Pochi mesi fa Google, Yahoo e Microsoft Live hanno ufficializzato un nuovo standard per il comportamento dei crawler introducendo il supporto ai Canonical link.
Questo nuovo attributo serve a specificare la pagina “base” che deve essere indicizzata per evitare che i motori di ricerca abbassino la popularity e il punteggio di qualità del sito per via di possibili contenuti duplicati.
Capita infatti soprattutto in siti dinamici, che alcune pagine possano essere raggiunte tramite indirizzi diversi o abbiano gli stessi blocchi di contenuto ripetuti. Un esempio ricorrente è ad esempio un articolo di un blog che usa la paginazione dei commenti: lo stesso contenuto viene raggiunto da indirizzi differenti (le pagine che suddividono i commenti) e può essere interpretato come duplicato.
Normalmente la soluzione più immediata per eviatre penalizzazioni era di assegnare ai link secondari l’attributo nofollow.
I Canonical link offrono un valido e preciso strumento di controllo senza rinunciare all’indicizzazione di tutti i contenuti.
<link rel="canonical" href="http://www.semantyca.net/paginabase" />

Per opera del britannico Stephen Wolfram, scienziato e fondatore dell’omonima società di ricerca, è stata rilasciata la versione alpha di Wolfram, una nuova applicazione web che potrebbe rivoluzionare le ricerche su internet.
Presentato all’università di Harvard a fine aprile, a prima vista sembrerebbe il classico motore di ricerca come Google o Yahoo ma in realtà nasconde un sofisticatissimo software capace di interpretare e analizzare in un modo unico i dati inseriti dall’utente. La vera novità infatti sta nel fatto che il portale fornisce la possibilità di consultare contenuti ed eseguire comparazioni rispettando il linguaggio naturale ovvero l’espressione delle domande nel modo in cui le porremmo ad un altro interlocutore.
Una volta inserito il quesito Wolfram si occuperà di analizzare i dati e fornirà un risultato comprensivo di testi, dati numerici, grafici e mappe.
Prosegui la lettura…
L’uso corretto dei tag heading all’interno di una pagina web è di estrema importanza per avere una strutturazione dei contenuti semantica e lineare. Attraverso questi tag i crawler possono determinare le sezioni e la loro suddivisione logica:
- <h1> determinerà l’argomento principale della pagina
- <h2> per le varie sezioni dell’argomento
- <h3> per le sottosezioni
- ecc…
Prosegui la lettura…