|
Le pagine che seguono sono state riprese e riassunte direttamente dalle pagine di Google.it.
Esse specificano quindi i consigli che Google stesso rivolge ai realizzatori di siti su come ottenere il primo posto nell’indicizzazione.
Istruzioni su struttura e contenuto:
Per arrivare al primo posto nell’indicizzazione progettate un sito con gerarchia e link testuali comprensibili.
Ogni pagina dovrà essere raggiungibile da almeno un link testuale statico.
Offrite agli utenti una mappa del sito con link che puntino alle sezioni più importanti. Se la mappa del sito contiene più di 100 link, suddividere la mappa in pagine separate.
Create un sito utile e ricco di informazioni, con pagine che descrivano in modo chiaro e accurato il contenuto del sito, se volete arrivare primi su Google.
Pensate alle parole che gli utenti potrebbero digitare per trovare le vostre pagine e accertatevi che siano incluse nel vostro sito.
Provate a utilizzare del testo anziché immagini per visualizzare nomi, contenuti o link importanti. Il programma di scansione di Google non riconosce il testo contenuto nelle immagini.
Assicuratevi che il tag TITLE e gli attributi ALT delle immagini siano descrittivi e precisi.
Verificate l’eventuale presenza di link inaccessibili e la correttezza del codice HTML.
Se decidete di utilizzare pagine dinamiche (es. l’URL contiene un carattere ’?’), ricordate che non tutti gli "spider" dei motori di ricerca effettuano la scansione di pagine dinamiche oltre a quelle statiche. Per arrivare al primo posto nell’indicizzazione limitate il numero di link in una pagina a una quantità ragionevole (meno di 100).
Istruzioni tecniche per ottenere il primo posto nell’indicizzazione
Utilizzate un browser di testo come Lynx per esaminare il vostro sito, in quanto molti spider dei motori di ricerca - ed anche il robot di Google - rilevano il sito allo stesso modo di Lynx. Se caratteristiche avanzate quali Javascript, cookies, ID di sessione, frame, DHTML o Flash vi impediscono di visualizzare l’intero sito in un browser di testo, anche gli spider dei motori di ricerca potrebbero incontrare problemi durante la scansione del vostro sito e negarvi il primo posto nell’indicizzazione.
Consentite ai motori di ricerca di eseguire la scansione dei vostri siti senza ID di sessione o argomenti che ne rilevano il percorso in tutto il sito.
Queste tecniche sono utili per la rilevazione del comportamento del singolo utente - e per arrivare primi su Google e sui motori di ricerca - ma lo schema di accesso dei programmi automatizzati è completamente differente. L’utilizzo di queste tecniche può condurre a un’indicizzazione incompleta, poiché i programmi automatizzati non sono in grado di eliminare gli URL che hanno un aspetto diverso, ma puntano effettivamente alla stessa pagina.
Assicuratevi che il vostro server Web supporti l’intestazione HTTP If-Modified-Since.
Questa funzione consente al server Web di comunicare a Google se il contenuto è stato modificato dall’ultima volta che è stata eseguita la scansione del vostro sito. L’implementazione di questa funzione consentirà di limitare l’uso di larghezza di banda e di ridurre il sovraccarico.
Utilizzate il file robots.txt nel vostro server Web. Questo file comunica ai programmi di scansione quali directory è vietato o è concesso scansionare. Assicuratevi che il file sia aggiornato, in modo da non bloccare involontariamente il crawler di Google.
Visitate il sito http://www.robotstxt.org/wc/faq.htm (informazioni in lingua inglese) per le risposte alle domande frequenti riguardanti i programmi automatizzati (robot) e le modalità di controllo degli stessi quando visitano il vostro sito.
Se la vostra azienda acquista un sistema di gestione contenuti, assicuratevi che questo sia in grado di esportare il vostro contenuto in modo che gli spider dei motori di ricerca possano eseguire la scansione del vostro sito (altrimenti come potreste arrivare al primo posto nell’indicizzazione ?).
Norme di qualità per ottenere il primo posto nell’indicizzazione
Progettate le vostre pagine per gli utenti, non solo per arrivare al primo posto nell’indicizzazione. Non ingannate i vostri utenti presentando un contenuto diverso da quello illustrato ai motori di ricerca.
Non usufruite di schemi di link progettati per migliorare la posizione del vostro sito o il punteggio PageRank. In particolare, evitate link verso siti web che usano trucchi di posizionamento (web spammer) in quanto ciò potrebbe influire negativamente sulla vostra posizione.
Non utilizzate programmi non autorizzati per inviare pagine, verificare la posizione e così via. Tali programmi sfruttano le risorse di elaborazione e rappresentano una violazione dei termini e condizioni di servizio di Google. Google sconsiglia l’utilizzo di prodotti per arrivare al primo posto nell’indicizzazione come WebPosition Gold, che inviano query (ricerche) automatiche o programmatiche a Google.
Norme di qualità su Google - Consigli specifici
Evitare testo o link nascosti.
Non usare cloaking o tecniche di reindirizzamento subdole.
Non inviare a Google query automatizzate.
Non caricare pagine con parole non pertinenti.
Google può rispondere in maniera negativa a comportamenti ingannevoli qui non elencati (es. abbindolare gli utenti registrando nomi di siti il cui nome sia simile nell’ortografia a quello di altri siti Web ben più noti). Non è questo il sistema per arrivare al primo posto nell’indicizzazione.
Come regola generale, progettare un sito usabile significa nella maggior parte dei casi progettare un sito search engine friendly, con contenuti capaci di arrivare primi su Google.
I navigatori cercano siti leggeri da scaricare e ricchi di contenuti
informativi pertinenti?
Google anche.
I navigatori cercano siti dall’architettura chiara, facilmente navigabili e magari completi di una mappa?
Gli spider dei motori di ricerca indicizzano più facilmente i siti che possono visitare in profondità, attraverso link e strutture di facile navigazione.
I navigatori detestano le pop up (le nuove pagine che si aprono sopra a quella precedente e di solito in un formato più piccolo del monitor)?
I motori di ricerca difficilmente ne indicizzano i contenuti e penalizzano lo sforzo per arrivare al primo posto nell’indicizzazione.
Le Guidelines di Google per ottenere il primo posto nell’indicizzazione
Le Guidelines di Google sono estremamente precise, ecco una breve rassegna delle cose più interessanti che richiedono/propongono/impongono.
Istruzioni su struttura e contenuto:
- Progettate un sito con gerarchia e link testuali comprensibili. Ogni pagina dovrà essere raggiungibile da almeno un link testuale statico.
- Create un sito utile e ricco di informazioni, con pagine che descrivano in modo chiaro e accurato il contenuto del sito.
- Provate a utilizzare del testo anziché immagini per visualizzare nomi, contenuti o link importanti. Il programma di scansione di Google non riconosce il testo contenuto nelle immagini.
- Verificate l’eventuale presenza di link inaccessibili e la correttezza del codice HTML.
- Se decidete di utilizzare pagine dinamiche (es. l’URL contiene un carattere ’?’), ricordate che non tutti gli "spider" dei motori di ricerca effettuano la scansione di pagine dinamiche oltre a quelle statiche. È utile prevedere un numero esiguo di parametri brevi.
- Limitate il numero di link in una pagina a una quantità ragionevole (meno di 100).
Già da questa prima serie di indicazioni cogliamo alcuni dei valori a cui Google cerca di sensibilizzare webmaster e content manager tutti tesi ad arrivare primi su Google:
- leggerezza
- quantità e qualità dei contenuti
- buona frequenza di aggiornamento
- più testo significativo e meno grafica inutile
- accessibilità, soprattutto dei link
Nelle successiva istruzioni tecniche si consiglia di testare il sito con un browser esclusivamente testuale, ovvero di assicurarci che il nostro Content Management System aziendale sia spider-friendly.
Pensiamo all’effetto che ha quest’ultimo consiglio su una software house che si accinge a progettare un CMS...
Norme di qualità - Consigli specifici
- Evitare testo o link nascosti.
- Non usare cloaking o tecniche di reindirizzamento subdole.
- Non inviare a Google query automatizzate.
- Non caricare pagine con parole non pertinenti.
- Non creare più pagine, sottodomini o domini dal contenuto sostanzialmente duplicato.
- Evitare pagine di rimando (doorway) create solo per i motori di ricerca o altri approcci "preconfezionati" come programmi di affiliazione dal contenuto originale scarso o nullo.
In queste norme, leggiamo invece una particolare attenzione verso potenziali fenomeni di spamming. Le "tecniche subdole" che Google mette all’indice, sono tutte quelle pensate per depistare lo spider e favorire una sua errata interpretazione del contenuto di un sito.
Le Guidelines, da questo punto di vista, sono anche un ottimo strumento cautelativo, con cui il motore di ricerca tenta di filtrare le innumerevoli segnalazioni che continuamente
Google non supporta bene i frame e le pagine dinamiche nello stabilire il primo posto nell’indicizzazione
Alcuni "spider" (il software dei motori di ricerca che analizzano automaticamente i siti) in certi casi possono riscontrare dei problemi di lettura .
Ecco alcuni dei casi di difficile indicizzazione, su cui Google stesso da alcuni suggerimenti.
«Le vostre pagine sono generate dinamicamente. L’inserimento nel nostro indice di pagine generate dinamicamente è previsto, tuttavia il numero di tali pagine è limitato poiché il nostro crawler può creare problemi ai siti che prevedono contenuti dinamici.
La vostra pagina contiene frame.
Google supporta i frame per quanto possibile. I frame tendono infatti a creare problemi con motori di ricerca, segnalibri, collegamenti di posta elettronica e così via, in quanto non sono conformi al modello concettuale del Web in cui a ogni pagina corrisponde un unico URL.
Se la ricerca di un utente restituisce un sito nella sua totalità, Google restituisce il set di frame; se, invece, la ricerca restituisce un’unica pagina del sito, Google restituisce tale pagina, che tuttavia non viene visualizzata in un frame poiché potrebbero non esistere set di frame corrispondenti a tale pagina.
Se siete preoccupati del modo in cui il vostro sito viene considerato dai motori di ricerca, se volete arrivare al primo posto nell’indicizzazione, vi consigliamo la lettura di "Search Engines and Frames" (informazioni in lingua inglese), in cui viene descritto l’uso del tag NoFrames per l’inserimento di contenuti alternativi.
Ad esempio, i browser Web audio, quali quelli utilizzati nelle autovetture e dagli utenti con problemi di vista, in genere non supportano i frame, che sono elementi grafici. Per ulteriori informazioni sul tag NoFrames nello standard HTML, visitate http://www.w3.org/TR/REC-html40/present/frames.html#h-16.4 ».
L’indicizzazione per Google
Google introdusse un elemento di novità nell’approccio al problema dell’indicizzazione del web, il PageRank, algoritmo di valutazione della rilevanza di una pagina basato su concetti matematici che l’inventore di Ethernet, Bob Metcalfe, sintetizzò con il termine network effect: una rete è tanto più utile quanto più elevato è il numero dei suoi utenti.
Per quanto riguarda il markup, è buona pratica:
Usare un markup HTML il più possibile attinente alla struttura dei contenuti presentati (semantico) e verificare sempre che il codice delle pagine sia formalmente valido[1]. Può essere utile confrontarsi con le specifiche WCAG[2] per rendere i contenuti meglio "accessibili" anche per i crawler;
Differenziare opportunamente i titoli delle varie pagine di un sito, renderli chiari, consistenti e coerenti con il contenuto della pagina: dovrebbero contenere le keyword di maggior peso;
Evitare di inviare informazioni incontrollate o inutili (potenzialmente dannose) tramite tag <meta>: i browser le ignorano, i crawler no;
Strutturare il codice delle pagine in modo che i contenuti importanti si trovino il più possibile vicini all’inizio del markup;
Evitare l’utilizzo di JavaScript per gestire la navigazione, perché il crawler non interpreta gli script e non seguirà questi collegamenti. Usare invece collegamenti standard inserendo tag <a> con l’attributo href. I browser delle ultime generazioni non avranno problemi a gestire link contenenti sia un indirizzo in href che una chiamata JavaScript in un gestore di evento onClick: se quest’ultima è ritenuta indispensabile, è possibile inserirla ed essa verrà eseguita prima del collegamento vero e proprio. È importante ricordarsi di inserire comunque anche il collegamento tramite l’attributo href, a beneficio di browser non standard, browser accessibili, e crawler.
Riguardo alla gestione del server e degli URL, invece, è opportuno:
Possibilmente, costruire anche l’URL della pagina in modo che contenga le keyword più probabili, ovvero che sia descrittivo e possibilmente somigliante al titolo della pagina stessa;
Evitare se possibile l’invio di parametri per un’eventuale applicazione lato server tramite l’inserimento di una stringa di query nell’URL della pagina, ossia la presenza di coppie parametro=valore dopo un punto di domanda, dopo l’indirizzo della pagina (http://www.sito.it/percorso/pagina?parametri=valori). Alcuni motori di ricerca scaricheranno e indicizzeranno solo la pagina base, con l’indirizzo senza query (non così Google, che indicizzerà l’URL completo);
inoltre, se la query string contiene informazioni specifiche sulla sessione (che cambiano per ogni visitatore) nemmeno Google ottiene un URL univoco per la pagina, e può trarne le più disparate conclusioni negative. Per questo tipo di informazioni è opportuno usare i cookie[4];
Evitare l’utilizzo di redirect non standard (attraverso tag <meta http-equiv="refresh">), perché il motore di ricerca non li seguirà. Attuare invece ogni redirezione con una risposta HTTP di redirection (codici 3xx);
Evitare assolutamente di servire contenuti differenziati ai crawler tentando di riconoscerne la stringa di User-Agent sul lato server. È una pratica dannosa che espone al rischio concreto di cancellazione dagli indici dei motori.
Obiettivi misurabili in posizionamento e indicizzazione
A differenza delle pubblicità tradizionali, il posizionamento su Google e sui motori di ricerca è valutabile quantitativamente. O sei nei primi venti indirizzi, o NON ci sei.
Non è un intervento di pura promozione istituzionale o estetica. Non è un “bel depliant”, di cui non si può verificare a chi veramente piace. L’indicizzazione e l’inserimento su Google e sui motori di ricerca, produce numeri, incrementi statistici, posizioni in classifiche. Deve produrre effetti già 30 giorni dopo la messa on line delle nuove pagine.
Le frasi obiettivo della pressione su Google
Le campagne di pressione su Google e sui motori di ricerca sono univoche e basate su una singola frase in cui si vuole primeggiare. Ogni ulteriore gruppo di parole, richiede un suo intervento specifico.
Ecco dunque degli obiettivi quantificabili!
Il principale è:
Diventare uno dei primi 20 siti offerti da Google in risposta per le frasi/domande concordate.
Le pagine per vincere su Google saranno scritte dal consulente, approvate nei contenuti dalla direzione dell’azienda, e poi messe on line per la pubblicazione su Internet dal vostro webmaster (chi si occupa di gestire il vostro sito) o dai consulenti di web marketing.
L’incremento viene raggiunto entro 90 giorni dalla messa on line su internet delle nuove pagine.
I costi. Il prezzo della consulenza per ottenere un’alta indicizzazione sui motori di ricerca è visionabile su questa pagina dedicata ai consulenza
per ottenere un alto posizionamento su Google.
Scriveteci e vi forniremo: risposte, preventivi, utili consigli. Un parere di un esperto nel posizionamento su Google è sempre utile. |