27 Nov Noindex
Noindex (che va scritto con la prima lettera minuscola: noindex) è un comando che tramite il nostro sito possiamo dare a Google e ai motori di ricerca con l’ordine di non includere una determinata pagina nei risultati di ricerca. In altre parole, e come è intuibile dal termine stesso, chiediamo ai motori di ricerca di non indicizzarla.
1. Come utilizzare il tag noindex in HTML
Il metodo più comune di usare questo comando relativamente a una pagina è di inserirlo direttamente nella sorgente HTML, più esattamente nella sezione head, che generalmente si trova in alto nel codice.
Attenzione: per essere certi che il comando funzioni, la pagina non deve essere già bloccata all’interno del file robots.txt, né tantomeno sottostare al comando disallow. Per ulteriori informazioni su cosa sia un il file robots.txt e per scoprire le differenze rispetto al comando disallow, dai uno sguardo ai link presenti nella sezione Leggi anche, in fondo a questo articolo. Sulla differenza con disallow, che è molto importante, torneremo anche dopo.
Come al solito, onde evitare di compromettere la funzionalità del sito, invitiamo chi non è abituato a smanettare con l’HTML ad affidarsi a figure preparate e professionali.
Per solo scopo informativo, riportiamo come dovrebbe apparire il comando di noindex nella sezione </head> del codice HTML della pagina da non indicizzare. Dovrebbe essere una cosa del genere:
<meta name=”robots” content=”noindex, follow”>
Che tradotto dal linguaggio macchina vorrebbe dire: «Ascolta, motore di ricerca (meta name=”robots”), non indicizzare questa pagina (content=”noindex) ma considera buoni i link che trovi al suo interno (follow”>). Se, oltre a non voler indicizzare la pagina in questione, vuoi anche impedire che Google indicizzi il tuo sito tramite i link in essa contenuti, allora dovrai ricorrere al comando nofollow, di cui abbiamo una voce esplicativa nel nostro glossario.
2. È possibile usare noindex nel file robots.txt?
Abbiamo parlato a più riprese di quanto sia importante imparare a gestire il file robots.txt, e questo consiglio trova ulteriore conferma dal fatto che questo file ti consente anche di lavorare col comando noindex. Anzi, usare noindex in robots.txt è a detta di molti più comodo, perché puoi chiedere a Google di non indicizzare più pagine lavorando però in un unico luogo (robots.txt, appunto), senza dover quindi andare a modificare la sorgente HTML di ogni singola pagina.
Esempio: poniamo che tu abbia un sito che si chiama vendooggetti.com, e che non vuoi indicizzare la pagina relativa alla privacy raggiungibile, sempre in via ipotetica, all’indirizzo vendooggetti.com/privacy. Per non farla indicizzare, basterà scrivere nel file robots.txt la seguente stringa:
noindex: /robots-txt-privacy/
Attenzione: la pratica di inserire la regola noindex nei file robots è stata recentemente deprecata da Google, che ha dichiarato ufficialmente di non seguirla.
3. L’importanza di noindex e la differenza con disallow
Riassumendo e concludendo: il noindex è molto importante da imparare a gestire quando si struttura un sito perché ci consente di alleggerire i motori di ricerca dall’indicizzare contenuti che noi non vogliamo vengano indicizzati, in quanto off topic rispetto al contenuto generale del sito (vale anche, ad esempio, per i contenuti duplicati: basta indicizzarli una sola volta). Una classica pagina da non incizzare è quella della privacy, che invece molte volte è indicizzata, ed è un errore. Ricordiamo che, dal punto di vista SEO, definiamo sempre noi cosa indicizzare e cosa escludere dai motori di ricerca.
Infine, va tenuta bene a mente la differenza fra disallow e noindex. Con disallow chiediamo ai motori di ricerca di non scansionare una pagina; ma ogni pagina può essere indicizzata anche senza scansione diretta da parte dei crawler. Per evitare l’indicizzazione, dobbiamo ricorrere alla regola noindex.
Un ultimo consiglio: tutto il sito può essere posto in modalità noindex. E’ il tipico caso dei siti in fase di restyling.
WordPress prevede in maniera nativa questa funzione, che tutti i webmaster sono bravi ad attivare (nel backend di WordPress, sezione “Impostazioni” > “Lettura” > “Visibilità ai motori di ricerca”). Che sono bravi ad attivare, ma che molto spesso si dimenticano di disattivare quando il sito viene messo online.
Il consiglio che diamo a tutti è quello di verificare che, una volta pubblicato il sito, venga disattivata la funzione che lo pone in modalità noindex, inibendone l’indicizzazione e quindi il posizionamento, con conseguenti calo di traffico e di conversioni (con il cliente arrabbiato). Una piccola disattenzione che può costare molto cara!