Warning sulle sitemap complete di Blogger: sono dannosi?
Se hai seguito la mia guida “Sitemap complete su Blogger“, avrai notato che, dai primi di Giugno, gli Strumenti Google per il Webmaster ti stanno restituendo il seguente avviso (warning):
XML non valido: numero eccessivo di tag
Numero eccessivo di tag per descrivere questo tag. Modificalo e reinvia.
e nei dettagli:
Tag principale: item
Tag: category
A mio avviso, comunque, questi avvisi non influiscono né sul funzionamento della sitemap, né sull’indicizzazione… né, addirittura, sul posizionamento del tuo blog. Ovviamente, se la pensi diversamente (non sono né un SEO, né un esperto), lascia un commento!
Perché gli avvisi nella sitemap completa di Blogger non sono dannosi
Una sitemap (eventualmente) errata non influisce pesantemente nella tua indicizzazione
Google, per indicizzare il tuo sito, non si affida completamente alla sitemap che invii: una volta che ha indicizzato anche una sola pagina del tuo blog, comincia a seguire tutti i link interni presenti in essa, indicizzando le pagine che trova, e ripetendo ricorsivamente, per ognuna di esse, la scansione dei link interni.
La sitemap è solo un aiuto che fornisci ai motori di ricerca: un elenco completo delle pagine del tuo sito, che Google usa per verificare di non essersi “dimenticato” qualche pagina. Ti aiuterà a raggiungere un’indicizzazione completa (e non è comunque detto che la raggiungerai), ma non ti impedirà certo di essere indicizzato!
È utile, quindi, soprattutto per quelle pagine o post poco linkati, nascosti nelle profondità del tuo blog. È utile anche a te: se la segnali sugli Strumenti Google per il Webmaster, potrai controllare il numero di pagine indicizzate rispetto al totale.
La sitemap non influisce sul posizionamento
La sitemap serve solo ad indicizzare le pagine del tuo sito (cioè, a farle entrare negli indici di Google), ma non servono a farti arrivare primo nei motori di ricerca (posizionamento o ranking).
Se vuoi fare un paragone sportivo, la sitemap aiuterà le tue pagine ad iscriversi alla gara, ma non a vincerla - ovviamente, se non partecipano, non potranno certo sperare di vincere!
Pertanto, un errore nella sitemap non provocherà nessuna penalizzazione.
La sitemap completa continua comunque a funzionare
Innanzitutto, Google Webmaster Tools restituisce degli avvisi, non errori! Come dice lo stesso Google:
In genere, questi avvisi non impediranno la normale elaborazione della Sitemap. Tuttavia, poiché potrebbero indicare potenziali problemi del sito, consigliamo di esaminare attentamente il file Sitemap e di correggere gli eventuali errori segnalati.
In questo caso, lo warning nasce dal fatto che non stai utilizzando una sitemap canonica, ma un Feed RSS che non è pensato per essere una sitemap. Lo warning è relativo a come Blogger inserisce le label dei tuoi post all’interno della sitemap, non al parametro più importante, cioè alle URL dei post!
Gli Strumenti Google per il Webmaster sono inoltre abbastanza chiari, nel caso in cui qualche URL nella sitemap non dovesse essere considerata. Se ad esempio implementi, sul tuo sito, un redirect 301, ma non aggiorni, nella sitemap, le url dei post nei quali hai implementato il redirect, ti verrà restituito questo avviso:
URL non seguito
Quando abbiamo testato un campione degli URL della tua sitemap, abbiamo riscontrato che Googlebot non era in grado di accedere ad alcuni di essi in quanto contenevano troppi reindirizzamenti.
Nel nostro caso, invece, non viene fatta nessuna menzione ad URL non seguiti.
Un’ulteriore conferma che la sitemap completa continua ad essere valida viene dal riepilogo sitemap. Questo, ad esempio, è il riepilogo del mio blog personale (Notorious da Ostra (Blog)):
Statistiche sitemap:
Totale URL: 52
URL indicizzati: 52
Il riepilogo, nel caso la sitemap non dovesse funzionare, sarebbe ben diverso: gli mancherebbe la voce URL indicizzati. Come esempio, ti riporto le statistiche sitemap di un sito con redirect, TechLog, che ho trasferito qui su Technoburger:
Statistiche sitemap:
Totale URL: 475
Potresti obiettare che gli URL indicizzati non compaiono perché sono stati tutti trasferiti. Falso!
Dal comando site, risultano ancora (in data 17/06/2008) 48 URL indicizzate.
Con questo post, ho cercato di dimostrarti che puoi continuare ad usare tranquillamente le sitemap complete su Blogger. Ti rinnovo l’invito a smentirmi, qualora dovessi aver sparato qualche castroneria - cosa molto probabile! ![]()
Articoli simili:
Se questo articolo ti è stato utile, segnalalo sul tuo sito! Puoi inoltre seguire comodamente gli aggiornamenti di Techlog tramite il feed RSS; infine puoi lasciare un commento se ti serve aiuto (o anche solo per un saluto); anche qui non serve registrarsi (sono abilitati anche i commenti anonimi; l'E-Mail serve, eventualmente, per ricevere le notifiche delle nuove risposte). ;-)





June 19th, 2008 at 1:57 pm
Io ho seguito i tuoi consigli sulle sitemap di blogger… Uso i feedburner associato al mio RSS.
Ho inserito nella sitemap di google il link del rss con l’aggiunta di update. Però non mi indicizza tutti gli articoli ma sono gli ultimi 25.
Come mai?
June 19th, 2008 at 2:09 pm
michele scrive:
Che indirizzo hai inserito? Se usi “rss.xml?…”, sostituiscilo con “atom.xml?…”; questo solo per evitare gli warning, non c’entra nulla con l’indicizzazione
http://technoburger.net/evitare-warning-sitemap-blogger
michele scrive:
update… cioè? Considera che non dovrebbero essere necessari altri parametri, oltre a quei due che ho suggerito.
michele scrive:
Cosa ti dice su “statistiche sitemap”? Cioè, ad esempio:
June 19th, 2008 at 2:23 pm
Ho atom.xml, errori infatti non me ne da.. Ho aggiunto da poco la sitemap e mi segna 21 link indicizzati.
June 19th, 2008 at 2:29 pm
Incollami la url che hai usato come Sitemap e le statistiche sitemap che ti ho chiesto sopra
… oppure vieni in chat, sono connesso
http://technoburger.net/contattaci
June 24th, 2008 at 1:40 pm
Ciao, scusa se non ho risposto, comunque ho risolto, avevo saltato un passaggio ora sembra che sia tutto ok, vedrò col tempo… Chiedo una cosa che centra con l’indicizzazione ma non con le sitemap.
Per una corretta indicizzazione non conviene mettere alla fine di ogni post un link “indietro” alla index, così che google possa scansionare meglio la pagina? Tempo fa avevo letto che è consigliato sempre mettere link di ritorno alla pagina iniziale.
June 24th, 2008 at 1:55 pm
michele lan scrive:
Sì, anche se più che all’indicizzazione, serve per passare (almeno credo) un po’ di page rank (che potrebbe ricevere il singolo post) alla home page… d’altronde, essendo la pagina principale del sito, difficilmente Google non la indicizzerà! Comunque tutti i template di Blogger dovrebbero inserire un link alla home in ogni pagina del blog.
Quello che invece ti consiglio di fare è inserire, nel testo del nuovo post, e in maniera del tutto naturale, dei link ai tuoi vecchi articoli a tema - questo si chiama “deep linking”, e, oltre a contestualizzare maggiormente il tuo post, e magari ad aumentare il numero di pagine viste per singolo visitatore, dovrebbe avere un effetto positivo sull’indicizzazione dei vecchi articoli, nascosti nelle profondità del blog.
June 24th, 2008 at 2:32 pm
Grazie per il tuo aiuto
Farò i link come hai detto
June 24th, 2008 at 3:11 pm
@ michele lan:
È stato un piacere aiutarti, spero di risentirti presto, su questo blog!
March 1st, 2009 at 9:12 pm
Buona sera a tutti,
scuate qualcuno mi puo aiutare a risolvere un mio problema: da 20 giorni il mio sito si trova nel blacklist di Google, com qusta scrita sotto il nome del dominio “Questo sito potrebbe arrecare danni al tuo computer”. Ringrazio moltissimo in anticipo a tutti quelli che vogliano darmi
una mano per risolvere questo problema
Dilman
March 3rd, 2009 at 8:14 pm
@ Dilman:
Di solito queste segnalazioni si ottengono in seguito a compromissioni da parte di hacker… specialmente quando si usa qualche CMS e non lo si aggiorna. Tu ne usi qualcuno?
March 3rd, 2009 at 10:46 pm
@ Andrea Romagnoli:
Gentile sig. Andrea, grazie per aver risposto, non ho nessun CMS, io uso solo frontpage.
grazie ancora
March 9th, 2009 at 11:14 pm
@ dilman:
Hai inserito qualche javascript “strano” nelle pagine html?
March 22nd, 2009 at 9:36 pm
Riguardo l’articolo:
io ho provato mettendo qualunque feed al posto della sitemap xml e funziona con tutti: atom, rss, sia completi che limitati agli ultimi 25
Riguardo Dillman:
Quando GG ti da quel messaggio c’è qualcosa nella tua pagina che non va, non so cosa tu abbia utilizzato oltre l’html, ma tutto quello che non è html lo controllerei (Javascript, flash, …), un’altra cosa, non so se il link è quello che c’è cliccando sul tuo nick, ma se fosse quello, io risolverei al più presto il problema dei font, capisco che tu debba scrivere in curdo, ma fai un immagine, perchè quei font non sono presenti su tutti i pc, io infatti non li vedo bene e Google ci tiene molto alla “leggibilità”.
March 23rd, 2009 at 1:37 am
Marco scrive:
Quando ho scritto questo post, utilizzando l’RSS si ottenevano gli warning che ho descritto sopra (comunque… non erano errori). Forse adesso hanno risolto.