Sitemap completa su Blogger (blogspot)
English version: Add Blogger to Webmaster Tools
Abbiamo già visto che è possibile, per un blog basato su Blogger (su blogspot.com), usare il feed RSS come Sitemap (da aggiungere agli Strumenti per il Webmaster di Google); la Sitemap così generata conterrà però solo gli ultimi articoli. Vediamo come ottenere una Sitemap completa, contenente cioè tutti gli articoli pubblicati.
Aggiornamento: ho cambiato lievemente l’indirizzo del feed, sostituendo “rss” con “atom”, per evitare degli warning provocati dal formato RSS quando viene usato come sitemap.
In breve: aggiungere la sitemap di Blogger su Webmaster Tools

- Collegarsi a Google Webmaster Tools, entrare nelle proprietà del blog e cliccare su Sitemap > Aggiungi Sitemap;
- Selezionare “Aggiungi sitemap web generale“;
- L’url della sitemap è: atom.xml?max-results=500&start-index=1
- Confermate cliccando Aggiungi sitemap web generale.
La sitemap così creata comincerà ad elencare gli articoli a partire dall’articolo 1 (il più nuovo) e conterrà al massimo 500 articoli.
Sitemap per blog con più di 500 articoli
Se avete pubblicato più di 500 articoli, la sitemap non conterrà gli articoli dal 501° in poi. Non vi preoccupate, basterà aggiungere altre sitemap (finché non si copriranno tutti gli articoli del blog).
Aggiungete altre sitemap, ripetendo i passi 1, 2, 3 e 4. Di volta in volta, quando arriverete al punto 3, inserite:
- atom.xml?max-results=500&start-index=501
- atom.xml?max-results=500&start-index=1001
- atom.xml?max-results=500&start-index=1501
- …
e così via… Ma avete davvero pubblicato più di 1500 articoli?
Alla fine la tabella riassuntiva delle sitemap dovrebbe essere simile a questa:

Una nota: se avete una sitemap “piena”, vedrete, nella tabella soprastante, che alla voce “link segnalati” comparirà 501, non 500: non vi preoccupate, quel link in più è la home page, riportata in ogni feed.
Spiegazione della sitemap
Parametri del feed atom.xml
Vediamo i parametri che abbiamo usato:
- start-index: l’articolo da cui cominciare a pubblicare;
- max-results: il numero massimo di articoli da pubblicare nel feed.
Collegandoci al file rss.xml, senza usare questi parametri, otteniamo di default gli ultimi 25 articoli.
Ulteriori parametri li trovate su Google Data APIs Protocol Reference. Quelli che abbiamo usato noi servono per la paginazione della sitemap.
Paginazione del feed
Una sitemap non può essere illimitata:
- non può contenere più di 50000 link (sì, lo so che postate moltissimi articoli)
- non può superare i 10 MB di dimensione
Per questo andremo a dividere la sitemap in più “pagine”.
Facendo dei test con un blog famoso su blogspot, con articoli di medie dimensioni, ho notato che un limite di 500 articoli è un buon compromesso: il file atom.xml va ad occupare così circa 2 MB - ma potete modificare tranquillamente tale numero, in base alle vostre esigenze.
Poniamo di voler ottenere l’URL della n-esima pagina (n parte da zero), con limite x; allora, la n-esima pagina comincerà dal (n*x+1)-esimo articolo (start-index). Quindi l’URL da inserire sarà:
atom.xml?max-results=x&start-index=(n*x+1)
Articoli simili:
Se questo articolo ti è stato utile, segnalalo sul tuo sito! Puoi inoltre seguire comodamente gli aggiornamenti di Techlog tramite il feed RSS; infine puoi lasciare un commento se ti serve aiuto (o anche solo per un saluto); anche qui non serve registrarsi (sono abilitati anche i commenti anonimi; l'E-Mail serve, eventualmente, per ricevere le notifiche delle nuove risposte). ;-)





November 26th, 2007 at 7:08 pm
Sitemap complete su Blogger…
Per migliorare l’indicizzazione del nostro blog, è possibile usare il feed RSS dello stesso come Sitemap; il feed, però, riporterà solo gli ultimi post.
Vediamo come aumentare il numero di articoli riportati passando ulteriori parametri all’indiri…
November 26th, 2007 at 10:25 pm
Ho appena aggiunto la sitemap al mio blog sui contest (ha più di 220 articoli)!! Tra qualche giorno ti saprò dire meglio, sugli sviluppi, ma credo che non ci dovrebbero essere problemi!!
Grande segnalazione complimenti!!
November 26th, 2007 at 10:31 pm
Grazie
Cercavo un parametro per togliere, dal feed, il contenuto dell’articolo (in modo da rendere meno pesante la sitemap) ma niente da fare. 
December 2nd, 2007 at 10:28 am
Grazie un articolo veramente ben spiegato! L’ho votato.
Ad oggi,il mio blog ha 454 post e mi risulta essere di 148.616 byte, quindi mi sembra tutto a posto.
Approfitto della tua bravura per chiederti se puoi spiegarmi come hai messo le emoticons. Ho provato vari sistemi, ma non sono mai riuscito.
Grazie ancora.
Bob.
December 4th, 2007 at 3:27 am
@Bob
Scusa per il ritardo della risposta: il tuo commento era finito nello spam di Akismet (forse per il “trucchetto” sull’e-mail che - giustamente - usi) e ieri non avevo controllato.
Per quanto riguarda le emoticon, su Wordpress (per quel poco che ho visto) dipendono dal tema che usi: alcuni le hanno, altri no.
Se ti riferivi a blogger (come penso), mi spiace, ma ancora non me ne sono interessato (magari più in là
)
December 15th, 2007 at 1:07 pm
URL limitato da robots.txt
Al momento non possiamo accedere alla tua home page a causa di limitazioni in robots.txt.
E’ quello che mi appare quando faccio la verifica del sito.
Avvisi ed errori della sitemap:
Abbiamo rilevato un errore durante l’accesso alla tua Sitemap. Accertati che la tua Sitemap rispetti le nostre linee guida e che sia possibile accedervi utilizzando il percorso da te fornito, quindi reinviala.
Qualcuno ha qualche souizione a questo problema ???
Grazie.
December 15th, 2007 at 1:59 pm
@UgoPiazza: se vai a vedere le pagine indicizzate su Google del tuo sito, noterai che il problema non è limitato alla sola sitemap: l’accesso all’intero sito è bloccato ai motori di ricerca.
Questo perché c’è la seguente riga sul tuo robots.txt
Vai sulla bacheca di blogspot, nella scheda Impostazioni, e controlla che
Vuoi far trovare il tuo blog dai motori di ricerca?
sia impostato su “Sì”
December 15th, 2007 at 2:40 pm
Era impostato su sì, ma ora per sicurezza ho selezionato NO, ho salvato, e dopo poco ancora SI, vediamo…
Grazie.
December 15th, 2007 at 4:00 pm
Ho fatto la prova sul mio blog di blogspot, e le modifiche al robots.txt dovrebbero essere immediate… :-S
December 16th, 2007 at 1:19 pm
Purtroppo non è cambiato nulla…
AIUTO !!!!!!!!!!
December 16th, 2007 at 3:25 pm
Hai provato a leggere http://www.labnol.org/forums/topic/robotstxt-disallowing-web-crawlers , come ti ho suggerito per e-mail? L’autore della discussione sembra avere il tuo stesso problema…
EDIT: mannaggia al justify definito sul CSS dei commenti! >:-(
December 16th, 2007 at 5:08 pm
SI, il problema è che non cita soluzione alcuna…
December 16th, 2007 at 6:43 pm
@UgoPiazza: sì, la cita, anche se un po’ all’interno della discussione:
aprire un ticket per richiere aiuto:
http://www.blogger.com/problem.g
Poi più sotto da’ anche un’avvertenza:
Comunque credo ci voglia un po’ di tempo…
Fammi sapere come va’ a finire
June 14th, 2008 at 4:26 pm
grazie del post. io però sto avendo un problema. dopo aver messo atom.xml (verifica ok) ho aggiunto rss.xml?max-results=500&start-index=1 ma su Strumenti per i Webmaster dopo la verifica mi è comparso il seguente avviso “XML non valido: numero eccessivo di tag” per 10 volte e mi chiede modifica e rinvio. Tag principale: item, Tag: category.
Lo status ora è quindi “avviso”, mentre per atom.xkl era “ok”. Per evitare conflitti con 2 sitemaps ho cancellato sitemap atom.xml (che consentiva un massimo di 26 post rilevati), ma il problema rimane. Segnalo che il numero totale di URL nella sitemap analizzati nel riepilogo sitemap è 75 e i post presenti al momento sono 74.
Che posso fare?
Grazie mille!
June 14th, 2008 at 5:27 pm
@ utopie:
Finché sono Warning non dovresti preoccuparti: probabilmente è dato dal fatto che, non essendo il feed una sitemap canonica, quando si usano troppe label la sitemap va un po’ “contro le regole”…
Adesso sto uscendo, quando torno faccio un po’ di verifiche e ti faccio sapere meglio
utopie scrive:
Già questo dovrebbe tranquillizzarti: significa che la sitemap sta facendo il suo dovere - cioè, quello di dire a Google quante pagine ci sono da indicizzare e il loro url, per aiutarlo nell’indicizzazione, e far vedere a te quante pagine non sono state ancora indicizzate. E Google ti ha indicizzato quasi tutte le pagine…
June 14th, 2008 at 7:11 pm
A me sta succedendo la stessa cosa di utopie per mesi nessun problema ma ora appare questo “AVVISO”. Tral’altro le url indicizzate ora sono tutte! mentre prima un buon numero non lo erano.
Una soluzione sembra esserci ma la sitemap suppongo non sarebbe più completa:
qui
June 14th, 2008 at 8:24 pm
cariblo scrive:
Esattamente!
Inoltre, gli warning sembrano leggermente diversi: se ora provi a passare ai Webmaster Tools una sitemap che fa il redirect a Feedburner, non darebbe warning, ma proprio errore!
Ripeto, quando si ottiene un messaggio del genere:
… lo scopo della sitemap è stato a mio avviso raggiunto!
(non dimentichiamoci che non influisce sul posizionamento…)
June 16th, 2008 at 1:16 am
A me succedeva lo stesso. Innanzitutto in questa sitemap non c’è il redirect=false quindi può essere questo l’errore. Comunque volevo chiedere se la prova fatta con i 501 posts, cioè più di 500 posts era stata fatta in un semplice blogspot.com oppure in un Blogger ‘hostato’ su altro servizio. Sapevo infatti che blogspot.com non dava più di 500 ‘entries’ cioè posts… Boh… comunque io la soluzione l’ho trovata, se San Google vuole, per il momento, dopo 24 h di prove…. E’ nel Mio sito sotto il tag sitemap; ho solo upgradato un vecchio post..
June 16th, 2008 at 2:03 pm
Blogmasterpg scrive:
Beh, per prima cosa non è un errore, ma uno warning…
Come dice lo stesso GWT:
Inoltre, non ci dovrebbe essere bisogno del parametro redirect=false: non appena nell’indirizzo del feed RSS viene inserito un parametro, viene restituito il feed residente su blogspot.com, senza fare il redirect su Feedburner.
… altrimenti, Google Webmaster Tools mi avrebbe dato l’errore “la sitemap non risiede nel dominio principale”!
Blogmasterpg scrive:
Avevo fatto il test con un blog su blogspot.com con molti articoli (non il mio), scaricando le sitemap che ottenevo cambiando i parametri e confrontandone i valori. Mi ricordo di aver ottenuto file molto grandi, quindi avevo testato sitemap contenenti più di 500 articoli. Il test comunque lo avevo fatto nel Novembre 2007, quindi magari adesso qualcosa è cambiato.

Comunque sia, specificando max-results=500&start-index=1, si ottengono sitemap con esattamente 500 articoli, non 501; il +1 è dato dal fatto che blogspot inserisce anche la url del blog, e GWT la considera come una voce della sitemap
Nel mio blog uso 100 come max-results; avevo letto in giro che erano preferibili sitemap le più piccole possibili.
Blogmasterpg scrive:
Mi sembra di aver capito che usi gli stessi parametri di cui ho parlato qui. Quale indirizzo hai passato a GWT? Ottieni degli warning?
June 16th, 2008 at 2:14 pm
@ Blogmasterpg:
Comunque sia, questo non è un problema di redirect; GWT, da Novembre 2007 (mese in cui ho applicato questo metodo), non ha mai dato uno warning. Sono comparsi da pochi giorni, e sembrano problemi relativi alle label dei post. In ogni caso, Google sembra riuscire a leggerla senza problemi…
June 17th, 2008 at 5:30 pm
[…] hai seguito la mia guida “Sitemap complete su Blogger“, avrai notato che, dai primi di Giugno, gli Strumenti Google per il Webmaster ti stanno […]
June 18th, 2008 at 3:14 pm
Trovato il “problema”: per eliminare gli warning, reinviate la sitemap, sostituendo, nell’indirizzo, “rss” con “atom”: nel feed atom non vengono inserite le label dei post, che provocavano gli warning.
June 18th, 2008 at 4:25 pm
[…] ti avevo detto che, secondo il mio modesto parere, gli warning nelle sitemap di Blogger non rappresentavano un problema. Nonostante continui a ritenere le mie considerazioni valide… […]
June 21st, 2008 at 11:42 pm
Notorious aka Andrea Romagnoli scrive:
quindo per togliore i warming basta togliere rss.xml?max-results=500&start-index=1 e mettere atom.xml?max-results=500&start-index=1 ? :#
June 22nd, 2008 at 4:07 am
@ utopie:
Esatto!
Ovviamente, superati i 500 articoli, dovrai cambiare start-index a 501… e così via.
Migliorata l’indicizzazione con la sitemap, puoi provare a migliorare un po’ il posizionamento leggendo questo:

http://technoburger.net/guide/blog/blogger/titoli-seo
June 22nd, 2008 at 3:00 pm
Notorious aka Andrea Romagnoli scrive:
si ora in effetti funge e lo status è ok. ora cancello indirizzo con rss. con la nuova stringa al momento alla voce “URL indicizzati in una sitemap” mi risulta la dicitura “Nessun dato disponibile. Ricontrolla appena possibile.”, mentre con i feed rss erano 75. penso sia solo questione di tempo. ad ogni modo vengono segnalati tutti i 77uRL della sistema. ora controllo il link per i titoli seo (in effetti era il passo successivo che volevo fare per ottimizzare il blog). grazie mille!
June 22nd, 2008 at 11:38 pm
utopie scrive:
Già
utopie scrive:
Se hai problemi fai un fischio!
June 30th, 2008 at 11:45 pm
Notorious aka Andrea Romagnoli scrive:
grazie. il post sui titoli seo era abbastanza chiaro. ho scelto la seconda opzione come suggerito. vediamo se funge…
July 1st, 2008 at 12:27 am
@ utopie:

Se vuoi, controlla le statistiche di accesso dai motori di ricerca, e vedi se migliorano (e di quanto).
Magari controlla anche se il posizionamento di qualche pagina migliori o meno.
September 21st, 2008 at 10:05 am
grazie per le informazioni che date
bruna
October 18th, 2008 at 12:20 am
Grazie mille come sempre sei stato utilissimo!
Stavo letteralmente impazzendo nel disperato tentativo di creare una sitemap da settimane e settimane (mesi a dire il vero!) grazie grazie grazie finalmente sono riuscito
October 18th, 2008 at 2:27 am
@ Tarkan:
Figurati!
March 15th, 2009 at 4:11 pm
grazie mille per i consigli, gli applicherò al mio blog seduta stante.
March 29th, 2009 at 3:29 pm
Grazie Andrea.
April 21st, 2009 at 3:42 pm
Siamo convinti sia necessario dire a Google dove sono i nostri post, presenti sul suo db di blogger? Mah… io vedo ottime le sitemap per un discorso di riduzione tempi o raggiungibilità di contenuti non raggiungibili, ma non so che plus possano dare le sitemap ai blog.
Se mi contraddite però ne sono contento e opero in tal senso!
April 22nd, 2009 at 3:01 am
Merlinox scrive:
Se per questo, Google si batte contro i contenuti duplicati, ma poi guarda quanti ne genera un suo prodotto:
http://www.google.it/search?q=site%3Anotoriousxl.blogspot.com+inurl%3Ashowcomment&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:it:official&client=firefox-a
… insomma, non darei per scontato che un suo prodotto abbia privilegi particolari, dal punto di vista dell’indicizzazione.
Poi è una cosa comunque innocua, una sitemap “duplicata” non crea problemi.
Merlinox scrive:
IMHO: i blog (e i contenuti raggiungibili tramite RSS) hanno un vantaggio nell’indicizzazione immediata (Google Search dovrebbe aiutarsi con Google Blog Search), ma non è detto che un post (magari poco linkato) resti indicizzato nel tempo.
Insomma, sempre secondo me, è una garanzia in più di avere i vecchi post (e con poco trust) indicizzati… da qui, l’importanza di avere sitemap complete (piuttosto che quelle parziali che blogspot propone nel robots.txt).
Il tutto IMHO, eh; però, ripeto, aggiungere le sitemap è una cosa che richiede poco tempo e che non crea, comunque, problemi.
Merlinox scrive:
Puoi anche darmi del tu, visto che siamo anche contatti su Friendfeed
April 22nd, 2009 at 9:03 am
Andrea Romagnoli scrive:
Andrea era solo per parlare con tutti i tuoi lettori
Comunque sono ancora dubbioso sulla validità delle sitemap, almeno per un blog. Se poi mi dici che male non fa questo è sicuramente un altro paio di maniche 
April 24th, 2009 at 2:54 am
Merlinox scrive:
Beh, blogspot stesso propone una sitemap ai motori di ricerca, quindi un vantaggio (anche minimo) ce l’avrà:
http://notoriousxl.blogspot.com/robots.txt
(il problema della sitemap proposta da blogspot è che sia incompleta - è il motivo per cui ho scritto questo post).
Anche se non dovesse avere nessun vantaggio nell’indicizzazione (ne dubito, il linkaggio interno dei vecchi post non è un granché… considerando anche che blogger blocca le label col robots.txt), un altro vantaggio è quello di poter vedere, su Google Webmaster Tools, il numero di post indicizzati rispetto al totale riportato nelle sitemap.
April 24th, 2009 at 9:43 am
Andrea Romagnoli scrive:
Questa è in assoluto una delle migliori risposte io abbia ricevuto: grazie!
April 24th, 2009 at 9:49 am
Come detto prima la testo anch’io su sitemap, però ho aggiunto anche il parametro orderby:
http:///atom.xml?max-results=1500&start-index=1&orderby=updated
April 24th, 2009 at 8:31 pm
Merlinox scrive:
Sì, prima mi ero dimenticato di dirlo.
(anche se ripeto, secondo me non è l’unico vantaggio)
Merlinox scrive:
Sì, penso vada bene ugualmente, se la sitemap è completa non dovrebbe cambiare nulla ordinare gli elementi o meno.
PS: io utilizzerei un max-results più basso e userei più sitemap, per dare a google file meno pesanti da scaricare.
April 25th, 2009 at 7:30 pm
Mi sa che uno dei blog in cui l’ho testata ha qualche problema. Risultato: totali url submitted 572, totali url indicizzate 19, sitemap completa 501 pagine, sitemap (rss blogger) 26.
Pagine indicizzate da google nella serp (ricerca site:) 2030… c’è qualcosa che non quadra
Altro blog: 401 totali, 16 indicizzate, 943 in serp: http://www.faridere.it!
Mah… mi sa che mr. G ci fa vedere quello che gli gira!
April 25th, 2009 at 8:41 pm
@ Merlinox:
Uhm, magari dagli tempo se l’hai aggiunta adesso, a me restituisce valori abbastanza veritieri (confrontando con site:)
PS (che non c’entra niente): nel sito in cui hai 2030 pagine indicizzate, quanti post hai scritto? (lo vedi dalla bacheca di blogger)
April 26th, 2009 at 10:34 pm
@andrea: ad ora 1724, però google indicizza anche tutte le pagine archivio / tag.
April 27th, 2009 at 10:37 am
Come non detto… sta iniziando a dare risulati considerevoli: tipo 300 su 500 indicizzate. Quello che non capisco è la relazione tra le pagine realmente indicizzate e quelle presenti sulla SERP. Misteri, anzi gMistery!
April 28th, 2009 at 5:46 pm
@ Merlinox:
Secondo me, è solo Google che sta ancora “elaborando” la sitemap
April 28th, 2009 at 5:47 pm
@Andrea: nel senso che sta dicendo “celo celo… mi manca… celo celo… mi manca mi manca… celo celo”???
Notte!
April 30th, 2009 at 2:28 pm
[…] techno burger viene data un’utile indicazioni per gli abitanti di blogger, i blog di blogspot. In pratica […]
June 29th, 2009 at 4:53 pm
Domanda: nel caso invio la mia sitemap che ad oggi conta 10 post ad esempio, tutti i successivi post che scrivo fino al limite di 500 vengono automaticamente aggiornati da google? o devo inviare la mia sitemap ogni volta?