Sitemap completa su Blogger (blogspot) Scrivi un commento!

Sitemap completa su Blogger (blogspot)

BlogspotEnglish version: Add Blogger to Webmaster Tools

Abbiamo già visto che è possibile, per un blog basato su Blogger (su blogspot.com), usare il feed RSS come Sitemap (da aggiungere agli Strumenti per il Webmaster di Google); la Sitemap così generata conterrà però solo gli ultimi articoli. Vediamo come ottenere una Sitemap completa, contenente cioè tutti gli articoli pubblicati.


Aggiornamento: ho cambiato lievemente l’indirizzo del feed, sostituendo “rss” con “atom”, per evitare degli warning provocati dal formato RSS quando viene usato come sitemap.

In breve: aggiungere la sitemap di Blogger su Webmaster Tools

Schermata di Google Webmaster Tools

  1. Collegarsi a Google Webmaster Tools, entrare nelle proprietà del blog e cliccare su Sitemap > Aggiungi Sitemap;
  2. Selezionare “Aggiungi sitemap web generale“;
  3. L’url della sitemap è: atom.xml?max-results=500&start-index=1
  4. Confermate cliccando Aggiungi sitemap web generale.

La sitemap così creata comincerà ad elencare gli articoli a partire dall’articolo 1 (il più nuovo) e conterrà al massimo 500 articoli.

Sitemap per blog con più di 500 articoli

Se avete pubblicato più di 500 articoli, la sitemap non conterrà gli articoli dal 501° in poi. Non vi preoccupate, basterà aggiungere altre sitemap (finché non si copriranno tutti gli articoli del blog).

Aggiungete altre sitemap, ripetendo i passi 1, 2, 3 e 4. Di volta in volta, quando arriverete al punto 3, inserite:

  1. atom.xml?max-results=500&start-index=501
  2. atom.xml?max-results=500&start-index=1001
  3. atom.xml?max-results=500&start-index=1501

e così via… Ma avete davvero pubblicato più di 1500 articoli? :mrgreen: Alla fine la tabella riassuntiva delle sitemap dovrebbe essere simile a questa:

Tabella sitemap

Una nota: se avete una sitemap “piena”, vedrete, nella tabella soprastante, che alla voce “link segnalati” comparirà 501, non 500: non vi preoccupate, quel link in più è la home page, riportata in ogni feed.

Spiegazione della sitemap

Parametri del feed atom.xml

Vediamo i parametri che abbiamo usato:

  • start-index: l’articolo da cui cominciare a pubblicare;
  • max-results: il numero massimo di articoli da pubblicare nel feed.

Collegandoci al file rss.xml, senza usare questi parametri, otteniamo di default gli ultimi 25 articoli.

Ulteriori parametri li trovate su Google Data APIs Protocol Reference. Quelli che abbiamo usato noi servono per la paginazione della sitemap.

Paginazione del feed

Una sitemap non può essere illimitata:

  • non può contenere più di 50000 link (sì, lo so che postate moltissimi articoli) :mrgreen:
  • non può superare i 10 MB di dimensione

Per questo andremo a dividere la sitemap in più “pagine”.

Facendo dei test con un blog famoso su blogspot, con articoli di medie dimensioni, ho notato che un limite di 500 articoli è un buon compromesso: il file atom.xml va ad occupare così circa 2 MB - ma potete modificare tranquillamente tale numero, in base alle vostre esigenze. :wink:

Poniamo di voler ottenere l’URL della n-esima pagina (n parte da zero), con limite x; allora, la n-esima pagina comincerà dal (n*x+1)-esimo articolo (start-index). Quindi l’URL da inserire sarà:

atom.xml?max-results=x&start-index=(n*x+1)

Articoli simili:

Se questo articolo ti è stato utile, segnalalo sul tuo sito! Puoi inoltre seguire comodamente gli aggiornamenti di Techlog tramite il feed RSS; infine puoi lasciare un commento se ti serve aiuto (o anche solo per un saluto); anche qui non serve registrarsi (sono abilitati anche i commenti anonimi; l'E-Mail serve, eventualmente, per ricevere le notifiche delle nuove risposte). ;-)

49 Responses to “Sitemap completa su Blogger (blogspot)”

  1. diggita.it Says:

    Sitemap complete su Blogger…

    Per migliorare l’indicizzazione del nostro blog, è possibile usare il feed RSS dello stesso come Sitemap; il feed, però, riporterà solo gli ultimi post.
    Vediamo come aumentare il numero di articoli riportati passando ulteriori parametri all’indiri…

  2. m1979 Says:

    Ho appena aggiunto la sitemap al mio blog sui contest (ha più di 220 articoli)!! Tra qualche giorno ti saprò dire meglio, sugli sviluppi, ma credo che non ci dovrebbero essere problemi!!

    Grande segnalazione complimenti!! ;-)

  3. notorious Says:

    Grazie :wink: Cercavo un parametro per togliere, dal feed, il contenuto dell’articolo (in modo da rendere meno pesante la sitemap) ma niente da fare. :(

  4. Bob Says:

    Grazie un articolo veramente ben spiegato! L’ho votato.
    Ad oggi,il mio blog ha 454 post e mi risulta essere di 148.616 byte, quindi mi sembra tutto a posto.
    Approfitto della tua bravura per chiederti se puoi spiegarmi come hai messo le emoticons. Ho provato vari sistemi, ma non sono mai riuscito.
    Grazie ancora.
    Bob.

  5. notorious Says:

    @Bob
    Scusa per il ritardo della risposta: il tuo commento era finito nello spam di Akismet (forse per il “trucchetto” sull’e-mail che - giustamente - usi) e ieri non avevo controllato. :(
    Per quanto riguarda le emoticon, su Wordpress (per quel poco che ho visto) dipendono dal tema che usi: alcuni le hanno, altri no.

    Se ti riferivi a blogger (come penso), mi spiace, ma ancora non me ne sono interessato (magari più in là :wink: )

  6. UgoPiazza Says:

    URL limitato da robots.txt
    Al momento non possiamo accedere alla tua home page a causa di limitazioni in robots.txt.

    E’ quello che mi appare quando faccio la verifica del sito.

    Avvisi ed errori della sitemap:

    Abbiamo rilevato un errore durante l’accesso alla tua Sitemap. Accertati che la tua Sitemap rispetti le nostre linee guida e che sia possibile accedervi utilizzando il percorso da te fornito, quindi reinviala.

    Qualcuno ha qualche souizione a questo problema ???

    Grazie.

  7. notorious Says:

    @UgoPiazza: se vai a vedere le pagine indicizzate su Google del tuo sito, noterai che il problema non è limitato alla sola sitemap: l’accesso all’intero sito è bloccato ai motori di ricerca. :wink: Questo perché c’è la seguente riga sul tuo robots.txt

    Disallow: /

    Vai sulla bacheca di blogspot, nella scheda Impostazioni, e controlla che
    Vuoi far trovare il tuo blog dai motori di ricerca?
    sia impostato su “Sì”

  8. UgoPiazza Says:

    Era impostato su sì, ma ora per sicurezza ho selezionato NO, ho salvato, e dopo poco ancora SI, vediamo…

    Grazie.

  9. notorious Says:

    Ho fatto la prova sul mio blog di blogspot, e le modifiche al robots.txt dovrebbero essere immediate… :-S

  10. UgoPiazza Says:

    Purtroppo non è cambiato nulla…

    AIUTO !!!!!!!!!!

  11. notorious Says:

    Hai provato a leggere http://www.labnol.org/forums/topic/robotstxt-disallowing-web-crawlers , come ti ho suggerito per e-mail? L’autore della discussione sembra avere il tuo stesso problema…

    EDIT: mannaggia al justify definito sul CSS dei commenti! >:-(

  12. UgoPiazza Says:

    SI, il problema è che non cita soluzione alcuna…

  13. notorious Says:

    @UgoPiazza: sì, la cita, anche se un po’ all’interno della discussione:
    aprire un ticket per richiere aiuto:
    http://www.blogger.com/problem.g

    Poi più sotto da’ anche un’avvertenza:

    When you submit a ticket to Blogger support, you will immediately get an auto-reply.

    YOU HAVE TO CONFIRM AND REPLY TO THAT MAIL FOR BLOGGER STAFF TO TAKE ACTION.

    If you have not received an acknowledgement mail, I suggest that you submit the request again.

    Comunque credo ci voglia un po’ di tempo…
    Fammi sapere come va’ a finire :)

  14. utopie Says:

    grazie del post. io però sto avendo un problema. dopo aver messo atom.xml (verifica ok) ho aggiunto rss.xml?max-results=500&start-index=1 ma su Strumenti per i Webmaster dopo la verifica mi è comparso il seguente avviso “XML non valido: numero eccessivo di tag” per 10 volte e mi chiede modifica e rinvio. Tag principale: item, Tag: category.
    Lo status ora è quindi “avviso”, mentre per atom.xkl era “ok”. Per evitare conflitti con 2 sitemaps ho cancellato sitemap atom.xml (che consentiva un massimo di 26 post rilevati), ma il problema rimane. Segnalo che il numero totale di URL nella sitemap analizzati nel riepilogo sitemap è 75 e i post presenti al momento sono 74.
    Che posso fare?
    Grazie mille!

  15. Notorious aka Andrea Romagnoli Says:

    @ utopie:
    Finché sono Warning non dovresti preoccuparti: probabilmente è dato dal fatto che, non essendo il feed una sitemap canonica, quando si usano troppe label la sitemap va un po’ “contro le regole”… ;)

    Adesso sto uscendo, quando torno faccio un po’ di verifiche e ti faccio sapere meglio ;)

    utopie scrive:

    Segnalo che il numero totale di URL nella sitemap analizzati nel riepilogo sitemap è 75 e i post presenti al momento sono 74

    Già questo dovrebbe tranquillizzarti: significa che la sitemap sta facendo il suo dovere - cioè, quello di dire a Google quante pagine ci sono da indicizzare e il loro url, per aiutarlo nell’indicizzazione, e far vedere a te quante pagine non sono state ancora indicizzate. E Google ti ha indicizzato quasi tutte le pagine… ;)

  16. cariblo Says:

    A me sta succedendo la stessa cosa di utopie per mesi nessun problema ma ora appare questo “AVVISO”. Tral’altro le url indicizzate ora sono tutte! mentre prima un buon numero non lo erano.
    Una soluzione sembra esserci ma la sitemap suppongo non sarebbe più completa:
    qui

  17. Notorious aka Andrea Romagnoli Says:

    cariblo scrive:

    Una soluzione sembra esserci ma la sitemap suppongo non sarebbe più completa

    Esattamente! ;) Inoltre, gli warning sembrano leggermente diversi: se ora provi a passare ai Webmaster Tools una sitemap che fa il redirect a Feedburner, non darebbe warning, ma proprio errore! ;)

    Ripeto, quando si ottiene un messaggio del genere:

    Numero totale di url: X
    Numero di url indicizzati: Y

    … lo scopo della sitemap è stato a mio avviso raggiunto! ;)
    (non dimentichiamoci che non influisce sul posizionamento…)

  18. Blogmasterpg Says:

    A me succedeva lo stesso. Innanzitutto in questa sitemap non c’è il redirect=false quindi può essere questo l’errore. Comunque volevo chiedere se la prova fatta con i 501 posts, cioè più di 500 posts era stata fatta in un semplice blogspot.com oppure in un Blogger ‘hostato’ su altro servizio. Sapevo infatti che blogspot.com non dava più di 500 ‘entries’ cioè posts… Boh… comunque io la soluzione l’ho trovata, se San Google vuole, per il momento, dopo 24 h di prove…. E’ nel Mio sito sotto il tag sitemap; ho solo upgradato un vecchio post..

  19. Notorious aka Andrea Romagnoli Says:

    Blogmasterpg scrive:

    Innanzitutto in questa sitemap non c’è il redirect=false quindi può essere questo l’errore

    Beh, per prima cosa non è un errore, ma uno warning… ;) Come dice lo stesso GWT:

    Generally, warnings will not prevent processing of your Sitemap, but they might indicate potential problems with your site

    Inoltre, non ci dovrebbe essere bisogno del parametro redirect=false: non appena nell’indirizzo del feed RSS viene inserito un parametro, viene restituito il feed residente su blogspot.com, senza fare il redirect su Feedburner.
    … altrimenti, Google Webmaster Tools mi avrebbe dato l’errore “la sitemap non risiede nel dominio principale”! ;)
    Blogmasterpg scrive:

    Comunque volevo chiedere se la prova fatta con i 501 posts, cioè più di 500 posts era stata fatta in un semplice blogspot.com oppure in un Blogger ‘hostato’ su altro servizio. Sapevo infatti che blogspot.com non dava più di 500 ‘entries’ cioè posts…

    Avevo fatto il test con un blog su blogspot.com con molti articoli (non il mio), scaricando le sitemap che ottenevo cambiando i parametri e confrontandone i valori. Mi ricordo di aver ottenuto file molto grandi, quindi avevo testato sitemap contenenti più di 500 articoli. Il test comunque lo avevo fatto nel Novembre 2007, quindi magari adesso qualcosa è cambiato.
    Comunque sia, specificando max-results=500&start-index=1, si ottengono sitemap con esattamente 500 articoli, non 501; il +1 è dato dal fatto che blogspot inserisce anche la url del blog, e GWT la considera come una voce della sitemap ;)
    Nel mio blog uso 100 come max-results; avevo letto in giro che erano preferibili sitemap le più piccole possibili. ;)
    Blogmasterpg scrive:

    Boh… comunque io la soluzione l’ho trovata, se San Google vuole, per il momento, dopo 24 h di prove

    Mi sembra di aver capito che usi gli stessi parametri di cui ho parlato qui. Quale indirizzo hai passato a GWT? Ottieni degli warning?

  20. Notorious aka Andrea Romagnoli Says:

    @ Blogmasterpg:
    Comunque sia, questo non è un problema di redirect; GWT, da Novembre 2007 (mese in cui ho applicato questo metodo), non ha mai dato uno warning. Sono comparsi da pochi giorni, e sembrano problemi relativi alle label dei post. In ogni caso, Google sembra riuscire a leggerla senza problemi… ;)

  21. Warning sulle sitemap complete di Blogger (Blogspot) Says:

    […] hai seguito la mia guida “Sitemap complete su Blogger“, avrai notato che, dai primi di Giugno, gli Strumenti Google per il Webmaster ti stanno […]

  22. Notorious aka Andrea Romagnoli Says:

    Trovato il “problema”: per eliminare gli warning, reinviate la sitemap, sostituendo, nell’indirizzo, “rss” con “atom”: nel feed atom non vengono inserite le label dei post, che provocavano gli warning. ;)

  23. Warning nelle sitemap di blogger: colpa del RSS! Says:

    […] ti avevo detto che, secondo il mio modesto parere, gli warning nelle sitemap di Blogger non rappresentavano un problema. Nonostante continui a ritenere le mie considerazioni valide… […]

  24. utopie Says:

    Notorious aka Andrea Romagnoli scrive:

    Trovato il “problema”: per eliminare gli warning, reinviate la sitemap, sostituendo, nell’indirizzo, “rss” con “atom”: nel feed atom non vengono inserite le label dei post, che provocavano gli warning.

    quindo per togliore i warming basta togliere rss.xml?max-results=500&start-index=1 e mettere atom.xml?max-results=500&start-index=1 ? :#

  25. Notorious aka Andrea Romagnoli Says:

    @ utopie:
    Esatto! ;)
    Ovviamente, superati i 500 articoli, dovrai cambiare start-index a 501… e così via.

    Migliorata l’indicizzazione con la sitemap, puoi provare a migliorare un po’ il posizionamento leggendo questo:
    http://technoburger.net/guide/blog/blogger/titoli-seo
    ;)

  26. utopie Says:

    Notorious aka Andrea Romagnoli scrive:

    @ utopie:
    Esatto!
    Ovviamente, superati i 500 articoli, dovrai cambiare start-index a 501… e così via.
    Migliorata l’indicizzazione con la sitemap, puoi provare a migliorare un po’ il posizionamento leggendo questo:
    http://technoburger.net/guide/blog/blogger/titoli-seo

    si ora in effetti funge e lo status è ok. ora cancello indirizzo con rss. con la nuova stringa al momento alla voce “URL indicizzati in una sitemap” mi risulta la dicitura “Nessun dato disponibile. Ricontrolla appena possibile.”, mentre con i feed rss erano 75. penso sia solo questione di tempo. ad ogni modo vengono segnalati tutti i 77uRL della sistema. ora controllo il link per i titoli seo (in effetti era il passo successivo che volevo fare per ottimizzare il blog). grazie mille! ;)

  27. Notorious aka Andrea Romagnoli Says:

    utopie scrive:

    penso sia solo questione di tempo.

    Già ;)

    utopie scrive:

    ora controllo il link per i titoli seo

    Se hai problemi fai un fischio! ;)

  28. utopie Says:

    Notorious aka Andrea Romagnoli scrive:

    utopie scrive:
    penso sia solo questione di tempo.
    Già
    utopie scrive:
    ora controllo il link per i titoli seo
    Se hai problemi fai un fischio!

    grazie. il post sui titoli seo era abbastanza chiaro. ho scelto la seconda opzione come suggerito. vediamo se funge… ;)

  29. Notorious aka Andrea Romagnoli Says:

    @ utopie:
    Se vuoi, controlla le statistiche di accesso dai motori di ricerca, e vedi se migliorano (e di quanto). ;)
    Magari controlla anche se il posizionamento di qualche pagina migliori o meno. :)

  30. bruna luzzi Says:

    grazie per le informazioni che date
    bruna

  31. Tarkan Says:

    Grazie mille come sempre sei stato utilissimo!
    Stavo letteralmente impazzendo nel disperato tentativo di creare una sitemap da settimane e settimane (mesi a dire il vero!) grazie grazie grazie finalmente sono riuscito ;-)

  32. Andrea Romagnoli Says:

    @ Tarkan:
    Figurati! ;)

  33. francesco deredi Says:

    grazie mille per i consigli, gli applicherò al mio blog seduta stante.

  34. dangp Says:

    Grazie Andrea.

  35. Merlinox Says:

    Siamo convinti sia necessario dire a Google dove sono i nostri post, presenti sul suo db di blogger? Mah… io vedo ottime le sitemap per un discorso di riduzione tempi o raggiungibilità di contenuti non raggiungibili, ma non so che plus possano dare le sitemap ai blog.

    Se mi contraddite però ne sono contento e opero in tal senso!

  36. Andrea Romagnoli Says:

    Merlinox scrive:

    Siamo convinti sia necessario dire a Google dove sono i nostri post, presenti sul suo db di blogger?

    Se per questo, Google si batte contro i contenuti duplicati, ma poi guarda quanti ne genera un suo prodotto:
    http://www.google.it/search?q=site%3Anotoriousxl.blogspot.com+inurl%3Ashowcomment&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:it:official&client=firefox-a

    … insomma, non darei per scontato che un suo prodotto abbia privilegi particolari, dal punto di vista dell’indicizzazione. ;) Poi è una cosa comunque innocua, una sitemap “duplicata” non crea problemi.

    Merlinox scrive:

    io vedo ottime le sitemap per un discorso di riduzione tempi o raggiungibilità di contenuti non raggiungibili, ma non so che plus possano dare le sitemap ai blog.

    IMHO: i blog (e i contenuti raggiungibili tramite RSS) hanno un vantaggio nell’indicizzazione immediata (Google Search dovrebbe aiutarsi con Google Blog Search), ma non è detto che un post (magari poco linkato) resti indicizzato nel tempo.

    Insomma, sempre secondo me, è una garanzia in più di avere i vecchi post (e con poco trust) indicizzati… da qui, l’importanza di avere sitemap complete (piuttosto che quelle parziali che blogspot propone nel robots.txt).

    Il tutto IMHO, eh; però, ripeto, aggiungere le sitemap è una cosa che richiede poco tempo e che non crea, comunque, problemi. :)

    Merlinox scrive:

    Se mi contraddite

    Puoi anche darmi del tu, visto che siamo anche contatti su Friendfeed :mrgreen:

  37. Merlinox Says:

    Andrea Romagnoli scrive:

    Puoi anche darmi del tu, visto che siamo anche contatti su Friendfeed

    Andrea era solo per parlare con tutti i tuoi lettori :) Comunque sono ancora dubbioso sulla validità delle sitemap, almeno per un blog. Se poi mi dici che male non fa questo è sicuramente un altro paio di maniche :)

  38. Andrea Romagnoli Says:

    Merlinox scrive:

    ono ancora dubbioso sulla validità delle sitemap, almeno per un blog.

    Beh, blogspot stesso propone una sitemap ai motori di ricerca, quindi un vantaggio (anche minimo) ce l’avrà: ;)
    http://notoriousxl.blogspot.com/robots.txt
    (il problema della sitemap proposta da blogspot è che sia incompleta - è il motivo per cui ho scritto questo post).

    Anche se non dovesse avere nessun vantaggio nell’indicizzazione (ne dubito, il linkaggio interno dei vecchi post non è un granché… considerando anche che blogger blocca le label col robots.txt), un altro vantaggio è quello di poter vedere, su Google Webmaster Tools, il numero di post indicizzati rispetto al totale riportato nelle sitemap. :)

  39. Merlinox Says:

    Andrea Romagnoli scrive:

    n altro vantaggio è quello di poter vedere, su Google Webmaster Tools, il numero di post indicizzati rispetto al totale riportato nelle sitemap

    Questa è in assoluto una delle migliori risposte io abbia ricevuto: grazie!

  40. Merlinox Says:

    Come detto prima la testo anch’io su sitemap, però ho aggiunto anche il parametro orderby:
    http:///atom.xml?max-results=1500&start-index=1&orderby=updated

  41. Andrea Romagnoli Says:

    Merlinox scrive:

    Questa è in assoluto una delle migliori risposte io abbia ricevuto: grazie!

    Sì, prima mi ero dimenticato di dirlo. :) (anche se ripeto, secondo me non è l’unico vantaggio) ;)

    Merlinox scrive:

    prima la testo anch’io su sitemap, però ho aggiunto anche il parametro orderby:

    Sì, penso vada bene ugualmente, se la sitemap è completa non dovrebbe cambiare nulla ordinare gli elementi o meno. :)

    PS: io utilizzerei un max-results più basso e userei più sitemap, per dare a google file meno pesanti da scaricare.

  42. Merlinox Says:

    Mi sa che uno dei blog in cui l’ho testata ha qualche problema. Risultato: totali url submitted 572, totali url indicizzate 19, sitemap completa 501 pagine, sitemap (rss blogger) 26.
    Pagine indicizzate da google nella serp (ricerca site:) 2030… c’è qualcosa che non quadra :)

    Altro blog: 401 totali, 16 indicizzate, 943 in serp: http://www.faridere.it!
    Mah… mi sa che mr. G ci fa vedere quello che gli gira!

  43. Andrea Romagnoli Says:

    @ Merlinox:
    Uhm, magari dagli tempo se l’hai aggiunta adesso, a me restituisce valori abbastanza veritieri (confrontando con site:)

    PS (che non c’entra niente): nel sito in cui hai 2030 pagine indicizzate, quanti post hai scritto? (lo vedi dalla bacheca di blogger)

  44. Merlinox Says:

    @andrea: ad ora 1724, però google indicizza anche tutte le pagine archivio / tag.

  45. Merlinox Says:

    Come non detto… sta iniziando a dare risulati considerevoli: tipo 300 su 500 indicizzate. Quello che non capisco è la relazione tra le pagine realmente indicizzate e quelle presenti sulla SERP. Misteri, anzi gMistery!

  46. Andrea Romagnoli Says:

    @ Merlinox:
    Secondo me, è solo Google che sta ancora “elaborando” la sitemap :)

  47. Merlinox Says:

    @Andrea: nel senso che sta dicendo “celo celo… mi manca… celo celo… mi manca mi manca… celo celo”??? :) Notte!

  48. Sitemap e blog Says:

    […] techno burger viene data un’utile indicazioni per gli abitanti di blogger, i blog di blogspot. In pratica […]

  49. Emilio Says:

    Domanda: nel caso invio la mia sitemap che ad oggi conta 10 post ad esempio, tutti i successivi post che scrivo fino al limite di 500 vengono automaticamente aggiornati da google? o devo inviare la mia sitemap ogni volta?

Leave a Reply


SMS Gratis