11th dicembre 2008 by WebAir
Un semplice tutorial che può sempre servire ai SEO (Search Engine Optimizer) che hanno iniziato da poco o a coloro che vogliono capire cos’è e come si crea una sitemap in formato xml necessaria per i motori di ricerca.
Una sitemap è un documento creato in XML e contiene tutti gli url delle pagine del nostro sito. Possiamo decidere di ometterne alcuni, per esempio gli url delle aree riservate che ci consentono di amministrare il nostro sito.
Possiamo vedere la sitemap XML come un’altra versione della sitemap che normalmente includiamo tra le pagine del nostro sito che serve per orientare gli utenti all’interno del sito; questa versione (XML) però non è per gli utenti, ma per i motori di ricerca e pià precisamente per i bot che fanno visita al nostro sito. Sono bot, non possiamo parlare con parole e foto sottoforma di HTML o PHP … loro vogliono l’XML. E allora passiamo alla creazione vera e propria della sitemap, non dimentichiamo però la logica che sta in ogni documento XML, bisogna infatti pensare alle matrioske, ogni elemento sarà contenuto dentro un altro fino ad arrivare al genitore, non dimenticatelo durante l’implementazione della vostra sitemap.
Iniziamo con quello che nelle normali pagine HTML sarebbe l’header, infatti troviamo alcuni dati relativi al formato della sitemap come formato e codifica
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset
xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd”>
<url>
in questa prima parte del codice dichiariamo anche a quali standard fa riferimento la sitemap
passiamo alla parte centrale della sitemap:
si comincia sempre con lo specificare l’indirizzo del nostro sito, dopo passeremo alle singole pagine (index, ecc…)
<url>
<loc>http://www.vostrosito.it/</loc>
<priority>1.00</priority>
<lastmod>2008-12-08T03:00:00+00:00</lastmod>
<changefreq>daily</changefreq>
</url>
spieghiamo quanto appena scritto:
- abbiamo racchiuso tutto nell’elemto URL, aperto all’inizio del blocco e chiuso alla fine
- con l’elemento LOC definiamo l’indirizzo della pagina (come già detto, inizalmente inseriamo l’indirizzo del nostro sito)
- l’elemento LASTMOD contiene la data dell’ultima modifica dell’url che abbiamo inserito nella riga precedente
- con l’elemento CHANGEFREQ specifichiamo con che frequenza viene modificata (aggiornata) la pagina dell’url dichiarato poco prima. i valori possibili per questo elemento sono always (conetnuto diverso ogni volta che vi si accede), hourly (contenuto aggiornato ogni ora), daily(contenuto aggiornato ogni giorno), weekly(contenuto aggiornato ogni settimana), monthly (contenuto aggiornato ogni mese), yearly (contenuto aggiornato ogni anno), never (contenuto mai aggiornato)
ripetete l’ultimo blocco del codice per ogni pagina che desiderate sia indicizzata dal motore di ricerca e alla fine chiudete con
</urlset>
il quale chiude quanto aperto inizialmente nel nostro documento XML. URLSET rappresenta l’elemento contenitore di tutto, il più esterno, all’interno del quale troviamo i singoli URL che vogliamo far indicizzare dai motori di ricerca.
Salvate il documento nel formato XML assegnando il nome che preferite ed avrete la vostra sitemap. Vi ricordo che per uno stesso sito potete avere più sitemap, fate attenzione a non assegnare lo stesso nome altrimenti sul server ne troverete solo una; ciò accade se si è in più di una persona a gestire il sito e magari involontariamente i colleghi possono inserire sitemap con nomi già esistenti (ricordate che esiste sempre l’errore umano!).
Per approfondimenti: sitemaps.org










Ciao
Google mi ha mandato questo avviso: XML non valido: numero eccessivo di tag. Dice che ci sono doppi .
Questo l’ho capito, ma io non so correggere la sitemap. Anzitutto, dove la trovo? Nell’html del blog? Ho provato a vedere ma non la trovo.
Puoi mandarmi una mail con la spiegazione, per favore?
Grazie
@ coscienza critica > la sitemap la trovi nella directory principale (root) del tuo sito o del tuo blog. E’ un file con estensione xml, molto spesso si chiama proprio sitemap.xml ma altre volte può chiamarsi diversamente. Guarda bene tra le directory che sono sul server.
Già, il problema è che non so cosa sia una directory, dove si trova e cosa è un server. Mi indichi i passi, per favore?
Grazie
iniziamo con qualcosa di semplice: http://it.wikipedia.org/wiki/Server qui potrai capire cos’è un server. Successivamente potrai capire che per gestire un sito, che è fisicamente su un server, ti serve un client FTP, ovvero un programma in grado di dialogare con il server impartendogli comandi che decidi te (aggiornare il contenuto del sito, cancellare le sue parti, ecc…). Prima però ti consiglio di leggerti bene il contenuto del link che ti è stato segnalato.
Probabilmente la gestione del sito non spetta a me, anche perché mi avvalgo della piattaforma blogger di google (il mio è un blog gratuito). Dal link che gentilmente mi hai dato, capisco che il server non dipende da me, ma è un servizio che mi viene offerto. Tuttavia, la pagina ’strumenti per il webmaster’ di google, mi segnala qualche problema (e google non mi indicizza celermente come prima). Penso che debbano provvedere loro, no? Io non sono server, ma client (se ho ben capito). Ecco gli screenshot relativi agli avvisi di errore e i suggerimenti che mi dànno:
img24.imageshack.us/gal.php?g=sitemap1.jpg
Ciao
Essendo un servizio offerto da google, è google stessa che gestisce tutta la parte relativa alla sitemap ecc… Almeno questo è quello che si capisce da quanto letto e da informazioni relative a Blogger. Infatti la sitempa del tuo blog l’ha fatta google, non tu. Per quanto riguarda la velocità con cui Google indicizza le tue pagine, non ti devi preoccupare, non dipende solo dalla corretteza della sitemap, ma anche dalla popolarità che il tuo blog ha in rete; poca popolarità = bassa velocita di rilevamento della pagine da parte di google. Se inserisi articoli interessanti e ricevi moltissime visite vedrai che google tornerà più spesso a far visita al tuo sito.
Sì, WebAir, hai capito bene: è google che pensa alla sitemap e quindi non capisco perché non corregge questi errori.
Fino al mese scorso, i miei post venivano indicizzati quasi istantaneamente (il blog è popolare, con una media di 500 visitatori al giorno), adesso… certe volte passano anche 24 ore. Come te lo spieghi?
Pare non si possano scrivere mail a google, ma non è certo. Se tu hai una loro mail, me la posti qui, per favore?
Grazie
Esiste il gruppo di asisstenza ufficiale per i webmaster http://groups.google.it/group/Google_Webmaster_Help-it Potrai postare i tuoi dubbi e le tue domande o semplicemente parlare con atri webmaster per scambiare consiglie ed idee.
Ok. Ho provato a postare il mio problema al link, dove non c’è nessuna traccia di mail! Incredibile.
Grazie mille, anche per la tua pazienza.
Cordialmente
Different fields of our life consume lots of time, therefore why should we expend free time for business term paper writing? It is easier to utilize really professional custom writing service to purchase the term paper essays from, I guess.
Bless you! Still yet another awesome article, this can be precisely why my partner and I returned for your internet site habitually..
LASHAWNDA