Blog Guide SEO About me Contatti Cerca nel sito... SERVIZI SEO WEB MARKETING PUBBLICITÀ SU GOOGLE PUBBLICITÀ SU FACEBOOK BLOG AZIENDALI Sei qui: EVE Milano / Posizionamento Motori di Ricerca / Come costruire la Sitemap.xml perfetta Come costruire la Sitemap.xml perfetta b j c a 28/06/2013 SCRITTO DA GIOVANNI SACHELI 1 COMMENTO La sitemap.xml è un elemento molto importante per un sito web, questo file infatti rappresenta l’indice di tutte le pagine che si intende inviare ai motori di ricerca affinchè vengano indicizzate. La guida si focalizza sulla sintassi corretta della sitemap.xml, mentre per verificare la completezza degli URL elencati rimando a questa guida . La sitemap.xml dovrebbe essere linkata dal file robots.txt che è il primo file che i crawler leggono quando atterrano su un sito web: 1 User‐agent: * 2 Disallow: /admin/ 3 4 Sitemap: http://www.esempio.com/sitemap.xml Robots.txt hosted with by GitHub Google nelle sue linee guida view raw fornisce consigli e risorse dove è possibile studiare la struttura che una sitemap.xml dovrebbe avere, tuttavia molti webmaster ignorano queste indicazioni e generano sitemap.xml spesso rudimentali ed incomplete. Con questo articolo vorrei riassumere le informazioni necessarie per creare una sitemap.xml perfetta. Cos’è la Sitemap.xml La sitemap.xml è un file, appunto in formato .xml , che contiene l’elenco formattato degli URL del sito web nel quale è contenuta. In questo elenco è possibile specificare, per ogni URL, alcune informazioni utili ai motori di ricerca: la data dell’ultimo aggiornamento la frequenza di aggiornamento l’importanza che l’URL ha in relazione a tutte le altre pagine del sito Come si scrive la Sitemap.xml La Sitemap.xml dovrebbe essere scritta e aggiornata automaticamente dal CMS ogni qual volta un contenuto viene aggiornato o aggiunto ex­novo. Durante la sua compilazione bisogna rispettare alcuni limiti ed alcune regole, come ad esempio possono venire elencati fino ad un massimo di 50.000 URLs e la dimensione del file Sitemap.xml non compresso non deve superare i 50MB. Vediamo un esempio di Sitemap.xml con due URLs: 1 <?xml version="1.0" encoding="UTF‐8"?> 2 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 3 <url> 4 <loc>http://www.esempio.it/</loc> 5 <lastmod>2013‐06‐26</lastmod> 6 <changefreq>daily</changefreq> 7 <priority>0.8</priority> 8 </url> 9 <url> 10 <loc>http://www.esempio.it/contatti/</loc> 11 <lastmod>2013‐05‐26</lastmod> 12 <changefreq>monthly</changefreq> 13 <priority>0.3</priority> 14 </url> 15 </urlset> Sitemap.xml hosted with by GitHub view raw Come potete notare la Sitemap.xml inizia con la tag di apertura “urlset” con la quale si dichiara lo standard del protocollo utilizzato. Di seguito trovate elencati tutti gli attributi, obbligatori e facoltativi, che una Sitemap.xml completa dovrebbe utilizzare. Gli attributi della Sitemap.xml Ci possono essere situazioni dove una sola sitemap non basta, ad esempio per siti con più di 50.000 pagine. In questi casi si devono generare più sitemap ed una sitemapindex che le comprenda tutte. Vediamo un esempio di sitemapindex.xml La Sitemapindex.xml 1 <?xml version="1.0" encoding="UTF‐8"?> 2 <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 3 <sitemap> 4 <loc>http://www.esempio.it/sitemap1.xml.gz</loc> 5 <lastmod>2013‐06‐01T14:32:19+00:00</lastmod> 6 </sitemap> 7 <sitemap> 8 <loc>http://www.esempio.it/sitemap2.xml.gz</loc> 9 <lastmod>2013‐06‐01</lastmod> 10 </sitemap> 11 </sitemapindex> Sitemap‐index.xml hosted with by GitHub view raw Dove posizionare la Sitemap.xml Si consiglia di inserire il file Sitemap.xml nella root del web server poichè gli URLs contenuti devono risiedere nella stessa struttura di folder della sitemap. In altre parole, il percorso di un file Sitemap determina l’insieme di URL che può essere inserito nella Sitemap, ad esempio: “ Un file Sitemap posizionato in http://esempio.it/catalog/sitemap.xml può includere tutti gli URL che iniziano con http://esempio.it/catalog/ ma non quelli che iniziano con http://esempio.it/images/. Per questo motivo si consiglia di posizionare la sitemap nel folder dove risiede la prima pagina del sito (index.php/html/asp/…) La Sitemap.xml per i siti multi­lingua organizzati in sub­folder Immaginiamo un sito in due lingue, Italiano ed Inglese, organizzato in sub­folder: http://www.esempio.com/IT/ http://www.esempio.com/EN/ In questo caso si consiglia di generare tre sitemap distinte: Un indice di sitemap: http://www.esempio.com/Sitemapindex.xml La sitemap per gli URL in lingua Italiana: http://www.esempio.com/IT/Sitemap.xml La sitemap per gli URL in lingua Inglese: http://www.esempio.com/EN/Sitemap.xml Questa suddivisione aiuta Google ad interpretare e suddividere le lingue nel sito, soprattutto in casi dove il rel alternate non sia ben implementato. Come riprodurre i caratteri speciali nella Sitemap.xml Codici di escape della Sitemap.xml Come verificare la correttezza della Sitemap.xml Online esistono diversi tools per testare la validità della Sitemap.xml, di seguito ne elenco alcuni: http://www.xml­sitemaps.com/validate­xml­sitemap.html http://www.automapit.com/sitemapvalidator.html http://www.xmlcheck.com/ http://seogadget.com/check­your­xml­sitemap­errors/ http://www.inspyder.com/free/SitemapValidator.aspx Articoli correlati che potrebbero interessarti: 4 modi per trovare la Sitemap.xml di un sito web (14.2) Come verificare la correttezza di una Sitemap.xml (12.7) La corretta migrazione SEO di un sito web (12.5) Come posizionare la pagina corretta in Google (8.9) Come funziona l’Intestazione HTTP X­Robots­Tag (6.9) Ottimizzare le immagini per Google e la SEO (6.3) Analytics SEO, un tool a 360° davvero interessante (6.3) Hotlinking, cosa vuol dire e come proteggersi (6.2) FILED UNDER: POSIZIONAMENTO MOTORI DI RICERCA TAGGED WITH: GOOGLE SEARCH CONSOLE , INDICIZZAZIONE , SITEMAP.XML AGENZIA PARTNER IN SVIZZERA Searcus Swiss Sagl agenzia di Consulenza SEO a Lugano dal 2009. EVE Milano collabora con Searcus per progetti SEO multi lingua. Cerchi una agenzia SEO in Ticino? Ti consiglio Searcus.ch e avremo modo di lavorare assieme. Abbiamo una profonda esperienza della SEO e Google AdWords e conosciamo il mercato Svizzero ed Europeo. About Giovanni Sacheli Giovanni Sacheli é consulente SEO e SEM per Searcus Swiss Sagl ed EVE Milano. Professionista Certificato Google AdWords e grande appassionato di analisi SEOtecniche ed ottimizzazioni di siti eCommerce multilingua. Dal 2009 condivide su questo blog le sue esperienze e le nozioni tecniche più interessanti per posizionare siti web su Google. Commenta con Google+ Questo articolo è stato pubblicato prima della migrazione su HTTPS avvenuta il 1/1/2016. Questi commenti riguardano l'URL vecchio, senza HTTPS. Non è possibile aggiungere altri commenti con Google+, usa i commenti nativi di WordPress.