Cum se creează un xml sitemap mare. Adăugarea unui fișier Sitemap la Yandex.Webmaster și Google Search Console (nuanțe și erori). Crearea și trimiterea sitemapurilor

Să presupunem că aveți un site plin de conținut unic, pe care Optimizare SEO iar tu stai, frecându-ți mâinile, așteptând ca creația ta să fie vizitată de un robot de căutare, indexat și aduci traficul râvnit. Timpul trece, iar rezultatul eforturilor tale nu este deosebit de vizibil. Ce s-a întâmplat? Poate că ceva a fost totuși trecut cu vederea, ceva a fost uitat în urmărirea nishtyak-ilor. Să presupunem că site-ul este încă unic și optimizatori de oriunde. Apoi trebuie să vă dați seama de ce motorul de căutare este atât de reticent să vă viziteze și de ce totul se întâmplă atât de încet.

Fiecare proiect web ar trebui să aibă două fișiere importante, și poate principalele: acestea sunt roboți (robots.txt) și sitemap (). Dacă vreuna dintre ele lipsește sau este completată incorect, este probabil ca resursa să nu dea rezultatul pe care îl așteptați. Până la urmă, boții de căutare au stabilit limite atât în ​​ceea ce privește timpul petrecut pe resursă, cât și în ceea ce privește numărul de documente pe care le pot verifica și introduce în baza de date. Și asta se datorează faptului că, dacă nu ați setat căile de călătorie pentru robotul de căutare, atunci acesta poate ajunge la conținut foarte curând, după ce a rătăcit în fișierele motorului înainte de asta.

Pentru a evita o astfel de confuzie, în fișierul roboți spunem pe ce roboți nu ar trebui să piardă timpul, iar folosind harta site-ului, dimpotrivă, vă sugerăm unde să căutați și unde să rătăcim.

Să presupunem că totul a crescut împreună cu noi și motoarele de căutare au început să ne indexeze proiectul, dar absența celui de-al doilea poate întârzia atingerea obiectivelor noastre. Și acum mai multe despre crearea unui sitemap.

Versiunile XML și HTML ale hărții site-ului

Sitemap.html acționează ca o navigare pentru oaspeții resursei noastre, ceea ce ajută la înțelegerea structurii site-ului și la găsirea secțiunii de interes pentru aceștia.

Sitemap.xml solicită și ajută roboții de căutare să descopere și să înceapă să indexeze paginile proiectului nostru. Dacă avem un nivel ridicat de imbricare și un număr mare de pagini web pe site, XML asigură că boții nu pierd din vedere ceea ce trebuie indexat. Ca un bonus frumos, primim un plus la karma sub forma încrederii sporite în resursa din motoarele de căutare.

Aspectele pozitive ale unui sitemap. xml pe site

  • indexarea accelerată a paginilor nou create;
  • probabilitate sută la sută ca motorul de căutare să găsească paginile necesare;
  • capacitatea de a specifica prioritățile pentru verificare, frecvența și data ultima actualizare pagini;
  • crește ușor credibilitatea resursei.

Important!

  • utilizați codificarea UTF-8 pentru harta site-ului;
  • dimensiunea fișierului nu trebuie să depășească 10 MB și conținutul său nu trebuie să depășească 50 de mii de adrese URL.

Cum să creați și să adăugați un sitemap. xml pe site

Luăm oricare editor de text, de exemplu Notepad++ și începeți să creați.

Primul bloc este partea standard, în care indicăm:

http://Наш сайт.ru/ 2016-05-23T23:45:36+00:00 daily 1.0

Valorile etichetei:

  • „loc” – în el am încheiat adresa paginii site-ului nostru, care ar trebui să fie indexată în curând de roboții de căutare;
  • „lastmod” - afișează data ultimei actualizări a paginii specificate în prima etichetă;
  • „changefreq” - arată cât de des va fi actualizat conținutul (în cazul nostru, în fiecare zi);
  • „prioritate” - setează prioritatea pentru indexarea paginii (de la 0 la 1)

Salvăm fișierul rezultat în format XML și îl plasăm în format . Apoi, specificați calea către acesta în roboți. txt cu această linie:

http://site-ul nostru/sitemap.xml

Sau putem folosi unul dintre generatoarele online. De exemplu,, care este conceput pentru a crea cel mult 500 de pagini. Dar adesea nu este nevoie de mai mult, așa că lucrăm cu el.

În prima linie introducem adresa URL completă a site-ului nostru cuhttp://site-ul nostru.

A doua linie, care se numește „ schimba frecventa ”, arată roboților de căutare cât de des vor fi actualizate paginile web. Putem alege:niciodată, săptămânal, zilnic, orar, lunar, anual.

Al treilea rând „Ultima modificare „ arată când pagina a fost actualizată ultima dată, putem alege fie data la care am decis să creăm un sitemap, fie să selectăm „ Utilizați răspunsul serverului » - atunci generatorul va introduce automat data ultima schimbare.

Și a patra linie prioritate ", după cum am discutat anterior, vă permite să selectați o prioritate pentru indexare, selectați"Prioritate calculată automat».

Apăsați butonul „Start” și așteptați ca acesta să fie generatharta site-ului în format XML, după aceea efectuăm din nou manipulări cu plasarea lui în rădăcină și specificarea căii în robots.txt.

Cum să raportați un fișier sitemap după crearea Google și Yandex

Mergem la webmaster și procedăm după cum urmează.

Alegeți să verificați harta site-ului:

Și setați calea către fișierul nostru sitemap.

Să verificăm ce s-a întâmplat:

Asigurați-vă că totul este în regulăși mergi la Google.

Pentru a ajunge la Google Search Console, în care, de fapt, puteți raporta harta noastră, accesați

Reîmprospătarea paginii- avem rezultatul verificării, iar dacă există o liniuță în coloana „Probleme”, atunci am făcut totul corect.

Rezumând

Creați și găzduiți o hartă de site. xml pe resursă este de fapt o chestiune de câteva minute, pentru aceasta puteți folosi orice editor de text sau generator online. Dacă aveți o hartă de site pe resursa dvs., accelerați și simplificați viața unui robot de căutare care urmează calea specificată și indexează paginile necesare. Aceasta înseamnă că rezultatul muncii dvs. de optimizare are șansa de a deveni vizibil mai repede. Dar este important să nu uităm de harta site-ului și să o actualizăm periodic, pentru că. pagina poate înceta participarea la promoție, iar boții vor continua să o viziteze, ceea ce va afecta pozițiile. De asemenea, exploratorul nostru XML poate servi ca asistent nu numai roboților, ci și hoților de conținut, deoarece în harta site-ului indicăm documentele de care avem nevoie, ceea ce simplifică foarte mult viața copy-pasteerilor. Prin urmare, vă recomandăm să verificați periodic conținutul resursei dvs. pentru unicitate. Urmând aceste reguli, creșteți încrederea motoarele de căutare Google și Yandex în resursa dvs.

Utilizați fișierul Sitemap pentru a informa Yandex despre structura actuală a site-ului: specificați o directivă specială în robots.txt sau adăugați-o în Yandex.Webmaster.

Cu Yandex.Webmaster, puteți:

Se încarcă Sitemap

    Alegeți site-ul din listă.

    Introduceți adresa URL a fișierului. De exemplu, https://example.com/sitemap.xml.

    Faceți clic pe butonul Adăugați.

Fișierul este pus în coada de procesare. Robotul îl va descărca în termen de două săptămâni. Fiecare fișier adăugat, inclusiv cele enumerate în fișierul index Sitemap , este gestionat de robot separat.

Odată ce fișierul este descărcat, veți vedea una dintre stările:

stare Descriere Notă
Bine
"Redirecţiona" Eliminați redirecționarea și
"Eroare" Fișierul este format incorect informează robotul despre actualizare
„Nu este indexat.”

Verificarea răspunsului serverului

Disallow directivă Permiteți accesul la Sitemap și informați robotul despre actualizare
stare Descriere Notă
Bine Fișierul este format corect și încărcat în baza de date a robotului.

Data ultimei descărcări este afișată lângă fișier.

Paginile indexate apar în rezultatele căutării în decurs de două săptămâni.

"Redirecţiona" URL-ul redirecționează către o altă adresă. Eliminați redirecționarea și informați robotul despre actualizare
"Eroare" Fișierul este format incorect Faceți clic pe linkul Eroare pentru a vedea detaliile. Editați fișierul și informați robotul despre actualizare
„Nu este indexat.” Când robotul încearcă să descarce fișierul Sitemap, serverul returnează starea HTTP alta decât 200

Verificați dacă fișierul este disponibil pentru robot. Pentru a face acest lucru, utilizați instrumentul de verificare a răspunsului serverului. Specificați calea completă către fișier.

Dacă fișierul nu este disponibil, contactați site-ul sau administratorul serverului de găzduire.

Accesul la fișier este refuzat în robots.txt cu directiva Disallow Permiteți accesul la Sitemap și informați robotul despre actualizare

Se actualizează Sitemap

Dacă ați modificat fișierul Sitemap adăugat la Yandex.Webmaster, nu este nevoie să îl ștergeți și să îl încărcați din nou. Robotul verifică în mod regulat fișierul pentru actualizări și erori.

Pentru a accelera indexarea fișierelor, faceți clic pe pictogramă. Dacă utilizați fișierul index Sitemap , puteți lansa procesarea fiecărui fișier listat în acesta. Robotul va descărca datele în două săptămâni. Puteți utiliza această funcție de până la 10 ori pentru fiecare gazdă.

Când epuizați toate încercările, veți putea încerca din nou la 30 de zile de la prima încercare. Data exactă este afișată în Yandex.Webmaster.

Eliminarea Sitemap-ului

Fișierele adăugate pe pagina de fișiere Sitemap pot fi eliminate din Yandex.Webmaster. Dacă directiva Sitemap a fost adăugată în fișierul robots.txt , ștergeți-o. După efectuarea modificărilor, informațiile despre Sitemap dispar din baza de date a robotului și din Yandex.Webmaster în câteva săptămâni.

FAQ

Harta site-ului este afișată în serviciu ca o pagină exclusă cu starea „Format document nevalid”.

Fișierul Sitemap (și alte fișiere XML) sunt afișate ca pagini excluse. Acest lucru este, totuși, doar în scop informativ și nu afectează indexarea site-ului sau procesarea Sitemap-ului.

Fișierul Sitemap poate fi afișat într-un grup de pagini excluse dacă robotul a încercat să-l indexeze ca o pagină obișnuită, în timp ce fișierele XML nu sunt indexate în motorul de căutare Yandex și nu sunt incluse în rezultatele căutării.

A apărut eroarea „Etichetă necunoscută” în timpul procesării Sitemap-ului

Fișierul Sitemap poate conține doar anumite elemente XML. Dacă Yandex.Webmaster găsește alte elemente în fișier (de exemplu, o referință la versiunea mobilă sau multilingvă, adrese URL de imagini), afișează eroarea „Etichetă necunoscută”. Robotul ignoră elementele neacceptate atunci când procesează Sitemap și ia în considerare datele din elementele acceptate. Prin urmare, nu trebuie să modificați fișierul Sitemap.

Dacă conținutul fișierului este modificat, informațiile din Yandex.Webmaster sunt actualizate în decurs de două săptămâni.

Fișierul Sitemap are starea „Neindexat”.

Este posibil ca fișierul Sitemap să nu fie indexat din mai multe motive:

    Robotul a accesat cu crawlere fișierul Sitemap recent și nu l-a procesat încă. Așteptați două săptămâni. Dacă utilizați fișierul index Sitemap cu mai multe fișiere, procesarea acestora poate dura mai mult decât un singur fișier Sitemap.

M-am gândit inițial să scriu un „post de weekend” simplu și ușor despre un lucru interesant pe care l-am observat recent în Google Search Console. Se pare că panourile pentru webmasteri Yandex și Google au acum verificarea automată a erorilor în hărțile de site XML. Anterior, îmi amintesc, se foloseau servicii speciale în astfel de scopuri, dar acum totul a devenit mult mai simplu.

În articol veți găsi nu numai o descriere a erorilor care pot fi urmărite cu ajutorul lor, ci am decis să vorbesc suplimentar despre cum să adăugați un fișier Sitemap la Yandex Webmaster și Google Search Console. Nu voi dezvălui nimic în afară de grandios, dar poate că cineva a ratat acest moment + va fi util pentru începători. Conţinut:

  • + linkuri utile.
  • (inclusiv căutarea erorilor).

1. Creați un Sitemap XML

Dacă proiectul dvs. web nu are încă o hartă de site, asigurați-vă că ați făcut una - aceasta este extrem de caracteristică utilă la (mai ales în resursele noi). Vreau să observ că în acest caz vorbim despre un format XML special (pentru motoarele de căutare), și nu despre HTML (pentru vizitatori). Mecanismul de lucru depinde de motorul pe care îl utilizați, iată câteva articole pe această temă:

  • Făcând (recenzii de plugin).
  • - câteva servicii pentru orice resurse.
  • (inclusiv considerat și XML).
  • Hack complicat pentru crearea unui Sitemap pe Blogspot Blog.

Harta site-ului: http://nume_domeniu/sitemap.xml

În general, am întâlnit informații conform cărora motoarele de căutare pot găsi în mod independent un sitemap XML dacă acesta se află la o adresă standard, dar, în principiu, este mai bine să îl încărcați în bara de instrumente.

2. Adăugați Sitemap la Google (Search Console)

Anterior, acest socket se numea Instrumente pentru webmasteri și arăta complet diferit. Acum este un instrument mai funcțional. Algoritmul acțiunilor este următorul:

  • Inregistreaza-teîn Search Console (dacă aveți deja un cont Google, atunci veți avea și acces la sistem);
  • Conectați-vă proiectul acolo și confirmați drepturile.
  • Pentru a finaliza sarcina de a adăuga Sitemap XML, accesați secțiunea „Crawling” - „Fișiere Sitemap”.

Această pagină conține toate informațiile de pe harta site-ului dvs. + puteți adăuga una nouă (2) sau puteți vedea dacă există erori în cele actuale (3).

Sitemapurile imbricate sunt acceptate în Google Search Console - există așa ceva, de exemplu, în pluginul Yoast SEO. Modulul generează adresa: http://domeniul_dvs./sitemap_index.xml.

Teoretic, puteți adăuga un singur fișier Sitemap (cel principal) la Googe Search Console, iar restul obiectelor vor fi preluate automat. În acest caz, pagina panoului va fi afișată numai sitemap.xml, iar când dați clic pe el, veți merge la subsecțiuni.

Apropo, dacă încărcați toate fișierele XML (principale și subparagrafele) separat, atunci numărul total de link-uri va fi adăugat:

Probabil, până acum nu există niciun instrument în consolă care să facă distincția între repetări, sau acesta este doar un astfel de format pentru afișarea numărului total de înregistrări sau o eroare.

În ceea ce privește erorile de sitemap

Dacă există probleme cu XML Sitemap adăugat, atunci veți vedea simbolurile corespunzătoare în panou (o pictogramă cu semn de exclamare și o intrare în coloana „Probleme”). În plus, vor exista și avertismente pe pagina unui anumit fișier sitemap.

În cazul din captura de ecran, puteți vedea o înregistrare că unele reguli robots.txt nu permit indexarea unor adrese de blog. Astfel de lucruri trebuie corectate și apoi trimiteți fișierul pentru reverificare - butonul „Test”.

Într-un alt proiect, am dat peste o situație mai proastă - harta site-ului a dat departe: (Aceasta este în general o prostie. Și modulul dorit a fost activat și am fost complet sigur că totul funcționează. Am găsit problema numai după ce am adăugat Sitemap-ul la panoul webmaster. Prin urmare, această procedură este destul de importantă și durează doar câteva minute.

3. Încărcați Sitemap pe Yandex

În ceea ce privește aici, după înregistrare, adăugarea unui site și confirmarea drepturilor asupra acestuia, trebuie să mergeți la secțiunea „Indexare” - „Fișiere Sitemap”.

Pagina are o detectare automată a hărții din Robots.txt + puteți adăuga fișierele dvs. Panoul acceptă și imbricarea. Dacă ceva a mers prost, va fi afișată o intrare de eroare. În captura de ecran de mai sus, problemele sunt legate de eticheta image:image din , pe care Yandex nu o înțelege. Wordpres are module care elimină acest jamb, dar, în principiu, nu afectează cu adevărat nimic. Eu personal las totul așa cum este.

Înainte de a adăuga un Sitemap la Yandex.Webmaster, puteți pur și simplu să efectuați o verificare rapidă a acestuia. Acest instrument este disponibil în secțiunea „Instrumente” - „Analiză sitemap”.

Total

După cum am spus mai sus, vă sfătuiesc să petreceți 5-10 minute pentru a adăuga fișierul Sitemap la Yandex și Google. Dacă proiectul dvs. nu are deja unul, asigurați-vă că îl creați. Acest proces, precum și utilizarea, va ajuta la îmbunătățirea indexării resursei și, de asemenea, vă va permite să găsiți erori despre care este posibil să nu le cunoașteți. Situațiile sunt diferite, de exemplu, au actualizat CMS-ul și au uitat să conecteze modulul sitemap-ului sau a început să eșueze de la sine - când Sitemap-ul începe să dea o eroare 404, nu este deloc cool.

Postarea, desigur, este mai mult pentru începători, dar sper că ți-a fost de folos și ție. Dacă ai ceva de adăugat, scrie mai jos.

Sitemap (Sitemap.xml) este un fișier .xml special stocat în directorul rădăcină al serverului. Acesta este un fișier cu informații despre paginile site-ului care trebuie indexate. De obicei, o hartă a site-ului este creată pentru Yandex și Google pentru a notifica roboților de căutare despre paginile care trebuie indexate. Harta site-ului verifică, de asemenea, cât de des au loc actualizările și care documente web sunt indexate cel mai important.

Videoclip de la Yandex Webmaster:

[yt=INGCBkR26eo]

Sitemap.xml este compilat folosind o sintaxă specială pe care o înțeleg motoarele de căutare, care va lista toate paginile care urmează să fie indexate, indicând gradul lor de importanță, data ultimei actualizări și frecvența aproximativă de actualizare.

Există două fișiere principale pe care orice proiect web ar trebui să le aibă - robots.txt și sitemap.xml. Dacă proiectul dvs. nu le are sau nu sunt completate corect, atunci cu un grad ridicat de probabilitate vă veți dăuna foarte mult resursei și nu îi lăsați să se deschidă până la sută la sută.

Fișierul sitemap.xml afectează promovarea site-ului web

Dacă nu aveți o hartă a site-ului, aceasta nu înseamnă că motoarele de căutare nu vor indexa resursa. Roboții de căutare fac adesea o treabă bună în accesarea cu crawlere a site-urilor și incluzându-le în căutare. Dar uneori pot apărea eșecuri, din cauza cărora uneori nu este posibil să găsiți toate documentele web. Principalele motive sunt:

  1. Secțiuni ale site-ului la care se poate ajunge doar făcând un lanț lung de tranziții;
  2. Adrese URL dinamice.

Crearea unui sitemap.xml ajută la rezolvarea acestei probleme.

Sitemap.xml afectează SEO indirect: face mai ușor și mai rapid indexarea paginilor.

Harta site-ului în format HTML

Sitemap-urile sunt împărțite în 2 tipuri sau formate principale: sitemap htmlși fișier xml sitemap. Harta site-ului HTML este o pagină a site-ului, care listează linkurile. De obicei acestea sunt link-uri către cele mai importante secțiuni și pagini ale site-ului. Harta site-ului HTML este mai mult pentru oameni mai degrabă decât roboți și ajută la navigarea rapidă în secțiunile principale ale site-ului. Pentru un sitemap sub forma unei pagini html, există restricții serioase privind numărul de link-uri pe o pagină. Dacă există prea multe link-uri pe pagină, nu toate link-urile pot fi indexate, sau pagina sitemap poate fi complet exclusă din căutarea unui număr excesiv de link-uri, chiar și link-uri interne.

Pentru ca sitemap-ul html să fie corect indexat și perceput adecvat de către vizitatori, nu trebuie să plasați mai mult de 100 de link-uri pe pagină. Este mai mult decât suficient pentru a plasa pe pagină toate secțiunile și subsecțiunile care nu se încadrau în meniul principal.

Obișnuit, Fișier HTML sitemap are o structură arborescentă, unde sunt indicate secțiunile și subsecțiunile extinse. Sunt adesea concepute sitemap-uri HTML inutil de greoaie elemente grafice, stiluri CSS și completate de Java-script. Totuși, harta site-ului html este de mică valoare pentru motoarele de căutare.

Un sitemap HTML nu este un sitemap complet. Dacă site-ul are sute, mii, zeci de mii de pagini? Pentru a face acest lucru, trebuie să plasați link-uri către toate paginile din harta site-ului în format xml.

Sitemap sitemap.txt

O altă modalitate de a proiecta un sitemap ca fișier poate fi un sitemap în format txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Totul este simplu. Fișierul sitemap.txt listează toate linkurile necesare rând cu linie. Harta site-ului în format txt este o „opțiune leneșă”. Aici funcționează o limită similară de 50.000 de link-uri xml pentru sitemap. Cu toate acestea, harta site-ului TXT nu are capacitatea de a indica data ultimei modificări și prioritatea paginii.

Sitemap XML Sitemap

Un sitemap XML este un fișier xml de forma sitemap.xml, care este de obicei situat la rădăcina site-ului. Un sitemap xml are multe avantaje față de un sitemap html:

  • Sitemap xml este un format special de sitemap, care este determinat de toate motoarele de căutare populare, cum ar fi Google și Yandex.
  • Puteți specifica până la 50.000 de link-uri în xml sitemap.
  • În xml sitemap-ului, puteți specifica prioritatea relativă și frecvența actualizărilor paginii.

Conținutul hărții site-ului este doar o recomandare pentru robotul de căutare. De exemplu, dacă setați pagina site-ului la o frecvență anuală de actualizare, roboții de căutare vor merge în continuare mai des. Și dacă setați rata de reîmprospătare a paginii la oră, aceasta nu înseamnă că roboții vor indexa pagina în fiecare oră.

Cum să creați sitemap.xml corect

Luați în considerare cum să faceți xml-map corect. Aici trebuie îndeplinite următoarele cerințe:

  1. Dimensiunea fișierului nu trebuie să depășească 10 MB;
  2. Harta nu trebuie să conțină mai mult de 50.000 de link-uri. În cazurile în care există mai multe legături, puteți crea mai multe hărți și le puteți include în harta xml principală;
  3. Adresa sitemap-ului trebuie scrisă în robots.txt;
  4. De asemenea, încărcați harta site-ului în Yandex și Google (cum se adaugă un fișier este descris mai jos);
  5. Motoarele de căutare trebuie să aibă acces la hartă. Este necesar să se folosească etichete speciale care să informeze motoarele de căutare că aceasta este o hartă, și nu altceva;
  6. Harta site-ului trebuie să fie codificată UTF-8.

Conținutul fișierului sitemap.xml arată astfel:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

În cazul în care sunt utilizate următoarele etichete obligatorii:

  • - eticheta părinte, conține toate adresele URL;
  • - o etichetă care conține informații despre o anumită adresă URL;
  • https://bazava.ru/ro/- în această etichetă, url-ul este indicat direct.
  • - acest tag contine data ultimei modificari a paginii;
  • - eticheta este folosită pentru a indica cât de des se schimbă pagina: întotdeauna, oră, zilnic, săptămânal, lunar, anual, niciodată;
  • Indică prioritatea unei anumite pagini, în raport cu alte pagini de pe site, de la 0,1 - prioritate scăzută, la 1 - prioritate mare.

Changefreq indică cât de des se schimbă pagina:

  1. Hourly - actualizare orară;
  2. Always - mereu actualizat;
  3. Săptămânal - actualizat o dată pe săptămână;
  4. Zilnic - actualizările au loc zilnic;
  5. Lunar - actualizările au loc o dată pe lună;
  6. Anual - o dată pe an;
  7. Niciodată - nu se actualizează (este mai bine să nu folosiți o astfel de valoare).

Prioritatea le spune motoarelor de căutare cât de importantă este o pagină în comparație cu altele. Prioritatea poate fi setată de la 0,1 (scăzută) la 1 (mare).

Fișierul sitemap.xml trebuie să conțină o indicație a spațiului de nume în limbajul XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Dacă fișierul sitemap conține mai mult de 50 de mii de link-uri sau dimensiunea sitemap.xml depășește 10 mb, se recomandă împărțirea sitemap-ului în mai multe fișiere. În acest caz, în harta site-ului, trebuie să specificați mai multe link-uri către diferite fișiere de hartă.

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

Aici sunt folosite etichetele deja familiare. și , precum și etichetele necesare:

  • - eticheta părinte, care conține adresele tuturor sitemap-urilor;
  • - o etichetă care conține parametrii pentru fiecare sitemap.

Cum se creează Sitemap.xml

Creați o hartă a site-ului un proces important în care este necesar să se indice clar ce pagini ale site-ului ar trebui să fie indexate și cum să le indexeze cel mai bine. În funcție de ce tip de hartă a site-ului vorbim, diferită cum se creează un sitemap. Nu are rost să discutăm despre cum să creați un sitemap html separat. Luați în considerare cum să faceți o hartă în format de fișier xml. Există mai multe modalități de bază de a crea un sitemap, dar toate au în comun locul în care se află harta site-ului și modul în care acesta este determinat de motoarele de căutare.

După cum a fost deja scris mai sus - fișierul sitemap este plasat în rădăcina site-ului. Motoarele de căutare sunt capabile să găsească fișierul sitemap pe cont propriu. Dar există mai multe modalități de a conecta direct la fișierul (fișierele) sitemap pentru o descoperire mai rapidă de către motoarele de căutare. Cel mai simplu mod de a specifica locația fișierului sitemap este să specificați direct un link sau mai multe link-uri către fișiere sitemap în instrumentele Yandex și Google pentru webmaster. Acolo poți verifica harta site-ului, conduce analiza hărții site-ului pentru corectitudine, potrivind ce pagini din harta site-ului sunt găsite de motorul de căutare și câte dintre ele sunt indexate.

A doua modalitate de a spune motoarele de căutare locația fișierului sitemap este cu directiva Sitemap din fișierul robots.txt.

Harta site-ului: http://site.ru/sitemap.xml

Puteți specifica mai multe fișiere sitemap în robots.txt, după care acestea vor fi adăugate automat la instrumentele pentru webmasteri. Ne-am uitat la cum să găsim un sitemap, acum să trecem la cum să creăm un sitemap.

Modalități de bază de a crea un sitemap

  1. Generare sitemap sistem de management al site-ului, dacă CMS-ul are o capacitate încorporată similară.
  2. Descărcați harta site-ului din afara serviciu online. Există multe generatoare de hărți de site online cu capacități și limitări diferite. Probabil una dintre cele mai faimoase generatoare online Sitemaps este Sitemap Generator . Are o funcționalitate destul de mare și vă va permite să generați gratuit un sitemap pentru 1500 de pagini, ceea ce este destul de mult. Există și xml-sitemaps.com, care are capacitatea de a configura parametrii sitemap-ului, dar are o limită de 500 de link-uri în fișierul sitemap.xml.
  3. Descărcați Sitemap Generator. Astfel de programe generatoare sunt de obicei plătite, dar cu ajutorul lor puteți genera în mod regulat un sitemap xml pentru unul sau mai multe site-uri. Iată câteva exemple de astfel de programe generatoare: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generator.
  4. Creare automată sitemap sitemapîn Joomla (Jumla), WordPress (Wordpress), Bitrix (Bitrix), ModX.
  5. Crearea manuală a unui Sitemap.

Sitemap WordPress

Puteți crea un sitemap pentru WordPress utilizând pluginul Google XML Sitemaps. Pentru aceasta, puteți face o mulțime de setări care vă vor permite să excludeți unele dintre materialele de pe site-ul dvs. și puteți, de asemenea, să setați rata de reîmprospătare așteptată. Pe lângă crearea unei hărți, pluginul Google XML Sitemaps, atunci când publică conținut nou pe blogul tău, anunță multe motoare de căutare despre acest lucru, invitându-i să indexeze rapid.

Puteți seta singur calea către fișierul sitemap în setările pluginului și chiar îi puteți da un nume diferit de sitemap.xml clasic.

[yt=5ZmRSR1bbEI]

Harta site-ului Joomla

Puteți crea un sitemap pentru Joomla folosind componenta Xmap.

Verificați Sitemap-ul pentru link-uri întrerupte

Pentru a nu înșela robotul de căutare, sitemap.xml trebuie configurat fără erori. Prin urmare, după fiecare actualizare a fișierului, trebuie să verificați harta site-ului pentru link-uri întrerupte.

Accesați Yandex Webmaster - secțiunea „Instrumente” - „Analiza fișierelor sitemap”.

Alegeți una dintre metodele de încărcare a fișierelor:

  • copiați textul sitmepa.xml;
  • trimiteți adresa URL a sitemapului;
  • încărcați fișierul xml în service.

Se verifică sitemap.xml în Yandex Webmaster

Analiză Sitemap.xml de către PixelPlus

Dacă sunt găsite erori (acest lucru se întâmplă des), serviciul vă va spune care adrese URL oferă un răspuns incorect (șters, redundant și așa mai departe).

Sitemap.xml este un instrument important

Harta site-ului este unul dintre cele mai importante instrumente SEO pentru promovarea site-ului web. Nu contează cum este creată harta site-ului. Ceea ce contează este ce link-uri vor fi listate în harta site-ului și cât de des vor fi actualizate. Uneori, totul este încărcat pe harta site-ului și chiar și acele linkuri care sunt interzise în robots.txt sau link-uri non-canonice. Harta site-ului este actualizată o dată pe lună sau mai puțin. O astfel de atitudine față de harta site-ului nu numai că o poate face inutilă, ci și mai rău - încurcă robotul de căutare, ceea ce va afecta negativ indexarea și pozițiile site-ului în căutare.

Creați o hartă a site-ului pentru resursa dvs. Dar fiți atenți și gândiți-vă bine ce să încărcați pe sitemap și ce nu.

Cum să adăugați un Sitemap XML la motoarele de căutare sistemele Googleși Yandex? De fapt, adăugarea unui Sitemap la Google Webmaster și Yandex Webmaster este elementară. În acest caz, de exemplu, Yandex determină automat harta site-ului dacă este specificată în fișierul Robots.txt.

În acest ghid, vom analiza exemple de adăugare a unui sitemap la Google Webmaster și Yandex Webmaster. Să vorbim despre metode de verificare și analiză a unui Sitemap, și anume prin Consola Google și datorită instrumentelor din Yandex Webmaster. Să atingem un punct atât de important, cum ar fi re-ocolirea paginilor Mapsite.

Continutul articolului:

Cum să adăugați un Sitemap XML la Yandex

După cum am menționat mai sus, în mod implicit agentul de căutare sisteme Yandex definiți harta specificată de Robots. După un timp, poate fi găsit în Yandex Webmaster. Dar cel mai bine este să-l adăugați suplimentar, poate ajuta dacă Robots este brusc indisponibil. Adăugarea Mapsite-ului vă va permite să accelerați în mod semnificativ accesarea cu crawlere a conținutului proiectului de către botul lui Yasha.

Adăugarea unui Sitemap XML în Yandex Webmaster:

  1. Conectați-vă la Yandex Webmaster.
  2. În fereastra care se deschide, veți vedea o linie goală în titlul ferestrei, deasupra căreia scrie „Add Sitemap”. Introduceți adresa URL a sitemapului dvs. în acest câmp.
  3. Apoi faceți clic pe „Adăugați”.

La finalizarea tuturor acțiunilor, botul motorului de căutare va analiza această adresă. Apoi, după un anumit timp, va fi afișat exact pe pagina în care l-ați adăugat. De asemenea, vor fi disponibile: starea sitemap-ului, data accesării cu crawlere și numărul total de link-uri din harta site-ului. Secțiunea vă va permite să analizați corect indexarea conținutului încărcat al proiectului dumneavoastră.

Cum să adăugați un Sitemap XML la Google

Nici adăugarea unei hărți în Consola Google nu vă va lua prea mult timp. Singura diferență față de Yasha, Gena nu afișează XMLMAP-urile specificate în Robots.txt. Dar are o listă destul de mare de instrumente pentru a lucra cu el.

Adăugați Sitemap XML în Search Console:

  1. Conectați-vă la Search Console.
  2. Accesați secțiunea „Scanare”.
  3. Accesați fila „Hărți site”.
  4. În fereastra care se deschide, în colțul din dreapta sus al ferestrei, veți vedea un buton roșu „adăugați/verificați fișierul sitemap”.
  5. Faceți clic pe acest buton, apoi adăugați adresa URL a hărții în câmp.
  6. Faceți clic pe „Trimite”.

Apoi ar trebui să așteptați puțin, astfel încât robotul de căutare Google să poată ocoli această adresă URL. Harta va fi afișată pe pagina în care ați adăugat-o. Făcând clic pe el, puteți vedea toate stările disponibile:

  1. Tipul de hartă site.
  2. Data procesării este ultima accesare cu crawlere de către bot.
  3. Probleme - posibile greșeli.
  4. Articolele nu sunt indexate, ci încărcate.
  5. Indexat - acele elemente care au fost ocolite de agentul de căutare Google.
  6. Diagrama principală este fișierele trimise și indexate.
  7. Erori sitemap.
  8. Erori în index.

Adăugarea unui sitemap la fișierul Robots.txt

În ultimul articol, a fost descris în detaliu un exemplu de specificare a adresei URL a hărții în Robots.txt. Poate fi găsit mai jos în recomandările pe această temă. Cred că cei care au creat deja roboți nu au nevoie de un exemplu și pot sări peste această parte a articolului.

Adăugarea URL a hărții la Robots.txt:

  1. Deschideți Robots.txt cu un editor de text.
  2. Coborâți în josul documentului.
  3. Adăugați în linia goală „Sitemap: http://site.ru/sitemap.xml” (fără ghilimele).
  4. Salvați documentul.
  5. Încărcați-l pe un server sau pe un client FTP de găzduire în directorul rădăcină al domeniului principal.

Verificarea sitemapului în Google Search Console

Este foarte ușor să verificați harta încărcată în Search Console. Este suficient să urmați pași simpli:

  1. Accesați fila „Hărți site”.
  2. În colțul din dreapta sus al ferestrei, faceți clic pe „Test”.
  3. Apoi, Google vă solicită să reîmprospătați pagina.
  4. Apoi veți vedea rezultatul testului.

Analiza sitemapului — Instrumente Yandex pentru webmasteri

Sunt puține în Yandex Webmaster mai multe moduri testați harta site-ului. Urmăm următorii pași:

  1. Mergem la secțiunea „Instrumente”.
  2. Accesați fila „Analiza sitemapului”.
  3. Veți avea acces la o pagină cu un câmp mare și următoarele metode: text, url, fișier. Cel mai simplu mod este să specificați o adresă URL.
  4. Scriem URL-ul în câmp.
  5. Faceți clic pe butonul „Verifică”.
  6. Ne uităm la rezultatul analizei.

Rebypass Sitemap în Google Webmaster și Yandex Webmaster

Acum să ne uităm la modalități de a-l actualiza. În unele cazuri, aceasta este o caracteristică destul de utilă, mai ales cu schimbări globale în conținutul proiectului. Actualizarea hărții site-ului indică roboților de căutare să reindexeze întregul conținut. Datorită acestei funcții, puteți actualiza majoritatea informațiilor modificate, în special pentru motoarele de căutare.

Ocoliți harta în Yandex Webmaster:

  1. Deschideți secțiunea „Indexare”.
  2. Accesați fila „Hărți site”.
  3. Veți vedea inscripția „Sursă” - faceți clic lângă cercuri sub formă de săgeți „trimite la rebypass”.


Ocoliți harta în Search Console:

  1. Deschideți secțiunea „Scanare”.
  2. Accesați fila „Hărți site”.
  3. Bifați caseta de lângă adresa URL a hărții dvs.
  4. Apoi, faceți clic pe butonul de deasupra „Trimite din nou”.
  5. Acceptați și reîmprospătați pagina.

Concluzie

V-am spus în detaliu despre toate complexitățile adăugării, analizei și re-ocolirii unui sitemap. Astfel, puteți accelera semnificativ indexarea proiectului de către motoarele de căutare. În unele cazuri, reduceți timpul necesar roboților pentru a accesa din nou cu crawlere conținutul solicitând o accesare forțată.

Pe lângă orice altceva, merită remarcat un punct. Fiți atenți și asigurați-vă că verificați starea hărții site-ului dvs. Aceasta este o necesitate pentru a răspunde rapid eventualelor erori. Astfel, puteți remedia rapid problemele apărute și puteți actualiza harta site-ului.

Sunt sigur că acest articol informativ va fi un ghid bun pentru webmasterii începători și proprietarii încrezători de proiecte pe Internet. Vă doresc succes în demersurile dumneavoastră și o bună optimizare tehnică a proiectelor dumneavoastră.

  • Citiți articole pe această temă: