Ce este indexarea paginilor. O modalitate rapidă de a verifica indexarea paginilor în Yandex și Google. Ceea ce determină viteza de indexare

Indexarea site-ului este cel mai important, necesar și primar detaliu în implementarea optimizării acestuia. La urma urmei, tocmai datorită prezenței unui index motoarele de căutare pot răspunde la toate solicitările utilizatorilor extrem de rapid și precis.

Ce este indexarea site-urilor?

Indexarea site-ului este procesul de adăugare a informațiilor despre conținutul (conținutul) site-ului în baza de date a motoarelor de căutare. Este indexul care este baza de date a motoarelor de căutare. Pentru ca site-ul să fie indexat și să apară în rezultatele căutării, trebuie să îl viziteze un bot special de căutare. Întreaga resursă, pagină cu pagină, este examinată de bot după un anumit algoritm. Ca urmare, găsirea și indexarea link-urilor, imaginilor, articolelor etc. În același timp, în rezultatele căutării, acele site-uri vor fi mai sus în listă, a căror autoritate este mai mare în comparație cu restul.

Există 2 opțiuni pentru indexarea site-ului PS:

  • Autodeterminarea de către robotul de căutare a paginilor proaspete sau a unei resurse create - această metodă este bună dacă există link-uri active de la alte site-uri deja indexate către ale dvs. În caz contrar, puteți aștepta robotul de căutare pe termen nelimitat;
  • Introducerea manuală a adresei URL a site-ului în formularul motorului de căutare destinată acestui lucru - această opțiune permite noului site să „stea în coadă” pentru indexare, ceea ce va dura destul de mult. Metoda este simplă, gratuită și necesită introducerea adresei doar a paginii principale a resursei. Această procedură poate fi efectuată prin intermediul panoului de webmasteri Yandex și Google.

Cum să pregătiți un site pentru indexare?

Trebuie remarcat imediat că este foarte nedorit să amenajați un site în stadiul de dezvoltare. Motoarele de căutare pot indexa pagini incomplete cu informații incorecte, greșeli de ortografie etc. Ca urmare, acest lucru va afecta negativ clasarea site-ului și emiterea de informații din această resursă în căutare.

Acum să enumerăm punctele care nu ar trebui uitate în etapa de pregătire a unei resurse pentru indexare:

  • restricțiile de indexare se aplică fișierelor flash, deci este mai bine să creați un site folosind HTML;
  • un tip de date precum Java Script nu este nici indexat de roboții de căutare, în acest sens, navigarea pe site ar trebui să fie duplicată cu link-uri text, iar toate informațiile importante care ar trebui indexate nu sunt scrise în Java Script;
  • trebuie să eliminați toate linkurile interne rupte, astfel încât fiecare link să conducă la o pagină reală a resursei dvs.;
  • structura site-ului ar trebui să vă permită să navigați cu ușurință de la paginile de jos la pagina principală și înapoi;
  • este mai bine să mutați informațiile inutile și secundare și blocurile în partea de jos a paginii și, de asemenea, să le ascundeți de roboții cu etichete speciale.

Cât de des are loc indexarea?

Indexarea site-ului, în funcție de o serie de motive, poate dura de la câteva ore la câteva săptămâni, până la o lună întreagă. Actualizarea indexării sau up-urile motorului de căutare apar la intervale diferite. Conform statisticilor, în medie, Yandex indexează pagini și site-uri noi pentru o perioadă de la 1 până la 4 săptămâni, iar Google gestionează o perioadă de până la 7 zile.

Dar cu pregătirea preliminară adecvată a resursei create, acești termeni pot fi redusi la minimum. La urma urmei, de fapt, toți algoritmii de indexare PS și logica muncii lor se rezumă la a oferi cel mai precis și mai actualizat răspuns la cererea unui utilizator. În consecință, cu cât conținutul de calitate apare mai regulat pe resursa dvs., cu atât va fi indexat mai repede.

Metode de accelerare a indexării

Mai întâi trebuie să „notificați” motoarele de căutare că ați creat o nouă resursă, așa cum este menționat în paragraful de mai sus. De asemenea, mulți oameni recomandă adăugarea unui nou site la sistemele de marcare sociale, dar eu nu fac asta. Acest lucru a făcut cu adevărat posibilă accelerarea indexării cu câțiva ani în urmă, deoarece roboții de căutare „vizitează” adesea astfel de resurse, dar, în opinia mea, acum este mai bine să puneți un link de la o rețea socială populară. În curând, vor observa un link către resursa dvs. și o vor indexa. Un efect similar poate fi obținut cu link-uri directe către un site nou din resurse deja indexate.

După ce mai multe pagini au fost deja indexate și site-ul a început să se dezvolte, puteți încerca să „alimentați” botul de căutare pentru a accelera indexarea. Pentru a face acest lucru, trebuie să publicați periodic conținut nou la intervale de timp aproximativ egale (de exemplu, în fiecare zi, 1-2 articole). Desigur, conținutul trebuie să fie unic, de înaltă calitate, competent și să nu fie suprasaturat cu fraze cheie. De asemenea, recomand crearea unui sitemap XML, care va fi discutat mai jos, și adăugarea acestuia în panoul webmaster al ambelor motoare de căutare.

fișiere robots.txt și sitemap

Fișierul text robots txt include instrucțiuni pentru roboții motoarelor de căutare. În același timp, face posibilă interzicerea indexării paginilor selectate ale site-ului pentru un anumit motor de căutare. Dacă o faci manual, este important ca numele acestui fișier să fie scris doar cu majuscule și să fie situat în directorul rădăcină al site-ului, majoritatea CMS-urilor îl generează singuri sau folosind plugin-uri.

Harta site-ului sau harta site-ului este o pagină care conține un model complet al structurii site-ului pentru a ajuta „utilizatorii pierduți”. În acest caz, puteți trece de la o pagină la alta fără a utiliza navigarea pe site. Este recomandabil să creați o astfel de hartă în format XML pentru motoarele de căutare și să o includeți în fișierul robots.txt pentru a îmbunătăți indexarea.

Puteți obține informații mai detaliate despre aceste fișiere în secțiunile relevante făcând clic pe linkuri.

Cum să împiedici indexarea unui site?

Puteți gestiona, inclusiv interzicerea indexării unui site sau a unei pagini separate, folosind fișierul robots.txt deja menționat mai sus. Pentru a face acest lucru, creați un document text cu același nume pe computer, plasați-l în folderul rădăcină al site-ului și scrieți în fișierul din care motor de căutare doriți să ascundeți site-ul. În plus, puteți ascunde conținutul site-ului de roboții Google sau Yandex folosind semnul *. Această instrucțiune din robots.txt va interzice indexarea de către toate motoarele de căutare.

Agent utilizator: * Nu permite: /

Pentru site-urile WordPress, puteți dezactiva indexarea site-ului prin panoul de control. Pentru a face acest lucru, în setările de vizibilitate a site-ului, bifați caseta „Recomandă motoarele de căutare să nu indexeze site-ul”. În același timp, Yandex, cel mai probabil, vă va asculta dorințele, dar cu Google nu este necesar, dar pot apărea unele probleme.

Bună prieteni! Foarte des îmi pui următoarele întrebări: - „de ce site-ul meu indexează mult timp”, „cât de des indexează site-urile Yandex”, „mi poate fi furat conținutul înainte de indexare și să mă acuze de furt”, cum să accelerez indexarea unui site de către Yandex” și așa mai departe. Am trimis peste 50 de răspunsuri pe e-mail tuturor celor interesați și am decis să-mi simplific munca și să răspund la întrebările de mai sus în acest articol, ca să zic așa, omorâți două păsări dintr-o singură piatră))) Deci, să începem vânătoarea!

Să aruncăm mai întâi o privire la două concepte, indexare și actualizare. Voi încerca să scriu pe scurt ce sunt și cu ce mănâncă.

Indexarea site-ului- aceasta este procesarea site-ului, adică programe care scanează site-ul și umple bazele de date ale motoarelor de căutare cu rezultate pentru interogări de căutare. Dacă indexarea se face corect, atunci utilizatorul va găsi cu ușurință paginile dorite ale site-ului. În caz contrar, resursa web nu va fi afișată în motoarele de căutare, cu alte cuvinte, utilizatorii nu o vor vedea și nu vor achiziționa produsul, nu vor folosi serviciul și așa mai departe.

Termenul " Actualizați " vine din cuvântul englezesc - update, care înseamnă - update. Printre specialiștii implicați, este adesea folosit și înseamnă literal „actualizare de date”. Varietăți ale unei astfel de actualizări vor fi finalizarea părții de interfață a site-ului sau introducerea de modificări pe o anumită pagină. Printre specialiști, este folosită și o formă prescurtată a cuvântului „ap”.

Apariția unor rezultate noi de căutare, după o interogare pentru aceeași expresie cheie într-un motor de căutare, de exemplu, Google sau Yandex - aceasta este ceea ce este o „actualizare” în legătură. Motoarele de căutare au , în care toate paginile sunt aranjate în ordine. Actualizarea duce la o modificare a pozițiilor înregistrărilor existente ale resurselor web sau la adăugarea unora noi ca răspuns la solicitările utilizatorilor. Procesul asociat cu actualizarea duce la actualizarea cache-ului motorului de căutare și la indexarea site-urilor din baza sa de date.

Puteți citi mai multe despre aceste două concepte pe paginile site-ului meu, aici sunt link-uri către ce este și ce este.

Ei bine, cred că ne-am dat seama, acum să trecem la întrebările tale.

De ce site-ul meu indexează de mult timp?

Totul depinde de robotul de căutare. El este cel care vizitează site-urile conform unui anumit program, cunoscut doar de Yandex, și scanează milioane de proiecte WEB pentru actualizări. De exemplu, dacă adăugați sau modificați conținut (articole, fotografii, videoclipuri, carduri de produse) pe site-ul dvs. o dată pe lună, atunci robotul va înțelege acest lucru mai devreme sau mai târziu și vă va vizita resursa doar o dată pe lună. Prin urmare, perioada de indexare a site-ului va fi aceeași.

Cu cât adăugați mai des conținut, cu atât robotul va veni mai des pe site-ul dvs. Pe resursele de știri precum Fontanka.ru sau RBK, roboții pur și simplu „trăiesc” și nu pleacă de acolo. Știrile de pe astfel de site-uri sunt actualizate și adăugate zeci sau chiar sute pe zi, iar robotii de căutare le scanează și le indexează aproape instantaneu.

Poate fi furat conținutul înainte ca site-ul să fie indexat?

Da, ei pot! Și exact așa se face. Deși site-ul este tânăr și abia își începe călătoria, este indexat o dată pe lună, sau chiar două. Tot conținutul care este publicat pe un astfel de site poate fi furat, atât manual, cât și automat (ceea ce se întâmplă mai des), lucrând în site-uri auto-umplute. Majoritatea studenților mei sunt foarte surprinși când le analizez site-ul și găsesc conținut neunic.

Ultimul meu student a publicat 15 articole pe site-ul său tânăr deodată, iar o lună mai târziu a fost foarte surprins că Yandex l-a acuzat de copy-paste și a pus un filtru pe site. Nu a funcționat pentru a-i dovedi lui Yandex (Platon Shchukin) că nu era un hoț, ci, dimpotrivă, i-au fost furate articole. Acum este foarte problematic să faceți acest lucru și, în plus, pentru a scoate site-ul de sub filtru, va trebui să ștergeți toate aceste articole și să scrieți altele noi. Rezultatul ignoranței și al acțiunilor greșite este pierderea de bani, pierderea conținutului și căderea sub filtru.

Puteți citi cum să vă protejați conținutul de furt sau vizionați videoclipul meu dacă vă este prea lene să-l citiți))) Nu voi scrie despre el în detaliu aici.

Cum să protejați conținutul de furt

Acum să vorbim despre cum să accelerăm procesul de indexare.

Cum să accelerezi procesul de indexare

Pentru ca indexarea site-ului dvs. și a conținutului nou adăugat să fie mai rapidă, trebuie să „cereți” botului Yandex să vă viziteze site-ul. O fac simplu și în mai multe feluri.

Prima modalitate de a accelera indexarea site-ului

Atrag un robot pe site-ul meu, distribuind postări ale articolelor publicate prin rețelele sociale. Fac asta cu ajutorul unui bloc de butoane ale rețelelor sociale. Imediat ce o postare este publicată, aceasta este văzută de roboți, deoarece trăiesc permanent în rețelele de socializare și nu pleacă de acolo, precum și din fluxurile de știri.

Publicarea articolelor pe rețelele sociale transmite semnale sociale către site și, pe lângă accelerarea indexării, are un efect benefic asupra promovării site-ului în Google și Yandex. Permiteți-mi să vă reamintesc că înainte de a partaja texte, asigurați-vă că anunțați Yandex că acestea sunt ale dvs. (vezi videoclipul de mai sus).

A doua modalitate de a accelera indexarea site-ului

Aici informăm Yandex-Bot că pe site-ul nostru a apărut conținut nou, prin Yandex Webmaster, a cărui secțiune se numește Adurilka în oamenii de rând.

Mergem la Yandex Webmaster, ne înregistrăm, adăugăm site-ul nostru și mergem la fila de indexare - pagini de accesare cu crawlere. Apoi copiem adresa URL a paginii pe care doriți să o indexați rapid și o adăugam la coloană, ca în imaginea de mai jos, și facem clic pe butonul de trimitere.

După aceea, așteptăm bypass-ul robotului. Adăugarea de noi adrese URL la Aduril accelerează semnificativ procesul de indexare și, atunci când lucrați împreună cu serviciul, eliminați complet furtul conținutului dvs. Totul este de fapt foarte simplu, dacă știi toate acestea.

De asemenea, este ușor să promovați site-uri în Yandex. O poți face singur și absolut gratuit, dar din nou, ai nevoie de cunoștințe. Dacă doriți, vă pot învăța și acest lucru (informații de mai jos).

Training pentru promovarea site-ului web

Atât pentru azi, succes tuturor și ne vedem curând!

Ce este indexarea site-urilor? Cum se întâmplă? Puteți găsi răspunsuri la aceste și alte întrebări în articol. în motoarele de căutare) este procesul de adăugare a informațiilor despre site în baza de date de către un robot motor de căutare, care este ulterior folosit pentru a căuta informații despre proiecte web care au trecut printr-o astfel de procedură.

Datele despre resursele web constau cel mai adesea în cuvinte cheie, articole, linkuri, documente. Audio, imaginile și așa mai departe pot fi, de asemenea, indexate. Se știe că algoritmul de identificare a cuvintelor cheie depinde de motorul de căutare.

Există anumite limitări asupra tipurilor de informații indexate (fișiere flash, javascript).

Managementul incluziunii

Indexarea site-ului este un proces complex. Pentru a-l gestiona (de exemplu, pentru a interzice atașarea unei anumite pagini), trebuie să utilizați fișierul robots.txt și instrucțiuni precum Permite, Interzice, Întârziere cu crawlere, Agent utilizator și altele.

Etichetele sunt, de asemenea, folosite pentru indexare. și recuzită , ascunzând conținutul resursei de roboții Google și Yandex (Yahoo folosește eticheta ).

În motorul de căutare Goglle, site-urile noi sunt indexate de la câteva zile la o săptămână, iar în Yandex - de la una la patru săptămâni.

Doriți ca site-ul dvs. să apară în interogările privind rezultatele motorului de căutare? Apoi trebuie procesat de Rambler, Yandex, Google, Yahoo și așa mai departe. Trebuie să informați motoarele de căutare (păianjeni, sisteme) despre existența site-ului dvs. web, iar apoi îl vor accesa cu crawlere în întregime sau parțial.

Multe site-uri nu sunt indexate de ani de zile. Informațiile care se află pe ele nu sunt văzute de nimeni, cu excepția proprietarilor lor.

Metode de prelucrare

Indexarea site-ului se poate face în mai multe moduri:

  1. Prima opțiune este adăugarea manuală. Trebuie să introduceți datele site-ului dvs. prin intermediul formularelor speciale oferite de motoarele de căutare.
  2. În al doilea caz, robotul motorului de căutare însuși găsește site-ul dvs. web prin link-uri și îl indexează. El vă poate găsi site-ul prin link-uri din alte resurse care duc la proiectul dumneavoastră. Această metodă este cea mai eficientă. Dacă un motor de căutare găsește un site în acest fel, îl consideră semnificativ.

Sincronizare

Indexarea site-ului nu este foarte rapidă. Termenele variază, de la 1-2 săptămâni. Link-urile din resurse autorizate (cu PR și Titz excelente) accelerează semnificativ plasarea site-ului în baza de date a motorului de căutare. Astăzi, Google este considerat cel mai lent, deși până în 2012 ar putea face această treabă într-o săptămână. Din păcate, lucrurile se schimbă foarte repede. Se știe că Mail.ru lucrează cu site-uri web în acest domeniu de aproximativ șase luni.

Nu orice specialist este capabil să indexeze un site în motoarele de căutare. Momentul de adăugare a unor noi pagini în baza de date a unui site deja procesat de motoarele de căutare este afectat de frecvența actualizării conținutului acestuia. Dacă pe o resursă apar în mod constant informații proaspete, sistemul le consideră actualizate frecvent și utile oamenilor. În acest caz, munca ei este accelerată.

Puteți monitoriza progresul indexării unui site web pe secțiuni speciale pentru webmasteri sau pe motoarele de căutare.

Schimbări

Deci, ne-am dat deja seama cum este indexat site-ul. Trebuie remarcat faptul că bazele de date ale motoarelor de căutare sunt actualizate frecvent. Prin urmare, numărul de pagini din proiectul dvs. adăugate acestora se poate modifica (atât să scadă, cât și să crească) din următoarele motive:

  • sancțiuni pentru motoarele de căutare împotriva site-ului;
  • prezența erorilor pe site;
  • modificarea algoritmilor motoarelor de căutare;
  • hosting dezgustător (inaccesibilitatea serverului pe care se află proiectul) și așa mai departe.

Yandex răspunde la întrebări frecvente

Yandex este un motor de căutare folosit de mulți utilizatori. Ocupă locul cinci printre sistemele de căutare din lume în ceea ce privește numărul de solicitări de cercetare procesate. Dacă ați adăugat un site la acesta, este posibil să dureze prea mult pentru a adăuga la baza de date.

Adăugarea unei adrese URL nu garantează indexarea acesteia. Aceasta este doar una dintre metodele folosite pentru a informa robotul despre sistem că a apărut o nouă resursă. Dacă nu există link-uri către site de pe alte site-uri web sau sunt puține dintre ele, adăugarea acestora va ajuta să îl găsiți mai rapid.

Dacă indexarea nu a avut loc, trebuie să verificați dacă au existat erori pe server în momentul în care a fost creată cererea pentru aceasta de la robotul Yandex. Dacă serverul raportează o eroare, robotul își va încheia activitatea și va încerca să o finalizeze într-o ordine dus-întors. Angajații Yandex nu pot crește viteza de adăugare a paginilor în baza de date a motorului de căutare.

Indexarea unui site în Yandex este o sarcină destul de dificilă. Nu știți cum să adăugați o resursă la un motor de căutare? Dacă există link-uri către acesta de pe alte site-uri web, atunci nu trebuie să adăugați un site special - robotul îl va găsi automat și îl va indexa. Dacă nu aveți astfel de legături, puteți utiliza formularul „Adăugați URL” pentru a spune motorului de căutare că site-ul web există.

Rețineți că adăugarea unei adrese URL nu garantează indexarea creației dvs. (sau viteza acesteia).

Mulți sunt interesați de cât timp durează indexarea unui site în Yandex. Angajații acestei companii nu oferă garanții și nu prevăd termeni. De regulă, de când robotul a aflat despre site, paginile sale în căutare apar în două zile, uneori în câteva săptămâni.

proces de prelucrare

Yandex este un motor de căutare care necesită acuratețe și atenție. Indexarea site-ului constă din trei părți:

  1. Robotul de căutare accesează cu crawlere paginile de resurse.
  2. Conținutul (conținutul) site-ului este înregistrat în baza de date (index) a sistemului de căutare.
  3. După 2-4 săptămâni, după actualizarea bazei de date, puteți vedea rezultatele. Site-ul dvs. va apărea (sau nu va apărea) în rezultatele căutării.

Verificare de indexare

Cum se verifică indexarea site-ului? Puteți face acest lucru în trei moduri:

  1. Introduceți numele companiei dvs. în bara de căutare (de exemplu, „Yandex”) și verificați fiecare link din prima și a doua pagină. Dacă găsiți acolo adresa URL a creației dvs., atunci robotul și-a finalizat sarcina.
  2. Puteți introduce adresa URL a site-ului dvs. în bara de căutare. Veți putea vedea câte foi de internet sunt afișate, adică indexate.
  3. Înregistrați-vă pe paginile webmasterilor din Mail.ru, Google, Yandex. După ce treceți de verificarea site-ului, veți putea vedea rezultatele indexării și alte servicii ale motoarelor de căutare create pentru a îmbunătăți performanța resursei dvs.

De ce refuză Yandex?

Indexarea unui site în Google se realizează astfel: robotul introduce toate paginile site-ului, de calitate scăzută și de înaltă calitate, în baza de date, fără a alege. Dar doar documentele utile participă la clasament. Și „Yandex” exclude imediat toate gunoiul web. Poate indexa orice pagină, dar motorul de căutare va elimina în cele din urmă tot gunoiul.

Ambele sisteme au un index incremental. Ambele pagini de calitate scăzută afectează clasamentul site-ului web în ansamblu. Există o filozofie simplă la lucru aici. Resursele preferate ale unui anumit utilizator vor ocupa poziții mai înalte în emiterea acestuia. Dar același individ va găsi cu greu un site care nu i-a plăcut data trecută.

De aceea, este mai întâi necesar să acoperiți copiile documentelor web de la indexare, să inspectați paginile goale și să nu lăsați conținut de calitate scăzută să intre în problemă.

Accelerarea Yandex

Cum pot accelera indexarea site-urilor în Yandex? Trebuie să urmați acești pași:

Acțiuni intermediare

Ce trebuie făcut până când pagina web este indexată de Yandex? Motorul de căutare intern ar trebui să considere site-ul ca sursă principală. De aceea, chiar înainte de publicarea articolului, este imperativ să adăugați conținutul acestuia la forma „Texte specifice”. În caz contrar, plagiatorii vor copia intrarea în resursa lor și vor fi primii în baza de date. Ca urmare, ei vor fi recunoscuți ca autori.

baza de date Google

Interdicţie

Ce este interdicția de indexare a site-urilor web? Îl puteți suprapune atât pe întreaga pagină, cât și pe o parte separată a acesteia (link sau fragment de text). De fapt, există atât o interdicție globală de indexare, cât și una locală. Cum este implementat?

Luați în considerare interdicția de a adăuga un site web la baza de date a motorului de căutare în Robots.txt. Folosind fișierul robots.txt, puteți exclude indexarea unei pagini sau a unui întreg titlu de resursă, astfel:

  1. Agent utilizator: *
  2. Nu permiteți: /kolobok.html
  3. Nu permiteți: /foto/

Primul paragraf spune că instrucțiunile sunt definite pentru toate PS-urile, al doilea indică faptul că indexarea fișierului kolobok.html este interzisă, iar al treilea nu permite adăugarea întregii umpluturi a folderului foto în baza de date. Dacă trebuie să excludeți mai multe pagini sau foldere, specificați-le pe toate în Robots.

Puteți utiliza metaeticheta robots pentru a preveni indexarea unei foi web individuale. Diferă de robots.txt prin faptul că oferă instrucțiuni tuturor PS deodată. Această metaetichetă urmează principiile generale ale formatului html. Ar trebui să fie plasat în titlul paginii între intrarea pentru a interzice, de exemplu, ar putea fi scris astfel: .

Ajax

Cum indexează Yandex site-urile Ajax? Astăzi, tehnologia Ajax este folosită de mulți dezvoltatori de site-uri web. Desigur, are un mare potențial. Cu acesta, puteți crea pagini web interactive rapide și productive.

Cu toate acestea, sistemul „vede” foaia web diferit decât utilizatorul și browserul. De exemplu, o persoană se uită la o interfață confortabilă cu foi de internet încărcate mobil. Pentru un robot de căutare, conținutul aceleiași pagini poate fi gol sau prezentat ca restul conținutului HTML static, pentru generarea căruia scripturile nu intră în acțiune.

Puteți utiliza o adresă URL cu # pentru a crea site-uri Ajax, dar crawler-ul nu o folosește. De obicei, partea URL după # este separată. Acest lucru trebuie luat în considerare. Prin urmare, în loc de o adresă URL ca http://site.ru/#example, el face o aplicație către pagina principală a resursei aflată la http://site.ru. Aceasta înseamnă că este posibil ca conținutul foii de internet să nu intre în baza de date. Ca urmare, nu va apărea în rezultatele căutării.

Pentru a îmbunătăți indexarea site-urilor Ajax, Yandex a acceptat modificări în robotul de căutare și regulile de procesare a adreselor URL ale unor astfel de site-uri web. Astăzi, webmasterii pot indica motorului de căutare Yandex necesitatea indexării prin crearea unei scheme adecvate în structura resurselor. Pentru asta ai nevoie de:

  1. Înlocuiți simbolul # din adresa URL a paginilor cu #!. Acum robotul va înțelege că va putea aplica pentru versiunea HTML a conținutului acestei foi de internet.
  2. Versiunea HTML a conținutului unei astfel de pagini ar trebui plasată pe o adresă URL unde #! înlocuit cu?_escaped_fragment_=.

Până când motorul de căutare nu va indexa pagina site-ului, acesta nu va participa la rezultatele căutării sale. Motorul de căutare poate afla despre site în două moduri:

  1. de la webmaster. De ce trebuie să adăugați adresa URL a unui document web la Yandex Addurl sau Google(din engleză adăugați url).
  2. accesând paginile site-ului printr-un link din alte documente web indexate.

Pe acest blog, am întâlnit o astfel de situație încât, fără probleme, Yandex a indexat doar pagina principală, dar cele interne nu au participat la căutare. Google nu a arătat nicio neatenție similară. Acolo, aproape cu viteza fulgerului, puteai observa articolul tău în rezultatele căutării.

De ce site-ul nu este indexat în Yandex

  1. Google introduce în baza sa de date toate paginile site-ului: de înaltă calitate și de calitate scăzută fără discernământ. Dar doar documentele web utile participă la clasament [nu confunda]. Yandex nu include imediat gunoiul web. Îl puteți forța să indexeze orice pagină, dar în timp, motorul de căutare va elimina gunoiul. Ambele sisteme au un index suplimentar. În ambele sisteme, paginile de calitate scăzută afectează clasarea site-ului în ansamblu. În ultimul punct, există o declarație oficială [vezi. Blogul Google] și logică simplă. Site-urile preferate ale unei anumite persoane vor fi în poziții mai înalte în emiterea sa. Dar aceeași persoană va găsi cu greu un site care să nu-l intereseze data trecută. Prin urmare, mai întâi trebuie să închideți documentele web duplicate de la indexare, să verificați dacă există pagini cu conținut lipsă și să nu lăsați conținut inutil să intre în problemă.
  2. „Verificați adresa URL” în Webmaster.Yandex vă va reaminte ce probleme sau ce probleme serverul.
  3. Dacă a fost achiziționat un domeniu acceptat, asupra căruia au fost impuse sancțiuni, atunci trebuie să scrieți ceva de genul Salutare serviciului de asistență. La 1 ianuarie 2000 a fost achiziționat domeniul site.ru. Pe 20 ianuarie 2000, site-ul a fost adăugat la Webmaster și addurilku. După trei săptămâni, nu a fost indexat. Spune-mi, te rog, poate un domeniu să provoace o indexare proastă?

Cum să accelerezi indexarea în Yandex

  1. Confirmați drepturile de gestionare a site-ului în Yandex.Webmaster.
  2. Postați un link către un articol în . Din 2012, Yandex a semnat un acord cu el.
  3. Instalați Yandex.Browser pe computer și „plimbați” prin paginile site-ului folosindu-l.
  4. Adăuga . Acolo, în coloana „Indexare”, vă puteți specifica manual URL-urile, la fel ca în addurilka. [nu este relevant ]
  5. Instalați codul Yandex.Metrica fără a bifa caseta de selectare „Interziceți trimiterea paginilor pentru indexare”.
  6. Creați harta site-ului. Apoi, la sosirea pe site, robotul îl va verifica în primul rând. Acest fișier există doar pentru el și nu este vizibil pentru public. Constă dintr-o listă de adrese URL ale paginilor. Nou create sau cu conținut actualizat sunt în partea de sus. Adresa Sitemap-ului este scrisă în robots.txt sau în forma corespunzătoare în Webmaster-„Setări de indexare”-„Fișiere Sitemap”.

Acțiuni suplimentare când Yandex a indexat doar o pagină

  1. Cât de des este actualizată pagina, cât de des o va reindexa robotul de căutare. Practic, conținutul se modifică periodic pe „harta site-ului” și pe paginile de pornire. Cu cât sunt publicate mai des articole noi, cu atât mai des paginile menționate mai sus vor fi actualizate și materialul nou va fi indexat prin link-uri din interiorul lor.
  2. Dacă faceți un blocaj cu cele mai recente publicații scrise pe toate paginile, atunci robotul de căutare poate merge la o nouă înregistrare din orice pagină a site-ului pe care a vizitat-o. Și va fi mai rapid. Link-urile dintr-un bloc through nu ar trebui să fie implementate de un script, nu au nevoie de .
  3. Site-urile care au se pot înregistra în directorul Yandex.blogs, iar de acolo datele vor fi transferate către robotul principal.
  4. Lăsați linkuri către articolele dvs. despre resurse actualizate frecvent: „LiveJournal”, "," și altele.

Actualizare baze de date - actualizare (în sus) emitere Se întâmplă în medie o dată pe săptămână. Dacă toate acțiunile de mai sus nu au ajutat, ceea ce nu am avut niciodată, atunci ar trebui să scrieți o scrisoare către serviciul de asistență, unde puteți spune ce s-a făcut, puțin despre site, că este umplut în mod regulat, că oamenii sunt interesați în el, dați câteva link-uri către cele mai bune articole ca exemplu. Dacă resursa are o prezență scăzută din cauza subiectelor înguste, trebuie să o spuneți. De exemplu, să spunem că proiectul nu planifică o prezență mare, deoarece a fost creat pentru societatea lepidopterologilor care studiază fluturii din familia Lepidoptera. Dacă site-ul este comercial, atunci raportați că în spatele lui există o organizație reală.