Cum funcționează motoarele de căutare. Ce este un motor de căutare

Internetul este necesar pentru mulți utilizatori pentru a primi răspunsuri la întrebările (întrebările) pe care le introduc.

Dacă nu ar exista motoare de căutare, utilizatorii ar trebui să caute în mod independent site-urile de care au nevoie, să le amintească și să le noteze. În multe cazuri, să găsești ceva potrivit „manual” ar fi foarte dificil și adesea pur și simplu imposibil.

Facem toată această muncă de rutină de căutare, stocare și sortare a informațiilor pe site-uri web.

Să începem cu celebrele motoare de căutare Runet.

Motoare de căutare pe internet în limba rusă

1) Să începem cu motorul de căutare autohton. Yandex funcționează nu numai în Rusia, ci și în Belarus și Kazahstan, Ucraina și Turcia. Există și Yandex în engleză.

2) Motorul de căutare Google a venit la noi din America și are localizare în limba rusă:

3) Motorul de căutare intern Mail ru, care reprezintă simultan rețeaua de socializare VKontakte, Odnoklassniki, de asemenea My World, celebrul Answers Mail.ru și alte proiecte.

4) Motor de căutare inteligent

Nigma (Nigma) http://www.nigma.ru/

Din 19 septembrie 2017, „intelectualul” nigma nu a funcționat. A încetat să mai prezinte un interes financiar pentru creatorii săi; aceștia au trecut la un alt motor de căutare numit CocCoc.

5) Cunoscuta companie Rostelecom a creat motorul de căutare Sputnik.

Există un motor de căutare numit Sputnik, conceput special pentru copii, despre care am scris.

6) Rambler a fost unul dintre primele motoare de căutare interne:

Există și alte motoare de căutare celebre în lume:

  • Bing,
  • Yahoo!,
  • Baidu,
  • Ecosia,

Să încercăm să ne dăm seama cum funcționează un motor de căutare, și anume cum sunt indexate site-urile, cum sunt analizate rezultatele indexării și cum sunt generate rezultatele căutării. Principiile de funcționare ale motoarelor de căutare sunt aproximativ aceleași: căutarea informațiilor pe Internet, stocarea acestora și sortarea lor pentru livrare ca răspuns la solicitările utilizatorilor. Dar algoritmii pe care îi folosesc motoarele de căutare pot diferi foarte mult. Acești algoritmi sunt păstrați secreti și dezvăluirea lor este interzisă.

Introducând aceeași interogare în șirurile de căutare ale diferitelor motoare de căutare, puteți obține răspunsuri diferite. Motivul este că toate motoarele de căutare folosesc proprii algoritmi.

Scopul motoarelor de căutare

În primul rând, trebuie să știi că motoarele de căutare sunt organizații comerciale. Scopul lor este să facă profit. Puteți obține profit din publicitate contextuală, alte tipuri de publicitate și din promovarea site-urilor necesare în partea de sus a rezultatelor căutării. În general, există multe moduri.

Depinde de mărimea audienței, adică de câte persoane folosesc acest motor de căutare. Cu cât publicul este mai mare, cu atât mai multor persoane le va fi afișat anunțul. În consecință, această publicitate va costa mai mult. Motoarele de căutare își pot crește audiența prin propria publicitate, precum și prin atragerea utilizatorilor prin îmbunătățirea calității serviciilor lor, a algoritmului și a confortului căutării.

Cel mai important și mai dificil lucru aici este dezvoltarea unui algoritm de căutare complet funcțional, care ar oferi rezultate relevante pentru majoritatea interogărilor utilizatorilor.

Munca unui motor de căutare și acțiunile webmasterilor

Fiecare motor de căutare are propriul algoritm, care trebuie să țină cont de un număr mare de factori diferiți atunci când analizează informațiile și compilează rezultate ca răspuns la solicitarea unui utilizator:

  • vârsta unui anumit site,
  • caracteristicile domeniului site-ului web,
  • calitatea conținutului de pe site și tipurile acestuia,
  • caracteristicile de navigare și structura site-ului,
  • uzabilitate (confort pentru utilizatori),
  • factori comportamentali (motorul de căutare poate determina dacă utilizatorul a găsit ceea ce căuta pe site sau utilizatorul a revenit din nou la motorul de căutare și acolo caută din nou un răspuns la aceeași interogare)
  • etc.

Toate acestea sunt necesare tocmai pentru ca rezultatele la cererea utilizatorului să fie cât mai relevante, satisfacând solicitările utilizatorului. În același timp, algoritmii motoarelor de căutare se schimbă și sunt perfecționați în mod constant. După cum se spune, nu există limită pentru perfecțiune.

Pe de altă parte, webmasterii și optimizatorii inventează în mod constant noi modalități de a-și promova site-urile, care nu sunt întotdeauna sincere. Sarcina dezvoltatorilor algoritmului motorului de căutare este să-i facă modificări care să nu permită site-urilor „rele” ale optimizatorilor necinstiți să apară în TOP.

Cum funcționează un motor de căutare?

Acum să vorbim despre cum funcționează de fapt motorul de căutare. Constă din cel puțin trei etape:

  • scanare,
  • indexare,
  • variind.

Numărul de site-uri de pe Internet este pur și simplu astronomic. Și fiecare site este informație, conținut informațional care este creat pentru cititori (oameni vii).

Scanare

Acesta este un motor de căutare care rătăcește pe Internet pentru a colecta informații noi, a analiza link-uri și a căuta conținut nou care poate fi folosit pentru a reveni la utilizator ca răspuns la solicitările acestuia. Pentru scanare, motoarele de căutare au roboți speciali numiți roboți de căutare sau păianjeni.

Roboții de căutare sunt programe care vizitează automat site-uri web și colectează informații de la acestea. Crawl-ul poate fi principal (robotul vizitează un site nou pentru prima dată). După colectarea inițială a informațiilor de pe site și introducerea lor în baza de date a motorului de căutare, robotul începe să-și viziteze paginile cu o oarecare regularitate. Dacă au apărut modificări (a fost adăugat conținut nou, conținut vechi a fost șters), atunci toate aceste modificări vor fi înregistrate de motorul de căutare.

Sarcina principală a unui păianjen de căutare este să găsească informații noi și să le trimită motorului de căutare pentru următoarea etapă de procesare, adică pentru indexare.

Indexarea

Un motor de căutare poate căuta informații doar printre acele site-uri care sunt deja incluse în baza sa de date (indexate de acesta). Dacă crawling-ul este procesul de căutare și colectare a informațiilor disponibile pe un anumit site, atunci indexarea este procesul de introducere a acestor informații în baza de date a motorului de căutare. În această etapă, motorul de căutare decide automat dacă introduce această sau acea informație în baza sa de date și unde să le introducă, în ce secțiune a bazei de date. De exemplu, Google indexează aproape toate informațiile găsite de roboții săi pe Internet, în timp ce Yandex este mai pretențios și nu indexează totul.

Pentru site-urile noi, etapa de indexare poate fi lungă, astfel încât vizitatorii din motoarele de căutare pot aștepta mult timp pentru site-uri noi. Iar informațiile noi care apar pe site-uri vechi, bine promovate, pot fi indexate aproape instantaneu și ajung aproape imediat în „index”, adică în baza de date a motorului de căutare.

Variind

Clasamentul este aranjarea informațiilor care au fost indexate anterior și introduse în baza de date a unui anumit motor de căutare, în funcție de rang, adică ce informații le va afișa motorul de căutare utilizatorilor săi în primul rând și ce informații vor fi plasate " rang” mai jos. Clasamentul poate fi atribuit stadiului de serviciu al motorului de căutare către clientul său - utilizatorul.

Pe serverele motoarelor de căutare, informațiile primite sunt procesate și sunt generate rezultate pentru o gamă largă de tot felul de interogări. Aici intră în joc algoritmii motoarelor de căutare. Toate site-urile incluse în baza de date sunt clasificate pe subiecte, iar subiectele sunt împărțite în grupuri de interogări. Pentru fiecare grup de cereri se poate alcătui o problemă preliminară, care va fi ulterior ajustată.

Bună ziua, dragi cititori ai site-ului blogului. Atunci când faci sau, cu alte cuvinte, optimizarea motoarelor de căutare, atât la nivel profesional (promovarea proiectelor comerciale pe bani), cât și la nivel amator (), cu siguranță vei da peste faptul că trebuie să cunoști principiile muncii în general. pentru a optimiza cu succes pentru ei site-ul dvs. sau al altcuiva.

Inamicul, după cum se spune, trebuie cunoscut din vedere, deși, desigur, ei (pentru RuNet, acesta este Yandex și) nu sunt deloc inamici pentru noi, ci mai degrabă parteneri, deoarece cota lor de trafic este în majoritatea cazurilor cea predominantă. și cel principal. Există, desigur, și excepții, dar ele nu fac decât să confirme această regulă.

Ce este un fragment și cum funcționează motoarele de căutare?

Dar mai întâi trebuie să vă dați seama ce este un fragment, pentru ce este acesta și de ce este atât de important conținutul său pentru optimizator? În rezultatele căutării se află imediat sub linkul către documentul găsit (al cărui text este preluat din ceea ce am scris deja):

Bucăți de text din acest document sunt de obicei folosite ca fragment. Opțiunea ideală este concepută pentru a oferi utilizatorului posibilitatea de a-și forma o opinie despre conținutul paginii fără a merge la el (dar asta dacă se dovedește a fi de succes și nu este întotdeauna cazul).

Fragmentul este generat automat și depinde de dvs. să decideți ce fragmente de text vor fi folosite în el și, ceea ce este important, aceeași pagină web va avea fragmente diferite pentru diferite solicitări.

Dar există posibilitatea ca conținutul etichetei Description să poată fi folosit uneori (în special în Google) ca fragment. Desigur, acest lucru va depinde și de problema în ale cărei rezultate de căutare apare.

Dar conținutul etichetei Description poate fi afișat, de exemplu, dacă cuvintele cheie de interogare coincid cu cuvintele pe care le-ați folosit în descriere sau dacă algoritmul în sine nu a găsit încă fragmente de text pe site-ul dvs. pentru toate interogările pentru care apare pagina dvs. în Rezultate Yandex sau Google.

Prin urmare, nu fi leneș și completați conținutul etichetei Description pentru fiecare articol. Acest lucru se poate face în WordPress dacă îl utilizați pe cel descris (și vă recomand cu tărie să îl utilizați).

Dacă ești fan Joomla, poți folosi acest material -.

Dar fragmentul nu poate fi obținut din indexul invers, deoarece stochează informații numai despre cuvintele folosite pe pagină și poziția acestora în text. Tocmai pentru a crea fragmente din același document în diferite rezultate de căutare (pentru diferite interogări), iubiții noștri Yandex și Google, pe lângă indexul invers (necesar direct pentru efectuarea unei căutări - citiți mai jos despre acesta), salvează și ele. indice direct, adică o copie a paginii web.

Prin salvarea unei copii a documentului în baza lor de date, atunci este destul de convenabil pentru ei să taie fragmentele necesare din ele, fără a se referi la original.

Acea. Se pare că motoarele de căutare stochează atât indexul direct, cât și cel invers al paginii web în baza lor de date. Apropo, poți influența indirect formarea fragmentelor prin optimizarea textului unei pagini web în așa fel încât algoritmul să aleagă exact fragmentul de text pe care îl ai în vedere. Dar despre asta vom vorbi într-un alt articol din această secțiune.

Cum funcționează motoarele de căutare în general

Esența optimizării este de a „ajuta” algoritmii motoarelor de căutare să ridice paginile site-urilor pe care le promovați la cea mai înaltă poziție posibilă în rezultatele căutării pentru anumite interogări.

Am pus cuvântul „ajutor” în propoziția anterioară între ghilimele, pentru că... Cu acțiunile noastre de optimizare, nu ajutăm cu adevărat și adesea împiedicăm complet algoritmul să obțină rezultate care sunt complet relevante pentru cerere (despre cele misterioase).

Dar aceasta este painea și untul optimizatorilor și până când algoritmii de căutare devin perfecți, vor exista oportunități prin optimizare internă și externă de a-și îmbunătăți pozițiile în rezultatele Yandex și Google.

Dar înainte de a trece la studiul metodelor de optimizare, va trebui să înțelegeți cel puțin superficial principiile modului în care funcționează motoarele de căutare, astfel încât să puteți face toate acțiunile ulterioare în mod conștient și să înțelegeți de ce este necesar acest lucru și cum vor cei pe care încercăm să-i înșelam. reactioneaza la ea.

Este clar că nu vom putea înțelege întreaga logică a muncii lor de la început până la sfârșit, deoarece multe informații nu sunt supuse dezvăluirii, dar pentru noi, la început, o înțelegere a principiilor fundamentale va fi suficientă. Asadar, haideti sa începem.

Oricum, cum funcționează motoarele de căutare? Destul de ciudat, dar logica muncii lor este, în principiu, aceeași și este următoarea: se colectează informații despre toate paginile web din rețea la care pot ajunge, după care aceste date sunt procesate cu viclenie, astfel încât să fie convenabil pentru ei efectuează o căutare. Asta este tot, de fapt, acest articol poate fi considerat complet, dar să adăugăm totuși câteva detalii.

În primul rând, să clarificăm că un document se referă la ceea ce numim de obicei o pagină de site. Mai mult, trebuie să aibă propria sa adresă unică () și, ceea ce este de remarcat, legăturile hash nu vor duce la apariția unui nou document (despre).

În al doilea rând, merită să ne oprim asupra algoritmilor (metodelor) de căutare a informațiilor în baza de date a documentelor colectate.

Algoritmi de indexare directă și inversă

Evident, metoda de simpla iterare prin toate paginile stocate în baza de date nu va fi optimă. Această metodă se numește algoritm căutare directăși în timp ce această metodă vă permite să găsiți cu siguranță informațiile necesare fără a pierde nimic important, este complet nepotrivită pentru a lucra cu volume mari de date, deoarece căutarea va dura prea mult timp.

Prin urmare, pentru a lucra eficient cu volume mari de date, a fost dezvoltat un algoritm de index invers (inversat). Și, remarcabil, este cel care este folosit de toate motoarele de căutare majore din lume. Prin urmare, ne vom opri asupra lui mai detaliat și vom lua în considerare principiile funcționării sale.

Când se utilizează algoritmul indici inversați documentele sunt convertite în fișiere text care conțin o listă a tuturor cuvintelor pe care le conțin.

Cuvintele din astfel de liste (fișiere index) sunt aranjate în ordine alfabetică și lângă fiecare dintre ele sunt indicate sub formă de coordonate locurile de pe pagina web în care apare acest cuvânt. Pe lângă poziția din document, pentru fiecare cuvânt există și alți parametri care îi determină semnificația.

Dacă vă amintiți, în multe cărți (mai ales tehnice sau științifice) pe ultimele pagini există o listă de cuvinte folosite în această carte, indicând numerele paginilor unde apar. Desigur, această listă nu include toate cuvintele folosite în carte, dar cu toate acestea poate servi ca exemplu de construire a unui fișier index folosind indecși inversați.

Vă rugăm să rețineți că motoarele de căutare caută informații nu pe internet, și în indexurile inverse ale paginilor web pe care le-au procesat. Deși salvează și indecși direcți (text original), deoarece mai târziu va fi nevoie de compilarea fragmentelor, dar despre asta am vorbit deja la începutul acestei publicații.

Algoritmul de index invers este folosit de toate sistemele, deoarece vă permite să accelerați procesul, dar în același timp va exista inevitabil pierdere de informații din cauza distorsiunilor introduse prin conversia documentului într-un fișier index. Pentru ușurința stocării, fișierele cu index invers sunt de obicei comprimate într-un mod inteligent.

Model matematic folosit pentru clasare

Pentru a căuta folosind indici inversați, se utilizează un model matematic pentru a simplifica procesul de detectare a paginilor web necesare (pe baza unei interogări introduse de utilizator) și procesul de determinare a relevanței tuturor documentelor găsite pentru această interogare. Cu cât se potrivește mai mult cu o anumită solicitare (cu atât este mai relevantă), cu atât ar trebui să apară mai sus în rezultatele căutării.

Aceasta înseamnă că sarcina principală îndeplinită de modelul matematic este de a căuta pagini în baza sa de indici inversi corespunzători unei anumite interogări și sortarea lor ulterioară în ordinea descrescătoare a relevanței pentru această interogare.

Folosirea unui model logic simplu, atunci când un document este găsit dacă fraza căutată este găsită în el, nu ne va potrivi, din cauza numărului imens de astfel de pagini web prezentate utilizatorului spre luare în considerare.

Motorul de căutare nu trebuie să furnizeze doar o listă a tuturor paginilor web pe care apar cuvintele din interogare. Ea trebuie să furnizeze această listă într-o astfel de formă încât documentele cele mai relevante pentru solicitarea utilizatorului să fie la început (sortați după relevanță). Această sarcină nu este banală și nu poate fi efectuată perfect în mod implicit.

Apropo, optimizatorii profită de imperfecțiunea oricărui model matematic, influențând într-un fel sau altul clasarea documentelor în rezultatele căutării (în favoarea site-ului pe care îl promovează, desigur). Modelul matematic folosit de toate motoarele de căutare aparține clasei vectoriale. Utilizează un astfel de concept precum greutatea unui document în raport cu o interogare specificată de utilizator.

În modelul vectorial de bază, ponderea unui document pentru o anumită interogare este calculată pe baza a doi parametri principali: frecvența cu care un anumit cuvânt apare în el (TF - frecvența termenului) și cât de rar apare acest cuvânt în toate celelalte pagini ale colecția (IDF - frecvența inversă a documentelor).

Prin colecție înțelegem întregul set de pagini cunoscut motorului de căutare. Înmulțind acești doi parametri unul cu celălalt, obținem ponderea documentului pentru o anumită cerere.

Desigur, diverse motoare de căutare, pe lângă parametrii TF și IDF, folosesc mulți coeficienți diferiți pentru a calcula greutatea, dar esența rămâne aceeași: greutatea paginii va fi mai mare, cu atât mai des apare cuvântul din interogarea de căutare. în el (până la anumite limite, după care documentul poate fi recunoscut ca spam) și cu atât mai rar acest cuvânt apare în toate celelalte documente indexate de acest sistem.

Evaluarea calității formulei de către evaluatori

Astfel, rezultă că se realizează generarea de rezultate pentru anumite solicitări complet conform formulei fără intervenție umană. Dar nicio formulă nu va funcționa perfect, mai ales la început, așa că trebuie să monitorizați funcționarea modelului matematic.

În aceste scopuri sunt folosite persoane special instruite – care vizualizează rezultatele (în special ale motorului de căutare care i-a angajat) pentru diverse interogări și evaluează calitatea formulei actuale.

Toate comentariile pe care le fac sunt luate în considerare de persoanele responsabile cu realizarea modelului matematic. Se fac modificări sau completări la formula sa, în urma cărora calitatea muncii motorului de căutare se îmbunătățește. Se pare că evaluatorii acționează ca un fel de feedback între dezvoltatorii algoritmului și utilizatorii acestuia, ceea ce este necesar pentru îmbunătățirea calității.

Principalele criterii de evaluare a calității formulei sunt:

  1. Acuratețea rezultatelor motorului de căutare este procentul de documente relevante (care se potrivesc cu interogarea). Cu cât sunt mai puține pagini web (de exemplu, uși) care nu au legătură cu subiectul solicitării, cu atât mai bine.
  2. Completitudinea rezultatelor căutării reprezintă procentul de pagini web care corespund unei anumite interogări (relevante) față de numărul total de documente relevante disponibile în întreaga colecție. Acestea. reiese că în întreaga bază de date de documente despre care se știe că caută, vor exista mai multe pagini web corespunzătoare unei anumite interogări decât sunt afișate în rezultatele căutării. În acest caz, putem vorbi despre incompletitudinea emisiunii. Este posibil ca unele dintre paginile relevante să fi căzut sub filtru și să fi fost, de exemplu, confundate cu uși sau altă zgură.
  3. Relevanța rezultatelor căutării este gradul în care o pagină web reală de pe un site de pe Internet corespunde cu ceea ce este scris despre ea în rezultatele căutării. De exemplu, un document poate să nu mai existe sau să fie mult modificat, dar va fi prezent în rezultatele căutării pentru o anumită cerere, în ciuda absenței sale fizice la adresa specificată sau a nerespectării actuale a cererii date. Relevanța rezultatelor depinde de frecvența roboților de căutare care scanează documente din colecția lor.

Cum își colectează Yandex și Google colecția

În ciuda simplității aparente a indexării paginilor web, există o mulțime de nuanțe pe care trebuie să le cunoașteți și, ulterior, să le utilizați atunci când vă optimizați (SEO) site-urile web proprii sau personalizate. Indexarea rețelei (colecția de colecții) este realizată de un program special conceput numit robot de căutare (bot).

Robotul primește o listă inițială de adrese pe care va trebui să le viziteze, copiază conținutul acestor pagini și dă acest conținut pentru prelucrare ulterioară algoritmului (le convertește în indici inversați).

Robotul nu poate doar să urmeze o listă care i-a fost dată în prealabil, ci și să urmărească link-uri din aceste pagini și documente indexate aflate pe aceste link-uri. Acea. robotul se comportă exact la fel ca un utilizator obișnuit care urmează link-uri.

Prin urmare, rezultă că cu ajutorul unui robot este posibil să indexezi tot ceea ce este de obicei disponibil unui utilizator folosind un browser pentru a naviga (motoarele de căutare indexează documente cu vizibilitate directă care pot fi văzute de orice utilizator de internet).

Există o serie de caracteristici asociate cu indexarea documentelor pe Internet (permiteți-mi să vă reamintesc că am discutat deja).

Prima caracteristică poate fi considerată că, pe lângă indexul invers, care este creat din documentul original descărcat din rețea, motorul de căutare stochează și o copie a acestuia, cu alte cuvinte, motoarele de căutare stochează și indexul direct. De ce este necesar acest lucru? Am menționat deja puțin mai devreme că acest lucru este necesar pentru a compune diferite fragmente în funcție de interogarea introdusă.

Câte pagini ale unui site arată Yandex în rezultatele căutării și în index?

Aș dori să vă atrag atenția asupra unei astfel de caracteristici a muncii Yandex, cum ar fi prezența unui singur document de pe fiecare site în rezultatele căutării pentru o anumită solicitare. Până de curând, nu s-ar fi putut întâmpla ca două pagini din aceeași resursă să fie prezente în poziții diferite în rezultatele căutării.

Aceasta a fost una dintre regulile fundamentale ale Yandex. Chiar dacă există o sută de pagini relevante pentru o anumită interogare pe un site, doar una (cea mai relevantă) va apărea în rezultate.

Yandex este interesat ca utilizatorul să primească o varietate de informații și să nu defileze prin mai multe pagini de rezultate ale căutării cu pagini ale aceluiași site, pe care acest utilizator s-a dovedit a fi neinteresant dintr-un motiv sau altul.

Cu toate acestea, mă grăbesc să mă corectez, deoarece când am terminat de scris acest articol, am aflat vestea că se dovedește că Yandex a început să permită afișarea unui al doilea document din aceeași resursă în rezultatele căutării, ca excepție, dacă această pagină se dovedește a fi „foarte bun și adecvat” (cu alte cuvinte, este foarte relevant pentru cerere).

Ceea ce este de remarcat este că aceste rezultate suplimentare de pe același site sunt și ele numerotate, prin urmare, din această cauză, unele resurse care ocupă poziții inferioare vor cădea din top. Iată un exemplu de noua ieșire Yandex:

Motoarele de căutare se străduiesc să indexeze toate site-urile web în mod egal, dar adesea acest lucru nu este ușor din cauza numărului complet diferit de pagini de pe ele (unele au zece, în timp ce altele au zece milioane). Cum să fii în acest caz?

Yandex iese din această situație limitând numărul de documente pe care le poate introduce în index de pe un site.

Pentru proiectele cu un nume de domeniu de nivel al doilea, de exemplu, un site web, numărul maxim de pagini care pot fi indexate de o oglindă Runet este în intervalul de la o sută la o sută cincizeci de mii (numărul specific depinde de relație la proiectul dat).

Pentru resurse cu un nume de domeniu de nivel al treilea - de la zece la treizeci de mii de pagini (documente).

Dacă aveți un site web cu un domeniu de nivel al doilea () și trebuie să indexați, de exemplu, un milion de pagini web, atunci singura cale de ieșire din această situație este să creați mai multe subdomenii ().

Subdomeniile pentru un domeniu de nivel al doilea pot arăta astfel: JOOMLA.site. Numărul de subdomenii pentru al doilea nivel pe care Yandex le poate indexa este undeva puțin peste 200 (uneori până la o mie), așa că în acest mod simplu puteți pune câteva milioane de pagini web în indexul oglinzii RuNet.

Cum tratează Yandex site-urile din zonele de domeniu non-rus

Datorită faptului că, până de curând, Yandex a căutat numai în partea în limba rusă a internetului, a indexat în principal proiecte în limba rusă.

Prin urmare, dacă creați un site web care nu se află în zonele de domeniu, care în mod implicit sunt clasificate ca în limba rusă (RU, SU și UA), atunci nu ar trebui să vă așteptați la indexare rapidă, deoarece cel mai probabil îl va găsi nu mai devreme de o lună mai târziu. Dar indexarea ulterioară va avea loc cu aceeași frecvență ca și în zonele de domeniu în limba rusă.

Acestea. Zona de domeniu afectează doar timpul care va trece înainte de începerea indexării, dar nu îi va afecta ulterior frecvența. Apropo, de ce depinde această frecvență?

Logica modului în care motoarele de căutare funcționează pentru a reindexa paginile se reduce la aproximativ următoarele:

  1. După ce a găsit și a indexat o pagină nouă, robotul o vizitează a doua zi
  2. După ce a comparat conținutul cu ceea ce a fost ieri și nu a găsit nicio diferență, robotul va reveni la el abia peste trei zile
  3. dacă de data aceasta nu se schimbă nimic, atunci va veni peste o săptămână etc.

Acea. În timp, frecvența vizitelor robotului pe această pagină va fi egală sau comparabilă cu frecvența actualizărilor acesteia. Mai mult, timpul de reintrare a robotului poate fi măsurat pentru diferite locații atât în ​​minute, cât și în ani.

Acestea sunt motoarele de căutare inteligente care creează un program individual de vizită pentru diverse pagini cu diverse resurse. Este posibil, totuși, să forțăm motoarele de căutare să reindexeze o pagină la cererea noastră, chiar dacă nu s-a schimbat nimic la ea, dar mai multe despre asta într-un alt articol.

Vom continua să studiem principiile căutării în articolul următor, unde ne vom uita la problemele cu care se confruntă motoarele de căutare și vom lua în considerare nuanțele. Ei bine, și mult mai mult, desigur, asta ajută într-un fel sau altul.

Multă baftă! Ne vedem curând pe paginile site-ului blogului

S-ar putea să fiți interesat

Rel Nofollow și Noindex - cum să blocați linkurile externe de pe un site web de la indexarea de către Yandex și Google
Ținând cont de morfologia limbii și de alte probleme rezolvate de motoarele de căutare, precum și de diferența dintre interogările de înaltă frecvență, de medie și de joasă frecvență
Încrederea în site - ce este, cum să o măsurați în XTools, ce o influențează și cum să creșteți autoritatea site-ului dvs.
Terminologie SEO, acronime și jargon
Relevanță și clasare - ce este și ce factori influențează poziția site-urilor în rezultatele Yandex și Google
Ce factori de optimizare pentru motoarele de căutare afectează promovarea site-ului web și în ce măsură?
Optimizarea textelor pentru motoarele de căutare – frecvența optimă a cuvintelor cheie și lungimea lor ideală
Conținut pentru site - cum umplerea acestuia cu conținut unic și util ajută la promovarea site-ului modern
Meta-etichetele titlul, descrierea și cuvintele cheie împiedică promovarea
Actualizări Yandex - ce sunt, cum să urmăriți țâțele, modificările rezultatelor căutării și toate celelalte actualizări

În ultimii ani, serviciile Google și Yandex au devenit parte din viața noastră. În acest sens, mulți se întreabă probabil ce este un motor de căutare? În termeni simpli, este un sistem software conceput pentru a căuta informații pe World Wide Web. Rezultatele sale sunt de obicei prezentate într-un format de listă, adesea numite pagini de rezultate ale motorului de căutare (SERPs). Informațiile pot fi o combinație de pagini web, imagini și alte tipuri de fișiere. Unele motoare de căutare conțin și informații disponibile în baze de date sau directoare publice.

Spre deosebire de directoarele web, care sunt acceptate doar de proprii editori, motoarele de căutare conțin și informații în timp real prin rularea unui algoritm pe crawler-ul web.

Istoria originii

Motoarele de căutare în sine au apărut mai devreme decât World Wide Web - în decembrie 1990. Primul astfel de serviciu s-a numit Archie și a căutat în conținutul fișierelor FTP folosind comenzi.

Ce este un motor de căutare pe Internet? Până în septembrie 1993, World Wide Web a fost indexat în întregime manual. A existat o listă de servere web editată de Tim Berners-Lee care a fost găzduită pe serverul web CERN. Pe măsură ce tot mai multe servere au intrat online, serviciul de mai sus nu a putut ține pasul cu procesarea unei asemenea cantități de informații.

Unul dintre primele motoare de căutare bazate pe căutări web a fost WebCrawler, care a fost lansat în 1994. Spre deosebire de predecesorii săi, a permis utilizatorilor să caute orice cuvânt pe orice pagină web. Acest algoritm a devenit de atunci standardul pentru toate motoarele de căutare majore. A fost și prima decizie cunoscută pe scară largă publicului. Tot în 1994 a fost lansat serviciul Lycos, care a devenit ulterior un mare proiect comercial.

Curând după aceea, au apărut multe motoare de căutare, iar popularitatea lor a crescut semnificativ. Acestea includ Magellan, Excite, Infoseek, Inktomi, Northern Light și AltaVista. Yahoo! a fost una dintre cele mai populare modalități de a găsi pagini web de interes, dar algoritmul său de căutare a funcționat pe propriul director web, mai degrabă decât pe copii cu text integral ale paginilor. Căutătorii de informații ar putea, de asemenea, să răsfoiască directorul în loc să efectueze o căutare prin cuvinte cheie.

O nouă rundă de dezvoltare

Google a îmbrățișat ideea de a vinde interogări de căutare în 1998, începând cu o companie mică numită goto.com. Această mișcare a avut un impact semnificativ asupra afacerii SEO, care de-a lungul timpului a devenit una dintre cele mai profitabile activități de pe Internet.

În jurul anului 2000, motorul de căutare Google a devenit cunoscut pe scară largă. Compania a obținut rezultate mai bune pentru multe căutări printr-o inovație numită PageRank. Acest algoritm iterativ clasifică paginile web pe baza conexiunilor lor cu alte site-uri și pagini, pe baza premisei că sursele bune sau dezirabile sunt adesea menționate de alții. Google a menținut, de asemenea, o interfață minimalistă pentru motorul său de căutare. Dimpotrivă, mulți dintre concurenți au construit un motor de căutare în portalul web. De fapt, Google a devenit atât de popular încât au apărut motoarele de înșelătorie precum Mystery Seeker. Astăzi există multe versiuni regionale ale acestui serviciu, în special motorul de căutare Google.ru, conceput pentru utilizatorii vorbitori de limbă rusă.

Cum funcționează aceste servicii?

Cum sunt afișate clasamentele și rezultatele? Ce sunt motoarele de căutare din punct de vedere al algoritmului de acțiune? Aceștia obțin informații prin accesarea cu crawlere web de la site la site. Robotul sau păianjenul verifică numele fișierului robots.txt standard care îi este adresat înainte de a trimite anumite informații pentru indexare. Se concentrează pe mulți factori, și anume anteturi, conținutul paginii, JavaScript, foi de stil în cascadă (CSS) și marcaj HTML standard al conținutului informațional sau metadatelor din metaetichetele HTML.

Indexarea înseamnă asocierea cuvintelor și a altor simboluri identificabile găsite pe paginile web cu numele lor de domeniu și câmpurile bazate pe HTML. Asociațiile sunt create într-o bază de date accesibilă public disponibilă pentru interogări de căutare pe web. Solicitarea utilizatorului poate fi de un singur cuvânt. Un index vă ajută să găsiți informații legate de o interogare cât mai repede posibil.

Unele dintre tehnicile de indexare și stocare în cache sunt secrete comerciale, în timp ce accesarea cu crawlere web este un proces simplu de vizitare a tuturor site-urilor web într-o manieră sistematică.

Între vizitele robotului, o versiune stocată în cache a paginii (o parte sau tot conținutul necesar pentru a-l afișa) stocată în memoria de lucru a motorului de căutare este trimisă rapid utilizatorului solicitant. Dacă vizita este întârziată, motorul de căutare poate acționa pur și simplu ca un proxy web. În acest caz, pagina poate diferi de indecșii de căutare. Sursa stocată în cache arată versiunea ale cărei cuvinte au fost indexate, deci poate fi utilă dacă pagina reală a fost pierdută.

Arhitectură la nivel înalt

De obicei, un utilizator introduce o interogare într-un motor de căutare sub forma mai multor cuvinte cheie. Indexul are deja numele site-urilor care conțin aceste cuvinte cheie și sunt afișate instantaneu. Adevărata sarcină de lucru este crearea de pagini web care sunt o listă cu rezultatele căutării. Fiecare pagină din întreaga listă trebuie să fie clasată în funcție de informațiile din indexuri.

În acest caz, elementul de rezultat superior necesită căutarea, reconstruirea și marcarea fragmentelor care arată contextul din cuvintele cheie potrivite. Aceasta este doar o parte a procesării fiecărei pagini web din rezultatele căutării, iar paginile ulterioare (lângă ea) necesită cea mai mare parte a acestei procesări ulterioare.

Pe lângă simpla căutare a cuvintelor cheie, motoarele de căutare oferă propriile operatori GUI sau comandați și parametri de căutare pentru a rafina rezultatele.

Ele oferă utilizatorului controalele necesare printr-o buclă de feedback, filtrare și ponderare în timp ce rafinează datele căutate pe baza paginilor inițiale ale primelor rezultate de căutare. De exemplu, din 2007, Google.com a făcut posibilă filtrarea listei rezultate după dată făcând clic pe „Afișați instrumentele de căutare” în coloana din stânga a paginii originale cu rezultate și apoi selectând intervalul de date dorit.

Cereri variate

Majoritatea motoarelor de căutare acceptă utilizarea operatorilor booleeni ȘI, SAU și NU pentru a ajuta utilizatorii finali să-și rafineze interogarea. Unii operatori sunt proiectați pentru literali, care permit utilizatorului să rafinați și să extindă termenii de căutare. Robotul caută cuvinte sau expresii în același mod în care caută comenzile introduse. Unele motoare de căutare oferă o funcție de căutare avansată care permite utilizatorilor să determine distanța dintre cuvintele cheie.

Există și căutarea bazată pe concept, în care cercetarea presupune utilizarea analizei statistice pe paginile care conțin cuvintele sau expresiile pe care le cauți. În plus, interogările în limbaj natural permit utilizatorului să introducă o întrebare în același mod în care ar pune-o unui om (cel mai tipic exemplu este ask.com).

Utilitatea unui motor de căutare depinde de relevanța setului de rezultate pe care îl returnează. Pot exista milioane de pagini web care conțin un anumit cuvânt sau expresie, dar unele pot fi mai relevante, mai populare sau mai autorizate decât altele. Majoritatea motoarelor de căutare folosesc metode de clasare pentru a asigura cele mai bune rezultate.

Modul în care un motor de căutare decide care pagini sunt cele mai potrivite pentru o interogare și în ce ordine ar trebui să fie afișate sursele găsite, variază foarte mult de la un robot la altul. Aceste metode se schimbă, de asemenea, în timp, pe măsură ce utilizarea internetului se schimbă și se dezvoltă noile tehnologii.

Ce este un motor de căutare: soiuri

Există două tipuri principale de motoare de căutare. Primul este un sistem de cuvinte cheie predefinite și ordonate ierarhic cu care oamenii l-au programat în masă. Al doilea este un sistem care generează un „index inversat” prin analiza textelor găsite.

Majoritatea motoarelor de căutare sunt servicii comerciale susținute de veniturile din publicitate și, astfel, unele permit agenților de publicitate să se claseze în rezultatele pe care le afișează contra cost. Serviciile care nu acceptă bani pentru clasare fac bani prin difuzarea de anunțuri contextuale lângă site-urile pe care le afișează. Astăzi, promovarea în motoarele de căutare este unul dintre cele mai profitabile câștiguri de pe internet.

Ce servicii sunt cele mai comune?

Google este cel mai popular motor de căutare din lume, cu o cotă de piață de 80,52% în martie 2017.

  • Google - 80,52%
  • Bing - 6,92%
  • Baidu - 5,94%
  • Yahoo! - 5,35%

Motoare de căutare în Rusia și Asia de Est

În Rusia și în unele țări din Asia de Est, Google nu este cel mai popular serviciu. În rândul utilizatorilor ruși, motorul de căutare Yandex este lider în popularitate (61,9%) față de Google (28,3%). În China, Baidu este cel mai popular serviciu. Portalul de căutare Naver din Coreea de Sud este folosit pentru 70% din căutările online din țară. De asemenea, Yahoo! în Japonia și Taiwan este cel mai popular instrument pentru găsirea datelor necesare.

Alte motoare de căutare rusești binecunoscute sunt Mail și Rambler. Odată cu începutul dezvoltării Runetului, ei s-au bucurat de o mare popularitate, dar acum și-au pierdut foarte mult poziția.

Restricții de căutare și criterii

Deși motoarele de căutare sunt programate să clasifice site-urile web pe baza unora dintre popularitatea și relevanța lor, cercetarea empirică indică diferite criterii politice, economice și sociale pentru selectarea informațiilor pe care le furnizează. Aceste părtiniri pot fi un rezultat direct al proceselor economice (de exemplu, companiile care fac publicitate unui motor de căutare pot deveni, de asemenea, mai populare în rezultatele căutării organice) și politice (de exemplu, eliminarea rezultatelor căutării din cauza legilor locale). De exemplu, Google nu va afișa unele site-uri neonaziste din Franța și Germania, unde negarea Holocaustului este ilegală.

Motoare de căutare creștine, islamice și evreiești

Creșterea globală a internetului și a media electronică în lumea musulmană în ultimul deceniu i-a determinat pe adepții islamici din Orientul Mijlociu și subcontinentul asiatic să încerce să-și creeze propriile motoare de căutare și portaluri filtrate care să permită utilizatorilor să efectueze căutări sigure.

Astfel de servicii conțin filtre care clasifică în continuare site-urile web ca „halal” sau „haram”, pe baza interpretării moderne de experți a „Legii Islamului”.

Portalul ImHalal a apărut online în septembrie 2011, iar Halalgoogling în iulie 2013. Ei folosesc filtre haram bazate pe algoritmi de la Google și Bing.

Alte motoare de căutare orientate religios includ Jewgle (versiunea evreiască a Google) și SeekFind.org, bazat pe creștin. Ei filtrează site-urile care neagă sau degradează credința lor.

Cel mai popular serviciu web al timpului nostru este motorul de căutare. Totul este de înțeles aici, pentru că vremurile în care reprezentanții primilor internauți puteau observa produse noi pe Internet au trecut de mult.

Apar și se acumulează atât de multe informații încât a devenit foarte greu pentru o persoană să găsească exact ceea ce are nevoie. Imaginați-vă cum ar fi să căutați pe Internet dacă utilizatorul obișnuit ar trebui să caute informații de la Dumnezeu știe unde. Pur și simplu nu înțeleg unde, pentru că nu veți găsi multe informații cu o căutare manuală.

Motor de căutare, ce este?

Este bine dacă utilizatorul cunoaște deja site-uri care pot avea informațiile necesare, dar ce să facă altfel? Pentru a ușura viața unei persoane în găsirea informațiilor necesare pe Internet, au fost inventate motoarele de căutare sau pur și simplu motoarele de căutare. Motorul de căutare îndeplinește o funcție foarte importantă, fără de care Internetul nu ar fi la fel cum suntem obișnuiți să-l vedem - aceasta este căutarea de informații pe Internet.

Sistem de căutare- acesta este un site web special sau cu alte cuvinte un site care oferă utilizatorilor, la cererea acestora, hyperlinkuri către pagini ale site-urilor care răspund la o anumită interogare de căutare.

Ca să fiu puțin mai precis, este o căutare de informații pe Internet, realizată datorită unui set funcțional software și hardware și a unei interfețe web pentru interacțiunea cu utilizatorii.

Pentru interacțiunea umană cu motorul de căutare, a fost creată o interfață web, adică un shell vizibil și ușor de înțeles. Această abordare a dezvoltatorilor de motoare de căutare face căutarea mai ușoară pentru mulți oameni. De regulă, căutările sunt efectuate folosind motoarele de căutare pe Internet, dar există și sisteme de căutare pentru servere FTP, anumite tipuri de bunuri pe World Wide Web sau informații de știri sau alte direcții de căutare.

Căutarea poate fi efectuată nu numai prin conținutul text al site-urilor, ci și prin alte tipuri de informații pe care o persoană le poate căuta: imagini, videoclipuri, fișiere de sunet etc.

Cum caută un motor de căutare?

Căutarea pe Internet în sine, la fel ca și navigarea pe site-uri web, este posibilă folosind un browser de internet. Numai după ce utilizatorul și-a specificat interogarea în bara de căutare, căutarea în sine este efectuată direct.

Orice sistem de căutare conține o parte software pe care se bazează întregul mecanism de căutare; se numește motor de căutare - acesta este un pachet software care oferă posibilitatea de a căuta informații. După ce contactează un motor de căutare, o persoană generează o interogare de căutare și o introduce în bara de căutare, motorul de căutare generează o pagină cu o listă de rezultate ale căutării, cele mai relevante, în opinia motorului de căutare, sunt situate mai sus.

Relevanța căutării - căutarea celor mai relevante materiale la solicitarea utilizatorului și plasarea de hyperlinkuri pe acestea în pagina cu rezultatele căutării cu rezultate mai precise deasupra altora. Distribuția în sine a rezultatelor se numește clasarea site-ului.

Deci, cum își pregătește un motor de căutare materialele pentru publicare și cum caută însuși motorul de căutare informații? Colectarea informațiilor în rețea este facilitată de un robot sau bot unic pentru fiecare motor de căutare, care are și o serie de alte sinonime, cum ar fi crawler sau spider, iar activitatea sistemului de căutare în sine poate fi împărțită în trei etape:

Prima etapă a funcționării unui motor de căutare include scanarea site-urilor din rețeaua globală și colectarea de copii ale paginilor web pe propriile servere. Acest lucru creează o cantitate imensă de informații care nu au fost încă procesate și nu sunt potrivite pentru rezultatele căutării.

A doua etapă a muncii motorului de căutare se rezumă la punerea în ordine a informațiilor primite anterior, în prima etapă, de pe site-uri. Sortarea este realizată în așa fel încât în ​​cel mai mic timp să fie favorabilă căutării de foarte înaltă calitate pe care utilizatorii se așteaptă de fapt de la un motor de căutare. Etapa se numește indexare, ceea ce înseamnă că paginile sunt deja pregătite pentru emitere, iar baza de date actuală va fi considerată un index.

Este tocmai a treia etapă care determină rezultatele căutării, după primirea unei cereri de la clientul său, pe baza cuvintelor cheie sau a cuvintelor cheie apropiate specificate în cerere. Acest lucru facilitează selectarea informațiilor cele mai relevante pentru cerere și livrarea ulterioară a acesteia. Întrucât există multe, multe informații, motorul de căutare realizează clasament în conformitate cu algoritmii săi.
Cel mai bun motor de căutare este considerat a fi cel care poate furniza materialul care răspunde cel mai corect solicitării utilizatorului. Dar și aici pot exista rezultate care au fost influențate de persoane interesate să-și promoveze site-ul; astfel de site-uri, deși nu întotdeauna, apar adesea în rezultatele căutării, dar nu pentru mult timp.

Deși lideri mondiali au fost deja identificați în multe regiuni, motoarele de căutare continuă să-și dezvolte căutarea de înaltă calitate. Cu cât o pot oferi o căutare mai bună, cu atât mai mulți oameni o vor folosi.

Cum se utilizează motorul de căutare?

Ce este un motor de căutare și cum funcționează este deja clar, dar cum să-l folosești corect? Majoritatea site-urilor au întotdeauna o bară de căutare, iar lângă ea există un buton Găsiți sau Căutați. O interogare este introdusă în linia de căutare, după care trebuie să apăsați butonul de căutare sau, așa cum se întâmplă mai des, apăsați tasta Enter de pe tastatură și în câteva secunde primiți rezultatul interogării în formular a unei liste.

Dar nu este întotdeauna posibil să obțineți răspunsul corect la o interogare de căutare prima dată. Pentru a vă asigura că căutarea a ceea ce doriți nu devine dureroasă, trebuie să compuneți corect interogarea de căutare și să urmați recomandările descrise mai jos.

Compunem corect interogarea de căutare

Următoarele vor oferi sfaturi pentru utilizarea motorului de căutare. Respectarea unor trucuri și reguli atunci când căutați informații într-un motor de căutare va face posibilă obținerea rezultatului dorit mult mai rapid. Urmați aceste instrucțiuni:

  1. Ortografia corectă a cuvintelor asigură numărul maxim de potriviri cu obiectul informațional dorit (Deși motoarele de căutare moderne au învățat deja să corecteze greșelile de ortografie, acest sfat nu trebuie neglijat).
  2. Folosind sinonime în interogarea dvs., puteți acoperi o gamă mai largă de căutare.
  3. Uneori, schimbarea unui cuvânt din textul interogării poate aduce rezultate mai bune; reformatați interogarea.
  4. Aduceți specificitate interogării dvs., utilizați aparițiile exacte ale expresiilor care ar trebui să definească esența principală a căutării.
  5. Experimentați cu cuvinte cheie. Folosirea cuvintelor cheie și a expresiilor poate ajuta la identificarea punctului principal, iar motorul de căutare va returna rezultate mai relevante.

Deci, ceea ce este un motor de căutare nu este altceva decât o oportunitate de a găsi informații de interes și de a le folosi, de obicei, complet gratuit, de a învăța ceva, de a înțelege ceva sau de a trage concluzia corectă pentru tine. Mulți oameni nu își mai pot imagina viața fără căutare vocală, în care nu este nevoie să tastați text, trebuie doar să spuneți cererea dvs., iar dispozitivul de introducere a informațiilor de aici este un microfon. Toate acestea indică dezvoltarea constantă a tehnologiilor de căutare pe Internet și necesitatea acestora.

Un motor de căutare este o bază de date cu informații specifice de pe Internet. Mulți utilizatori cred că, de îndată ce introduc o interogare într-un motor de căutare, întregul Internet este imediat accesat cu crawlere, dar acest lucru nu este deloc adevărat. Internetul este scanat constant, de multe programe, datele despre site-uri sunt introduse într-o bază de date, unde, după anumite criterii, toate site-urile și toate paginile lor sunt distribuite în diverse tipuri de liste și baze de date. Adică este un fel de dulap de fișiere de date, iar căutarea are loc nu pe Internet, ci pe acest dulap de fișiere.

Google este cel mai popular motor de căutare din lume.

Pe lângă motorul de căutare, Google oferă multe servicii suplimentare, programe și hardware, inclusiv un serviciu de e-mail, browser Google Chrome, cea mai mare bibliotecă video YouTube și multe alte proiecte. Google cumpără cu încredere multe proiecte care aduc profituri mari. Majoritatea serviciilor nu sunt destinate utilizatorului direct, ci spre a face bani pe Internet și sunt integrate cu accent pe interesele utilizatorilor europeni și americani.

Mail este un motor de căutare care este popular în principal datorită serviciului său de e-mail.

Există multe servicii suplimentare, a căror cheie este Mail, în acest moment compania Mail deține rețeaua socială Odnoklassniki, propria rețea „My World”, serviciul Money-mail, multe jocuri online, trei browsere aproape identice cu nume diferite. . Toate aplicațiile și serviciile conțin o mulțime de conținut publicitar. Rețeaua de socializare VKonatkte blochează tranzițiile directe către serviciile de e-mail, justificându-le cu un număr mare de viruși.

Wikipedia.

Wikipedia este un sistem de referință de căutare.

Motorul de căutare non-profit, care funcționează cu donații private, nu își umple, așadar, paginile cu publicitate. Un proiect multilingv al cărui scop este de a crea o enciclopedie de referință completă în toate limbile lumii. Nu are autori anumiți și este populat și condus de voluntari din toată lumea. Fiecare utilizator poate să scrie și să editeze un articol.

Pagina oficială - www.wikipedia.org.

Youtube este cea mai mare bibliotecă de fișiere video.

Găzduire video cu elemente ale unei rețele sociale, unde fiecare utilizator poate adăuga un videoclip. De la achiziționarea lor de către Google Ink, nu este necesară înregistrarea separată pentru YouTube, trebuie doar să vă înregistrați în serviciul de e-mail Google.

Pagina oficială - youtube.com.

Yahoo! este al doilea cel mai important motor de căutare din lume.

Există servicii suplimentare, dintre care cel mai faimos este Yahoo mail. Ca parte a îmbunătățirii calității motorului de căutare, Yahoo transferă date despre utilizatori și interogările acestora către Microsoft. Din aceste date, se formează o idee despre interesele utilizatorilor și se formează o piață pentru conținut publicitar. Motorul de căutare Yahoo, precum , este implicat în achiziția altor companii, de exemplu, Yahoo deține serviciul de căutare Altavista și site-ul de comerț electronic Alibaba.

Pagina oficială - www.yahoo.com.

WDL este o bibliotecă digitală.

Biblioteca colectează cărți care oferă valoare culturală în formă digitală. Scopul principal este de a crește nivelul de conținut cultural al internetului. Accesul la bibliotecă este gratuit.

Pagina oficială - www.wdl.org/ru/.

Bing este un motor de căutare de la Microsoft.

Pagina oficială - www.baidu.com.

Motoare de căutare în Rusia

Rambler este un motor de căutare „pro-american”.

Inițial a fost creat ca un portal media de internet. La fel ca multe alte motoare de căutare, are servicii de căutare pentru imagini, fișiere video, hărți, prognoze meteo, o secțiune de știri și multe altele. Editorii oferă, de asemenea, un browser gratuit, Rambler-Nichrome.

Pagina oficială - www.rambler.ru.

Nigma este un motor de căutare inteligent.

Un motor de căutare mai convenabil datorită prezenței multor filtre și setări. Interfața vă permite să includeți sau să excludeți valori similare sugerate în căutare pentru a obține rezultate mai bune. De asemenea, atunci când primiți un rezultat de căutare, vă permite să utilizați informații de la alte motoare de căutare majore.

Pagina oficială - www.nigma.ru.

Aport - catalog de produse online.

În trecut, un motor de căutare, dar după ce dezvoltarea și inovarea au fost oprite, a pierdut rapid teren și . În prezent, Aport este o platformă de tranzacționare în care sunt prezentate produsele a peste 1.500 de companii.

Pagina oficială - www.aport.ru.

Sputnik este un motor național de căutare și un portal de internet.

Creat de Rostelecom. Momentan in faza de testare.

Pagina oficială - www.sputnik.ru.

Metabot este un motor de căutare în creștere.

Sarcinile Metabot sunt de a crea un motor de căutare pentru toate celelalte motoare de căutare, creând poziții de rezultate ținând cont de datele din întreaga listă de motoare de căutare. Adică este un motor de căutare pentru motoarele de căutare.

Pagina oficială - www.metabot.ru.

Motorul de căutare a fost suspendat.

Pagina oficială - www.turtle.ru.

KM este un multiportal.

Inițial, site-ul a fost un multiportal cu introducerea ulterioară a unui motor de căutare. Căutarea poate fi efectuată atât în ​​cadrul site-ului, cât și pe toate site-urile RuNet monitorizate.

Pagina oficială - www.km.ru.

Gogo - nu funcționează, redirecționează către un motor de căutare.

Pagina oficială - www.gogo.ru.

Multiportalul rusesc, nu foarte popular, necesită îmbunătățiri. Motorul de căutare include știri, televiziune, jocuri și o hartă.

Pagina oficială - www.zoneru.org.

Motorul de căutare nu funcționează, dezvoltatorii sugerează utilizarea motorului de căutare.