Cele mai comune motoare de căutare de pe World Wide Web. Căutați pe World Wide Web. Sarcini de testare pentru autocontrol

Accesul liber la informație, indiferent de granițe și distanțe, a devenit posibil datorită World Wide Web (WWW, Web) - un depozit global de informații care există pe baza tehnică a Internetului. Poate că ai deja experiență cu WWW.

WWW sau World Wide Web:

  • este un ansamblu de resurse informaționale organizate într-un singur întreg;
  • integrează numeroase resurse găzduite pe computere din întreaga lume;
  • este organizat în așa fel încât resursele informaționale să fie prezentate în ea nu într-o succesiune liniară, ci să fie prevăzute cu legături (hiperlinkuri) care indică clar posibile tranziții, legături între resurse.

World Wide Web este un depozit de informații puternic; cantitatea de informații conținute în acesta nu poate fi măsurată cu acuratețe. WWW conține informații de o natură foarte diferită; acolo gasesti:

  • cel mai cele mai recente știri- politice, economice, culturale, sportive;
  • științifice, tehnice, educaționale și informații generale absolut orice fel;
  • publicitate pentru diverse bunuri si servicii;
  • Resurse pentru agrement și divertisment - cărți, muzică, filme, jocuri și multe altele.

Oricine are acces la Internet își poate posta informațiile online. Întreaga lume va avea acces la aceste informații.

Informațiile de pe WWW sunt organizate sub formă de pagini (pagini Web). La rândul lor, paginile pot fi combinate în componente mai mari - site-uri („site” în engleză - un loc, un site). Un site Web este un set de pagini Web legate de conținut. Agențiile guvernamentale, organizațiile publice, întreprinderile, firmele și companiile, muzeele și bibliotecile, ziarele, instituțiile de învățământ, inclusiv multe școli, au site-uri web.

Fiecare site si fiecare pagina are propria adresa unde pot fi accesate. Site-urile web variază foarte mult ca design, dar cel mai adesea au o structură similară. Fiecare site are pagina principala, care este similar cu pagina de cuprins dintr-o carte. În textele postate pe paginile site-urilor pot fi evidențiate cuvinte cheie - hyperlink-uri din care merg hyperlink-urile. Sunt evidențiate cu culoare sau subliniere. Făcând clic pe un astfel de cuvânt, trecem la vizualizarea unui alt document, iar acest document poate fi localizat pe alt computer, într-o altă țară, pe alt continent. Nu numai textul poate fi folosit ca hyperlink, ci și orice imagine grafică. Această organizare a informației se numește hipertext.

Pentru a muta utilizatorul pe ajutorul „web”. programe speciale( Browsere web, engleză „browse”, „inspect”, „study”, Fig. 1.12).

Orez. 1.12.
Sigle ale celor mai comune browsere - Mozilla Firefox și Internet Explorer

La prima vedere, World Wide Web poate fi gândit ca o bibliotecă în care cărțile sunt aranjate fără ordine aparentă: nu există sistem unificat cataloage, fără bibliotecari. În același timp, vizitatorii „bibliotecii” la discreția lor adaugă noi volume sau le iau irevocabil. Pentru a extrage Informatii utile de pe World Wide Web, trebuie să știți unde și cum să căutați, aveți nevoie de experiență în munca de căutare.

Căutare documentul solicitat WWW-ul are loc prin browser în mai multe moduri:

  • prin precizarea adresei documentului;
  • prin deplasarea de-a lungul rețelei de hyperlinkuri;
  • prin utilizarea motoarelor de căutare.

1.6.2. Motoare de căutare

Toate sistemele de recuperare a informațiilor de pe World Wide Web sunt amplasate pe computere special dedicate, cu canale de comunicare puternice. În fiecare zi deservesc un număr mare de clienți.

Acțiunea motoarelor de căutare se bazează pe studiul constant și consecvent al tuturor paginilor tuturor site-urilor de pe World Wide Web. Pentru fiecare document, imaginea de căutare este compilată - un set de cuvinte cheie care reflectă conținutul acestui document. Datorită actualizării constante a informațiilor motoare de căutare reveniți periodic la paginile explorate anterior pentru a detecta și înregistra modificările. Informațiile despre cuvintele cheie ale paginilor explorate în acest fel sunt stocate în motorul de căutare.

Atunci când se primește o solicitare de la utilizator, motorul de căutare, pe baza informațiilor disponibile în acesta, formează o listă de pagini care corespund criteriilor de căutare. Documentele găsite sunt de obicei ordonate în funcție de locația cuvintelor cheie (în titlu, la începutul textului), frecvența de apariție a acestora în text și alte caracteristici.

Există multe motoare de căutare. În ciuda principiului general de funcționare, motoarele de căutare diferă în limbajele de interogare, zonele de căutare, adâncimea căutării în cadrul unui document, metodele de ordonare a informațiilor și alte caracteristici. Cel mai popular motor de căutare din lume este Google. Cele mai mari motoare de căutare interne sunt Yandex, Rambler.

Adresa: www.google.com

Cel mai rapid și cel mai mare motor de căutare. Conține informații pe mai mult de un miliard și jumătate de pagini. Există o alegere de limbă. Evaluează popularitatea unei resurse în funcție de numărul de link-uri care duc la ea din alte pagini.

Adresa: www.yandex.ru

Motor de căutare puternic intern. Oferă căutare, în principal printre resursele în limba rusă, deși nu este inferior sistemelor străine în ceea ce privește capabilitățile. Efectuează o analiză calitativă a informațiilor, ținând cont de formele de cuvinte ale limbii ruse.

Adresa: http://www.rambler.ru/

Unul dintre primele motoare de căutare rusești. Cu exceptia specificații standard site-ul de căutare are un catalog de rating de resurse.

1.6.3. Termeni de căutare

Când începe o căutare, utilizatorul introduce unul sau mai multe cuvinte cheie și selectează tipul de căutare. Majoritatea motoarelor de căutare au trei tipuri principale de căutări:

  1. căutare după oricare dintre cuvinte - rezultatul căutării este o listă imensă a tuturor paginilor care conțin cel puțin unul dintre cuvintele cheie; poate fi folosit atunci când utilizatorul nu este sigur de cuvintele cheie;
  2. căutare după toate cuvintele - în acest mod de căutare, se formează o listă a tuturor paginilor, care conține toate cuvintele cheie în orice ordine;
  3. căutare exactă a expresiei - ca rezultat al căutării, este compilată o listă cu toate paginile care conțin o expresie care se potrivește exact cu expresia cheie (semnele de punctuație sunt ignorate).

Dacă sunt găsite prea multe pagini, puteți adăuga încă una cuvânt cheie si repeta cautarea. Pentru a face acest lucru, multe motoare de căutare au o funcție de căutare printre cele găsite. De asemenea, puteți intra termeni de căutare folosind conexiuni logice similare ca înțeles cu uniunile „și”, „sau” și particula „nu” din limba rusă (Fig. 1.13).

Orez. 1.13.
Utilizarea conectivelor logice în interogările de căutare

Semnificația conectivelor logice devine mai ușor de înțeles dacă sunt ilustrate folosind o diagramă grafică - cercuri Euler. Să ne imaginăm seturile de documente care conțin cuvintele cheie „canari”, „cideliți” ca două cercuri pe plan, pe care le vom plasa în interiorul cercului înfățișând toate documentele WWW. Apoi seturile de documente care se potrivesc cu interogările noastre (vezi Figura 1.13) vor fi reprezentate de zonele completate din Figura 1-13. 1.14.

Orez. 1.14.
Interpretarea grafică a conectivului logic:
se potrivește: a) interogarea „canari & carduelis”, b) interogarea „canari | carduelis", c) interogare "~ canari & carduelis", d) interogare "~ (canari | carduelis)"

Dacă, în urma căutării, nu ați găsit niciun document adecvat, trebuie să:

  • verificați ortografia cuvintelor cheie;
  • verificați utilizarea corectă a conectivelor logice;
  • alege sinonime mai bune;
  • schimba logica cererii.

1.6.4. Adrese World Wide Web utile

Cel mai important

Accesul liber la informație, indiferent de granițe și distanțe, a devenit posibil datorită World Wide Web (WWW, Web, World Wide Web) - un depozit de informații la nivel mondial care există pe baza tehnică a Internetului.

Pentru a muta utilizatorul pe „web” ajută programele speciale numite browsere. Căutarea documentului dorit în WWW poate avea loc: prin specificarea adresei documentului; prin deplasarea de-a lungul rețelei de hyperlinkuri; prin utilizarea motoarelor de căutare.

Există multe motoare de căutare. Cele mai multe dintre ele au trei tipuri principale de căutare: pentru oricare dintre cuvinte; în toate cuvintele; exact pe frază.

Întrebări și sarcini


Milioane de site-uri sunt găzduite pe web și multe resurse învechite, gunoaie și publicitate neloială sunt adiacente informațiilor relevante.

Internetul este cea mai democratică sursă de informare. Fiecare își poate plasa propria resursă pe Web și își poate exprima opinia. Acesta este atât un punct forte, cât și o slăbiciune a World Wide Web.

Găsirea informațiilor pe Internet ar fi probabil foarte dificilă dacă nu ar fi create instrumente puternice de căutare: motoare de căutare(motoare de căutare) cataloage de rating(rubricatori), liste tematice de link-uri, enciclopedii onlineȘi dicționare.

Pentru a căuta diverse tipuri de informații, diverse instrumente se dovedesc a fi cele mai eficiente.

Directoare de resurse

Catalogul are structura ierarhica. Secțiunile tematice ale primului nivel definesc cele mai largi subiecte posibile, precum „sport”, „agrement”, „știință”, „cumpărături” etc. Fiecare secțiune poate avea subsecțiuni. Utilizatorul poate specifica zona de interes pentru el, călătorind prin arborele de directoare și restrângând treptat zona de căutare. De exemplu, atunci când căutați informații despre laptopuri, lanțul de căutare poate arăta astfel: Tehnologia de informație-> Calculatoare -> Laptop-uri. După ce a ajuns la subdirectorul dorit, utilizatorul găsește un set de link-uri în el.

De obicei, toate linkurile din director sunt link-uri de profil, deoarece nu programele sunt implicate în compilarea cataloagelor, ci oamenii. Este evident că dacă sunteți în căutarea unor informații generale despre un subiect amplu, atunci este recomandabil să consultați catalogul. Dacă trebuie să găsiți un anumit document, atunci catalogul va fi un instrument de căutare ineficient.

Adesea, cataloagele de resurse sunt, de asemenea, evaluări, de exemplu. Catalogul invită site-urile înregistrate în el să se instaleze pe paginile lor Numărător de vizite, și afișează liste de link-uri către site-uri în funcție de popularitatea acestora (trafic). Popularitatea unei resurse este evaluată de o serie de parametri, inclusiv așa-numitul gazde(număr de vizitatori unici pe zi) și lovituri(număr de vizite pe site pe zi).

Unul dintre cele mai populare cataloage de rating este Rambler's Top 100. (http://top100.rambler.ru/top100/) Este adesea interesant să evaluăm starea resurselor nu întregi rusești, ci regionale pe un anumit subiect. revizuiți resursele web Krasnoyarsk și regiunea, puteți recomanda cataloage-evaluări ale resurselor Krasland (http://www.krasland.ru/) și Stalker (http://www.stalker.internet.ru/).

motoare de căutare

Document relevant- un document al cărui conținut semantic corespunde cerere de informatie. Motoarele de căutare moderne caută în funcție de context, de ex. cuvintele conținute în interogare, ținând cont de variațiile formelor de cuvinte și extinderea interogărilor cu sinonime. Dar computerele nu înțeleg sensul, prin urmare, în lista de răspunsuri la o solicitare, împreună cu documentele relevante pentru solicitarea dvs., le puteți primi și pe cele care nu vă convin în niciun fel.

Este evident că procentul documentelor relevante primite depinde de capacitatea de a emite corect o cerere. Proporția documentelor relevante din lista tuturor celor găsite de motorul de căutare se numește precizie de căutare. Documentele irelevante se numesc zgomot. Dacă toate documentele găsite sunt relevante (fără zgomot), atunci precizia căutării este de 100%. Dacă toate documentele relevante sunt găsite, atunci caracterul complet al căutării este de 100%.

Astfel, calitatea căutării este determinată de doi parametri interdependenți: acuratețea și completitudinea căutării. Creșterea caracterului complet al căutării reduce acuratețea și invers.

Motoarele de căutare pot fi comparate cu un birou de asistență, ai cărui agenți merg prin companii, colectând informații într-o bază de date. La contactarea serviciului, informațiile sunt emise din această bază de date. Datele din baza de date devin depășite, așa că agenții le actualizează periodic. Cu alte cuvinte, Ghișeu de ajutor are doua functii: 1) crearea si actualizarea constanta a datelor in baza de date si 2) cautarea informatiilor in baza de date la cererea clientului.

În mod similar, un motor de căutare este format din două părți: așa-numita robot de căutare(sau păianjen) care traversează serverele Web și construiește o bază de date și motor de căutare link-uri relevante pentru interogarea utilizatorului în baza de date.

Trebuie remarcat faptul că, atunci când procesează o anumită cerere de utilizator, motorul de căutare operează cu o bază de date internă (și nu începe să călătorească pe Web). Deși baza de date a motorului de căutare este actualizată constant, motorul de căutare nu poate indexa toate documentele Web: sunt prea multe dintre ele. Problema completității insuficiente a căutării este nu numai resursele interne limitate ale motorului de căutare, ci și faptul că viteza robotului este limitată, iar numărul de noi documente Web este în continuă creștere.

Cele mai populare motoare de căutare astăzi sunt Google (www.google.com, www.google.ru) și Yandex (www.yandex.ru).

Enciclopedii online și cărți de referință

În unele cazuri, poate fi necesar să găsiți nu doar un document care conține un cuvânt cheie, ci și interpretarea unui anumit cuvânt. Atunci când căutați un termen necunoscut folosind un motor de căutare, riscați să obțineți o serie întreagă de articole în care este folosit acest termen și, în același timp, să nu știți ce înseamnă cu adevărat. O astfel de căutare este efectuată de preferință într-o enciclopedie online.

Una dintre cele mai mari enciclopedii online este resursa "Yandex. Encyclopedia" (http://encycl.yandex.ru/) - acest proiect conține 14 enciclopedii, inclusiv articole din Marea Enciclopedie Sovietică și Enciclopedia Brockhaus și Efron. De cele mari aparține și „Enciclopedia lui Chiril și Metodiu” (http://www.km.ru).

Pe lângă transferul dicționarelor tradiționale în mediul hipertext, proiectele wiki enciclopedice se dezvoltă rapid. Wiki- un site web pentru colectarea și structurarea informațiilor scrise. Se caracterizează prin faptul că toți vizitatorii pot completa și edita informațiile postate pe acesta. http://ru.wikipedia.org/ - Wikipedia în rusă - parte a unui proiect multilingv, al cărui scop este de a crea o enciclopedie completă în toate limbile Pământului.

















Inapoi inainte

Atenţie! Previzualizarea slide-ului are doar scop informativ și este posibil să nu reprezinte întreaga amploare a prezentării. Dacă sunteți interesat acest lucru vă rugăm să descărcați versiunea completă.

Obiective:

  • să înțeleagă principiile de bază ale organizării căutării de informații pe Internet.
  • dezvolta gândirea algoritmică, capacitatea de a evidenția principalul lucru, extinde orizonturile elevilor prin introducerea de termeni noi;
  • formarea abilităților de căutare a informațiilor pe internet;
  • a cultiva o cultură a comunicării: elev-elev, profesor-elev

Sarcini:

  • Familiarizarea cu conceptul de WWW
  • Pagină web, site-ul web
  • Adresarea paginilor de internet
  • Familiaritate cu capacitățile motoarelor de căutare, interogări de căutare.
  • Utilizați căutarea și selecția informațiilor în activități practice și în viața de zi cu zi

Hardware și software: tablă interactivă, proiector, prezentare pentru lecție, carduri - teme, un set de evaluări.

Tip de lecție:învăţarea de materiale noi.

În timpul orelor

I. Moment organizatoric.

II. Actualizare de cunoștințe. Prezentarea noului material.

- Buna baieti. Astăzi vă vom duce într-o călătorie...

Privește cu atenție diapozitivul. Unde crezi că vom merge?

Într-o călătorie prin Internet.

Ecranul arată o reprezentare grafică aproximativă a legăturilor dintre rețelele de Internet. Sunt afișate doar legăturile dintre servere.

Cum arată această imagine? (Spre cerul înstelat, către web.).

Subiectul lecției: „WWW. Călătorie pe World Wide Web”.

Dar înainte de a naviga pe Web, ne vom familiariza cu conceptul de WWW, pagină Web, site Web, browser, motor de căutare și apoi trecem la partea practică: vom lucra cu motoarele de căutare, vom face interogări, vom găsi informațiile necesare și să le aplice în practică.

Ce este Internetul? Internetul este un sistem mondial de rețele de calculatoare interconectate pentru stocarea și transmiterea informațiilor. World Wide Web se bazează pe Internet

WWW - ce înseamnă această abreviere? (World Wide Web, WWW)

World Wide Web (WWW, Web) - NETWORK la nivel mondial(web)

WWW este un depozit global de informații care există pe baza tehnică a INTERNET-ului (la urma urmei, există mai mult de 2 miliarde de utilizatori de Internet)

WWW - unirea a numeroase resurse distribuite în întreaga lume;

WWW este o organizație de resurse de informații furnizate cu hyperlinkuri.

WWW - conține informații de o natură foarte diferită: știri, informații științifice, tehnice, educaționale, publicitate pentru bunuri și servicii, resurse pentru agrement și divertisment, comunicare prin social media, portaluri și forumuri și multe altele. Viaţă omul modern Acum este imposibil de imaginat fără internet.

Oricine poate posta informații online, iar întreaga lume va avea acces la aceste informații!

Informațiile de pe WWW sunt organizate ca pagini web . De exemplu, să deschidem site-ul școlii noastre www.schuv1996.mskobr.ru.

site-ul web - Acestea sunt mai multe pagini Web care sunt interconectate prin conținut. În textele postate pe paginile site-urilor pot fi evidențiate cuvinte cheie - hyperlink-uri.

Este determinată adresa oricărui fișier la scară mondială unificat pointer de resurse - URL. URL-ul este un șir standardizat caractere care indică locația unei resurse, a unui document sau a unei părți a acesteia pe Internet și constă din trei părți.

Structura adresei:

  • nume de protocol pentru accesarea serviciului de internet;
  • Numele serverului care găzduiește resursa și rulează aplicația server Internet Service. Aici vedem adesea abrevierea www;
  • Numele complet fișier care este stocat pe server.
  • www.schuv1996.mskobr.ru.
    1. protocol http://
    2. schuv1996.mskobr.ru - server
    3. știri/ - fișier de pagină

    Un număr imens de documente electronice hipertext stocate pe serverele WWW formează un fel de hiperspațiu de documente între care este posibilă mișcarea.

    Dar programele speciale ajută utilizatorul să navigheze pe „web”. (Browserele web; vizualizare de navigare, studiere)

    Ce browsere cunoașteți?

    Există vreun sistem de stocare a informațiilor pe Internet, este posibil să „te confuzi” pe web? Este haos sau există un fel de sistem, logică?

    Pentru a nu vă încurca, trebuie să știți de unde și cum să extrageți informațiile necesare, aveți nevoie de experiență în munca de căutare. Cum se caută informații:

    • Prin specificarea adresei documentului (wikipedia.org)
    • Prin navigarea printr-un web de hyperlinkuri
    • Prin utilizarea motoarelor de căutare. YANDEX, RAMBLER

    MOTOARE DE CĂUTARE (tehnologie de căutare)

    Toate sistemele de recuperare a informațiilor de pe World Wide Web sunt localizate pe servere speciale. În fiecare zi deservesc un număr mare de clienți. Acțiunea motoarelor de căutare se bazează pe studiul constant și consecvent al tuturor paginilor tuturor site-urilor. Pentru fiecare document, pagină, există un anumit set de cuvinte cheie care reflectă conținutul paginii. Când se primește o interogare, motorul de căutare generează o listă de pagini care corespund criteriilor de căutare. Documentele găsite sunt ordonate în funcție de locația cuvintelor cheie, de frecvența de apariție a acestora în text etc.

    Ce motoare de căutare cunoști? ( GOOGLE, YANDEX, RAMBLER)

    Motoarele de căutare au de obicei trei operatori: „ȘI logic”, „SAU logic” și „NU logic”. Operatorul „ȘI logic” este indicat între cuvintele cheie dacă este necesar să se returneze documente care conțin toate cuvintele căutate. „SAU logic” este folosit atunci când este necesară căutarea documentelor care conțin cel puțin unul dintre cuvintele cheie asociate acestui operator. Operatorul „NU logic” este necesar pentru a exclude din lista documentelor în care există un cuvânt precedat în interogare de acest operator.

    Când începe o căutare, utilizatorul introduce unul sau mai multe cuvinte cheie și selectează tipul de căutare.

    Dacă căutarea este dificilă, încercați să schimbați logica interogării, alegeți sinonime mai bune

    III. Partea practică.

    Elevii sunt împărțiți în micro-grupe.

    1 etapa de lucru

    Sunteți invitat să completați cuvintele încrucișate „Istoria INTERNET-ului” ( Anexa 1), folosind World Wide Web și motoarele de căutare cunoscute de dvs.

    Toată lumea caută răspunsul la prima întrebare a cuvintelor încrucișate, dar pe servere de căutare diferite.

    Să comparăm numărul de linkuri găsite către documente și site-uri pentru aceeași interogare. - Care server de căutare a dat mai multe link-uri?

    Cine a găsit răspunsul la întrebare ridică mâna și completează cuvintele încrucișate pe tabla interactivă inteligentă.Elevii găsesc răspunsul corect și îl notează pe tabla interactivă unde este proiectată prezentarea.În rezultatul lucrării, toate celulele de cuvinte încrucișate sunt umplute.

    Observați ce cuvânt cheie se află în celulele evidențiate? - Internet! Dreapta. – Deci, cu prima etapă a acestei sarcini, ne-am descurcat, lucrând împreună.

    Etapa 2. Munca cu carduri

    Găsiți răspunsuri la următoarele întrebări ( Anexa 2) și salvați-le în folderele dvs. (lucrați în micro-grupuri):

    1) Ce zi este considerată ziua de naștere a Internetului în Rusia și de ce?

    2) Când și unde a fost inventată înghețata plombir?

    3) Unde și când a apărut ciocolata?

    4) Care este cea mai strălucitoare stea de pe cerul nopții?

    5) De ce se numește Marea Neagră „Neagră”?

    6) Care țară este cea mai mică? Dă-i o scurtă descriere.

    7) Când și unde au avut loc primele Jocuri Olimpice? Faceți o scurtă descriere.

    Salvați informațiile ca text și imagini în dosarul dvs.

    Salvați informații din paginile Web descărcate într-o varietate de moduri în folderul desktop:

    • Cum fisier text
    • , pentru a face acest lucru, selectați paragraful din subiectul de căutare din textul de pe pagina Web, copiați-l în clipboard, porniți MS Word, executați comanda „Lipire”, salvați documentul rezultat, închideți MS Word.
    • salvați desenul
    • dintr-o pagină web ca fisier grafic, pentru a face acest lucru, selectați imaginea de pe pagină și faceți clic dreapta pe ea, selectați elementul „Salvare imagine ca...” din meniul contextual, specificați calea, numele fișierului și tipul fișierului (JPG).
    • Salvați un link către o pagină web

    Rezultatele acestui pas ar trebui să fie stocate în folderul cu numele dvs. de familie în folderul Documentele mele.

    IV. Notare. Discutarea rezultatelor lucrării

    Listați site-urile web pe care le-ați vizitat. Vă rugăm să descrieți aceste site-uri. Ce servicii oferă utilizatorului?

    În această etapă, notele sunt acordate pe baza rezultatelor îndeplinirii sarcinilor 1 și 2.

    V. Reflecție.

    Astăzi ne-am „plimbat” pe Internet, ne-am familiarizat cu conceptul de rețea - WWW, am căutat informații despre diverse interogări, am învățat cum să primim corect informații de pe Internet, ne-am familiarizat cu concepte precum browser, adresă URL, căutare motoare

    • Ce ți-a plăcut la lecție? Ce nu ți-a plăcut?
    • Ce a fost nou pentru tine la lecție?

    VI. Teme pentru acasă.

    Găsiți informații pe Internet despre numărul de utilizatori ai celor mai comune motoare de căutare. Când și cum a apărut @?

    CEL MAI IMPORTANT

    Accesul liber la informație, indiferent de granițe și distanțe, a devenit posibil datorită World Wide Weh (WWW, Web, World Wide Web) - un depozit de informații la nivel mondial care există pe baza tehnică a Internetului.

    Pentru a muta utilizatorul pe "web" ajutor special

    programe numite browsere. Căutarea documentului dorit în WW&V se poate efectua: prin specificarea adresei documentului; prin deplasarea de-a lungul rețelei de hyperlinkuri; prin utilizarea motoarelor de căutare.

    Există multe motoare de căutare. Cele mai multe dintre ele au trei tipuri principale de căutare: pentru oricare dintre cuvinte; în toate cuvintele; exact pe frază.

    Întrebări și sarcini

    1. Efectuați o traducere literală a expresiei 4 YWorld Wide Web.

    2. Descrieți organizarea WWW în termeni generali.

    4. Imaginează-ți că textul acestui paragraf este postat pe Web-cafrre. Ce cuvinte din text pot fi alese drept cuvinte cheie pentru a-i transmite cât mai exact sensul? Enumerați până la 10 astfel de cuvinte.

    5. Cunoașteți adresa site-ului școlii dvs.? Ce site-uri ați recomanda să vizitați colegii dvs. de clasă?

    b. Ce browser folosești la școală?

    7. Ce motoare de căutare cunoașteți?

    8. Enumeraţi principalele tipuri de interogări de căutare.

    9. Găsiți informații pe World Wide Web despre numărul de utilizatori ai celor mai comune motoare de căutare.

    Prezentați grafic rezultatele acestor interogări folosind cercuri Euler. Specificați denumirile interogărilor în ordinea crescătoare a numărului de documente pe care motorul de căutare le va găsi pentru fiecare interogare.

    11. Căutați pe World Wide Web răspunsuri la următoarele întrebări.

    Cine este Norbert Wiener și care este rolul său în studiul proceselor informaționale?

    Cine este Claude Shannon și de ce este celebru?



    De către cine și când a fost inventat termenul „hipertext”?

    Cine este considerat inventatorul WYVW și când s-a întâmplat?

    Cine este Euler, după cine poartă numele schema grafica ilustrând relațiile dintre mulțimi?


    Sarcini de testare pentru autocontrol

    1. Care dintre următoarele afirmații dezvăluie cel mai corect sensul conceptului de „informație” din punct de vedere cotidian?

    a) o succesiune de caractere ale unui alfabet

    b) fondul de carte al bibliotecii

    c) informații despre lumea înconjurătoare și despre procesele care au loc în ea, percepute de o persoană direct sau cu ajutorul unor dispozitive speciale


    d) informații cuprinse în teoriile științifice

    2. Semnal de apel continuu:

    c) purtare informații text

    d) purtând orice informație Z. Un semnal se numește discret:

    a) luând un număr finit de valori determinate

    b) în continuă schimbare în timp

    c) care poate fi decodificat

    d) purtarea unor informaţii aci Yu

    4. Informațiile care nu depind de opinia sau judecata personală se numesc:

    a) de înțeles

    b) la zi

    B) obiectiv

    d) util

    5. Material informativ și important în în prezent sunt numite:

    a) util

    b) la zi

    c) de încredere

    d) obiectiv

    b. În funcție de modul de percepție al unei persoane, se disting următoarele tipuri de informații:

    a) textuale, numerice, grafice, tabulare etc.

    b) științifice, sociale, politice, economice, religioase etc.

    c) obişnuit, de producţie, tehnic, managerial

    7. Se știe că o persoană sănătoasă din punct de vedere fizic primește cea mai mare cantitate de informații cu ajutorul:


    a) organele auzului

    b) organele vederii

    c) organele tactile

    d) organe olfactive

    e) papilele gustative

    8. Precizați obiectul „extra” în termeni de acord asupra semnificației semnelor utilizate:



    b) indicatoare rutiere

    d) semne muzicale

    9. Specificați obiectul „extra” în ceea ce privește tipul de scriere:

    a) rusă

    b) Limba engleză

    V) chinez

    d) franceza

    10. Limbile formale includ:

    a) rusă

    b) latină

    c) Chineză

    d) franceza

    11. După forma de prezentare, informațiile pot fi împărțite condiționat în următoarele tipuri:

    a) matematice, biologice, medicale, psihologice etc.

    b) semn și figurat

    c) obișnuit, științific, industrial, managerial

    d) vizuale, auditive, tactile, olfactive, gustative

    12. Discretizarea informațiilor este:

    a) un proces fizic care se modifică în timp

    b) caracteristica cantitativă a semnalului

    c) procesul de conversie a informațiilor dintr-o formă continuă în una discretă d) procesul de conversie a informațiilor dintr-o formă discretă într-una continuă

    13. Dați cel mai complet răspuns.

    Determinați ce set de litere este codificat de șirul binar 0110100011000.

    a) EBCEA b) BDDEA c) CG) CEA d) EBAEA

    16. Tabla de șah este formată din 8 coloane și 8 rânduri. Care este numărul minim de biți necesar pentru a codifica coordonatele unui câmp de șah?

    17. Pe ce linie sunt dispuse în ordine crescătoare unitățile de măsură ale informațiilor?

    a) gigabyte, megabyte, kilobyte, octet, bit

    b) bit, byte, megabyte, kilobyte, gigabyte

    c) octet, bit, kilobyte, megabyte, gigabyte

    d) bit, octet, kilobyte, megabyte, gigabyte

    18. Dimensiunea mesajului este de 11 KB. Mesajul conține 11.264 de caractere. Care este puterea alfabetului cu care este scris mesajul?

    a) 64 b) 128 c) 256 d) 512

    19. Dat un text de 600 de caractere. Se știe că simbolurile sunt luate dintr-un tabel de 16 x 32. Definiți volumul de informații text în biți.

    A) 1000 b) 2400 c) 3600 d) 5400

    20.
    Cele două texte conțin același număr de caractere. Primul text este format din caractere alfabetice cu o capacitate de 16, iar al doilea text este format din caractere alfabetice cu o capacitate de 256. De câte ori mai multe informații există în al doilea text decât în ​​primul?

    a) 12 b) 2 c) 24

    21. Procesele informaționale- Acest:

    a) procesele de construcție a clădirilor și structurilor

    b) procese de epurare chimică şi mecanică a apei

    c) procesele de colectare, stocare, prelucrare, căutare și transmitere a informațiilor

    d) procesele de producere a energiei electrice

    22. La purtătorul de informații se obișnuiește să însemne:

    a) linie de comunicare

    b) Internetul

    c) calculator

    d) un obiect material asupra căruia informațiile pot fi fixate într-un fel sau altul

    23. Care linie reprezintă corect schema de transfer de informații?

    a) codificator sursă - receptor "decodor -".

    b) sursă - canal de comunicare „encoder -” - receptor „decodor -”.

    c) interferența codificatorului sursă - „receptor decodor

    d) canal de comunicare decodor sursă -» receptor codificator

    24. Hipertextul este:


    a) text foarte mare

    b) text care poate fi urmat de link-uri

    c) text tastat pe computer

    d) text în care este folosit fontul marime mare

    25. Un motor de căutare NU este:

    d) Yandex

    26. Tabelul prezintă interogări către motorul de căutare. Ce interogare va fi găsită cel mai mare număr paginile corespunzătoare?

    A) reproducere & păstrare & swordtails & somn
    b) conținut și spadasini
    V) (conținut și spadasini) somn
    G) continut & swordtails & somn

    CALCULATORUL CA DISPOZITIV UNIVERSAL DE LUCRU CU INFORMAȚIA

    Milioane de site-uri sunt găzduite pe web și multe resurse învechite, gunoaie și publicitate neloială sunt adiacente informațiilor relevante.

    Internetul este cea mai democratică sursă de informare. Fiecare își poate plasa propria resursă pe Web și își poate exprima opinia. Acesta este atât un punct forte, cât și o slăbiciune a World Wide Web.

    Găsirea informațiilor pe Internet ar fi probabil foarte dificilă dacă nu ar fi create instrumente puternice de căutare: motoare de căutare(motoare de căutare) cataloage de rating(rubricatori), liste tematice de link-uri, enciclopedii și dicționare online.

    Pentru a căuta diverse tipuri de informații, diverse instrumente se dovedesc a fi cele mai eficiente.

    Directoare de resurse

    Directorul are o structură ierarhică. Secțiunile tematice ale primului nivel definesc cele mai largi subiecte posibile, precum „sport”, „agrement”, „știință”, „cumpărături” etc. Fiecare secțiune poate avea subsecțiuni. Utilizatorul poate specifica zona de interes pentru el, călătorind prin arborele de directoare și restrângând treptat zona de căutare. De exemplu, atunci când căutați informații despre laptopuri, lanțul de căutare poate arăta astfel: Tehnologia informației -> Calculatoare -> Laptop. După ce a ajuns la subdirectorul dorit, utilizatorul găsește un set de link-uri în el.

    De obicei, toate linkurile din director sunt link-uri de profil, deoarece nu programele sunt implicate în compilarea cataloagelor, ci oamenii. Este evident că dacă sunteți în căutarea unor informații generale despre un subiect amplu, atunci este recomandabil să consultați catalogul. Dacă trebuie să găsiți un anumit document, atunci catalogul va fi un instrument de căutare ineficient.

    Adesea, cataloagele de resurse sunt, de asemenea, evaluări, de exemplu. Catalogul invită site-urile înregistrate în el să se instaleze pe paginile lor Numărător de vizite, și afișează liste de link-uri către site-uri în funcție de popularitatea acestora (trafic). Popularitatea unei resurse este evaluată de o serie de parametri, inclusiv așa-numitul gazde(număr de vizitatori unici pe zi) și lovituri(număr de vizite pe site pe zi).

    Unul dintre cele mai populare cataloage de rating este Rambler's Top 100. (http://top100.rambler.ru/top100/) Este adesea interesant să evaluăm starea resurselor nu întregi rusești, ci regionale pe un anumit subiect. revizuiți resursele web Krasnoyarsk și regiunea, puteți recomanda cataloage-evaluări ale resurselor Krasland (http://www.krasland.ru/) și Stalker (http://www.stalker.internet.ru/).

    motoare de căutare

    Document relevant- un document al cărui conținut semantic corespunde cerere de informatie. Motoarele de căutare moderne caută în funcție de context, de ex. cuvintele conținute în interogare, ținând cont de variațiile formelor de cuvinte și extinderea interogărilor cu sinonime. Dar computerele nu înțeleg sensul, prin urmare, în lista de răspunsuri la o solicitare, împreună cu documentele relevante pentru solicitarea dvs., le puteți primi și pe cele care nu vă convin în niciun fel.

    Este evident că procentul documentelor relevante primite depinde de capacitatea de a emite corect o cerere. Proporția documentelor relevante din lista tuturor celor găsite de motorul de căutare se numește precizie de căutare. Documentele irelevante se numesc zgomot. Dacă toate documentele găsite sunt relevante (fără zgomot), atunci precizia căutării este de 100%. Dacă toate documentele relevante sunt găsite, atunci caracterul complet al căutării este de 100%.

    Astfel, calitatea căutării este determinată de doi parametri interdependenți: acuratețea și completitudinea căutării. Creșterea caracterului complet al căutării reduce acuratețea și invers.

    Motoarele de căutare pot fi comparate cu un birou de asistență, ai cărui agenți merg prin companii, colectând informații într-o bază de date. La contactarea serviciului, informațiile sunt emise din această bază de date. Datele din baza de date devin depășite, așa că agenții le actualizează periodic. Cu alte cuvinte, help desk are două funcții: 1) crearea și actualizarea constantă a datelor în baza de date și 2) căutarea informațiilor în baza de date la solicitarea clientului.

    În mod similar, un motor de căutare este format din două părți: așa-numita robot de căutare(sau păianjen) care traversează serverele Web și construiește o bază de date și motor de căutare link-uri relevante pentru interogarea utilizatorului în baza de date.

    Trebuie remarcat faptul că, atunci când procesează o anumită cerere de utilizator, motorul de căutare operează cu o bază de date internă (și nu începe să călătorească pe Web). Deși baza de date a motorului de căutare este actualizată constant, motorul de căutare nu poate indexa toate documentele Web: sunt prea multe dintre ele. Problema completității insuficiente a căutării este nu numai resursele interne limitate ale motorului de căutare, ci și faptul că viteza robotului este limitată, iar numărul de noi documente Web este în continuă creștere.

    Cele mai populare motoare de căutare astăzi sunt Google (www.google.com, www.google.ru) și Yandex (www.yandex.ru).

    Enciclopedii online și cărți de referință

    În unele cazuri, poate fi necesar să găsiți nu doar un document care conține un cuvânt cheie, ci și interpretarea unui anumit cuvânt. Atunci când căutați un termen necunoscut folosind un motor de căutare, riscați să obțineți o serie întreagă de articole în care este folosit acest termen și, în același timp, să nu știți ce înseamnă cu adevărat. O astfel de căutare este efectuată de preferință într-o enciclopedie online.

    Una dintre cele mai mari enciclopedii online este resursa "Yandex. Encyclopedia" (http://encycl.yandex.ru/) - acest proiect conține 14 enciclopedii, inclusiv articole din Marea Enciclopedie Sovietică și Enciclopedia Brockhaus și Efron. De cele mari aparține și „Enciclopedia lui Chiril și Metodiu” (http://www.km.ru).

    Pe lângă transferul dicționarelor tradiționale în mediul hipertext, proiectele wiki enciclopedice se dezvoltă rapid. Wiki este un site web pentru colectarea și structurarea informațiilor scrise. Se caracterizează prin faptul că toți vizitatorii pot completa și edita informațiile postate pe acesta. http://ru.wikipedia.org/ - Wikipedia în rusă - parte a unui proiect multilingv, al cărui scop este de a crea o enciclopedie completă în toate limbile Pământului.

    Istoria World Wide Web

    Inventatorii World Wide Web sunt Sir Timothy John Berners-Lee(n. 8 iunie 1955) și, într-o măsură mai mică, Robert Cayo. Tim Berners-Lee este un autor de tehnologie HTTP, URI/URL și HTML. În 1980, a lucrat pentru Consiliul European pentru Cercetare Nucleară (în franceză: Conseil Européen pour la Recherche Nucléaire, CERN) ca consultant pe software. Acolo, la Geneva (Elveția), a scris programul Inquire pentru propriile nevoi, care a pus bazele conceptuale pentru World Wide Web.

    ÎN 1989În timp ce lucra la CERN pe intranetul organizației, Tim Berners-Lee a propus proiectul global de hipertext cunoscut acum sub numele de World Wide Web.

    Ca parte a proiectului, Berners-Lee a scris primul server web din lume și primul browser web hipertext din lume, numit „WorldWideWeb”.

    Berners-Lee a creat primul site web din lume la http://info.cern.ch/, site-ul este acum arhivat. Acest site este online 6 august 1991. Acest site a descris ce este World Wide Web, cum se instalează un server web, cum se utilizează un browser. Acest site a fost și primul director de internet din lume, deoarece Tim Berners-Lee a găzduit și a menținut mai târziu o listă de link-uri către alte site-uri de acolo.

    Dar inca baza teoretica Web-ul a fost pus mult mai devreme. În 1945, Vanniver Bush a dezvoltat conceptul de „Memex” – mijloace auxiliare de „extindere a memoriei umane”. Memex este un dispozitiv în care o persoană își stochează toate cărțile și înregistrările (și, în mod ideal, toate cunoștințele sale care pot fi descrise în mod formal) și care oferă informațiile necesare cu suficientă rapiditate și flexibilitate. Bush a prezis, de asemenea, o indexare cuprinzătoare a textelor și a resurselor multimedia cu capacitatea de a cautare rapida informatiile necesare. Următorul pas semnificativ către World Wide Web a fost crearea hipertextului (termen inventat de Ted Nelson în 1965).

    Orez. 75. Logo-ul World Wide Web Consortium

    Din 1994, principala activitate de dezvoltare a World Wide Web a preluat Consorțiul World Wide Web, fondată și condusă în continuare de Tim Berners-Lee. W3C este o organizație care dezvoltă și implementează standarde tehnologice pentru Internet și World Wide Web.

    Perspective de dezvoltare

    Conceptul actual al dezvoltării World Wide Web astăzi este crearea unui web semantic (cu sens). Autorul conceptului de web semantică este și Tim Berners-Lee. Web semantic (web semantic)- acesta este un add-on peste World Wide Web existent, care este conceput pentru a face informațiile postate în rețea mai convenabile. de înțeles pentru computere.

    În prezent, computerele joacă un rol destul de limitat în formarea și prelucrarea informațiilor pe Internet. Funcțiile computerelor se reduc în principal la stocarea, afișarea și preluarea informațiilor. În același timp, crearea informațiilor, evaluarea, clasificarea și actualizarea acesteia - toate acestea sunt încă realizate de o persoană. Cum să includeți computerul în aceste procese? Dacă un computer nu poate fi încă învățat să înțeleagă limbajul uman, atunci trebuie folosit un limbaj pe care computerul îl poate înțelege. Adică, în mod ideal, toate informațiile de pe Internet ar trebui să fie plasate în două limbi: într-un limbaj uman pentru o persoană și într-un limbaj informatic pentru înțelegerea unui computer. Web-ul semantic este conceptul de rețea în care fiecare resursă în limbaj uman ar fi furnizată cu o descriere care poate fi înțeleasă de un computer.

    Programele vor putea să găsească ele însele resursele necesare, să proceseze informațiile, să clasifice datele, să identifice relații logice, să tragă concluzii și să ia decizii pe baza acestor concluzii. Dacă este adoptat pe scară largă și implementat bine, Web-ul semantic are potențialul de a revoluționa Internetul.

    Lucrarea fundamentală pe Web-ul semantic este Spinning the Semantic Web: Unleashing the Full Potential of the World Wide Web de Berners-Lee în 2005.

    Sarcini

    1. Prima globală rețea de calculatoare purta numele:

    • bitnet;
    • ARPANet;
    • NSFNet.

    2. Furnizorul de internet este:

    • Organizația furnizorului de servicii de internet;
    • organizație implicată în crearea de site-uri web;
    • dispozitiv periferic folosit pentru a comunica cu un alt computer.

    3. FTP este:

    • client de mail;
    • program de telefonie IP;
    • protocol de transfer de fișiere.

    4. URL-ul paginii web este setat: http://www.sgzt.com/sgzt/archive/content/2005/03/043. Care este numele protocolului pentru accesarea acestuia resursă informațională?

    • sgzt/archive/content/2005/03/043;
    • http;
    • www.sgzt.com.

    5. În care dintre zonele de domeniu de prim nivel date se poate achiziționa Numele domeniului entitateînregistrat pe teritoriul Federației Ruse?

    • .com;
    • în ambele.

    6. Printre intrările date, specificați adresa IP corectă a computerului:

    • 198.15.19.216;
    • 298.15.19.216;
    • 200,6,201,13;
    • http://www.ipc.ru;
    • www.ip-address.com.

    7. Care dintre următoarele adrese de email corect?

    8. Ce este HTML?

    • Unul dintre protocoalele familiei TCP/IP;
    • Limba marcare hipertext document;
    • Limbaj de programare.

    Informații similare.