Cum pot fi codate informațiile. Codificarea informațiilor. Codificarea informațiilor în PC. Codificarea informațiilor text

Departamentul de Educație al orașului Moscova


Instituția de învățământ de stat

Învățământul profesional secundar

Colegiul de Arhitectură și Construcții nr. 7 TSP-2

Raport

Pe tema: "Informatică și TIC"

pe tema: „Sisteme numerice ».

Completat de: student al grupului 11EVM

Numele complet: Vus Ivan Valerievich

verificat:

Profesorul Ovsyannikova A.S.

Moscova - 2011

Reprezentarea datelor în memoria unui computer personal (numere, simboluri, grafică, sunet).

Forma și limbajul prezentării informațiilor

Percepând informațiile cu ajutorul simțurilor, o persoană caută să o fixeze astfel încât să devină de înțeles pentru alții, prezentându-le într-o formă sau alta.

Compozitorul poate cânta o temă muzicală la pian și apoi o poate nota folosind note. Imaginile inspirate de aceeași melodie pot fi întruchipate de poet sub forma unei poezii, coregraful o poate exprima cu un dans, iar artistul o poate exprima într-o pictură.

O persoană își exprimă gândurile sub forma unor propoziții formate din cuvinte. Cuvintele, la rândul lor, sunt compuse din litere. Aceasta este o reprezentare alfabetică a informațiilor.

Forma de prezentare a acelorași informații poate fi diferită. Depinde de obiectivul pe care ti l-ai propus. Găsești operații similare în lecțiile de matematică și fizică atunci când prezinți o soluție sub diferite forme. De exemplu, soluția la problema: „Găsiți valoarea unei expresii matematice ...” poate fi prezentată în formă tabelară sau grafică utilizând mijloace vizuale de prezentare a informațiilor: numere, un tabel, o imagine.

Astfel, informațiile pot fi prezentate sub diferite forme:

  • scrierea semnelor, constând din diverse semne, între care se obișnuiește să se facă distincția
    • simbolic sub formă de text, numere, personaje speciale(de exemplu, textul unui manual);
    • grafic (de exemplu, o hartă geografică);
    • tabular (de exemplu, un tabel pentru înregistrarea cursului unui experiment fizic);
  • sub formă de gesturi sau semnale (de exemplu, semnale de la un controlor de trafic);
  • verbal oral (de exemplu, conversație).

Forma de prezentare a informațiilor este foarte importantă atunci când o transmiteți: dacă o persoană are auz slab, atunci este imposibil să îi transmiteți informații în formă solidă; dacă câinele are un simț al mirosului slab dezvoltat, atunci nu poate funcționa în serviciul de căutare. În momente diferite, oamenii transmiteau informații sub diferite forme folosind: vorbire, fum, tobe, clopote, scriere, telegraf, radio, telefon, fax.

Indiferent de forma de prezentare și metoda de transmitere a informațiilor, acestea sunt transmise întotdeauna folosind un limbaj.

În lecțiile de matematică, folosiți un limbaj special bazat pe numere, semne operatii aritmeticeși relații. Ele alcătuiesc alfabetul limbii matematicii.

În lecțiile de fizică, când luați în considerare un fenomen fizic, utilizați caracteristica a acestui limbaj personaje speciale din care faci formule. Formula este un cuvânt în limbajul fizicii.

În lecțiile de chimie, folosiți și anumite simboluri, semne, combinându-le în „cuvintele” unui anumit limbaj.

Există limbajul surzilor și mutilor, unde simbolurile limbajului sunt anumite semne exprimate prin expresii faciale și mișcări ale mâinilor.

Baza oricărei limbi este alfabetul - un set de caractere (simboluri) definite unic din care este format un mesaj.

Limbile sunt împărțite în naturale (vorbite) și formale. Alfabetul limbii naturale depinde de tradițiile naționale. Limbajele formale se găsesc în domenii speciale ale activității umane (matematică, fizică, chimie etc.). Există aproximativ 10.000 de limbi, dialecte și adverbe diferite în lume. Multe limbi vorbite provin din aceeași limbă. De exemplu, franceza, spaniola, italiana și alte limbi au fost formate din latină.

Codificarea informațiilor

Odată cu apariția limbajului și apoi a sistemelor de semne, posibilitățile de comunicare între oameni s-au extins. Acest lucru a făcut posibilă stocarea ideilor, cunoștințelor acumulate și a oricăror date, transmiterea lor în diferite moduri la distanță și în alte momente - nu numai contemporanilor lor, ci și generațiilor viitoare. Creațiile strămoșilor au supraviețuit până în prezent, care, cu ajutorul diferitelor simboluri, s-au imortalizat pe ei înșiși și faptele lor în monumente și inscripții. Picturile rupestre (petroglifele) sunt încă un mister pentru oamenii de știință. Poate că, în acest fel, oamenii antici au vrut să ia contact cu noi, viitorii locuitori ai planetei și să raporteze evenimentele vieții lor.

Fiecare națiune are propria limbă, formată dintr-un set de caractere (litere): rusă, engleză, japoneză și multe altele. V-ați familiarizat deja cu limbajul matematicii, fizicii, chimiei.

Reprezentarea informațiilor folosind un limbaj este adesea denumită codificare.

Cod- un set de simboluri (simboluri) pentru a reprezenta informații. Codificare- procesul de prezentare a informațiilor sub forma unui cod.

Șoferul transmite un semnal cu un semnal sonor sau faruri intermitente. Codul este prezența sau absența unui bip și, în cazul unei semnalizări luminoase, a clipirii farurilor sau a absenței acestuia.

Vă confruntați cu codificarea informațiilor atunci când traversați drumul conform semnalelor de trafic. Codul determină culorile semaforului - roșu, galben, verde.

Limbajul natural în care oamenii comunică se bazează și pe cod. Numai în acest caz se numește alfabet. Când vorbiți, acest cod este transmis în sunete, când scrieți - cu litere. Aceleași informații pot fi reprezentate folosind coduri diferite. De exemplu, o înregistrare a unei conversații poate fi înregistrată prin intermediul literelor rusești sau a simbolurilor speciale verbale.

Pe măsură ce tehnologia s-a dezvoltat, căi diferite codificarea informațiilor. În a doua jumătate a secolului al XIX-lea, inventatorul american Samuel Morse a inventat un cod uimitor care servește și azi omenirii. Informațiile sunt codificate cu trei „litere”: un semnal lung (liniuță), un semnal scurt (punct) și nici un semnal (pauză) pentru a separa literele. Astfel, codificarea se reduce la utilizarea unui set de caractere dispuse într-o ordine strict definită.

Oamenii au căutat întotdeauna modalități de a face schimb rapid de mesaje. Pentru aceasta s-au trimis mesageri, s-au folosit porumbei purtători. Printre popoare, existau diferite modalități de a notifica despre un pericol iminent: tambur, fum de la focuri, steaguri etc. Cu toate acestea, utilizarea unei astfel de prezentări de informații necesită un acord preliminar cu privire la înțelegerea mesajului primit.

Celebrul om de știință german Gottfried Wilhelm Leibniz a propus în secolul al XVII-lea un unic și sistem simplu reprezentări ale numerelor. „Calculul folosind două ... este fundamental pentru știință și generează noi descoperiri ... atunci când reducem numerele la cele mai simple începuturi, care sunt 0 și 1, apare o ordine minunată peste tot”.

Astăzi, acest mod de reprezentare a informațiilor folosind o limbă care conține doar două caractere ale alfabetului - 0 și 1, este utilizat pe scară largă în dispozitive tehnice, inclusiv în computer. Aceste două caractere 0 și 1 sunt numite de obicei cifre binare sau biți (din bitul englezesc - Binary Digit - semn binar).

Inginerii au fost atrași de această metodă de codificare prin simplitatea implementării tehnice - indiferent dacă există sau nu un semnal. Orice mesaj poate fi codat cu aceste două numere.

Unitatea mai mare pentru măsurarea cantității de informații este considerată a fi 1 octet, care constă din 8 biți.

De asemenea, este obișnuit să utilizați unități mai mari pentru măsurarea cantității de informații. Numărul 1024 (2 10) este un multiplicator atunci când se trece la o unitate de măsură mai mare.

Codificarea informațiilor într-un computer

Toate informațiile pe care le prelucrează un computer trebuie să fie reprezentate printr-un cod binar folosind două cifre - 0 și 1. Aceste două caractere sunt numite de obicei cifre binare sau biți. Orice mesaj poate fi codat cu două cifre 1 și 0. Acesta a fost motivul pentru care două procese importante trebuie organizate în computer:

  • codificarea, care este furnizată de dispozitivele de intrare la conversia informațiilor de intrare într-o formă percepută de un computer, adică într-un cod binar;
  • decodare, care este furnizată de dispozitivele de ieșire la conversia datelor dintr-un cod binar într-o formă care poate fi înțeleasă de o persoană.

Din punctul de vedere al implementării tehnice, utilizarea sistemului de numere binare pentru codificarea informațiilor s-a dovedit a fi multă
mai ușor decât utilizarea altor metode. Într-adevăr, este convenabil să codificați informațiile sub forma unei secvențe de zerouri și unii dacă aceste valori sunt prezentate ca două stări stabile posibile ale unui element electronic:

  • 0 - fără semnal electric sau semnalul are nivel scăzut;
  • 1 - prezența unui semnal sau semnalul este ridicat.

Aceste stări sunt ușor de distins. Dezavantajul codării binare este codurile lungi. Dar în tehnologie este mai ușor să te descurci cu un număr mare elemente simple decât cu un pic complicat.

Dumneavoastră și în viața de zi cu zi trebuie să aveți de-a face cu un dispozitiv în fiecare zi care poate fi doar în două stări stabile: pornit / oprit. Desigur, acesta este un comutator bine-cunoscut. Dar s-a dovedit imposibil să vină cu un comutator care să poată trece stabil și rapid la oricare dintre cele 10 state. Drept urmare, după o serie de încercări nereușite, dezvoltatorii au ajuns la concluzia că era imposibil să construiască un computer bazat pe sistemul numeric zecimal. Și sistemul de numere binare a stat la baza reprezentării numerelor într-un computer.

În prezent, există diferite moduri de codificare și decodare binară a informațiilor într-un computer. În primul rând, depinde de tipul de informație, și anume de ceea ce ar trebui codificat: text, numere, imagini grafice sau sunet. În plus, la codificarea numerelor, un rol important îl joacă modul în care vor fi utilizate: în text, în calcule sau în procesul de I / O. Particularitățile implementării tehnice sunt, de asemenea, suprapuse.

Codificare numerică

Sistem numeric - un set de tehnici și reguli pentru scrierea numerelor folosind un set specific de caractere.

Pentru a scrie numere, pot fi utilizate nu numai cifre, ci și litere (de exemplu, scrierea cifrelor romane - XXI). Același număr poate fi reprezentat diferit în diferite sisteme numerice.

În funcție de metoda de afișare a numerelor, sistemele numerice sunt împărțite în pozițional și non-pozițional.

V sistemul de poziție calculând, valoarea cantitativă a fiecărei cifre a unui număr depinde de locul în care (poziția sau cifra) este scrisă una sau alta cifră a acestui număr. De exemplu, schimbând poziția cifrei 2 în sistemul zecimal, puteți scrie numere zecimale de diferite dimensiuni, de exemplu 2; douăzeci; 2000; 0,02 etc.

Într-un sistem numeric nepozițional, numerele nu își modifică valoarea cantitativă atunci când se schimbă locația (poziția) lor în număr. Un exemplu de sistem non-pozițional este sistemul roman, în care, indiferent de locație, același simbol are același sens (de exemplu, simbolul X în XXV).

Numărul diferitelor simboluri utilizate pentru a reprezenta un număr în sistemul numeric pozițional se numește sistemul numeric de bază.

În computer, cel mai potrivit și mai fiabil a fost sistemul de numere binare, în care secvențele numerelor 0 și 1 sunt utilizate pentru a reprezenta numerele.

În plus, pentru a lucra cu memoria computerului, sa dovedit a fi convenabil să se utilizeze reprezentarea informațiilor folosind încă două sisteme numerice:

  • octal (orice număr este reprezentat folosind opt cifre - 0, 1, 2 ... 7);
  • hexazecimal (caractere-numere utilizate - 0, 1, 2 ... 9 și litere - A, B, C, D, E, F, înlocuind numerele 10, 11, 12, 13, 14, 15, respectiv).

Codificarea informațiilor despre caracter

Apăsarea unei taste alfanumerice de pe tastatură trimite un semnal către computer ca număr binar reprezentând una dintre valorile din tabelul de coduri. Un tabel de coduri reprezintă reprezentarea internă a caracterelor într-un computer. În toată lumea, tabelul ASCII (American Standard Code for Informational Interchange) este acceptat ca standard.

Pentru a stoca codul binar de un caracter, este alocat 1 octet = 8 biți. Având în vedere că fiecare bit ia valoarea 1 sau 0, numărul combinațiilor posibile de unii și zerouri este 2 8 = 256.

Aceasta înseamnă că, cu ajutorul unui octet, puteți obține 256 de combinații de coduri binare diferite și puteți afișa 256 de simboluri diferite cu ajutorul lor. Aceste coduri alcătuiesc tabelul ASCII.

De exemplu, când apăsați tasta cu litera S, codul 01010011 este scris în memoria computerului. Când litera S este afișată pe ecran, computerul efectuează decodarea - pe baza acestui cod binar, o imagine a simbolului este construit.

SUN - 01010011 010101101 01001110

Standardul ASCII codifică primele 128 de caractere de la 0 la 127: cifre, litere ale alfabetului latin, caractere de control. Primele 32 de caractere sunt caractere de control și sunt destinate în principal transmiterii comenzilor de control. Scopul lor poate varia în funcție de software și hardware. A doua jumătate a tabelului de coduri (de la 128 la 255) nu este definită de standardul american și este destinată simbolurilor alfabetelor naționale, pseudografice și unele simboluri matematice. Diferite țări pot utiliza versiuni diferite ale celei de-a doua jumătăți a tabelului de coduri.

Notă! Numerele sunt codificate conform standardului ASCII și sunt înregistrate în două cazuri - în timpul intrării-ieșirii și când sunt întâlnite în text. Dacă numerele sunt implicate în calcule, atunci ele sunt convertite într-un alt cod binar.

Pentru comparație, luați în considerare numărul 45 pentru două opțiuni de codare.

Atunci când este utilizat în text, acest număr va necesita 2 octeți pentru reprezentarea sa, deoarece fiecare cifră va fi reprezentată de propriul cod în conformitate cu tabelul ASCII. În sistemul binar - 00110100 00110101.

Atunci când este utilizat în calcule, codul acestui număr va fi obținut conform regulilor speciale de traducere și reprezentat ca un număr binar pe 8 biți 00101101, care va necesita 1 octet.

Unul dintre principalele avantaje ale unui computer este că este o mașină uimitor de versatilă. Oricine a întâlnit-o vreodată știe că a face calcule aritmetice nu este deloc principala metodă de utilizare a unui computer. Computerele reproduc perfect muzică și filme video, cu ajutorul lor este posibilă organizarea de conferințe vocale și video pe Internet, crearea și procesarea imaginilor grafice, iar posibilitatea de a utiliza un computer în domeniul jocurilor pe computer la prima vedere pare complet incompatibilă cu imaginea unui superaritmometru, care macină sute de milioane de cifre pe secundă.

Atunci când alcătuim un model informațional al unui obiect sau fenomen, trebuie să fim de acord asupra modului de a înțelege anumite denumiri. Adică să fie de acord asupra tipului de prezentare a informațiilor.

O persoană își exprimă gândurile sub forma unor propoziții formate din cuvinte. Sunt o reprezentare alfabetică a informațiilor. Baza oricărei limbi este un alfabet - un set finit de diverse semne (simboluri) de orice natură, din care este compus un mesaj.

Una și aceeași intrare poate avea semnificații diferite. De exemplu, un set de numere 251299 poate însemna: masa unui obiect; lungimea obiectului; distanța dintre obiecte; număr de telefon; data înregistrării 25 decembrie 1999.

Pentru a reprezenta informații, pot fi folosite diferite coduri și, în consecință, trebuie să cunoașteți anumite reguli - legile scrierii acestor coduri, adică să poată codifica.

Cod - un set de simboluri pentru prezentarea informațiilor.

Codificare - procesul de prezentare a informațiilor sub forma unui cod.

Pentru a comunica între noi, folosim un cod - rusă. Când vorbiți, acest cod este transmis în sunete, când scrieți - cu litere. Șoferul transmite un semnal cu un semnal sonor sau faruri intermitente. Vă confruntați cu codificarea informațiilor atunci când traversați drumul sub formă de semnale de trafic. Astfel, codificarea se reduce la utilizarea unei colecții de caractere conform unor reguli strict definite.

Informațiile pot fi codate în diferite moduri: oral; în scris; gesturi sau semnale de orice altă natură.

Codificarea binară a datelor.

Pe măsură ce tehnologia s-a dezvoltat, au apărut diferite moduri de codificare a informațiilor. În a doua jumătate a secolului al XIX-lea, inventatorul american Samuel Morse a inventat un cod uimitor care servește și azi omenirii. Informațiile sunt codificate cu trei caractere: semnal lung (liniuță), semnal scurt (punct), fără semnal (pauză) - pentru a separa literele.

Sistemul propriu există și în calcul - se numește codare binarăși se bazează pe reprezentarea datelor printr-o succesiune de doar două caractere: 0 și 1. Aceste caractere se numesc cifre binare, în engleză - cifră binară sau bit abreviat (bit).

Un bit poate exprima două concepte: 0 sau 1 ( da sau Nu, negru sau alb, Adevărat sau Minciuna etc.). Dacă numărul de biți este mărit la doi, atunci pot fi deja exprimate patru concepte diferite:

Trei biți pot codifica opt valori diferite:

000 001 010 011 100 101 110 111

Prin creșterea numărului de biți din sistemul de codare binar cu unul, dublăm numărul de valori care pot fi exprimate în acest sistem, adică formula generală este:

unde N este numărul de valori codificate independente;

m - lățimea de biți a codării binare, adoptată în acest sistem.

În informatică număr mare procesele de informare trece folosind codificarea datelor... Prin urmare, înțelegerea acestui proces este foarte importantă atunci când înțelegeți elementele de bază ale acestei științe. Codificarea informațiilor este înțeleasă ca procesul de conversie a caracterelor scrise în diferite limbi naturale (rusă, Engleză etc.) în notație digitală.

Aceasta înseamnă că la codificarea textului, fiecărui caracter i se atribuie o valoare specifică sub formă de zerouri și unii -.

De ce codificați informațiile?

În primul rând, trebuie să răspundeți la întrebare de ce codificați informațiile? Faptul este că un computer este capabil să proceseze și să stocheze un singur tip de reprezentare a datelor - digital. Prin urmare, orice informații incluse în acesta trebuie traduse în vedere digitală.

Standarde de codificare a textului

Pentru ca toate computerele să poată înțelege fără echivoc acest text sau altul, este necesar să se utilizeze în general acceptate standarde de codare a textului... În alte cazuri, va fi necesară transcodarea suplimentară sau incompatibilitatea datelor.



ASCII

Primul standard computerizat pentru codificarea caracterelor a fost ASCII (nume complet - American Standard Code for Information Interchange). Doar 7 biți au fost folosiți pentru a codifica orice caracter. După cum vă amintiți, doar 27 de caractere sau 128 de caractere pot fi codate folosind 7 biți. Acest lucru este suficient pentru a codifica literele mari și mici ale alfabetului latin, cifrele arabe, semnele de punctuație, precum și un anumit set de caractere speciale, de exemplu, semnul dolar - „$”. Cu toate acestea, pentru a codifica caracterele alfabetelor altor popoare (inclusiv caracterele alfabetului rus), a fost necesar să se completeze codul la 8 biți (28 = 256 de caractere). În același timp, a fost utilizată o codificare separată pentru fiecare limbă.

UNICOD

A fost necesar să se salveze situația din punct de vedere al compatibilității tabele de codificare... Prin urmare, de-a lungul timpului, au fost dezvoltate standarde noi și actualizate. În prezent, se numește cea mai populară codificare UNICOD... În ea, fiecare caracter este codificat folosind 2 octeți, ceea ce corespunde la 216 = 62536 coduri diferite.



Standarde de codificare grafică

Este nevoie de mult mai mulți octeți pentru a codifica o imagine decât pentru a codifica caractere. Majoritatea imaginilor create și procesate stocate în memoria computerului sunt împărțite în două grupe principale:

Grafică raster

În grafica raster, o imagine este reprezentată de un set de puncte colorate. Astfel de puncte se numesc pixeli. Când imaginea este mărită, astfel de puncte se transformă în pătrate.


Pentru a codifica o imagine alb-negru, fiecare pixel este codat cu un bit. De exemplu, negru este 0 și alb este 1)


Imaginea noastră din trecut poate fi codificată astfel:

La codificarea imaginilor fără culoare, cel mai des se folosește o paletă de 256 de nuanțe de gri, de la alb la negru. Prin urmare, pentru a codifica o astfel de gradație, este suficient un octet (28 = 256).


În codificarea imaginilor color sunt utilizate mai multe scheme de culori.




În practică, se folosesc deseori Model de culoare RGB, unde sunt folosite respectiv trei culori primare: roșu, verde și albastru. Restul nuanțelor de culoare sunt obținute prin amestecarea acestor culori primare.


Deci, pentru a codifica modelul din trei culoriîn 256 de tonuri, se obțin peste 16,5 milioane de nuanțe de culoare diferite. Adică, 3⋅8 = 24 de biți sunt folosiți pentru codificare, ceea ce corespunde la 3 octeți.


Bineînțeles, numărul minim de biți poate fi utilizat pentru codificarea imaginilor color, dar apoi pot fi generate mai puține tonuri de culoare și, prin urmare, calitatea imaginii va fi redusă semnificativ.


Pentru a determina dimensiunea imaginii, trebuie să înmulțiți numărul de pixeli în lățime cu lungimea numărului de pixeli și să înmulțiți din nou cu dimensiunea pixelului în octeți.


  • A- numărul de pixeli în lățime;
  • b- numărul de pixeli în lungime;
  • Eu- dimensiunea unui pixel în octeți.

De exemplu, o imagine color de 800-600 pixeli ocupă 60.000 octeți.

Grafică vectorială

Obiectele grafice vectoriale sunt codificate într-un mod complet diferit. Aici imaginea este formată din linii, care pot avea proprii coeficienți de curbură.



Standarde de codare audio

Sunetele pe care le aude o persoană sunt vibrații ale aerului. Vibrațiile sonore sunt procesul de propagare a undelor.

Sunetul are două caracteristici principale:

  • amplitudinea vibrațiilor - determină volumul sunetului;
  • frecvența vibrațiilor - determină tonul sunetului.


Sunetul poate fi transformat într-un semnal electric folosind un microfon. Sunetul este codificat la un anumit interval de timp prestabilit. În acest caz, se măsoară dimensiunea semnalului electric și se atribuie o valoare binară. Cu cât sunt efectuate mai des aceste măsurători, cu atât este mai bună calitatea sunetului.




Un disc compact de 700 MB conține aproximativ 80 de minute de sunet de calitate CD.

Standarde de codare video

După cum știți, o secvență video constă din fragmente care se schimbă rapid. Cadrele sunt schimbate la o viteză cuprinsă între 24-60 de cadre pe secundă.

Dimensiunea unei imagini în octeți este determinată de dimensiunea cadrului (numărul de pixeli pe ecran în înălțime și lățime), numărul de culori utilizate și numărul de cadre pe secundă. Dar, odată cu aceasta, poate exista și o pistă audio.

Un computer modern poate procesa informații numerice, textuale, grafice, sonore și video. Toate aceste tipuri de informații dintr-un computer sunt reprezentate în cod binar, adică se folosește un alfabet cu o putere de două caractere (0 și 1). Acest lucru se datorează faptului că este convenabil să se reprezinte informații sub forma unei secvențe de impulsuri electrice: nu există impuls (0), există un impuls (1). O astfel de codare se numește de obicei binară, iar secvențele logice ale zero-urilor și ale celor înseși sunt numite limbaj mașină.

Fiecare cifră a codului binar al mașinii poartă cantitatea de informații egală cu un bit.

Această concluzie poate fi făcută considerând numerele alfabetului mașinii ca evenimente echiprobabile. La scrierea unei cifre binare, este posibil să se realizeze alegerea doar a uneia dintre cele două stări posibile, ceea ce înseamnă că poartă o cantitate de informații egală cu 1 bit. În consecință, două cifre transportă informații 2 biți, patru biți - 4 biți etc. Pentru a determina cantitatea de informații în biți, este suficient să determinați numărul de cifre din codul mașinii binare.

Codificarea informațiilor text

În prezent, majoritatea utilizatorilor care utilizează un computer procesează informații text, care constă din simboluri: litere, cifre, semne de punctuație etc.

Pe baza unei celule cu o capacitate de informație de 1 bit, pot fi codate doar 2 stări diferite. Pentru ca fiecare caracter care poate fi introdus de la tastatură în registrul latin să primească propriul cod binar unic, sunt necesari 7 biți. Pe baza unei secvențe de 7 biți, în conformitate cu formula Hartley, se pot obține N = 2 7 = 128 combinații diferite de zerouri și unele, adică coduri binare. Prin asocierea fiecărui caracter cu codul său binar, obținem un tabel de codificare. O persoană funcționează cu simboluri, un computer - cu codurile sale binare.

Pentru aspectul tastaturii latine, un astfel de tabel de codare este unul pentru întreaga lume, prin urmare, textul tastat folosind aspectul tastaturii latine va fi afișat în mod adecvat pe orice computer. Acest tabel se numește ASCII (American Standard Code of Information Interchange) în engleză pronunțată [eski], în rusă pronunțată [aski]. Mai jos este întregul tabel ASCII, codurile în care sunt indicate în formă zecimală. Poate fi folosit pentru a determina că atunci când introduceți, să zicem, caracterul „*” de la tastatură, computerul îl percepe ca cod 42 (10), la rândul său 42 (10) = 101010 (2) - acesta este codul binar a personajului „*”. Codurile de la 0 la 31 nu sunt utilizate în acest tabel.

Tabel de caractere ASCII

Pentru a codifica un caracter, se folosește o cantitate de informații egală cu 1 octet, adică I = 1 octet = 8 biți. Folosind o formulă care conectează numărul de evenimente posibile K și cantitatea de informații I, puteți calcula câte simboluri diferite pot fi codificate (presupunând că simbolurile sunt evenimente posibile):

K = 2 I = 2 8 = 256,

adică un alfabet cu o capacitate de 256 de caractere poate fi folosit pentru a reprezenta informații textuale.

Esența codării este că fiecărui caracter i se atribuie un cod binar de la 00000000 la 11111111 sau codul zecimal corespunzător de la 0 la 255.

Trebuie amintit că în prezent pentru codificarea literelor rusești, sunt utilizate cinci tabele de coduri diferite(KOI-8, CP1251, CP866, Mac, ISO) și textele codificate folosind un tabel nu vor fi afișate corect într-o altă codificare. Acest lucru poate fi clar reprezentat ca un fragment al tabelului de codificare a caracterelor combinat.

Simboluri diferite sunt atribuite aceluiași cod binar.

Cod binar

Cod zecimal

Cu toate acestea, în majoritatea cazurilor, nu utilizatorului îi pasă de transcodarea documentelor text, ci programe speciale- convertoare care sunt integrate în aplicații.

Din 1997, ultima Versiuni Microsoft Office acceptă noua codificare. Se numește Unicode. Unicode este un codbook care folosește 2 octeți pentru a codifica fiecare caracter, adică 16 biți. Pe baza unui astfel de tabel, se pot codifica N = 2 16 = 65 536 caractere.

Unicode include aproape toate scripturile moderne, inclusiv: arabă, armeană, bengali, birmaneză, greacă, georgiană, devanagari, ebraică, chirilică, coptă, khmeră, latină, tamilă, hangulă, han (China, Japonia, Coreea), cherokee, etiopiană, Japoneze (Katakana, Hiragana, Kanji) și altele.

În scopuri academice, s-au adăugat multe scripturi istorice, inclusiv: greaca veche, hieroglifele egiptene, cuneiformul, scrierea mayașă, alfabetul etrusc.

Unicode oferă o gamă largă de simboluri și pictograme matematice și muzicale.

Pentru caracterele chirilice din Unicode, sunt alocate două game de coduri:

Chirilic (# 0400 - # 04FF)

Supliment chirilic (# 0500 - # 052F).

Dar implementarea tabelei Unicode în forma sa pură este reținută din motivul că, dacă codul unui caracter va ocupa nu un octet, ci doi octeți, că pentru stocarea textului va lua de două ori mai mult spațiu pe disc și pentru transfer pe canale de comunicare - de două ori mai lung.

Prin urmare, în practică, reprezentarea Unicode a UTF-8 (Unicode Transformation Format) este acum mai frecventă. UTF-8 oferă cea mai bună compatibilitate cu sistemele care utilizează caractere pe 8 biți. Textul care conține doar caractere numerotate mai puțin de 128 este convertit în text simplu ASCII atunci când este scris în UTF-8. Restul caracterelor Unicode sunt reprezentate prin secvențe de 2 până la 4 octeți în lungime. În general, deoarece cele mai comune caractere din lume - caracterele alfabetului latin - în UTF-8 ocupă încă 1 octet, această codificare este mai economică decât Unicode pur.

Pentru a determina codul de caractere numerice, puteți utiliza fie tabelul de coduri. Pentru aceasta, selectați elementul „Insert” - „Symbol” din meniu, după care apare pe ecran caseta de dialog Symbol. Tabelul de simboluri pentru fontul selectat apare în caseta de dialog. Caracterele din acest tabel sunt aranjate rând cu rând, secvențial de la stânga la dreapta, începând cu caracterul Spațiu.

Ne-am familiarizat cu sistemele numerice - modalități de codificare a numerelor. Numerele oferă informații despre numărul de articole. Aceste informații trebuie codificate, reprezentate într-un fel de sistem numeric. Care dintre metodele cunoscute de ales depinde de problema rezolvată.
Până de curând, computerele prelucrau în principal informații numerice și textuale. Dar o persoană primește majoritatea informațiilor despre lumea exterioară sub formă de imagini și sunete. În acest caz, imaginea este mai importantă. Amintiți-vă proverbul: „Este mai bine să vezi o dată decât să auzi de o sută de ori”. Prin urmare, astăzi computerele încep să lucreze din ce în ce mai activ cu imagini și sunet. Cu siguranță vom lua în considerare metodele de codificare a acestor informații.

Codificare binară a informațiilor numerice și text.

Orice informație este codificată într-un computer folosind secvențe de două cifre - 0 și 1. Computerul stochează și procesează informații sub forma unei combinații de semnale electrice: tensiunea 0,4 V-0,6 V corespunde zero logic și tensiunea 2,4 V-2,7 V corespunde unității logice. Se numesc secvențe de 0 și 1 coduri binare , iar numerele 0 și 1 sunt biți (în cifre binare). Această codificare a informațiilor de pe un computer se numește codare binară ... Astfel, codarea binară codifică cu numărul minim posibil de simboluri elementare, codificând cel mai mult prin mijloace simple... De aceea este remarcabil din punct de vedere teoretic.
Codificarea binară a informațiilor îi atrage pe ingineri, deoarece este ușor de implementat tehnic. Circuite electronice pentru a procesa codurile binare, acestea trebuie să fie în una din cele două stări: există semnal / fără semnal sau înaltă tensiune / joasă tensiune .
Calculatoarele din munca lor funcționează cu numere reale și întregi, reprezentate sub forma a doi, patru, opt și chiar zece octeți. Pentru a reprezenta semnul unui număr la numărare, un supliment semnează rangul , care de obicei vine înaintea cifrelor numerice. Pentru numerele pozitive, bitul semnat este 0, iar pentru numerele negative - 1. Pentru a scrie reprezentarea internă a unui întreg negativ (-N), trebuie să:
1) obțineți codul suplimentar al numărului N înlocuind 0 cu 1 și 1 cu 0;
2) adăugați 1 la numărul rezultat.

Deoarece un octet nu este suficient pentru a reprezenta acest număr, este reprezentat ca 2 octeți sau 16 biți, codul său complementar este 1111101111000101, deci -1082 = 1111101111000110.
Dacă un PC ar putea gestiona doar octeți unici, nu ar fi de mare folos. În realitate, PC-ul funcționează cu numere scrise în doi, patru, opt și chiar zece octeți.
Începând cu sfârșitul anilor 1960, computerele au fost utilizate din ce în ce mai mult pentru procesarea informațiilor textuale. Pentru a reprezenta informații textuale, se folosesc de obicei 256 de caractere diferite, de exemplu, litere mari și mici ale alfabetului latin, cifre, semne de punctuație etc. În majoritatea computerelor moderne, fiecare caracter corespunde unei secvențe de opt zerouri și unii, numită octet .
Un octet este o combinație de opt biți de zerouri și unii.
La codificarea informațiilor din aceste computere electronice, sunt utilizate 256 de secvențe diferite de 8 zerouri și unele, ceea ce face posibilă codificarea a 256 de caractere. De exemplu, litera rusă capitală „M” are codul 11101101, litera „I” - codul 11101001, litera „P” - codul 11110010. Astfel, cuvântul „LUME” este codificat cu o succesiune de 24 de biți sau 3 octeți: 111011011110100111110010.
Numărul de biți dintr-un mesaj se numește volumul de informații al mesajului. Este interesant!

Inițial, numai alfabetul latin era folosit în computere. Are 26 de litere. Deci cinci impulsuri (biți) ar fi suficiente pentru a desemna fiecare. Dar textul conține semne de punctuație, cifre zecimale etc. Prin urmare, în primele computere vorbitoare de limbă engleză, un octet - o silabă mașină - a inclus șase biți. Apoi șapte - nu numai pentru a distinge literele mari de literele mici, ci și pentru a crește numărul de coduri de control pentru imprimante, lumini de semnalizare și alte echipamente. În 1964, a apărut puternicul IBM-360, în care octetul a devenit în cele din urmă egal cu opt biți. Ultimul opt bit a fost necesar pentru personajele pseudo-grafice.
Atribuirea unui anumit cod binar unui caracter este o chestiune de convenție, care este fixată în tabelul de coduri. Din păcate, există cinci codificări diferite pentru literele rusești, astfel încât textele create într-o codificare nu vor fi reflectate corect în alta.
Cronologic, unul dintre primele standarde pentru codificarea literelor rusești pe computere a fost KOI8 („Cod pentru schimb de informații, 8 biți”). Cea mai comună codificare este codarea chirilică standard a Microsoft Windows, notată prin abrevierea CP1251 („CP” înseamnă „Pagină cod” sau „pagină cod”). Apple a dezvoltat propria codificare a literelor rusești (Mac) pentru computerele Macintosh. Organizația Internațională pentru Standardizare (International Standards Organization, ISO) a aprobat codificarea ISO 8859-5 ca standard pentru limba rusă. În cele din urmă, a apărut un nou standard internațional Unicode, care alocă nu un octet, ci două pentru fiecare caracter și, prin urmare, cu ajutorul acestuia, este posibil să codificați nu 256 de caractere, ci până la 65536.
Toate aceste codificări urmează tabelul de coduri ASCII (American Standard Code for Information Interchange), care codifică 128 de caractere.

Tabel de caractere ASCII:

cod simbol cod simbol cod simbol cod simbol cod simbol cod simbol
32 Spaţiu 48 . 64 @ 80 P 96 " 112 p
33 ! 49 0 65 A 81 Î 97 A 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 tu
38 & 54 5 70 F 86 V 102 f 118 v
39 " 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 X 104 h 120 X
41 ) 57 8 73 Eu 89 Da 105 eu 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 l 124 |
45 - 61 < 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127 DEL

Codarea binară a textului are loc după cum urmează: atunci când este apăsată o tastă, o anumită secvență de impulsuri electrice este transmisă computerului și fiecare caracter corespunde propriei sale secvențe de impulsuri electrice (zerouri și unele pe limbajul mașinii). Programul de tastatură și driver de ecran identifică caracterul prin tabelul de coduri și își creează imaginea pe ecran. Astfel, textele și numerele sunt stocate în memoria computerului în cod binar și programatic sunt convertite în imagini pe ecran.

Codificarea binară a informațiilor grafice.

Din anii 80, tehnologia procesării informațiilor grafice pe un computer s-a dezvoltat rapid. Grafică pe computer Este utilizat pe scară largă în modelarea computerizată în cercetarea științifică, simulatoare pe computer, animație pe computer, grafică de afaceri, jocuri etc.
Informațiile grafice de pe ecranul de afișare sunt prezentate sub forma unei imagini care este formată din puncte (pixeli). Peer la fotografie de ziar, și veți vedea că este format și din cele mai mici puncte. Dacă acestea sunt doar puncte alb-negru, atunci fiecare dintre ele poate fi codat cu 1 bit. Dar dacă există nuanțe în fotografie, atunci doi biți vă permit să codificați 4 nuanțe de puncte: 00 - alb, 01 - gri deschis, 10 - gri închis, 11 - negru. Trei biți vă permit să codificați 8 nuanțe etc.
Numărul de biți necesari pentru codificarea unei nuanțe de culoare se numește adâncime de culoare.

V calculatoare moderne rezoluţie (numărul de puncte de pe ecran), precum și numărul de culori depinde de adaptorul video și pot fi modificate programatic.
Imaginile color pot avea diferite moduri: 16 culori, 256 culori, 65536 culori ( culoare înaltă), 16.777.216 culori ( culoare adevarata). Un punct pentru mod culoare înaltă Sunt necesari 16 biți sau 2 octeți.
Cea mai comună rezoluție a ecranului este de 800 x 600 pixeli. 480.000 de puncte. Să calculăm cantitatea de memorie video necesară pentru modul de culoare înaltă: 2 octeți * 480.000 = 960.000 octeți.
Pentru a măsura cantitatea de informații, sunt utilizate și unități mai mari:


Prin urmare, 960.000 de octeți este aproximativ egal cu 937,5 KB. Dacă o persoană vorbește opt ore pe zi fără pauză, atunci în 70 de ani de viață va vorbi despre 10 gigaocteți de informații (aceasta este de 5 milioane de pagini - un teanc de hârtie înalt de 500 de metri).
Rata de transmisie este numărul de biți transmis pe secundă. Rata de transmisie de 1 bit pe secundă se numește 1 baud.

O bitmap este stocată în memoria video a unui computer, care este un cod binar al unei imagini, de unde este citită de un procesor (de cel puțin 50 de ori pe secundă) și afișată pe ecran.


Codificare binară a informațiilor audio.

De la începutul anilor '90 calculatoare personale am avut ocazia să lucrez cu informații audio. Fiecare computer cu o placă de sunet poate salva ca fișiere ( fișier este o anumită cantitate de informații stocate pe disc și denumite ) și reproduceți informații audio. Prin special instrumente software(editoare de fișiere audio) deschise oportunități ample pentru a crea, edita și asculta fișiere audio. Se creează programe de recunoaștere a vorbirii și devine posibilă controlarea computerului prin voce.
Exact placă de sunet(card) convertește un semnal analogic într-o fonogramă discretă și invers, sunet „digitalizat” - într-un semnal analogic (continuu), care este alimentat la intrarea difuzorului.


La codarea binară a unui semnal audio analogic, semnalul continuu este eșantionat, adică este înlocuit de o serie de eșantioane individuale - eșantioane. Calitatea codificării binare depinde de doi parametri: cantitatea niveluri discrete semnalul și numărul de probe pe secundă. Numărul de eșantioane sau rata de eșantionare în adaptoarele audio este diferită: 11 kHz, 22 kHz, 44,1 kHz etc. Dacă numărul de niveluri este 65536, atunci unul semnal sonor calculat 16 biți (216). Un adaptor audio pe 16 biți codifică și reproduce sunetul mai precis decât un adaptor audio pe 8 biți.
Numărul de biți necesari pentru a codifica un nivel sonor se numește adâncimea sunetului.
Dimensiunea unui fișier mono-audio (în octeți) este determinată de formula:


Cu sunet stereo, volumul fișierului audio se dublează, cu sunet cvadrafonic, cvadruplează.
Pe măsură ce programele devin mai complexe și funcțiile lor cresc, precum și apariția aplicațiilor multimedia, volumul funcțional de programe și date crește. Dacă la mijlocul anilor '80 volumul obișnuit de programe și date era de zeci și doar uneori de sute de kilobyți, atunci la mijlocul anilor '90 a început să se ridice la zeci de megaocteți. În consecință, cantitatea de memorie RAM crește.