Cum este desemnat volumul de informații? Care este puterea alfabetului? Cum să găsești puterea alfabetului: formulă. Unități de dimensiune a fișierului

Scopul lecției:

  1. Aveți o idee despre abordarea alfabetică pentru determinarea cantității de informații;
  2. Cunoașteți formula de determinare a numărului de mesaje informative, a cantității de informații din mesaje;
  3. Să fie capabil să rezolve probleme pentru a determina numărul de mesaje informative și cantitatea de informații pe care o poartă mesajul primit.

În timpul orelor

1. Actualizarea cunoștințelor:

Băieți, să vedem ce vedem în afara ferestrei. Ce poți spune despre natură? (A venit iarna.)
- Dar de ce ai decis că a venit iarna? (E frig, ninge.)
- Dar nicăieri nu este scris că acestea sunt semne de iarnă. (Dar știm ce înseamnă totul: iarna a venit.)

Prin urmare, se dovedește că cunoștințele pe care le extragem din realitatea înconjurătoare este informație. (slide 1)

Încălzire.

Completați tabelul și folosiți săgețile pentru a afișa potrivirile.

Este posibil să măsurați cantitatea de informații și cum să o faceți? (Da)

Se pare că informația poate fi măsurată și cantitatea acesteia.

Există două abordări pentru măsurarea informațiilor. Ne vom întâlni cu unul dintre ei astăzi. (Uită-te la aplicație slide 2)

2. Studierea materialelor noi.

Cum poți găsi cantitatea de informații?

Să ne uităm la un exemplu.

Avem un scurt text scris în limba rusă. Este format din litere ale alfabetului rus, numere și semne de punctuație. Pentru simplitate, vom presupune că caracterele sunt prezente în text cu probabilitate egală.

Setul de caractere folosit în text este numit alfabet.

În informatică, alfabetul înseamnă nu numai litere, ci și numere, semne de punctuație și alte caractere speciale.

Alfabetul are o dimensiune (numar intreg de caractere) Care e numit puterea alfabetului. Cu abordarea alfabetică, se crede că fiecare caracter al textului are o anumită „greutate informațională”. Pe măsură ce puterea alfabetului crește, ponderea informațională a simbolurilor acestui alfabet crește.

Să notăm puterea alfabetului cu N.

Să aflăm relația dintre ponderea informațională a simbolului (i) și puterea alfabetului (N). Cel mai mic alfabet conține 2 caractere, care sunt desemnate „0” și „1”. Greutatea informațională a unui simbol al alfabetului binar este luată ca unitate de informație și se numește 1 bit. (Vezi atașamentul slide 3)

N 2 4 8 16 32 64 128 256
i 1 bit 2 biți 3 biți 4 biți 5 biți 6 biți 7 biți 8 biți

De asemenea, computerul folosește propriul alfabet, care poate fi numit computer. Numărul de caractere pe care îl include este de 256 de caractere. Aceasta este puterea alfabetului computerului.

De asemenea, am constatat că 256 de caractere diferite pot fi codificate folosind 8 biți.

8 biți este o valoare atât de caracteristică încât i s-a dat propriul nume - octet.

1 octet = 8 biți

Folosind acest fapt: puteți calcula rapid cantitatea de informații conținute în textul computerului, adică în textul tastat folosind un computer, având în vedere că majoritatea articolelor, cărților, publicațiilor etc. scris folosind editori de text, apoi în acest fel puteți găsi volumul de informații al oricărui mesaj creat într-un mod similar.

Să vedem regula de măsurare a informațiilor din punctul de vedere al abordării alfabetice pe slide. (Vezi atașamentul slide 4)

Exemplu:

Găsiți volumul de informații al unei pagini de text pe computer.

Soluţie:

Să folosim regula.

1. Aflați puterea: N=256
2. Găsiți volumul de informații al unui personaj: N= 2 i i = 8 biți = 1 octet.
3. Găsiți numărul de caractere de pe pagină. Aproximativ.

(Aflați numărul de caractere dintr-o linie și înmulțiți-l cu numărul de linii)

Explicaţie:

Lăsați copiii să aleagă un șir aleatoriu și să numere numărul de caractere din acesta, ținând cont de toate semnele de punctuație și spațiile.

40 de caractere * 50 de linii = 2000 de caractere.

4. Găsiți volumul de informații al întregii pagini: 2000 * 1 = 2000 octeți

De acord că un octet este o unitate mică de informație. Pentru a măsura cantități mari de informații, se folosesc următoarele unități (Vezi atașamentul slide5)

3. Consolidarea materialului studiat.

Pe birou:

Completați spațiile libere cu numere și verificați exactitatea.

1 KB = ___ octet = ______bit,
2 KB = _____ octet =______ biți,
24576 biți =_____octeți =_____Kocteți,
512 KB = ___ biți = ____biți.

Studenților li se oferă sarcini:

1) Mesajul este scris folosind un alfabet care conține 8 caractere. Câte informații conține o literă din acest alfabet?

Soluţie: N=8, apoi i= 3 biți

2) Un mesaj scris cu litere din alfabetul de 128 de caractere conține 30 de caractere. Câte informații transportă?

1. N= 128, K=30
2. N= 2 i i= 7 biți (volum de un caracter)
3. I = 30*7 = 210bit (volumul întregului mesaj)

4. Munca creativă.

Tastați text pe computer al cărui volum de informații este de 240 de octeți.

5. Rezumatul lecției.

Ce nou am învățat în clasă astăzi?
- Cum se determină cantitatea de informații din punct de vedere alfabetic?
- Cum să găsești puterea alfabetului?
- Cu ce ​​este egal 1 octet?

6. Tema pentru acasă (Vezi atașamentul slide 6).

Învață o regulă de măsurare a informațiilor în ceea ce privește abordarea alfabetică.

Învață unitățile de măsură ale informațiilor.

Rezolvă o problemă:

1) Capacitatea unui alfabet este de 64 de caractere. Care va fi cantitatea de informații dintr-un text format din 100 de caractere?
2) Volumul de informații al mesajului este de 4096 de biți. Conține 1024 de caractere. Care este puterea alfabetului cu care este compus acest mesaj?

Și multe alte concepte au legături foarte directe între ele. Foarte puțini utilizatori de astăzi sunt bine versați în aceste probleme. Să încercăm să clarificăm care este puterea alfabetului, cum să o calculăm și să o aplicăm în practică. În viitor, acest lucru, fără îndoială, poate fi util în practică.

Cum se măsoară informația

Înainte de a începe să studiem întrebarea care este puterea alfabetului și ce este aceasta în general, ar trebui să începem, ca să spunem așa, cu elementele de bază.

Cu siguranță toată lumea știe că astăzi există sisteme speciale pentru măsurarea oricăror cantități pe baza valorilor de referință. De exemplu, pentru distanțe și cantități similare acestea sunt metrii, pentru masă și greutate - kilograme, pentru intervale de timp - secunde etc.

Dar cum măsori informațiile în ceea ce privește volumul textului? Tocmai de aceea a fost introdus conceptul de putere alfabetică.

Care este puterea alfabetului: un concept inițial

Deci, dacă respectăm regula general acceptată că valoarea finală a oricărei mărimi este un parametru care determină de câte ori este conținută unitatea de referință în cantitatea măsurată, putem concluziona: puterea alfabetului este numărul total de simboluri utilizate. pentru o anumită limbă.

Pentru a fi mai clar, să lăsăm deocamdată întrebarea cum să găsim puterea alfabetului și să acordăm atenție simbolurilor în sine, desigur, din punctul de vedere al tehnologiei informației. În linii mari, lista completă a caracterelor folosite conține litere, cifre, tot felul de paranteze, caractere speciale, semne de punctuație etc. Totuși, dacă abordăm întrebarea care este puterea alfabetului într-un mod computerizat, ar trebui să includem și un spațiu (un singur spațiu între cuvinte sau alte caractere).

Să luăm ca exemplu limba rusă, sau mai bine zis, aspectul tastaturii. Pe baza celor de mai sus, lista completă conține 33 de litere, 10 numere și 11 caractere speciale. Astfel, puterea totală a alfabetului este de 54.

Greutatea informațională a caracterelor

Cu toate acestea, conceptul general al puterii alfabetului nu definește esența calculării volumelor de informații de text care conțin litere, numere și simboluri. Acest lucru necesită o abordare specială.

Practic, gândiți-vă, care ar putea fi setul minim din punct de vedere al unui sistem informatic, câte caractere poate conține? Răspuns: doi. Si de aceea. Faptul este că fiecare simbol, fie că este o literă sau un număr, are propria sa greutate informațională, prin care mașina recunoaște exact ce se află în fața lui. Dar computerul înțelege doar reprezentarea sub formă de unu și zero, pe care, de fapt, se bazează toată informatica.

Astfel, orice caracter poate fi reprezentat ca șiruri care conțin numerele 1 și 0, adică secvența minimă care denotă o literă, un număr sau un simbol este formată din două componente.

Greutatea informației în sine, luată ca unitate standard de măsură a informațiilor, se numește bit (1 bit). În consecință, 8 biți formează 1 octet.

Reprezentarea caracterelor în cod binar

Deci, care este puterea alfabetului, cred, este deja puțin clar. Acum să ne uităm la un alt aspect, în special reprezentarea practică a puterii folosind Ca exemplu, pentru simplitate, să luăm un alfabet care conține doar 4 caractere.

Într-un cod binar cu două cifre, secvența și reprezentarea informațiilor lor pot fi descrise după cum urmează:

Număr de serie

Cod binar

De aici concluzia cea mai simplă: cu puterea alfabetului N=4, greutatea unui singur caracter este de 2 biți.

Dacă folosim un cod binar de trei cifre pentru un alfabet cu, de exemplu, 8 caractere, numărul de combinații va fi următorul:

Număr de serie

Cod binar

Cu alte cuvinte, cu puterea alfabetului N=8, greutatea unui simbol pentru un cod binar din trei cifre va fi egală cu 3 biți.

alfabet și să-l folosească într-o expresie computerizată

Acum să încercăm să ne uităm la relația exprimată prin numărul de caractere din cod și puterea alfabetului. Formula, unde N este puterea alfabetică a alfabetului și b este numărul de caractere din codul binar, va arăta astfel:

Adică 2 1 =2, 2 2 =4, 2 3 =8, 2 4 =16 etc. În linii mari, numărul necesar de caractere al codului binar în sine este greutatea simbolului. Din punct de vedere informativ, arată astfel:

Măsurarea volumului de informații

Cu toate acestea, acestea au fost doar cele mai simple exemple, ca să spunem așa, pentru o înțelegere inițială a puterii alfabetului. Să trecem la practică.

În această etapă de dezvoltare a tehnologiei informatice pentru introducerea textului, luând în considerare literele mari, literele mari și chirilice și latine, semnele de punctuație, parantezele, simbolurile aritmetice etc. Sunt utilizate 256 de caractere. Pe baza faptului că 256 este 2 8, nu este greu de ghicit că greutatea fiecărui caracter dintr-un astfel de alfabet este 8, adică 8 biți sau 1 octet.

Pe baza tuturor parametrilor cunoscuți, putem obține cu ușurință volumul de informații dorit al oricărui text. De exemplu, avem un text de computer care conține 30 de pagini. O pagină conține 50 de rânduri a câte 60 de caractere sau simboluri, inclusiv spații.

Astfel, o pagină va conține 50 x 60 = 3.000 de octeți de informații, iar întregul text va conține 3.000 x 50 = 150.000 de octeți. După cum puteți vedea, măsurarea chiar și a textelor mici în octeți este incomod. Dar biblioteci întregi?

În acest caz, este mai bine să convertiți volumul în unități mai puternice - kilobytes, megabytes, gigabytes etc. Pe baza faptului că, de exemplu, 1 kilooctet este egal cu 1024 de octeți (2 10), iar un megaoctet este de 2 10 kiloocteți (1024 de kiloocteți), este ușor de calculat că volumul de text în informații și expresii matematice pentru exemplu va fi 150000/1024 = 146, 484375 kiloocteți sau aproximativ 0,14305 megaocteți.

În loc de o postfață

În general, aceasta este pe scurt tot ceea ce privește luarea în considerare a întrebării care este puterea alfabetului. Rămâne de adăugat că în această descriere a fost folosită o abordare pur matematică. Este de la sine înțeles că încărcarea semantică a textului nu este luată în considerare în acest caz.

Dar, dacă abordăm problemele de luare în considerare tocmai dintr-o poziție care oferă unei persoane ceva de înțeles, un set de combinații fără sens sau secvențe de simboluri în acest sens va avea încărcare informațională nulă, deși, din punctul de vedere al conceptului de informație volum, rezultatul poate fi încă calculat.

În general, cunoștințele despre puterea alfabetului și conceptele conexe nu sunt atât de greu de înțeles și pot fi aplicate pur și simplu în sensul acțiunilor practice. Mai mult, orice utilizator se confruntă cu asta aproape în fiecare zi. Este suficient să dam exemplul popularului editor Word sau al oricărui alt editor de același nivel care folosește un astfel de sistem. Dar nu-l confunda cu Notepad obișnuit. Aici puterea alfabetului este mai mică, deoarece tastarea nu folosește, să zicem, majuscule.

Volumul informațional al textului și unitățile de măsură ale informațiilor


Un computer modern poate procesa informații numerice, text, grafice, sonore și video. Toate aceste tipuri de informații dintr-un computer sunt prezentate în cod binar, adică sunt utilizate doar două caractere 0 și 1. Acest lucru se datorează faptului că este convenabil să se reprezinte informația sub forma unei secvențe de impulsuri electrice: există nici un impuls (0), există un impuls (1).

O astfel de codificare este de obicei numită binară, iar secvențele logice de zerouri și unități în sine sunt numite limbaj mașină.

Cât de lung trebuie să fie codul binar pentru a putea fi folosit pentru a codifica caracterele de pe tastatura computerului?

Prin urmare, greutatea informațională a unui caracter dintr-un alfabet suficient este de 1 octet.

Pentru a măsura volume mari de informații, se folosesc unități mai mari de informații:

Unități de măsurare a cantității de informații:

1 octet = 8 biți

1 kilobyte = 1 KB = 1024 octeți

1 megaoctet = 1 MB = 1024 KB

1 gigabyte = 1 GB = 1024 GB

Volumul informativ al textului

1. Numărul de personaje din carte:

60 * 40 * 150 = 360.000 de caractere.

2. Deoarece 1 caracter cântărește 1 octet, volumul de informații al cărții este egal cu

360.000 de octeți.

3. Să convertim octeții în unități mai mari:

360.000 / 1024 = 351,56 KB

351,56 / 1024 = 0,34 MB

Răspuns: Volumul de informații al textului este de 0,34 MB.

Sarcină:

Volumul de informații al textului pregătit cu ajutorul computerului este de 3,5 KB. Câte caractere conține acest text?

1. Să convertim volumul din MB în octeți:

3,5 MB * 1024 = 3584 KB

3584 KB * 1024 = 3.670.016 octeți

2. Deoarece 1 caracter cântărește 1 octet, numărul de caractere din text este

Pentru măsurare este folosită abordarea alfabetică cantitatea de informațiiîntr-un text prezentat ca o succesiune de caractere ale oarecare alfabet. Această abordare nu are legătură cu conținutul textului. Cantitatea de informații în acest caz este numită volumul informativ al textului, care este proporțională cu dimensiunea textului - numărul de caractere care alcătuiesc textul. Această abordare de măsurare a informațiilor este uneori numită abordare volumetrică.

Fiecare caracter al textului poartă o anumită cantitate de informații. El este numit ponderea informatiei a simbolului. Prin urmare, volumul informațional al textului este egal cu suma ponderilor informaționale ale tuturor caracterelor care alcătuiesc textul.

Aici se presupune că textul este un lanț secvenţial de caractere numerotate. În formula (1) i 1 denotă ponderea informațională a primului caracter al textului, i 2 - ponderea informațională a celui de-al doilea caracter al textului etc.; K- dimensiunea textului, adică numărul total de caractere din text.

Toate simbolurile diferite folosite pentru a scrie texte, numit alfabet. Mărimea alfabetului este un număr întreg numit puterea alfabetului. Trebuie avut în vedere faptul că alfabetul include nu numai literele unei anumite limbi, ci toate celelalte simboluri care pot fi folosite în text: numere, semne de punctuație, diverse paranteze, spații etc.

Determinarea greutăților informaționale ale simbolurilor poate avea loc în două aproximări:

1) asumarea probabilității egale (frecvență egală de apariție) a oricărui caracter din text;

2) luarea în considerare a diferitelor probabilități (frecvență diferită de apariție) ale diferitelor personaje din text.

Aproximarea probabilității egale a caracterelor din text

Dacă presupunem că toate caracterele alfabetului din orice text apar cu aceeași frecvență, atunci ponderea informațională a tuturor caracterelor va fi aceeași. Lăsa N- puterea alfabetului. Atunci fracția oricărui caracter din text este 1/ N partea a textului. Prin definiția probabilității (vezi ) această valoare este egală cu probabilitatea ca un caracter să apară în fiecare poziție a textului:

p = 1/N

Conform formulei lui K. Shannon (vezi. „Măsurarea informațiilor. Abordarea conținutului”), cantitatea de informații transportată de un simbol este calculată după cum urmează:

i = log2(1/ p) = log2 N(pic) (2)

Prin urmare, ponderea informațională a simbolului ( i) și puterea alfabetului ( N) sunt legate între ele conform formulei lui Hartley (vezi „ Măsurarea informațiilor. Abordarea conținutului” )

2 i = N.

Cunoașterea greutății informaționale a unui caracter ( i) și dimensiunea textului exprimată în număr de caractere ( K), puteți calcula volumul de informații al textului folosind formula:

eu = K · i (3)

Această formulă este o versiune specială a formulei (1), în cazul în care toate simbolurile au aceeași pondere a informațiilor.

Din formula (2) rezultă că atunci când N= 2 (alfabet binar) greutatea informației a unui caracter este de 1 bit.

Din perspectiva abordării alfabetice a măsurării informaţiei1 bit -aceasta este greutatea informațională a unui caracter din alfabetul binar.

O unitate de măsură mai mare a informației este octet.

1 octet -aceasta este greutatea informațională a unui simbol din alfabet cu o putere de 256.

Deoarece 256 = 2 8, relația dintre un bit și un octet rezultă din formula lui Hartley:

2 i = 256 = 2 8

De aici: i= 8 biți = 1 octet

Pentru a reprezenta textele stocate și procesate pe un computer, cel mai des este folosit un alfabet cu o capacitate de 256 de caractere. Prin urmare,
1 caracter al unui astfel de text „cântărește” 1 octet.

Pe lângă bit și octet, unități mai mari sunt, de asemenea, folosite pentru a măsura informațiile:

1 KB (kilobyte) = 2 10 octeți = 1024 octeți,

1 MB (megaoctet) = 2 10 KB = 1024 KB,

1 GB (gigabyte) = 2 10 MB = 1024 MB.

Aproximarea diferitelor probabilități de apariție a caracterelor în text

Această aproximare ia în considerare faptul că în textul real apar caractere diferite cu frecvențe diferite. Rezultă că probabilitățile de apariție a diferitelor personaje într-o anumită poziție a textului sunt diferite și, prin urmare, ponderile lor informaționale sunt diferite.

Analiza statistică a textelor rusești arată că frecvența de apariție a literei „o” este de 0,09. Aceasta înseamnă că pentru fiecare 100 de caractere, litera „o” apare în medie de 9 ori. Același număr indică probabilitatea ca litera „o” să apară într-o anumită poziție în text: p o = 0,09. Rezultă că greutatea informațională a literei „o” în textul rus este egală cu:

Cea mai rară literă din texte este litera „f”. Frecvența sa este 0,002. De aici:

Aceasta duce la o concluzie calitativă: ponderea informațională a literelor rare este mai mare decât ponderea literelor care apar frecvent.

Cum se calculează volumul de informații al unui text ținând cont de diferitele greutăți de informații ale caracterelor alfabetului? Acest lucru se face după următoarea formulă:

Aici N- dimensiunea (puterea) alfabetului; n j- numărul de repetări ale numărului simbol j in text; eu j- greutatea informatiei a numarului simbolului j.

Abordarea alfabetică în cursul de informatică stă la baza școlii

Într-un curs de informatică la o școală de bază, introducerea elevilor în abordarea alfabetică a măsurării informațiilor are loc cel mai adesea în contextul reprezentării informatice a informațiilor. Afirmația principală este așa:

Cantitatea de informații este măsurată prin dimensiunea codului binar cu care este reprezentată această informație

Deoarece orice tip de informație este reprezentat în memoria computerului sub formă de cod binar, această definiție este universală. Este valabil pentru informații simbolice, numerice, grafice și audio.

Un semn ( deversare)codul binar poartă 1pic de informație.

Când se explică metoda de măsurare a volumului informațional al unui text într-un curs de bază de informatică, această problemă este abordată prin următoarea secvență de concepte: alfabet-dimensiunea codului binar al caracterelor-volumul informativ al textului.

Logica raționamentului se desfășoară din exemple particulare pentru a obține o regulă generală. Lasă alfabetul unei anumite limbi să aibă doar 4 caractere. Să le notăm: , , , . Aceste simboluri pot fi codificate folosind patru coduri binare din două cifre: - 00, - 01, - 10, - 11. Aici sunt utilizate toate variantele de plasare a două simboluri, al căror număr este 2 2 = 4. De aici concluzia este desenat: ponderea informației a simbolului este din Un alfabet de 4 caractere este egal cu doi biți.

Următorul caz special este un alfabet de 8 caractere, fiecare caracter poate fi codificat în cod binar de 3 biți, deoarece numărul de plasări a două caractere în grupuri de 3 este 2 3 = 8. Prin urmare, ponderea informației unui caracterul dintr-un alfabet de 8 caractere este de 3 biți. etc.

Generalizând din exemple particulare, obținem o regulă generală: folosirea b- codul binar de biți poate codifica un alfabet format din N = 2 b- simboluri.

Exemplul 1. Pentru a scrie text, pentru a separa cuvintele sunt folosite doar litere mici ale alfabetului rus și „spațiu”. Care este volumul de informații al unui text format din 2000 de caractere (o pagină tipărită)?

Soluţie. Există 33 de litere în alfabetul rus. Prin scurtarea acestuia cu două litere (de exemplu, „е” și „й”) și introducerea unui caracter spațiu, obținem un număr foarte convenabil de caractere - 32. Folosind aproximarea probabilității egale a caracterelor, scriem formula lui Hartley:

2i= 32 = 2 5

De aici: i= 5 biți - greutatea informațiilor pentru fiecare caracter al alfabetului rus. Atunci volumul de informații al întregului text este egal cu:

eu= 2000 5 = 10.000 pic

Exemplul 2. Calculați volumul de informații al unui text de 2000 de caractere, a cărui înregistrare utilizează un alfabet de reprezentare computerizată a textelor cu o capacitate de 256.

Soluţie.În acest alfabet, greutatea informațiilor fiecărui caracter este de 1 octet (8 biți). Prin urmare, volumul de informații al textului este de 2000 de octeți.

În sarcinile practice pe această temă, este important să exersăm abilitățile elevilor în conversia cantității de informații în diferite unități: biți - octeți - kilobytes - megabytes - gigabytes. Dacă recalculăm volumul de informații al textului din exemplul 2 în kiloocteți, obținem:

2000 de octeți = 2000/1024 1,9531 KB

Exemplul 3. Dimensiunea mesajului, care conține 2048 de caractere, a fost de 1/512 de megaoctet. Care este dimensiunea alfabetului în care este scris mesajul?

Soluţie. Să convertim volumul de informații al mesajului din megaocteți în biți. Pentru a face acest lucru, înmulțiți această valoare de două ori cu 1024 (obținem octeți) și o dată cu 8:

eu= 1/512 · 1024 · 1024 · 8 = 16.384 biți.

Deoarece un astfel de volum de informații este transportat de 1024 de caractere ( LA), apoi pe caracter există:

i = eu/K= 16.384/1024 = 16 biți.

Rezultă că dimensiunea (puterea) alfabetului utilizat este de 2 16 = 65.536 de caractere.

Abordarea volumului în cursurile de informatică din liceu

Studiind informatica în clasele 10-11 la un nivel de învățământ general de bază, este posibil să lăsați cunoștințele elevilor despre abordarea volumetrică de măsurare a informațiilor la același nivel ca cel descris mai sus, de exemplu. în contextul volumului de cod binar de calculator.

Când se studiază informatica la nivel de profil, abordarea volumetrică trebuie luată în considerare dintr-o perspectivă matematică mai generală, folosind idei despre frecvența caracterelor din text, probabilități și legătura probabilităților cu ponderile informaționale ale caracterelor.

Cunoașterea acestor probleme se dovedește a fi importantă pentru o înțelegere mai profundă a diferențelor în utilizarea codificării binare uniforme și neuniforme (vezi. „Codificarea informațiilor”), pentru a înțelege unele tehnici de compresie a datelor (vezi „Comprimarea datelor”) și algoritmi de criptare (vezi. "Criptografie" ).

Exemplul 4. Alfabetul tribului MUMU are doar 4 litere (A, U, M, K), un semn de punctuație (punct) și un spațiu este folosit pentru a separa cuvintele. S-a calculat că popularul roman „Mumuka” conține doar 10.000 de caractere, dintre care: literele A - 4000, literele U - 1000, literele M - 2000, literele K - 1500, puncte - 500, spații - 1000. Câtă informație are conţine o carte?

Soluţie. Deoarece volumul cărții este destul de mare, putem presupune că frecvența de apariție a fiecărui simbol alfabetic în textul calculat din acesta este tipică pentru orice text în limba MUMU. Să calculăm frecvența de apariție a fiecărui simbol în întregul text al cărții (adică probabilitatea) și ponderile informaționale ale simbolurilor

Calculăm cantitatea totală de informații din carte ca suma produselor ponderii informaționale a fiecărui simbol și numărul de repetări ale acestui simbol în carte: