Kako se informacije mogu kodirati. Kodiranje informacija. Kodiranje informacija na računalu. Kodiranje tekstualnih informacija

Odjel za obrazovanje grada Moskve


Državna obrazovna ustanova

Srednje strukovno obrazovanje

Visoka škola za arhitekturu i graditeljstvo broj 7 TSP-2

izvješće

Na temu: "Informatika i ICT"

na temu: „Brojevni sustavi ».

Završio: student grupe 11EVM

Puno ime: Vus Ivan Valerievich

provjereno:

Učiteljica Ovsyannikova A.S.

Moskva - 2011

Prikaz podataka u memoriji osobnog računala (brojevi, simboli, grafika, zvuk).

Oblik i jezik prezentacije informacija

Opažajući informacije uz pomoć osjetila, osoba ih nastoji popraviti tako da postanu razumljive drugima, prezentirajući ih u jednom ili drugom obliku.

Skladatelj može svirati glazbenu temu na glasoviru, a zatim je zapisati pomoću nota. Slike inspirirane istom melodijom pjesnik može utjeloviti u obliku pjesme, koreograf to može izraziti plesom, a umjetnik na slici.

Osoba izražava svoje misli u obliku rečenica sastavljenih od riječi. Riječi se pak sastoje od slova. Ovo je abecedni prikaz informacija.

Oblik izlaganja istih informacija može biti različit. Ovisi o cilju koji ste sebi postavili. Na slične operacije nailazite na satovima matematike i fizike kada predstavljate rješenje u različitim oblicima. Na primjer, rješenje problema: "Pronađite vrijednost matematičkog izraza ..." može se prikazati u tabličnom ili grafičkom obliku uporabom vizualnih sredstava prezentiranja informacija: brojeva, tablice, slike.

Stoga se informacije mogu prikazati u različitim oblicima:

  • pisanje znakova, koje se sastoji od različitih znakova, među kojima je uobičajeno razlikovati
    • simbolički u obliku teksta, brojeva, posebni znakovi(na primjer, tekst udžbenika);
    • grafička (na primjer, zemljopisna karta);
    • tablični (na primjer, tablica za bilježenje tijeka fizičkog pokusa);
  • u obliku gesta ili signala (na primjer, signala kontrolora prometa);
  • usmeni verbalni (na primjer, razgovor).

Oblik iznošenja informacija vrlo je važan pri prijenosu: ako osoba ima slab sluh, tada je nemoguće prenijeti joj informaciju u zvučnom obliku; ako pas ima slabo razvijen njuh, onda ne može raditi u službi za pretraživanje. U različito vrijeme ljudi su prenosili informacije u različitim oblicima koristeći: govor, dim, bubnjanje, zvonjenje, pisanje, telegraf, radio, telefon, faks.

Bez obzira na oblik prezentacije i način prijenosa informacija, one se uvijek prenose jezikom.

Na satovima matematike koristite poseban jezik koji se temelji na brojevima, znakovima aritmetičke operacije i odnosi. Oni čine abecedu jezika matematike.

Na satovima fizike, kada razmatrate fizički fenomen, koristite karakteristiku ovog jezika posebne znakove od kojih izrađujete formule. Formula je riječ u jeziku fizike.

Na satovima kemije također koristite određene simbole, znakove, kombinirajući ih u "riječi" određenog jezika.

Postoji jezik gluhonijemih, gdje su simboli jezika određeni znakovi izraženi izrazom lica i pokretima ruku.

Temelj svakog jezika je abeceda - skup jedinstveno definiranih znakova (simbola) od kojih se formira poruka.

Jezici se dijele na prirodne (govorne) i formalne. Abeceda prirodnog jezika ovisi o nacionalnoj tradiciji. Formalni jezici nalaze se u posebnim područjima ljudskog djelovanja (matematika, fizika, kemija itd.). U svijetu postoji oko 10.000 različitih jezika, narječja i priloga. Mnogi govorni jezici potječu od istog jezika. Na primjer, francuski, španjolski, talijanski i drugi jezici nastali su od latinskog.

Kodiranje informacija

Pojavom jezičnih, a zatim i znakovnih sustava, mogućnosti komunikacije među ljudima su se proširile. To je omogućilo pohranjivanje ideja, stečenog znanja i bilo kojih podataka, njihovo prenošenje na različite načine na daljinu i u drugim trenucima - ne samo njihovim suvremenicima, već i budućim generacijama. Do danas su opstale kreacije predaka, koji su uz pomoć različitih simbola ovjekovječili sebe i svoja djela u spomenicima i natpisima. Zidne slike (petroglifi) i dalje su misterij za znanstvenike. Možda su na taj način stari ljudi htjeli stupiti u kontakt s nama, budućim stanovnicima planeta, i izvijestiti o događajima iz njihovog života.

Svaki narod ima svoj jezik, koji se sastoji od skupa znakova (slova): ruskog, engleskog, japanskog i mnogih drugih. Već ste se upoznali s jezikom matematike, fizike, kemije.

Prikaz informacija pomoću jezika često se naziva kodiranje.

Kodirati- skup simbola (simbola) za predstavljanje informacija. Kodiranje- postupak prezentiranja informacija u obliku koda.

Vozač šalje signal zvučnim signalom ili trepćućim svjetlima. Kôd je prisutnost ili odsutnost zvučnog signala, a u slučaju svjetlosne signalizacije treptanje prednjih svjetala ili njegova odsutnost.

Suočeni ste s kodiranjem podataka pri prelasku ceste prema prometnoj signalizaciji. Kôd određuje boje semafora - crvenu, žutu, zelenu.

Prirodni jezik na kojem ljudi komuniciraju također se temelji na kodu. Samo u ovom slučaju naziva se abeceda. Kada se govori, ovaj se kôd prenosi zvukovima, dok se piše - slovima. Isti se podaci mogu prikazati pomoću različitih kodova. Na primjer, snimka razgovora može se snimiti ruskim slovima ili posebnim doslovnim simbolima.

Kako se tehnologija razvijala, različiti putevi kodiranje informacija. U drugoj polovici 19. stoljeća američki izumitelj Samuel Morse izumio je nevjerojatan kod koji služi čovječanstvu i danas. Podaci su kodirani s tri "slova": dugim signalom (crtica), kratkim signalom (točka) i bez signala (stanka) za odvajanje slova. Dakle, kodiranje se svodi na korištenje skupa znakova raspoređenih u strogo definiranom redoslijedu.

Ljudi su uvijek tražili načine za brzu razmjenu poruka. Za to su poslani glasnici, korišteni su golubovi nosači. Narodi su imali različite načine obavještavanja o nadolazećoj opasnosti: bubnjanje, dim s krijesa, zastave itd. Međutim, uporaba takvog prikaza informacija zahtijeva prethodni dogovor o razumijevanju primljene poruke.

Poznati njemački znanstvenik Gottfried Wilhelm Leibniz predložio je u 17. stoljeću jedinstvenu i jednostavan sustav prikazi brojeva. "Izračun pomoću dvojki ... temeljni je za znanost i generira nova otkrića ... kad se brojevi svedu na najjednostavnije početke, koji su 0 i 1, posvuda se pojavljuje prekrasan poredak."

Danas se ovaj način predstavljanja informacija pomoću jezika koji sadrži samo dva znaka abecede - 0 i 1, naširoko koristi u tehnički uređaji, uključujući i u računalu. Ova dva znaka 0 i 1 obično se nazivaju binarne znamenke ili bitovi (od engleskog bita - Binary Digit - binarni znak).

Inženjere je ova metoda kodiranja privukla jednostavnošću tehničke implementacije - postoji li signal ili ne. Svaka poruka može biti kodirana s ova dva broja.

Veća jedinica za mjerenje količine informacija smatra se 1 bajtom, koji se sastoji od 8 bitova.

Također je prihvaćeno koristiti veće jedinice za mjerenje količine informacija. Broj 1024 (2 10) je množitelj pri prelasku na višu mjernu jedinicu.

Kodiranje informacija u računalu

Sve informacije koje računalo obrađuje moraju biti predstavljene binarnim kodom koji koristi dvije znamenke - 0 i 1. Ova dva znaka obično se nazivaju binarne znamenke ili bitovi. Svaka poruka može biti kodirana s dvije znamenke 1 i 0. To je bio razlog da se u računalu moraju organizirati dva važna procesa:

  • kodiranje, koje omogućuju ulazni uređaji pri pretvaranju ulaznih informacija u oblik koji računalo može uočiti, odnosno u binarni kôd;
  • dekodiranje, koje omogućuju izlazni uređaji prilikom pretvaranja podataka iz binarnog koda u oblik koji osoba može razumjeti.

S gledišta tehničke implementacije, upotreba binarnog brojevnog sustava za kodiranje informacija pokazala se velikom
lakše nego koristiti druge metode. Doista, prikladno je kodirati informacije u obliku niza nula i jedinica ako su te vrijednosti predstavljene kao dva moguća stabilna stanja elektroničkog elementa:

  • 0 - nema električnog signala ili signal nema niska razina;
  • 1 - prisutnost signala ili signal je visok.

Ove uvjete je lako razlikovati. Nedostatak binarnog kodiranja su dugi kodovi. No, u tehnologiji se lakše nositi s velikim brojem jednostavni elementi nego s malo kompliciranim.

Svakodnevno se vi i u svakodnevnom životu morate nositi s uređajem koji može biti samo u dva stabilna stanja: uključeno / isključeno. Naravno, ovo je dobro poznati prekidač. No pokazalo se da je nemoguće doći do prekidača koji bi se mogao stabilno i brzo prebaciti u bilo koje od 10 stanja. Kao rezultat toga, nakon niza neuspješnih pokušaja, programeri su došli do zaključka da je nemoguće izgraditi računalo na temelju decimalnog brojevnog sustava. A binarni brojčani sustav bio je osnova za predstavljanje brojeva u računalu.

Trenutno postoje različiti načini binarnog kodiranja i dekodiranja informacija u računalu. Prije svega, to ovisi o vrsti informacija, naime, što bi trebalo kodirati: tekst, brojevi, grafičke slike ili zvuk. Osim toga, pri kodiranju brojeva važnu ulogu igra način na koji će se oni koristiti: u tekstu, u izračunima ili u procesu I / O. Osobitosti tehničke implementacije također se preklapaju.

Kodiranje broja

Brojevni sustav - skup tehnika i pravila za pisanje brojeva pomoću određenog skupa znakova.

Za pisanje brojeva mogu se koristiti ne samo brojevi, već i slova (na primjer, pisanje rimskih brojeva - XXI). Isti se broj može različito prikazati u različitim brojevnim sustavima.

Ovisno o načinu prikaza brojeva, brojevni sustavi se dijele na pozicijske i nepozicijske.

V. pozicijskog sustava računajući, kvantitativna vrijednost svake znamenke broja ovisi o tome gdje je (položaj ili znamenka) zapisana jedna ili druga znamenka ovog broja. Na primjer, mijenjanjem položaja znamenke 2 u decimalnom sustavu možete pisati decimalne brojeve različitih veličina, na primjer 2; dvadeset; 2000; 0,02 itd.

U ne-pozicijskom sustavu brojeva brojevi ne mijenjaju svoju kvantitativnu vrijednost kada se promijeni njihovo mjesto (položaj) u broju. Primjer nekopozicijskog sustava je rimski sustav u kojem, bez obzira na mjesto, isti simbol ima isto značenje (na primjer, X u XXV).

Broj različitih simbola koji se koriste za predstavljanje broja u pozicijskom sustavu brojeva naziva se osnovni sustav brojeva.

U računalu je najprikladniji i najpouzdaniji bio binarni brojčani sustav u kojem se nizovi brojeva 0 i 1 koriste za predstavljanje brojeva.

Osim toga, za rad s memorijom računala pokazalo se prikladnim koristiti prikaz informacija pomoću još dva brojčana sustava:

  • oktalni (bilo koji broj predstavljen je pomoću osam znamenki - 0, 1, 2 ... 7);
  • heksadecimalni (koriste se znakovi -brojevi - 0, 1, 2 ... 9 i slova - A, B, C, D, E, F, zamjenjujući brojeve 10, 11, 12, 13, 14, 15).

Kodiranje informacija o znakovima

Pritiskom alfanumeričke tipke na tipkovnici šalje se računalu signal kao binarni broj koji predstavlja jednu od vrijednosti u tablici kodova. Kodna tablica je interni prikaz znakova u računalu. U cijelom svijetu ASCII tablica (American Standard Code for Informational Interchange) prihvaćena je kao standard.

Za spremanje binarnog koda od jednog znaka dodjeljuje se 1 bajt = 8 bita. S obzirom da svaki bit uzima vrijednost 1 ili 0, broj mogućih kombinacija jedinica i nula je 2 8 = 256.

To znači da uz pomoć 1 bajta možete dobiti 256 različitih kombinacija binarnih kodova i prikazati 256 različitih simbola uz njihovu pomoć. Ovi kodovi čine ASCII tablicu.

Na primjer, kada pritisnete tipku sa slovom S, u memoriju računala upisuje se kôd 01010011. Kada se slovo S prikaže na ekranu, računalo izvodi dekodiranje - na temelju ovog binarnog koda slika simbola je izgrađena.

SUNCE - 01010011 010101101 01001110

ASCII standard kodira prvih 128 znakova od 0 do 127: brojeve, slova latinične abecede, kontrolne znakove. Prva 32 znaka su kontrolni znakovi i namijenjeni su uglavnom za prijenos upravljačkih naredbi. Njihova namjena može varirati ovisno o softveru i hardveru. Druga polovica tablice kodova (od 128 do 255) nije definirana američkim standardom i namijenjena je simbolima nacionalnih abeceda, pseudografskim i nekim matematičkim simbolima. Različite zemlje mogu koristiti različite inačice druge polovice tablice kodova.

Bilješka! Brojevi su kodirani prema ASCII standardu i bilježe se u dva slučaja - tijekom unosa -izlaza i kada se nađu u tekstu. Ako su brojevi uključeni u izračune, tada se pretvaraju u drugi binarni kod.

Za usporedbu, razmotrite broj 45 za dvije mogućnosti kodiranja.

Kada se koristi u tekstu, za ovaj broj bit će potrebna 2 bajta za predstavljanje, jer će svaka znamenka biti predstavljena vlastitim kodom u skladu s ASCII tablicom. U binarnom sustavu - 00110100 00110101.

Kada se koristi u izračunima, kôd ovog broja bit će dobiven prema posebnim pravilima prevođenja i predstavljen kao 8-bitni binarni broj 00101101, koji će zahtijevati 1 bajt.

Jedna od glavnih prednosti računala je to što je nevjerojatno svestran stroj. Svatko tko je to ikada naišao zna da aritmetički izračuni uopće nisu glavna metoda korištenja računala. Računala savršeno reproduciraju glazbene i video filmove, uz njihovu pomoć moguće je organizirati govorne i video konferencije na internetu, stvarati i obrađivati ​​grafičke slike, a mogućnost korištenja računala u području računalnih igara na prvi pogled izgleda potpuno nespojivo s slika superaritmometra, koji melje stotine milijuna znamenki u sekundi.

Prilikom sastavljanja informacijskog modela objekta ili pojave moramo se složiti kako razumjeti određene oznake. Odnosno, dogovoriti se o vrsti prezentacije informacija.

Osoba izražava svoje misli u obliku rečenica sastavljenih od riječi. Oni su abecedni prikaz informacija. Temelj svakog jezika je abeceda - konačan skup različitih znakova (simbola) bilo koje prirode, od kojih je sastavljena poruka.

Jedan te isti unos može imati različita značenja. Na primjer, skup brojeva 251299 može značiti: masu objekta; duljina objekta; udaljenost između objekata; broj telefona; zabilježite datum 25. prosinca 1999. godine.

Za predstavljanje informacija mogu se koristiti različiti kodovi i, u skladu s tim, morate znati određena pravila - zakone pisanja ovih kodova, tj. moći kodirati.

Kodirati - skup simbola za prezentaciju informacija.

Kodiranje - postupak predstavljanja informacija u obliku koda.

Za međusobnu komunikaciju koristimo kôd - ruski. Kada se govori, ovaj se kôd prenosi zvukovima, dok se piše - slovima. Vozač šalje signal zvučnim signalom ili trepćućim svjetlima. Suočeni ste s kodiranjem informacija pri prelasku ceste u obliku prometne signalizacije. Dakle, kodiranje se svodi na korištenje zbirke znakova prema strogo definiranim pravilima.

Podaci se mogu kodirati na različite načine: usmeno; u pisanom obliku; geste ili signali bilo koje druge prirode.

Binarno kodiranje podataka.

S razvojem tehnologije pojavili su se različiti načini kodiranja informacija. U drugoj polovici 19. stoljeća američki izumitelj Samuel Morse izumio je nevjerojatan kod koji služi čovječanstvu i danas. Podaci su kodirani s tri znaka: dugi signal (crtica), kratki signal (točka), bez signala (pauza) - za odvajanje slova.

Sustav postoji i u računarstvu - naziva se binarno kodiranje a temelji se na predstavljanju podataka nizom od samo dva znaka: 0 i 1. Ti se znakovi pozivaju binarne znamenke, na engleskom -binarna znamenka ili skraćeni bit (bit).

Jedan bit može izraziti dva pojma: 0 ili 1 ( Da ili Ne, crno ili bijela, pravi ili Laganje itd.). Ako se broj bitova poveća na dva, tada se već mogu izraziti četiri različita pojma:

Tri bita mogu kodirati osam različitih vrijednosti:

000 001 010 011 100 101 110 111

Povećanjem broja bitova u binarnom sustavu kodiranja za jedan udvostručujemo broj vrijednosti koje se mogu izraziti u ovom sustavu, odnosno opća je formula:

gdje je N broj neovisnih kodiranih vrijednosti;

m - bitna širina binarnog kodiranja usvojena u ovom sustavu.

U informatici veliki broj informacijski procesi prolazi pomoću kodiranje podataka... Stoga je razumijevanje ovog procesa vrlo važno pri razumijevanju osnova ove znanosti. Kodiranje informacija shvaća se kao proces pretvaranja znakova napisanih na različitim prirodnim jezicima (ruski, Engleski itd.) u digitalni zapis.

To znači da se pri kodiranju teksta svakom znaku dodjeljuje određena vrijednost u obliku nula i jedinica -.

Zašto kodirati podatke?

Prvo morate odgovoriti na pitanje zašto kodirati informacije? Činjenica je da je računalo sposobno obraditi i pohraniti samo jednu vrstu prikaza podataka - digitalnu. Stoga se svi podaci koji se u njemu nalaze moraju biti prevedeni digitalni prikaz.

Standardi kodiranja teksta

Kako bi sva računala nedvosmisleno razumjela ovaj ili onaj tekst, potrebno je koristiti općeprihvaćeni standardi kodiranja teksta... U drugim slučajevima bit će potrebno dodatno transkodiranje ili nekompatibilnost podataka.



ASCII

Prvi računalni standard za kodiranje znakova bio je ASCII (puni naziv - američki standardni kod za razmjenu informacija). Za kodiranje bilo kojeg znaka korišteno je samo 7 bitova. Kao što se sjećate, samo 27 znakova ili 128 znakova može se kodirati pomoću 7 bita. To je dovoljno za kodiranje velikih i malih slova latinske abecede, arapskih brojeva, interpunkcijskih znakova, kao i određenog skupa posebnih znakova, na primjer, znak dolara - "$". Međutim, kako bi se kodirali znakovi abeceda drugih naroda (uključujući i znakove ruske abecede), bilo je potrebno kôd nadopuniti na 8 bitova (28 = 256 znakova). Istodobno, za svaki je jezik korišteno zasebno kodiranje.

UNICODE

Bilo je potrebno spasiti situaciju u smislu kompatibilnosti kodiranje tablica... Stoga su se s vremenom razvili novi i ažurirani standardi. Trenutno se naziva najpopularnije kodiranje UNICODE... U njemu je svaki znak kodiran pomoću 2 bajta, što odgovara 216 = 62536 različitih kodova.



Standardi kodiranja grafike

Za kodiranje slike potrebno je mnogo više bajtova nego za kodiranje znakova. Većina stvorenih i obrađenih slika pohranjenih u memoriji računala podijeljena je u dvije glavne skupine:

Rasterska grafika

U rasterskoj grafici slika je predstavljena skupom točkica u boji. Takve se točke nazivaju pikselima. Kad se slika poveća, takve se točke pretvaraju u kvadrate.


Za kodiranje crno -bijele slike svaki piksel kodiran je s jednim bitom. Na primjer, crna je 0, a bijela 1)


Naša prošla slika može se kodirati ovako:

Kod kodiranja slika u boji najčešće se koristi paleta od 256 nijansi sive, u rasponu od bijele do crne. Stoga je za kodiranje takve gradacije dovoljan jedan bajt (28 = 256).


Za kodiranje slika u boji koristi se nekoliko shema boja.




U praksi se često koriste RGB model u boji, gdje se koriste tri osnovne boje: crvena, zelena i plava. Ostatak nijansi boja dobiva se miješanjem ovih osnovnih boja.


Dakle, za kodiranje modela iz tri boje u 256 tonova dobije se preko 16,5 milijuna različitih nijansi boja. To jest, za kodiranje se koristi 3⋅8 = 24 bita, što odgovara 3 bajta.


Naravno, minimalni broj bitova može se koristiti za kodiranje slika u boji, ali tada se može generirati manje tonova boja, pa će se kvaliteta slike značajno smanjiti.


Da biste odredili veličinu slike, trebate pomnožiti broj piksela u širini s duljinom broja piksela i ponovno pomnožiti s veličinom samog piksela u bajtima.


  • a- broj piksela u širini;
  • b- broj piksela po duljini;
  • Ja- veličina jednog piksela u bajtovima.

Na primjer, slika u boji od 800-600 piksela zauzima 60 000 bajtova.

Vektorska grafika

Objekti vektorske grafike kodirani su na potpuno drugačiji način. Ovdje se slika sastoji od linija koje mogu imati vlastite koeficijente zakrivljenosti.



Standardi audio kodiranja

Zvukovi koje osoba čuje su vibracije zraka. Zvučne vibracije su proces širenja valova.

Zvuk ima dvije glavne karakteristike:

  • amplituda vibracija - određuje glasnoću zvuka;
  • frekvencija vibracija - određuje ton zvuka.


Zvuk se može pretvoriti u električni signal pomoću mikrofona. Zvuk je kodiran u određenom, unaprijed određenom vremenskom intervalu. U tom se slučaju mjeri veličina električnog signala i dodjeljuje se binarna vrijednost. Što se češće izvode ova mjerenja, to je kvaliteta zvuka bolja.




Kompaktni disk od 700 MB drži oko 80 minuta zvuka kvalitete CD-a.

Standardi video kodiranja

Kao što znate, video sekvenca sastoji se od fragmenata koji se brzo mijenjaju. Okviri se mijenjaju brzinom u rasponu od 24-60 sličica u sekundi.

Veličina snimljenog materijala u bajtovima određena je veličinom kadra (brojem piksela po ekranu u visini i širini), brojem korištenih boja i brojem sličica u sekundi. No, uz ovo može postojati i audio zapis.

Suvremeno računalo može obraditi numeričke, tekstualne, grafičke, audio i video informacije. Sve ove vrste informacija u računalu predstavljene su u binarnom kodu, odnosno koristi se abeceda kapaciteta dva znaka (0 i 1). To je zbog činjenice da je prikladno predstaviti informacije u obliku niza električnih impulsa: nema impulsa (0), postoji impuls (1). Takvo kodiranje obično se naziva binarno, a logički nizovi nula i samih jedinica nazivaju se strojni jezik.

Svaka znamenka strojnog binarnog koda nosi količinu informacija jednaku jednom bitu.

Ovaj zaključak može se donijeti razmatranjem brojeva abecede stroja kao jednako vjerojatnih događaja. Prilikom pisanja binarne znamenke moguće je realizirati izbor samo jednog od dva moguća stanja, što znači da ona nosi količinu informacija jednaku 1 bitu. Slijedom toga, dvije znamenke nose informacije od 2 bita, četiri bita - 4 bita itd. Za određivanje količine informacija u bitovima, dovoljno je odrediti broj znamenki u binarnom strojnom kodu.

Kodiranje tekstualnih informacija

Trenutno većina korisnika koji koriste računalo obrađuje tekstualne informacije koje se sastoje od simbola: slova, brojeva, interpunkcijskih znakova itd.

Na temelju jedne ćelije s informacijskim kapacitetom od 1 bita mogu se kodirati samo 2 različita stanja. Da bi svaki znak koji se može unijeti s tipkovnice u latinični registar primio vlastiti jedinstveni binarni kod, potrebno je 7 bita. Na temelju niza od 7 bitova, u skladu s Hartleyjevom formulom, može se dobiti N = 2 7 = 128 različitih kombinacija nula i jedinica, t.j. binarni kodovi. Povezivanjem svakog znaka s njegovim binarnim kodom dobivamo tablicu kodiranja. Osoba operira simbolima, računalo - svojim binarnim kodovima.

Za raspored latinične tipkovnice takva je tablica kodiranja jedna za cijeli svijet, pa će tekst otkucan latiničnom tipkovnicom biti adekvatno prikazan na svakom računalu. Ova se tablica naziva ASCII (američki standardni kod razmjene informacija) na engleskom izgovara se [eski], na ruskom izgovara [aski]. Dolje se nalazi cijela tablica ASCII, kodovi u kojima su navedeni u decimalnom obliku. Može se koristiti za utvrđivanje da kad unesete, recimo, znak “*” s tipkovnice, računalo ga percipira kao kôd 42 (10), zauzvrat 42 (10) = 101010 (2) - ovo je binarni kôd znaka “*”. Kodovi od 0 do 31 se ne koriste u ovoj tablici.

Tablica znakova ASCII

Za kodiranje jednog znaka koristi se količina informacija jednaka 1 bajtu, odnosno I = 1 bajt = 8 bita. Koristeći formulu koja povezuje broj mogućih događaja K i količinu informacija I, možete izračunati koliko se različitih simbola može kodirati (pod pretpostavkom da su simboli mogući događaji):

K = 2 I = 2 8 = 256,

odnosno abeceda kapaciteta 256 znakova može se koristiti za predstavljanje tekstualnih informacija.

Bit kodiranja je da se svakom znaku dodjeljuje binarni kod od 00000000 do 11111111 ili odgovarajući decimalni kod od 0 do 255.

Mora se zapamtiti da trenutno za kodiranje ruskih slova koristi se pet različitih tablica kodova(KOI - 8, CP1251, CP866, Mac, ISO) i tekstovi kodirani pomoću jedne tablice neće se ispravno prikazati u drugom kodiranju. To se može jasno predstaviti kao fragment kombinirane tablice kodiranja znakova.

Istom binarnom kodu dodijeljeni su različiti simboli.

Binarni kod

Decimalni kod

Međutim, u većini slučajeva nije korisniku stalo do transkodiranja tekstualnih dokumenata, već posebne programe- pretvarači koji su ugrađeni u aplikacije.

Posljednji od 1997. godine Microsoft verzije Office podržava novo kodiranje. Zove se Unicode. Unicode je šifarnik koji koristi 2 bajta za kodiranje svakog znaka, tj. 16 bita. Na temelju takve tablice može se kodirati N = 2 16 = 65 536 znakova.

Unicode uključuje gotovo sva moderna pisma, uključujući: arapsko, armensko, bengalsko, burmansko, grčko, gruzijsko, devanagarijsko, hebrejsko, ćirilično, koptsko, kmersko, latinsko, tamilsko, hangulsko, hansko (kinesko, japansko, korejsko), čerokijsko, etiopsko, Japanski (Katakana, Hiragana, Kanji) i drugi.

U akademske svrhe dodani su mnogi povijesni spisi, uključujući: starogrčke, egipatske hijeroglife, klinasto pismo, pisanje Maja, etruščansku abecedu.

Unicode nudi širok raspon matematičkih i glazbenih simbola i piktograma.

Postoje dva raspona kodova za ćirilične znakove u Unicodeu:

Ćirilica ( # 0400 - # 04FF)

Ćirilski dodatak ( # 0500 - # 052F).

No, implementacija Unicode tablice u čistom obliku zadržana je iz razloga što ako kôd jednog znaka zauzima ne jedan bajt, već dva bajta, to će za spremanje teksta trebati dvostruko više prostora na disku, a za prijenos preko komunikacijskih kanala - dvostruko dulji.

Stoga je sada u praksi Unicode prikaz UTF-8 (Unicode transformacijski format) češći. UTF-8 pruža najbolju kompatibilnost sa sustavima koji koriste 8-bitne znakove. Tekst koji sadrži samo znakove manje od 128 pretvara se u običan ASCII tekst kada se piše u UTF-8. Ostatak Unicode znakova predstavljen je nizovima od 2 do 4 bajta. Općenito, budući da najčešći znakovi na svijetu - znakovi latinične abecede - u UTF -8 i dalje zauzimaju 1 bajt, ovo je kodiranje ekonomičnije od čistog Unicodea.

Za određivanje numeričkog koda znakova možete upotrijebiti tablicu kodova. Da biste to učinili, u izborniku odaberite stavku "Umetni" - "Simbol", nakon čega se na zaslonu pojavljuje dijaloški okvir Simbol. Tablica simbola za odabrani font pojavljuje se u dijaloškom okviru. Znakovi u ovoj tablici poredani su red po redak, slijeva slijeva nadesno, počevši od znaka Razmak.

Upoznali smo se s brojčanim sustavima - načinima kodiranja brojeva. Brojevi daju podatke o broju stavki. Ove informacije moraju biti kodirane, predstavljene u nekakvom brojčanom sustavu. Koju od poznatih metoda odabrati ovisi o problemu koji se rješava.
Do nedavno su računala uglavnom obrađivala numeričke i tekstualne podatke. No, osoba prima većinu informacija o vanjskom svijetu u obliku slike i zvuka. U ovom slučaju slika je važnija. Sjetite se izreke: "Bolje je vidjeti jednom nego čuti sto puta." Stoga danas računala počinju sve aktivnije raditi sa slikom i zvukom. Svakako ćemo razmotriti metode kodiranja takvih informacija.

Binarno kodiranje numeričkih i tekstualnih informacija.

Sve se informacije kodiraju u računalu pomoću dvoznamenkastih nizova-0 i 1. Računalo pohranjuje i obrađuje informacije u obliku kombinacije električnih signala: napon 0,4 V-0,6 V odgovara logičkoj nuli, a napon 2,4 V-2,7 V - do logičke jedinice. Zovu se nizovi 0 i 1 binarni kodovi , a brojevi 0 i 1 su komadići (u binarnim znamenkama). To kodiranje informacija na računalu naziva se binarno kodiranje ... Dakle, binarno kodiranje je kodiranje s minimalnim mogućim brojem elementarnih simbola, kodirajući najviše jednostavnim sredstvima... Zato je izvanredan s teorijskog gledišta.
Binarno kodiranje informacija privlači inženjere jer se tehnički lako provodi. Elektronički sklopovi za obradu binarnih kodova moraju biti u samo jednom od dva stanja: postoji signal / nema signala ili visoki napon / niski napon .
Računala u svom radu rade s realnim i cijelim brojevima, predstavljenim u obliku dva, četiri, osam, pa čak i deset bajtova. Za predstavljanje znaka broja pri brojanju, dodatni znak čina , koji obično dolazi ispred brojčanih znamenki. Za pozitivne brojeve bit znaka je 0, a za negativne brojeve - 1. Da biste napisali unutarnji prikaz negativnog cijelog broja (-N), trebate:
1) dobiti dodatni kôd broja N zamjenom 0 s 1 i 1 s 0;
2) rezultirajućem broju dodajte 1.

Budući da jedan bajt nije dovoljan za predstavljanje ovog broja, predstavljen je kao 2 bajta ili 16 bita, njegov komplementarni kod je 1111101111000101, dakle -1082 = 1111101111000110.
Da računalo može rukovati samo s jednim bajtom, ne bi bilo od velike koristi. U stvarnosti, računalo radi s brojevima koji su zapisani u dva, četiri, osam, pa čak i deset bajtova.
Počevši od kasnih 1960 -ih, računala su se sve više koristila za obradu tekstualnih informacija. Za predstavljanje tekstualnih informacija obično se koristi 256 različitih znakova, na primjer, velika i mala slova latinične abecede, brojevi, interpunkcijski znakovi itd. U većini modernih računala svaki znak odgovara nizu od osam nula i jedinica, tzv bajt .
Bajt je osmobitna kombinacija nula i jedinica.
Prilikom kodiranja informacija u tim elektroničkim računalima koristi se 256 različitih nizova od 8 nula i jedinica, što omogućuje kodiranje 256 znakova. Na primjer, veliko rusko slovo "M" ima kôd 11101101, slovo "I" - kôd 11101001, slovo "P" - kôd 11110010. Dakle, riječ "WORLD" kodirana je nizom od 24 bita ili 3 bajta: 111011011110100111110010.
Broj bitova u poruci naziva se informacijski volumen poruke. Zanimljivo je!

U početku se u računalima koristila samo latinica. Ima 26 slova. Dakle, pet impulsa (bitova) bilo bi dovoljno za označavanje svakog. No, tekst sadrži interpunkcijske znakove, decimalne znamenke itd. Stoga je u prvim računalima koji govore engleski jedan bajt - strojni slog - sadržavao šest bita. Zatim sedam - ne samo za razlikovanje velikih slova od malih slova, već i za povećanje broja kontrolnih kodova za pisače, signalna svjetla i drugu opremu. Godine 1964. pojavio se moćni IBM-360 u kojem je bajt konačno postao jednak osam bitova. Posljednji osmi bit bio je potreban za pseudo-grafičke likove.
Dodjeljivanje određenog binarnog koda znaku stvar je dogovora, koji je fiksiran u tablici kodova. Nažalost, postoji pet različitih kodiranja za ruska slova, pa se tekstovi stvoreni u jednom kodiranju neće ispravno odraziti u drugom.
Kronološki, jedan od prvih standarda za kodiranje ruskih slova na računalima bio je KOI8 ("Kod za razmjenu informacija, 8 bita"). Najčešće kodiranje je standardno ćirilično kodiranje sustava Microsoft Windows, označeno kraticom CP1251 ("CP" označava "Kodnu stranicu" ili "kodnu stranicu"). Apple je razvio vlastito kodiranje ruskih slova (Mac) za Macintosh računala. Međunarodna organizacija za standardizaciju (International Standards Organization, ISO) odobrila je kodiranje ISO 8859-5 kao standard za ruski jezik. Konačno, pojavio se novi međunarodni standard Unicode koji za svaki znak ne dodjeljuje jedan bajt, već dva, pa je stoga uz njegovu pomoć moguće kodirati ne 256 znakova, već čak 65536.
Sva ova kodiranja nastavljaju ASCII (American Standard Code for Information Interchange) kodnu tablicu koja kodira 128 znakova.

Tablica znakova ASCII:

kodirati simbol kodirati simbol kodirati simbol kodirati simbol kodirati simbol kodirati simbol
32 Prostor 48 . 64 @ 80 P 96 " 112 str
33 ! 49 0 65 A 81 P 97 a 113 q
34 " 50 1 66 B 82 R 98 b 114 r
35 # 51 2 67 C 83 S 99 c 115 s
36 $ 52 3 68 D 84 T 100 d 116 t
37 % 53 4 69 E 85 U 101 e 117 u
38 & 54 5 70 Ž 86 V. 102 f 118 v
39 " 55 6 71 G 87 W 103 g 119 w
40 ( 56 7 72 H 88 x 104 h 120 x
41 ) 57 8 73 Ja 89 Y 105 i 121 y
42 * 58 9 74 J 90 Z 106 j 122 z
43 + 59 : 75 K 91 [ 107 k 123 {
44 , 60 ; 76 L 92 \ 108 l 124 |
45 - 61 < 77 M 93 ] 109 m 125 }
46 . 62 > 78 N 94 ^ 110 n 126 ~
47 / 63 ? 79 O 95 _ 111 o 127 DEL

Binarno kodiranje teksta događa se na sljedeći način: kad se pritisne tipka, određeni niz električnih impulsa prenosi se na računalo, a svaki znak odgovara vlastitom slijedu električnih impulsa (nule i jedinice na strojni jezik). Program za tipkovnicu i upravljački program zaslona identificira lik prema tablici kodova i stvara njegovu sliku na zaslonu. Tako se tekstovi i brojevi spremaju u memoriju računala u binarnom kodu i programski pretvaraju u slike na ekranu.

Binarno kodiranje grafičkih informacija.

Od 80 -ih godina tehnologija obrade grafičkih informacija na računalu brzo se razvijala. Računalna grafikaŠiroko se koristi u računalnom modeliranju u znanstvenim istraživanjima, računalnim simulatorima, računalnoj animaciji, poslovnoj grafici, igrama itd.
Grafičke informacije na zaslonu prikazane su u obliku slike koja se formira od točaka (piksela). Zavirite u novinska fotografija i vidjet ćete da se sastoji i od najmanjih točaka. Ako su to samo crno -bijele točke, tada se svaka od njih može kodirati s 1 bitom. Ali ako na fotografiji postoje nijanse, tada vam dva bita omogućuju kodiranje 4 nijanse točkica: 00 - bijela, 01 - svijetlo siva, 10 - tamno siva, 11 - crna. Tri bita omogućuju vam kodiranje 8 nijansi itd.
Broj bitova potreban za kodiranje jedne nijanse boje naziva se dubina boje.

V. moderna računala razlučivost (broj točaka na zaslonu), kao i broj boja ovisi o video adapteru i može se programski promijeniti.
Slike u boji mogu imati različite načine rada: 16 boja, 256 boja, 65536 boja ( visoka boja), 16.777.216 boja ( prava boja). Jedna točka za način rada visoka boja Potrebno je 16 bita ili 2 bajta.
Najčešća rezolucija zaslona je 800 x 600 piksela. 480.000 bodova. Izračunajmo količinu video memorije potrebnu za način visoke boje: 2 bajta * 480 000 = 960 000 bajtova.
Za mjerenje količine informacija koriste se i veće jedinice:


Stoga je 960 000 bajtova približno jednako 937,5 KB. Ako osoba govori osam sati dnevno bez pauze, tada će za 70 godina svog života govoriti o 10 gigabajta informacija (to je 5 milijuna stranica - hrpa papira visoka 500 metara).
Brzina prijenosa je broj bitova koji se prenose u sekundi. Brzina prijenosa od 1 bita u sekundi naziva se 1 baud.

Bitmapa se pohranjuje u video memoriju računala, koja je binarni kôd slike, odakle je čita procesor (najmanje 50 puta u sekundi) i prikazuje na ekranu.


Binarno kodiranje audio informacija.

Od početka 90 -ih osobna računala dobio priliku raditi sa audio informacijama. Svako računalo sa zvučnom karticom može se spremiti kao datoteke ( datoteka je određena količina podataka pohranjena na disku i nazvana ) i reproducirati audio informacije. Kroz posebne softverski alati(uređivači audio datoteka) otvoreni široke mogućnosti za stvaranje, uređivanje i slušanje zvučnih datoteka. Stvaraju se programi za prepoznavanje govora i postaje moguće kontrolirati računalo glasom.
Točno zvučna kartica(kartica) pretvara analogni signal u diskretni fonogram i obrnuto, "digitalizirani" zvuk - u analogni (kontinuirani) signal, koji se dovodi na ulaz zvučnika.


Prilikom binarnog kodiranja analognog audio signala, uzorkuje se kontinuirani signal, tj. zamjenjuje se nizom njegovih pojedinačnih uzoraka - očitanja. Kvaliteta binarnog kodiranja ovisi o dva parametra: količini diskretne razine signal i broj uzoraka u sekundi. Broj uzoraka ili brzina uzorkovanja u audio adapterima je različit: 11 kHz, 22 kHz, 44,1 kHz itd. Ako je broj razina 65536, tada jedna zvučni signal izračunao 16 bitova (216). 16-bitni audio adapter kodira i reproducira zvuk točnije od 8-bitnog audio adaptera.
Broj bitova potreban za kodiranje jedne razine zvuka naziva se dubina zvuka.
Veličina mono-audio datoteke (u bajtovima) određena je formulom:


Sa stereo zvukom, glasnoća audio datoteke udvostručuje se, s četveroglasnim zvukom se učetverostručuje.
Kako programi postaju sve složeniji i njihove se funkcije povećavaju, kao i pojavom multimedijskih aplikacija, funkcionalni obujam programa i podataka raste. Ako je sredinom 80-ih uobičajen opseg programa i podataka bio desetke, a tek ponekad stotine kilobajta, onda je sredinom 90-ih počeo iznositi desetke megabajta. U skladu s tim, količina RAM -a raste.