Formati elektroničkih dokumenata koji se koriste u upravljanju dokumentacijom

U suvremenom svijetu, informacije su vrijedan resurs usporediv, osim s vremenom. Informacije obavljaju mnoge zadatke u životu društva, pružajući komunikacijske interakcije svih njegovih komponenti, pričvršćivanje, zadržavajući i prijenos primljenih i akumuliranih znanja. Ipak, ključna uloga igra informacije u upravljanju.

Informacije o upravljanju zabilježene su u dokumentima. Dokument, kao nositelj informacija, je informacijski resurs, koji je povjeren stručnjacima za dokumente, namijenjen organiziranju tehnološkog procesa dokumentacije i rada s dokumentima, uključujući korištenje modernog informacijske tehnologije.

U sadašnjoj fazi nitko ne sumnja u potrebu uvođenja novih informacijskih tehnologija u procese upravljanja i prije svega u opsegu dokumentacije (dou), kao u jednoj od najvažnijih komponenti tih procesa. Govoreći o uvođenju novih informacijskih i komunikacijskih tehnologija (ICT) na dou sferu, u pravilu, podrazumijeva se da je dizajn i implementacija automatiziranog sustava upravljanja dokumentacijom (AC dom) s većim brojem ugrađenih i priloženih modula implicirano.

Ali što je iza tih informacijskih tehnologija, uključujući sustave kao dou? Nekoliko stručnjaka za dokumente to razumije u cijelosti. U isto vrijeme, to je sasvim očito da bez osnovnih, temeljnih znanja u području informacijske tehnologije (IT) ne može učiniti dokumente.

U najnovijem nacionalnom standardu, reguliranje procesa upravljanja gost r ISO 15489-2007, odgovornost "dokumentacije za upravljanje" jasno je napisana, odnosno stručnjaci u području upravljanja dokumentacijom, za dizajn, provedbu i Upotreba automatiziranog sustava DOW-a , To sugerira da dokumenti više ne mogu biti promatrač treće strane prilikom projektiranja i provedbe AC \u200b\u200bdou i samo tada njegovih korisnika. Oni već moraju u početnoj fazi svog dizajna aktivno sudjelovati u procesu i uspostaviti osnovne zahtjeve za funkcionalnu komponentu ovog sustava.

U skladu s uvjetima kvalifikacija, dokumentacija je sudjelovala u formuliranju zadataka, projektiranja, rada i poboljšanja (djelomično informacijska podrška) Automatizirani informacijski sustavi i sustavi upravljanja. Također sudjeluje u razvoju najnovijih informacijskih tehnologija, dizajna i ažuriranja baza podataka i banaka podataka. Studira i sažima napredno domaće i inozemno iskustvo u području dow.

Studija računalnih informacijskih tehnologija u aktivnosti upravljanja Ona postaje važan zadatak suvremenog osposobljavanja u specijalitet "dokumentaciji i dokumentaciji upravljanja" , Moderni stručnjak trebao bi biti dobro usmjeren na raznolikost softvera i zamišljajući razinu varijabilnosti softverskih i tehnoloških rješenja za provedbu zadataka u domu.

Odavde možemo zaključiti da je potrebno proširiti horizonte dokumenata u području primjene informacijskih tehnologija u dou i njihovih značajki.

Najvažniji problem koji proizlazi iz uvođenja u aktivnosti bilo kojeg, osobito države, organizacija je problem očuvanja elektronički dokumenti i pristup njemu nakon znatnog vremenskog razdoblja. Drugi problemi nastaju prilikom razmjene elektroničkih dokumenata u upravljanju, posebno na međuresorj razini. U ovom trenutku, ovi problemi, djelomično, pomoći će u rješavanju otvorenih formata elektroničkih dokumenata.

Zemlja se aktivno raspravlja i pitanje uvođenja elektroničkog upravljanja dokumentima na razini vlade (na primjer, program "Elektronska Rusija" , "Elektronska moskva" , koncept formiranja e-uprave uvođenje elektroničkih upravnih propisa , Udruga državnih informacija Re-surks ). Rješenje problema isporučenih u ovim dokumentima nije moguće bez uzimanja u obzir formati elektroničkih dokumenata (ED).

Važni dokumenti postavljaju glavne smjerove razvoja informacijskih tehnologija u Ruska Federacijasu doktrina sigurnost informacija i strategija razvoja informacijsko društvo , Posebna pozornost posvećuje se programima i konceptima, zbog činjenice da je upravo u njima metodologija za uvođenje modernog u Rusiji, uključujući i dow opseg. Među njima su posebni interes saveznog ciljanog programa "Elektronska Rusija (2002-2010)" , Koncept formiranja u ruskoj federaciji e-uprave do 2010. godine , Koncept korištenja informacijskih tehnologija u aktivnostima savezne vlade do 2010. godine i tako dalje.

Koncept razvoja nacionalnog sustava standardizacije to je sustav mišljenja o problemima razvoja nacionalnog sustava standardizacije u Ruskoj Federaciji do 2010. godine i sadrži razumne ciljeve, ciljeve i upute razvoja.

Namjeravamo rješavati ovo pitanje kako bismo posvetili ciklus članaka u kojima će biti opisani glavni formati elektroničkih dokumenata, formiranje i razvoj slobodnog softver, specifičnost otvorenih formata elektroničkih dokumenata, praksa primjene u Rusiji i inozemstvu.

Format elektroničkog dokumenta je, točnije, format datoteke koji sadrži tekst i / ili audiovizualne informacije u kodiranom obliku. "Kodirano" ne bi trebalo biti zbunjeno s konceptom "šifriranog". Šifriranje se odnosi na način skrivanja informacija, a kodiranje je samo konverzija informacija iz jednog oblika na drugu.

Ako analizirate suvremene rječnike računalna tehnologija, koncept "formata" je raznolik i težak. Za korisnika je dovoljno znati da je format elektroničkog dokumenta određena definitivna logika ili algoritam, nakon što se informacije iz strojno čitljivog pretvaraju u osobu razumljivu i obrnuto. Formati mogu imati različite vrste, od jednostavnih i ograničenih na izazove do složenih i sposobnih za nošenje mnogih funkcija, uključujući mogućnosti stvaranja rasporeda, kompresije i šifriranja.

U području računalne tehnologije pod pojam "format" označava strukturu informacijskog objekta. Na primjer, format datoteke naziva se metoda organiziranja informacija elemenata (bitova, bajtova) u datoteci, a elektronički format dokumenta određuje metodu lokacije i prezentacije podataka u elektroničkom dokumentu .

Mi navodimo ukratko formati elektroničkih dokumenata koji se koriste u DOW-u .

Formati teksta koriste se za stvaranje tekstualnih tekstova i najčešće se stvaraju pomoću tekstualnih procesora.
Na primjer:

Doc je popularan elektronički format dokumenta, dizajniran za pregled i promjenu (uredi) tekst dokumenta. Format je iznimno zgodan ako istovremeno radite na dokumentu nekoliko izvođača.
.Pdf je identičan format prikaza na bilo kojem operativnom sustavu iu bilo kojoj primjeni. Popularno u pripremi dokumenata, prezentacijskih materijala, reklamnih knjižica, itd. Zbog činjenice da je format namijenjen za pregled dokumenta i ne dopušta da se neautoriziraju (ili neprimjetne) promjene u njoj, njegova uporaba u DOW-u je iznimno zgodan. Treba napomenuti da se svi standardi međunarodne organizacije za standardizaciju (ISO) šalju na Rostechregulaciju u PDF formatu.

RTF - dizajniran za pregled dokumenata i uređivanje u različitim verzijama softverskih proizvoda. Na primjer, verzije riječi za Windows. U DOE format Aktivno se koristi zbog činjenice da vam omogućuje pretvaranje datoteka bez gubitka strukture i smislenog dijela dokumenta i rad s njima u jednom operativnom sustavu, ali u raznim privremenim verzijama.
Grafički formati Spremite sliku (na primjer, fotografiju, crtanje) i podijeljeni su u dvije glavne vrste: vektorske formatekoji pohranjuju sliku kao skup geometrijskih oblika (DXF, EPS, CGM), i rasterske formatekoji je pohranio sliku kao skup dot piksela (BMP, TIFF, GIF). Spremljena slika može se dodati tekstu dokumenta i koristiti ga prilikom dizajniranja prezentacije.

Formati baze podataka kreiraju se pomoću sustava upravljanja bazom podataka (DBMS). Sastoje se od polja i stolova koji sadrže odvojeni elementi informacija. Pro-Gram vam omogućuje uspostavljanje veza između raspršenih elemenata. Na primjer, baza podataka zaposlenika može sadržavati polja s imenima zaposlenika, adresa i informacija o obavljenom radu.

Datoteke u formatu proračunske tablice pohranjuju se u ćelije broja i odnosa između tih brojeva. Tako jedna stanica može sadržavati formulu koja sažima podatke drugih dviju stanica. Poput datoteka baze podataka, datoteke za proračunske tablice obično imaju format programa, s kojim se stvaraju. Ovaj format je prikladan prilikom uzimanja u obzir radno vrijeme, itd.

Video i audio formati sadrže pokretne slike ( digitalni video, animacije) i zvučni podaci koji su najviše stvoreni i gledani koristeći odgovarajuće programe i pohranjene u jednokratnoj formatu. Najčešće korišteni su brzi i MPEG formati. Osim njihove pomoći, možete se prijaviti na sastanke, sastanke itd.

Neka nas prebivamo detaljnije o formatima označavanja koji sadrže ugrađene upute za prikazivanje i razumijevanje sadržaja datoteke.

Možete definirati elektronički jezik označavanja dokumenata na SGML (standardni generalizirani oznaku jezika). U početku je razvijen za razmjenu računalnih dokumenata u velikoj vladi i zrakoplovnim projektima. Široko se koristi u tiskanom i objavljivanju sfere, ali njegova složenost otežala je široko rasprostranjena za svakodnevnu uporabu.

SGML je odobrila međunarodna organizacija za standardizacijuISO. Kao međunarodni standard ISO 8879: 1986 Informacijske obrade - Tekst i uredski sustavi - Standardni generalizirani markup jezik (SGML) "i koristi se u državnim tijelima mnogih zemalja svijeta.

Iz jezika rasporeda SGML dokumenta, došlo je do novih, naprednijih označavanja jezikaHTML i XML.

HTML (HyperText Markup Language - "označavanje jezikahipertekst ") Ovo je SGML aplikacija. Koristi se za prikaz svih informacija na mreži. U skladu s međunarodnim standardomISO. 8879: 1986 i standard jedokumenti za označavanje jezika u World Wide Web (www).

XML (Extensible Markup jezik) - podskup sGML jezik, Primljeno popularnost pri upravljanju informacijama i razmjenom, kao relativno jednostavan jezik označavanja dokumenata. XML - Format teksta dizajniran za pohranjivanje strukturiranih podataka (umjesto postojećihdatoteke baze podataka ), razmijeniti informacije izmeđuprogrami , kao i stvoriti na svojoj osnovi više specijaliziranih jezika za označavanje, ponekad se nazivaju rječnicima.

XML format usvojen je od strane tijela za standardizaciju internetskih zajednica u lice svjetskih weba (W3C) konzorcija, koji razvija i provodi tehnološke standardeWorld Wide Web I UDDI organizacije (univerzalni opis, otkrivanje i integracija), razvijajući univerzalni opis standard, otkrivanje i integraciju, dizajniran za definiranje, registraciju i otkrivanje web usluga koje nude tvrtke. Ova specifikacija utvrđuje zahtjeve za registar distribuiranih informacija web-servisa .

Prema odredištu, formati elektroničkih dokumenata mogu se podijeliti na:
- formati za gledanje dokumenta;
- formati za gledanje i promjenu dokumenta;
- formati za promjenu dokumenta.

Ako je moguće, elektroničke formate dokumenata su:
- Prijenosna inter-platforma;
- prijenosni interpogramno;
- specijalizirana.

U pravilu se ne događa jasna granica između tih kategorija. Formati koji su prijenosni između različitih platformi mogu biti interpogram. Specijalizirani formati koriste se u uskim zadacima i koriste se, u pravilu samo primjenama jedne tvrtke i najčešće zatvaraju.

Dostupnost, formati mogu biti otvoreni i zatvoreni. Zatvoreni formati uvijek su imovina određene organizacije koja ih koristi kako bi se zajamčila kvaliteta kvalitete proizvoda i zaštiti od konkurenata za posuđivanje tehnologije.

Otvoreni format je javno dostupna specifikacija digitalnog pohrane podataka, bez licenciranih ograničenja kada se koristi. Konkretno, trebalo bi biti moguće uključiti podršku za otvorene formate kao ubesplatno (otvoreno) iu vlasnički (vlasnički, ne-free) proširenlicence karakteristične za svaku od ovih vrsta. Glavni cilj otvorenih formata je jamčiti mogućnost pristupa podacima za dugo vremena bez obzira na licencirana prava i tehničke specifikacije, Otvoreni format elektroničkog dokumenta štiti potrošača ne samo pri mijenjanju verzija programa, već i omogućuje čitanje dokumenata u uvjetima nedostupnosti programa, s kojim je stvoren elektronički dokument.

Što je izvanredan XML format? Extensible Margup Jezik Jezik Extensible Markup jezik sadrži ne samo podatke, već i "obavlja informacije koje opisuju ove podatke. Primjenjivo je na bilo koju aplikaciju računala i omogućuje vam da prenose velike količine informacija bez potrebe za vremenskom konstrukcijom podataka struktura podataka " .

Trenutno se proizvođači softvera odmah prebacuju na korištenje XML-a u njihovim proizvodima i dakle, implementiraju ideju standardizacije formata dokumenata na temelju XML-a, u biti otvoreni format elektronički dokumenti.

Nastavak u sljedećem broju.

Gost r ISO 15489-2007. Upravljanje dokumentima. Opći zahtjevi.

Elektronski dokumenti postali su isti kao važan dio arhiva kao pisač na tablici tajnika. Tekstovi, fotografije, crteži, baze podataka, audio i video datoteke brzo idu na "znamenku", uzrokujući raspravu o tome koje su formate najprikladniji za stalno skladištenje elektroničkih dokumenata. Srećom, ruski arhivisti imaju nekoga tko će tražiti pomoć.

O elektroničkih dokumenata se sve više i glasnije. U SAD-u, Architatsts posvećen ovom području rada punopravni profesionalni odmor - elektronički dan dokumenta (dan elektroničkog zapisa), koji se slavi 10. listopada. Dana dana, znanstvenici i prakse prikupljaju se zajedno kako bi razgovarali o aktualnim pitanjima očuvanja elektroničkih dokumenata.

Ruska znanstvena zajednica također ne ostaje izvan rješavanja praktičnih problema, iako nije posvećena crvenim danima kalendara. Prošle godine znanstvenici s ruskog državnog humanitarnog sveučilišta (RGU) proveli su veliku studiju različitih formata Elektronski dokumenti detaljan opis Nijanse svakog od njih.

Zaključci, glavni trendovi prikazani su u znanstvenom izvješću RGGu " Usporedna analiza Formati datoteka elektroničkih dokumenata trajnog (dugoročnog) skladišta ".1 Ovo je jedan od prvih sličnih vrsta istraživačkih radova u Rusiji, dopuštajući arhivu saveznih izvršnih vlasti, državnih i nevladinih organizacija, kao i Državni i općinski arhivi objektivno pristupaju problemu odabira najoptimalnijih arhiva. Format trajnog (dugoročnog) pohranjivanja elektroničkih dokumenata.

Neki zahtjevi za pohranjivanje elektroničkih dokumenata

Već u fazi dizajna, morski sustav je izgrađen na takav način da tijekom cijelog razdoblja skladištenja kako bi se osigurala autentičnost, pouzdanost i prikladnost dokumenta, bez obzira na promjene u sustavu2. Takve promjene u broju drugih mogu biti uzrokovane pretvaranjem formata, migracije3 između tehničke opreme, operativnih sustava ili softverske aplikacije, U tom slučaju treba napomenuti da kada bi se u sklopu kontrolne informacije 4 trebalo pohraniti informacije o savršenoj konverziji, informacije o savršenoj konverziji. Također je važno znati da, osim izvornog elektroničkog dokumenta, tijekom razdoblja skladištenja potrebno je zadržati dokument metapodataka (opis dokumenata) 5, koji sadrži sve metapodatke o elektroničkom dokumentu. Ako razdoblje skladištenja elektroničkog dokumenta prelazi očekivano razdoblje postojanja sustava za pohranu podataka, potrebno je dokumentirati planove migracije na nove sustave6.

Čitljivost je integralni opis elektroničkog dokumenta. Osigurano je tehničke karakteristike Dokument i softver na raspolaganju za arhiviranje zaposlenika. Format datoteke definiran za trajno (dugoročno) skladištenje mora biti u skladu s tehničkim mogućnostima državnih tijela, državnih i općinskih arhiva, nevladinih organizacija, itd. Za reprodukciju informacija u dugoročnoj perspektivi7. Štoviše, preporučuje se da se elektronički dokumenti naprave na skladištu popraćene softverskim alatima koji im omogućuju da se reproduciraju i priložene dokumentacije kit8.

Što se tiče formata datoteka, prikaz bi trebao biti podržan elektroničkim sustavima za upravljanje dokumentima, ne postoji točna ujednačenost. Danas su regulatorni pravni akti pomalo različiti u svojoj viziji konačnog popisa. Na primjer, prema preporukama za pripremu saveznih vlasti popisa dokumenata, stvaranje, skladištenje i uporabu treba provoditi u obliku elektroničkih dokumenata u organizaciji unutarnjih aktivnosti (odobren od strane Reda Rosarhiva od 29. travnja 2011. br. 32), prisutnost elektroničkih dokumenata u EDS-u u PDF-u, DOC, RTF, TXT, XML formata.

U skladu sa zahtjevima za informacijski sustavi Upravljanje elektroničkim dokumentima saveznih izvršnih tijela, uzimajući u obzir, uključujući potrebu za obradom putem podatkovnih sustava informacije o uslugama Ograničena distribucija (odobren redoslijedom Ministarstva komunikacija Ruske Federacije 02.09.2011. 221), Sljedeći četiri formata su obvezni: PDF, RTF, DOC, TIFF. Ostali regulatorni dokumenti omogućuju mogućnost prisutnosti u elektronički sustavi Državna tijela drugih formata datoteka elektroničkih dokumenata.

U rujnu 2014., Stručno vijeće u Ministarstvu trgovine koristi PDF / A kao format međuodregatalne interakcije u sed i dugoročno skladištenje elektronički dokumenti. Uz PDF / A predlaže se prenositi XML datoteku s detaljima elektroničkog dokumenta. Poznato je da će zajedno s FSO biti pripremljeni odgovarajućim redoslijedom sa zahtjevima za protok dokumenata.

Preporuke za odabir formata elektroničkog dokumenta

Izbor optimalnog formata za pohranu određuje se vrstom informacija, karakteristikama. tehnička sredstva Skladištenje (magnetski, optički, statički podaci e-pošte), značajke korisničkog pristupa podacima i softveru. Zbog smanjenja nosača medija i povećanja njihove sposobnosti, dostupnost softvera i čitljivosti format datoteke u dugo vremena prepoznaje se od strane glavnih čimbenika pri odabiru metode kodiranja. U komparativnoj analizi elektroničkih formata dokumenata (tekstualne, grafičke, audio i video datoteke, baze podataka, prezentacije), uzeti su u obzir sljedeće kriterije: uzet je u obzir sljedeći kriteriji:

  • programer i vlasništvo;
  • godina razvoja formata datoteka;
  • godina njegove posljednje modernizacije;
  • učestalost ažuriranja softvera;
  • dostupnost verzija;
  • otvoreni ili zatvoreni programski kod;
  • opis i usporedba matematičkih algoritama kompresije;
  • format odredišne \u200b\u200bdatoteke;
  • prisutnost i dostupnost pretvarača;
  • stabilnost s više replikacija 9.

Formati teksta

Tekst je glavni niz pohranjen u informacijskim arhivama. Tretira se kao tekstovi u ljudskim komunikacijskim jezicima (s izuzetkom hijeroglifnog pisanja, blizu grafičkog oblika) i programskih jezika. Često tekstualne datoteke Uključite grafičke fragmente informacija. Za razliku od ilustracija, audio i video zapisa, tekstualne podatke podložne su značajnoj kompresiji pomoću posebnih programa za arhiviranje.

Prema preporukama RGU-a, arhiviranje datoteka je bolje proizvesti u nešifričnom obliku koristeći zip (* .zip), a tekstualne informacije su učinkovitije za snimanje sljedeći formati: XML (uključuje XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011) (* .pdf). S nekim se uvjetima mogu koristiti formati teksta: Običan tekst (ISO 8859-1ncoding), PDF (* .pdf) (ugrađeni fontovi), bogati format teksta 1.x (* .rtf), html, sgml (* .sgml), otvoreni ured (* .sxw / * , ODT), OOXML (ISO / IEC DIS 29500) (* .docx), ePub (nehipkriptan) (* .pub). Najveća stabilnost prilikom migracije iz jednog formata u odabranom softveru u drugoj, * .Doc i * .xml formati se ponašaju. Tablica 1 prikazuje rezultate promjena u količini informacija tijekom migracije.

Tablica 1. Matrica se mijenja u količini informacija tijekom migracije (koliko puta)

Formati datoteka Izvor /
Formati migracijskih datoteka
* .doc
Microsoft Word. 97-2003
* .odt.* .xml* .rtf.* .pdf.* .pdf (pdf / a)
* .doc
Microsoft Word 97-2003
izvor<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 izvor>8,4 >7,7 >10 >18,4
* .xml<2,2 <8,2 izvor>1,04 >1,4 >2,6

Napomenuti da uredski paket OpenOffice, koja je distribuirana zbog besplatne licence, ima niz ograničenja, na primjer, u usporedbi s Microsoft Word 2007. Dakle, za stvaranje datoteke u XML formatu u OpenOffice 4 (Writer), dodatne tehničke postavke sustava biti potrebni (prisutnost instaliranog Java okruženja (JRE). Izvorni XML OpenOffice 4 * .stw Format još nije dobio značajnu podršku i opise. Microsoft Word 2007 ne prikazuje informacije u takvom formatu, otvarajući ga kao prazan dokument.

Grafički formati

Grafičke informacije S. visoka rezolucijaPogotovo polikrome i polutonske slike praktički nisu podložene za arhivsku kompresiju. U pravilu, rasterski formati se koriste za skladištenje, koji pružaju skladištenje realnih scena s velikom dubinom boje. Prema rezultatima komparativne analize, pokazalo se samo tri formata najprikladnija za dugoročno skladištenje rasterskih slika: TIFF (nekomprimirano), JPEG2000 (bez gubitaka) (* .jp2), PNG (* .png).

Za vektorske slike Preporučeni format je SVG (* .svg). Crteži, strukturne sheme, grafički predstavljaju algoritme koji se sastoje od grafičkih primitiva (segmenti i slomljene linije, poligone, krugove i elipse) najučinkovitije se provode u takvim vektorskim formatima kao SWG, WMF, CGM i slično. Međutim, nemoguće je zaboraviti da vektorski formati obično dovode do iskrivljenja sheme boja složene slike.

Za kodiranje 3D slika (formati virtualnih podataka) prihvatljivi su za korištenje X3D formata (* .x3d).

Audio i video formati

Kao ja. grafičke informacije, Audio i video informacije gotovo ne mogu učinkovito arhivirati: u prosjeku, njihova kompresija ne prelazi 5%. Odabir različitih vrsta kodiranja takvih podataka značajno utječe na volumen pohranjene datoteke, dakle, iz potrebne kvalitete reprodukcije i kao rezultat toga, preferencija ovog ili ona formatu ovisi o traženom količinom arhivske pohrane. Preporučeni audio skladišni formati: AIFF (PCM) (* .aif, * .aif), WAV (PCM) (* .wav), AES3 (LPCM) (* .aes). Najbolji rezultati o rezultatima usporedbe za sigurnost video podataka pokazali su formate: Motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2), AVI (nekomprimirani, Motion JPEG) (* .avi), QuickTime film ( Nekomprimirani, JPEG (* .mov).

Baze podataka i banke podataka

Izbor formata skladištenja baze podataka uglavnom ovisi o njegovoj strukturi. Ako je baza jedna datoteka, preporučljivo je pohraniti u kodiranje koje odgovara ovoj vrsti datoteke. Prilikom skladištenja baze čiji se zapisi sastoje od područja različitih struktura, RTF i PDF kodiranja se najčešće koriste, ali u eventualnom slučaju, ako nema audio i video fraza u bazi podataka. Najsvestraniji formati za dugoročne baze podataka za pohranu su vrijednosti odvojene zarezima (* .csv), razgraničeni tekst (* .txt), SQL ddl. U rijetkim slučajevima mogu se koristiti formati: DBF (* .dbf), OpenOffice (* .sxc / *. ODS), OOXML (ISO / IEC 29500) (*. XLSX).

Prezentacije

Nijedno od postojeći formati Ne pruža visok stupanj pouzdanosti očuvanja prezentacije. Uz neke rezervacije, možete preporučiti OpenOffice formati (* .sxi / *. ODP) i OOXML (ISO / IEC DIS 29500) (* .pptx). PowerPoint format (* .ppt) i drugi formati prezentacijskih datoteka ne zadovoljavaju zahtjeve dugoročnog pohrane.

Hibridne informacije

Za spremanje sveobuhvatnih dokumenata, struktura koja uključuje fragmente razne prirode (tekst, fotografiranje, crtanje, itd.), Moderni tekstualni formati kao što je MS Word, RTF su najprikladniji. Oni omogućuju uključivanje grafičke slike U rasterskim koda. Ako postoje mnoge ilustracije, ovaj dokument se preporučuje da se pohranjuju kao jedna slika - u ovom slučaju, grafički formati su poželjni.

Bilješke:

  1. Istraživački rad proveden je u okviru državnog ugovora br. 016-3 od 31. svibnja 2013. "Studija suvremenih procesa upravljanja dokumentima i upravljanja elektroničkim dokumentima. "Znanstveno izvješće" Usporedna analiza formata datoteka elektroničkih dokumenata stalnog (dugoročnog) skladišta "(kao dio provedbe aktivnosti Federalnog ciljnog programa" Kultura Rusije "(2012-2018).
  2. GOST R ISO 15489-2007 "Nacionalni standard Ruske Federacije. Sustav standarda o informacijama, knjižničarstvu i objavljivanju. Upravljanje dokumentima. Opći zahtjevi "(odobren po redoslijedu rostedregulacije od 12.03.2007. Br. 28-ST).
  3. Migracija elektroničkih dokumenata je radnju na pokretnim zapisima iz jednog sustava u drugi sustav, uz zadržavanje njihove autentičnosti, integriteta, pouzdanosti i jednostavnosti korištenja.
  4. Struktura opisa dokumenata sastoji se od opisa fizičke ili tehničke strukture i njegove logičke strukture, odnosno odnose između elemenata podataka koji čine dokument. Za više informacija o stvaranju, upravljanju i korištenju metapodataka, pogledajte GOST R ISO 23081-1-2008. Sustav standarda o informacijama, knjižničarstvu i objavljivanju. Procesi upravljanja dokumentima. Metapodatke za dokumente. Dio 1. Načela (odobren putem Reda rostedregulacije od 13. studenog 2008. br. 310-ST).
  5. GOST R 54471-2011 "Elektronski sustavi za upravljanje dokumentima. Upravljanje dokumentima. Informacije pohranjene u u elektroničkom obliku, Preporuke za osiguranje pouzdanosti i pouzdanosti. "
  6. Pravila za organiziranje skladištenja, stjecanja, računovodstvo i korištenje dokumenata arhivske fonda Ruske Federacije i drugih arhivskih dokumenata u državnom i općinskom arhivu, muzeji i knjižnice, organizacije Ruske akademije znanosti (odobreni od strane Reda Ministarstva Kultura i masovna komunikacija Ruske Federacije 18. siječnja 2007. br. 19).
  7. Vidi Ibid. 4.4.3.
  8. Replikacija je metoda spremanja digitalnih informacija stvaranjem jednog ili više kompletnih kopija (klonova) digitalnih materijala. Replikacija zahtijeva posebne događaje kako bi podržao sve kopije u ažurnom.

Tekstualne datoteke su najčešći tip podataka u svijetu računala. Postoji nekoliko problema povezanih s tekstualnim datotekama. Prvo - ekstremno veliki broj Simboli potrebni za podršku različitih jezika. Američki programeri za rad s 128 znakova koriste skup američkih ASCII simbola (američki standardni kod za razmjenu informacija). Kako bi podržao druge jezike, često nije dovoljno i 256 znakova, dakle, postupno prijelaz na Unicode kodiranje se sada provodi, u kojem su dva bajta već dane za pohranjivanje jednog znaka (tj. Moguće je kodirati 65.536 različitih znakova ).

Drugi problem je u tome što ljudi žele da tiskani dokumenti sadrže grafikone, grafikone, bilješke, naslove i kako bi se koristili različiti fontovi. Dokumenti distribuirani na internetu ( na liniji Dokumenti) mogu sadržavati animaciju, linkove na različite mrežni resursi I zvučnu podršku.

Mnoge tekstualne datoteke se prenose kao jednostavan tekst (običan tekst). Jednostavan tekst je teško napraviti atraktivan i lako čitljiv, jer nema fontova različitih dizajna, grafova, zaglavlja, titlova itd. dodatne značajke Nosite ime tekst za označavanje (Markup).

Govoreći o označavanju teksta, dodjeljuju pojmove fizički i logičan Obilježava. Kada koristite fizički izgled teksta, označen je točan prikaz svakog fragmenta. Na primjer, "centrirani tekst, 14 Keglem, masti, vremena slušalice". Ako logička oznaka ukazuje na logičku vrijednost ovog fragmenta, na primjer, "je naslov poglavlja". Ove dvije metode obilježavanja su namijenjene, u pravilu, za uporabu u različitim situacijama. Da biste ispisali tekst na pisaču, morate koristiti fizičku oznaku. Odluke treba izvršiti na veličini polja i odlomku. Rane verzije tekstualnih procesora koristili su samo fizičku vrstu oznake. U isto vrijeme, font, veličina i stil bio je usmjeren na svaki fragment.

Prilikom razmjene informacija s drugim ljudima, fizički dizajn teksta nameće niz ograničenja, posebno za online dokumente. Veličina zaslona, \u200b\u200brazlučivost, fontovi su različiti za različiti sustavi, Iz tih razloga, logički dizajn teksta sve je više. U nekim slučajevima, logički dizajn je praktički potrebno: prilikom stvaranja elektroničkih dokumenata kao što su www stranice ili prilikom stvaranja i objavljivanja rasutog rada, kao što su knjige.

Za spremanje oznake dokumenata prilikom prenošenja informacije o tekstu od automobila do uporabe automobila različite metode, Tekstualni procesori I. sustavi izdavanja Posebno dizajnirani formati datoteka, koji ne sadrže ne samo tekst, već i informacije o tome kako se mora urediti. Glavni problem ovdje je nekonzistentno s takvim formatima, iako najsloženiji programi obično mogu čitati datoteke u formatu natjecatelja. Primjeri ovog pristupa su tekst teksta riječi i Starwritera.

Uz drugačiji pristup, posebne naredbe za označavanje umetnute izravno u dokument. Čak i ako nemate softver koji podržava takav format, još uvijek ga razumijete u njemu. Postoji mnogo načina za takvu prezentaciju rasporeda teksta, uključujući:

  • Hipertekstuk oznaku jezika (HTML) koji se koristi u World Wide Webu;
  • Tex i lateksa su popularni za mnoge akademske publikacije, kao i matematičare, fizičare, kemičare, pa čak i glazbenike.

Primjeri programa koji vam omogućuju da postavite tekst na sličan način, poslužite netscape skladatelja i lix (Klyx).

Datoteke koje stvaraju različiti urednici često imaju jedinstvene ekstenzije koje omogućuju, bez gledanja u dokument, pogodite metode polaganja teksta. Dakle, datoteke koje su stvorili urednici običnog teksta pripreme često imaju proširenje. Txt i pripremljeni u uredniku lyx - .lyx. Procesor teksta riječi prema zadanim postavkama stvara datoteke u MS Word formatu (proširenje.doc), ali također podržava druge formate, kao što je RTF (proširenje.rtf). Dokumenti koji sadrže naredbe za označavanje hTML jezikimati proširenje.html ili.htm.

Očito je nemoguće navesti sve uređivače teksta. Mnogi od njih su "izoštreni" pod jednom ili drugom određenom aktivnošću. Popis koji se raspravlja u nastavku prikazuje samo mali dio uređivača teksta.

Urednici neformatiranih tekstova

Notepad. Izgrađen u B. operacijski sustav Windows, razumijevanje i jednostavno i korištenje; MEDIT. Ima sličnosti s uređivanjem iz MS DOS-a, komponente upravitelj datoteka mc. (Ponoćni zapovjednik) Linux OS; Kedit. Siastoran uređivač teksta, dio KDE Linuxa; Krite. Urednik teksta dodatne postavke U usporedbi s drugim jednostavnim uređivačima teksta; Emacs. kombinira funkcije upravitelja datoteka i uređivača teksta; jedan od prepoznatljive značajke je sposobnost stvaranja makronaredbi (makronaredbi); U svim UNIX klonovima, uključujući Linux; Emacs se može koristiti u MS Windows.

Urednici koji stvaraju tekst s označavanjem elemenata

Riječ. Služi za stvaranje raznih tiskanih dokumenata, je komponenta. office u MS Windows; Starwriter. To je dio programa StarOffice, izgled i funkcionalnost, sličan je riječju, djeluje jednako dobro u MS Windows iu Linux OS-u; Lyx. (KLYX u KDE) moderni urednik teksta, namijenjen ljudima koji žele dobiti dokument koji izgleda profesionalno, ali potrošiti na njezino stvaranje najmanje vremena; Urednik umeće Tex i lateks označavajući timski tekst; Netscape skladatelj. Umeće HTML jezik označavanja teksta, postoje verzije za Linux OS i MS Windows.

To jest, formati za pohranjivanje tekstualnih datoteka. Sada glavna sredstva, gotovo monopolist u pripremi standarda tekstualne dokumente On je program MicrosoftWord, tako da će se fokus biti uplaćen formatama namijenjenim za ovaj program.

ali)Doc, Formati proširenja . docTo je uobičajeni način predstaviti tekst vmikrosoftword. Tekst s ekstenzijom .doc sadrži podatke o tome gdje i što je slom na nizovima i paragrafima, metoda usklađivanja teksta, zvonjavanje između redaka i paragrafa, pogled i crtanje fontova i tako dalje. Sve se to zove formatiranje teksta, Formatiranje teksta i format datoteke je potpuno drugačiji koncepti, iako su izraženi u bliskim riječima.

Ne uvijek stara verzija MicrosoftWord može čitati ono što je stvoreno na modernijoj verziji. Ili kada se preselite na staru verziju, ili drugi program je izgubljen nešto iz formatiranja dokumenta. No, novije verzije uvijek mogu biti u potpunosti pročitati ono što je stvoreno u ranijim verzijama.

FormatDoc Omogućuje vam da stvorite najkvalitetnije formatiranje teksta, ali stvoreni tekst se ne igra uvijek na drugom računalu.

bRTF., Proširenje .rtfracted kao pravotEKST.format., Što znači odgovarajući format teksta, Obiteljski formati su vrlo široku kompatibilnost, razumiju sve tekstualne procesore, stare i nove. Ali ne svi uređivači teksta, budući da su urednici više primitivni način rada s tekstom. Mnogi ne-crijeva (na primjer, grafički) programi rade značajno bolje rade s CRTF nego cDOC. Kompatibilnost se provodi jer se triformating pretvara u softverske upute koje vam omogućuju da otvorite i pregledate dokument na raznim sredstvima.

Ako trebate prepisati tekst na drugo računalo pomoću diskete, dok nije poznato što je program rada s tekstom vrijedan, onda je spreman da ga spremite u RTF formatu. Format datoteka je nešto veći volumen, thandoc, ali jamstvo se čini da će drugo računalo razumjeti ovaj tekst.

FormatRTF. Omogućuje vam da reproducirate stvoreni tekst na bilo kojoj verziji.Microsoft.Riječ. iu mnogim programima ne-crijeva.

u)Txt., Ovo je primitivni format teksta koji ne sadrži složeno oblikovanje. Od formatiranja ovdje se sačuva samo podjela na stavka, a svaka linija se pretvara u paragraf. Formatxt, primjenjuje programeri za pisanje programa, jer Računalo ne treba "lijepo" na ljudskim konceptima teksta. To je još uvijek formata za korištenje teksta kada tekst mora razumjeti korisnike s različitim softverom kada konačni program ne prepoznaje druge formate datoteka.

U sustavu Windows, softverski alat za rad s tekstovima u formatu.txt- Notepad. (Prijenosno računalo), To je zgodno pregledavanje različiti programi i elektroničkih dokumenata koji nisu namijenjeni za ispis.

Poruke e-mail Također nemaju razvijeni oblikovanje. Stoga, ako šaljete dokument u obliku poštanske poruke, on će izgubiti svoj izgled, Ako želite prenijeti poštom ne samo sadržajem, već i izgled teksta, mora se poslati kao doc datoteka priključen na poštansku poruku.

Postoji mnogo ostali tekstualni formati, 10 ili više godina, nekoliko drugih tekstualnih programa, kao što je domaći program "Lexicon", također su popularni. Za programe raseljene bymicrosoftword, vlastite, izvorne formate teksta, koji mogu biti potrebni čitajući tekstove tog vremena.

Konačno, tekst se može pohraniti i na jedan stupanj ili drugi za uređivanje desetaka drugih formata namijenjenih da ne stvaraju tekstualne dokumente, već i za druge svrhe. Kao primjeri, možete donijeti format . htmlna CreateWeb stranice, . xlx.za urednik tablice Excel, popularnaposcriptformat . pdf.i mnogi drugi.