Studija formata elektroničkih dokumenata korištenih u dou. Formati elektroničkih dokumenata koji se primjenjuju u upravljanju aktivnostima

To jest, formati za pohranjivanje tekstualnih datoteka. Sada glavna sredstva, gotovo monopolist u pripremi standarda tekstualne dokumente On je program MicrosoftWord, tako da će se fokus biti uplaćen formatama namijenjenim za ovaj program.

ali)Doc, Formati proširenja . docTo je uobičajeni način predstaviti tekst vmikrosoftword. Tekst s ekstenzijom .doc sadrži podatke o tome gdje i što je slom na nizovima i paragrafima, metoda usklađivanja teksta, zvonjavanje između redaka i paragrafa, pogled i crtanje fontova i tako dalje. Sve se to zove formatiranje teksta, Formatiranje teksta i format datoteke je potpuno drugačiji koncepti, iako su izraženi u bliskim riječima.

Ne uvijek stara verzija MicrosoftWord može čitati ono što je stvoreno na modernijoj verziji. Ili kada se preselite na staru verziju, ili drugi program je izgubljen nešto iz formatiranja dokumenta. No, novije verzije uvijek mogu biti u potpunosti pročitati ono što je stvoreno u ranijim verzijama.

FormatDoc Omogućuje vam da stvorite najkvalitetnije formatiranje teksta, ali stvoreni tekst se ne igra uvijek na drugom računalu.

bRTF., Proširenje .rtfracted kao pravotEKST.format., Što znači odgovarajući format teksta, Obiteljski formati su vrlo široku kompatibilnost, razumiju sve tekstualne procesore, stare i nove. Ali ne svi uređivači teksta, budući da su urednici više primitivni način rada s tekstom. Mnogi ne-crijeva (na primjer, grafički) programi rade značajno bolje rade s CRTF nego cDOC. Kompatibilnost se provodi jer se triformating pretvara u softverske upute koje vam omogućuju da otvorite i pregledate dokument na raznim sredstvima.

Ako trebate prepisati tekst na drugo računalo pomoću diskete, dok nije poznato što je program rada s tekstom vrijedan, onda je spreman da ga spremite u RTF formatu. Format datoteka je nešto veći volumen, thandoc, ali jamstvo se čini da će drugo računalo razumjeti ovaj tekst.

FormatRTF. Omogućuje vam da reproducirate stvoreni tekst na bilo kojoj verziji.Microsoft.Riječ. iu mnogim programima ne-crijeva.

u)Txt., Ovo je primitivni format teksta koji ne sadrži složeno oblikovanje. Od formatiranja ovdje se sačuva samo podjela na stavka, a svaka linija se pretvara u paragraf. Formatxt, primjenjuje programeri za pisanje programa, jer Računalo ne treba "lijepo" na ljudskim konceptima teksta. To je još uvijek formata za korištenje teksta kada tekst mora razumjeti korisnike s različitim softverom kada konačni program ne prepoznaje druge formate datoteka.

U sustavu Windows, softverski alat za rad s tekstovima u formatu.txt- Notepad. (Prijenosno računalo), To je zgodno pregledavanje različiti programi i elektroničkih dokumenata koji nisu namijenjeni za ispis.

Poruke e-mail Također nemaju razvijeni oblikovanje. Stoga, ako šaljete dokument u obliku poštanske poruke, onda će izgubiti svoj izgled. Ako želite prenijeti poštom ne samo sadržajem, već i izgled teksta, mora se poslati kao doc datoteka priključen na poštansku poruku.

Postoji mnogo ostali tekstualni formati, 10 ili više godina, nekoliko drugih tekstualnih programa, kao što je domaći program "Lexicon", također su popularni. Za programe raseljene bymicrosoftword, vlastite, izvorne formate teksta, koji mogu biti potrebni čitajući tekstove tog vremena.

Konačno, tekst se može pohraniti i na jedan stupanj ili drugi za uređivanje desetaka drugih formata namijenjenih da ne stvaraju tekstualne dokumente, već i za druge svrhe. Kao primjeri, možete donijeti format . hTML.na CreateWeb stranice, . rešetkaza urednik tablice Excel, popularnaposcriptformat . pdf.i mnogi drugi.

Elektronski dokumenti postali su isti kao važan dio arhiva kao pisač na tablici tajnika. Tekstovi, fotografije, crteži, baze podataka, audio i video datoteke brzo idu na "znamenku", uzrokujući raspravu o tome što formati su najprikladniji za stalno skladištenje. elektronički dokumenti, Srećom, ruski arhivisti imaju nekoga tko će tražiti pomoć.

O elektroničkih dokumenata se sve više i glasnije. U SAD-u, Architatsts posvećen ovom području rada punopravni profesionalni odmor - elektronički dan dokumenta (dan elektroničkog zapisa), koji se slavi 10. listopada. Dana dana, znanstvenici i prakse prikupljaju se zajedno kako bi razgovarali o aktualnim pitanjima očuvanja elektroničkih dokumenata.

Ruska znanstvena zajednica također ne ostaje izvan rješavanja praktičnih problema, iako nije posvećena crvenim danima kalendara. Prošle godine znanstvenici s ruskog državnog humanitarnog sveučilišta (RGgu) proveli su veliki studij različitih formata elektroničkih dokumenata s datotekama detaljan opis Nijanse svakog od njih.

Zaključci, glavni trendovi prikazani su u znanstvenom izvješću RGGu " Usporedna analiza Formati datoteka elektroničkih dokumenata trajnog (dugoročnog) skladišta ".1 Ovo je jedan od prvih sličnih vrsta istraživačkih radova u Rusiji, dopuštajući arhivu saveznih izvršnih vlasti, državnih i nevladinih organizacija, kao i Državni i općinski arhivi objektivno pristupaju problemu odabira najoptimalnijih arhiva. Format trajnog (dugoročnog) pohranjivanja elektroničkih dokumenata.

Neki zahtjevi za pohranjivanje elektroničkih dokumenata

Već u fazi dizajna, morski sustav je izgrađen na takav način da tijekom cijelog razdoblja skladištenja kako bi se osigurala autentičnost, pouzdanost i prikladnost dokumenta, bez obzira na promjene u sustavu2. Takve promjene u broju drugih mogu biti uzrokovane pretvaranjem formata, migracije3 između tehničke opreme, operativnih sustava ili softverske aplikacije, U tom slučaju treba napomenuti da kada bi se u sklopu kontrolne informacije 4 trebalo pohraniti informacije o savršenoj konverziji, informacije o savršenoj konverziji. Također je važno znati da, osim izvornog elektroničkog dokumenta, tijekom razdoblja skladištenja potrebno je zadržati dokument metapodataka (opis dokumenata) 5, koji sadrži sve metapodatke o elektroničkom dokumentu. Ako razdoblje skladištenja elektroničkog dokumenta prelazi očekivano razdoblje postojanja sustava za pohranu podataka, potrebno je dokumentirati planove migracije na nove sustave6.

Čitljivost je integralni opis elektroničkog dokumenta. Osigurano je tehničke karakteristike Dokument I. softverDostupni arhivski radnici. Format datoteke definiran za trajno (dugoročno) skladištenje mora biti u skladu s tehničkim mogućnostima državnih tijela, državnih i općinskih arhiva, nevladinih organizacija, itd. Za reprodukciju informacija u dugoročnoj perspektivi7. Štoviše, zakonodavno je sadržano da su elektroničke dokumenti napravljeni za skladištenje popraćene softverdopuštajući im da se reproduciraju i skup prateće dokumentacije8.

Što se tiče formata datoteka, prikaz bi trebao biti podržan elektroničkim sustavima za upravljanje dokumentima, ne postoji točna ujednačenost. Danas su regulatorni pravni akti pomalo različiti u svojoj viziji konačnog popisa. Na primjer, prema preporukama za pripremu saveznih vlasti popisa dokumenata, stvaranje, skladištenje i uporabu treba provoditi u obliku elektroničkih dokumenata u organizaciji unutarnjih aktivnosti (odobren od strane Reda Rosarhiva od 29. travnja 2011. br. 32), prisutnost elektroničkih dokumenata u EDS-u u PDF-u, DOC, RTF, TXT, XML formata.

U skladu sa zahtjevima za informacijske sustave upravljanja elektroničkim dokumentima saveznih izvršnih tijela, uzimajući u obzir potrebu za obradom putem podataka o uslugama sustava ograničene distribucije (odobren redoslijedom Ministarstva komunikacije Ruske Federacije 02.09. 2011 br. 221), sljedeće četiri formata su obvezni: PDF, RTF, DOC, TIFF. Ostali regulatorni dokumenti omogućuju mogućnost prisutnosti u elektroničkim sustavima državnih tijela drugih formata datoteka elektroničkih dokumenata.

U rujnu 2014., Stručno vijeće u Ministarstvu trgovine koristi PDF / A kao format međuodregatalne interakcije u sed i dugoročno skladištenje elektronički dokumenti. Uz PDF / A predlaže se prenositi XML datoteku s detaljima elektroničkog dokumenta. Poznato je da će zajedno s FSO biti pripremljeni odgovarajućim redoslijedom sa zahtjevima za protok dokumenata.

Preporuke za odabir formata elektroničkog dokumenta

Izbor optimalnog formata skladištenja određen je vrstom informacija, karakteristikama tehničkog načina skladištenja (magnetskim, optičkim, čvrstim e-poštom), značajkama pristupa korisnicima podacima i softveru. Zbog smanjenja nosača medija i povećanja njihove sposobnosti, dostupnost softvera i čitljivosti format datoteke u dugo vremena prepoznaje se od strane glavnih čimbenika pri odabiru metode kodiranja. U komparativnoj analizi elektroničkih formata dokumenata (tekstualne, grafičke, audio i video datoteke, baze podataka, prezentacije), uzeti su u obzir sljedeće kriterije: uzet je u obzir sljedeći kriteriji:

  • programer i vlasništvo;
  • godina razvoja formata datoteka;
  • godina njegove posljednje modernizacije;
  • učestalost ažuriranja softvera;
  • dostupnost verzija;
  • otvoreni ili zatvoreni programski kod;
  • opis i usporedba matematičkih algoritama kompresije;
  • format odredišne \u200b\u200bdatoteke;
  • prisutnost i dostupnost pretvarača;
  • stabilnost s više replikacija 9.

Formati teksta

Tekst je glavni niz pohranjen u informacijskim arhivama. Tretira se kao tekstovi u ljudskim komunikacijskim jezicima (s izuzetkom hijeroglifnog pisanja, blizu grafičkog oblika) i programskih jezika. Često, tekstualne datoteke uključuju fragmente grafičkih informacija. Za razliku od ilustracija, audio i video zapisa, tekstualne podatke podložne su značajnoj kompresiji pomoću posebnih programa za arhiviranje.

Prema preporukama RGU-a, arhiviranje datoteka je bolje proizvesti u nešifričnom obliku koristeći zip (* .zip), a tekstualne informacije su učinkovitije za snimanje sljedeći formati: XML (uključuje XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011) (* .pdf). Neki uvjeti mogu koristiti tekstualne formate: običan tekst (ISO 8859-1ncoding), PDF (* .pdf) (ugrađeni fontovi), bogati format teksta 1.x (* .rtf), HTML (uključuju Doctype deklaraciju), SGML (* .sgml), Open Office (* .sxw / *. ODT), OOXML (ISO / IEC DIS 29500) (* .docx), ePub (nehipkriptan) (* .pub). Najveća stabilnost prilikom migracije iz jednog formata u odabranom softveru u drugoj, * .Doc i * .xml formati se ponašaju. Tablica 1 prikazuje rezultate promjena u količini informacija tijekom migracije.

Tablica 1. Matrica se mijenja u količini informacija tijekom migracije (koliko puta)

Formati datoteka Izvor /
Formati migracijskih datoteka
* .doc.
Microsoft Word 97-2003
* .odt.* .xml.* .rtf.* .pdf.* .pdf (pdf / a)
* .doc.
Microsoft Word 97-2003
izvor<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 izvor>8,4 >7,7 >10 >18,4
* .xml.<2,2 <8,2 izvor>1,04 >1,4 >2,6

Imajte na umu da je OpenOffice uredski paket, koji je distribuiran zahvaljujući besplatnoj dozvoli, ima niz ograničenja, na primjer, u usporedbi s Microsoft Word 2007. Dakle, za stvaranje datoteke u XML formatu u OpenOffice 4 (Writer), dodatni tehnički Potrebno je postavke sustava (bit će potrebna prisutnost instaliranog Java okruženja. (JRE). Izvorni XML OpenOffice 4 * ..STW format još nije dobio značajnu podršku i opise. Microsoft Word 2007 ne prikazuje informacije u takvom format, otvoriti ga kao prazan dokument.

Grafički formati

Grafičke informacije s visokom razlučivošću, osobito polikrome i polutonske slike, praktički nije podložno za arhiviranje kompresije. U pravilu, rasterski formati se koriste za skladištenje, koji pružaju skladištenje realnih scena s velikom dubinom boje. Prema rezultatima komparativne analize, pokazalo se da su samo tri formata najprikladnija za dugotrajno skladištenje. raster slike: TIFF (nekomprimirano), JPEG2000 (bez gubitaka) (* .jp2), PNG (* .png).

Za vektorske slike Preporučeni format je SVG (* .svg). Crteži, strukturne sheme, grafički predstavljaju algoritme koji se sastoje od grafičkih primitiva (segmenti i slomljene linije, poligone, krugove i elipse) najučinkovitije se provode u takvim vektorskim formatima kao SWG, WMF, CGM i slično. Međutim, ne smijemo to zaboraviti vektorske formate Obično dovodi do izobličenja sheme boja složene slike.

Za kodiranje 3D slika (formati virtualnih podataka) prihvatljivi su za korištenje X3D formata (* .x3d).

Audio i video formati

Kao i grafičke informacije, audio i video informacije gotovo ne mogu učinkovito arhivirati: u prosjeku, njihova kompresija ne prelazi 5%. Odabir različitih vrsta kodiranja takvih podataka značajno utječe na volumen pohranjene datoteke, dakle, iz potrebne kvalitete reprodukcije i kao rezultat toga, preferencija ovog ili ona formatu ovisi o traženom količinom arhivske pohrane. Preporučeni audio skladišni formati: AIFF (PCM) (* .aif, * .aif), WAV (PCM) (* .wav), AES3 (LPCM) (* .aes). Najbolji rezultati o rezultatima usporedbe za sigurnost video podataka pokazali su formate: Motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2), AVI (nekomprimirani, Motion JPEG) (* .avi), QuickTime film ( Nekomprimirani, JPEG (* .mov).

Baze podataka i banke podataka

Izbor formata skladištenja baze podataka uglavnom ovisi o njegovoj strukturi. Ako je baza jedna datoteka, preporučljivo je pohraniti u kodiranje koje odgovara ovoj vrsti datoteke. Prilikom skladištenja baze čiji se zapisi sastoje od područja različitih struktura, RTF i PDF kodiranja se najčešće koriste, ali u eventualnom slučaju, ako nema audio i video fraza u bazi podataka. Najsvestraniji formati za dugoročne baze podataka za pohranu su vrijednosti odvojene zarezima (* .csv), razgraničeni tekst (* .txt), SQL DDL. U rijetkim slučajevima mogu se koristiti formati: DBF (* .dbf), OpenOffice (* .sxc / *. ODS), OOXML (ISO / IEC 29500) (*. XLSX).

Prezentacije

Nijedno od postojeći formati Ne pruža visok stupanj pouzdanosti očuvanja prezentacije. Uz neke rezervacije, možete preporučiti OpenOffice formati (* .sxi / *. ODP) i OOXML (ISO / IEC DIS 29500) (* .pptx). PowerPoint format (* .ppt) i drugi formati prezentacijskih datoteka ne zadovoljavaju zahtjeve dugoročnog pohrane.

Hibridne informacije

Za spremanje sveobuhvatnih dokumenata, struktura koja uključuje fragmente razne prirode (tekst, fotografiranje, crtanje, itd.), Moderni tekstualni formati kao što je MS Word, RTF su najprikladniji. Oni omogućuju uključivanje grafičke slike U rasterskim koda. Ako postoje mnoge ilustracije, ovaj dokument se preporučuje da se pohranjuju kao jedna slika - u ovom slučaju, grafički formati su poželjni.

Bilješke:

  1. Istraživački rad proveden je u okviru državnog ugovora br. 016-3 od 31. svibnja 2013. "Studija suvremenih procesa upravljanja dokumentima i upravljanja elektroničkim dokumentima. "Znanstveno izvješće" Usporedna analiza formata datoteka elektroničkih dokumenata stalnog (dugoročnog) skladišta "(kao dio provedbe aktivnosti Federalnog ciljnog programa" Kultura Rusije "(2012-2018).
  2. GOST R ISO 15489-2007 "Nacionalni standard Ruske Federacije. Sustav standarda o informacijama, knjižničarstvu i objavljivanju. Upravljanje dokumentima. Opći zahtjevi "(odobren po redoslijedu rostedregulacije od 12.03.2007. Br. 28-ST).
  3. Migracija elektroničkih dokumenata je radnju na pokretnim zapisima iz jednog sustava u drugi sustav, uz zadržavanje njihove autentičnosti, integriteta, pouzdanosti i jednostavnosti korištenja.
  4. Struktura opisa dokumenta sastoji se od opisa njegove fizičke ili tehnička struktura i njegova logička struktura, odnosno odnosi između elemenata podataka koji čine dokument. Za više informacija o stvaranju, upravljanju i korištenju metapodataka, pogledajte GOST R ISO 23081-1-2008. Sustav standarda o informacijama, knjižničarstvu i objavljivanju. Procesi upravljanja dokumentima. Metapodatke za dokumente. Dio 1. Načela (odobren putem Reda rostedregulacije od 13. studenog 2008. br. 310-ST).
  5. GOST R 54471-2011 "Elektronski sustavi za upravljanje dokumentima. Upravljanje dokumentima. Informacije pohranjene u u elektroničkom obliku, Preporuke za osiguranje pouzdanosti i pouzdanosti. "
  6. Pravila za organiziranje skladištenja, stjecanja, računovodstvo i korištenje dokumenata arhivske fonda Ruske Federacije i drugih arhivskih dokumenata u državnom i općinskom arhivu, muzeji i knjižnice, organizacije Ruske akademije znanosti (odobreni od strane Reda Ministarstva Kultura i masovna komunikacija Ruske Federacije 18. siječnja 2007. br. 19).
  7. Vidi Ibid. 4.4.3.
  8. Replikacija je metoda spremanja digitalnih informacija stvaranjem jednog ili više kompletnih kopija (klonova) digitalnih materijala. Replikacija zahtijeva posebne događaje kako bi podržao sve kopije u ažurnom.

Tekstualne datoteke su najčešći tip podataka u svijetu računala. Postoji nekoliko problema povezanih s tekstualnim datotekama. Prvi je iznimno velik broj znakova potrebnih za podršku različitih jezika. Američki programeri za rad s 128 znakova koriste skup američkih ASCII simbola (američki standardni kod za razmjenu informacija). Kako bi podržao druge jezike, često nije dovoljno i 256 znakova, dakle, postupno prijelaz na Unicode kodiranje se sada provodi, u kojem su dva bajta već dane za pohranjivanje jednog znaka (tj. Moguće je kodirati 65.536 različitih znakova ).

Drugi problem je u tome što ljudi žele da tiskani dokumenti sadrže grafikone, grafikone, bilješke, naslove i kako bi se koristili različiti fontovi. Dokumenti distribuirani na internetu ( na liniji Dokumenti) mogu sadržavati animaciju, linkove na različite mrežni resursi I zvučnu podršku.

Mnoge tekstualne datoteke se prenose kao jednostavan tekst (običan tekst). Jednostavan tekst je teško napraviti atraktivan i lako čitljiv, jer nema fontova različitih dizajna, grafova, naslova, titlova itd. Te se dodatne značajke nazivaju tekst za označavanje (Markup).

Govoreći o označavanju teksta, dodjeljuju pojmove fizički i logičan Obilježava. Kada koristite fizički izgled teksta, označen je točan prikaz svakog fragmenta. Na primjer, "centrirani tekst, 14 Keglem, masti, vremena slušalice". Ako logička oznaka ukazuje na logičku vrijednost ovog fragmenta, na primjer, "je naslov poglavlja". Ove dvije metode obilježavanja su namijenjene, u pravilu, za uporabu u različitim situacijama. Da biste ispisali tekst na pisaču, morate koristiti fizičku oznaku. Odluke treba izvršiti na veličini polja i odlomku. Rane verzije tekstualnih procesora koristili su samo fizičku vrstu oznake. U isto vrijeme, font, veličina i stil bio je usmjeren na svaki fragment.

Prilikom razmjene informacija s drugim ljudima, fizički dizajn teksta nameće niz ograničenja, posebno za online dokumente. Veličina zaslona, \u200b\u200brazlučivost, fontovi su različiti za različite sustave. Iz tih razloga, logički dizajn teksta sve je više. U nekim slučajevima, logički dizajn je praktički potrebno: prilikom stvaranja elektroničkih dokumenata kao što su www stranice ili prilikom stvaranja i objavljivanja rasutog rada, kao što su knjige.

Za očuvanje označavanja dokumenata prilikom prijenosa informacija o tekstu s uređaja na stroj različite metode, Tekstualni procesori i sustavi izdavaštva koriste posebno dizajnirane formate datoteka koji sadrže ne samo tekst, već i informacije o tome kako se mora urediti. Glavni problem ovdje je nekonzistentno s takvim formatima, iako najsloženiji programi obično mogu čitati datoteke u formatu natjecatelja. Primjeri ovog pristupa su tekst teksta riječi i Starwritera.

Uz drugačiji pristup, posebne naredbe za označavanje umetnute izravno u dokument. Čak i ako nemate softver koji podržava takav format, još uvijek ga razumijete u njemu. Postoji mnogo načina za takvu prezentaciju rasporeda teksta, uključujući:

  • Hipertekstuk oznaku jezika (HTML) koji se koristi u World Wide Webu;
  • Tex i lateksa su popularni za mnoge akademske publikacije, kao i matematičare, fizičare, kemičare, pa čak i glazbenike.

Primjeri programa koji vam omogućuju da postavite tekst na sličan način, poslužite netscape skladatelja i lix (Klyx).

Datoteke koje stvaraju različiti urednici često imaju jedinstvene ekstenzije koje omogućuju, bez gledanja u dokument, pogodite metode polaganja teksta. Dakle, datoteke koje su stvorili urednici običnog teksta pripreme često imaju proširenje. Txt i pripremljeni u uredniku lyx - .lyx. Procesor teksta riječi prema zadanim postavkama stvara datoteke u MS Word formatu (proširenje.doc), ali također podržava druge formate, kao što je RTF (proširenje.rtf). Dokumenti koji sadrže HTML oznake naredbe imaju proširenje.html ili.htm.

Očito je nemoguće navesti sve uređivače teksta. Mnogi od njih su "izoštreni" pod jednom ili drugom određenom aktivnošću. Popis koji se raspravlja u nastavku prikazuje samo mali dio uređivača teksta.

Urednici neformatiranih tekstova

Notepad. Izgrađen u operacijskoj dvorani windows sustav, razumijevanje i jednostavno i korištenje; MEDIT. Ima sličnosti s uređivanjem iz MS DOS-a, komponente upravitelj datoteka mc. (Ponoćni zapovjednik) Linux OS; Kedit. Najjednostavniji urednik teksta je dio KDE Linuxa; Krite. Urednik teksta dodatne postavke U usporedbi s drugim jednostavnim uređivačima teksta; Emacs. kombinira funkcije upravitelja datoteka i uređivača teksta; jedan od prepoznatljive značajke je sposobnost stvaranja makronaredbi (makronaredbi); U svim UNIX klonovima, uključujući Linux; Emacs se može koristiti u MS Windows.

Urednici koji stvaraju tekst s označavanjem elemenata

Riječ. Služi za stvaranje raznih tiskanih dokumenata, je komponenta. office u MS Windows; Starwriter. To je dio programa StarOffice, izgled i funkcionalnost, sličan je riječju, djeluje jednako dobro u MS Windows iu Linux OS-u; Lyx. (KLYX u KDE) moderni urednik teksta, namijenjen ljudima koji žele dobiti dokument koji izgleda profesionalno, ali potrošiti na njezino stvaranje najmanje vremena; Urednik umeće Tex i lateks označavajući timski tekst; Netscape skladatelj. Umeće HTML jezik označavanja teksta, postoje verzije za Linux OS i MS Windows.

U suvremenom svijetu, informacije su vrijedan resurs usporediv, osim s vremenom. Informacije obavljaju mnoge zadatke u životu društva, pružajući komunikacijske interakcije svih njegovih komponenti, pričvršćivanje, zadržavajući i prijenos primljenih i akumuliranih znanja. Ipak, ključna uloga igra informacije u upravljanju.

Informacije o upravljanju zabilježene su u dokumentima. Dokument, kao nositelj informacija, je informacijski resurs, koji je povjeren stručnjacima za dokumente, namijenjen organiziranju tehnološkog procesa dokumentacije i rada s dokumentima, uključujući korištenje modernog informacijske tehnologije.

U sadašnjoj fazi nitko ne sumnja u potrebu uvođenja novih informacijskih tehnologija u procese upravljanja i prije svega u opsegu dokumentacije (dou), kao u jednoj od najvažnijih komponenti tih procesa. Govoreći o uvođenju novih informacijskih i komunikacijskih tehnologija (ICT) na području dou, u pravilu, shvaća se kao projektiranje i provedba automatizirani sustav Upravljanje dokumentima upravljanja (AC do) s mnoštvom ugrađenih i zatvorenih modula.

Ali što je iza tih informacijskih tehnologija, uključujući sustave kao dou? Nekoliko stručnjaka za dokumente to razumije u cijelosti. U isto vrijeme, to je sasvim očito da bez osnovnih, temeljnih znanja u području informacijske tehnologije (IT) ne može učiniti dokumente.

U najnovijem nacionalnom standardu, reguliranje procesa upravljanja gost r ISO 15489-2007, odgovornost "dokumentacije za upravljanje" jasno je napisana, odnosno stručnjaci u području upravljanja dokumentacijom, za dizajn, provedbu i Upotreba automatiziranog sustava DOW-a , To sugerira da dokumenti više ne mogu biti promatrač treće strane prilikom projektiranja i provedbe AC \u200b\u200bdou i samo tada njegovih korisnika. Oni već moraju u početnoj fazi svog dizajna aktivno sudjelovati u procesu i uspostaviti osnovne zahtjeve za funkcionalnu komponentu ovog sustava.

U skladu s uvjetima kvalifikacija, dokumentacija je sudjelovala u formuliranju zadataka, projektiranja, rada i poboljšanja (djelomično informacijska podrška) Automatizirani informacijski sustavi i sustavi upravljanja. Također sudjeluje u razvoju najnovijih informacijskih tehnologija, dizajna i ažuriranja baza podataka i banaka podataka. Studira i sažima napredno domaće i inozemno iskustvo u području dow.

Studija informacijskih informacijskih tehnologija u upravljačkim aktivnostima postaje važan zadatak općeg stručnog usavršavanja u specijaliziranoj "dokumentaciji i dokumentaciji" , Moderni stručnjak trebao bi biti dobro usmjeren na raznolikost softvera i zamišljajući razinu varijabilnosti softverskih i tehnoloških rješenja za provedbu zadataka u domu.

Odavde možemo zaključiti da je potrebno proširiti horizonte dokumenata u području primjene informacijskih tehnologija u dou i njihovih značajki.

Najvažniji problem koji proizlazi iz uvođenja u aktivnosti bilo kojeg, osobito države, organizacija je problem očuvanja elektroničkih dokumenata i pristup na nju nakon znatnog vremenskog razdoblja. Drugi problemi nastaju prilikom razmjene elektroničkih dokumenata u upravljanju, posebno na međuresorj razini. U ovom trenutku, ovi problemi, djelomično, pomoći će u rješavanju otvorenih formata elektroničkih dokumenata.

Zemlja se aktivno raspravlja i pitanje uvođenja elektroničkog upravljanja dokumentima na razini vlade (na primjer, program "Elektronska Rusija" , "Elektronska moskva" , koncept formiranja e-uprave uvođenje elektroničkih upravnih propisa , Udruga državnih informacija Re-surks ). Rješenje problema isporučenih u ovim dokumentima nije moguće bez uzimanja u obzir formati elektroničkih dokumenata (ED).

Važni dokumenti koji definiraju glavne smjerove razvoja informacijskih tehnologija u Ruskoj Federaciji su doktrina informacijske sigurnosti i strategija razvoja informacijsko društvo , Posebna pozornost posvećuje se programima i konceptima, zbog činjenice da je upravo u njima metodologija za uvođenje modernog u Rusiji, uključujući i dow opseg. Među njima su posebni interes saveznog ciljanog programa "Elektronska Rusija (2002-2010)" , Koncept formiranja u ruskoj federaciji e-uprave do 2010. godine , Koncept korištenja informacijskih tehnologija u aktivnostima savezne vlade do 2010. godine i tako dalje.

Koncept razvoja nacionalnog sustava standardizacije to je sustav mišljenja o problemima razvoja nacionalnog sustava standardizacije u Ruskoj Federaciji do 2010. godine i sadrži razumne ciljeve, ciljeve i upute razvoja.

Razmatranje ovog pitanja, namjeravamo posvetiti ciklus članaka u kojima će biti opisani glavni formati elektroničkih dokumenata, formiranje i razvoj slobodnog softvera, specifičnost otvorenih formata elektroničkih dokumenata, praksu primjenjivanja u Rusiji i u inozemstvu.

Format elektroničkog dokumenta je, točnije, format datoteke koji sadrži tekst i / ili audiovizualne informacije u kodiranom obliku. "Kodirano" ne bi trebalo biti zbunjeno s konceptom "šifriranog". Šifriranje se odnosi na način skrivanja informacija, a kodiranje je samo konverzija informacija iz jednog oblika na drugu.

Ako analizirate suvremene rječnike računalna tehnologija, koncept "formata" je raznolik i težak. Za korisnika je dovoljno znati da je format elektroničkog dokumenta određena definitivna logika ili algoritam, nakon što se informacije iz strojno čitljivog pretvaraju u osobu razumljivu i obrnuto. Formati mogu imati različite vrste, od jednostavnih i ograničenih na izazove do složenih i sposobnih za nošenje mnogih funkcija, uključujući mogućnosti stvaranja rasporeda, kompresije i šifriranja.

U području računalne tehnologije pod pojam "format" označava strukturu informacijskog objekta. Na primjer, format datoteke naziva se metoda organiziranja informacija elemenata (bitova, bajtova) u datoteci, a elektronički format dokumenta određuje metodu lokacije i prezentacije podataka u elektroničkom dokumentu .

Mi navodimo ukratko formati elektroničkih dokumenata koji se koriste u DOW-u .

Formati teksta Koristi se za stvaranje tekstualnih tekstova i najčešće se stvaraju pomoću tekstualnih procesora.
Na primjer:

Doc je popularan elektronički format dokumenta, dizajniran za pregled i promjenu (uredi) tekst dokumenta. Format je iznimno zgodan ako istovremeno radite na dokumentu nekoliko izvođača.
.Pdf - format prikaza dokumenta u identičnom obliku na bilo kojem operacijski sustav Iu bilo kojoj prijavi. Popularno u pripremi dokumenata, prezentacijskih materijala, reklamnih knjižica, itd. Zbog činjenice da je format namijenjen za pregled dokumenta i ne dopušta da se neautoriziraju (ili neprimjetne) promjene u njoj, njegova uporaba u DOW-u je iznimno zgodan. Treba napomenuti da se svi standardi međunarodne organizacije za standardizaciju (ISO) šalju na Rostechregulaciju u PDF formatu.

RTF - dizajniran za pregled dokumenata i uređivanje u različitim verzijama softverskih proizvoda. Na primjer, verzije riječi za Windows. Osim toga, format se aktivno koristi zbog činjenice da vam omogućuje pretvaranje datoteka bez gubitka strukture i smislenog dijela dokumenta i rad s njima u jednom operativnom sustavu, ali u raznim privremenim verzijama.
Grafički formati Spremite sliku (na primjer, fotografiju, crtanje) i podijeljeni su u dvije glavne vrste: vektorske formate koji pohranjuju sliku kao skup geometrijskih oblika (DXF, EPS, CGM) i rasterske formate koji su pohranili sliku kao skup kao skup pikselne točke (BMP, TIFF, GIF). Spremljena slika može se dodati tekstu dokumenta i koristiti ga prilikom dizajniranja prezentacije.

Formati baze podataka kreiraju se pomoću sustava upravljanja bazom podataka (DBMS). Sastoje se od polja i stolova koji sadrže odvojeni elementi informacija. Pro-Gram vam omogućuje uspostavljanje veza između raspršenih elemenata. Na primjer, baza podataka zaposlenika može sadržavati polja s imenima zaposlenika, adresa i informacija o obavljenom radu.

Datoteke u formatu proračunske tablice pohranjuju se u ćelije broja i odnosa između tih brojeva. Tako jedna stanica može sadržavati formulu koja sažima podatke drugih dviju stanica. Poput datoteka baze podataka, datoteke za proračunske tablice obično imaju format programa, s kojim se stvaraju. Ovaj format je prikladan prilikom uzimanja u obzir radno vrijeme, itd.

Video i audio formati sadrže pokretne slike ( digitalni video, animacije) i zvučni podaci koji su najviše stvoreni i gledani koristeći odgovarajuće programe i pohranjene u jednokratnoj formatu. Najčešće korišteni su brzi i MPEG formati. Osim njihove pomoći, možete se prijaviti na sastanke, sastanke itd.

Neka nas prebivamo detaljnije o formatima označavanja koji sadrže ugrađene upute za prikazivanje i razumijevanje sadržaja datoteke.

Možete definirati elektronički jezik označavanja dokumenata na SGML (standardni generalizirani oznaku jezika). U početku je razvijen za razmjenu računalnih dokumenata u velikoj vladi i zrakoplovnim projektima. Široko se koristi u tiskanom i objavljivanju sfere, ali njegova složenost otežala je široko rasprostranjena za svakodnevnu uporabu.

SGML je odobrila međunarodna organizacija za standardizacijuISO. Kao međunarodni standard ISO 8879: 1986 Informacijske obrade - Tekst i uredski sustavi - Standardni generalizirani markup jezik (SGML) "i koristi se u državnim tijelima mnogih zemalja svijeta.

Iz jezika rasporeda SGML dokumenta, došlo je do novih, naprednijih označavanja jezikaHTML i XML.

HTML (HyperText Markup Language - "označavanje jezikahipertekst. ") Ovo je SGML aplikacija. Koristi se za prikaz svih informacija na mreži. U skladu s međunarodnim standardomISO. 8879: 1986 i standard jedokumenti za označavanje jezika u World Wide Web (www).

XML (Extensible Markup jezik) - podskup sGML jezik, Primljeno popularnost pri upravljanju informacijama i razmjenom, kao relativno jednostavan jezik označavanja dokumenata. XML - Format teksta dizajniran za pohranjivanje strukturiranih podataka (umjesto postojećihdatoteke baze podataka ), razmijeniti informacije izmeđuprogrami , kao i stvoriti na svojoj osnovi više specijaliziranih jezika za označavanje, ponekad se nazivaju rječnicima.

XML format usvojen je od strane tijela za standardizaciju internetskih zajednica u lice svjetskih weba (W3C) konzorcija, koji razvija i provodi tehnološke standardeWorld Wide Web I UDDI organizacije (univerzalni opis, otkrivanje i integracija), razvijajući univerzalni opis standard, otkrivanje i integraciju, dizajniran za definiranje, registraciju i otkrivanje web usluga koje nude tvrtke. Ova specifikacija utvrđuje zahtjeve za registar distribuiranih informacija web-servisa .

Prema odredištu, formati elektroničkih dokumenata mogu se podijeliti na:
- formati za gledanje dokumenta;
- formati za gledanje i promjenu dokumenta;
- formati za promjenu dokumenta.

Ako je moguće, elektroničke formate dokumenata su:
- Prijenosna inter-platforma;
- prijenosni interpogramno;
- specijalizirana.

U pravilu se ne događa jasna granica između tih kategorija. Formati koji su prijenosni između različitih platformi mogu biti interpogram. Specijalizirani formati koriste se u uskim zadacima i koriste se, u pravilu samo primjenama jedne tvrtke i najčešće zatvaraju.

Dostupnost, formati mogu biti otvoreni i zatvoreni. Zatvoreni formati uvijek su imovina određene organizacije koja ih koristi kako bi se zajamčila kvaliteta kvalitete proizvoda i zaštiti od konkurenata za posuđivanje tehnologije.

Otvoreni format je javno dostupna specifikacija digitalnog pohrane podataka, bez licenciranih ograničenja kada se koristi. Konkretno, trebalo bi biti moguće uključiti podršku za otvorene formate kao ubesplatno (otvoreno) iu vlasnički (vlasnički, ne-free) proširenlicence karakteristične za svaku od ovih vrsta. Glavni cilj otvorenih formata je jamčiti mogućnost pristupa podacima za dugo vremena bez obzira na licencirana prava i tehničke specifikacije, Otvoreni format elektroničkog dokumenta štiti potrošača ne samo pri mijenjanju verzija programa, već i omogućuje čitanje dokumenata u uvjetima nedostupnosti programa, s kojim je stvoren elektronički dokument.

Što je izvanredan XML format? Extensible Margup Jezik Jezik Extensible Markup jezik sadrži ne samo podatke, već i "obavlja informacije koje opisuju te podatke. Primjenjivo je na bilo koju aplikaciju računala i omogućuje vam da prenose velike količine informacija bez potrebe za vremenskom konstrukcijom podataka struktura podataka " .

Trenutno se proizvođači softvera odmah prebacuju na korištenje XML-a u njihovim proizvodima i dakle, implementiraju ideju standardizacije formata dokumenata na temelju XML-a, u biti otvoreni format elektronički dokumenti.

Nastavak u sljedećem broju.

Gost r ISO 15489-2007. Upravljanje dokumentima. Opći zahtjevi.

Riječ "format" ima mnogo vrijednosti. U području računalne tehnologije pod pojam "format" označava strukturu informacijskog objekta. Na primjer, format datoteke naziva se metoda organiziranja informacija elemenata (bitova, bajtova) u datoteci, a format elektroničkog dokumenta određuje metodu lokacije i prezentaciju podataka u elektroničkom dokumentu.

Postoji mnogo razni formati elektronički dokumenti. Općenito, mogu se podijeliti na "jednokratno", tj. Kontrolirano i podržano samo jednim programerima softvera i "Multi-Program", koji su podržani od strane nekoliko programera i mogu se obraditi raznim programima.

Glavni formati elektroničkih dokumenata.

1. Formati teksta. Oni su najviše stvoreni uz pomoć tekstualnih procesora. Najčešći tekstualni formati su:

1) jednokratni microsoft formati Riječ, Wordperfect, koji imaju širenje programa u kojem se stvaraju;

2) RTF format, koji je podržan raznim softverskim aplikacijama i, čuva navedeno oblikovanje teksta;

c) PDF format (prijenosni format dokumenta) koji sadrži sliku slike, uključujući tekst i grafiku. PDF formatu datoteke mogu se čitati samo pomoću raznih čitača datoteka, ali se stvaraju samo s adobe programi Acrobat.

2. Grafički formati. Oni pohranjuju sliku (na primjer, fotografiju, crtanje) i podijeljeni su u dvije glavne vrste:

1) Vektorski formati koji pohranjuju sliku kao skup geometrijskih oblika. Među njima su najčešći:

a) DXF format (crtež razmjera formata), koji se široko koristi u programima dizajna računala koje koriste inženjeri, arhitekti;

b) Format EPS (enkapsulirani postskriptu), naširoko se koristi u sustavima za izdavanje stolnih računala;

c) CGM Format (računalna grafika metafila) se naširoko koristi u mnogim grafičkim urednicima (na primjer, u Photoshopu uredniku);

2) Raster formati koji pohranjuju sliku kao skup dot piksela. Kada se mjeri razmjera, rasterski grafikoni dobivaju izobličenje. Među rasterske formate Najčešće:

a) BMP format (bitmap) je relativno niskokvalitetni format, najčešće se koristi u tekstualnim procesorima;

b) TIFF format (označeni format slike), široko se koristi u mnogim softverskim aplikacijama;

c) GIF format (format grafičke razmjene), široko se koristi u programima namijenjenim internetu.

3. Formati baze podataka kreiraju se pomoću sustava upravljanja bazom podataka (DBMS). Sastoje se od polja i tablica koje sadrže pojedine elemente informacija. Program vam omogućuje uspostavljanje veza između raspršenih elemenata. Na primjer, baza podataka kupca može sadržavati polja s imenima korisnika, adrese i kupnju informacija. Ta se polja mogu organizirati u odvojene tablice (na primjer, jednu tablicu za sva polja s imenima korisnika). Baze podataka se mogu pretvoriti u tekstualni format, ali će se odnose između polja i tablica biti izgubljeni (na primjer, 10 stranica imena, 10 stranica adresa i 1000 stranica informacija o kupnji, tj. Inkoherentne informacije).

4. Formati proračunskih tablica. Datoteke u formatu proračunske tablice pohranjuju se u ćelije broja i odnosa između tih brojeva. Tako jedna stanica može sadržavati formulu koja sažima podatke drugih dviju stanica. Poput datoteka baze podataka, datoteke za proračunske tablice obično imaju format programa, s kojim se stvaraju. Neki programi mogu uvesti i izvoziti podatke iz drugih izvora, uključujući programe dizajnirane za takve razmjene podataka (na primjer, Dif format (format podataka o razmjeni podataka). Elektronička tablica datoteke mogu se pretvoriti u tekstualne datoteke, ali vrijednosti i međusobne veze između brojeva će biti izgubljen.,

5. Video - i audio formati. Ovi formati sadrže pokretne slike (digitalni video, animacija) i audio podatke koji se u potpunosti kreira i pregledava pomoću odgovarajućih programa i pohranjuju se u formatu jednog urre. Najčešće korišteni su brzi vremenski i MPEG formati (Grupa Stručnjaci za pokret Picture).

6. Označavanje jezika, također nazvanih oznaka označavanja, sadrže ugrađene upute za prikaz i razumijevanje koji sadrži datoteku. To uključuje:

1) SGML (standardni generalizirani markup jezik), koji se koristi u mnogim zemljama svijeta u državnim tijelima i međunarodni je standard;

2) HTML (jezik HmperText Markup), koji se koristi za prikaz gotovo svih informacija na World Wide Web mreži;

3) XML (Extensible Markup jezik) je relativno jednostavan jezik temeljen na SGML-u i stekao popularnost pri upravljanju informacijama i razmjenom.

PDF format, koji je stvorio Adobe Systems Inc., vrlo je popularan kod razmjene dokumenata i široko se koristi za internetske dokumente, jer vam omogućuje održavanje izvorne izglede dokumenata i omogućuje izmjenu dokumenta. Prema Adobeovoj procjeni, pola milijarde ljudi ju je već preuzelo besplatan program Pregled PDF datoteka, mnoga poduzeća su odabrali ovaj format kao standard za prijenos i pohranjivanje dokumenata, a mnogi neovisni programeri nude proizvode koji podržavaju PDF, a neki su besplatni.

Modificirana verzija formata, pod nazivom PDF-Arhiva (PDF-A), smatra se u inozemstvu kao jedan od dva glavna formata koja se mogu koristiti u budućnosti za arhivsko pohranu elektroničkih dokumenata. Drugi format je XML.

Može se tvrditi da je najveća distribucija u području upravljanja sada primila dokumente stvorene tekstualnim procesorima, posebno Microsoft Word. Značajan broj upravljačkih dokumenata također se stvara u obliku proračunskih tablica (šalica svih korištenja Microsoft Excel tabličnog procesora), te u obliku prezentacijskih slajdova (pripremljenih pomoću sustava pripreme prezentacije Microsoft PowerPoint). Mnogi elektronički dokumenti generiraju tako relativno nedavno u nastajanju tehnologija kao e-mail, video konferencije, web stranice. U budućnosti, mnoge druge tehnologije mogu postati veliki "proizvođači" elektroničkih dokumenata, kao što su geoinformacijski sustavi, operatorski centri.

Svaki od formata elektroničkih dokumenata ima svoje prednosti i nedostatke kada se koristi u dokumentacijskom upravljanju. Na primjer, tekstualne formate (riječ savršena, Microsoft Word, RTF, itd.) Pogodni su za kontekstualno pretraživanje po dokumentima u bazi podataka i grafičkim formatima (pdf, TIFF, itd.) Dopustite da dobijete sliku dokumenta s Sve svoje vanjske značajke prilikom skeniranja dokumenata u istom obliku kao na papiru, sa svim potpisima i vizama.

MS Word Format je vrlo zgodan prilikom uređivanja dokumenta i grupe rad s njom, no MS Word datoteka pohranjuje mnogo skrivenih informacija (prije svega o promjenama u datoteci) i stoga vrlo nesigurno u točki pogled na propuštanje službenih informacija. U nekim slučajevima, kao što je ponuda Ili nacrt ugovora, skrivene informacije vam omogućuje da utvrdite što su početne pretpostavke i koje su imale najviše utjecaja na tekst.

U grupnoj pripremi dokumenta, analiza uređivanja omogućuje da ne uči ne samo imena ljudi koji su to napravili, već i koji su doprinijeli konačnoj verziji.

Glavno pitanje koje proizlazi u vezi s formatima elektroničkih dokumenata je pitanje pretvorbe i (ili) migracije elektroničkih dokumenata. Kada se pretvorba promijeni elektronički format dokumenta, a kada se migracija, elektronički dokument premješta s jedne softverske platforme ili medije u drugu bez promjene formata. Međutim, tijekom migracije možda ćete morati sazvati elektronički dokument. Na primjer, prilikom premještanja elektroničkog dokumenta iz operativnog sustava Macintoch, operativni sustav Microsoft Windows zahtijeva konverziju elektroničkog dokumenta u novi format (na primjer, RTF ili Word 2000).

U tom slučaju, moguće je 3 glavne vrste gubitaka koje treba uzeti u obzir pri pohranjivanju elektroničkih dokumenata:

1) gubitak podataka. Kada je gubitak podataka u određenoj mjeri, sadržaj dokumenta je izgubljen. Elektronički dokument postaje neispravan i nepouzdan;

2) gubitak izgleda, struktura elektroničkog dokumenta. Na primjer, pri pretvaranju tekstualnih dokumenata u RTF format, možete izgubiti neke od značajki izgleda dokumenata;

3) Gubitak veza između podataka (u proračunskim tablicama, baze podataka) također čini dokument neispravan.

Treba imati na umu da se kopija dokumenta može legalno prepoznati samo ako je stvoren u dokazanoj metodi i točan je, pun i pouzdan za dugoročnu uporabu.

Drugo pitanje povezano s formatima i upravljanjem elektroničkim dokumentima pitanje je kompresije datoteka (kompresija). Prednosti kompresije datoteka štedi mjesto zauzeto tijekom pohrane, bržeg i jednostavnog prijenosa datoteka. Nedostaci kompresije datoteka su da može dovesti do gubitka podataka. Osim toga, uzrokuje potrebu za korištenjem dodatnih programa kompresije softvera (WinZip, Zipmagic, itd.), Koji su također svojstveni problemu zastarjelosti, višestrukog, ovisno o platformi.

Mogućnosti korištenja formata PDF-arhiva u elektroničkim arhivima su ograničene: posebno, PDF-A format nije prikladan za arhivsko skladištenje audiovizualnih dokumenata.

Sumirati:treba napomenuti da se nitko od formata elektroničkih dokumenata ne može smatrati univerzalnim za dugoročnu arhivsku pohranu, budući da se tehnike, tehnologije i softver se brzo mijenjaju.