Studiul formatelor electronice de documente utilizate în Dou. Formate de documente electronice aplicate în activități de management

Adică formate pentru stocarea fișierelor text. Acum, principalul mijloc, aproape un monopolist în pregătirea standardului documente text El este programul MicrosoftWord, deci mai departe se va acorda accentul pe formatele destinate acestui program.

dar)Doc.. Formate de extensie . doc.Aceasta este modul obișnuit de a prezenta textul VmicrosoftWord. Textul cu extensia.doc conține datele despre unde și care este defalcarea pe șiruri și paragrafe, metodele de aliniere a textului, clopotul dintre rânduri și paragrafe, vederea și desenarea fonturilor și așa mai departe. Toate acestea se numesc formatarea textului. Formatarea textului și a fișierului este concepte complet diferite, deși sunt exprimate în cuvinte apropiate.

Nu intotdeauna versiune veche MicrosoftWord poate citi ceea ce este creat într-o versiune mai modernă. Sau când se deplasează la o versiune mai veche sau un alt program se pierde ceva din formatarea documentului. Dar versiunile mai noi pot fi întotdeauna pe deplin citite ce este creat în versiunile anterioare.

FormatDoc. Vă permite să creați formatarea textului de cea mai bună calitate, dar textul creat nu este întotdeauna redat pe alt computer.

b)RTF.. Extinderea dreaptatEXT.format., Ce înseamnă formatul corect de text. Formatele familiei sunt compatibilitate foarte largi, înțeleg toți procesoarele de text, cele vechi și noi. Dar nu toți editorii de text, deoarece editorii sunt mijloace mai primitive de a lucra cu textul. Multe programe non-intestine (de exemplu, grafică) lucrează semnificativ mai bine cu CRTF decât CDOC. Compatibilitatea este implementată deoarece triformatting este convertit în instrucțiuni de software care vă permit să deschideți și să vizualizați un document în diferite mijloace.

Dacă aveți nevoie să rescrieți textul la un alt computer utilizând o dischetă, în timp ce nu se știe ce merită un program de lucru cu text, atunci acesta este salvat să îl salvați în formatul RTF. Fișierul Format este un volum ușor mai mare, Thandoc, dar apare o garanție că un alt computer va înțelege acest text.

FormatRTF. Vă permite să redați textul creat pe orice versiune.Microsoft.Cuvânt. și în multe programe non-intestine.

în)TXT.. Acesta este un format de text primitiv care nu conține formatare complexă. Din formatare, doar diviziunea pe paragrafe este păstrată aici, iar fiecare linie se transformă într-un paragraf. Formatxt, aplicat de programatori pentru scrierea unui cod de program, deoarece Calculatorul nu are nevoie de "frumos" pe conceptele umane de design text. Este încă un format care să utilizeze textul atunci când textul trebuie să înțeleagă utilizatorii cu software diferit atunci când programul final nu recunoaște alte formate de fișiere.

În Windows, un instrument software pentru lucrul cu texte în format.txt- Notepad. (Caiet), Este convenabil să o navigați diverse programe și documentele electronice care nu sunt destinate tipăririi.

Mesaje e-mail De asemenea, nu au dezvoltat formatarea. Prin urmare, dacă trimiteți un document sub forma unui mesaj poștal, atunci își va pierde aspectul. Dacă doriți să transferați prin poștă nu numai conținutul, ci și apariția textului, acesta trebuie trimis ca un fișier DOC atașat la mesajul poștal.

Sunt multi alte formate de text. Acum 10 sau mai mulți ani, mai multe alte programe de text, cum ar fi programul intern "lexicon", sunt, de asemenea, populare. Pentru programele strămutate BymicrosoftWord, propriile formate de text originale, care pot fi necesare prin citirea textelor acelei momente.

În cele din urmă, textul poate fi stocat și la un grad sau altul pentru a edita zeci de alte formate destinate să nu creeze documente text, ci în alte scopuri. Ca exemple, puteți aduce formatul . hTML.la crearea site-urilor, . xLX.pentru editorul de tabel Excent, PopularPostScriptFormat . pDF.Și multe altele.

Documentele electronice au devenit aceleași ca o parte importantă a arhivelor ca imprimantă pe tabelul secretarului. Texte, fotografii, desene, baze de date, fișiere audio și video merg rapid la "cifra", provocând o discuție despre ce formate sunt cele mai potrivite pentru stocarea constantă. documente electronice. Din fericire, arhiviștii ruși au cineva să caute ajutor.

Despre documentele electronice sunt spuse din ce în ce mai puternice. În SUA, arhivați dedicați acestui domeniu de lucru o vacanță profesională cu drepturi depline - o zi de documente electronice (Ziua Electronică a înregistrărilor), care este sărbătorită pe 10 octombrie. În această zi, oamenii de știință și practicile sunt colectate împreună pentru a discuta problemele actuale de conservare a documentelor electronice.

Comunitatea științifică rusă, de asemenea, nu rămâne deoparte de rezolvarea problemelor practice, deși nu a fost dedicată zilelor roșii ale calendarului. Anul trecut, oamenii de știință de la Universitatea Umanitară de Stat din Rusia (RGGU) au efectuat un studiu la scară largă a diferitelor formate de fișiere electronice de documente cu descriere detaliata Nuanțele fiecăruia dintre ele.

Concluzii, principalele tendințe sunt prezentate în raportul științific al RGGU " Analiza comparativa Formate de dosare de documente electronice de stocare permanentă (pe termen lung) ".1 Acesta este unul dintre primele lucrări similare de cercetare din Rusia, permițând arhivele autorităților executive federale, organizațiilor de stat și neguvernamentale, precum și Arhivele de stat și municipale de a aborda în mod obiectiv problema alegerii celei mai optime arhive. Formatul stocării permanente (pe termen lung) a documentelor electronice.

Unele cerințe pentru stocarea documentelor electronice

Deja în stadiul de proiectare, sistemul maritim este construit astfel încât în \u200b\u200btimpul întregii perioade de depozitare pentru a asigura autenticitatea, fiabilitatea și caracterul adecvat al documentului, indiferent de modificările sistemului2. Astfel de modificări ale numărului de altele pot fi cauzate de conversia formatelor, migrația3 între echipamentele tehnice, sistemele de operare sau aplicații software. În acest caz, trebuie remarcat faptul că atunci când convertirea formatelor, informațiile despre conversia perfectă trebuie depozitate ca parte a informațiilor de control4. De asemenea, este important să știți că, în plus față de documentul electronic original, pe parcursul perioadei de depozitare, este necesar să se păstreze documentul de metadate (descrierea documentului) 5, care conține toate metadatele despre documentul electronic. În cazul în care perioada de depozitare a documentului electronic depășește perioada de așteptare a existenței sistemelor de stocare a datelor, este necesar să se documenteze planurile de migrare către noile sisteme6.

Lizibilitatea este o descriere integrală a documentului electronic. Este asigurată caracteristici tehnice Documentul I. software.Lucrătorii de arhivare disponibili. Formatul de fișier definit pentru depozitarea permanentă (pe termen lung) trebuie să respecte capacitățile tehnice ale organismelor guvernamentale, ale arhivelor de stat și municipale, organizații neguvernamentale etc. să reproducă informații într-o perspectivă pe termen lung7. Mai mult, legislativ consacrat că documentele electronice sunt făcute pentru depozitarea însoțită de software.permițându-le să se reproducă și setul de documentație însoțitoare8.

În ceea ce privește formatele de fișiere, afirmația cărora ar trebui să fie susținută de sisteme electronice de gestionare a documentelor, nu există o uniformitate exactă. Astăzi, actele juridice de reglementare sunt oarecum diferite în viziunea lor asupra listei finale. De exemplu, în conformitate cu recomandările privind pregătirea autorităților federale din lista documentelor, crearea, stocarea și utilizarea cărora ar trebui să se efectueze sub formă de documente electronice în organizarea activităților interne (aprobate prin ordinul Rosarhiva datată 29 aprilie 2011 nr. 32), prezența documentelor electronice în formatele PDF, DOC, RTF, TXT, XML.

În conformitate cu cerințele privind sistemele informatice ale gestionării electronice a documentelor organelor executive federale, luând în considerare necesitatea procesării prin date ale sistemelor informatice de servicii de distribuție limitată (aprobată prin Ordinul Ministerului Comunicațiilor din Federația Rusă de 02.09. 2011 Nr. 221), următoarele patru formate sunt obligatorii: PDF, RTF, DOC, TIFF. Alte documente de reglementare permit posibilitatea prezenței în sistemele electronice ale autorităților de stat ale altor formate de fișiere electronice de documente.

În septembrie 2014, Consiliul de experți din Ministerul Comerțului utilizează PDF / A ca forma de interacțiune interdepartamentală în SED și depozitare pe termen lung Documente electronice. Împreună cu PDF / A, se propune transmiterea unui fișier XML cu detaliile unui document electronic. Se știe că împreună cu FSO va fi pregătit o comandă corespunzătoare cu cerințele pentru fluxul de documente.

Recomandări pentru selectarea formatului electronic al documentului

Alegerea formatului optim de stocare este determinată de tipul de informații, caracteristicile mijloacelor tehnice de depozitare (e-mailuri magnetice, optice, solide), caracteristicile accesului utilizatorilor la date și software. Datorită reducerii transportatorilor media și creșterea capacității acestora, disponibilitatea software-ului și lizibilității formatului de fișier într-o perioadă lungă de timp este recunoscută de principalii factori atunci când aleg o metodă de codare. Într-o analiză comparativă a formatelor electronice de documente (fișiere textuale, grafice, audio și video, baze de date, prezentări), au fost luate în considerare următoarele criterii: au fost luate în considerare următoarele criterii:

  • dezvoltator și proprietate;
  • anul de dezvoltare a formatelor de fișiere;
  • an de ultima sa modernizare;
  • frecvența actualizărilor de software;
  • disponibilitatea versiunilor;
  • codul programului deschis sau închis;
  • descrierea și compararea algoritmilor de compresie matematică;
  • formatul fișierului destinație;
  • prezența și disponibilitatea convertorilor;
  • stabilitate cu replicări multiple 9.

Formate text

Textul este matricea principală stocată în arhivele de informații. Acesta este tratat ca texte în limbile de comunicare umană (cu excepția scrierii hieroglifice, aproape de forma grafică) și a limbajelor de programare. Adesea, fișierele text includ fragmente de informații grafice. Spre deosebire de ilustrații, înregistrările audio și video, datele de text sunt supuse unor comprimări semnificative utilizând programe speciale de arhivare.

Conform recomandărilor RGU, arhivarea fișierelor este mai bună pentru a produce într-o formă necriptată utilizând ZIP (* .ZIP), iar informațiile despre text sunt mai expediate pentru a înregistra în formatele următoare: XML (include XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011) (* .pdf). Unele condiții pot utiliza formate text: text simplu (ISO 8859-1Ncoding), PDF (* .pdf) (fonturi încorporate), formatul text îmbogățit 1.x (* .rtf), HTML (include o declarație de doctype), SGML (* * .SGML), Open Office (* .SXW / *. ODT), OOXML (ISO / IEC DIS 29500) (* .docx), EPUB (necriptat) (* .epub). Cea mai mare stabilitate atunci când migrează dintr-un singur format în software-ul selectat în celălalt, formatele * .doc și * .xml se comportă. Tabelul 1 prezintă rezultatele modificărilor în cantitatea de informații în timpul migrației.

Tabelul 1. Matricea se schimbă în cantitatea de informații în timpul migrației (de câte ori)

Formate de fișiere Sursa /
Formate de fișiere de migrare
* .doc.
Microsoft Word 97-2003.
* .odt.* .XML.* .RTF.* .pdf.* .pdf (PDF / A)
* .doc.
Microsoft Word 97-2003.
sursă<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 sursă>8,4 >7,7 >10 >18,4
* .XML.<2,2 <8,2 sursă>1,04 >1,4 >2,6

Rețineți că pachetul OpenOffice Office, care a fost distribuit datorită unei licențe gratuite, are o serie de restricții, de exemplu, comparativ cu Microsoft Word 2007. Deci, pentru a crea un fișier în format XML în OpenOffice 4 (Writer), tehnic suplimentar Se va solicita setările sistemului (va fi necesară prezența mediului java instalat. (JRE). Formatul XML OpenOffice 4 * .Stw nu a primit încă suport și descrieri semnificative. Microsoft Word 2007 nu afișează informații în astfel de un format, deschizându-l ca un document gol.

Formate grafice

Informații grafice cu rezoluție înaltă, în special imagini de policrom și jumătate, sunt practic care nu pot fi comprimate de arhivă. De regulă, formatele de raster sunt utilizate pentru depozitare, care asigură depozitarea scenelor realiste cu o adâncime mare de culoare. Conform rezultatelor analizei comparative, doar trei formate s-au dovedit a fi cele mai potrivite pentru depozitarea pe termen lung. imagini raster.: TIFF (necomprimat), JPEG2000 (Lossless) (* .jp2), PNG (* .png).

Pentru imagini vectoriale. Formatul recomandat este SVG (* .SVG). Desenele, schemele structurale, algoritmi reprezentați grafic formați din primitive grafice (segmente și linii sparte, poligoane, cercuri și elipse) sunt implementate în mod eficient în astfel de formate vectoriale ca SWG, WMF, CGM și altele asemenea. Cu toate acestea, nu trebuie să uităm asta formate vectoriale De obicei, duce la denaturarea schemei de culori a unei imagini complexe.

Pentru codarea imaginilor 3D (formate de date virtuale) este acceptabilă pentru a utiliza formatul X3D (* .x3d).

Formate audio și video

La fel ca informațiile grafice, informațiile audio și video sunt aproape incapabili să arhiveze efectiv: în medie, compresia lor nu depășește 5%. Selectarea diferitelor tipuri de codare a acestor date afectează în mod semnificativ volumul fișierului stocat, de la calitatea de redare necesară și, ca rezultat, preferința acestui format sau acel format depinde de volumul necesar de stocare de arhivă. Formate recomandate de stocare audio: AIFF (PCM) (* .aif, * .aif), wav (PCM) (* .wav), AES3 (LPCM) (* .AES). Cele mai bune rezultate privind rezultatele comparației pentru siguranța datelor video au arătat formate: motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2), AVI (Necomprimat, Motion JPEG) (* Necomprimat, motion jpeg) (* .mov).

Baze de date și bănci de date

Alegerea formatului de stocare a bazei de date depinde în principal de structura sa. Dacă baza este un fișier, este recomandabil să îl stocați în codarea corespunzătoare acestui tip de fișier. Când depozitați baza a cărei înregistrări constau în câmpuri de diferite structuri, codificările RTF și PDF sunt utilizate cel mai adesea, dar în cazul eventualului, dacă nu există fraze audio și video în baza de date. Cele mai versatile formate pentru bazele de date de stocare pe termen lung sunt valorile separate prin virgulă (* .csv), text delimitat (* .txt), SQL DDL. În cazuri rare, pot fi utilizate formate: DBF (* .dbf), OpenOffice (* .Sxc / *. ODS), OOXML (ISO / IEC 29500) (* xlsx).

Prezentări

Niciunul dintre formate existente Nu oferă un grad ridicat de fiabilitate a conservării prezentării. Cu unele rezerve, puteți recomanda formate OpenOffice (* .sxi / *. ODP) și OOXML (ISO / IEC DIS 29500) (* .pptx). Formatul PowerPoint (* .ppt) și alte formate ale fișierelor de prezentare nu îndeplinesc cerințele de stocare pe termen lung.

Informații hibride

Pentru stocarea documentelor cuprinzătoare, a cărei structură include fragmente de diferite natură (text, fotografie, desen etc.), formate de text moderne, cum ar fi MS Word, RTF, sunt cele mai potrivite. Acestea permit includerea imagini grafice În codurile raster. Dacă există multe ilustrații, acest document este recomandat să fie stocat ca o singură imagine - în acest caz, sunt preferate formate grafice.

NOTE:

  1. Activitatea de cercetare a fost efectuată în cadrul contractului de stat nr. 016-3 din data de 31 mai 2013 "Studiul proceselor moderne de gestionare a documentelor și gestionarea documentelor electronice. "Raport științific" Analiza comparativă a formatelor de fișiere ale documentelor electronice de depozitare permanentă (pe termen lung) "(ca parte a punerii în aplicare a activităților programului federal țintă" Cultura Rusiei "(2012-2018).
  2. GOST R ISO 15489-1-2007 "Standardul Național al Federației Ruse. Sistem de standarde privind informarea, biblioteconomia și publicarea. Managementul documentelor. Cerințe generale "(aprobată prin ordinul de rostechregulation datată 12.03.2007 nr. 28-ST).
  3. Migrarea documentelor electronice este o acțiune privind deplasarea înregistrărilor de la un sistem la un alt sistem, menținându-și autenticitatea, integritatea, fiabilitatea și ușurința utilizării.
  4. Structura descrierii documentului constă într-o descriere a fizicului sau structura tehnică și structura sa logică, adică relațiile dintre elementele de date care constituie documentul. Pentru mai multe informații despre crearea, gestionarea și utilizarea metadatelor, consultați GOST R ISO 23081-1-2008. Sistem de standarde privind informarea, biblioteconomia și publicarea. Procese de gestionare a documentelor. Metadate pentru documente. Partea 1. Principii (aprobate prin ordinul RostechRegulare din 13 noiembrie 2008 Nr. 310-ST).
  5. GOST R 54471-2011 "Sisteme electronice de gestionare a documentelor. Managementul documentației. Informațiile stocate în în format electronic. Recomandări pentru asigurarea fiabilității și fiabilității. "
  6. Reguli de organizare a depozitării, achiziționării, contabilității și utilizării documentelor Fondului de arhivă a Federației Ruse și a altor documente de arhivă în arhivele de stat și municipale, muzee și biblioteci, organizații ale Academiei Ruse de Științe (aprobate prin Ordinul Ministerului Cultură și comunicații în masă ale Federației Ruse din 18 ianuarie 2007 Nr. 19).
  7. A se vedea ibid. 4.4.3.
  8. Replicarea este o metodă de salvare a informațiilor digitale prin crearea uneia sau mai multor copii complete (clone) de materiale digitale. Replicarea necesită evenimente speciale pentru a sprijini toate copiile într-o dată actualizate.

Fișierele text sunt cele mai frecvente tipuri de date din lumea calculatoarelor. Există mai multe probleme asociate cu fișierele text. Primul este un număr extrem de mare de caractere necesare pentru a sprijini diferite limbi. Programatorii americani pentru lucrul cu 128 de caractere utilizează un set de simboluri ASCII din SUA (cod standard american pentru schimbul de informații). Pentru a sprijini alte limbi, adesea nu este suficient și 256 de caractere, prin urmare, o tranziție treptată la codificarea Unicode este acum efectuată, în care au fost deja date doi octeți de stocare a unui caracter (adică este posibil să codifice 65.536 de caractere diferite ).

A doua problemă este că oamenii doresc ca documentele tipărite să conțină grafice, diagrame, note, titluri și pentru a fi utilizate diferite fonturi. Documentele distribuite pe Internet ( pe net Documentele) pot conține animație, legături către diverse resurse de rețea Și suport de sunet.

Multe fișiere text sunt transmise ca un text simplu (text simplu). Textul simplu este dificil de a face atractiv și ușor de citit, deoarece nu există fonturi de diferite modele, grafice, titluri, subtitrări etc. Aceste caracteristici suplimentare sunt numite marcarea textului (Marcaj).

Vorbind despre marcajul text, alocați concepte fizic și logic Marcare. Când utilizați aspectul fizic al textului, este indicată vizualizarea exactă a fiecărui fragment. De exemplu, "Text centrat, 14 Keglem, Fat, Setul cu cască de ori". Dacă marcajul logic indică valoarea logică a acestui fragment, de exemplu, "este titlul capitolului". Aceste două metode de marcare sunt destinate, de regulă, pentru utilizare în situații diferite. Pentru a imprima textul pe imprimantă, trebuie să utilizați marcajul fizic. Deciziile ar trebui luate cu privire la dimensiunea câmpurilor și numerele paragrafului. Versiunile timpurii ale procesatorilor de text au folosit doar tipul fizic de marcare. În același timp, fontul, dimensiunea și stilul au fost indicate pentru fiecare fragment.

La schimbul de informații cu alte persoane, proiectarea fizică a textului impune o serie de restricții, în special pentru documentele online. Dimensiunea ecranului, rezoluția, fonturile sunt diferite pentru diferite sisteme. Din aceste motive, designul logic al textului este din ce în ce mai mult. În unele cazuri, designul logic este practic necesar: atunci când creați documente electronice, cum ar fi paginile www sau atunci când creați și publicați o muncă în vrac, cum ar fi cărțile.

Pentru a păstra marcajul documentelor atunci când transferați informații text de la aparat la mașină diferite metode. Procesoarele de text și sistemele de publicare utilizează formate de fișiere special concepute care conțin nu numai text, ci și informații despre modul în care trebuie decorate. Principala problemă este incompatibilă cu astfel de formate, deși cele mai complexe programe pot citi de obicei fișierele din formatele concurenților. Exemplele acestei abordări sunt procesoare de text și text StarWriter.

Cu o abordare diferită, comenzile speciale de marcare sunt introduse direct în document. Chiar dacă nu aveți software care acceptă un astfel de format, îl înțelegeți în continuare în ea. Există multe modalități de a prezenta o astfel de prezentare a aspectului textului, printre care:

  • Limba de marcaj hipertext (HTML) utilizată în World Wide Web;
  • Tex și Latex sunt populare pentru multe publicații academice, precum și pentru matematicieni, fizicieni, chimiști și chiar muzicieni.

Exemple de programe care vă permit să plasați textul într-un mod similar, serviți compozitorul Netscape și Lyx (Klyx).

Fișierele create de editori diferiți au adesea extensii unice care permit, fără a privi în document, ghiciți metodele de stabilire a textului. Deci, fișierele create de editoarele pregătirii textului simplu au adesea extensie. TXT și preparați în editorul Lyx - .lyx. Procesorul de text cu cuvânt implicit creează fișiere în format MS Word (extensie.doc), dar acceptă și alte formate, cum ar fi RTF (extensie.rtf). Documentele care conțin comenzi de marcare HTML au extensie.html or.htm.

Evident, este imposibil să enumerați toți editorii de text. Mulți dintre ei sunt "ascuțiți" sub una sau altă activitate specifică. Lista discutată mai jos arată doar o mică parte a editorilor de text.

Editori de texte neformatate

Notepad. Construit în camera de operație sistemul Windows., înțelegere și utilizare ușoară; Mcedit. Are asemănări cu editarea editului din MS DOS, Componenta manager de fișiere mc. (Comandantul miezului nopții) Linux OS; Kedit. Cel mai simplu editor de text face parte din KDE Linux; Kwrite. un editor de text setari aditionale Comparativ cu alți editori de text simplu; Emacs. combină funcțiile unui manager de fișiere și a unui editor de text; Unul dintre trăsături distinctive este capacitatea de a crea macrocomenzi (macrocomenzi); Există în toate clone Unix, inclusiv Linux; Emacs poate fi utilizat în MS Windows.

Editorii care creează text cu elemente de marcare

Cuvânt. Acesta servește la crearea unei varietăți de documente tipărite, este o componentă. aplicații de birou în ferestrele MS; Starwriter. Face parte din programul StarOffice, aspectul și funcționalitatea, este similar cu Word, funcționează la fel de bine atât în \u200b\u200bMS Ferestre, cât și în sistemul de operare Linux; Lyx. (Klyx în KDE) Un editor de text modern, destinat persoanelor care doresc să obțină un document care să privească profesional, ci să-și petreacă la crearea unui timp de minim; Editorul introduce textul echipei de marcare Tex și Latex; Compozitorul Netscape. Introduce textul marcajului de limbă HTML, există versiuni pentru ambele OS Linux și MS Ferestre.

În lumea modernă, informațiile sunt o resursă valoroasă comparabilă cu excepția timpului. Informațiile efectuează multe sarcini în viața societății, oferind interacțiunea de comunicare a tuturor componentelor sale, fixarea, menținerea și transmiterea cunoștințelor primite și acumulate. Cu toate acestea, rolul-cheie joacă informații în management.

Informațiile de gestionare sunt înregistrate în documente. Documentul, ca transportator de informații, este o resursă informațională, care este încredințată specialiștilor de documente, concepută pentru a organiza un proces tehnologic de documentare și de a lucra cu documente, inclusiv utilizarea modernă tehnologia Informatiei.

În stadiul actual, nimeni nu este îndoielnic necesitatea de a introduce noi tehnologii informaționale în procesele de management și, în primul rând, în domeniul de aplicare al documentației (Dou), ca într-una dintre cele mai importante componente ale acestor procese. Vorbind despre introducerea de noi tehnologii de informare și comunicare (TIC) în domeniul Dou, de regulă, este înțeleasă ca proiectarea și implementarea sistem automatizat Managementul documentației gestionării (AC Dou) cu o multitudine de module încorporate și închise.

Dar ceea ce se află în spatele acestor tehnologii informaționale, inclusiv sisteme de dou? Puțini specialiști în documente înțeleg acest lucru în întregime. În același timp, este destul de evident că, fără cunoștințe fundamentale, în domeniul tehnologiei informației (IT) nu pot face niciun document.

În ultimul standard național, reglementarea proceselor de gestionare a GOST R ISO 15489-1-2007, responsabilitatea "Documentației de Management" este clar scrisă, adică specialiști în domeniul gestionării documentației, pentru proiectare, implementare și Utilizarea sistemului Dow Automatizat . Acest lucru sugerează că documentele nu mai pot fi un observator terță parte la proiectarea și implementarea AC Dou și numai atunci utilizatorii săi. Acestea trebuie să fie deja în stadiul inițial al designului său să ia o parte activă în proces și să stabilească cerințele de bază pentru componenta funcțională a acestui sistem.

În conformitate cu cerințele privind calificările, documentația participă la formularea sarcinilor, proiectării, funcționării și îmbunătățirii (în parte suport de informare) Sisteme de informare automate și sisteme de control. De asemenea, participă la dezvoltarea celor mai recente tehnologii informaționale, de proiectare și actualizare a bazelor de date și bănci de date. El studiază și rezumă experiența internă și străină avansată în zona Dow.

Studiul tehnologiilor informatice informatice în activitățile de management devine o sarcină importantă de formare profesională generală în domeniul "documentației și documentației" . Un specialist modern ar trebui să fie bine axat pe varietatea de software și să-și imagineze nivelul variabilității soluțiilor software și tehnologice pentru implementarea sarcinilor lui Dou.

De aici putem concluziona că este necesar să se extindă orizonturile documentelor în domeniul aplicării tehnologiilor informaționale în Dou și caracteristicile acestora.

Cea mai importantă problemă care rezultă din introducerea acesteia în activitățile oricărei, în special a statului, organizarea este problema conservării documentelor electronice și a accesului la acesta după o perioadă considerabilă de timp. O altă problemă apar la schimbarea documentelor electronice în management, în special la nivelul interdepartamental. În stadiul actual, aceste probleme, în parte, vor ajuta la rezolvarea formatelor deschise de documente electronice.

Țara este discutată în mod activ și problema introducerii managementului electronic de documente la nivel de guvernare (de exemplu, programul "Rusia electronică" , "Electronic Moscova" , Conceptul de formare a e-guvernării , introducerea reglementărilor administrative electronice , Asociația informațiilor guvernamentale RE-SURSS ). Soluția aspectelor emise în aceste documente nu este posibilă fără a lua în considerare formatele documentelor electronice (ED).

Documente importante care definesc principalele direcții de dezvoltare a tehnologiilor informaționale în Federația Rusă sunt doctrina securității informațiilor și strategia de dezvoltare societatea informațională . O atenție deosebită este acordată programelor și conceptelor, datorită faptului că este tocmai în ele o metodologie de introducere a acestuia modernă în Rusia, inclusiv Dow Scopul. Printre acestea se numără un interes deosebit pentru programul țintă federal "Electronic Rusia (2002-2010)" , Conceptul de formare în Federația Rusă a E-guvernării până în 2010 , Conceptul de utilizare a tehnologiilor informaționale în activitățile organelor guvernamentale federale până în 2010 si etc.

Conceptul de dezvoltare a sistemului național de standardizare este un sistem de opinii cu privire la problemele dezvoltării sistemului național de standardizare în Federația Rusă până în 2010 și conține obiective, obiective și direcții de dezvoltare rezonabile.

Luarea în considerare a acestei probleme, intenționăm să dedicăm un ciclu de articole în care vor fi descrise principalele formate de documente electronice, formarea și dezvoltarea de software liber, specificitatea formatelor deschise de documente electronice, practica aplicării acestora în Rusia și in strainatate.

Formatul documentului electronic este, mai precis, formatul de fișier care conține informații text și / sau audiovizual în forma codificată. "Codificat" nu ar trebui să fie confundat cu conceptul de "criptat". Criptarea se referă la mijloacele de ascundere a informațiilor, iar codificarea este doar conversia informațiilor de la o formă la alta.

Dacă analizați dicționarele moderne tehnologia calculatoarelor, conceptul de "format" este diversificat și dificil. Pentru un utilizator, este suficient să știți că formatul documentului electronic este o anumită logică sau algoritm definit, urmând care informații de la dispozitivul de citire a mașinii este transformat într-o persoană care poate fi ușor de înțeles și invers. Formatele pot avea diferite tipuri, de la simple și limitate la provocările complexe și capabile să transporte mai multe funcții, inclusiv posibilitățile de a crea layout-uri, compresie și criptare.

În domeniul tehnologiei informatice, sub termenul "format" înseamnă structura instalației de informare. De exemplu, formatul de fișier se numește metoda de organizare a elementelor de informație (biți, octeți) în fișier, iar formatul electronic al documentului determină metoda de localizare și prezentare a datelor în documentul electronic .

Listăm formate pe scurt ale documentelor electronice utilizate în Dow .

Formate text Folosit pentru a crea texte text și sunt cel mai adesea create folosind procesoare de text.
De exemplu:

DOC este un format de document electronic popular, conceput pentru a vizualiza și modifica (edita) textul documentului. Formatul este extrem de convenabil dacă lucrați simultan pe un document de mai mulți artiști.
.PDF - format de afișare a documentelor într-o formă identică pe oricare sistem de operare Și în orice cerere. Populară în pregătirea documentelor, a materialelor de prezentare, a broșurilor de publicitate etc. Datorită faptului că formatul este destinat să vizualizeze documentul și nu permite efectuarea unei modificări neautorizate (sau imperceptibile), utilizarea sa în Dow este extrem de convenabil. Trebuie remarcat faptul că toate standardele Organizației Internaționale pentru Standardizare (ISO) sunt trimise la ROSTECHREGULARE în format PDF.

RTF - conceput pentru a vizualiza documente și a le edita în diferite versiuni ale produselor software. De exemplu, versiuni cuvânt pentru ferestre. În plus, formatul este utilizat în mod activ datorită faptului că vă permite să convertiți fișiere fără pierderi de structură și o parte semnificativă a documentului și să lucrați cu acestea într-un singur sistem de operare, dar în diferitele sale versiuni temporare.
Formate grafice Stocați imaginea (de exemplu, o fotografie, desen) și sunt împărțite în două tipuri principale: formate vectoriale care stochează imaginea ca un set de forme geometrice (DXF, EPS, CGM) și formate de raster care stocate imaginea ca set de Pixel Dot (BMP, TIFF, GIF). Imaginea salvată poate fi adăugată la textul documentului și o utilizează la proiectarea unei prezentări.

Formatele bazei de date sunt create utilizând sisteme de gestionare a bazelor de date (DBMS). Ele constau în câmpuri și mese care conțin elemente separate informație. Pro-gram vă permite să stabiliți link-uri între elementele împrăștiate. De exemplu, baza de date a angajaților poate conține domenii cu numele angajaților, adreselor și informațiilor despre activitatea efectuată.

Fișierele din formatul foii de calcul sunt stocate în celulele numărului și relației dintre aceste numere. Astfel, o celulă poate conține o formulă care rezumă datele celorlalte două celule. Ca și fișierele de bază de date, fișierele de calcul tabelar au, de obicei, formatul programului, cu care sunt create. Acest format este convenabil atunci când se ia în considerare timpul de lucru etc.

Formatele video și audio conțin imagini în mișcare ( video digital., animație) și date de sunet care sunt cele mai create și vizualizate utilizând programele corespunzătoare și stocate în format unic-str. Cele mai utilizate sunt formate QuickTime și MPEG. În plus față de ajutorul lor, vă puteți conecta la întâlniri, întâlniri etc.

Să trăim mai detaliat pe formatele de marcare care conțin instrucțiuni încorporate pentru afișarea și înțelegerea conținutului fișierului.

Puteți defini limba electronică de marcare a documentelor pe SGML (limbă standard de marcare generalizată). Inițial, a fost dezvoltat pentru împărțirea documentelor care pot fi citite de calculator în proiecte mari de guvernare și aerospațiale. Acesta a fost utilizat pe scară largă în sfera tipărită și publică, însă complexitatea sa a făcut dificilă să fie răspândită pentru utilizarea zilnică.

SGML a fost aprobat de Organizația Internațională pentru StandardizareISO. Ca standard internațional ISO 8879: 1986 Prelucrarea informațiilor - Sisteme de text și de birou - Limba standard de marcare generalizată (SGML) "și este utilizată în organele de stat din multe țări ale lumii.

Din limba de aspect a documentului SGML, au avut loc noi limbi de marcare mai avansateHTML și XML.

HTML (Limba de marcaj hipertext - "Limba de marcarehipertext. ") Aceasta este o aplicație SGML. Este folosit pentru a afișa aproape toate informațiile din rețea. Respectă standardul internaționalISO. 8879: 1986 și este standarddocumentele de marcare a limbii în World Wide Web (www).

XML (limbă de marcare extensibilă) - un subset limba SGML.. Popularitate a primit popularitate atunci când gestionați informațiile și schimbul, ca un limbaj relativ simplu de marcare a documentelor. XML - Format text conceput pentru a stoca date structurate (în loc de existentefișiere de baze de date. ), să facă schimb de informații întreprograme , precum și de a crea pe baza lor mai multe limbi de marcare specializate, uneori numite dicționare.

Formatul XML este adoptat de către autoritățile de standardizare a comunității comunitare pe Internet în fața consorțiului World Wide Wide (W3C), care dezvoltă și implementează standarde tehnologice pentruWorld Wide Web Și organizațiile UDDI (Descrierea, descoperirea și integrarea universală), dezvoltarea unui standard de descriere universală, detecție și integrare, concepute pentru a defini, înregistra și detecta serviciile web oferite de companii. Această specificație stabilește cerințele pentru Registrul de informații distribuite al serviciului Web .

Prin destinație, formatele de documente electronice pot fi împărțite în:
- formate pentru vizualizarea documentului;
- formate pentru vizualizarea și schimbarea documentului;
- Formate pentru schimbarea documentului.

Dacă este posibil, formatele electronice de documente sunt:
- inter-platformă portabilă;
- Interpogramo portabil;
- de specialitate.

De regulă, granița clară dintre aceste categorii nu se întâmplă. Formatele care sunt portabile între diferite platforme pot fi interprogramul. Formatele specializate sunt utilizate în sarcini înguste și sunt utilizate, de regulă, numai prin aplicații ale unei companii și sunt cele mai des închise.

Prin disponibilitate, formatele pot fi deschise și închise. Formatele închise sunt întotdeauna proprietatea unei anumite organizații care le utilizează pentru a garanta calitatea calității produsului și pentru a proteja împotriva concurenților de tehnologie a împrumutului.

Formatul deschis este o specificație de stocare a datelor digitale disponibile public, fără restricții licențiate atunci când este utilizat. În special, ar trebui să fie posibilă includerea suportului pentru formatele deschise ca îngratuit (deschis) și în proprietar (proprietar, non-free) extins de cătrelicențe caracteristică fiecăruia dintre aceste tipuri. Scopul principal al formatelor deschise este de a garanta posibilitatea accesului la date pentru o lungă perioadă de timp, fără a ține seama de drepturile licențiate și specificatii tehnice. Formatul deschis al documentului electronic protejează consumatorul nu numai la schimbarea versiunilor programului, dar, de asemenea, face posibilă citirea documentelor în condițiile de indisponibilitate a programului, cu care a fost creat un document electronic.

Care este formatul XML remarcabil? Limba lingvistică extensibilă Limba de marcare extensibilă conține nu numai date, ci și "conține informații care descrie aceste date. Acesta este valabil pentru orice aplicație de calculator și vă permite să transmiteți cantități mari de informații fără a fi nevoie de transformarea consumatoare de timp a structurilor de date " .

În prezent, producătorii de software au trecut cu promptitudine la utilizarea XML în produsele lor și, prin urmare, implementarea ideii de standardizare a formatelor de documente bazate pe XML, în esență format deschis Documente electronice.

Continuarea în următoarea problemă.

GOST R ISO 15489-1-2007. Managementul documentelor. Cerințe generale.

Cuvântul "format" are multe valori. În domeniul tehnologiei informatice, sub termenul "format" înseamnă structura instalației de informare. De exemplu, un format de fișier se numește metoda de organizare a elementelor de informație (biți, octeți) în fișier, iar formatul documentului electronic determină metoda de amplasare și prezentare a datelor în documentul electronic.

Sunt multi diverse formate Documente electronice. În general, ele pot fi împărțite în "String-string", adică, controlate și susținute de un singur dezvoltator de software și "multiprogram", care sunt susținute de mai mulți dezvoltatori și pot fi procesate de diverse programe.

Formate principale de documente electronice.

1. Formate de text. Ele sunt cele mai create cu ajutorul procesatorilor de text. Cele mai frecvente formate de text sunt:

1) Strângeți unică formate Microsoft Word, WordPerfect, care au extinderea programului în care sunt create;

2) formatul RTF, care este susținut de diverse aplicații software și, păstrează formatarea specificată a textului;

c) Formatul PDF (formatul documentului portabil), care conține o imagine a paginii, inclusiv text și grafică. Fișierele Format PDF pot fi citite numai utilizând numai cititoare de fișiere diverse, dar sunt create numai cu programe Adobe. Acrobat.

2. Formate grafice. Ele stochează o imagine (de exemplu, o fotografie, desen) și sunt împărțite în două tipuri principale:

1) Formate vectoriale care stochează imaginea ca un set de forme geometrice. Printre acestea sunt cele mai frecvente:

a) formatul DXF (format de desenare interbancare), utilizat pe scară largă în programele de proiectare a calculatoarelor utilizate de ingineri, arhitecți;

b) formatul EPS (PostScript încapsulat), utilizat pe scară largă în sistemele de publicare desktop;

c) Formatul CGM (metafile grafice de calculator) este utilizat pe scară largă în mulți editori grafici (de exemplu, în editorul Photoshop);

2) formate de raster care stochează imaginea ca un set de pixeli puncte. Când scala se schimbă, graficele rasterului devine denaturare. Printre formate de raster Cel mai comun:

a) Formatul BMP (Bitmap) este un format relativ de calitate, cel mai des utilizat în procesoare de text;

b) formatul TIFF (etichetat formatul fișierului imagine), utilizat pe scară largă în multe aplicații software;

c) Formatul GIF (formatul de interbancare grafică), utilizat pe scară largă în programele destinate internetului.

3. Formatele bazei de date sunt create utilizând sisteme de gestionare a bazelor de date (DBMS). Acestea constau în câmpuri și mese care conțin elemente individuale de informații. Programul vă permite să stabiliți link-uri între elementele împrăștiate. De exemplu, baza de date a clienților poate conține câmpuri cu nume de clienți, adrese și informații de cumpărare. Aceste câmpuri pot fi organizate în tabele separate (de exemplu, un tabel pentru toate câmpurile cu nume de clienți). Bazele de date pot fi convertite într-un format text, dar relațiile dintre câmpuri și tabele vor fi pierdute (de exemplu, 10 pagini de nume, 10 pagini de adrese și 1000 de pagini de informații despre achiziții, adică informații incoerente).

4. Formate de foi de calcul. Fișierele din formatul foii de calcul sunt stocate în celulele numărului și relației dintre aceste numere. Astfel, o celulă poate conține o formulă care rezumă datele celorlalte două celule. Ca și fișierele de bază de date, fișierele de calcul tabelar au, de obicei, formatul programului, cu care sunt create. Unele programe pot importa și exporta date din alte surse, inclusiv programe concepute pentru un astfel de schimb de date (de exemplu, Dif Format (format de schimb de date). Fișierele de tabel electronic pot fi convertite în fișiere text, dar valorile și interconexiunile dintre numere vor fi pierdute..

5. Formate video și audio. Aceste formate conțin imagini în mișcare (video digitală, animație) și date audio, create și vizualizate în întregime folosind programele corespunzătoare și sunt stocate în format unic-str. Cele mai utilizate dintre ele sunt formate rapide și MPEG (grup de experți în filme).

6. Limbile de marcare, numite și formate de marcare, conțin instrucțiuni de afișare încorporate și înțelegere conținând un fișier. Acestea includ:

1) SGML (limbă standard de marcare generalizată), care este utilizată în multe țări ale lumii în organele de stat și este un standard internațional;

2) HTML (Language HMperText Markup), care este utilizat pentru a afișa aproape toate informațiile din rețeaua Web World Wide;

3) XML (Limba de marcare extensibilă) este un limbaj relativ simplu bazat pe SGML și a câștigat popularitate atunci când gestionează informația și schimbul.

Formatul PDF, creat de Adobe Systems Inc., este foarte popular cu schimbul de documente și este utilizat pe scară largă pentru documentele Internet, deoarece vă permite să mențineți apariția inițială a documentelor și permite să modificați documentul. Potrivit evaluării Adobe, o jumătate de miliard de oameni au descărcat-o deja program gratuit Vizualizarea fișierelor PDF, multe întreprinderi au ales acest format ca un standard pentru transferul și stocarea documentelor, iar mulți dezvoltatori independenți oferă produse care susțin PDF, iar unele sunt gratuite.

Versiunea modificată a formatului, numită arhivă PDF (PDF-A), este considerată în străinătate ca una dintre cele două formate principale care pot fi utilizate în viitor pentru depozitarea arhivistică a documentelor electronice. Al doilea format este XML.

Se poate argumenta că cea mai mare distribuție în domeniul managementului a primit acum documente create de procesoare de text, în special Microsoft Word. Un număr semnificativ de documente manageriale este, de asemenea, creat în formatul de foi de calcul (o ceașcă de toate utilizând procesorul Microsoft Excel Tabel) și în formatul diapozitivelor de prezentare (preparat utilizând sistemul de preparare a prezentării Microsoft PowerPoint). Multe documente electronice generează astfel de tehnologii emergente relativ recent ca e-mail, videoconferințe, site-uri web. În viitor, multe alte tehnologii pot deveni mari "producători" de documente electronice, cum ar fi sistemele de geoinformație, centrele de operare.

Fiecare dintre formatele de documente electronice are avantajele și dezavantajele sale atunci când este utilizat în gestionarea documentației. De exemplu, formatele de text (cuvântul perfect, Microsoft Word, RTF etc.) sunt convenabile pentru căutarea contextuală după documente în baza de date, iar formatele grafice (PDF, TIFF etc.) vă permit să obțineți o imagine a unui document cu Toate caracteristicile sale externe la scanarea stocurilor de stocare în aceeași formă ca pe hârtie, cu toate semnăturile și vizele.

Formatul MS Word este foarte convenabil atunci când editați un document și un grup de lucru cu acesta, totuși fișierul MS Word stochează o mulțime de informații ascunse (în primul rând despre modificările făcute în fișier) și, prin urmare, foarte nesigure în punctul de Vizualizarea scurgerii informațiilor despre serviciu. În unele cazuri, cum ar fi oferi Sau un proiect de contract, informațiile ascunse vă permit să stabiliți ceea ce au fost ipotezele inițiale și care au avut cea mai mare influență asupra textului.

În pregătirea grupului a documentului, analiza editării face posibilă învățarea nu numai a numelor persoanelor care au făcut-o, ci și care au contribuit la versiunea finală.

Principala întrebare care apare în legătură cu formatele documentelor electronice este o chestiune de conversie și (sau) migrarea documentelor electronice. Când conversia, un format electronic de format de document și când migrarea, un document electronic este mutat de la o singură platformă software sau media la alta, fără a schimba formatul. Cu toate acestea, în timpul migrării, este posibil să fie necesar să convocați un document electronic. De exemplu, atunci când mutați documentul electronic din sistemul de operare Macintoch, sistemul de operare Microsoft Windows necesită conversia unui document electronic la un nou format (de exemplu, RTF sau Word 2000).

În acest caz, este posibil 3 tipuri principale de pierderi care trebuie luate în considerare la depozitarea documentelor electronice:

1) Pierderea datelor. Când pierderea datelor este o anumită măsură, conținutul documentului este pierdut. Documentul electronic devine defect și nesigur;

2) pierderea aspectului, structura documentului electronic. De exemplu, la conversia documentelor text în format RTF, puteți pierde unele dintre caracteristicile aspectului documentelor;

3) Pierderea legăturilor dintre date (în foi de calcul, baze de date) face de asemenea un document defect.

Trebuie să se țină cont de faptul că o copie a documentului poate fi recunoscută legal numai dacă este creată în metoda dovedită și este corectă, completă și fiabilă pentru utilizarea pe termen lung.

A doua întrebare asociată cu formatele și gestionarea documentelor electronice este o chestiune de comprimare a fișierelor (compresie). Avantajele compresiei de fișiere sunt salvarea locului ocupat în timpul depozitării, transferului de fișiere mai rapide și simple. Dezavantajele compresiei fișierelor sunt că poate duce la pierderea datelor. În plus, provoacă necesitatea utilizării programelor suplimentare de compresie a software-ului (WinZip, Zipmagic etc.), care sunt, de asemenea, inerente problemei obrasescenței, multi-scară, în funcție de platformă.

Posibilitățile de utilizare a formatelor PDF-Archive în arhivele electronice sunt limitate: în special, formatul PDF-A nu este potrivit pentru stocarea arhivării documentelor audiovizuale.

Rezumând:trebuie remarcat faptul că niciunul dintre formatele documentelor electronice nu poate fi considerat universal pentru depozitarea de arhivă pe termen lung, deoarece tehnicile, tehnologiile și software-ul se schimbă destul de repede.