Formatele electronice de documente utilizate în Managementul documentației

În lumea modernă, informațiile sunt o resursă valoroasă comparabilă cu excepția timpului. Informațiile efectuează multe sarcini în viața societății, oferind interacțiunea de comunicare a tuturor componentelor sale, fixarea, menținerea și transmiterea cunoștințelor primite și acumulate. Cu toate acestea, rolul-cheie joacă informații în management.

Informațiile de gestionare sunt înregistrate în documente. Documentul, ca transportator de informații, este o resursă informațională, care este încredințată specialiștilor de gestionare a documentelor concepute pentru a organiza un proces tehnologic de documentare și de a lucra cu documente, inclusiv utilizarea tehnologiilor moderne de informare.

În stadiul actual, nimeni nu este îndoielnic necesitatea de a introduce noi tehnologii informaționale în procesele de management și, în primul rând, în domeniul de aplicare al documentației (Dou), ca într-una dintre cele mai importante componente ale acestor procese. Vorbind despre introducerea de noi tehnologii de informare și comunicare (TIC) la sfera Dou, de regulă, se înțelege că proiectarea și implementarea unui sistem automatizat de gestionare a documentației (AC Dou) cu o multitudine de module încorporate și atașate este implicit.

Dar ceea ce se află în spatele acestor tehnologii informaționale, inclusiv sisteme de dou? Puțini specialiști în documente înțeleg acest lucru în întregime. În același timp, este destul de evident că, fără cunoștințe fundamentale, în domeniul tehnologiei informației (IT) nu pot face niciun document.

În ultimul standard național, reglementarea proceselor de gestionare a GOST R ISO 15489-1-2007, responsabilitatea "Documentației de Management" este clar scrisă, adică specialiști în domeniul gestionării documentației, pentru proiectare, implementare și Utilizarea sistemului Dow Automatizat . Acest lucru sugerează că documentele nu mai pot fi un observator terță parte la proiectarea și implementarea AC Dou și numai atunci utilizatorii săi. Acestea trebuie să fie deja în stadiul inițial al designului său să ia o parte activă în proces și să stabilească cerințele de bază pentru componenta funcțională a acestui sistem.

În conformitate cu cerințele privind calificările, documentația participă la formularea sarcinilor, proiectării, funcționării și îmbunătățirii (în parte suport de informare) Sisteme de informare automate și sisteme de control. De asemenea, participă la dezvoltarea celor mai recente tehnologii informaționale, de proiectare și actualizare a bazelor de date și bănci de date. El studiază și rezumă experiența internă și străină avansată în zona Dow.

Studiul tehnologiilor informaționale de informatică în activități de management Ea devine o sarcină importantă de formare contemporană în domeniul "Documentația și Documentația" . Un specialist modern ar trebui să fie bine axat pe varietatea de software și să-și imagineze nivelul variabilității soluțiilor software și tehnologice pentru implementarea sarcinilor lui Dou.

De aici putem concluziona că este necesar să se extindă orizonturile documentelor în domeniul aplicării tehnologiilor informaționale în Dou și caracteristicile acestora.

Cea mai importantă problemă care rezultă din introducerea acesteia în activitățile oricărei, în special a statului, organizarea este problema conservării documente electronice și acces la ea după o perioadă considerabilă de timp. O altă problemă apar la schimbarea documentelor electronice în management, în special la nivelul interdepartamental. În stadiul actual, aceste probleme, în parte, vor ajuta la rezolvarea formatelor deschise de documente electronice.

Țara este discutată în mod activ și problema introducerii managementului electronic de documente la nivel de guvernare (de exemplu, programul "Rusia electronică" , "Electronic Moscova" , Conceptul de formare a e-guvernării , introducerea reglementărilor administrative electronice , Asociația informațiilor guvernamentale RE-SURSS ). Soluția aspectelor emise în aceste documente nu este posibilă fără a lua în considerare formatele documentelor electronice (ED).

Documente importante care solicită principalele direcții de dezvoltare a tehnologiilor informaționale în Federația Rusăsunt doctrina securității informațiilor și strategia de dezvoltare societatea informațională . O atenție deosebită este acordată programelor și conceptelor, datorită faptului că este tocmai în ele o metodologie de introducere a acestuia modernă în Rusia, inclusiv Dow Scopul. Printre acestea se numără un interes deosebit pentru programul țintă federal "Electronic Rusia (2002-2010)" , Conceptul de formare în Federația Rusă a E-guvernării până în 2010 , Conceptul de utilizare a tehnologiilor informaționale în activitățile organelor guvernamentale federale până în 2010 si etc.

Conceptul de dezvoltare a sistemului național de standardizare este un sistem de opinii cu privire la problemele dezvoltării sistemului național de standardizare în Federația Rusă până în 2010 și conține obiective, obiective și direcții de dezvoltare rezonabile.

Intenționăm să abordăm această problemă să dedice un ciclu de articole în care vor fi descrise principalele formate de documente electronice, formarea și dezvoltarea liberei software., specificitatea formatelor deschise de documente electronice, practica aplicării acestora în Rusia și în străinătate.

Formatul documentului electronic este, mai precis, formatul de fișier care conține informații text și / sau audiovizual în forma codificată. "Codificat" nu ar trebui să fie confundat cu conceptul de "criptat". Criptarea se referă la mijloacele de ascundere a informațiilor, iar codificarea este doar conversia informațiilor de la o formă la alta.

Dacă analizați dicționarele tehnologice moderne, conceptul de "format" este diversificat și dificil. Pentru un utilizator, este suficient să știți că formatul documentului electronic este o anumită logică sau algoritm definit, urmând care informații de la dispozitivul de citire a mașinii este transformat într-o persoană care poate fi ușor de înțeles și invers. Formatele pot avea diferite tipuri, de la simple și limitate la provocările complexe și capabile să transporte mai multe funcții, inclusiv posibilitățile de a crea layout-uri, compresie și criptare.

În domeniul tehnologiei informatice, sub termenul "format" înseamnă structura instalației de informare. De exemplu, formatul de fișier se numește metoda de organizare a elementelor de informație (biți, octeți) în fișier, iar formatul electronic al documentului determină metoda de localizare și prezentare a datelor în documentul electronic .

Listăm formate pe scurt ale documentelor electronice utilizate în Dow .

Formatele text sunt utilizate pentru a crea texte text și sunt create cel mai adesea folosind procesoare de text.
De exemplu:

DOC este un format de document electronic popular, conceput pentru a vizualiza și modifica (edita) textul documentului. Formatul este extrem de convenabil dacă lucrați simultan pe un document de mai mulți artiști.
.Pdf este un format de afișare identic pe orice sistem de operare și în orice aplicație. Populară în pregătirea documentelor, a materialelor de prezentare, a broșurilor de publicitate etc. Datorită faptului că formatul este destinat să vizualizeze documentul și nu permite efectuarea unei modificări neautorizate (sau imperceptibile), utilizarea sa în Dow este extrem de convenabil. Trebuie remarcat faptul că toate standardele Organizației Internaționale pentru Standardizare (ISO) sunt trimise la ROSTECHREGULARE în format PDF.

RTF - conceput pentru a vizualiza documente și a le edita în diferite versiuni ale produselor software. De exemplu, versiuni cuvânt pentru ferestre. ÎN Formatul DOE. Acesta este utilizat în mod activ datorită faptului că vă permite să transformați fișierele fără a pierde structura și o parte semnificativă a documentului și să lucrați cu ei într-un sistem de operare, dar în diferitele sale versiuni temporare.
Formate grafice Stocați imaginea (de exemplu, foto, desen) și sunt împărțite în două tipuri principale: formate vectorialecare stochează imaginea ca un set de forme geometrice (DXF, EPS, CGM) și formate de rastercare a stocat imaginea ca un set de pixeli dot (BMP, TIFF, GIF). Imaginea salvată poate fi adăugată la textul documentului și o utilizează la proiectarea unei prezentări.

Formatele bazei de date sunt create utilizând sisteme de gestionare a bazelor de date (DBMS). Ele constau în câmpuri și mese care conțin elemente separate informație. Pro-gram vă permite să stabiliți link-uri între elementele împrăștiate. De exemplu, baza de date a angajaților poate conține domenii cu numele angajaților, adreselor și informațiilor despre activitatea efectuată.

Fișierele din formatul foii de calcul sunt stocate în celulele numărului și relației dintre aceste numere. Astfel, o celulă poate conține o formulă care rezumă datele celorlalte două celule. Ca și fișierele de bază de date, fișierele de calcul tabelar au, de obicei, formatul programului, cu care sunt create. Acest format este convenabil atunci când se ia în considerare timpul de lucru etc.

Formatele video și audio conțin imagini în mișcare ( video digital., animație) și date de sunet care sunt cele mai create și vizualizate utilizând programele corespunzătoare și stocate în format unic-str. Cele mai utilizate sunt formate QuickTime și MPEG. În plus față de ajutorul lor, vă puteți conecta la întâlniri, întâlniri etc.

Să trăim mai detaliat pe formatele de marcare care conțin instrucțiuni încorporate pentru afișarea și înțelegerea conținutului fișierului.

Puteți defini limba electronică de marcare a documentelor pe SGML (limbă standard de marcare generalizată). Inițial, a fost dezvoltat pentru împărțirea documentelor care pot fi citite de calculator în proiecte mari de guvernare și aerospațiale. Acesta a fost utilizat pe scară largă în sfera tipărită și publică, însă complexitatea sa a făcut dificilă să fie răspândită pentru utilizarea zilnică.

SGML a fost aprobat de Organizația Internațională pentru StandardizareISO. Ca standard internațional ISO 8879: 1986 Prelucrarea informațiilor - Sisteme de text și de birou - Limba standard de marcare generalizată (SGML) "și este utilizată în organele de stat din multe țări ale lumii.

Din limba de aspect a documentului SGML, au avut loc noi limbi de marcare mai avansateHTML și XML.

HTML (Limba de marcaj hipertext - "Limba de marcarehipertext. ") Aceasta este o aplicație SGML. Este folosit pentru a afișa aproape toate informațiile din rețea. Respectă standardul internaționalISO. 8879: 1986 și este standarddocumentele de marcare a limbii în World Wide Web (www).

XML (limbă de marcare extensibilă) - un subset limba SGML.. Popularitate a primit popularitate atunci când gestionați informațiile și schimbul, ca un limbaj relativ simplu de marcare a documentelor. XML - Format text conceput pentru a stoca date structurate (în loc de existentefișiere de baze de date. ), să facă schimb de informații întreprograme , precum și de a crea pe baza lor mai multe limbi de marcare specializate, uneori numite dicționare.

Formatul XML este adoptat de către autoritățile de standardizare a comunității comunitare pe Internet în fața consorțiului World Wide Wide (W3C), care dezvoltă și implementează standarde tehnologice pentruWorld Wide Web Și organizațiile UDDI (Descrierea, descoperirea și integrarea universală), dezvoltarea unui standard de descriere universală, detecție și integrare, concepute pentru a defini, înregistra și detecta serviciile web oferite de companii. Această specificație stabilește cerințele pentru Registrul de informații distribuite al serviciului Web .

Prin destinație, formatele de documente electronice pot fi împărțite în:
- formate pentru vizualizarea documentului;
- formate pentru vizualizarea și schimbarea documentului;
- Formate pentru schimbarea documentului.

Dacă este posibil, formatele electronice de documente sunt:
- inter-platformă portabilă;
- Interpogramo portabil;
- de specialitate.

De regulă, granița clară dintre aceste categorii nu se întâmplă. Formatele care sunt portabile între diferite platforme pot fi interprogramul. Formatele specializate sunt utilizate în sarcini înguste și sunt utilizate, de regulă, numai prin aplicații ale unei companii și sunt cele mai des închise.

Prin disponibilitate, formatele pot fi deschise și închise. Formatele închise sunt întotdeauna proprietatea unei anumite organizații care le utilizează pentru a garanta calitatea calității produsului și pentru a proteja împotriva concurenților de tehnologie a împrumutului.

Formatul deschis este o specificație de stocare a datelor digitale disponibile public, fără restricții licențiate atunci când este utilizat. În special, ar trebui să fie posibilă includerea suportului pentru formatele deschise ca îngratuit (deschis) și în proprietar (proprietar, non-free) extins de cătrelicențe caracteristică fiecăruia dintre aceste tipuri. Scopul principal al formatelor deschise este de a garanta posibilitatea accesului la date pentru o lungă perioadă de timp, fără a ține seama de drepturile licențiate și specificatii tehnice. Formatul deschis al documentului electronic protejează consumatorul nu numai la schimbarea versiunilor programului, dar, de asemenea, face posibilă citirea documentelor în condițiile de indisponibilitate a programului, cu care a fost creat un document electronic.

Care este formatul XML remarcabil? Limba lingvistică extensibilă Limba de marcare extensibilă conține nu numai date, ci și "conține informații care descrie aceste date. Acesta este valabil pentru orice aplicație de calculator și vă permite să transmiteți cantități mari de informații fără a fi nevoie de transformarea consumatoare de timp a structurilor de date " .

În prezent, producătorii de software au trecut cu promptitudine la utilizarea XML în produsele lor și, prin urmare, implementarea ideii de standardizare a formatelor de documente bazate pe XML, în esență format deschis Documente electronice.

Continuarea în următoarea problemă.

GOST R ISO 15489-1-2007. Managementul documentelor. Cerințe generale.

Documentele electronice au devenit aceleași ca o parte importantă a arhivelor ca imprimantă pe tabelul secretarului. Texte, fotografii, desene, baze de date, fișiere audio și video merg rapid la "cifra", provocând o discuție despre ce formate sunt cele mai potrivite pentru stocarea constantă a documentelor electronice. Din fericire, arhiviștii ruși au cineva să caute ajutor.

Despre documentele electronice sunt spuse din ce în ce mai puternice. În SUA, arhivați dedicați acestui domeniu de lucru o vacanță profesională cu drepturi depline - o zi de documente electronice (Ziua Electronică a înregistrărilor), care este sărbătorită pe 10 octombrie. În această zi, oamenii de știință și practicile sunt colectate împreună pentru a discuta problemele actuale de conservare a documentelor electronice.

Comunitatea științifică rusă, de asemenea, nu rămâne deoparte de rezolvarea problemelor practice, deși nu a fost dedicată zilelor roșii ale calendarului. Anul trecut, oamenii de știință de la Universitatea Umanitară de Stat din Rusia (RGGU) au efectuat un studiu la scară largă a diferitelor formate de fișiere electronice de documente cu descriere detaliata Nuanțele fiecăruia dintre ele.

Concluzii, principalele tendințe sunt prezentate în raportul științific al RGGU " Analiza comparativa Formate de dosare de documente electronice de stocare permanentă (pe termen lung) ".1 Acesta este unul dintre primele lucrări similare de cercetare din Rusia, permițând arhivele autorităților executive federale, organizațiilor de stat și neguvernamentale, precum și Arhivele de stat și municipale de a aborda în mod obiectiv problema alegerii celei mai optime arhive. Formatul stocării permanente (pe termen lung) a documentelor electronice.

Unele cerințe pentru stocarea documentelor electronice

Deja în stadiul de proiectare, sistemul maritim este construit astfel încât în \u200b\u200btimpul întregii perioade de depozitare pentru a asigura autenticitatea, fiabilitatea și caracterul adecvat al documentului, indiferent de modificările sistemului2. Astfel de modificări ale numărului de altele pot fi cauzate de conversia formatelor, migrația3 între echipamentele tehnice, sistemele de operare sau aplicații software. În acest caz, trebuie remarcat faptul că atunci când convertirea formatelor, informațiile despre conversia perfectă trebuie depozitate ca parte a informațiilor de control4. De asemenea, este important să știți că, în plus față de documentul electronic original, pe parcursul perioadei de depozitare, este necesar să se păstreze documentul de metadate (descrierea documentului) 5, care conține toate metadatele despre documentul electronic. În cazul în care perioada de depozitare a documentului electronic depășește perioada de așteptare a existenței sistemelor de stocare a datelor, este necesar să se documenteze planurile de migrare către noile sisteme6.

Lizibilitatea este o descriere integrală a documentului electronic. Este asigurată caracteristici tehnice Document și software disponibil pentru arhivarea angajaților. Formatul de fișier definit pentru depozitarea permanentă (pe termen lung) trebuie să respecte capacitățile tehnice ale organismelor guvernamentale, ale arhivelor de stat și municipale, organizații neguvernamentale etc. să reproducă informații într-o perspectivă pe termen lung7. Mai mult, se recomandă ca documentele electronice să fie făcute pe depozitare însoțite de unelte software care le permit să se reproducă, iar Kitul de documentare însoțitor8.

În ceea ce privește formatele de fișiere, afirmația cărora ar trebui să fie susținută de sisteme electronice de gestionare a documentelor, nu există o uniformitate exactă. Astăzi, actele juridice de reglementare sunt oarecum diferite în viziunea lor asupra listei finale. De exemplu, în conformitate cu recomandările privind pregătirea autorităților federale din lista documentelor, crearea, stocarea și utilizarea cărora ar trebui să se efectueze sub formă de documente electronice în organizarea activităților interne (aprobate prin ordinul Rosarhiva datată 29 aprilie 2011 nr. 32), prezența documentelor electronice în formatele PDF, DOC, RTF, TXT, XML.

În conformitate cu cerințele pentru sisteme de informare Gestionarea electronică a documentelor organismelor executive federale, inclusiv necesitatea procesării prin intermediul datelor sistemelor limitate de diseminare (ustensile. Ordinul Ministerului Comunicațiilor Federației Ruse din 02.09.2011 nr. 221), sunt necesare următoarele patru formate: PDF, RTF, DOC, TIFF. Alte documente de reglementare permit posibilitatea prezenței în sisteme electronice autoritățile de stat ale altor formate de dosare de documente electronice.

În septembrie 2014, Consiliul de experți din cadrul Ministerului Comerțului de a utiliza PDF / A ca forma de interacțiune interdepartamentală în ed și depozitarea pe termen lung a documentelor electronice. Împreună cu PDF / A, se propune transmiterea unui fișier XML cu detaliile unui document electronic. Se știe că împreună cu FSO va fi pregătit o comandă corespunzătoare cu cerințele pentru fluxul de documente.

Recomandări pentru selectarea formatului electronic al documentului

Alegerea formatului optim de stocare este determinată de tipul de informații, caracteristici. mijloace tehnice Depozitare (date magnetice, optice, solide de e-mail), caracteristici de acces utilizator la date și software. Datorită reducerii transportatorilor media și creșterea capacității acestora, disponibilitatea software-ului și lizibilității formatului de fișier într-o perioadă lungă de timp este recunoscută de principalii factori atunci când aleg o metodă de codare. Într-o analiză comparativă a formatelor electronice de documente (fișiere textuale, grafice, audio și video, baze de date, prezentări), au fost luate în considerare următoarele criterii: au fost luate în considerare următoarele criterii:

  • dezvoltator și proprietate;
  • anul de dezvoltare a formatelor de fișiere;
  • an de ultima sa modernizare;
  • frecvența actualizărilor de software;
  • disponibilitatea versiunilor;
  • codul programului deschis sau închis;
  • descrierea și compararea algoritmilor de compresie matematică;
  • formatul fișierului destinație;
  • prezența și disponibilitatea convertorilor;
  • stabilitate cu replicări multiple 9.

Formate text

Textul este matricea principală stocată în arhivele de informații. Acesta este tratat ca texte în limbile de comunicare umană (cu excepția scrierii hieroglifice, aproape de forma grafică) și a limbajelor de programare. De multe ori fișiere text Includeți fragmente de informații grafice. Spre deosebire de ilustrații, înregistrările audio și video, datele de text sunt supuse unor comprimări semnificative utilizând programe speciale de arhivare.

Conform recomandărilor RGU, arhivarea fișierelor este mai bună pentru a produce într-o formă necriptată utilizând ZIP (* .ZIP), iar informațiile despre text sunt mai expediate pentru a înregistra în formatele următoare: XML (include XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011) (* .pdf). Cu unele condiții pot fi utilizate formate text: Text simplu (ISO 8859-1NCODING), PDF (* .pdf) (fonturi încorporate), formatul text îmbogățit 1.x (* .RTF), HTML, SGML (* .SGML), Office Open (* .sxw / * . OXT), OOXML (ISO / IEC DIS 29500) (* .docx), epub (necriptat) (* .epub). Cea mai mare stabilitate atunci când migrează dintr-un singur format în software-ul selectat în celălalt, formatele * .doc și * .xml se comportă. Tabelul 1 prezintă rezultatele modificărilor în cantitatea de informații în timpul migrației.

Tabelul 1. Matricea se schimbă în cantitatea de informații în timpul migrației (de câte ori)

Formate de fișiere Sursa /
Formate de fișiere de migrare
* .doc.
Microsoft Word. 97-2003
* .odt.* .XML.* .RTF.* .pdf.* .pdf (PDF / a)
* .doc.
Microsoft Word 97-2003.
sursă<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 sursă>8,4 >7,7 >10 >18,4
* .XML.<2,2 <8,2 sursă>1,04 >1,4 >2,6

Rețineți că pachet de birou OpenOffice, care a fost distribuită din cauza unei licențe gratuite, are o serie de restricții, de exemplu, comparativ cu Microsoft Word 2007. Deci, pentru a crea un fișier în format XML în OpenOffice 4 (Writer), setările tehnice suplimentare ale sistemului vor fi să fie obligat (prezența mediului Java instalat (JRE). Nativ același XML OpenOffice 4 * .Stw nu a primit încă suport și descrieri semnificative. Microsoft Word 2007 nu afișează informații într-un astfel de format, deschizându-l ca gol document.

Formate grafice

Informații grafice S. rezoluție înaltăÎn special imaginile din policrom și pe jumătate, sunt practic care nu pot fi supuse compresiei arhivelor. De regulă, formatele de raster sunt utilizate pentru depozitare, care asigură depozitarea scenelor realiste cu o adâncime mare de culoare. Conform rezultatelor analizei comparative, doar trei formate s-au dovedit a fi cele mai potrivite pentru depozitarea pe termen lung. imagini raster.: TIFF (necomprimat), JPEG2000 (Lossless) (* .jp2), PNG (* .png).

Pentru imaginile vectoriale, formatul recomandat este SVG (fără legare Java Script) (* .SVG). Desenele, schemele structurale, algoritmi reprezentați grafic formați din primitive grafice (segmente și linii sparte, poligoane, cercuri și elipse) sunt implementate în mod eficient în astfel de formate vectoriale ca SWG, WMF, CGM și altele asemenea. Cu toate acestea, este imposibil să uitați că formatele vectoriale conduc, de obicei, la distorsionarea schemei de culori a unei imagini complexe.

Pentru codarea imaginilor 3D (formate de date virtuale) este acceptabilă pentru a utiliza formatul X3D (* .x3d).

Formate audio și video

La fel ca informațiile grafice, informațiile audio și video sunt aproape incapabili să arhiveze efectiv: în medie, compresia lor nu depășește 5%. Selectarea diferitelor tipuri de codare a acestor date afectează în mod semnificativ volumul fișierului stocat, de la calitatea de redare necesară și, ca rezultat, preferința acestui format sau acel format depinde de volumul necesar de stocare de arhivă. Formate recomandate de stocare audio: AIFF (PCM) (* .aif, * .aif), wav (PCM) (* .wav), AES3 (LPCM) (* .AES). Cele mai bune rezultate privind rezultatele comparației pentru siguranța datelor video au arătat formate: motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2), AVI (Necomprimat, Motion JPEG) (* Necomprimat, motion jpeg) (* .mov).

Baze de date și bănci de date

Alegerea formatului de stocare a bazei de date depinde în principal de structura sa. Dacă baza este un fișier, este recomandabil să îl stocați în codarea corespunzătoare acestui tip de fișier. Când depozitați baza a cărei înregistrări constau în câmpuri de diferite structuri, codificările RTF și PDF sunt utilizate cel mai adesea, dar în cazul eventualului, dacă nu există fraze audio și video în baza de date. Cele mai versatile formate pentru bazele de date de stocare pe termen lung sunt valorile separate prin virgulă (* .csv), text delimitat (* .txt), SQL DDL. În cazuri rare, pot fi utilizate formate: DBF (* .dbf), OpenOffice (* .Sxc / *. ODS), OOXML (ISO / IEC 29500) (* xlsx).

Prezentări

Niciunul dintre formate existente Nu oferă un grad ridicat de fiabilitate a conservării prezentării. Cu unele rezerve, puteți recomanda formate OpenOffice (* .sxi / *. ODP) și OOXML (ISO / IEC DIS 29500) (* .pptx). Formatul PowerPoint (* .ppt) și alte formate ale fișierelor de prezentare nu îndeplinesc cerințele de stocare pe termen lung.

Informații hibride

Pentru stocarea documentelor cuprinzătoare, a cărei structură include fragmente de diferite natură (text, fotografie, desen etc.), formate de text moderne, cum ar fi MS Word, RTF, sunt cele mai potrivite. Acestea permit includerea imagini grafice În codurile raster. Dacă există multe ilustrații, acest document este recomandat să fie stocat ca o singură imagine - în acest caz, sunt preferate formate grafice.

NOTE:

  1. Activitatea de cercetare a fost efectuată în cadrul contractului de stat nr. 016-3 din data de 31 mai 2013 "Studiul proceselor moderne de gestionare a documentelor și gestionarea documentelor electronice. "Raport științific" Analiza comparativă a formatelor de fișiere ale documentelor electronice de depozitare permanentă (pe termen lung) "(ca parte a punerii în aplicare a activităților programului federal țintă" Cultura Rusiei "(2012-2018).
  2. GOST R ISO 15489-1-2007 "Standardul Național al Federației Ruse. Sistem de standarde privind informarea, biblioteconomia și publicarea. Managementul documentelor. Cerințe generale "(aprobată prin ordinul de rostechregulation datată 12.03.2007 nr. 28-ST).
  3. Migrarea documentelor electronice este o acțiune privind deplasarea înregistrărilor de la un sistem la un alt sistem, menținându-și autenticitatea, integritatea, fiabilitatea și ușurința utilizării.
  4. Structura descrierii documentului constă într-o descriere a structurii sale fizice sau tehnice și a structurii sale logice, adică relațiile dintre elementele de date care constituie documentul. Pentru mai multe informații despre crearea, gestionarea și utilizarea metadatelor, consultați GOST R ISO 23081-1-2008. Sistem de standarde privind informarea, biblioteconomia și publicarea. Procese de gestionare a documentelor. Metadate pentru documente. Partea 1. Principii (aprobate prin ordinul RostechRegulare din 13 noiembrie 2008 Nr. 310-ST).
  5. GOST R 54471-2011 "Sisteme electronice de gestionare a documentelor. Managementul documentației. Informații stocate în în format electronic. Recomandări pentru asigurarea fiabilității și fiabilității. "
  6. Reguli de organizare a depozitării, achiziționării, contabilității și utilizării documentelor Fondului de arhivă a Federației Ruse și a altor documente de arhivă în arhivele de stat și municipale, muzee și biblioteci, organizații ale Academiei Ruse de Științe (aprobate prin Ordinul Ministerului Cultură și comunicații în masă ale Federației Ruse din 18 ianuarie 2007 Nr. 19).
  7. A se vedea ibid. 4.4.3.
  8. Replicarea este o metodă de salvare a informațiilor digitale prin crearea uneia sau mai multor copii complete (clone) de materiale digitale. Replicarea necesită evenimente speciale pentru a sprijini toate copiile într-o dată actualizate.

Fișierele text sunt cele mai frecvente tipuri de date din lumea calculatoarelor. Există mai multe probleme asociate cu fișierele text. Primul este un număr extrem de mare de caractere necesare pentru a sprijini diferite limbi. Programatorii americani pentru lucrul cu 128 de caractere utilizează un set de simboluri ASCII din SUA (cod standard american pentru schimbul de informații). Pentru a sprijini alte limbi, adesea nu este suficient și 256 de caractere, prin urmare, o tranziție treptată la codificarea Unicode este acum efectuată, în care au fost deja date doi octeți de stocare a unui caracter (adică este posibil să codifice 65.536 de caractere diferite ).

A doua problemă este că oamenii doresc ca documentele tipărite să conțină grafice, diagrame, note, titluri și pentru a fi utilizate diferite fonturi. Documentele distribuite pe Internet ( pe net Documentele) pot conține animație, legături către diverse resurse de rețea Și suport de sunet.

Multe fișiere text sunt transmise ca un text simplu (text simplu). Textul simplu este dificil de a face atractiv și ușor de citit, deoarece nu există fonturi de diferite modele, grafice, anteturi, subtitrări etc. caracteristici suplimentare Purtați un nume marcarea textului (Marcaj).

Vorbind despre marcajul text, alocați concepte fizic și logic Marcare. Când utilizați aspectul fizic al textului, este indicată vizualizarea exactă a fiecărui fragment. De exemplu, "Text centrat, 14 Keglem, Fat, Setul cu cască de ori". Dacă marcajul logic indică valoarea logică a acestui fragment, de exemplu, "este titlul capitolului". Aceste două metode de marcare sunt destinate, de regulă, pentru utilizare în situații diferite. Pentru a imprima textul pe imprimantă, trebuie să utilizați marcajul fizic. Deciziile ar trebui luate cu privire la dimensiunea câmpurilor și numerele paragrafului. Versiunile timpurii ale procesatorilor de text au folosit doar tipul fizic de marcare. În același timp, fontul, dimensiunea și stilul au fost indicate pentru fiecare fragment.

La schimbul de informații cu alte persoane, proiectarea fizică a textului impune o serie de restricții, în special pentru documentele online. Dimensiunea ecranului, rezoluția, fonturile sunt diferite pentru diferite sisteme. Din aceste motive, designul logic al textului este din ce în ce mai mult. În unele cazuri, designul logic este practic necesar: atunci când creați documente electronice, cum ar fi paginile www sau atunci când creați și publicați o muncă în vrac, cum ar fi cărțile.

Pentru a păstra marcajul documentelor atunci când transferați informații text de la aparat la mașină diferite metode. Procesoarele de text și sistemele de publicare utilizează formate de fișiere special concepute care conțin nu numai text, ci și informații despre modul în care trebuie decorate. Principala problemă este incompatibilă cu astfel de formate, deși cele mai complexe programe pot citi de obicei fișierele din formatele concurenților. Exemplele acestei abordări sunt procesoare de text și text StarWriter.

Cu o abordare diferită, comenzile speciale de marcare sunt introduse direct în document. Chiar dacă nu aveți software care acceptă un astfel de format, îl înțelegeți în continuare în ea. Există multe modalități de a prezenta o astfel de prezentare a aspectului textului, printre care:

  • Limba de marcaj hipertext (HTML) utilizată în World Wide Web;
  • Tex și Latex sunt populare pentru multe publicații academice, precum și pentru matematicieni, fizicieni, chimiști și chiar muzicieni.

Exemple de programe care vă permit să plasați textul într-un mod similar, serviți compozitorul Netscape și Lyx (Klyx).

Fișierele create de editori diferiți au adesea extensii unice care permit, fără a privi în document, ghiciți metodele de stabilire a textului. Deci, fișierele create de editoarele pregătirii textului simplu au adesea extensie. TXT și preparați în editorul Lyx - .lyx. Procesorul de text cu cuvânt implicit creează fișiere în format MS Word (extensie.doc), dar acceptă și alte formate, cum ar fi RTF (extensie.rtf). Documente care conțin comenzi de marcare limba HTML.au extensie.html or.htm.

Evident, este imposibil să enumerați toți editorii de text. Mulți dintre ei sunt "ascuțiți" sub una sau altă activitate specifică. Lista discutată mai jos arată doar o mică parte a editorilor de text.

Editori de texte neformatate

Notepad. Construit în B. sistem de operare Ferestre, înțelegere și utilizare și utilizare; Mcedit. Are asemănări cu editarea editului din MS DOS, Componenta manager de fișiere mc. (Comandantul miezului nopții) Linux OS; Kedit. Simplificat editor de text, o parte din KDE Linux; Kwrite. un editor de text setari aditionale Comparativ cu alți editori de text simplu; Emacs. combină funcțiile unui manager de fișiere și a unui editor de text; Unul dintre trăsături distinctive este capacitatea de a crea macrocomenzi (macrocomenzi); Există în toate clone Unix, inclusiv Linux; Emacs poate fi utilizat în MS Windows.

Editorii care creează text cu elemente de marcare

Cuvânt. Acesta servește la crearea unei varietăți de documente tipărite, este o componentă. aplicații de birou în ferestrele MS; Starwriter. Face parte din programul StarOffice, aspectul și funcționalitatea, este similar cu Word, funcționează la fel de bine atât în \u200b\u200bMS Ferestre, cât și în sistemul de operare Linux; Lyx. (Klyx în KDE) Un editor de text modern, destinat persoanelor care doresc să obțină un document care să privească profesional, ci să-și petreacă la crearea unui timp de minim; Editorul introduce textul echipei de marcare Tex și Latex; Compozitorul Netscape. Introduce textul marcajului de limbă HTML, există versiuni pentru ambele OS Linux și MS Ferestre.

Adică formate pentru stocarea fișierelor text. Acum, principalul mijloc, aproape un monopolist în pregătirea standardului documente text El este programul MicrosoftWord, deci mai departe se va acorda accentul pe formatele destinate acestui program.

dar)Doc.. Formate de extensie . doc.Aceasta este modul obișnuit de a prezenta textul VmicrosoftWord. Textul cu extensia.doc conține datele despre unde și care este defalcarea pe șiruri și paragrafe, metodele de aliniere a textului, clopotul dintre rânduri și paragrafe, vederea și desenarea fonturilor și așa mai departe. Toate acestea se numesc formatarea textului. Formatarea textului și a fișierului este concepte complet diferite, deși sunt exprimate în cuvinte apropiate.

Nu intotdeauna versiune veche MicrosoftWord poate citi ceea ce este creat într-o versiune mai modernă. Sau când se deplasează la o versiune mai veche sau un alt program se pierde ceva din formatarea documentului. Dar versiunile mai noi pot fi întotdeauna pe deplin citite ce este creat în versiunile anterioare.

FormatDoc. Vă permite să creați formatarea textului de cea mai bună calitate, dar textul creat nu este întotdeauna redat pe alt computer.

b)RTF.. Extinderea dreaptatEXT.format., Ce înseamnă formatul corect de text. Formatele familiei sunt compatibilitate foarte largi, înțeleg toți procesoarele de text, cele vechi și noi. Dar nu toți editorii de text, deoarece editorii sunt mijloace mai primitive de a lucra cu textul. Multe programe non-intestine (de exemplu, grafică) lucrează semnificativ mai bine cu CRTF decât CDOC. Compatibilitatea este implementată deoarece triformatting este convertit în instrucțiuni de software care vă permit să deschideți și să vizualizați un document în diferite mijloace.

Dacă aveți nevoie să rescrieți textul la un alt computer utilizând o dischetă, în timp ce nu se știe ce merită un program de lucru cu text, atunci acesta este salvat să îl salvați în formatul RTF. Fișierul Format este un volum ușor mai mare, Thandoc, dar apare o garanție că un alt computer va înțelege acest text.

FormatRTF. Vă permite să redați textul creat pe orice versiune.Microsoft.Cuvânt. și în multe programe non-intestine.

în)TXT.. Acesta este un format de text primitiv care nu conține formatare complexă. Din formatare, doar diviziunea pe paragrafe este păstrată aici, iar fiecare linie se transformă într-un paragraf. Formatxt, aplicat de programatori pentru scrierea unui cod de program, deoarece Calculatorul nu are nevoie de "frumos" pe conceptele umane de design text. Este încă un format care să utilizeze textul atunci când textul trebuie să înțeleagă utilizatorii cu software diferit atunci când programul final nu recunoaște alte formate de fișiere.

În Windows, un instrument software pentru lucrul cu texte în format.txt- Notepad. (Caiet), Este convenabil să o navigați diverse programe și documentele electronice care nu sunt destinate tipăririi.

Mesaje e-mail De asemenea, nu au dezvoltat formatarea. Prin urmare, dacă trimiteți un document sub forma unui mesaj poștal, atunci își va pierde aspectul. Dacă doriți să transferați prin poștă nu numai conținutul, ci și apariția textului, acesta trebuie trimis ca un fișier DOC atașat la mesajul poștal.

Sunt multi alte formate de text. Acum 10 sau mai mulți ani, mai multe alte programe de text, cum ar fi programul intern "lexicon", sunt, de asemenea, populare. Pentru programele strămutate BymicrosoftWord, propriile formate de text originale, care pot fi necesare prin citirea textelor acelei momente.

În cele din urmă, textul poate fi stocat și la un grad sau altul pentru a edita zeci de alte formate destinate să nu creeze documente text, ci în alte scopuri. Ca exemple, puteți aduce formatul . hTML.la crearea site-urilor, . xLX.pentru editorul de tabel Excent, PopularPostScriptFormat . pDF.Și multe altele.