Formats de documents électroniques utilisés dans la gestion de la documentation

Dans le monde moderne, l'information est une ressource précieuse comparable à l'exception du temps. L'information effectue de nombreuses tâches dans la vie de la société, fournissant une interaction de communication de toutes ses composantes, la fixation, tout en maintenant et émettant des connaissances reçues et accumulées. Néanmoins, le rôle clé joue des informations dans la gestion.

Les informations de gestion sont enregistrées dans des documents. Le document, en tant que transporteur d'informations, est une ressource d'information, qui est confiée à des spécialistes de la gestion de documents conçus pour organiser un processus technologique de documentation et travailler avec des documents, notamment en utilisant les technologies de l'information modernes.

À l'étape actuelle, personne ne doute que la nécessité d'introduire de nouvelles technologies de l'information dans des processus de gestion et principalement dans la gestion de la gestion de la documentation (DOU), comme dans l'une des composantes les plus importantes de ces processus. Parlant de l'introduction de nouvelles technologies d'information et de communication (TIC) au Dou Sphere, en règle générale, il est entendu que la conception et la mise en œuvre d'un système automatisé de gestion de la documentation (AC DOU) avec une pluralité de modules embarqués et attachés est implicite.

Mais ce qui est derrière ces technologies de l'information, y compris des systèmes de type Dou? Peu de spécialistes du document comprennent cela en totalité. Dans le même temps, il est tout à fait évident que sans une connaissance fondamentale fondamentale dans le domaine des technologies de l'information (IT) ne peut faire aucun document.

Dans la dernière norme nationale, la réglementation des processus de gestion de GOST R ISO 15489-1-2007, la responsabilité de la "documentation de gestion" est clairement précis, c'est-à-dire des spécialistes dans le domaine de la gestion de la documentation, de la conception, de la mise en œuvre et de la Utilisation du système Dow automatisé . Cela suggère que les documents ne peuvent plus être un observateur tiers lors de la conception et de la mise en œuvre de AC DOU et uniquement de ses utilisateurs. Ils doivent déjà au stade initial de sa conception, prendre une part active dans le processus et établir les exigences de base pour la composante fonctionnelle de ce système.

Conformément aux exigences de qualifications, la documentation participe à la formulation de tâches, de conception, d'exploitation et d'amélioration (en partie support d'information) Systèmes d'information et systèmes de contrôle automatisés. Il participe également au développement des dernières technologies de l'information, de conception et de mise à jour des bases de données et des banques de données. Il étudie et résume une expérience domestique et étrangère avancée dans la zone Dow.

Étude des technologies de l'information informatique dans activités de gestion Il devient une tâche importante de formation contemporaine dans la spécialité "Documentation et gestion de la documentation" . Un spécialiste moderne devrait être bien axé sur la variété de logiciels et d'imaginer le niveau de variabilité des solutions logicielles et technologiques pour mettre en œuvre les tâches de Dou.

De là, nous pouvons conclure qu'il est nécessaire d'élargir les horizons des documents dans le domaine de l'application des technologies de l'information dans le Dou et leurs caractéristiques.

Le problème le plus important résultant de l'introduction de celui-ci dans les activités de tout, en particulier de l'État, est le problème de la préservation documents électroniques et l'accès à celui-ci après une période considérable. Un autre problème surviennent lors de l'échange de documents électroniques en gestion, en particulier au niveau interministériel. À l'étape actuelle, ces problèmes, en partie, aideront à résoudre des formats ouverts de documents électroniques.

Le pays est activement discuté et la question de l'introduction de la gestion des documents électroniques au niveau gouvernemental (par exemple, le programme "Électronique Russie" , "Electronic Moscou" , concept de formation de gouvernement électronique , Introduction de la réglementation administrative électronique , Association des informations gouvernementales RE-SURSS ). La solution des problèmes livrés dans ces documents n'est pas possible sans prendre en compte les formats de documents électroniques (ED).

Documents importants demandant aux principales orientations du développement des technologies de l'information dans Fédération Russesont la doctrine de la sécurité de l'information et stratégie de développement société de l'information . Une attention particulière est accordée aux programmes et aux concepts, en raison du fait que c'est précisément en eux une méthodologie pour l'introduction de l'informatique moderne en Russie, y compris la possibilité de DOW. Parmi eux, on intéresse un intérêt particulier pour le programme cible fédéral "Russie électronique (2002-2010)" , Concept de formation dans la Fédération de Russie du gouvernement électronique jusqu'en 2010 , Concept d'utilisation des technologies de l'information dans les activités des organes du gouvernement fédéral jusqu'en 2010 et etc.

Le concept de développement du système national de normalisation c'est un système de vues sur les problèmes de développement du système national de normalisation dans la Fédération de Russie jusqu'en 2010 et contient des objectifs raisonnables, des objectifs et des orientations de développement.

Nous avons l'intention de résoudre ce problème pour consacrer un cycle d'articles dans lesquels les principaux formats de documents électroniques seront décrits, la formation et le développement de logiciel, Spécificité des formats ouverts de documents électroniques, la pratique de les appliquer en Russie et à l'étranger.

Le format du document électronique est, plus précisément, le format de fichier contenant des informations texte et / ou audiovisuelles sur le formulaire codé. Le "codé" ne doit pas être confondu avec le concept de "crypté". Le cryptage fait référence aux moyens de cacher des informations et le codage n'est que la conversion des informations d'une forme à une autre.

Si vous analysez des dictionnaires de technologie informatique modernes, le concept de «format» est diversifié et difficile. Pour un utilisateur, il suffit de savoir que le format du document électronique est une certaine logique ou algorithme définitive, à la suite de laquelle les informations de la machine-lisible sont converties en une personne compréhensible et inversement. Les formats peuvent avoir des types différents, de simples et limités à des défis à complexes et capables de transporter de nombreuses fonctions, y compris les possibilités de création de dispositions, de compression et de cryptage.

Dans le domaine de la technologie informatique, sous le terme "format" désigne la structure de l'installation d'information. Par exemple, le format de fichier s'appelle la méthode d'organisation des éléments d'information (bits, octets) dans le fichier et le format de document électronique détermine la méthode d'emplacement et de présentation de données dans le document électronique. .

Nous répertorions brièvement les formats de documents électroniques utilisés dans Dow .

Les formats de texte sont utilisés pour créer des textes de texte et sont le plus souvent créés à l'aide de processeurs de texte.
Par example:

Doc est un format de document électronique populaire, conçu pour afficher et modifier (modifier) \u200b\u200ble texte du document. Le format est extrêmement pratique si vous travaillez simultanément sur un document de plusieurs interprètes.
.Pdf est un format d'affichage identique sur tout système d'exploitation et dans n'importe quelle application. Populaire dans la préparation de documents, de matériel de présentation, de livrets publicitaires, etc. En raison du fait que le format est destiné à afficher le document et ne permet pas de modifier non autorisé (ou imperceptible), son utilisation dans le Dow est extrêmement pratique. Il convient de noter que toutes les normes de la normalisation de l'Organisation internationale (ISO) sont envoyées à Rostechregulation au format PDF.

RTF - Conçu pour afficher les documents et les modifier dans différentes versions de logiciels. Par exemple, Word des versions pour Windows. DANS Format DOE Il est activement utilisé en raison du fait qu'il vous permet de transformer des fichiers sans perdre la structure et une partie significative du document et de travailler avec eux dans un système d'exploitation, mais dans ses différentes versions temporaires.
Formats graphiques Stockez l'image (par exemple, photo, dessin) et sont divisés en deux types principaux: formats de vecteurqui stockent l'image comme un ensemble de formes géométriques (DXF, EPS, CGM) et formats de rasterCela stocka l'image comme un ensemble de pixels de points (BMP, TIFF, GIF). L'image enregistrée peut être ajoutée au texte du document et l'utiliser lors de la conception d'une présentation.

Les formats de base de données sont créés à l'aide de systèmes de gestion de la base de données (SGBD). Ils sont composés de champs et de tables contenant Éléments séparés informations. Le Pro-Gram vous permet d'établir des liens entre les éléments dispersés. Par exemple, la base de données des employés peut contenir des champs avec les noms des employés, des adresses et des informations sur le travail effectué.

Les fichiers dans le format de la feuille de calcul sont stockés dans les cellules du nombre et de la relation entre ces chiffres. Ainsi, une cellule peut contenir une formule qui résume les données des deux autres cellules. Comme les fichiers de base de données, les fichiers de feuille de calcul ont généralement le format du programme, qui sont créés. Ce format est pratique lors de la prise en compte du temps de travail, etc.

Les formats vidéo et audio contiennent des images en mouvement ( vidéo numérique, Animation) et les données sonores les plus créées et visualisées à l'aide des programmes appropriés et stockés en format à sournoi Les plus utilisés sont des formats QuickTime et MPEG. En plus de leur aide, vous pouvez vous connecter à des réunions, réunions, etc.

Laissez-nous ménager plus en détail sur les formats de balisage contenant des instructions incorporées pour afficher et comprendre le contenu du fichier.

Vous pouvez définir la langue de marquage électronique de documents sur SGML (langage de balisage généralisé normalisé). Initialement, il a été développé pour le partage de documents lisibles par ordinateur dans les grands projets gouvernementaux et aérospatiaux. Il a été largement utilisé dans la sphère imprimée et édition, mais sa complexité rendait difficile la répression pour une utilisation quotidienne.

SGML a été approuvé par l'Organisation internationale de normalisationIso. En tant que standard international ISO 8879: 1986 Traitement des informations - Systèmes de texte et de bureau - Langue de balisage généralisé (SGML) »et est utilisé dans des organismes d'État de nombreux pays du monde.

De la langue de la mise en page du document SGML, de nouvelles langues de balisage plus avancées ont eu lieuHTML et XML.

HTML (langage de balisage hypertexte - "Langue de marquagehypertexte. ") Ceci est une application SGML. Il est utilisé pour afficher presque toutes les informations sur le réseau. Conforme à la norme internationaleIso. 8879: 1986 et est standarddocuments de marquage de la langue dans Internet (www).

XML (langage de balisage extensible) - un sous-ensemble langue SGML. A reçu une popularité lors de la gestion des informations et de l'échanger comme langue de marquage linguistique relativement simple des documents. XML - format de texte conçu pour stocker des données structurées (au lieu d'existerfichiers de base de données ), échanger des informations entreprogrammes , ainsi que de créer sur sa base plus de langages de marquage spécialisés, parfois appelés dictionnaires.

Le format XML est adopté par les autorités de normalisation de la communauté Internet face au consortium mondial du Web (W3C), qui développe et met en œuvre des normes technologiques pourInternet Et organisations UDDI (description universelle, découverte et intégration), développant une norme de description universelle, une détection et une intégration, conçues pour définir, enregistrer et détecter les services Web offerts par les entreprises. Cette spécification établit les exigences relatives au registre des informations distribuées du service Web. .

Par destination, les formats de documents électroniques peuvent être divisés en:
- formats pour visualiser le document;
- formats pour la visualisation et la modification du document;
- formats pour changer le document.

Si possible, les formats de documents électroniques sont les suivants:
- inter-plate-forme portable;
- Interpogramno portable;
- Spécialisé.

En règle générale, la limite claire entre ces catégories ne se produit pas. Les formats qui sont portables entre différentes plates-formes peuvent être l'interprogramme. Les formats spécialisés sont utilisés dans des tâches étroites et sont utilisées, en règle générale, uniquement par des applications d'une entreprise et sont le plus souvent fermées.

Par disponibilité, les formats peuvent être ouverts et fermés. Les formats fermés sont toujours la propriété d'une organisation particulière qui les utilise afin de garantir la qualité de la qualité du produit et de protéger contre les concurrents de la technologie empruntante.

Open Format est une spécification de stockage de données numériques disponible publiquement, exemptes de restrictions sous licence lorsqu'elle est utilisée. En particulier, il devrait être possible d'inclure le support des formats ouverts comme danslibre (ouvert) et dans exclusif (propriétaire, non libres) prolongélicences caractéristique de chacun de ces types. L'objectif principal des formats ouverts est de garantir la possibilité d'avoir accès aux données pendant une longue période sans tenir compte des droits autorisés et spécifications techniques. Le format ouvert du document électronique protège le consommateur non seulement lorsque vous modifiez les versions du programme, mais permet également de lire des documents dans les conditions d'indisponibilité du programme, avec laquelle un document électronique a été créé.

Quel est le format XML remarquable? Langue linguistique de balise extensible Le langage de balisage extensible contient non seulement des données, mais également «transmet des informations décrivant ces données. Il est applicable à toute application informatique et vous permet de transmettre de grandes quantités d'informations sans la nécessité de transformer le temps de la structure de données » .

Actuellement, les fabricants de logiciels passaient rapidement à l'utilisation de XML dans leurs produits et mettent donc en œuvre l'idée de normalisation des formats de document basés sur XML, en substance. format ouvert Documents électroniques.

Suite dans le prochain numéro.

GOST R ISO 15489-1-2007. Gestion de documents. Exigences générales.

Les documents électroniques sont devenus les mêmes qu'une partie importante des archives en tant qu'imprimante sur la table du secrétaire. Les textes, les photos, les dessins, les bases de données, les fichiers audio et vidéo se rendent rapidement au «chiffre», provoquant une discussion sur les formats les mieux adaptés au stockage constant de documents électroniques. Heureusement, les archivistes russes ont quelqu'un à demander de l'aide.

Sur les documents électroniques sont de plus en plus et plus fort. Aux États-Unis, les archivattes dédiées à ce domaine de travail à une fête professionnelle à part entière - une journée électronique du document (Journée électronique des enregistrements), qui est célébrée le 10 octobre. Ce jour-là, des scientifiques et des pratiques sont collectés ensemble pour discuter d'actualités de préservation des documents électroniques.

La communauté scientifique russe ne reste pas non plus en plus de résoudre des problèmes pratiques, mais non dédiés aux jours rouges du calendrier. L'année dernière, les scientifiques de l'Université humanitaire de l'État russe (RGGU) ont mené une étude à grande échelle de divers formats de fichiers de documents électroniques avec description détaillée Nuances de chacun d'eux.

Conclusions, les principales tendances sont présentées dans le rapport scientifique du RGGU " Analyse comparative Formats de fichiers de documents électroniques de stockage permanent (à long terme) ».1 C'est l'un des premiers types d'œuvres de recherche similaires en Russie, permettant aux archives des autorités exécutives fédérales, de l'État et des organisations non gouvernementales, ainsi que Archives de l'État et des municipalités visant à aborder objectivement la question du choix des archives les plus optimales. Le format du stockage permanent (à long terme) des documents électroniques.

Quelques exigences pour stocker des documents électroniques

Déjà au stade de la conception, le système maritime est construit de manière à ce que toute la période de stockage pour assurer l'authenticité, la fiabilité et l'aptitude du document, quels que soient les changements dans le système2. Ces changements dans le nombre d'autres peuvent être causés par la conversion de formats, la migration3 entre l'équipement technique, les systèmes d'exploitation ou applications de programme. Dans ce cas, il convient de noter que lorsque la conversion des formats, des informations sur la conversion parfaite devraient être stockées dans le cadre des informations de contrôle4. Il est également important de savoir que, en plus du document électronique original, tout au long de la période de stockage, il est nécessaire de conserver le document de métadonnées (description du document) 5, qui contient toutes les métadonnées sur le document électronique. Si la période de stockage du document électronique dépasse la période prévue de l'existence de systèmes de stockage de données, il est nécessaire de documenter les plans de migration vers de nouveaux systèmes6.

La lisibilité est une description intégrée du document électronique. Il est assuré caractéristiques techniques Document et logiciels disponibles pour archiver les employés. Le format de fichier défini pour le stockage permanent (à long terme) doit être conforme aux capacités techniques des organismes gouvernementaux, des archives de l'État et des municipalités, des organisations non gouvernementales, etc., pour reproduire des informations dans une perspective à long terme7. De plus, il est recommandé de faire des documents électroniques sur le stockage accompagné d'outils logiciels qui leur permettent de se reproduire et du kit de documentation annexé8.

En ce qui concerne les formats de fichiers, l'affichage doit être pris en charge par des systèmes de gestion de documents électroniques, il n'existe aucune uniformité précise. Aujourd'hui, les actes juridiques réglementaires sont quelque peu différents dans leur vision de la liste finale. Par exemple, selon les recommandations sur la préparation des autorités fédérales de la liste des documents, la création, le stockage et l'utilisation desquelles devrait être effectuée sous forme de documents électroniques dans l'organisation des activités internes (approuvées par l'ordre de Rosarhiva datée du 29 avril 2011 N ° 32), la présence de documents électroniques dans l'EDS au format PDF, DOC, RTF, TXT, XML formats.

Conformément aux exigences de systèmes d'information Gestion des documents électroniques des organes exécutifs fédéraux, y compris la nécessité de traiter par le biais de données de systèmes de diffusion limitées (ustensiles. Ordre du ministère des Communications de la Fédération de Russie du 02.09.2011 N ° 221), les quatre formats suivants sont obligatoires: PDF, RTF, DOC, TIFF. D'autres documents de réglementation permettent la possibilité de la présence dans systèmes électroniques autorités d'État d'autres formats de dossiers de documents électroniques.

En septembre 2014, le Conseil d'experts du ministère du Commerce utilisera PDF / A comme format d'interaction interministérielle dans le stockage ED et à long terme des documents électroniques. En plus de PDF / A, il est proposé de transmettre un fichier XML avec les détails d'un document électronique. Il est connu que, conjointement avec la FSO, vous préparez un ordre correspondant avec les exigences relatives au flux de documents.

Recommandations pour la sélection du format de document électronique

Le choix du format de stockage optimal est déterminé par le type d'informations, caractéristiques. moyens techniques Stockage (données magnétiques, optiques, e-mails de l'état solide), fonctionnalités d'accès aux données et logiciels. En raison de la réduction des supports multimédias et de l'augmentation de leurs capacités, la disponibilité de logiciels et de lisibilité du format de fichier est longue par les principaux facteurs lors du choix d'une méthode de codage. Dans une analyse comparative des formats de documents électroniques (fichiers textuels, graphiques, audio et vidéo, bases de données, présentations), les critères suivants ont été pris en compte: les critères suivants ont été pris en compte:

  • développeur et propriété;
  • année du développement du format de fichier;
  • année de sa dernière modernisation;
  • fréquence des mises à jour logicielles;
  • disponibilité des versions;
  • code de programme ouvert ou fermé;
  • description et comparaison des algorithmes de compression mathématiques;
  • format de fichier de destination;
  • la présence et la disponibilité de convertisseurs;
  • stabilité avec plusieurs réplications 9.

Formats de texte

Le texte est le tableau principal stocké dans les archives de l'information. Il est traité comme des textes dans les langues de communication humaine (à l'exception de l'écriture hiéroglyphique, proche de la forme graphique) et des langages de programmation. Souvent fichiers texte Inclure des fragments d'informations graphiques. Contrairement aux illustrations, aux enregistrements audio et vidéo, les données texte sont nécessaires à une compression significative à l'aide de programmes d'archivage spéciaux.

Selon les recommandations de la RGU, l'archivage des fichiers est préférable de produire sous une forme non cryptée à l'aide de ZIP (* .zip) et d'informations textuelles est plus rapide à enregistrer dans formats suivants: XML (comprend XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011) (* .pdf). Avec certaines conditions peuvent être utilisées formats de texte: Texte brut (ISO 8859-1ncoding), PDF (* .pdf) (polices intégrées), format de texte riche (* .rtf), HTML, SGML (* .SGML), Open Office (* .sxw / * . ODT), OOXML (ISO / IEC DIS 29500) (* .docx), EPUB (non crypté) (* .ePub). La plus grande stabilité lors de la migration d'un seul format dans le logiciel sélectionné dans l'autre, les formats * .doc et * .xml se comportent. Le tableau 1 présente les résultats des variations de la quantité d'informations pendant la migration.

Tableau 1. Matrix change dans la quantité d'informations pendant la migration (combien de fois)

Formats de fichier source /
Formats de fichiers de migration
* .doc
Microsoft Word. 97-2003
* .odt.* .xml* .rtf.* .pdf.* .pdf (pdf / a)
* .doc
Microsoft Word 97-2003
la source<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 la source>8,4 >7,7 >10 >18,4
* .xml<2,2 <8,2 la source>1,04 >1,4 >2,6

Noter que paquet de bureau OpenOffice, qui a été distribué en raison d'une licence libre, présente un certain nombre de restrictions, par exemple, par rapport au Microsoft Word 2007. Donc, de créer un fichier au format XML dans OpenOffice 4 (écrivain), des paramètres techniques supplémentaires du système seront disponibles. être requis (la présence de l'environnement Java installé (JRE). Natif Le même format XML OpenOffice 4 * .stw n'a pas encore reçu de support et des descriptions significatives. Microsoft Word 2007 n'affiche pas les informations dans un tel format, l'ouvrant comme vide. document.

Formats graphiques

Informations graphiques S. haute résolutionEn particulier, les images polychromes et demi-teintes ne sont pratiquement pas nécessaires à la compression d'archives. En règle générale, des formats de raster sont utilisés pour le stockage, qui permettent de stocker des scènes réalistes avec une grande profondeur de couleur. Selon les résultats de l'analyse comparative, seuls trois formats se sont avérés les plus adaptés au stockage à long terme. images raster: TIFF (non compressé), JPEG2000 (sans perte) (* .JP2), PNG (* .png).

Pour des images vectorielles, le format recommandé est SVG (pas de liaison de script Java) (* .svg). Des dessins, des schémas structurels, des algorithmes de représentation graphique constitués de primitives graphiques (segments et lignes brisées, polygones, cercles et ellipses) sont les plus efficacement implémentés dans de tels formats vectoriels comme SWG, WMF, CGM et similaires. Cependant, il est impossible d'oublier que les formats de vecteur conduisent généralement à déformer la palette de couleurs d'une image complexe.

Pour encoder des images 3D (formats de données virtuels) est acceptable d'utiliser le format X3D (* .x3d).

Formats audio et vidéo

Comme les informations graphiques, audio et vidéo sont presque incapables d'archiver efficacement: en moyenne, leur compression ne dépasse pas 5%. La sélection de divers types d'encodage de ces données affecte de manière significative le volume du fichier stocké, par conséquent de la qualité de lecture requise et, par conséquent, la préférence de ce format ou de ce format dépend du volume requis du stockage d'archives. Formats de stockage audio recommandés: AIFF (PCM) (* .AIF, * .AIFF), WAV (PCM) (* .wav), AES3 (LPCM) (* .A .AEES). Les meilleurs résultats sur les résultats de la comparaison de la sécurité des données vidéo ont montré des formats: Motion JPEG 2000 (ISO / CEI 15444-4) (*. MJ2), AVI (non compressé, MOTION JPEG) (* .avi), film QuickTime ( MOTION JPEG non compressé (* .MOV).

Bases de données et banques de données

Le choix du format de stockage de base de données dépend principalement de sa structure. Si la base est un fichier, il est conseillé de le stocker dans le codage correspondant à ce type de fichier. Lors de la conservation de la base dont les enregistrements sont composés de champs de structures différentes, les codages RTF et PDF sont le plus souvent utilisés, mais dans le cas échéant, s'il n'y a pas de phrases audio et vidéo dans la base de données. Les formats les plus polyvalents pour les bases de données de stockage à long terme sont des valeurs séparées par des virgules (* .CSV), du texte délimité (* .txt), SQL DDL. Dans de rares cas, des formats peuvent être utilisés: DBF (* .DBF), OpenOffice (* .sxc / *. ODS), OOXML (ISO / IEC 29500) (*. XLSX).

Présentations

Ni aucun formats existants Il ne fournit pas de degré de fiabilité élevée de la préservation de la présentation. Avec certaines réservations, vous pouvez recommander des formats OpenOffice (* .sxi / *. ODP) et OOXML (ISO / IEC DIS 29500) (* .pptx). Format PowerPoint (* .ppt) et d'autres formats de fichiers de présentation ne répondent pas aux exigences du stockage à long terme.

Informations hybrides

Pour stocker des documents complets, dont la structure comprend des fragments de nature variable (texte, photographie, dessin, etc.), formats de texte modernes tels que MS Word, RTF conviennent le mieux. Ils permettent d'inclure images graphiques Dans des codages raster. S'il y a de nombreuses illustrations, ce document est recommandé d'être stocké comme une image unique - dans ce cas, des formats graphiques sont préférés.

Remarques:

  1. Des travaux de recherche ont été réalisés dans le cadre du contrat d'État n ° 016-3 daté du 31 mai 2013 «Étude des processus modernes de gestion de documents et de gestion des documents électroniques. "Rapport scientifique" Analyse comparative des formats de fichiers de documents électroniques de stockage permanent (à long terme) "(dans le cadre de la mise en œuvre des activités du programme cible fédéral" Culture de la Russie "(2012-2018).
  2. GOST R ISO 15489-1-2007 "Norme nationale de la Fédération de Russie. Système de normes sur l'information, la bibliothéconomie et la publication. Gestion de documents. Exigences générales "(approuvées par ordre de Rostechregulation datée du 12.03.2007 no 28-ST).
  3. La migration des documents électroniques est une action sur le déplacement des enregistrements d'un système à un autre système tout en maintenant leur authenticité, leur intégrité, leur fiabilité et leur facilité d'utilisation.
  4. La structure de description du document consiste en une description de sa structure physique ou technique et de sa structure logique, c'est-à-dire des relations entre les éléments de données constituant le document. Pour plus d'informations sur la création, la gestion et l'utilisation de métadonnées, voir GOST R ISO 23081-1-2008. Système de normes sur l'information, la bibliothéconomie et la publication. Processus de gestion de documents. Métadonnées pour les documents. Partie 1. Principes (approuvés par ordre de Rostechregulation daté du 13 novembre 2008 n ° 310-ST).
  5. GOST R 54471-2011 "Systèmes de gestion de documents électroniques. Gestion de la documentation. Informations stockées dans en format électronique. Recommandations pour assurer la fiabilité et la fiabilité. "
  6. Règles d'organisation du stockage, de l'acquisition, de la comptabilité et de l'utilisation des documents du Fonds d'archives de la Fédération de Russie et d'autres documents d'archives dans les archives de l'État et des municipalités, des musées et des bibliothèques, des organisations de l'Académie de Sciences de la Russie (approuvée par l'Ordre du ministère de Culture et communications de masse de la Fédération de Russie du 18 janvier 2007 N ° 19).
  7. Voir ibid. 4.4.3.
  8. La réplication est une méthode permettant d'économiser des informations numériques en créant une ou plusieurs copies complètes (clones) de matériaux numériques. La réplication nécessite des événements spéciaux pour soutenir tous les copies à jour.

Les fichiers texte sont le type de données le plus courant dans le monde de l'ordinateur. Il existe plusieurs problèmes associés à des fichiers texte. Le premier est un nombre extrêmement grand de caractères requis pour prendre en charge diverses langues. Les programmeurs américains pour travailler avec 128 caractères utilisent un ensemble de symboles ASCII US ASCII (code standard américain pour le partage d'informations). Pour soutenir d'autres langues, il ne suffit souvent pas de 256 caractères, par conséquent, une transition progressive vers un codage Unicode est maintenant effectuée, dans laquelle deux octets ont déjà été donnés à la conservation d'un caractère (c'est-à-dire qu'il est possible d'encoder 65 536 caractères différents ).

Le deuxième problème est que les personnes souhaitent que les documents imprimés contiennent des graphiques, des graphiques, des notes, des titres et pour être utilisés diverses polices. Documents distribués sur Internet ( en ligne Documents) peut contenir une animation, des liens vers divers ressources réseau Et soutien sonore.

De nombreux fichiers texte sont transmis comme un texte simple (texte brut). Le texte simple est difficile à rendre attrayant et facilement lisible, car il n'y a pas de polices de différentes conceptions, graphiques, en-têtes, sous-titres, etc. fonctionnalités supplémentaires Porter un nom texte de marquage (Markup).

En parlant de balisage de texte, allouer des concepts physique et logique Marquage. Lorsque vous utilisez la disposition physique du texte, la vue exacte de chaque fragment est indiquée. Par exemple, "Texte centralisé, 14 keglem, graisse, casque Times". Si le balisage logique indique la valeur logique de ce fragment, par exemple, "est le titre du chapitre". Ces deux méthodes de marquage sont destinées, en règle générale, à utiliser dans différentes situations. Pour imprimer du texte sur l'imprimante, vous devez utiliser le marquage physique. Les décisions devraient être faites sur la taille des champs et des numéros de paragraphe. Les premières versions des processeurs de texte utilisaient uniquement le type physique de balisage. Dans le même temps, la police, la taille et le style ont été pointés pour chaque fragment.

Lors de l'échange d'informations avec d'autres personnes, la conception physique du texte impose un certain nombre de restrictions, en particulier pour les documents en ligne. Taille de l'écran, résolution, les polices sont différentes pour différents systèmes. Pour ces raisons, la conception logique du texte est de plus en plus. Dans certains cas, la conception logique est pratiquement nécessaire: lors de la création de documents électroniques tels que les pages www ou lors de la création et de la publication de la main-d'œuvre en vrac, telle que des livres.

Pour préserver le marquage des documents lors du transfert d'informations de texte de la machine à la machine méthodes différentes. Les processeurs de texte et les systèmes de publication utilisent des formats de fichiers spécialement conçus contenant non seulement du texte, mais également des informations sur la manière dont elle doit être décorée. Le problème principal ici est incompatible avec de tels formats, bien que les programmes les plus complexes puissent généralement lire des fichiers dans les formats de concurrents. Des exemples de cette approche sont des processeurs de texte Word et Starwriter.

Avec une approche différente, des commandes de balisage spéciales sont insérées directement dans le document. Même si vous n'avez pas de logiciel qui prend en charge un tel format, vous le comprenez toujours. Il existe de nombreuses façons d'une telle présentation de la disposition du texte, notamment:

  • Hypertext Markup Language (HTML) utilisé dans World Wide Web;
  • TEX et LATEX sont populaires pour de nombreuses publications académiques, ainsi que dans les mathématiciens, les physiciens, les chimistes et même les musiciens.

Exemples de programmes qui vous permettent de placer du texte de la même manière, desservir Netscape Composer et LyX (KlyX).

Les fichiers créés par différents éditeurs ont souvent des extensions uniques qui permettent, sans examiner le document, devinez les méthodes de texte pose. Donc, les fichiers créés par les éditeurs de la préparation du texte brut ont souvent une extension. TXT et préparé dans l'éditeur LYX - .LYX. Le mot processeur de texte par défaut crée des fichiers au format MS Word (Extension.doc), mais prend également en charge d'autres formats, tels que RTF (extension.rtf). Documents contenant des commandes de balisage langue HTMLavoir une extension.html ou.htm.

De toute évidence, il est impossible d'énumérer tous les éditeurs de texte. Beaucoup d'entre eux sont «aiguisés» sous une ou une autre activité spécifique. La liste décrite ci-dessous ne montre qu'une petite partie des éditeurs de texte.

Éditeurs de textes non formatés

Notepad. Construit en B. système opérateur Windows, compréhension et utilisation et utilisation; Mecdit. Il a des similitudes avec Modifier Modifier de MS DOS, Composant gestionnaire de fichiers mC. (Commandant de minuit) OS Linux; Kedit. Qui aime éditeur de texte, une partie de KDE Linux; Kwrite. un éditeur de texte paramètres additionnels Par rapport aux autres éditeurs de texte simples; Emacs. Combine les fonctions d'un gestionnaire de fichiers et d'un éditeur de texte; un des caractéristiques distinctives est la capacité de créer des macros (macros); Il y a dans tous les clones UNIX, y compris Linux; Les EMACS peuvent être utilisés dans MS Windows.

Éditeurs créant du texte avec des éléments de marquage

Mot. Il sert à créer une variété de documents imprimés, est un composant. applications de bureau dans MS Windows; Atrier. Il fait partie du programme StarOffice, de l'apparence et de la fonctionnalité, il est similaire au mot, cela fonctionne également bien dans MS Windows et dans Linux OS; Lyx. (Klyx in kde) un éditeur de texte moderne, destiné aux personnes qui souhaitent obtenir un document d'apparence professionnelle, mais à passer en création d'un minimum de temps; L'éditeur insère le texte de l'équipe de marquage TEX et de latex; Netscape Compositeur. Insertion du texte de balisage de langue HTML, il existe des versions pour Linux OS et MS Windows.

C'est-à-dire des formats pour stocker des fichiers texte. Maintenant, le principal moyen, presque un monopoliste dans la préparation de la norme documents texte Il est le programme Microsoftword, de sorte que l'accent sera également accordé aux formats destinés à ce programme.

mais)Doc. Formats d'extension . docCeci est la façon habituelle de présenter le texte du VMicrosoftword. Le texte avec l'extension.doc contient les données sur l'endroit où et quelle est la ventilation sur les chaînes et les paragraphes, les méthodes d'alignement du texte, le bellant entre rangées et paragraphes, vue et dessin des polices et ainsi de suite. Tout cela s'appelle texte de formatage. Le formatage du texte et du format de fichier est des concepts complètement différents, bien qu'ils soient exprimés en mots proches.

Pas toujours ancienne version Microsoftword peut lire ce qui est créé sur une version plus moderne. Ou lors de la déplacement vers une version plus ancienne, ou un autre programme est perdu quelque chose à partir du formatage du document. Mais les versions plus récentes peuvent toujours être entièrement lues ce qui est créé dans les versions antérieures.

FormatDoc Vous permet de créer la mise en forme du texte de la plus haute qualité, mais le texte créé n'est pas toujours joué sur un autre ordinateur.

b)Rtf.. Extension .rtfracted comme droitetEXTE.format., Quels moyens format de texte approprié. Les formats de famille sont une très large compatibilité, ils comprennent tous les processeurs de texte, anciens et nouveaux. Mais pas tous les éditeurs de texte, car les éditeurs sont des moyens plus primitifs de travailler avec le texte. De nombreux programmes non intestines (par exemple, graphique) fonctionnent de manière significative mieux fonctionnent avec CRTF que CDOC. La compatibilité est implémentée car le traitement de la tomiforme est converti en instructions logicielles vous permettant d'ouvrir et d'afficher un document dans divers moyens.

Si vous avez besoin de réécrire le texte à un autre ordinateur à l'aide d'une disquette, alors qu'il n'est pas connu, un programme de travail avec texte en vaut la peine, il est enregistré pour l'enregistrer dans le format RTF. Le fichier de format est un volume légèrement plus grand, Thandoc, mais une garantie apparaît qu'un autre ordinateur comprendra ce texte.

FormatRtf. Vous permet de lire le texte créé sur n'importe quelle version.Microsoft.Mot. et dans de nombreux programmes de non-intestin.

dans)SMS.. Il s'agit d'un format de texte primitif qui ne contient pas de formatage complexe. Du formatage, seule la division sur les paragraphes est préservée ici et chaque ligne se transforme en paragraphe. Formatxt, appliqué par programmeurs pour écrire un code de programme, car L'ordinateur n'a pas besoin de "belle" sur des concepts humains de conception de texte. Il s'agit toujours d'une formatTEXT pour utiliser le texte lorsque le texte doit comprendre les utilisateurs avec différents logiciels lorsque le programme final ne reconnaît pas d'autres formats de fichiers.

Sous Windows, un outil logiciel pour travailler avec des textes dans le format.txt- Notepad. (Carnet), Il est commode de le parcourir divers programmes et des documents électroniques non destinés à l'impression.

messages e-mail En outre, n'avez pas développé de formatage. Par conséquent, si vous envoyez un document sous la forme d'un message postal, cela perdra son apparence. Si vous souhaitez transférer par courrier non seulement du contenu, mais également l'apparence du texte, il doit être envoyé sous forme de fichier DOC connecté au message postal.

Il y a beaucoup de autres formats de texte. Il y a 10 ans ou plus, plusieurs autres programmes de texte, tels que le programme national "Lexicon", sont également populaires. Pour les programmes déplacés par MicRosoftword, leurs propres formats de texte originaux, qui peuvent être nécessaires en lisant les textes de cette époque.

Enfin, le texte peut être stocké et d'un degré ou d'un autre pour éditer des dizaines d'autres formats destinés à ne pas créer de documents texte, mais à d'autres fins. Comme des exemples, vous pouvez apporter le format . hTML.aux sites Creewebeb, . xlx.pour l'éditeur de table Excel, populairePostscriptFormat . pdf.et plein d'autres.