تنسيقات المستندات الإلكترونية المستخدمة في إدارة الوثائق

في العالم الحديث، فإن المعلومات هي مورد قيمة قابلة للمقارنة إلا مع الوقت. تنفذ المعلومات العديد من المهام في حياة المجتمع، وتوفير تفاعل الاتصالات لجميع مكوناتها، وإصلاحها، مع الحفاظ على المعرفة المستلمة والتراكم. ومع ذلك، فإن الدور الرئيسي يلعب المعلومات في الإدارة.

يتم تسجيل معلومات الإدارة في المستندات. الوثيقة، كشركة حاملة للمعلومات، هي مورد معلومات، مكلفة إلى أخصائيي المستندات، المصممة لتنظيم عملية التكنولوجيا التكنولوجية والعمل مع الوثائق، بما في ذلك استخدام الحديثة تكنولوجيات المعلومات.

في المرحلة الحالية، لا شك أن الحاجة إلى إدخال تقنيات معلومات جديدة في عمليات الإدارة وخاصة في نطاق إدارة الوثائق (DOU)، كما في واحدة من أهم مكونات هذه العمليات. تحدث عن إدخال تكنولوجيات المعلومات والاتصالات الجديدة (تكنولوجيا المعلومات والاتصالات) إلى كرة القدم، كقاعدة عامة، من المفهوم أن تصميم وتنفيذ نظام آلي لإدارة الوثائق (AC DOU) مع عدد من الوحدات النمطية والمتوافقة ضمني.

ولكن ما وراء تقنيات المعلومات هذه، بما في ذلك أنظمة مثل DU؟ عدد قليل من متخصصي المستندات فهم هذا بالكامل. في الوقت نفسه، من الواضح تماما أنه بدون معرفة أساسية أو أساسية في مجال تكنولوجيا المعلومات (IT) لا يمكن أن تفعل أي وثائق.

في أحدث المعايير الوطنية، ينظم عمليات الإدارة في GOST R ISO 15489-1-2007، وهي مسؤولية "الوثائق الإدارية" مكتوبة بوضوح، أي المتخصصين في مجال إدارة الوثائق، للتصميم والتنفيذ و استخدام نظام Dow الآلي وبعد هذا يشير إلى أن المستندات لم تعد لم تعد مراقبا من طرف ثالث عند تصميم وتنفيذ AC Dous وفقط مستخدميها فقط. يجب عليهم بالفعل في المرحلة الأولية من تصميمها، خذ جزءا نشطا في العملية وإنشاء المتطلبات الأساسية للمكون الوظيفي لهذا النظام.

وفقا لمتطلبات المؤهلات، تشارك الوثائق في صياغة المهام والتصميم والتشغيل والتحسين (جزئيا دعم المعلومات) نظم المعلومات الآلية وأنظمة التحكم. كما تشارك في تطوير أحدث تقنيات المعلومات وتصميم وتحديث قواعد البيانات وبنوك البيانات. يدرس ويلخص الخبرة المحلية والأجنبية المتقدمة في منطقة داو.

دراسة تكنولوجيات معلومات الكمبيوتر في نشاطات الادارة يصبح مهمة مهمة للتدريب المعاصر في تخصص "إدارة الوثائق والتوثيق" وبعد يجب أن يكون متخصص حديث يركز جيدا على مجموعة متنوعة من البرامج وتخيل مستوى التباين في البرامج والحلول التكنولوجية لتنفيذ مهام Dous.

من هنا يمكننا أن نستنتج أنه من الضروري توسيع آفاق الوثائق في مجال تطبيق تكنولوجيات المعلومات في Dous وميزاتها.

المشكلة الأكثر أهمية الناشئة عن مقدمة تكنولوجيا المعلومات في أنشطة أي، لا سيما الدولة، هي مشكلة الحفظ المستندات الإلكترونية والوصول إليها بعد فترة زمنية كبيرة. تنشأ مشاكل أخرى عند تبادل المستندات الإلكترونية في الإدارة، خاصة على المستوى المشترك بين الإدار. في المرحلة الحالية، ستساعد هذه المشكلات جزئيا في حل تنسيقات مفتوحة للوثائق الإلكترونية.

تناقش البلاد بنشاط وقضية إدخال إدارة الوثائق الإلكترونية على المستوى الحكومي (على سبيل المثال، برنامج "روسيا الإلكترونية" ، "موسكو الإلكترونية" ، مفهوم تشكيل الحكومة الإلكترونية ، مقدمة من اللوائح الإدارية الإلكترونية جمعية المعلومات الحكومية إعادة المشاركات ). لا يمكن حل حل المشكلات المقدمة في هذه المستندات دون مراعاة تنسيقات المستندات الإلكترونية (ED).

وثائق مهمة تسأل الاتجاهات الرئيسية لتطوير تكنولوجيات المعلومات في الاتحاد الروسيهي عقيدة أمن المعلومات واستراتيجية التنمية مجتمع المعلومات وبعد يتم إيلاء اهتمام خاص للبرامج والمفاهيم، بسبب حقيقة أنه بدقة منهجية مقدمة لإدخالها الحديثة في روسيا، بما في ذلك نطاق داو. من بينها مصلحة خاصة للبرنامج المستهدف الفيدرالي "روسيا الإلكترونية (2002-2010)" ومفهوم التكوين في الاتحاد الروسي للحكومة الإلكترونية حتى عام 2010 مفهوم استخدام تكنولوجيات المعلومات في أنشطة الهيئات الحكومية الاتحادية حتى عام 2010 وإلخ.

مفهوم تطوير نظام التقييس الوطني إنه نظام وجهات النظر حول مشاكل تطوير نظام التقييس الوطني في الاتحاد الروسي حتى عام 2010 ويحتوي على أهداف ومعقولة وأهداف واتجاهات التنمية.

نعتزم معالجة هذه المسألة لتكريس دورة من المقالات التي سيتم فيها وصف التنسيقات الرئيسية للوثائق الإلكترونية وتشكيل وتطوير مجاني البرمجيات، خصوصية التنسيقات المفتوحة للوثائق الإلكترونية، وممارسة تطبيقها في روسيا والخارج.

شكل المستند الإلكتروني هو تنسيق الملفات بشكل أكثر دقة يحتوي على معلومات و / أو معلومات سمعية سمعية في النموذج المشفر. لا ينبغي الخلط بين "المشفرة" في حيرة مع مفهوم "مشفرة". يشير التشفير إلى وسائل إخفاء المعلومات، والترميز هو فقط تحويل المعلومات من نموذج إلى آخر.

إذا قمت بتحليل القواميس الحديثة تكنولوجيا الكمبيوتر، مفهوم "الشكل" متنوع وصعب. بالنسبة للمستخدم، يكفي معرفة أن تنسيق المستند الإلكتروني هو منطق معين معين أو خوارزمية محددة، فيما يلي المعلومات من القراءة من الجهاز يتم تحويلها إلى شخص مفهوم والعكس صحيح. قد يكون لها تنسيقات مختلفة، من بسيطة ومقتصرة على التحديات المعقدة والقادرة على حمل العديد من الوظائف، بما في ذلك إمكانيات إنشاء تخطيط، والضغط والتشفير.

في مجال تكنولوجيا الكمبيوتر، بموجب مصطلح "التنسيق" يعني هيكل مرفق المعلومات. على سبيل المثال، يسمى تنسيق الملف الأسلوب الخاص بتنظيم عناصر المعلومات (BITS، BYTES) في الملف، وتنسيق المستند الإلكتروني يحدد طريقة الموقع وعرض البيانات في المستند الإلكتروني .

نحن ندرج تنسيقات لفترة وجيزة من المستندات الإلكترونية المستخدمة في داو .

يتم استخدام تنسيقات النص لإنشاء نصوص نصية وغالبا ما تم إنشاؤها باستخدام معالجات النصوص.
على سبيل المثال:

Doc هو تنسيق مستند إلكتروني شائع، مصمم لعرض وتغيير (تحرير) نص المستند. التنسيق مناسب للغاية إذا كنت تعمل في وقت واحد على وثيقة من الأداء العديد من الأداء.
.pdf هو تنسيق عرض متطابق على أي نظام تشغيل وفي أي تطبيق. شعبية في إعداد الوثائق ومواد العرض والكتيبات الإعلانية وما إلى ذلك بسبب حقيقة أن التنسيق يهدف إلى عرض المستند ولا يسمح بإجراء تغييرات غير مصرح بها (أو غير محسوسة) على ذلك، واستخدامها في Dow مريح. تجدر الإشارة إلى أن جميع معايير المنظمة الدولية للتوحيد القياسي (ISO) يتم إرسالها إلى Rostechregulation بتنسيق PDF.

RTF - مصممة لعرض المستندات وتعديلها في إصدارات مختلفة من منتجات البرامج. على سبيل المثال، إصدارات Word ل Windows. في شعبي تنسيق يتم استخدامه بنشاط بسبب حقيقة أنه يسمح لك بتحويل الملفات دون فقدان الهيكل وجزء مغزى من المستند والعمل معهم في نظام تشغيل واحد، ولكن في إصداراتها المؤقتة المختلفة.
تنسيقات الجرافيك تخزين الصورة (على سبيل المثال، الصورة والرسم) وتنقسم إلى نوعين رئيسيين: تنسيقات ناقلاتالتي تخزن الصورة كمجموعة من الأشكال الهندسية (DXF، EPS، CGM)، و التنسيقات النقطيةالتي تخزن الصورة كمجموعة من نقاط البكسل DOT (BMP، TIFF، GIF). يمكن إضافة الصورة المحفوظة إلى نص المستند واستخدامها عند تصميم عرض تقديمي.

يتم إنشاء تنسيقات قاعدة البيانات باستخدام أنظمة إدارة قواعد البيانات (DBMS). أنها تتكون من الحقول والجداول التي تحتوي على عناصر منفصلة معلومة. يسمح لك Pro-Gram بإنشاء روابط بين العناصر المتناثرة. على سبيل المثال، قد تحتوي قاعدة بيانات الموظفين على حقول بأسماء الموظفين وعناوين ومعلومات حول العمل المنجز.

يتم تخزين الملفات بتنسيق جدول البيانات في خلايا الرقم والعلاقة بين هذه الأرقام. وبالتالي، قد تحتوي خلية واحدة على صيغة تلخص بيانات الخلايا الأخرى. مثل ملفات قاعدة البيانات، عادة ما تحتوي ملفات جدول البيانات على تنسيق البرنامج، والتي يتم بها إنشاء. هذا التنسيق مناسب عند مراعاة وقت العمل، إلخ.

تحتوي تنسيقات الفيديو والصوت على صور متحركة ( فيديو رقميةوالرسوم المتحركة) والبيانات الصوتية الأكثر تم إنشاؤها وإنصائها باستخدام البرامج المناسبة وتخزينها بتنسيق منفردا. الأكثر استخداما هي تنسيقات QuickTime و MPEG. بالإضافة إلى مساعدتهم، يمكنك تسجيل الدخول في الاجتماعات والاجتماعات وما إلى ذلك

دعنا نتناول مزيدا من التفاصيل على تنسيقات العلامات التي تحتوي على إرشادات مضمنة لعرض وفهم محتوى الملفات.

يمكنك تحديد لغة وضع العلامات الإلكترونية في SGML (لغة العلامات المعممة القياسية). في البداية، تم تطويره لتقاسم المستندات القابلة للقراءة بالكمبيوتر في مشاريع الحكومة الكبيرة والفضاء. تم استخدامه على نطاق واسع في مجال المطبوعات والنشر، لكن تعقيده جعل من الصعب أن يكون واسع النطاق للاستخدام اليومي.

تمت الموافقة على SGML من قبل المنظمة الدولية للتوحيد القياسيISO. كمعيار دولي ISO 8879: 1986 معالجة المعلومات - أنظمة النص والمكاتب - لغة التعميز المعممة القياسية (SGML) "وتستخدم في جثث الدولة في العديد من بلدان العالم.

من لغة تخطيط وثيقة SGML، حدثت لغات العلامات الجديدة والمزيد من المعلوماتHTML و XML.

أتش تي أم أل (لغة ترميز النص التشعبي - "لغة العلاماتالنص التشعبي. ") هذا هو تطبيق SGML. يتم استخدامه لعرض جميع المعلومات تقريبا على الشبكة. يتوافق مع المعايير الدوليةISO. 8879: 1986 وهو معياروثائق علامات اللغة في شبكة الانترنت (www).

XML (لغة ترميز القابلة للتوسيع) - مجموعة فرعية sGML اللغةوبعد تلقيت الشعبية عند إدارة المعلومات وتبادلها، ككلغة علامات لغة بسيطة نسبيا. تنسيق النص XML - مصمم لتخزين البيانات المهيكلة (بدلا من الموجودةملفات قاعدة البيانات )، لتبادل المعلومات بينبرامج ، وكذلك لخلق على أساسها أكثر لغات العلامات المتخصصة، تسمى أحيانا القواميس.

يتم اعتماد تنسيق XML من قبل سلطات توحيد مجتمع الإنترنت في مواجهة كونسورتيوم World Wide Web (W3C)، والذي يتطور وينفذ المعايير التكنولوجية لشبكة الانترنت و UDDI المنظمات (الوصف العالمي والاكتشاف والتكامل)، تطوير وصف عالمي معيار، والكشف والتكامل، مصممة لتحديد وتسجيل واكتشاف خدمات الويب التي تقدمها الشركات. تضع هذه المواصفات متطلبات سجل المعلومات الموزعة لخدمة الويب .

حسب الوجهة، يمكن تقسيم تنسيقات المستندات الإلكترونية إلى:
- تنسيقات لعرض المستند؛
- تنسيقات المشاهدة وتغيير المستند؛
- تنسيقات لتغيير المستند.

إن أمكن، تنسيقات المستندات الإلكترونية هي:
- المحمولة بين المنصة؛
- المحمولة interpogramno؛
- متخصص.

كقاعدة عامة، لا يحدث الحدود الواضحة بين هذه الفئات. قد تكون التنسيقات المحمولة بين المنصات المختلفة هو interpogramme. يتم استخدام تنسيقات متخصصة في المهام الضيقة وتستخدم، كقاعدة عامة، فقط من خلال تطبيقات شركة واحدة وغالبا ما تكون مغلقة.

بموجب التوافر، يمكن أن تكون التنسيقات مفتوحة ومغلقة. التنسيقات المغلقة هي دائما خاصية منظمة معينة تستخدمها من أجل ضمان جودة جودة المنتج والحماية من منافسي تقنية الاقتراض.

التنسيق المفتوح هو مواصفات تخزين البيانات الرقمية المتاحة للجمهور، خالية من القيود المرخصة عند استخدامها. على وجه الخصوص، يجب أن يكون من الممكن تضمين الدعم للتنسيقات المفتوحة كما هو الحال فيمجاني (مفتوح) وفي الملكية (الملكية غير المجانية) ممتدة من قبلالتراخيص سمة من كل من هذه الأنواع. الهدف الرئيسي من التنسيقات المفتوحة هو ضمان إمكانية الوصول إلى البيانات لفترة طويلة دون النظر إلى الحقوق المرخصة و المواصفات الفنيةوبعد يحمي التنسيق المفتوح المستند الإلكتروني للمستهلك ليس فقط عند تغيير إصدارات البرنامج، ولكنه يجعل من الممكن أيضا قراءة المستندات في شروط عدم توفر البرنامج، والتي تم إنشاء مستند إلكتروني.

ما هو تنسيق XML رائع؟ لغة لغة الترميز القابلة للتوسيع لا تحتوي لغة العلامات القابلة للتوسيع على البيانات فقط، ولكن أيضا "يحمل المعلومات التي تصف هذه البيانات. ينطبق على أي تطبيق كمبيوتر ويسمح لك بنقل كميات كبيرة من المعلومات دون الحاجة إلى التحول المستهل للوقت لهياكل البيانات " .

حاليا، تحول مصنعي البرمجيات على الفور إلى استخدام XML في منتجاتهم، وبالتالي، قم بتطبيق فكرة توحيد تنسيقات المستندات بناء على XML، في جوهرها تنسيق مفتوح الوثائق الإلكترونية.

استمرار في القضية التالية.

GOST R ISO 15489-1-2007. إدارة الوثائق. المتطلبات العامة.

أصبحت المستندات الإلكترونية هي نفسها جزءا مهما من المحفوظات كطابعة على جدول السكرتير. الانتقال النصوص والصور والرسومات وقواعد البيانات والملفات الصوتية والفيديو بسرعة إلى "الرقم"، مما تسبب في مناقشة حول التنسيقات الأكثر ملاءمة للتخزين المستمر للمستندات الإلكترونية. لحسن الحظ، لدى Archivists الروس شخص ما طلب المساعدة.

حول الوثائق الإلكترونية تقول بشكل متزايد وصوت. في الولايات المتحدة، Archivatsts مخصصة لهذه المجال من العمل عطلة محترفة كاملة - يوم وثيقة إلكترونية (يوم السجلات الإلكترونية)، والذي يحتفل به في 10 أكتوبر. في هذا اليوم، يتم جمع العلماء والممارسات معا لمناقشة القضايا الموضعية للحفاظ على الوثائق الإلكترونية.

لا يزال المجتمع العلمي الروسي أيضا على حل المشكلات العملية، وإن لم يكن مكرسا للأيام الحمراء للتقويم. في العام الماضي، أجرت العلماء من الجامعة الإنسانية الحكومية الروسية (RGU) دراسة واسعة النطاق صيغ مختلفة ملفات المستندات الإلكترونية وصف مفصل الفروق الدقيقة لكل منهم.

الاستنتاجات، يتم تقديم الاتجاهات الرئيسية في التقرير العلمي ل RGGU " تحليل مقارن تنسيقات الملفات من المستندات الإلكترونية من التخزين الدائم (طويل الأجل) ".1 هذا هو واحد من أول نوع مماثل يعمل في روسيا، مما يتيح لمحفوظات السلطات التنفيذية الفيدرالية، والمنظمات الحكومية والمنظمات غير الحكومية، وكذلك المحفوظات الحكومية والبلدية لنقل موضوعيا من مسألة اختيار أكثر المحفوظات الأمثل. شكل تخزين دائم (طويل الأجل) للوثائق الإلكترونية.

بعض المتطلبات لتخزين المستندات الإلكترونية

بالفعل في مرحلة التصميم، تم بناء نظام البحر بطريقة ما خلال فترة التخزين بأكملها لضمان صحة وثائق المستند وموثوقية المستند، بغض النظر عن التغييرات في النظام 2. قد تكون هذه التغييرات في عدد الآخرين ناتجة عن تحويل التنسيقات، والهجرة 3 بين المعدات التقنية وأنظمة التشغيل أو تطبيقات برمجيةوبعد في هذه الحالة، تجدر الإشارة إلى أنه عند تحويل التنسيقات، يجب تخزين معلومات حول التحويل المثالي كجزء من معلومات التحكم 4. من المهم أيضا معرفة ذلك، بالإضافة إلى المستند الإلكتروني الأصلي، طوال فترة التخزين، من الضروري إبقاء مستند البيانات الوصفية (الوصف المستند) 5، والذي يحتوي على جميع البيانات الوصفية حول المستند الإلكتروني. إذا تجاوزت فترة التخزين الخاصة بالوثيقة الإلكترونية الفترة المتوقعة من وجود أنظمة تخزين البيانات، فمن الضروري توثيق خطط الترحيل إلى أنظمة جديدة 6.

قابلية القراءة هي وصفا لا يتجزأ من المستند الإلكتروني. هو ضمان الخصائص التقنية المستند والبرامج المتاحة لأرشيف الموظفين. يجب أن يمتثل تنسيق الملف المحدد للتخزين الدائم (طويل الأجل) من القدرات التقنية للأجسام الحكومية ومحفوظات الدولة والبلدية والمنظمات غير الحكومية وغيرها لإعادة إنتاج المعلومات في منظور طويل الأجل 7. علاوة على ذلك، يوصى بإجراء المستندات الإلكترونية على تخزين مصحوبا لأدوات البرمجيات التي تسمح لهم بإعادة إنتاجها، والوثائق المصاحبة Kit8.

فيما يتعلق بتنسيقات الملفات، يجب دعم عرضها بواسطة أنظمة إدارة المستندات الإلكترونية، لا يوجد توحيد دقيق. اليوم، فإن الأفعال القانونية التنظيمية مختلفة إلى حد ما في رؤيتها للقائمة النهائية. على سبيل المثال، وفقا للتوصيات المتعلقة بإعداد السلطات الفيدرالية لقائمة الوثائق، ينبغي إجراء إنشاء وتخزين واستخدام منها في شكل وثائق إلكترونية في تنظيم الأنشطة الداخلية (المعتمدة من قبل ترتيب Rosarhiva مؤرخة 29 أبريل 2011 رقم 32)، وجود مستندات إلكترونية في إصدار EDS في PDF، DOC، RTF، TXT، XML.

وفقا لمتطلبات نظم المعلومات إدارة الوثائق الإلكترونية للسلطات التنفيذية الفيدرالية، مع الأخذ في الاعتبار بما في ذلك الحاجة إلى المعالجة من خلال نظم البيانات معلومات الخدمة التوزيع المحدود (المعتمد حسب ترتيب وزارة الاتصالات في الاتحاد الروسي 02.09.2011 رقم 221)، والتنسيقات الأربعة التالية إلزامية: PDF، RTF، DOC، TIFF، TIFF، TIFF. تسمح الوثائق التنظيمية الأخرى بإمكانية وجود الأنظمة الإلكترونية سلطات الدولة التنسيقات الأخرى لملفات الوثائق الإلكترونية.

في سبتمبر 2014، يستخدم مجلس الخبراء في وزارة التجارة قوات الدفاع الشعبي / أ نسق التفاعل بين الإصدارات في SED و تخزين طويل المدى الوثائق الإلكترونية. جنبا إلى جنب مع PDF / A، يقترح إرسال ملف XML مع تفاصيل وثيقة إلكترونية. ومن المعروف أنه مع FSO سيتم إعداد طلب مناسب مع متطلبات تدفق المستندات.

توصيات لاختيار تنسيق المستند الإلكتروني

يتم تحديد اختيار تنسيق التخزين الأمثل حسب نوع المعلومات والخصائص. الوسائل التقنية تخزين (بيانات رسائل البريد الإلكتروني المغناطيسية والبصرية والصلبة)، ميزات الوصول للمستخدم إلى البيانات والبرامج. نظرا للحد من شركات النقل في وسائل الإعلام وزيادة قدرتها، يتم التعرف على توفر البرامج والقراءة من تنسيق الملف في وقت طويل من قبل العوامل الرئيسية عند اختيار طريقة ترميز. في تحليل مقارن لتنسيقات المستندات الإلكترونية (الملفات النصية، الرسومية، الصوتية، الفيديو والفيديو، قواعد البيانات، العروض التقديمية)، أخذت المعايير التالية في الاعتبار: أخذت المعايير التالية في الاعتبار:

  • المطور والملكية؛
  • سنة تطوير تنسيق الملفات؛
  • سنة التحديث الأخير؛
  • تواتر تحديثات البرامج؛
  • توافر الإصدارات؛
  • فتح أو إغلاق رمز البرنامج؛
  • وصف ومقارنة خوارزميات الضغط الرياضي؛
  • تنسيق ملف الوجهة؛
  • وجود وتوافر المحولات؛
  • الاستقرار مع النسخ المتماثلة المتعددة 9.

تنسيقات النص

النص هو الصفيف الرئيسي المخزن في أرشيف المعلومات. يتم التعامل معها على أنها نصوص بلغات الاتصال البشرية (باستثناء الكتابة الهيروغليفية، بالقرب من النموذج الرسومي) ولغات البرمجة. غالبا الملفات النصية تشمل شظايا معلومات الرسوم البيانية. على عكس الرسوم التوضيحية والسجلات الصوتية والفيديو، تكون البيانات النصية قابلة للضغط الكبير باستخدام برامج الأرشفة الخاصة.

وفقا لتوصيات RGU، فإن أرشفة الملفات من الأفضل إنتاجها في نموذج غير مشفر باستخدام ZIP (* .zip)، والمعلومات النصية أكثر سرعة لتسجيل الدخول التنسيقات التالية: XML (يشمل XSD / XSL / XHTML)، PDF / A-1 (ISO 19005-1) (* .pdf)، PDF / A-2 (ISO 19005-2: 2011) (* .pdf). مع بعض الشروط يمكن استخدامها تنسيقات النص: نص عادي (ISO 8859-1CODING)، PDF (* .pdf) (خطوط مضمنة)، تنسيق النص الغني 1.x (* .rtf)، HTML، SGML (* .sgml)، Open Office (* .sxw / * . ODT)، OOXML (ISO / IEC DIS 29500) (* .docx)، EPUB (غير مشفرة) (* .EPUB). أكبر استقرار عند الترحيل من تنسيق واحد في البرامج المحددة في الآخر، فإن تنسيقات * .doc و * .xml تتصرف. يقدم الجدول 1 نتائج التغييرات في مقدار المعلومات أثناء الترحيل.

جدول 1. يتغير مصفوفة في كمية المعلومات أثناء الترحيل (عدد المرات)

تنسيقات الملفات المصدر /
تنسيقات ملفات الترحيل
* .doc.
مايكروسوفت وورد. 97-2003
* .odt.* .xml* .rtf.* .بي دي إف.* .pdf (PDF / A)
* .doc.
مايكروسوفت وورد 97-2003.
مصدر<3,3 >2,2 >2,7 >3,2 >3,7
* .odt.>3,4 مصدر>8,4 >7,7 >10 >18,4
* .xml<2,2 <8,2 مصدر>1,04 >1,4 >2,6

لاحظ أن حزمة مكتب OpenOffice، الذي تم توزيعه بسبب ترخيص مجاني، لديه عدد من القيود، على سبيل المثال، مقارنة مع Microsoft Word 2007. لذا، لإنشاء ملف بتنسيق XML في OpenOffice 4 (Writer)، سوف الإعدادات الفنية الإضافية للنظام أن تكون هناك حاجة (وجود بيئة Java المثبتة (JR). Native نفس XML OpenOffice 4 * .stw لم يتلق بعد دعما كبيرا وأوصافا. لا يعرض Microsoft Word 2007 معلومات بهذا الشكل، وفتحه كغادر فارغا وثيقة.

تنسيقات الجرافيك

معلومات الرسومات S. عالية الدقةلا سيما صور البولي كروم وصور النصف غير عمليا غير قابلة للضغط على ضغط الأرشيف. كقاعدة عامة، يتم استخدام تنسيقات النقطية للتخزين، والتي توفر تخزين مشاهد واقعية مع عمق لون كبير. وفقا لنتائج التحليل المقارن، تحولت ثلاث تنسيقات فقط إلى أن تكون أكثر ملاءمة للتخزين الطويل الأجل للصور النقطية: TIFF (غير مضغوط)، JPEG2000 (ضياع) (* .jp2)، PNG (* .png).

ل صور ناقلات التنسيق الموصى به هو SVG (* .svg). الرسومات، والمخططات الهيكلية، تمثل خوارزميات بيانيا تتألف من بدائريات جرافيك (شرائح وخطوط مكسورة، مضلعات، الدوائر والقطع المنفذة) بشكل فعال في تنسيقات ناقلات مثل SWG، WMF، CGM وما شابه ذلك. ومع ذلك، من المستحيل أن تنسى أن تنسيقات ناقلات تؤدي عادة إلى تشويه نظام الألوان لصورة معقدة.

بالنسبة لتشفير الصور ثلاثية الأبعاد (تنسيقات البيانات الافتراضية) مقبولة لاستخدام تنسيق X3D (* .x3d).

صيغ الصوت والفيديو

مثلي. معلومات الرسمومعلومات الصوت والفيديو غير قادرة تقريبا على الأرشفة بشكل فعال: في المتوسط، لا يتجاوز ضغطهم 5٪. يؤثر اختيار أنواع مختلفة من ترميز هذه البيانات بشكل كبير على حجم الملف المخزن، وبالتالي، من جودة التشغيل المطلوبة، ونتيجة لذلك، يعتمد تفضيل هذا أو التنسيق على الحجم المطلوب من تخزين الأرشيف. تنسيقات تخزين الصوت الموصى بها: AIFF (PCM) (* .AIF، * .AIFF)، WAV (PCM) (* .wav)، AES3 (LPCM) (* .aes). أفضل النتائج حول نتائج المقارنة لسلامة بيانات الفيديو أظهرت التنسيقات: Motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2)، AVI (غير مضغوطة، الحركة JPEG) (* .AVI)، فيلم QuickTime ( غير مضغوط، الحركة JPEG) (* .mov).

قواعد البيانات وبنوك البيانات

يعتمد اختيار تنسيق تخزين قاعدة البيانات بشكل أساسي على هيكله. إذا كان القاعدة ملف واحد، فمن المستحسن تخزينه في الترميز المقابل لهذا النوع من الملفات. عند تخزين القاعدة التي تتكون سجلاتها من حقول من الهياكل المختلفة، يتم استخدام ترميزات RTF و PDF في أغلب الأحيان، ولكن في الحالة النهائية، إذا لم تكن هناك عبارات صوتية وفيديو في قاعدة البيانات. التنسيقات الأكثر تنوعا لقواعد بيانات التخزين طويلة الأجل هي قيم مفصولة بفواصل (* .csv)، نص محدد (* .txt)، SQL DDL. في حالات نادرة، يمكن استخدام التنسيقات: DBF (* .dbf)، OpenOffice (* .sxc / *. ODS)، OOXML (ISO / IEC 29500) (*. XLSX).

العروض التقديمية

لا هذا ولا ذاك التنسيقات الحالية لا يوفر درجة عالية من موثوقية الحفاظ على العرض التقديمي. مع بعض التحفظات، يمكنك أن توصي بتنسيقات OpenOffice (* .sxi / *. ODP) أو OOXML (ISO / IEC CIS 29500) (* .pptx). تنسيق PowerPoint (* .ppt) وغيرها من تنسيقات ملفات العرض التقديمي لا تفي بمتطلبات التخزين على المدى الطويل.

معلومات هجينة

لتخزين المستندات الشاملة، يتضمن هيكل ما شظايا ذات طبيعة مختلفة (نص، تصوير، رسم، إلخ)، تنسيقات النص الحديثة مثل MS Word، RTF هي الأنسب. أنها تسمح بما يجب أن تشمل الصور الرسومية في الترميز النقطي. إذا كانت هناك العديد من الرسوم التوضيحية، فمن المستحسن تخزين هذه الوثيقة كصورة واحدة - في هذه الحالة، يتم تفضيل تنسيقات الرسومات.

ملاحظات:

  1. تم تنفيذ أعمال البحث في إطار عقد الدولة رقم 016-3 بتاريخ 31 مايو 2013 "دراسة العمليات الحديثة لإدارة الوثائق وإدارة الوثائق الإلكترونية. "تقرير علمي" تحليل مقارن لتنسيقات الملفات من الوثائق الإلكترونية للتخزين الدائم (كجزء من تنفيذ أنشطة البرنامج المستهدف الفيدرالي "ثقافة روسيا" (2012-2018).
  2. GOST R ISO 15489-1-2007 "المعيار الوطني للاتحاد الروسي. نظام المعايير المتعلقة بالمعلومات، المكتبية والنشر. إدارة الوثائق. المتطلبات العامة "(المعتمدة بأمر روستانية مؤرخة 12.03.2007 رقم 28-St).
  3. الهجرة من المستندات الإلكترونية هي إجراء في نقل السجلات من نظام واحد إلى نظام آخر مع الحفاظ على أصالة ونزاهتها وموثوقيتها وسهولة الاستخدام.
  4. يتكون هيكل وصف المستند من وصف لهيكلها البدني أو الفني والهيكل المنطقي، أي العلاقات بين عناصر البيانات التي تشكل المستند. لمزيد من المعلومات حول إنشاء وإدارة واستخدام البيانات الوصفية، راجع GOST R ISO 23081-1-2008. نظام المعايير المتعلقة بالمعلومات، المكتبية والنشر. عمليات إدارة المستندات. البيانات الوصفية للمستندات. الجزء 1. المبادئ (المعتمدة بأمر من روستتيقوند مؤرخ في 13 نوفمبر 2008 رقم 310-ST).
  5. GOST R 54471-2011 "نظم إدارة الوثائق الإلكترونية. إدارة الوثائق. المعلومات المخزنة في في شكل إلكترونيوبعد توصيات لضمان الموثوقية والموثوقية ".
  6. قواعد تنظيم تخزين واكتناء ومحاسبة وثائق صندوق الأرشيف والولايات المتحدة الوثائق الروسية وغيرها من وثائق الأرشيف الأخرى في المحفوظات الحكومية والبلدية والمتاحف والمكتبات، ومنظمات الأكاديمية الروسية للعلوم (المعتمدة من قبل أمر وزارة الثقافة والاتصالات الجماعية للاتحاد الروسي في 18 يناير 2007 رقم 19).
  7. انظر المرجع نفسه 4.4.3.
  8. النسخ المتماثل هو طريقة لتوفير المعلومات الرقمية عن طريق إنشاء نسخة كاملة أو أكثر (الحيوانات المستنسخة) من المواد الرقمية. يتطلب النسخ المتماثل أحداث خاصة لدعم جميع النسخ في ما يصل إلى تاريخ.

الملفات النصية هي نوع البيانات الأكثر شيوعا في عالم الكمبيوتر. هناك العديد من المشاكل المرتبطة بالملفات النصية. أولا - المتكرر عدد كبير من الرموز المطلوبة لدعم لغات مختلفة. يستخدم المبرمجون الأمريكيون للعمل مع 128 حرفا مجموعة من رموز ASCII الأمريكية (رمز قياسي أمريكي لمشاركة المعلومات). لدعم اللغات الأخرى، غالبا ما لا يكفي و 256 حرفا، وبالتالي، يتم الآن إجراء الانتقال التدريجي إلى ترميز Unicode، حيث تم بالفعل إعطاء بايتان بالفعل لتخزين حرف واحد (أي أنه من الممكن تشفير 65،536 حرفا مختلفا ).

المشكلة الثانية هي أن الأشخاص يريدون أن تحتوي المستندات المطبوعة على الرسوم البيانية والرسوم البيانية والملاحظات والعناوين وترتيب استخدام الخطوط المختلفة. الوثائق الموزعة في الإنترنت ( متصل المستندات) قد تحتوي على رسوم متحركة وروابط مختلفة موارد الشبكة والدعم السليم.

يتم إرسال العديد من الملفات النصية كنص بسيط (نص عادي). النص البسيط يصعب قراءة جذابة وسهولة، حيث لا توجد خطوط من التصميمات المختلفة، الرسوم البيانية، الرؤوس، الترجمات، إلخ. ميزات اضافية ارتداء اسم بمناسبة النص (وضع علامة على).

التحدث عن ترميز النص، تخصيص المفاهيم جسدي - بدني و منطقية العلامات. عند استخدام التصميم المادي للنص، يشار إلى العرض الدقيق لكل جزء. على سبيل المثال، "النص المركزي، 14 كليف، الدهون، سماعات الرأس مرات". إذا تشير العلامات المنطقية إلى القيمة المنطقية لهذه الشظية، على سبيل المثال، "هو عنوان الفصل". هذه الطريقتين للمناسبة المقصود، كقاعدة عامة، للاستخدام في حالات مختلفة. من أجل طباعة النص على الطابعة، تحتاج إلى استخدام العلامات الفيزيائية. يجب اتخاذ القرارات بشأن حجم الحقول وأرقام الفقرة. تستخدم الإصدارات المبكرة من المعالجات النصية فقط النوع المادي للتمييز. في الوقت نفسه، تمت الإشارة إلى الخط والحجم والأناقة لكل جزء.

عند تبادل المعلومات مع أشخاص آخرين، يفرض التصميم البدني للنص عددا من القيود، خاصة بالنسبة للوثائق عبر الإنترنت. حجم الشاشة، والدقة، الخطوط مختلفة أنظمة مختلفةوبعد لهذه الأسباب، التصميم المنطقي للنص بشكل متزايد. في بعض الحالات، يكون التصميم المنطقي ضروريا عمليا: عند إنشاء مستندات إلكترونية مثل صفحات www أو عند إنشاء ونشر العمالة السائبة، مثل الكتب.

لحفظ علامات المستندات عند إرسالها معلومات النص من السيارة إلى استخدام السيارة طرق مختلفةوبعد معالجات النص I. نظم النشر تنسيقات الملفات المصممة خصيصا، لا تحتوي على نص فقط، ولكن أيضا معلومات حول كيفية تزيينها. المشكلة الرئيسية هنا غير متسقة مع هذه التنسيقات، على الرغم من أن البرامج الأكثر تعقيدا يمكن عادة قراءة الملفات في تنسيقات المنافسين. أمثلة على هذا النهج هي معالجات النص Word و StarWriter.

من خلال نهج مختلف، يتم إدراج أوامر العلامات الخاصة مباشرة في المستند. حتى إذا لم يكن لديك برامج يدعم هذا التنسيق، فأنت ما زلت تفهمه فيه. هناك العديد من الطرق لمثل هذا العرض لتخطيط النص، بما في ذلك:

  • لغة ترميز النص التشعبي (HTML) المستخدمة في World Wide Web؛
  • تحظى TEX والأرث بشعبية للعديد من المنشورات الأكاديمية، وكذلك في علماء الرياضيات والفيزيائيين والكيميائيين وحتى الموسيقيين.

أمثلة على البرامج التي تسمح لك بوضع نص بطريقة مماثلة، خدمة Netscape Composer و Lyx (Klyx).

غالبا ما تحتوي الملفات التي تم إنشاؤها بواسطة محررين مختلفين ملحقات فريدة تتيح، دون النظر في المستند، تخمين طرق وضع النص. لذلك غالبا ما يكون للملفات التي تم إنشاؤها بواسطة محررين إعداد النص العادي ملحق. TXT، وأعد في محرر Lyx - .lyx. يقوم Word Text Processor بشكل افتراضي بإنشاء ملفات بتنسيق MS Word (extension.doc)، ولكن أيضا يدعم التنسيقات الأخرى، مثل RTF (Extension.rtf). المستندات التي تحتوي على أوامر العلامات لغة HTMLلديك extension.html or.htm.

من الواضح أنه من المستحيل سرد جميع محرري النصوص. كثير منهم "شحذ" تحت واحد أو نشاط محدد آخر. تظهر القائمة التي تمت مناقشتها أدناه جزءا صغيرا فقط من محرري النصوص.

محرري النصوص غير المنسقة

المفكرة. بنيت في ب. نظام التشغيل النوافذ والتفاهم والسهل والاستخدام؛ mcedit. لديها أوجه التشابه مع تحرير التحرير من MS DOS، مكون مدير الملفات mc. (قائد منتصف الليل) نظام التشغيل Linux؛ كيديت. مبسدة محرر النص، جزء من KDE Linux؛ kwrite. محرر نصوص إعدادات إضافية مقارنة بالمحررين النصي البسيط الآخرين؛ emacs. يجمع بين وظائف مدير الملفات ومحرر النص؛ واحد من السمات المميزة هي القدرة على إنشاء وحدات ماكرو (وحدات الماكرو)؛ هناك في جميع الحيوانات المستنسخة UNIX، بما في ذلك Linux؛ يمكن استخدام Emacs في MS Windows.

المحررين يخلقون نصا مع عناصر وضع العلامات

كلمة. إنه يعمل على إنشاء مجموعة متنوعة من المستندات المطبوعة، وهو مكون. تطبيقات المكاتب في MS نوافذ؛ starwriter. إنه جزء من برنامج StarOffice ومظهره ووظائفه، كما أنه يشبه Word، وهو يعمل بشكل جيد على حد سواء في MS Windows وفي نظام التشغيل Linux؛ ليكس. (Klyx in KDE) محرر نصوص حديث، مخصص للأشخاص الذين يرغبون في الحصول على وثيقة يبحثون باحتراف، ولكن ينفقون على خلقها بحد أدنى وقت؛ يقوم المحرر بإدراج نص فريق TEX والوقت اللاتكس؛ نتسكيب الملحن. إدراج نص ترميز لغة HTML، هناك إصدارات لكل من نظام التشغيل Linux و MS Windows.

وهذا هو، التنسيقات لتخزين الملفات النصية. الآن الوسائل الرئيسية، ما يقرب من احترام في إعداد المعيار وثائق النص إنه برنامج MicrosoftWord، لذلك سيتم دفع التركيز إلى التنسيقات المخصصة لهذا البرنامج.

لكن)وثيقةوبعد تنسيقات التمديد . وثيقةهذه هي الطريقة المعتادة لتقديم نص VMicrosoftWord. يحتوي النص مع Extension.doc على البيانات الموجودة في المكان وما هو انهيار السلاسل والفقرات، وطرق محاذاة النص، والقيل بين الصفوف والفقرات، وجهة النظر والرسم على الخطوط وما إلى ذلك. كل هذا يسمى تنسيق النصوبعد تنسيق تنسيق النص وتنسيق الملف هو مفاهيم مختلفة تماما، على الرغم من أنه يتم التعبير عنها بكلمات وثيقة.

ليس دائما نسخة قديمة يمكن ل Microsoft Kord قراءة ما يتم إنشاؤه في إصدار أكثر حداثة. أو عند الانتقال إلى إصدار أكثر قديمة، أو يفقد برنامج آخر شيئا من تنسيق المستند. ولكن يمكن دائما قراءة الإصدارات الأحدث تماما ما يتم إنشاؤه بالكامل في الإصدارات السابقة.

صيغةوثيقة يتيح لك إنشاء أعلى تنسيق نصي أعلى جودة، ولكن لا يتم تشغيل النص الذي تم إنشاؤه دائما على كمبيوتر آخر.

ب)RTF.وبعد التمديد .rtfracted كما حقنص.صيغة.، ماذا يعني تنسيق النص المناسبوبعد تنسيقات الأسرة هي توافق واسع جدا، فهم يفهمون جميع المعالجات النصية، القديمة والجديدة. ولكن ليس كل محرري النصوص، لأن المحررين أكثر وسيلة بدائية للعمل مع النص. تعمل برامج العديد من الأمعاء (على سبيل المثال، الرسوم البيانية) عمل أفضل بكثير مع CRTF من CDOC. يتم تطبيق التوافق نظرا لأنه يتم تحويل TrOMIMATTING إلى تعليمات البرامج التي تتيح لك فتح وعرض مستند في وسائل مختلفة.

إذا كنت بحاجة إلى إعادة كتابة النص إلى كمبيوتر آخر باستخدام قرص مرن، في حين أنه لا يعرف ما هو برنامج العمل مع النص يستحق كل هذا العناء، ثم يتم حفظه لحفظه في تنسيق RTF. ملف التنسيق هو حجم أكبر قليلا، Thandoc، ولكن يظهر الضمان أن جهاز كمبيوتر آخر سوف يفهم هذا النص.

صيغةRTF. يتيح لك تشغيل النص الذي تم إنشاؤه على أي إصدار.مايكروسوفت.كلمة. وفي العديد من البرامج غير الأمعاء.

في)رسالة قصيرة.وبعد هذا تنسيق نص بدائي لا يحتوي على تنسيق معقد. من التنسيق، يتم الاحتفاظ بالقسمة فقط بشأن الفقرات هنا، ويتحول كل سطر إلى فقرة. FormessXT، تطبيقها من قبل المبرمجين لكتابة رمز البرنامج، لأن لا يحتاج الكمبيوتر إلى "جميلة" على المفاهيم الإنسانية لتصميم النص. لا يزال مضمونا لاستخدام النص عندما يجب أن يفهم النص المستخدمين برامج مختلفة عندما لا يتعرف البرنامج النهائي على تنسيقات الملفات الأخرى.

في Windows، أداة برمجية للعمل مع النصوص في format.txt- المفكرة. (دفتر)، من المناسب تصفح ذلك برامج مختلفة والوثائق الإلكترونية غير المقصودة للطباعة.

رسائل بريد إلكتروني أيضا لم يكن قد وضعت التنسيق. لذلك، إذا قمت بإرسال مستند في شكل رسالة بريدية، فسوف يفقده مظهر خارجيوبعد إذا كنت ترغب في النقل عن طريق البريد ليس فقط المحتوى، ولكن أيضا ظهور النص، فيجب إرساله كملف مستند متصل بالرسالة البريدية.

هناك الكثير تنسيقات النص الأخرىوبعد منذ 10 سنوات أو أكثر، تعتبر العديد من البرامج النصية الأخرى، مثل البرنامج المحلي "المعجم"، شعبية أيضا. بالنسبة للبرامج النازحة BymicrosoftWord، فإن تنسيقات النص الأصلية الخاصة بهم، والتي قد تكون هناك حاجة إليها من خلال قراءة نصوص ذلك الوقت.

أخيرا، يمكن تخزين النص ودرجة واحدة أو آخر لتحرير العشرات من التنسيقات الأخرى التي تهدف إلى إنشاء مستندات نصية، ولكن لأغراض أخرى. كأمثلة، يمكنك إحضار التنسيق . لغة البرمجةإلى مواقع CreateWeb، . xLX.لمحرر الجدول Excel، PopularPostScriptFormat . بي دي إف.واشياء أخرى عديدة.