فرمت های سند الکترونیکی مورد استفاده در مدیریت اسناد

در دنیای مدرن، اطلاعات یک منبع ارزشمند قابل مقایسه است به جز زمان. اطلاعات وظایف بسیاری در زندگی جامعه را انجام می دهد، تعامل ارتباطی تمام اجزای آن، اصلاح، در حالی که حفظ و انتقال دانش دریافت شده و انباشته شده است. با این وجود، نقش کلیدی اطلاعات در مدیریت را بازی می کند.

اطلاعات مدیریت در اسناد ثبت می شود. سند، به عنوان یک حامل اطلاعات، یک منبع اطلاعاتی است که به متخصصان مدیریت سند اختصاص داده شده برای سازماندهی یک فرایند تکنولوژیکی مستند سازی و کار با اسناد، از جمله استفاده از فن آوری های اطلاعاتی مدرن، سپرده می شود.

در مرحله حاضر، هیچ کس شک ندارد که نیاز به معرفی فن آوری های اطلاعات جدید را به فرآیندهای مدیریت و عمدتا در محدوده مدیریت اسناد (DOU)، همانطور که در یکی از مهمترین مولفه های این فرآیندها نیست. صحبت کردن در مورد معرفی فناوری اطلاعات و ارتباطات جدید (ICT) به حوزه های دو، به عنوان یک قاعده، درک می شود که طراحی و پیاده سازی یک سیستم خودکار مدیریت اسناد (AC DOU) با تعدادی از ماژول های جاسازی شده و متصل شده است ضمنی.

اما آنچه پشت این فناوری های اطلاعاتی است، از جمله سیستم های به عنوان دو؟ تعداد کمی از متخصصان سند این را به طور کامل درک می کنند. در عین حال، کاملا واضح است که بدون دانش اساسی، بنیادی در زمینه فناوری اطلاعات (IT) نمی تواند هر گونه اسناد را انجام دهد.

در آخرین استاندارد ملی، تنظیم فرآیندهای مدیریت GOST R ISO 15489-1-2007، مسئولیت "اسناد مدیریتی" به وضوح بیان شده است، یعنی متخصصان در زمینه مدیریت اسناد، برای طراحی، پیاده سازی و استفاده از سیستم خودکار Dow . این نشان می دهد که اسناد دیگر نمی تواند یک ناظر شخص ثالث در هنگام طراحی و اجرای AC DOU و تنها پس از آن کاربران آن باشد. آنها باید در مرحله اولیه طراحی خود، بخش فعال در روند را داشته باشند و الزامات اساسی برای اجزای عملکردی این سیستم را ایجاد کنند.

مطابق با الزامات مدارک تحصیلی، مستندات در فرمول بندی وظایف، طراحی، عملیات و بهبود (بخشی از آن) شرکت می کند پشتیبانی اطلاعات) سیستم های اطلاعاتی خودکار و سیستم های کنترل. همچنین در توسعه آخرین فن آوری های اطلاعاتی، طراحی و به روز رسانی پایگاه های داده ها و بانک های داده شرکت می کند. او مطالعات و خلاصه تجربه پیشرفته داخلی و خارجی در منطقه Dow را خلاصه می کند.

بررسی فناوری اطلاعات کامپیوتری در فعالیت های مدیریت این یک وظیفه مهم آموزش معاصر در تخصص "مستند سازی و مدیریت اسناد" است . یک متخصص مدرن باید به خوبی بر روی نرم افزار های مختلف متمرکز شود و سطح تغییرات نرم افزاری و راه حل های تکنولوژیکی را برای اجرای وظایف DOD تصور کنید.

از اینجا می توان نتیجه گرفت که لازم است افق های اسناد را در زمینه استفاده از فناوری اطلاعات در DOU و ویژگی های آنها گسترش دهیم.

مهمترین مشکل ناشی از معرفی آن در فعالیت های هر، به ویژه دولت، سازمان مشکل حفاظت است اسناد الکترونیکی و دسترسی به آن پس از یک دوره قابل توجهی از زمان. مشکلات دیگر در هنگام مبادله اسناد الکترونیکی در مدیریت، به ویژه در سطح بین اداری بوجود می آیند. در مرحله حاضر، این مشکلات، به طور جزئی، به حل فرمت های باز اسناد الکترونیکی کمک خواهد کرد.

این کشور به طور فعال مورد بحث قرار گرفته و موضوع معرفی مدیریت اسناد الکترونیکی در سطح دولت (به عنوان مثال، برنامه "الکترونیک الکترونیکی" ، "الکترونیک مسکو" ، مفهوم تشکیل دولت الکترونیک ، معرفی مقررات اداری الکترونیکی ، انجمن اطلاعات دولتی دوباره سوس ) راه حل مسائل ارائه شده در این اسناد بدون توجه به فرمت های اسناد الکترونیکی (ED) امکان پذیر نیست.

اسناد مهم از راهنمایی اصلی توسعه فن آوری های اطلاعاتی در فدراسیون روسیهدکترین امنیت اطلاعات هستند و استراتژی توسعه جامعه اطلاعاتی . توجه ویژه به برنامه ها و مفاهیم به دلیل این واقعیت است که دقیقا در آنها یک روش شناسی برای معرفی آن در روسیه، از جمله دامنه DOW است. در میان آنها علاقه خاصی به برنامه هدف فدرال "الکترونیک روسیه (2002-2010)" ، مفهوم تشکیل در فدراسیون روسیه دولت الکترونیک تا سال 2010 ، مفهوم استفاده از فناوری اطلاعات در فعالیت های سازمان های دولتی فدرال تا سال 2010 و غیره.

مفهوم توسعه سیستم استاندارد سازی ملی این یک نظام دیدگاه در مورد مشکلات توسعه سیستم استاندارد سازی ملی در فدراسیون روسیه تا سال 2010 است و شامل اهداف، اهداف و جهت گیری های معقول است.

ما قصد داریم به این موضوع رسیدگی کنیم تا یک چرخه ای از مقالاتی را که فرمت های اصلی اسناد الکترونیکی آن را شرح می دهند، تشکیل دهند، شکل گیری و توسعه رایگان نرم افزار، خاصیت فرمت های باز اسناد الکترونیکی، عمل استفاده از آنها در روسیه و خارج از کشور.

فرمت سند الکترونیکی، دقیق تر، فرمت فایل حاوی متن و / یا اطلاعات صوتی و تصویری در فرم کد شده است. "رمزگذاری" نباید با مفهوم "رمزگذاری شده" اشتباه گرفته شود. رمزگذاری به معنای مخفی کردن اطلاعات اشاره دارد و کدگذاری تنها تبدیل اطلاعات از یک فرم به دیگری است.

اگر شما تجزیه و تحلیل لغت نامه های فن آوری مدرن کامپیوتر، مفهوم "فرمت" متنوع و دشوار است. برای یک کاربر، به اندازه کافی بدانید که فرمت سند الکترونیکی یک منطق مشخص یا الگوریتم مشخصی است که پس از آن اطلاعاتی از دستگاه قابل خواندن به یک فرد قابل درک و بالعکس تبدیل می شود. فرمت ها ممکن است انواع مختلفی داشته باشند، از ساده و محدود به چالش های پیچیده و قادر به حمل بسیاری از توابع، از جمله امکان ایجاد طرح بندی، فشرده سازی و رمزگذاری.

در زمینه تکنولوژی کامپیوتر، تحت اصطلاح "فرمت" به معنای ساختار تسهیلات اطلاعات است. به عنوان مثال، فرمت فایل، روش سازماندهی عناصر اطلاعاتی (بیت، بایت) در فایل نامیده می شود و فرمت سند الکترونیکی روش مکان و ارائه داده ها را در سند الکترونیکی تعیین می کند .

ما فهرست فرمت های الکترونیکی اسناد الکترونیکی مورد استفاده در Dow \u200b\u200bرا فهرست می کنیم .

فرمت های متن برای ایجاد متون متن استفاده می شود و اغلب با استفاده از پردازنده های متنی ایجاد می شود.
مثلا:

DOC یک فرمت سند محبوب الکترونیکی است، طراحی شده برای مشاهده و تغییر (ویرایش) متن سند. فرمت بسیار راحت است اگر شما به طور همزمان بر روی یک سند از چند هنرمند کار می کنید.
.pdf یک فرمت صفحه نمایش یکسان در هر سیستم عامل و در هر برنامه است. محبوب در تهیه اسناد، مواد ارائه شده، جزوه های تبلیغاتی و غیره به دلیل این واقعیت است که فرمت در نظر گرفته شده برای مشاهده سند و اجازه نمی دهد تا تغییر غیر مجاز (یا غیر قابل تشخیص) به آن، استفاده از آن در Dow \u200b\u200bبسیار است راحت. لازم به ذکر است که تمام استانداردهای سازمان بین المللی استاندارد سازی (ISO) به ROSTECHREGULATION در فرمت PDF ارسال می شود.

RTF - طراحی شده برای مشاهده اسناد و ویرایش آنها را در نسخه های مختلف محصولات نرم افزاری. به عنوان مثال، نسخه های نسخه برای ویندوز. که در فرمت DOE این به طور فعال به دلیل این واقعیت استفاده می شود که به شما اجازه می دهد فایل ها را بدون از دست دادن ساختار و بخش معنی دار سند تبدیل کنید و با آنها در یک سیستم عامل کار کنید، اما در نسخه های موقت مختلف آن کار کنید.
فرمت های گرافیکی تصویر (به عنوان مثال، عکس، نقاشی) را ذخیره کنید و به دو نوع اصلی تقسیم می شوند: فرمت های برداراین تصویر را به عنوان مجموعه ای از اشکال هندسی (DXF، EPS، CGM) ذخیره می کند و فرمت های شطرنجیاین تصویر را به عنوان مجموعه ای از پیکسل های نقطه (BMP، TIFF، GIF) ذخیره کرد. تصویر ذخیره شده را می توان به متن سند اضافه کرد و هنگام طراحی ارائه آن از آن استفاده کرد.

فرمت های پایگاه داده با استفاده از سیستم های مدیریت پایگاه داده (DBMS) ایجاد می شود. آنها شامل زمینه ها و جداول حاوی عناصر جداگانه اطلاعات Pro-Gram به شما امکان می دهد ارتباط بین عناصر پراکنده ایجاد کنید. به عنوان مثال، پایگاه داده کارمندان ممکن است شامل زمینه هایی با نام کارکنان، آدرس ها و اطلاعات در مورد کار انجام شده باشد.

فایل ها در قالب صفحه گسترده در سلول های تعداد و ارتباط بین این اعداد ذخیره می شوند. بنابراین، یک سلول ممکن است حاوی فرمول باشد که داده های دو سلول دیگر را خلاصه کند. مانند فایل های پایگاه داده، فایل های صفحه گسترده معمولا فرمت برنامه را دارند که با آنها ایجاد می شود. این فرمت در هنگام استفاده از زمان کار، و غیره مناسب است

فرمت های ویدئویی و صوتی شامل تصاویر متحرک ( ویدیوی دیجیتال، انیمیشن) و داده های صوتی که بیشتر ایجاد شده و با استفاده از برنامه های مناسب ایجاد شده و مشاهده می شود و در قالب یکپارچه ذخیره می شود. بیشترین استفاده از فرمت های QuickTime و MPEG هستند. علاوه بر کمک آنها، شما می توانید در جلسات، جلسات، و غیره وارد شوید

اجازه دهید ما را در جزئیات بیشتر در فرمت های نشانه گذاری که شامل دستورالعمل های جاسازی شده برای نمایش و درک محتوای فایل.

شما می توانید زبان علامت گذاری سند الکترونیکی را در SGML (استاندارد زبان نشانه گذاری استاندارد عمومی) تعریف کنید. در ابتدا، آن را برای به اشتراک گذاشتن اسناد قابل خواندن کامپیوتر در پروژه های بزرگ دولتی و هوافضا توسعه داده شد. این به طور گسترده ای در حوزه چاپ شده و انتشارات مورد استفاده قرار گرفت، اما پیچیدگی او دشوار بود که برای استفاده روزمره گسترده شود.

SGML توسط سازمان بین المللی استاندارد سازی تایید شدایزو به عنوان استاندارد بین المللی ISO 8879: 1986 پردازش اطلاعات - سیستم های متن و اداری - استاندارد زبان نشانه گذاری عمومی (SGML) "و در بدن های دولتی بسیاری از کشورهای جهان استفاده می شود.

از زبان طرح سند SGML، زبان جدید، پیشرفته تر، پیشرفته تر رخ داده استHTML و XML.

HTML (زبان نشانه گذاری Hypertext - "مارک زبانhypertext ") این یک برنامه SGML است. این برای نمایش تقریبا تمام اطلاعات در شبکه استفاده می شود. مطابق با استاندارد بین المللی استایزو 8879: 1986 و استاندارد استعلامت گذاری زبان اسناد در وب جهانی (www).

XML (زبان نشانه گذاری قابل انعطاف) - یک زیر مجموعه زبان SGML. محبوبیت را در هنگام مدیریت اطلاعات و مبادله آن به عنوان یک زبان نشانه گذاری زبان نسبتا ساده اسناد دریافت کرد. XML - فرمت متن طراحی شده برای ذخیره داده های ساخت یافته (به جای موجودفایل های پایگاه داده )، برای تبادل اطلاعات بینبرنامه ها ، و همچنین برای ایجاد بر اساس زبان های علامت گذاری تخصصی، گاهی اوقات به نام فرهنگ لغت.

فرمت XML توسط مقامات استاندارد سازی جامعه اینترنتی در برابر کنسرسیوم جهانی وب (W3C)، که استانداردهای تکنولوژیکی را توسعه می دهد، تصویب می شودوب جهانی سازمان های UDDI (توضیحات جهانی، کشف و ادغام)، توسعه یک استاندارد توصیف جهانی، تشخیص و ادغام، طراحی شده برای تعریف، ثبت و شناسایی خدمات وب ارائه شده توسط شرکت ها. این مشخصات نیاز به ثبت نام اطلاعات توزیع شده از سرویس وب را تعیین می کند .

با مقصد، فرمت های اسناد الکترونیکی را می توان به آن تقسیم کرد:
- فرمت ها برای مشاهده سند؛
- فرمت ها برای مشاهده و تغییر سند؛
- فرمت ها برای تغییر سند.

در صورت امکان، فرمت های سند الکترونیکی عبارتند از:
- بین پلت فرم قابل حمل؛
- Interpogramno قابل حمل؛
- تخصصی

به عنوان یک قاعده، مرز روشن بین این دسته ها اتفاق نمی افتد. فرمت هایی که قابل حمل بین سیستم عامل های مختلف ممکن است اینترپوشام باشد. فرمت های تخصصی در وظایف باریک استفاده می شود و به عنوان یک قاعده، تنها با استفاده از برنامه های یک شرکت استفاده می شود و اغلب بسته می شوند.

با در دسترس بودن، فرمت ها می توانند باز و بسته شوند. فرمت های بسته همیشه دارایی یک سازمان خاص هستند که از آنها استفاده می کنند تا کیفیت کیفیت محصول را تضمین کنند و از رقبای فناوری قرض بگیرند.

فرمت باز یک مشخصات ذخیره سازی داده های دیجیتال در دسترس عمومی است که از محدودیت های مجاز هنگام استفاده استفاده می شود. به طور خاص، باید شامل پشتیبانی از فرمت های باز به عنوان دررایگان (باز) و در اختصاصی (اختصاصی، بدون آزاد) گسترش یافته توسطمجوز مشخصه هر یک از این نوع. هدف اصلی فرمت های باز این است که امکان دسترسی به داده ها را برای مدت زمان طولانی بدون توجه به حقوق مجاز و مشخصات فنی. فرمت باز از سند الکترونیکی، مصرف کننده را نه تنها در هنگام تغییر نسخه های برنامه محافظت می کند، بلکه می تواند اسناد را در شرایط عدم دسترسی به برنامه، که یک سند الکترونیکی ایجاد شده است، بخواند.

فرمت XML قابل توجه چیست؟ زبان زبان مارکپذیر قابل گسترش زبان مارکپذیر قابل گسترش شامل نه تنها داده ها، بلکه "همچنین اطلاعاتی را ارائه می دهد که این داده ها را توصیف می کند. این برای هر برنامه کامپیوتری قابل استفاده است و به شما اجازه می دهد مقدار زیادی از اطلاعات را بدون نیاز به تغییر زمان مصرف ساختارهای داده انتقال دهید " .

در حال حاضر، تولید کنندگان نرم افزار به سرعت به استفاده از XML در محصولات خود تغییر داده اند و بنابراین، ایده استاندارد سازی فرمت های سند را بر اساس XML، در اصل، پیاده سازی می کنند فرمت باز اسناد الکترونیکی

ادامه در موضوع بعدی.

GOST R ISO 15489-1-2007. مدیریت اسناد. الزامات کلی.

اسناد الکترونیکی به عنوان بخش مهمی از آرشیو ها به عنوان چاپگر در جدول دبیر تبدیل شده اند. متون، عکس ها، نقاشی ها، پایگاه های داده، فایل های صوتی و تصویری به سرعت به "رقم" می روند، باعث بحث در مورد اینکه چه فرمت ها برای ذخیره سازی مداوم اسناد الکترونیکی مناسب هستند. خوشبختانه، آرشیوهای روسی دارای کسی هستند که به دنبال کمک هستند.

درباره اسناد الکترونیکی به طور فزاینده ای گفته می شود و بلندتر می شود. در ایالات متحده، ArchiVatsts اختصاص داده شده به این منطقه از کار یک تعطیلات حرفه ای کامل - یک روز سند الکترونیکی (روز رکورد الکترونیکی)، که در 10 اکتبر جشن گرفته شده است. در این روز، دانشمندان و شیوه ها با هم جمع آوری می شوند تا مسائل مربوط به حفظ اسناد الکترونیکی را مورد بحث قرار دهند.

جامعه علمی روسیه نیز از حل مشکلات عملی کنار نمی آید، هرچند به روزهای قرمز تقویم اختصاص ندارد. سال گذشته، دانشمندان دانشگاه بشردوستانه دولت روسیه (RGGU) مطالعهی گسترده ای از فرمت های مختلف فایل های سند الکترونیکی را انجام دادند توصیف همراه با جزئیات تفاوت های هر یک از آنها.

نتیجه گیری، روند اصلی در گزارش علمی RGGU ارائه شده است " تجزیه و تحلیل مقایسه فرمت های فایل های اسناد الکترونیکی ذخیره دائمی (بلند مدت) ".1 این یکی از اولین نوع مشابه تحقیقات تحقیقاتی در روسیه است و اجازه می دهد تا بایگانی مقامات اجرایی فدرال، سازمان های دولتی و غیر دولتی، و همچنین آرشیو های دولتی و شهرداری به طور عینی به مسئله انتخاب آرشیوهای بهینه ترین مطلوب نزدیک می شوند. فرمت ذخیره دائمی (بلند مدت) اسناد الکترونیکی.

برخی از الزامات برای ذخیره اسناد الکترونیکی

در حال حاضر در مرحله طراحی، سیستم دریایی به گونه ای ساخته شده است که در طول کل دوره ذخیره سازی برای اطمینان از صحت، قابلیت اطمینان و مناسب بودن سند، صرف نظر از تغییرات سیستم 2 ساخته شده است. چنین تغییراتی در تعداد دیگران ممکن است ناشی از تبدیل فرمت ها، مهاجرت 3 بین تجهیزات فنی، سیستم عامل ها یا برنامه های کاربردی نرم افزار. در این مورد، باید توجه داشت که هنگام تبدیل فرمت ها، اطلاعات مربوط به تبدیل کامل باید به عنوان بخشی از اطلاعات کنترل 4 ذخیره شود. همچنین مهم است بدانید که علاوه بر سند اصلی الکترونیکی، در طول دوره ذخیره سازی، لازم است سند متادیتا را حفظ کنید (توضیحات سند) 5، که شامل تمام ابردادها در مورد سند الکترونیکی است. اگر دوره ذخیره سازی سند الکترونیکی بیش از دوره مورد انتظار وجود سیستم های ذخیره سازی داده ها باشد، لازم است که برنامه های مهاجرت به سیستم های جدید 6 را ثبت کنیم.

خوانایی یک توصیف جدایی ناپذیر از سند الکترونیکی است. تضمین شده است مشخصات فنی سند و نرم افزار موجود برای کارکنان بایگانی. فرمت فایل تعریف شده برای ذخیره سازی دائمی (بلند مدت) باید با قابلیت های فنی مقامات دولتی، آرشیو های دولتی و شهرداری، سازمان های غیر دولتی و غیره مطابقت داشته باشد تا اطلاعات را در بلندمدت تولید کند. علاوه بر این، توصیه می شود که اسناد الکترونیکی بر روی ذخیره سازی همراه با ابزارهای نرم افزاری که به آنها اجازه می دهد تا تولید کنند، و کیت مستندات همراه با اسناد و مدارک همراه.

با توجه به فرمت های فایل، نمایش آن باید توسط سیستم های مدیریت اسناد الکترونیکی پشتیبانی شود، یکنواختی دقیق وجود ندارد. امروزه اقدامات قانونی قانونی در دیدگاه خود از لیست نهایی تا حدودی متفاوت است. به عنوان مثال، بر اساس توصیه های آماده سازی مقامات فدرال لیستی از اسناد، ایجاد، ذخیره سازی و استفاده از آن باید به صورت اسناد الکترونیکی در سازمان فعالیت های داخلی انجام شود (تصویب شده توسط سفارش Rosarhiva تاریخ 29 آوریل 2011، شماره 32)، حضور اسناد الکترونیکی در EDS در فرمت های PDF، DOC، RTF، TXT، XML.

مطابق با الزامات سیستم های اطلاعاتی مدیریت اسناد الکترونیکی سازمان های اجرایی فدرال، از جمله نیاز به پردازش از طریق داده های سیستم های انتشار محدود (ظروف. سفارش وزارت ارتباطات فدراسیون روسیه 02.09.2011 شماره 221)، چهار فرمت زیر مورد نیاز است: PDF، RTF، DOC، TIFF. سایر اسناد نظارتی امکان حضور در آن را فراهم می کند سیستم های الکترونیکی مقامات دولتی از فرمت های دیگر فایل های اسناد الکترونیکی.

در سپتامبر 2014، شورای کارشناس وزارت بازرگانی از PDF / A به عنوان فرمت تعامل بین اداری در ED و ذخیره سازی درازمدت اسناد الکترونیکی استفاده می کند. همراه با PDF / A، پیشنهاد شده است تا فایل XML را با جزئیات یک سند الکترونیکی انتقال دهد. شناخته شده است که همراه با FSO یک سفارش متناظر با الزامات جریان سند آماده می شود.

توصیه هایی برای انتخاب فرمت سند الکترونیکی

انتخاب فرمت ذخیره سازی بهینه توسط نوع اطلاعات، ویژگی ها تعیین می شود. ابزار فنی ذخیره سازی (Magnetic، Optical، Optical، Emails Emails Emails)، ویژگی های دسترسی کاربر به داده ها و نرم افزار. با توجه به کاهش حامل های رسانه ای و افزایش ظرفیت آنها، دسترسی به نرم افزار و قابلیت خواندن فرمت فایل در مدت زمان طولانی توسط عوامل اصلی در انتخاب روش کدگذاری به رسمیت شناخته شده است. در تجزیه و تحلیل تطبیقی \u200b\u200bفرمت های سند الکترونیکی (فایل های متنی، گرافیک، صوتی و تصویری، پایگاه های داده، ارائه ها)، معیارهای زیر مورد توجه قرار گرفتند: معیارهای زیر مورد توجه قرار گرفتند:

  • توسعه دهنده و مالکیت؛
  • سال توسعه فرمت فایل؛
  • سال آخرین مدرنسازی او؛
  • فرکانس به روز رسانی نرم افزار؛
  • در دسترس بودن نسخه؛
  • کد برنامه باز یا بسته؛
  • شرح و مقایسه الگوریتم های فشرده سازی ریاضی؛
  • فرمت فایل مقصد؛
  • حضور و دسترسی به مبدل؛
  • پایداری با تکرار چندگانه 9.

فرمت های متن

متن آرایه اصلی ذخیره شده در آرشیو اطلاعات است. این به عنوان متون در زبان های ارتباطی انسانی (به استثنای نوشتن هیروگلیفیک، نزدیک به فرم گرافیکی) و زبان های برنامه نویسی درمان می شود. غالبا فایل های متنی شامل قطعات اطلاعات گرافیکی است. بر خلاف تصاویر، سوابق صوتی و تصویری، داده های متنی به فشرده سازی قابل توجه با استفاده از برنامه های آرشیو ویژه قابل توجه است.

با توجه به توصیه های RGU، بایگانی فایل ها بهتر است در یک فرم رمزگذاری شده با استفاده از ZIP (* .zip) تولید شود، و اطلاعات متن بیشتر برای ضبط بیشتر است فرمت های بعدی: XML (شامل XSD / XSL / XHTML)، PDF / A-1 (ISO 19005-1) (* .pdf)، PDF / A-2 (ISO 19005-2: 2011) (* .pdf). با برخی از شرایط می تواند مورد استفاده قرار گیرد فرمت های متن: متن ساده (ISO 8859-1NCoding)، PDF (* .pdf) (فونت های جاسازی شده)، فرمت متن غنی 1.x (* .rtf)، HTML، SGML (* .sgml)، دفتر باز (* .sxw / * . ooxml)، ooxml (ISO / IEC DIS 29500) (* .docx)، ePub (رمزگذاری نشده) (* .epub). بزرگترین ثبات زمانی که مهاجرت از یک فرمت در نرم افزار انتخاب شده در دیگر، فرمت های * .doc و * .xml رفتار می کنند. جدول 1 نتایج تغییرات در مقدار اطلاعات را در طی مهاجرت ارائه می دهد.

جدول 1. ماتریس تغییر در مقدار اطلاعات در طی مهاجرت (چند بار)

فرمت فایل منبع /
فرمت های فایل های مهاجرت
* .doc
مایکروسافت ورد 97-2003
* .odt* .xml.* .rtf* .pdf* .pdf (PDF / A)
* .doc
مایکروسافت ورد 97-2003
منبع<3,3 >2,2 >2,7 >3,2 >3,7
* .odt>3,4 منبع>8,4 >7,7 >10 >18,4
* .xml.<2,2 <8,2 منبع>1,04 >1,4 >2,6

توجه داشته باشید که بسته دفتر OpenOffice، که به دلیل مجوز رایگان توزیع شده است، تعداد محدودی از محدودیت ها را در مقایسه با مایکروسافت ورد 2007 ارائه می دهد. بنابراین، برای ایجاد یک فایل در فرمت XML در OpenOffice 4 (Writer)، تنظیمات فنی اضافی سیستم خواهد بود لازم است (حضور محیط جاوا نصب شده (JRE). فرمت XML XML OpenOffice 4 * .stw هنوز پشتیبانی و توضیحات قابل توجهی را دریافت نکرده است. مایکروسافت ورد 2007 اطلاعاتی را در چنین فرمت نمایش نمی دهد، آن را به عنوان خالی باز می کند سند

فرمت های گرافیکی

اطلاعات گرافیک S. کیفیت بالابه خصوص تصاویر Polychrome و Halftone عملا قادر به فشرده سازی بایگانی نیستند. به عنوان یک قانون، فرمت های Raster برای ذخیره سازی استفاده می شود که ذخیره سازی صحنه های واقع بینانه را با عمق رنگی بزرگ فراهم می کند. با توجه به نتایج تجزیه و تحلیل تطبیقی، تنها سه فرمت برای ذخیره سازی طولانی مدت مناسب تر بود. تصاویر شطرنجی: TIFF (Uncompressed)، JPEG2000 (lossless) (* .jp2)، png (* .png).

برای تصاویر بردار، فرمت توصیه شده SVG (بدون اتصال اسکریپت جاوا) (* .svg) است. نقشه ها، طرح های ساختاری، الگوریتم های گرافیکی نشان داده شده از ابتدای گرافیکی (بخش ها و خطوط شکسته، چند ضلعی، حلقه ها و بیضی ها) به طور موثرتر در چنین فرمت های بردار به عنوان SWG، WMF، CGM و غیره اجرا می شوند. با این حال، فراموش نکنید که فرمت های بردار معمولا منجر به تحریف طرح رنگ یک تصویر پیچیده می شود.

برای کدگذاری تصاویر 3D (فرمت های داده مجازی) قابل قبول است برای استفاده از فرمت X3D (* .x3d) قابل قبول است.

فرمت های صوتی و تصویری

مانند اطلاعات گرافیکی، اطلاعات صوتی و تصویری تقریبا قادر به آرشیو به طور موثر نیست: به طور متوسط، فشرده سازی آنها بیش از 5٪ نیست. انتخاب انواع مختلف رمزگذاری این داده ها به طور قابل توجهی بر حجم فایل ذخیره شده تاثیر می گذارد، بنابراین از کیفیت پخش مورد نیاز و به عنوان یک نتیجه، اولویت این یا آن فرمت بستگی به حجم مورد نیاز ذخیره سازی بایگانی دارد. فرمت های ذخیره سازی صوتی توصیه شده: AIFF (PCM) (* .aif، * .aiff)، WAV (PCM) (* .wav)، AES3 (LPCM) (* .aes). بهترین نتایج بر نتایج مقایسه ای برای ایمنی داده های ویدئویی نشان داد: Motion JPEG 2000 (ISO / IEC 15444-4) (*. MJ2)، AVI (Uncomptered، Motion JPEG) (* .avi)، فیلم QuickTime ( Uncompressioned، Motion JPEG) (* .mov).

پایگاه های داده و بانک های داده

انتخاب فرمت ذخیره سازی پایگاه داده به طور عمده بر ساختار آن بستگی دارد. اگر پایه یک فایل باشد، توصیه می شود آن را در کدگذاری مربوط به این نوع فایل ذخیره کنید. هنگام ذخیره پایه ای که سوابق آنها از زمینه های ساختارهای مختلف تشکیل شده است، کدگذاری های RTF و PDF اغلب مورد استفاده قرار می گیرند، اما در موارد احتمالی، اگر عبارات صوتی و تصویری در پایگاه داده وجود نداشته باشند. فرمت های متنوع ترین برای پایگاه های ذخیره سازی درازمدت، مقادیر جدا شده کاما (* .csv)، متن تعریف شده (* .txt)، SQL DDL است. در موارد نادر، فرمت ها می توانند مورد استفاده قرار گیرند: DBF (* .DBF)، OpenOffice (* .SXC / * ODS)، OOXML (ISO / IEC 29500) (*. XLSX).

ارائه

هیچ یک از فرمت های موجود این میزان قابل توجهی از قابلیت اطمینان از حفظ ارائه را فراهم نمی کند. با برخی از رزرو، شما می توانید فرمت های OpenOffice (* .sxi / *. ODP) و OOXML (ISO / IEC DIS 29500) (* .pptx) را توصیه کنید. فرمت پاورپوینت (* .ppt) و سایر فرمت های فایل های ارائه، الزامات ذخیره سازی درازمدت را برآورده نمی کنند.

اطلاعات هیبریدی

برای ذخیره اسناد جامع، ساختار که شامل قطعاتی از ماهیت های مختلف (متن، عکاسی، نقاشی، و غیره)، فرمت های متن مدرن مانند MS Word، RTF مناسب ترین هستند. آنها اجازه می دهند شامل تصاویر گرافیک در کدهای شيفات. اگر تصاویر زیادی وجود داشته باشد، این سند توصیه می شود به عنوان یک تصویر واحد ذخیره شود - در این مورد، فرمت های گرافیکی ترجیح داده می شود.

یادداشت:

  1. کار پژوهشی در چارچوب قرارداد دولتی شماره 016-3 از تاریخ 31 مه 2013 انجام شد "مطالعه فرایندهای مدرن مدیریت سند و مدیریت اسناد الکترونیکی. "گزارش علمی" تجزیه و تحلیل مقایسه ای از فرمت های فایل اسناد الکترونیکی ذخیره دائمی (بلند مدت) "(به عنوان بخشی از اجرای فعالیت های برنامه هدف فدرال" فرهنگ روسیه "(2012-2018).
  2. GOST R ISO 15489-1-2007 "استاندارد ملی فدراسیون روسیه. سیستم استانداردهای اطلاعات، کتابداری و نشر. مدیریت اسناد. الزامات عمومی "(تایید شده توسط دستور Rostechregulation تاریخ 12.03.2007 شماره 28-ST).
  3. مهاجرت اسناد الکترونیکی یک عمل در مورد سوابق متحرک از یک سیستم به سیستم دیگر است، در حالی که حفظ صحت، یکپارچگی، قابلیت اطمینان و سهولت استفاده.
  4. ساختار توصیف سند شامل توصیف ساختار فیزیکی یا فنی آن و ساختار منطقی آن است، یعنی روابط بین عناصر داده ای که سند را تشکیل می دهند. برای کسب اطلاعات بیشتر در مورد ایجاد، مدیریت و استفاده از متادیتا، GOST R ISO 23081-1-2008 را ببینید. سیستم استانداردهای اطلاعات، کتابداری و نشر. فرآیندهای مدیریت سند ابرداده برای اسناد قسمت 1. اصول (تایید شده توسط دستور Rostechregulation تاریخ نوامبر 13، 2008 شماره 310-ST).
  5. GOST R 54471-2011 "سیستم های مدیریت اسناد الکترونیکی. مدیریت مستندات اطلاعات ذخیره شده در در قالب الکترونیکی. توصیه هایی برای اطمینان از قابلیت اطمینان و قابلیت اطمینان. "
  6. قوانین سازماندهی ذخیره سازی، کسب، حسابداری، حسابداری و استفاده از اسناد صندوق بایگانی فدراسیون روسیه و سایر اسناد بایگانی در آرشیو های دولتی و شهرداری، موزه ها و کتابخانه ها، سازمان های آکادمی علوم روسیه (تصویب شده توسط وزارت امور خارجه فرهنگ و ارتباطات جمعی فدراسیون روسیه 18 ژانویه 2007 شماره 19).
  7. ببینید همانجا 4.4.3.
  8. تکرار یک روش صرفه جویی در اطلاعات دیجیتال با ایجاد یک یا چند نسخه کامل (کلون ها) مواد دیجیتال است. تکرار نیاز به رویدادهای ویژه برای پشتیبانی از تمام نسخه ها در تاریخ به روز است.

فایل های متنی رایج ترین نوع داده در دنیای کامپیوتر هستند. چندین مشکل مرتبط با فایل های متنی وجود دارد. اول، تعداد بسیار زیادی از کاراکترهای مورد نیاز برای حمایت از زبان های مختلف است. برنامه نویسان آمریکایی برای کار با 128 کاراکتر از مجموعه ای از نمادهای ASCII ایالات متحده (کد استاندارد آمریکایی برای به اشتراک گذاری اطلاعات) استفاده می کنند. برای حمایت از زبان های دیگر، اغلب کافی نیست و 256 کاراکتر، بنابراین انتقال تدریجی به رمزگذاری یونیکد در حال حاضر انجام می شود، که در آن دو بایت قبلا برای ذخیره یک شخصیت داده شده است (یعنی امکان رمزگذاری 65،536 کاراکتر مختلف )

مشکل دوم این است که مردم می خواهند اسناد چاپ شده را شامل نمودارها، نمودار ها، یادداشت ها، سرفصل ها و به منظور استفاده از فونت های مختلفی داشته باشند. اسناد توزیع شده در اینترنت ( برخط اسناد) ممکن است شامل انیمیشن، لینک به انواع مختلف منابع شبکه و پشتیبانی صدا

بسیاری از فایل های متنی به عنوان یک متن ساده (متن ساده) منتقل می شوند. متن ساده دشوار است که جذاب و راحت قابل خواندن باشد، زیرا فونت های طرح های مختلف، نمودارها، هدایا، زیرنویس ها و غیره وجود ندارد امکانات اضافی نام یک نام علامت گذاری متن (نشانه گذاری).

صحبت از نشانه گذاری متن، تخصیص مفاهیم فیزیکی و منطقی نشانه گذاری. هنگام استفاده از طرح فیزیکی متن، دیدگاه دقیق هر قطعه نشان داده شده است. به عنوان مثال، "متن متمرکز، 14 کیلم، چربی، هدست تایمز". اگر نشانه گذاری منطقی نشان می دهد ارزش منطقی این قطعه، به عنوان مثال، "عنوان فصل" است. این دو روش علامت گذاری به عنوان یک قاعده در نظر گرفته شده است، برای استفاده در شرایط مختلف. به منظور چاپ متن بر روی چاپگر، شما باید از علامت فیزیکی استفاده کنید. تصمیمات باید بر روی اندازه زمینه ها و اعداد پاراگراف ساخته شود. نسخه های اولیه پردازنده های متنی تنها نوع فیزیکی نشانه گذاری را استفاده می کنند. در عین حال، فونت، اندازه و سبک برای هر قطعه اشاره شد.

هنگام مبادله اطلاعات با افراد دیگر، طراحی فیزیکی متن تعدادی از محدودیت ها را به ویژه برای اسناد آنلاین اعمال می کند. اندازه صفحه نمایش، رزولوشن، فونت ها برای سیستم های مختلف متفاوت هستند. به همین علت، طراحی منطقی متن به طور فزاینده ای است. در برخی موارد، طراحی منطقی عملا ضروری است: هنگام ایجاد اسناد الکترونیکی مانند صفحات WWW یا هنگام ایجاد و انتشار کار فله ای، مانند کتاب ها.

برای حفظ نشانه های اسناد هنگام انتقال اطلاعات متن از دستگاه به دستگاه روش های مختلف. پردازنده های متنی و سیستم های انتشارات از فرمت های خاصی طراحی شده استفاده می کنند که شامل نه تنها متن، بلکه همچنین اطلاعاتی در مورد چگونگی تزئینات آن هستند. مشکل اصلی در اینجا با چنین فرمت ها متناقض است، هرچند برنامه های پیچیده تر معمولا می توانند فایل ها را در فرمت های رقبا بخوانند. نمونه هایی از این رویکرد، پردازنده های متن ورد و ستاره دار هستند.

با یک رویکرد متفاوت، دستورات نشانه گذاری ویژه به طور مستقیم به سند وارد می شوند. حتی اگر شما نرم افزاری نداشته باشید که از این فرمت پشتیبانی می کند، هنوز آن را در آن درک می کنید. راه های زیادی برای چنین ارائه طرح متن وجود دارد، از جمله:

  • زبان نشانه گذاری Hypertext (HTML) که در وب جهانی استفاده می شود؛
  • تگزاس و لاتکس برای بسیاری از نشریات علمی، و همچنین در ریاضیدانان، فیزیکدانان، شیمیدانان و حتی نوازندگان محبوب هستند.

نمونه هایی از برنامه هایی که به شما اجازه می دهد متن را به شیوه ای مشابه قرار دهید، Serve Netscape Composer و Lyx (Klyx).

فایل های ایجاد شده توسط ویراستاران مختلف اغلب دارای پسوندهای منحصر به فرد هستند که اجازه می دهند بدون نگاه کردن به سند، روش های متن را حدس بزنند. بنابراین فایل های ایجاد شده توسط ویراستاران آماده سازی متن ساده اغلب دارای فرمت هستند. TXT، و در ویرایشگر Lyx - .Lex تهیه شده است. پردازنده متن کلمه به طور پیش فرض فایل ها را در فرمت MS Word (Extension.Doc) ایجاد می کند، اما همچنین از فرمت های دیگر مانند RTF (Extension.RTF) پشتیبانی می کند. اسناد حاوی دستورات نشانه گذاری زبان HTMLextension.html or.htm داشته باشند

بدیهی است، همه ویراستاران متن را غیر ممکن نیست. بسیاری از آنها تحت یک یا چند فعالیت خاص "تیز" هستند. لیست مورد بحث در زیر تنها بخش کوچکی از سردبیران متن را نشان می دهد.

ویراستاران متون Unformatted

دفترچه یادداشت ساخته شده در ب سیستم عامل ویندوز، درک و آسان و استفاده؛ mcytit این شباهت ها را با ویرایش ویرایش از MS DOS، جزء مدیر فایل mC. (Midnight Commander) سیستم عامل لینوکس؛ kedit ساده ویرایشگر متن، بخشی از لینوکس KDE؛ kwrite یک ویرایشگر متن تنظیمات اضافی در مقایسه با دیگر ویراستاران متن ساده؛ emacs توابع یک مدیر فایل و یک ویرایشگر متن را ترکیب می کند؛ یکی از ویژگی های متمایز کننده توانایی ایجاد ماکرو (ماکرو) است؛ در تمام کلون های یونیکس، از جمله لینوکس وجود دارد؛ EMACS را می توان در MS Windows استفاده کرد.

ویراستاران ایجاد متن با عناصر مارک

کلمه. این کار برای ایجاد انواع اسناد چاپ شده است، جزء است. برنامه های اداری در MS Windows؛ ستاره دار این بخشی از برنامه StarOffice، ظاهر و عملکرد است، آن را شبیه به کلمه است، آن را به همان اندازه به خوبی در هر دو در MS Windows و در سیستم عامل لینوکس کار می کند؛ lyx (Klyx در KDE) یک ویرایشگر متن مدرن، در نظر گرفته شده برای افرادی که می خواهند یک سند را به طور حرفه ای به دنبال داشته باشند، اما برای ایجاد حداقل زمان صرف آن؛ ویرایشگر متن تیم TeX و LaTeX را علامت گذاری می کند؛ آهنگساز Netscape. متن نشانه گذاری زبان HTML را وارد کنید، نسخه های هر دو سیستم عامل لینوکس و MS وجود دارد.

این، فرمت های ذخیره سازی فایل های متنی است. در حال حاضر به معنای اصلی، تقریبا یک انحصار در آماده سازی استاندارد است اسناد متن او برنامه MicrosoftWord است، بنابراین تمرکز بیشتر به فرمت های مورد نظر برای این برنامه پرداخت می شود.

ولی)اسناد. فرمت های فرمت . اسناداین روش معمول برای ارائه متن vmicrosoftword است. متن با extension.doc شامل داده های مربوط به کجا و تجزیه و تحلیل رشته ها و پاراگراف ها، روش تراز کردن متن، زنگ بین ردیف ها و پاراگراف ها، دیدگاه و طراحی فونت ها و غیره است. همه اینها نامیده می شود قالب بندی متن. فرمت متن و فرمت فایل کاملا مفاهیم کاملا متفاوت است، هرچند آنها در کلمات نزدیک بیان می شوند.

نه همیشه نسخه قدیمی MicrosoftWord می تواند آنچه را که در نسخه مدرن تر ایجاد شده است را بخواند. یا هنگام رفتن به یک نسخه قدیمی تر، یا یک برنامه دیگر چیزی از قالب بندی سند از دست داده است. اما نسخه های جدیدتر همیشه می توانند به طور کامل خواندن آنچه در نسخه های قبلی ایجاد شده است.

فرمتاسناد به شما اجازه می دهد تا با بالاترین کیفیت متن فرمت ایجاد کنید، اما متن ایجاد شده همیشه در رایانه دیگری پخش نمی شود.

ب)RTF. فرمت .rtfracted به عنوان درستمتنفرمت، به چه معنی است فرمت متن مناسب. فرمت های خانوادگی سازگاری بسیار گسترده ای هستند، آنها همه پردازنده های متنی، قدیمی و جدید را درک می کنند. اما نه همه سردبیران متن، از آنجا که سردبیران ابزار ابتدایی بیشتری برای کار با متن نیستند. بسیاری از برنامه های غیر روده (به عنوان مثال، گرافیک) برنامه ها به طور قابل توجهی بهتر کار با CRTF از CDOC کار می کنند. سازگاری اجرا می شود زیرا TRIFORMATTING به دستورالعمل های نرم افزاری تبدیل می شود که به شما اجازه می دهد تا یک سند را به وسیله ابزارهای مختلف باز کنید و مشاهده کنید.

اگر شما باید متن را به رایانه دیگری با استفاده از یک فلاپی دیسک بازنویسی کنید، در حالی که مشخص نیست که چه برنامه ای از کار با متن آن ارزش دارد، پس از آن ذخیره می شود تا آن را در فرمت RTF ذخیره کنید. فایل فرمت حجم کمی بزرگتر است، Thandoc، اما گارانتی به نظر می رسد که یک کامپیوتر دیگر این متن را درک می کند.

فرمتRTF به شما اجازه می دهد تا متن ایجاد شده را در هر نسخه پخش کنید.مایکروسافتکلمه. و در بسیاری از برنامه های غیر روده.

که در)txt. این یک فرمت متن اولیه است که شامل قالب بندی پیچیده نیست. از قالب بندی، تنها بخش در پاراگراف ها در اینجا حفظ می شود، و هر خط به یک پاراگراف تبدیل می شود. FormatTTTTS، اعمال شده توسط برنامه نویسان برای نوشتن یک کد برنامه، به دلیل کامپیوتر نیازی به "زیبا" در مفاهیم انسانی طراحی متن ندارد. این هنوز یک فرمت است برای استفاده از متن زمانی که متن باید کاربران را با نرم افزار های مختلف درک کند، زمانی که برنامه نهایی دیگر فرمت های فایل را تشخیص نمی دهد.

در ویندوز، یک ابزار نرم افزاری برای کار با متون در format.txt- دفترچه یادداشت (نوت بوک)، مناسب است که آن را مرور کنید برنامه های مختلف و اسناد الکترونیکی برای چاپ در نظر گرفته نشده است.

پیام ها پست الکترونیک همچنین فرمت های توسعه یافته را توسعه نداده اید. بنابراین، اگر یک سند را به صورت یک پیام پستی ارسال کنید، ظاهر آن را از دست خواهد داد. اگر می خواهید از طریق پست الکترونیکی نه تنها محتوا را انتقال دهید، بلکه ظاهر متن نیز باید به عنوان یک فایل DOC متصل به پیام پستی ارسال شود.

بسیاری وجود دارد سایر فرمت های متن. 10 یا بیشتر سال ها پیش، چندین برنامه متنی دیگر، مانند برنامه داخلی "Lexicon"، نیز محبوب هستند. برای برنامه های جابجایی bymicrosoftword، فرمت های متن اصلی خود، که ممکن است با خواندن متون آن زمان مورد نیاز باشد.

در نهایت، متن را می توان ذخیره کرد و به یک درجه یا یک درجه دیگر برای ویرایش ده ها فرمت دیگر در نظر گرفته شده برای ایجاد اسناد متنی، بلکه برای اهداف دیگر. به عنوان مثال، شما می توانید فرمت را به ارمغان بیاورید . htmlبه سایت های CreateWeb، . xlxبرای ویرایشگر جدول اکسل، popularpostpscriptformat . pDF.و خیلی های دیگر.