تشفير KOI8-R. أي نوع من ترميز KOI8-R وما الذي قدمته؟ كوي الترميز الجدول 8 رمز عشري

مرحبا، عزيزي موقع قراء بلوق. اليوم سنتحدث إليكم عن المكان الذي يأتي فيه Krakoyarbra وفي البرامج، التي توجد ترميزات نصية ويجب استخدامها. دعونا نفكر في تفصيل تاريخ تطورهم، بدءا من ASCII الأساسية، وكذلك إصداراتها الموسعة من CP866، KOI8-R، Windows 1251 وتنتهي برموز حديثة من Unicode UTF 16 و 8 Consortium.

شخص ما قد يبدو هذه المعلومات غير ضرورية، لكنك تعرف مقدار الأسئلة التي تعود إلي بالضبط الشقوق (لا تقرأ مجموعة من الشخصيات). الآن سيكون لدي الفرصة لإرسال كل شخص إلى نص هذه المقالة والبحث بشكل مستقل عن المياه الضحلة. حسنا، احصل على استعداد لامتصاص المعلومات ومحاولة مراقبة السرد.

ASCII - ترميز نص لاتيزا الأساسي

يحدث تطوير ترميزات النص في وقت واحد مع تكوين صناعة تكنولوجيا المعلومات، وخلال هذا الوقت كان لديهم وقت للخضوع لبعض التغييرات. تاريخيا، بدأ كل شيء بضارة إلى حد ما في النطق الروسي من EBCDIC، مما جعل من الممكن ترميز حروف الأبجدية اللاتينية والأرقام العربية وعلامات الترقيم مع رموز التحكم.

ولكن لا تزال نقطة الانطلاق لتطوير ترميزات النص الحديثة يجب أن تعتبر مشهورة ASCII. (رمز قياسي أمريكي لتبادل المعلومات، والذي عادة ما يكون باللغة الروسية هو عادة ما يكون "Aski"). فهو يصف أول 128 حرفا من الأكثر استخداما من قبل المستخدمين الناطقين باللغة الإنجليزية - والأرقام العربية وعلامات الترقيم.

حتى في هذه الأحرف 128 موضحة في ASCII، تم سحق بعض رموز الخدمة بين قوسين، المشابك، العلامات النجمية، إلخ. في الواقع، يمكنك أن ترى لهم:

إنها هذه الأحرف 128 من الإصدار الأولي من ASCII أصبحت المعيار، وفي أي ترميز آخر سوف تلبي بالتأكيد والوقوف على أنها ستكون بهذه الطريقة.

ولكن الحقيقة هي أنه بمساعدة بايت واحد من المعلومات، يمكنك أن ترميز رقم 128، ولكن ما يصل إلى 256 قيما مختلفة (مرتين إلى درجة تساوي ثمانية 256)، لذلك ظهرت مجموعة كاملة بعد الإصدار الأساسي من aska. الترميزات المتقدمة ASCII.بالإضافة إلى 128 علامة رئيسية، كان من الممكن أيضا ترميز رموز الترميز الوطنية (على سبيل المثال، الروسية).

هنا، ربما، الأمر يستحق المزيد عن نظام الأرقام المستخدمة في الوصف. أولا، كما تعلم كل شيء، يعمل الكمبيوتر فقط بأرقام في نظام ثنائي، أي مع الأصفار والوحدات ("Boulev Algebra"، إذا كان أي شخص عقد في المعهد أو في المدرسة). كل منها مناسبة إلى درجة، بدءا من الصفر، وللثنائي في السابع:

ليس من الصعب فهم أن جميع المجموعات الممكنة من الأصفار والوحدات في مثل هذا التصميم يمكن أن يكون فقط 256. ترجمة الرقم من النظام الثنائي في عشري بسيط للغاية. من الضروري ببساطة أضعاف كل درجات TWOS أعلاه تلك التي تقف واحدة.

في مثالنا، اتضح 1 (2 إلى درجة الصفر) بالإضافة إلى 8 (اثنين إلى الدرجات 3)، بالإضافة إلى 32 (مرتين في الدرجة الخامسة)، بالإضافة إلى 64 (في السادس)، بالإضافة إلى 128 (في السابع) وبعد إجمالي يتلقى 233 في نظام رقم عشري. كما ترون، كل شيء بسيط للغاية.

ولكن إذا نظرت إلى الطاولة مع أحرف ASCII، فسترى أنها مقدمة في الترميز الست عشري. على سبيل المثال، يتوافق "العلامة النجمية" إلى جنة رقم سداسي عشري 2A. ربما تعلم أنه في نظام أرقام سداسي عشري، يتم استخدام الحروف اللاتينية من A (يعني عشرة) إلى F (يعني خمسة عشر) في نظام أرقام سداسي عشري.

حسنا، لذلك أرقام ثنائية في سداسي عشري اللجوء إلى الطريقة البسيطة والبصرية التالية. يتم تقسيم كل بايت من المعلومات إلى جزأين من أربعة بتات، كما هو موضح في لقطة الشاشة أعلاه. وبالتالي في كل نصف بايت، لا يمكن أن يكون الرمز الثنائي يشفر إلا لمدة ستة عشر قيما (اثنان في الدرجة الرابعة)، والتي يمكن تمثيلها بسهولة من قبل سداسي عشري.

علاوة على ذلك، في النصف الأيسر من البايت، سيكون من الضروري النظر في مدى مرة أخرى من الصفر، وليس كما هو موضح في لقطة الشاشة. نتيجة لذلك، من خلال الحوسبة غير الجيدة، نحصل على أن الرقم E9 يتم ترميزه في لقطة الشاشة. آمل أن يكون مسار مفاجي وتصلب هذا Rebus أنك مفهوم. حسنا، الآن سوف نستمر، تحدث في الواقع عن ترميز النص.

إصدارات طويلة من Aski - CP866 و KOI8-R ترميز مع Pseudograph

لذلك، بدأنا نتحدث عن ASCII، الذي كان مثل نقطة انطلاق لتنمية جميع الترميزات الحديثة (Windows 1251، Unicode، UTF 8).

في البداية، تم وضعه 128 علامة فقط على الأبجدية اللاتينية، والأرقام العربية وشيء آخر هناك، ولكن في الإصدار الموسع، كان من الممكن استخدام جميع القيم 256 التي يمكن تشفيرها في معلومات باتيه واحدة. أولئك. فرصة لإضافة رموز الحروف من لسانه إلى Aska.

هنا سيكون من الضروري أن يصرف مرة أخرى لتوضيح - لماذا تحتاج الترميز النصوص ولماذا هو مهم جدا. يتم تشكيل الأحرف الموجودة على شاشة جهاز الكمبيوتر الخاص بك على أساس شيئين - مجموعات من أشكال المتجهات (تمثيلات) من جميع أنواع الشخصيات (أنها في الملفات الشخصية) والرمز الذي يسمح لك بسحب هذه المجموعة من الأشكال المتجهات ( ملف الخط) هو الحرف المراد إدراجها في المكان المناسب.

من الواضح أن الخطوط هي المسؤولة عن نماذج متجه، ولكن نظام التشغيل والبرامج المستخدمة فيها مسؤولة عن الترميز. أولئك. ستكون أي نص على جهاز الكمبيوتر الخاص بك مجموعة من البايتات في كل منها رمزا واحدا من هذا النص مشفرة.

البرنامج الذي يعرض هذا النص على الشاشة (محرر النصوص، المتصفح، وما إلى ذلك)، عند تحليل الكود، يقرأ ترميز العلامة التالية والبحث عن النموذج المتجه الذي يتوافق عليه في ملف الخط المطلوب متصل عرض المستند هذا النص. كل شيء بسيط ويتبت.

لذلك، لتشفير أي رمز نحتاجه (على سبيل المثال، من الأبجدية الوطنية)، يجب إكمال الشرطين - يجب أن يكون شكل متجه من هذه العلامة في الخط المستخدم ويمكن ترميز هذا الرمز في ترميزات ASCII الموسعة في بايت واحد وبعد لذلك، هناك مجموعة كاملة من هذه الخيارات. فقط لترميز رموز اللغة الروسية هناك العديد من أنواع الحمانات الممتدة.

على سبيل المثال، ظهرت في البداية CP866.حيث كان من الممكن استخدام رموز الأبجدية الروسية وكان إصدار موسع من ASCII.

أولئك. تزامن الجزء العلوي تماما مع الإصدار الأساسي من ASKI (128 رموز من اللاتينية والأرقام، وحتى أي Labuda)، والتي تمثل في لقطة شاشة أعلى قليلا، ولكن بالفعل الجزء السفلي من جدول ترميز CP866 كان المحدد في لقطة الشاشة أقل قليلا من الرأي والسماح لتشفير 128 علامة (الحروف الروسية وأي pseudographic):

انظر، في العمود الأيمن، تبدأ الأرقام مع 8، ل تشير الأرقام من 0 إلى 7 إلى الجزء الأساسي من ASCII (انظر لقطة للشاشة الأولى). وبالتالي الحرف الروسي "M" في CP866 سيكون له رمز 9C (إنه على تقاطع الصفوف المقابلة مع 9 والعمود مع رقم C في نظام أرقام سداسي عشري)، والذي يمكن كتابته في معلومات بايت واحدة، وإذا هناك خط مناسب مع الأحرف الروسية، سيتم عرض هذه الرسالة دون مشاكل في النص.

أين ذهبت هذه الكمية pseudographers في CP866.؟ كل شيء حقيقة أن هذا الترميز للنص الروسي قد تم تطويره في تلك السنوات الساطعة، عندما لم يكن هناك أي توزيع لأنظمة تشغيل الرسوم البيانية كما الآن. وفي DOSS، وعمليات نصية مماثلة، سمحت PSEDographic بتنويع تصميم النصوص على الأقل، وبالتالي فهي تهزم مع CP866 وجميع صفوفها الأخرى من تصريف الإصدارات الممتدة من Assa.

CP866 موزعة شركة IBM، ولكن بالإضافة إلى ذلك، تم تطوير عدد من الترميزات لرموز اللغة الروسية، على سبيل المثال، يمكن أن يعزى نفس النوع (موسع ASCII) koi8-r.:

ظل مبدأ عمله هو نفس CP866 الموصوف لاحقا - يتم ترميز كل رمز نص واحد بايت واحد. تظهر لقطة الشاشة النصف الثاني من طاولة KOI8-R، لأن النصف الأول يتفق تماما مع قاعدة ASUS الأساسية، والتي تظهر في لقطة للشاشة الأولى في هذه المقالة.

من بين ميزات ترميز KOI8-R، تجدر الإشارة إلى أن الحروف الروسية في طاولتها ليست في ترتيب أبجدي، مثل هذا، على سبيل المثال، التي تم إجراؤها في CP866.

إذا نظرت إلى لقطة للشاشة الأولى جدا (الجزء الأساسي، والذي يدخل جميع الترميزات الموسعة)، فاحظ أنه في KOI8-R، توجد الحروف الروسية في نفس الجداول من الجدول كحرف الأبجدية اللاتينية من الجزء الأول من الطاولة. تم ذلك لراحة التبديل من الرموز الروسية إلى اللاتينية من خلال التخلص من بت واحد فقط (اثنان في الدرجة السابعة أو 128).

ويندوز 1251 - نسخة حديثة من ASCII ولماذا تخرج

كان هناك مزيد من تطوير ترميزات النص يرجع إلى حقيقة أن أنظمة تشغيل الرسوم والضرورة التي تحتاجها إلى استخدام الكاذبين فيها كانت تكتسب شعبية. نتيجة لذلك، كانت مجموعة كاملة نشأت، والتي، عند جوهرها، لا تزال إصدارات متقدمة من ASKI (رمز نص واحد يتم تشفيرها ببرمجة واحدة فقط من المعلومات)، ولكن دون استخدام الأحرف الكاذبية.

عالجوا ما يسمى ترميز ANSI، الذي طوره المعهد الأمريكي للتوحيد القياسي. ما زال اسم السيريليك يستخدم في التكرار لخيار بدعم اللغة الروسية. مثال على مثل هذا المثال.

كان مختلفا بشكل إيجابي عن CP866 و KOI8-R المستخدمة سابقا في أن مكان أحرف الكماشة، استغرق الرموز المفقودة للطباعة الروسية (علامة التناقص)، وكذلك الرموز المستخدمة في قريبة من السلافية الروسية اللغات (الأوكرانية، البيلاروسية، إلخ):

نظرا لمثل هذه الوفرة من ترميز اللغة الروسية، كان لدى الشركات المصنعة للمخطوط ومصنعي البرمجيات باستمرار صداع، ومعكم، عزيزي القراء، غالبا ما حصلوا على أولئك الأكثر سيئة السمعة krakoyabry.عندما تم تدريس الارتباك مع الإصدار المستخدم في النص.

في كثير من الأحيان، خرجوا عند إرسال الرسائل وتلقي الرسائل عبر البريد الإلكتروني، مما أدى إلى إنشاء جداول تحويلية معقدة للغاية، والتي، في الواقع، لا يمكن أن تحل هذه المشكلة في الجذر، وغالبا ما يستخدم المستخدمون للمراسلات لتجنب krakozyabs سيئة السمعة عند استخدامها الترميزات الروسية CP866 مماثلة CP866 أو KOI8-R أو Windows 1251.

في جوهرها، كانت Krakoyarbra، التي تنفذ بدلا من النص الروسي، نتيجة الاستخدام غير الصحيح لترميز هذه اللغة، والتي لم تتطابق مع تلك التي تم ترميزها فيها الرسالة النصية في البداية.

لنفترض أنه إذا تم ترميز الرموز مع CP866، فحاول عرضه باستخدام جدول التعليمات البرمجية لنظام التشغيل Windows 1251، فهذه الأكثر متصدعا (مجموعة غير طبيعية من الأحرف) والخروج، واستبدال نص الرسالة بالكامل.

غالبا ما يحدث موقف مماثل في المنتديات أو المدونات، عندما لا يتم حفظ النص مع الأحرف الروسية عن طريق الخطأ في نفس الترميز المستخدم في الموقع الافتراضي، أو ليس في محرر النصوص، والذي يضيف إلى الكود Sebestin لا مرئية للعين المجردة.

في النهاية، مثل هذا الموقف مع العديد من الترميزات والزحف باستمرار، كانت العديد من المتصابقين، وهناك متطلبات مسبقة لإنشاء تباين عالمي جديد، والذي كان من شأنه أن يحل محل كل ما هو موجود وحل، وأخيرا، إلى جذر المشكلة مع ظهور غير موجود نصوص مقروءة. بالإضافة إلى ذلك، كانت هناك مشكلة لغات الصينية المماثلة، حيث كانت رموز اللغة أكثر من 256 بكثير.

Unicode (Unicode) - الرموز العالمية UTF 8 و 16 و 32

لا يمكن وصف هذه الآلاف من علامات مجموعة اللغة في جنوب شرق آسيا في معلومات واحدة بيب واحدة تم تخصيصها لترميز شخصيات في إصدارات ASCII المتقدمة. نتيجة لذلك، تم إنشاء كونسورتيوم يسمى Unicode. (Unicode - اتحاد يونيكود) في تعاون العديد من قادة تكنولوجيا المعلومات في الصناعة (أولئك الذين ينتجون برنامجا يرمدي الحديد، الذين يخلقون خطوط) كانوا مهتمين بمظهر ترميز نص عالمي.

كان الاختلاف الأول المنشور تحت رعاية اتحاد يونيكود UTF 32.وبعد الرقم في اسم الترميز يعني عدد البتات المستخدمة لتشفير رمز واحد. 32 بت هي 4 بايت من المعلومات التي ستكون هناك حاجة لترميز علامة واحدة واحدة في ترميز UTF العالمي الجديد.

نتيجة لذلك، فإن الملف نفسه مع النص المشفر في الإصدار الموسع من ASCII و UTF-32 سيكون في الحالة الأخيرة سيكون له حجم (يزن) أربع مرات أكثر. إنه سيء، لكن لدينا الآن الفرصة لترميز عدد العلامات تساوي 2 إلى ثلاثين درجة الثانية بمساعدة UTF ( مليارات الشخصياتوالتي ستغطي أي قيمة حقيقية لهامش هائل).

لكن العديد من البلدان التي لديها لغات المجموعة الأوروبية لها مثل هذا العدد الهائل من العلامات التي يجب استخدامها في الترميز على الإطلاق وليس هناك حاجة، عند استخدام UTF-32، لم يتلقوا زيادة بنسبة أربع مرات في وزن المستندات النصية، ونتيجة لذلك، زيادة في حركة المرور عبر الإنترنت والبيانات المخزنة الحجم. هذا كثير، ولا أحد يستطيع تحمل مثل هذه النفايات.

نتيجة لتطوير يونيكود ظهر UTF-16.التي تحولت بنجاح تم اعتمادها افتراضيا كمساحة أساسية لجميع الأحرف التي نستخدمها. يستخدم اثنين بايت لتشفير علامة واحدة. دعونا نرى كيف يبدو هذا الشيء.

في نظام التشغيل Windows، يمكنك تمرير على طول المسار "ابدأ" - "البرامج" - "قياسي" - "الخدمة" - "جدول الأحرف". نتيجة لذلك، يفتح جدول مع أشكال ناقلات جميعها المثبتة في خطوطك. إذا اخترت في "معلمات إضافية" مجموعة من أحرف Unicode، فيمكنك أن ترى لكل خط بشكل منفصل مجموعة كاملة من الأحرف المدرجة فيها.

بالمناسبة، النقر على أي منهم، يمكنك أن ترى ذلك رمز بتنسيق UTF-16تتكون من أربعة أرقام سداسية عشرية:

كم عدد الأحرف التي يمكن ترميزها في UTF-16 باستخدام 16 بت؟ 65 536 (اثنان إلى ستة عشر)، وتم اتخاذ هذا الرقم للمساحة الأساسية في Unicode. بالإضافة إلى ذلك، هناك طرق لترميزها وحوالي مليون حرف، ولكنها تقتصر على المساحة الموسعة في مليون رموز نصية.

ولكن حتى هذا الإصدار الناجح من ترميز Unicode لم يجلب الكثير من الرضا عن أولئك الذين كتبوا، على سبيل المثال، البرامج فقط باللغة الإنجليزية، لأن لديهم، بعد التبديل من الإصدار الموسع من ASCII إلى UTF-16، زاد وزن المستندات مرتين (بايت واحد لكل رمز في Aski و Baytes على نفس الرمز في UTF-16).

هذا هو بالتحديد لتلبية الجميع وكل شيء في اتحاد يونيكود قرر أن يأتي مع ترميز متغير طولوبعد كانت تسمى UTF-8. على الرغم من الثمانية في العنوان، فإنه حقا لديه طول متغير، أي يمكن ترميز كل رمز نص في سلسلة من واحد إلى ستة بايت.

في الممارسة العملية، يستخدم UTF-8 مجموعة فقط من واحد إلى أربعة بايت، لأنه لا يوجد شيء ممكن من الناحية النظرية لتقديم أي شيء إلى البايت الأربعة من التعليمات البرمجية. يتم تشفير جميع علامات اللاتينية في بايت واحدة، وكذلك في ASSII الجيدة القديمة.

ما هو جدير بالملاحظة، في حالة الترميز فقط اللاتينية، حتى تلك البرامج التي لا تفهم Unicode ستظل لا تزال تقرأ ما يتم ترميزه في UTF-8. أولئك. الجزء الأساسي من Aska تبديل ببساطة إلى هذا قبالة اتحاد يونيكود.

يتم ترميز علامات السيريلية في UTF-8 إلى بايتين، وعلى سبيل المثال، جورجيا - في ثلاثة بايت. اتحاد يونيكود بعد إنشاء UTF 16 و 8 قرر المشكلة الرئيسية - الآن لدينا في الخطوط هناك مساحة رمز واحدوبعد والآن لا تزال الشركات المصنعة الخاصة بهم فقط على أساس قواتهم وفرصهم لملء أشكال ناقلات الرموز النصية. الآن في مجموعات حتى.

في جدول الرمز أدناه، يمكن ملاحظة أن الخطوط المختلفة تدعم عددا مختلفا من الأحرف. يمكن أن تزن بعض رموز الخطوط Unicode بشكل جيد للغاية. ولكن الآن لا يتميز بحقيقة أنها تم إنشاؤها للحصول على ترميزات مختلفة، ولكن بحقيقة أن الشركة المصنعة للخط تمتلئ أو غير ملء مساحة الرمز الموحد من قبل تلك أو نماذج متجه أخرى حتى النهاية.

Krakoyabry بدلا من الحروف الروسية - كيفية إصلاح

دعونا الآن نرى كيف يظهر نص Crakozyabe بدلا من النص أو، بمعنى آخر، كيفية تحديد الترميز الصحيح للنص الروسي. في الواقع، يتم تعيينه في البرنامج الذي تقوم بإنشاءه أو تحريره هذا النص نفسه، أو رمز باستخدام شظايا النص.

لتحرير وإنشاء ملفات نصية، أنا شخصيا استخدام جيد جدا، في رأيي. ومع ذلك، يمكن أن تسليط الضوء على بناء الجملة لا تزال جيدة مئات لغات البرمجة والتمييز، وكذلك القدرة على التوسع مع الإضافات. اقرأ نظرة عامة مفصلة عن هذا البرنامج الرائع تحت الرابط.

في القائمة أعلى المفكرة ++، يوجد عنصر "ترميز"، حيث سيكون لديك القدرة على تحويل خيار موجود إلى واحد يتم استخدامه في موقعك الافتراضي:

في حالة وجود موقع في جملة 1.5 وما فوق، وكذلك في حالة مدونة على WordPress، يجب عليك اختيار الخيار من أجل تجنب مظهر Krakoyar UTF 8 بدون BOMوبعد ما هي بادئة BOM؟

والحقيقة هي أنه عندما تم تطوير ترميز ETF-16، لسبب ما قررت ربط مثل هذا الشيء كقدرة على تسجيل رمز رمز، سواء في التسلسل المباشر (على سبيل المثال، 0A15) وفي العكس (150A) وبعد وبالنسبة للبرامج لفهم رموز القراءة التسلسلية، واخترع بوم. (علامة ترتيب البايت أو، بمعنى آخر، توقيع)، والتي تم التعبير عنها في إضافة ثلاثة بايت إضافية إلى بداية المستندات.

في ترميز UTF-8، لم تكن هناك بوم في اتحاد يونيكود، وبالتالي إضافة توقيع (هذه الأكثر شهرة ثلاثة بايت إضافية إلى بداية المستند) بعض البرامج تمنع ببساطة قراءة التعليمات البرمجية. لذلك، نحن دائما، عند حفظ الملفات في UTF، يجب عليك تحديد خيار بدون BOM (بدون توقيع). لذلك أنت مقدما موستاس نفسك من المكبس.

لا يعرف ما هو جدير بالذكر، بعض البرامج في Windows لا تعرف كيفية القيام بذلك (لا تتمكن من حفظ النص في UTF-8 بدون BOM)، على سبيل المثال، نفس Windows Notoriousbook Windows. إنه يحفظ المستند في UTF-8، ولكن لا يزال يضيف توقيعا إلى بدايةه (ثلاثة بايت إضافية). علاوة على ذلك، ستكون هذه البايتات هي نفسها دائما - اقرأ الشفرة في التسلسل المباشر. ولكن على الخوادم، بسبب هذه الأشياء الصغيرة، قد تكون هناك مشكلة - سوف تخرج cringels.

لذلك، في أي حال لا تستخدم نوافذ دفتر الملاحظات المعتادة لتحرير مستندات موقعك، إذا كنت لا تريد ظهور Krakoyarbra. أنا أعتبر أحدث وأسهل خيار لمحرر المفكرة ++ المذكورة بالفعل، والتي لا تحتوي على عيوب ويتألف من أحد المزايا.

في المفكرة ++ عند اختيار ترميز، سيكون لديك القدرة على تحويل النص إلى ترميز UCS-2، وهو قريب جدا من معيار Unicode في جوهره. أيضا في غير من النوع يمكن ترميزها في ANSI، I.E. بالإشارة إلى اللغة الروسية، سيتم وصف هذا بالفعل من قبلنا فوق Windows 1251. من أين تأتي هذه المعلومات؟

يتم توضيحه في سجل نظام التشغيل Windows الخاص بك - والتي ترميز هي الاختيار في حالة ANSI، ما يجب اختياره في حالة OEM (للغة الروسية، سيكون CP866). إذا قمت بتثبيت لغة افتراضية أخرى على جهاز الكمبيوتر الخاص بك، فسيتم استبدال هذه الترميزات بمشابه تفريغ ANSI أو OEM بنفس اللغة.

بعدك في المفكرة ++، احفظ المستند في الترميز الذي تحتاجه أو فتح مستند من الموقع للتحرير، ثم في الركن الأيمن السفلي من المحرر، يمكنك رؤية اسمه:

لتجنب krakoyarbrov.بالإضافة إلى الإجراءات الموضحة أعلاه، سيكون من المفيد التسجيل في رأسه من التعليمات البرمجية المصدرية لجميع صفحات معلومات الموقع حول هذا الترميز من أجل الخادم أو المضيف المحلي لا يحدث.

بشكل عام، في جميع لغات التشعبية العلامات بخلاف HTML، يتم استخدام إعلان XML خاص، والذي يحدد ترميز النص.

قبل البدء في تفكيك الكود، سيعثر المتصفح على الإصدار المستخدم وكيف تحتاج بالضبط لتفسير رموز أحرف هذه اللغة. ولكن ما هو جدير بالملاحظة، في حال حفظ المستند في Unicode الافتراضي، يمكن حذف إعلان XML هذا (سيتم تعيين الترميز UTF-8، إذا لم يكن هناك بوم أو UTF-16 إذا كان هناك BOM).

في حالة وثيقة لغة HTML لتحديد الترميز المستخدم عنصر التعريفالتي وصفها بين علامة الرأس الافتتاحية والإغلاق:

... ...

هذا الإدخال مختلف تماما عن B مقبول، ولكنه يتوافق تماما مع إدخاله حديثا ببطء من قبل معيار HTML 5، وسوف يكون مفهوما بشكل صحيح تماما من قبل المتصفحات المستخدمة حاليا.

من الناحية النظرية، سيكون عنصر التعريف مع إشارة إلى ترميز HTML للوثيقة أفضل وضعه عالية قدر الإمكان في رأس قفص الاتهامبحيث في وقت الاجتماع في نص العلامة الأولى ليست من ANSI الأساسية (التي تقرأ دائما دائما وفي أي اختلاف) يجب أن يكون للمتصفح بالفعل معلومات حول كيفية تفسير رموز هذه الأحرف.

كل التوفيق لك! لاجتماعات غامضة على موقع صفحات المدونة

قد تكون مهتما

ما هي عناوين URL من الفرق بين الروابط المطلقة والنسبية للموقع
OpenServer هو خادم محلي حديث ومثال على استخدام WordPress لتثبيت على جهاز كمبيوتر
ما هو chmod، والكثير حقوق الوصول لتعيين الملفات والمجلدات (777، 755، 666) وكيفية القيام به من خلال PHP
البحث yandex في الموقع والتخزين عبر الإنترنت

اليوم سنتحدث إليكم عن المكان الذي يأتي فيه Krakoyarbra وفي البرامج، التي توجد ترميزات نصية ويجب استخدامها. دعونا نفكر في تفصيل تاريخ تطورهم، بدءا من ASCII الأساسية، وكذلك إصداراتها الموسعة من CP866 و KOI8-R و Windows 1251 وتنتهي مع الترميز الحديث من الاتحاد UNOCODE UTF 16 و 8 Consortium. جدول المحتويات: شخص ما قد يبدو هذه المعلومات غير ضرورية، لكنك تعرف مقدار الأسئلة التي تعود إلي بالضبط الشقوق (لا تقرأ مجموعة من الشخصيات). الآن سيكون لدي الفرصة لإرسال كل شخص إلى نص هذه المقالة والبحث بشكل مستقل عن المياه الضحلة. حسنا، احصل على استعداد لامتصاص المعلومات ومحاولة مراقبة السرد.

ASCII - ترميز النص لاتيزا الأساسي

يحدث تطوير ترميزات النص في وقت واحد مع تكوين صناعة تكنولوجيا المعلومات، وخلال هذا الوقت كان لديهم وقت للخضوع لبعض التغييرات. تاريخيا، بدأ كل شيء بضارة إلى حد ما في النطق الروسي من EBCDIC، مما جعل من الممكن ترميز حروف الأبجدية اللاتينية والأرقام العربية وعلامات الترقيم مع رموز التحكم. ولكن لا تزال نقطة الانطلاق لتطوير ترميزات النص الحديثة يجب أن تعتبر مشهورة ASCII. (رمز قياسي أمريكي لتبادل المعلومات، والذي عادة ما يكون باللغة الروسية هو عادة ما يكون "Aski"). ويصف أول 128 حرفا من المستخدمين الأكثر استخداما في اللغة الإنجليزية شيوعا - الحروف اللاتينية والأرقام العربية وعلامات الترقيم. حتى في هذه الأحرف 128 موضحة في ASCII، تم سحق بعض رموز الخدمة بين قوسين، المشابك، العلامات النجمية، إلخ. في الواقع، يمكنك أن ترى لهم:
إنها هذه الأحرف 128 من الإصدار الأولي من ASCII أصبحت المعيار، وفي أي ترميز آخر سوف تلبي بالتأكيد والوقوف على أنها ستكون بهذه الطريقة. ولكن الحقيقة هي أنه بمساعدة بايت واحد من المعلومات، يمكنك أن ترميز رقم 128، ولكن ما يصل إلى 256 قيما مختلفة (مرتين إلى درجة تساوي ثمانية 256)، لذلك ظهرت مجموعة كاملة بعد الإصدار الأساسي من aska. الترميزات المتقدمة ASCII.بالإضافة إلى 128 علامة رئيسية، كان من الممكن أيضا ترميز رموز الترميز الوطنية (على سبيل المثال، الروسية). هنا، ربما، الأمر يستحق المزيد عن نظام الأرقام المستخدمة في الوصف. أولا، كما تعلم كل شيء، يعمل الكمبيوتر فقط بأرقام في نظام ثنائي، أي مع الأصفار والوحدات ("Boulev Algebra"، إذا كان أي شخص عقد في المعهد أو في المدرسة). بايت واحد يتكون من ثمانية بتات، كل منها مناسبة إلى درجة، بدءا من الصفر، وللثنائي في السابع:
ليس من الصعب فهم أن جميع المجموعات الممكنة من الأصفار والوحدات في مثل هذا التصميم يمكن أن يكون فقط 256. ترجمة الرقم من النظام الثنائي في عشري بسيط للغاية. من الضروري ببساطة أضعاف كل درجات TWOS أعلاه تلك التي تقف واحدة. في مثالنا، اتضح 1 (2 إلى درجة الصفر) بالإضافة إلى 8 (اثنين إلى الدرجات 3)، بالإضافة إلى 32 (مرتين في الدرجة الخامسة)، بالإضافة إلى 64 (في السادس)، بالإضافة إلى 128 (في السابع) وبعد إجمالي يتلقى 233 في نظام رقم عشري. كما ترون، كل شيء بسيط للغاية. ولكن إذا نظرت إلى الطاولة مع أحرف ASCII، فسترى أنها مقدمة في الترميز الست عشري. على سبيل المثال، يتوافق "العلامة النجمية" إلى جنة رقم سداسي عشري 2A. ربما تعلم أنه في نظام أرقام سداسي عشري، يتم استخدام الحروف اللاتينية من A (يعني عشرة) إلى F (يعني خمسة عشر) في نظام أرقام سداسي عشري. حسنا، لذلك أرقام ثنائية في سداسي عشري اللجوء إلى الطريقة البسيطة والبصرية التالية. يتم تقسيم كل بايت من المعلومات إلى جزأين من أربعة بتات، كما هو موضح في لقطة الشاشة أعلاه. وبالتالي في كل نصف بايت، لا يمكن أن يكون الرمز الثنائي يشفر إلا لمدة ستة عشر قيما (اثنان في الدرجة الرابعة)، والتي يمكن تمثيلها بسهولة من قبل سداسي عشري. علاوة على ذلك، في النصف الأيسر من البايت، سيكون من الضروري النظر في مدى مرة أخرى من الصفر، وليس كما هو موضح في لقطة الشاشة. نتيجة لذلك، من خلال الحوسبة غير الجيدة، نحصل على أن الرقم E9 يتم ترميزه في لقطة الشاشة. آمل أن يكون مسار مفاجي وتصلب هذا Rebus أنك مفهوم. حسنا، الآن سوف نستمر، تحدث في الواقع عن ترميز النص.

إصدارات طويلة من Aski - CP866 و KOI8-R ترميز مع Pseudograph

لذلك، بدأنا نتحدث عن ASCII، الذي كان مثل نقطة انطلاق لتنمية جميع الترميزات الحديثة (Windows 1251، Unicode، UTF 8). في البداية، تم وضعه 128 علامة فقط على الأبجدية اللاتينية، والأرقام العربية وشيء آخر هناك، ولكن في الإصدار الموسع، كان من الممكن استخدام جميع القيم 256 التي يمكن تشفيرها في معلومات باتيه واحدة. أولئك. فرصة لإضافة رموز الحروف من لسانه إلى Aska. هنا سيكون من الضروري أن يصرف مرة أخرى لتوضيح - لماذا تحتاج ترميز النص ولماذا هو مهم جدا. يتم تشكيل الرموز على شاشة جهاز الكمبيوتر الخاص بك على أساس شيئين - مجموعة من النماذج المتجهة (العروض التقديمية) من جميع أنواع الأحرف (وهي في ملفات مع الخطوط المثبتة على جهاز الكمبيوتر الخاص بك) والرمز الذي يتيح لك الانسحاب هذه المجموعة من أشكال المتجهات (ملف الخط) الحرف الذي تريد إدراجه في المكان المناسب. من الواضح أن الخطوط هي المسؤولة عن نماذج متجه، ولكن نظام التشغيل والبرامج المستخدمة فيها مسؤولة عن الترميز. أولئك. ستكون أي نص على جهاز الكمبيوتر الخاص بك مجموعة من البايتات في كل منها رمزا واحدا من هذا النص مشفرة. البرنامج الذي يعرض هذا النص على الشاشة (محرر النصوص، المتصفح، وما إلى ذلك)، عند تحليل الكود، يقرأ ترميز العلامة التالية والبحث عن النموذج المتجه الذي يتوافق عليه في ملف الخط المطلوب متصل عرض المستند هذا النص. كل شيء بسيط ويتبت. لذلك، لتشفير أي رمز نحتاجه (على سبيل المثال، من الأبجدية الوطنية)، يجب إكمال الشرطين - يجب أن يكون شكل متجه من هذه العلامة في الخط المستخدم ويمكن ترميز هذا الرمز في ترميزات ASCII الموسعة في بايت واحد وبعد لذلك، هناك مجموعة كاملة من هذه الخيارات. فقط لترميز رموز اللغة الروسية هناك العديد من أنواع الحمانات الممتدة. على سبيل المثال، ظهرت في البداية CP866.حيث كان من الممكن استخدام رموز الأبجدية الروسية وكان إصدار موسع من ASCII. أولئك. تزامن الجزء العلوي تماما مع الإصدار الأساسي من ASKI (128 رموز من اللاتينية والأرقام، وحتى أي Labuda)، والتي تمثل في لقطة شاشة أعلى قليلا، ولكن بالفعل الجزء السفلي من جدول ترميز CP866 كان المحدد في لقطة الشاشة أقل قليلا من الرأي والسماح لتشفير 128 علامة (الحروف الروسية وأي pseudographic):
انظر، في العمود الأيمن، تبدأ الأرقام مع 8، ل تشير الأرقام من 0 إلى 7 إلى الجزء الأساسي من ASCII (انظر لقطة للشاشة الأولى). وبالتالي الحرف الروسي "M" في CP866 سيكون له رمز 9C (إنه على تقاطع الصفوف المقابلة مع 9 والعمود مع رقم C في نظام أرقام سداسي عشري)، والذي يمكن كتابته في معلومات بايت واحدة، وإذا هناك خط مناسب مع الأحرف الروسية، سيتم عرض هذه الرسالة دون مشاكل في النص. أين ذهبت هذه الكمية pseudographers في CP866.؟ كل شيء حقيقة أن هذا الترميز للنص الروسي قد تم تطويره في تلك السنوات الساطعة، عندما لم يكن هناك أي توزيع لأنظمة تشغيل الرسوم البيانية كما الآن. وفي DOSS، وعمليات نصية مماثلة، سمحت PSEDographic بتنويع تصميم النصوص على الأقل، وبالتالي فهي تهزم مع CP866 وجميع صفوفها الأخرى من تصريف الإصدارات الممتدة من Assa. CP866 موزعة شركة IBM، ولكن بالإضافة إلى ذلك، تم تطوير عدد من الترميزات لرموز اللغة الروسية، على سبيل المثال، يمكن أن يعزى نفس النوع (موسع ASCII) koi8-r.:
ظل مبدأ عمله هو نفس CP866 الموصوف لاحقا - يتم ترميز كل رمز نص واحد بايت واحد. تظهر لقطة الشاشة النصف الثاني من طاولة KOI8-R، لأن النصف الأول يتفق تماما مع قاعدة ASUS الأساسية، والتي تظهر في لقطة للشاشة الأولى في هذه المقالة. من بين ميزات ترميز KOI8-R، تجدر الإشارة إلى أن الحروف الروسية في طاولتها ليست في ترتيب أبجدي، مثل هذا، على سبيل المثال، التي تم إجراؤها في CP866. إذا نظرت إلى لقطة للشاشة الأولى جدا (الجزء الأساسي، والذي يدخل جميع الترميزات الموسعة)، فاحظ أنه في KOI8-R، توجد الحروف الروسية في نفس الجداول من الجدول كحرف الأبجدية اللاتينية من الجزء الأول من الطاولة. تم ذلك لراحة التبديل من الرموز الروسية إلى اللاتينية من خلال التخلص من بت واحد فقط (اثنان في الدرجة السابعة أو 128).

ويندوز 1251 - نسخة حديثة من ASCII ولماذا تخرج

كان هناك مزيد من تطوير ترميزات النص يرجع إلى حقيقة أن أنظمة تشغيل الرسوم والضرورة التي تحتاجها إلى استخدام الكاذبين فيها كانت تكتسب شعبية. نتيجة لذلك، كانت مجموعة كاملة نشأت، والتي، عند جوهرها، لا تزال إصدارات متقدمة من ASKI (رمز نص واحد يتم تشفيرها ببرمجة واحدة فقط من المعلومات)، ولكن دون استخدام الأحرف الكاذبية. عالجوا ما يسمى ترميز ANSI، الذي طوره المعهد الأمريكي للتوحيد القياسي. ما زال اسم السيريليك يستخدم في التكرار لخيار بدعم اللغة الروسية. مثال أن هذا يمكن أن يخدم ويندوز 1251.وبعد كان مختلفا بشكل إيجابي عن CP866 و KOI8-R المستخدمة سابقا في أن مكان أحرف الكماشة، استغرق الرموز المفقودة للطباعة الروسية (علامة التناقص)، وكذلك الرموز المستخدمة في قريبة من السلافية الروسية اللغات (الأوكرانية، البيلاروسية، إلخ):
نظرا لمثل هذه الوفرة من ترميز اللغة الروسية، كان لدى الشركات المصنعة للمخطوط ومصنعي البرمجيات باستمرار صداع، ومعكم، عزيزي القراء، غالبا ما حصلوا على أولئك الأكثر سيئة السمعة krakoyabry.عندما تم تدريس الارتباك مع الإصدار المستخدم في النص. في كثير من الأحيان، خرجوا عند إرسال الرسائل عبر البريد الإلكتروني وتلقيها، مما أدى إلى إنشاء جداول توزيع معقدة للغاية، والتي تعذر استخدام هذه المشكلة في الواقع في الجذر، وغالبا ما تم استخدام مستخدمين المراسلات من قبل الحروف اللاتينية لتجنب Krakozyabs سيئة السمعة استخدام الترميزات الروسية لمثل هذا CP866، KOI8-R أو Windows 1251. في جوهرها، كانت Krakoyarbra، المنفذة بدلا من النص الروسي، نتيجة الاستخدام غير الصحيح لترميز هذه اللغة، والتي لم تتوافق معها واحد الذي تم ترميز الرسالة النصية في البداية. لنفترض أنه إذا تم ترميز الرموز مع CP866، فحاول عرضه باستخدام جدول التعليمات البرمجية لنظام التشغيل Windows 1251، فهذه الأكثر متصدعا (مجموعة غير طبيعية من الأحرف) والخروج، واستبدال نص الرسالة بالكامل.
غالبا ما يحدث موقف مماثل عند إنشاء وتكوين المواقع أو المنتديات أو المدونات، عندما لا يتم حفظ النص مع الأحرف الروسية عن طريق الخطأ في نفس الترميز المستخدم في الموقع الافتراضي، أو ليس في محرر النصوص، والذي يضيف إلى الكود Sebestin غير مرئي العين المجردة. في النهاية، مثل هذا الموقف مع العديد من الترميزات والزحف باستمرار، كانت العديد من المتصابقين، وهناك متطلبات مسبقة لإنشاء تباين عالمي جديد، والذي كان من شأنه أن يحل محل كل ما هو موجود وحل، وأخيرا، إلى جذر المشكلة مع ظهور غير موجود نصوص مقروءة. بالإضافة إلى ذلك، كانت هناك مشكلة لغات الصينية المماثلة، حيث كانت رموز اللغة أكثر من 256 بكثير.

Unicode (Unicode) - الرموز العالمية UTF 8 و 16 و 32

لا يمكن وصف هذه الآلاف من علامات مجموعة اللغة في جنوب شرق آسيا في معلومات واحدة بيب واحدة تم تخصيصها لترميز شخصيات في إصدارات ASCII المتقدمة. نتيجة لذلك، تم إنشاء كونسورتيوم يسمى Unicode. (Unicode - اتحاد يونيكود) في تعاون العديد من قادة تكنولوجيا المعلومات في الصناعة (أولئك الذين ينتجون برنامجا يرمدي الحديد، الذين يخلقون خطوط) كانوا مهتمين بمظهر ترميز نص عالمي. كان الاختلاف الأول المنشور تحت رعاية اتحاد يونيكود UTF 32.وبعد الرقم في اسم الترميز يعني عدد البتات المستخدمة لتشفير رمز واحد. 32 بت هي 4 بايت من المعلومات التي ستكون هناك حاجة لترميز علامة واحدة واحدة في ترميز UTF العالمي الجديد. نتيجة لذلك، فإن الملف نفسه مع النص المشفر في الإصدار الموسع من ASCII و UTF-32 سيكون في الحالة الأخيرة سيكون له حجم (يزن) أربع مرات أكثر. إنه سيء، لكن لدينا الآن الفرصة لترميز عدد العلامات تساوي 2 إلى ثلاثين درجة الثانية بمساعدة UTF ( مليارات الشخصياتوالتي ستغطي أي قيمة حقيقية لهامش هائل). لكن العديد من البلدان التي لديها لغات المجموعة الأوروبية لها مثل هذا العدد الهائل من العلامات التي يجب استخدامها في الترميز على الإطلاق وليس هناك حاجة، عند استخدام UTF-32، لم يتلقوا زيادة بنسبة أربع مرات في وزن المستندات النصية، ونتيجة لذلك، زيادة في حركة المرور عبر الإنترنت والبيانات المخزنة الحجم. هذا كثير، ولا أحد يستطيع تحمل مثل هذه النفايات. نتيجة لتطوير يونيكود ظهر UTF-16.التي تحولت بنجاح تم اعتمادها افتراضيا كمساحة أساسية لجميع الأحرف التي نستخدمها. يستخدم اثنين بايت لتشفير علامة واحدة. دعونا نرى كيف يبدو هذا الشيء. في نظام التشغيل Windows، يمكنك تمرير على طول المسار "ابدأ" - "البرامج" - "قياسي" - "الخدمة" - "جدول الأحرف". نتيجة لذلك، يفتح جدول مع أشكال ناقلات جميعها المثبتة في خطوطك. إذا اخترت في "معلمات إضافية" مجموعة من أحرف Unicode، فيمكنك أن ترى لكل خط بشكل منفصل مجموعة كاملة من الأحرف المدرجة فيها. بالمناسبة، النقر على أي منهم، يمكنك أن ترى ذلك رمز بتنسيق UTF-16تتكون من أربعة أرقام سداسية عشرية:
كم عدد الأحرف التي يمكن ترميزها في UTF-16 باستخدام 16 بت؟ 65 536 (اثنان إلى ستة عشر)، وتم اتخاذ هذا الرقم للمساحة الأساسية في Unicode. بالإضافة إلى ذلك، هناك طرق لترميزها وحوالي مليون حرف، ولكنها تقتصر على المساحة الموسعة في مليون رموز نصية. ولكن حتى هذا الإصدار الناجح من ترميز Unicode لم يجلب الكثير من الرضا عن أولئك الذين كتبوا، على سبيل المثال، البرامج فقط باللغة الإنجليزية، لأن لديهم، بعد التبديل من الإصدار الموسع من ASCII إلى UTF-16، زاد وزن المستندات مرتين (بايت واحد لكل رمز في Aski و Baytes على نفس الرمز في UTF-16). هذا هو بالضبط لتلبية الجميع وكلها في اتحاد يونيكود تقرر. الخروج مع الترميز طول متغير. كانت تسمى UTF-8. على الرغم من الثمانية في العنوان، فإنه حقا لديه طول متغير، أي يمكن ترميز كل رمز نص في سلسلة من واحد إلى ستة بايت. في الممارسة العملية، يستخدم UTF-8 مجموعة فقط من واحد إلى أربعة بايت، لأنه لا يوجد شيء ممكن من الناحية النظرية لتقديم أي شيء إلى البايت الأربعة من التعليمات البرمجية. يتم تشفير جميع علامات اللاتينية في بايت واحدة، وكذلك في ASSII الجيدة القديمة. ما هو جدير بالملاحظة، في حالة الترميز فقط اللاتينية، حتى تلك البرامج التي لا تفهم Unicode ستظل لا تزال تقرأ ما يتم ترميزه في UTF-8. أولئك. الجزء الأساسي من Aska تبديل ببساطة إلى هذا قبالة اتحاد يونيكود. يتم ترميز علامات السيريلية في UTF-8 إلى بايتين، وعلى سبيل المثال، جورجيا - في ثلاثة بايت. اتحاد يونيكود بعد إنشاء UTF 16 و 8 حل المشكلة الرئيسية - الآن لدينا في الخطوط هناك مساحة رمز واحدوبعد والآن لا تزال الشركات المصنعة الخاصة بهم فقط على أساس قواتهم وفرصهم لملء أشكال ناقلات الرموز النصية. في جدول الرمز أدناه، يمكن ملاحظة أن الخطوط المختلفة تدعم عددا مختلفا من الأحرف. يمكن أن تزن بعض رموز الخطوط Unicode بشكل جيد للغاية. ولكن الآن لا يتميز بحقيقة أنها تم إنشاؤها للحصول على ترميزات مختلفة، ولكن بحقيقة أن الشركة المصنعة للخط تمتلئ أو غير ملء مساحة الرمز الموحد من قبل تلك أو نماذج متجه أخرى حتى النهاية.

Krakoyabry بدلا من الحروف الروسية - كيفية إصلاح

دعونا الآن نرى كيف يظهر نص Crakozyabe بدلا من النص أو، بمعنى آخر، كيفية تحديد الترميز الصحيح للنص الروسي. في الواقع، يتم تعيينه في البرنامج الذي تقوم بإنشاءه أو تحريره هذا النص نفسه، أو رمز باستخدام شظايا النص. لتحرير وإنشاء ملفات نصية، يمكنني استخدام جيد جدا، في رأيي، HTML و PHP Editor Notepad ++. ومع ذلك، يمكن أن تسليط الضوء على بناء الجملة لا تزال جيدة مئات لغات البرمجة والتمييز، وكذلك القدرة على التوسع مع الإضافات. اقرأ نظرة عامة مفصلة عن هذا البرنامج الرائع تحت الرابط. في القائمة أعلى المفكرة ++، يوجد عنصر "ترميز"، حيث سيكون لديك القدرة على تحويل خيار موجود إلى واحد يتم استخدامه في موقعك الافتراضي:
في حالة وجود موقع في جملة 1.5 وما فوق، وكذلك في حالة مدونة على WordPress، يجب عليك اختيار الخيار من أجل تجنب مظهر Krakoyar UTF 8 بدون BOMوبعد ما هي بادئة BOM؟ والحقيقة هي أنه عندما تم تطوير ترميز ETF-16، لسبب ما قررت ربط مثل هذا الشيء كقدرة على تسجيل رمز رمز، سواء في التسلسل المباشر (على سبيل المثال، 0A15) وفي العكس (150A) وبعد وبالنسبة للبرامج لفهم رموز القراءة التسلسلية، واخترع بوم. (علامة ترتيب البايت أو، بمعنى آخر، توقيع)، والتي تم التعبير عنها في إضافة ثلاثة بايت إضافية إلى بداية المستندات. في ترميز UTF-8، لم تكن هناك بوم في اتحاد يونيكود، وبالتالي إضافة توقيع (هذه الأكثر شهرة ثلاثة بايت إضافية إلى بداية المستند) بعض البرامج تمنع ببساطة قراءة التعليمات البرمجية. لذلك، نحن دائما، عند حفظ الملفات في UTF، يجب عليك تحديد خيار بدون BOM (بدون توقيع). لذلك أنت مقدما موستاس نفسك من المكبسوبعد لا يعرف ما هو جدير بالذكر، بعض البرامج في Windows لا تعرف كيفية القيام بذلك (لا تتمكن من حفظ النص في UTF-8 بدون BOM)، على سبيل المثال، نفس Windows Notoriousbook Windows. إنه يحفظ المستند في UTF-8، ولكن لا يزال يضيف توقيعا إلى بدايةه (ثلاثة بايت إضافية). علاوة على ذلك، ستكون هذه البايتات هي نفسها دائما - اقرأ الشفرة في التسلسل المباشر. ولكن على الخوادم، بسبب هذه الأشياء الصغيرة، قد تكون هناك مشكلة - سوف تخرج cringels. لذلك، في أي حال لا تستخدم نوافذ دفتر الملاحظات المعتادة لتحرير مستندات موقعك، إذا كنت لا تريد ظهور Krakoyarbra. أنا أعتبر أحدث وأسهل خيار لمحرر المفكرة ++ المذكورة بالفعل، والتي لا تحتوي على عيوب ويتألف من أحد المزايا. في المفكرة ++ عند اختيار ترميز، سيكون لديك القدرة على تحويل النص إلى ترميز UCS-2، وهو قريب جدا من معيار Unicode في جوهره. أيضا في غير من النوع يمكن ترميزها في ANSI، I.E. بالإشارة إلى اللغة الروسية، سيتم وصف هذا بالفعل من قبلنا فوق Windows 1251. من أين تأتي هذه المعلومات؟ يتم توضيحه في سجل نظام التشغيل Windows الخاص بك - والتي ترميز هي الاختيار في حالة ANSI، ما يجب اختياره في حالة OEM (للغة الروسية، سيكون CP866). إذا قمت بتثبيت لغة افتراضية أخرى على جهاز الكمبيوتر الخاص بك، فسيتم استبدال هذه الترميزات بمشابه تفريغ ANSI أو OEM بنفس اللغة. بعدك في المفكرة ++، احفظ المستند في الترميز الذي تحتاجه أو فتح مستند من الموقع للتحرير، ثم في الركن الأيمن السفلي من المحرر، يمكنك رؤية اسمه: لتجنب krakoyarbrov.بالإضافة إلى الإجراءات الموضحة أعلاه، سيكون من المفيد التسجيل في رأسه من التعليمات البرمجية المصدرية لجميع صفحات معلومات الموقع حول هذا الترميز من أجل الخادم أو المضيف المحلي لا يحدث. بشكل عام، في جميع لغات التشعبية العلامات بخلاف HTML، يتم استخدام إعلان XML خاص، والذي يحدد ترميز النص.< ? xml version= "1.0" encoding= "windows-1251" ? > قبل البدء في تفكيك الكود، سيعثر المتصفح على الإصدار المستخدم وكيف تحتاج بالضبط لتفسير رموز أحرف هذه اللغة. ولكن ما هو جدير بالملاحظة، في حال حفظ المستند في Unicode الافتراضي، يمكن حذف إعلان XML هذا (سيتم تعيين الترميز UTF-8، إذا لم يكن هناك بوم أو UTF-16 إذا كان هناك BOM). في حالة وثيقة لغة HTML لتحديد الترميز المستخدم عنصر التعريفالتي وصفها بين علامة الرأس الافتتاحية والإغلاق: < head> . . . < meta charset= "utf-8" > . . . < / head> هذا الدخول مختلف تماما عن المعتمد في المعيار في HTML 4.01، ولكن يتوافق تماما مع إدخاله حديثا ببطء مع معيار HTML 5، وسوف يكون مفهوما بشكل صحيح تماما من قبل أي متصفحات تستخدمها حاليا المستخدمة حاليا. من الناحية النظرية، سيكون عنصر التعريف مع إشارة إلى ترميز HTML للوثيقة أفضل وضعه عالية قدر الإمكان في رأس قفص الاتهامبحيث في وقت الاجتماع في نص العلامة الأولى ليست من ANSI الأساسية (التي تقرأ دائما دائما وفي أي اختلاف) يجب أن يكون للمتصفح بالفعل معلومات حول كيفية تفسير رموز هذه الأحرف. الرابط أولا

تشفير KOI8-R

ISO 8859-5 ترميز

ISO 8859-5.

الترميز البديل

"ترميز بديل" - استنادا إلى صفحة كود CP437، حيث يتم استبدال جميع الرموز الأوروبية المحددة في الشوط الثاني بالسيريلية، تاركة الأحرف الكاذبة سليمة. وبالتالي، فإن هذا لا يفسد نوع البرامج باستخدام نظام Windows، ويوفر أيضا استخدام الأحرف السيريلية فيها.

تاريخيا، كان هناك العديد من خيارات الترميز البديلة، ولكن جميع الاختلافات تتعلق فقط بمنطقة 0xF0 - 0xFF (240-255). كان المعيار النهائي هو ترميز IBM CP866، والدعم الذي تمت إضافته إلى MS-DOS الإصدار 6.22 (تم استخدام جميع أنواع الشقوق "ذاتي". التشفير البديلة لا يزال حيا وشعبيا للغاية في بيئة DOS و OS / 2 . بالإضافة إلى ذلك، يتم تسجيل هذه الترميز أسماء في نظام ملفات الدهون. لا يزال CP866 يستخدم في أنظمة الأسرة التي تعمل بنظام Windows NT Russolded.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.
8. 410. ب 411. في 412. G 413. د 414. E 415. 416. S 417. و 418. ال 419. K 41A. L 41B. م 41C. ح 41D. o 41e. ص 41F.
9. ص 420. مع 421. ر 422. 423. F 424. × 425. ج 426. ح 427. ث 428. شح 429. Kommersant 42A. 42b. ب 42C. E 42D. يو 42e. أنا 42F.
أ. 430. ب 431. في 432. G 433. د 434. E 435. 2036. S 437. و 438. ال 439. إلى 43A. l 43b. م 43C. ح 43D. حوالي 43e. ص 43F.
ب. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255D. ╜ 255C. ╛ 255B. ┐ 2510
جيم └ 2514 ┴ 2534. ┬ 252C. ├ 251C. ─ 2500 ┼ 253C. ╞ 255E. ╟ 255F. ╚ 255A. ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256C. ╧ 2567
د. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256B. ╪ 256A. ┘ 2518 ┌ 250C. █ 2588 ▄ 2584 ▌ 258C. ▐ 2590 ▀ 2580
هيا ص 440. من 441. ر 442. في 443. F 444. × 445. ج 446. ح 447. SH 448. شح 449. Kommersant 44A. S 44B. ب 44C. E4D. يو 44e. أنا 44f.
F. E 301. 451. є 404. є 454. ї 407. ї 457. ў 40E. ў 45E. ° B0. ∙ 2219 B7. 221a. № 2116 ¤ A4. ■ 25A0. A0.

لذلك 8859-5. - ترميز 8 بت من سلسلة ISO-8859 لتسجيل السيريلية. في روسيا لا يستخدم تقريبا. بشكل عام، ISO 8859-5 ليس ترميز مريح للغاية، لأنه ليس لديه العديد من الأحرف الضرورية، مثل اندفاعة (-)، شجرة الاختناق ("")، الدرجات (°)، إلخ.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.
8. 80 81 82 83 84 85 86 87 88 89 8A. 8B. 8C. 8D. 8E. 8F.
9. 90 91 92 93 94 95 96 97 98 99 9A. 9 ب. 9C. 9D. 9E. 9F.
أ. A0. E 301. 402 يورو. ѓ 403. є 404. 405. 406. ї 407. ј 408. љ 409. њ 40A. ћ 40B. ќ 40C. ميلادي ў 40E. џ 40F.
ب. 410. ب 411. في 412. G 413. د 414. E 415. 416. S 417. و 418. ال 419. K 41A. L 41B. م 41C. ح 41D. o 41e. ص 41F.
جيم ص 420. مع 421. ر 422. 423. F 424. × 425. ج 426. ح 427. ث 428. شح 429. Kommersant 42A. 42b. ب 42C. E 42D. يو 42e. أنا 42F.
د. 430. ب 431. في 432. G 433. د 434. E 435. 2036. S 437. و 438. ال 439. إلى 43A. l 43b. م 43C. ح 43D. حوالي 43e. ص 43F.
هيا ص 440. من 441. ر 442. في 443. F 444. × 445. ج 446. ح 447. SH 448. شح 449. Kommersant 44A. S 44B. ب 44C. E4D. يو 44e. أنا 44f.
F. № 2116 451. 452. ѓ 453. є 454. ѕ 455. 456. ї 457. ј 458. љ 459. њ 45a. ћ 45B. ќ 45C. · A7. ў 45E. џ 45F.

KOI-8 (رمز تبادل المعلومات، 8 بت)، KOI8 - معيار ترميز رمز ثمانية بت في علوم الكمبيوتر. مصممة لترميز الحروف الحروف الهجائية السيريلية. هناك أيضا إصدار سبعة بت من إصدار الترميز - KOI-7. يتم وصف KOI-7 و KOI-8 في GOST 19768-74 (الآن غير صالح).

وضع مطورو KOI-8 رموز الأبجدية الروسية في الجزء العلوي من جدول ASCII الموسع بطريقة يمكن أن تتوافق مواقف الشخصيات السيريلية مع نظائرها الصوتية في الأبجدية الإنجليزية في أسفل الجدول. هذا يعني أنه إذا كان في النص مكتوبا في KOI-8، لإزالة القليل الثامن من كل رمز، فسيظهر نص "قابل للقراءة"، على الرغم من أنه يتم كتابته بواسطة رموز اللاتينية. على سبيل المثال، تتحول عبارة "النص الروسي" إلى "Russkij Tekst". كأثر جانبي، تحولت رموز السيريلية لترتيبها بالترتيب الأبجدي.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.
8. ─ 2500 │ 2502 ┌ 250C. ┐ 2510 └ 2514 ┘ 2518 ├ 251C. ┤ 2524 ┬ 252C. ┴ 2534. ┼ 253C. ▀ 2580 ▄ 2584 █ 2588 ▌ 258C. ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0. ∙ 2219 221a. ≈ 2248 ≤ 2264 ≥ 2265 A0. ⌡ 2321 ° B0. ² B2. B7. ÷ F7.
أ. ═ 2550 ║ 2551 ╒ 2552 451. ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255A. ╛ 255B. ╜ 255C. ╝ 255D. ╞ 255E.
ب. ╟ 255F. ╠ 2560 ╡ 2561 E 301. ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256A. ╫ 256B. ╬ 256C. © A9.
جيم يو 44e. 430. ب 431. ج 446. د 434. E 435. F 444. G 433. × 445. و 438. ال 439. إلى 43A. l 43b. م 43C. ح 43D. حوالي 43e.
د. ص 43F. أنا 44f. ص 440. من 441. ر 442. في 443. 2036. في 432. ب 44C. S 44B. S 437. SH 448. E4D. شح 449. ح 447. Kommersant 44A.
هيا يو 42e. 410. ب 411. ج 426. د 414. E 415. F 424. G 413. × 425. و 418. ال 419. K 41A. L 41B. م 41C. ح 41D. o 41e.
F. ص 41F. أنا 42F. ص 420. مع 421. ر 422. 423. 416. في 412. ب 42C. 42b. S 417. ث 428. E 42D. شح 429. ح 427. Kommersant 42A.

تشفير KOI8-U (الأوكرانية)

أصبح KOI-8 أول ترميز موحد روسي على شبكة الإنترنت.

وافق IETF عدة RFCs وفقا لخيارات ترميز KOI-8:

  • RFC 1489 - KOI8-R (خطابات الأبجدية الروسية)؛
  • RFC 2319 - KOI8-U (خطابات الأبجدية الأوكرانية)؛
  • RFC 1345 - ISO-IR-111 (مع وجود خطأ في تحديد النطاق الرئيسي).

في الجداول المذكورة أعلاه، يتم الإشارة إلى الأرقام من قبل رمز سداسي عشري الرسالة في Unicode.

تشفير KOI8-R (الروسية)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

8.

2500

2502

250C.

2510

2514

2518

251C.

2524

252C.

2534

253C.

2580

2584

2588

258C.

2590

9.

2591

2592

2593

2320

25A0.

2219

221 أ.

2248

2264

2265

A0.

2321
°
B0.
²
B2.
·
B7.
÷
F7.

أ.

2550

2551

2552
هيا
451

2553

2554

2555

2556

2557

2558

2559

255 أ.

255b.

255C.

255d.

255E.

ب.

255f.

2560

2561
هيا
401

2562

2563

2564

2565

2566

2567

2568

2569

256A.

256 ب.

256C.
©
A9.

جيم
يو
44e.
لكن
430
ب.
431
جيم
446
د.
434
هيا
435
f.
444
g.
433
حاء
445
و
438
ج.
439
ل
43 أ.
ل.
43b.
م.
43C.
ن.
43D.
حول
43e.

د.
p
43f.
أنا
44f.
رديئة
440
من عند
441
t.
442
د
443
ج.
436
في
432
ب
44C.
س
44b.
z.
437
ش
448
هيا
44d.
ش
449
جيم
447
kommersant.
44 أ.

هيا
يو
42E.
لكن
410
ب.
411
جيم
426
د.
414
هيا
415
F.
424
G.
413
حاء
425
و
418
ج.
419
ل
41 أ.
ل.
41b.
م.
41C.
ن.
41D.
حول
41e.

F.
P
41F.
أنا
42F.
رديئة
420
من عند
421
T.
422
د
423
ج.
416
في
412
ب
42C.
س
42b.
z.
417
ش
428
هيا
42D.
ش
429
جيم
427
kommersant.
42A.

خيارات أخرى

لا يتم عرض خطوط الطاولة فقط، لأن كل شيء آخر يتزامن.

تشفير KOI8-U (الروسية الأوكرانية)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

أ.

2550

2551

2552
هيا
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 أ.

255b.
ґ
491

255d.

255E.

ب.

255f.

2560

2561
هيا
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A.
Ґ
490

256C.
©
A9.

تشفير KOI8-RU (الروسية-البيلوروسكو-الأوكرانية)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

أ.

2550

2551

2552
هيا
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 أ.

255b.
ґ
491
ў
45e.

255E.

ب.

255f.

2560

2561
هيا
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256A.
Ґ
490
Ў
40e.
©
A9.

تشفير KOI8-C (آسيا الوسطى)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.
8. ғ
493
җ
497
қ
49B.
ҝ
49D.
ң
4A3.
ү
4AF.
ұ
4B1.
ҳ
4b3.
ҷ
4b7.
ҹ
4b9.
һ
4bb.

2580
ә
4d9.
ӣ
4E3.
ө
4E9.
ӯ
4EF.
9. Ғ
492
Җ
496
Қ
49a.
Ҝ
49C.
Ң
4A2.
Ү
4A.
Ұ
4b0.
Ҳ
4b2.
Ҷ
4b6.
Ҹ
4b8.
Һ
4BA.

2321
Ә
4d8.
Ӣ
4E2.
Ө
4E8.
Ӯ
4ee.
أ.
A0.
ђ
452
ѓ
453
هيا
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45a.
ћ
45b.
ќ
45C.
ґ
491
ў
45e.
џ
45f.
ب.
2116
Ђ
402
Ѓ
403
هيا
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40A.
Ћ
40b.
Ќ
40C.
Ґ
490
Ў
40E.
Џ
40f.

تشفير KOI8-T (طاجيك)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.
8. қ
49B.
ғ
493

201A.
Ғ
492

201E.

2026

2020

2021

2030
ҳ
4b3.

2039
Ҳ
4b2.
ҷ
4b7.
Ҷ
4b6.
9. Қ
49a.

2018

2019

201C.

201D.

2022

2013
-
2014

2122

203A.
أ. ӯ
4EF.
Ӯ
4ee.
هيا
451
¤
A4.
ӣ
4E3.
¦
A6.
§
A7.
«
من
¬
مات
­
ميلادي
®
أخر
ب. °
B0.
±
B1.
²
B2.
هيا
401
Ӣ
4E2.

B6.
·
B7.

2116
»
BB.
©
A9.

KOI8-O، ترميز KOI8-S (Slavic، الإملاء القديم)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

8.
Ђ
0402
Ѓ
0403
¸
00b8.
ѓ
0453

201E.

2026

2020
§
00A7.

20ac.
¨
00A8.
Љ
0409

2039
Њ
040A.
Ќ
040C.
Ћ
040b.
Џ
040F.

9.
ђ
0452

2018

2019

201C.

201D.

2022

2013

2014
£
00A3.
·
00b7.
љ
0459

203A.
њ
045A.
ќ
045C.
ћ
045b.
џ
045F.

أ.

00A0.
ѵ
0475
ѣ
0463
هيا
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00ae.

2122
«
00ab.
ѳ
0473
ґ
0491
ў
045E.
´
00b4.

ب.
°
00b0.
Ѵ
0474
Ѣ
0462
هيا
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2.
»
00bb.
Ѳ
0472
Ґ
0490
Ў
040E.
©
00a9.

ISO-IR-111، ترميز KOI8-E

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

أ.

00A0.
ђ
0452
ѓ
0453
هيا
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A.
ћ
045b.
ќ
045C.
­
00ad.
ў
045E.
џ
045F.

ب.

2116
Ђ
0402
Ѓ
0403
هيا
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A.
Ћ
040b.
Ќ
040C.
¤
00A4.
Ў
040E.
Џ
040F.

COOI8-Unified Coding، KOI8-F

يتم اقتراح ترميز KOI8 الموحد (KOI8-F) بواسطة برامج الإصبع.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .a.a. .نسخة. .د. .e.e. .F.

8.

2500

2502

250C.

2510

2514

2518

251C.

2524

252C.

2534

253C.

2580

2584

2588

258C.

2590

9.

2591

2018

2019

201C.

201D.

2022

2013

2014
©
00a9.

2122

00A0.
»
00bb.
®
00ae.
«
00ab.
·
00b7.
¤
00A4.

أ.

00A0.
ђ
0452
ѓ
0453
هيا
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045A.
ћ
045b.
ќ
045C.
ґ
0491
ў
045E.
џ
045F.

ب.

2116
Ђ
0402
Ѓ
0403
هيا
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040A.
Ћ
040b.
Ќ
040C.
Ґ
0490
Ў
040E.
Џ
040F.

خيارات لغير المدخنين KOI-8

في بعض البلدان، تم إنشاء CMEAS بواسطة تعديلات KOI-8 لخيارات Lattics الوطنية. كانت الفكرة الأساسية هي نفسها - مع "قطع" القليل الثامن، يجب أن يظل النص أكثر أو أقل مفهومة.

- حسنا، ابدأ! - قال دوولوكه.
"حسنا"، قال بيير، لا يزال يبتسم. - لقد خائفة. كان من الواضح أن القضية، التي بدأت بسهولة، لم يعد من الممكن منعها أنه كان يحدث، بالفعل بغض النظر عن إرادة الناس، ويجب القيام به. جاء دينيسوف لأول مرة إلى الجدار ومعلن:
- نظرا لأن P "Svatstniki رفض" لهم "، ما إذا كان من الممكن البدء: أخذ البنادق ووفقا لكلمة T" وابدأ في الإقليق.
"ز ..." AZ! اثنان! T "و!" دنيسف صاح بغضب وانتقل إلى الجانب. ذهب كلاهما على المسارات الواقعة أقرب وأقرب، في الضباب تعترف ببعضها البعض. كان لدى المعارضين الحق، والاستخراج إلى الجدار، واطلاق النار عندما يريد شخص ما. كان شيلوخ بطيئا، دون رفع البندقية، والبناء بعيونه الزاهية والسقرة في مواجهة خصمها. فمه، كما هو الحال دائما، كان ابتسامة مثل.
- لذلك عندما أريد - أستطيع أن أطلق النار! - قال بيير، بكلمة ثلاث خطوات سريعة ذهب إلى الأمام، المواجهة من الممشى التروتاني والمشي على الثلج بأكمله. أمسك بيير بندقية، وتمتد يده اليمنى، على ما يبدو خائفا من المسدس لعدم قتل نفسه. يمتلك بجد يده اليسرى، لأنه يريد دعم يدها اليمنى، وعرف أنه كان مستحيلا. بعد خطوات ستة ستة وتزولها من المسار في الثلج، نظر بيير إلى قدميه، نظرت مرة أخرى إلى Dolokhov مرة أخرى، وسحب إصبعه، كما تم تدريسه، بالرصاص. لا أتوقع مثل هذا الصوت القوي، ابتسم بيير من رصيفه، ثم ابتسم نفسه انطباعه وتوقف. دخان، سماكة سائما من الضباب، منعه لرؤيته في اللحظة الأولى؛ لكن لقطة أخرى كان ينتظرها، لم يتبع. سمعت فقط خطوات دولوهوف السريعة، ويبدو رقمه بسبب الدخان. بيد واحدة أبقى وراء الجانب الأيسر، والآخر مضغوط مسدس حذف. وجهه كان شاحب. ركض روستوف وأخبره شيء ما.
وقال سولوكوف من خلال أسنانه "الأمر كذلك ..."، قال سولوكوف من خلال أسنانه "لا،"، وجعل بعض السقوط، مما يجعل خطوات صابر، سقط على الثلج بجانبها. كانت يده اليسرى في الدم، ويخطئها عن sutuk وانحلى بها. كان وجهه شاحب، عبوس وارتعد.
"سأكتب ..." بدأت في المشاركة، لكنه لم يستطع أن يقول على الفور ... "من فضلك، وافق على الجهود". بيير، بالكاد يحمل تنهد، وجرى إلى دولوهوف، وأراد أن يذهب من خلال الفضاء يفصل الحواجز، كما صرخ شاهوف: - إلى الجدار! - وعلى بيير، الذي أدرك ما هو الأمر، توقف عند صابره. 10 خطوات فقط تقاسمها. أسقط شيلوكهوف رأسه إلى الثلج، عض على الثلج الجشع، رفع رأسه مرة أخرى، واسترداده، والتقطت ساقيه وجلست، وتبحث عن مركز جيد من الثقل. ابتلع الثلج البارد وامتصه؛ ارتعد شفتيه، لكن كل شيء يبتسم؛ تتلمع العيون بذل جهد ورحم آخر القوى التي تم جمعها. رفع البندقية وبدأت في الهدف.
وقال نيسفيتسكي: "الجانب، عن قرب البندقية".
- 3AK "أنا! - دون معلقة، حتى دنيسف صاح خصمه.
بيير مع ابتسامة الوديقة من الأسف والتوبة، وضع ساقيه ويديه بلا حول ولا قوة، مستقيم مع ثدييها الواسعة التي وقفت قبل دولوكهوف ونظرت إليه للأسف. نزل دنيسوف ورستوف ونسفيتسكي. في الوقت نفسه، سمعوا النار والشر صرخة ديولولوجوف.
- بواسطة! - صاح من قبل شاهوف ووضع عكسي على وجه الثلج. أمسك بيير رأسه، وانتقل إلى الغابة، والمشي بالكامل في الثلج وحكم على بصوت عال كلمات غير معروفة:
- غبي غبي! الموت ... خطأ ... - قال إنه يطلق النار. أوقفه Nesvitsky وأخذ منزله.
روستوف مع دينيسوف كان محظوظا من قبل الجرحى Dolokhov.
تشيلوكهوف، بصمت، مع عيون مغلقة، وضعت في مزلقة ولم ترد على الأسئلة التي فعلها؛ ولكن، بعد أن دخلت في موسكو، استيقظ فجأة، وبمزيد من رفع رأسه، أخذ روستوف الذي كان يجلس بيده. ضرب روستوف تغيرت تماما وتعبيرا متحمسا بشكل غير متوقع عن وجه Dolologov.
- نحن سوف؟ ما هو شعورك؟ - سأل روستوف.
- Splly! ولكن ليس النقطة. صديقي "، قال صوت شارد إلى الصوت المتقطع، - أين نحن؟ نحن في موسكو، وأنا أعلم. أنا لا شيء، لكنني قتلت لها، قتل ... إنها لن تأخذها. انها لن تحدث ...
- منظمة الصحة العالمية؟ - سأل روستوف.
- امى. أمي، ملاكي، ملاك بلدي رائعتين، والدة، و Solohov، بكيت، ضعي يد روستوف. عندما هدأ إلى حد ما، أوضح روستوف، الذي يعيش مع والدته، إذا كانت الأم ترىه يموت، فلن تأخذ ذلك. توسل روستوف للذهاب إليها وإعدادها.
أذهب روستوف إلى الوفاء بالترتيب، وتعلم مفاجأة كبيرة بأنها تعلمت أن هذا الشرج، الذي عاش هذا المشاغل من سولوهوف في موسكو مع المرأة العجوز والأخت المتفوقة، وكان الابن الأكثر لطيفا والأخ.

نادرا ما رأى بيير مؤخرا زوجته بعينين على العينين. وفي سانت بطرسبرغ، وفي موسكو، كان منزلهم مليئا باستمرار بالضيوف. في الليلة القادمة بعد مبارزة، كما فعل في كثير من الأحيان، لم يذهب إلى غرفة النوم، ولكن ظلت في مكتبه الوضائي، في مكتب الأب الأبوي، في تلك التي توفي فيها عدد المتسول.
واجه الأريكة وأراد أن تغفو، من أجل أن تنسى كل ما كان عليه، لكنه لم يستطع القيام بذلك. مثل هذه العاصفة من المشاعر والأفكار، ارتفعت الذكريات فجأة في روحه أنه لا يستطيع النوم فقط، لكنه لم يستطع الجلوس على الفور ويجب أن يقفز من الأريكة والسير في جميع أنحاء الغرفة بخطوات سريعة. تم تقديمه له في البداية بعد الزواج، مع الكتفين المفتوحين والمظهر المتعبين والعاطفي، وعلى الفور بجانبها يبدو جميلا وقحلا وسخرية بحزم من Dolokhov، وكيف كان في العشاء، والوجه نفسه dolologov، شاحب، يرتجف والمعاناة كيف كان عندما تحول وسقط على الثلج.
"ماذا كان هناك؟ - سأل نفسه. - قتلت الحبيب، نعم، قتل حبيب زوجته. نعم لقد كان هذا. من ماذا؟ كيف جئت إلى هذا؟ - لأنك تزوجت منها، - أجاب الصوت الداخلي.
"لكن ما أنا مذنب؟ سأل. - في حقيقة أنك متزوج لست من قبل حبها، في حقيقة أنك خدعت نفسك ولها، وتم جمعها في تلك اللحظة بعد العشاء في الأمير فاسيلا، عندما قال إن هذه الكلمات لا يمكن أن يسمى: "جي من الخبرة Aime ". [أنا أحبك.] كل شيء من هذا! لقد شعرت بذلك، فكر، لقد شعرت بذلك أنه لم يكن ما لم يكن لدي أي حقوق في ذلك. لذلك خرج ". لقد تذكر شهر العسل، وحجب الذكريات. على وجه الخصوص، ذكريات كيف يوم واحد، بعد فترة وجيزة من زواجه، كان على بعد 12 مترا من اليوم، في معطف الحرير جاء من غرفة النوم إلى المكتب، ووجد رأس رئيس المدير، الذي تساءل بعناية، نظرت إلى وجه بيير، على حمامه وابتسم قليلا، كما لو كان من خلال التعبير عن هذه الابتسامة محترمة تعاطف سعادة مبدأه.
"وعدد المرات التي كنت فخورتها بها، كنت فخورا بجمالها العظيم، براعةها العلمانية، فكر في ذلك؛ كانت فخورة بالمنزل الذي تناولته بطرسبرغ بأكمله، فخور باتجاهه وجماله. إذن ما أنا فخور به؟! ثم اعتقدت أنني لم أفهمها. في كثير من الأحيان، أفكر في شخصيتها، قلت لنفسي أنني كنت ألقي باللوم على أنني لا أفهمها، وأنا لا أفهم هذا من أي وقت مضى، والرضا وغياب أي إدمان ورغبات، وكان التأثير كله في تلك الكلمة الرهيبة إنها امرأة مفسدة: قالت نفسي كلمة فظيعة، وأصبح كل شيء واضحا!
"سافرت أناتول إليها لأخذ المال منها وقبلها في أكتافها العارية. لم تعطيه المال، لكنها سمحت بتقبيل نفسه. الأب، يمزح، متحمس لها الغيرة؛ وقالت إنها بابتسامة مريحة، إنها ليست غبية للغاية أن تكون غيور: دعه يفعل ذلك أرادت، قالت عني. سألتها مرة واحدة، سواء كانت تشعر علامات الحمل. ضحكت بازدراء وقالت إنها لم تكن أحذية ترغب في الحصول على أطفال، وأنها لن يكون لها أطفال مني ".
ثم تذكر وقاحة ووضوح أفكارها وفعاليات التعبيرات المتأصلة فيها رغم تربيتها في أعلى دائرة أرستقراطية. "أنا لست نوعا من أحمق ... سأحاول نفسي ... أليز فومنز رائع". في كثير من الأحيان، بالنظر إلى نجاحها في عيون كبار السن والشباب والنساء، لا يمكن أن يفهم بيير لماذا لم يحبها. نعم، أنا لم أحبها أبدا، قلت لنفسي بيير؛ كنت أعرف أنها كانت امرأة مفسدة، كرر نفسه، لكنها لم تهتم أن تعترف بذلك.