كيف يتم تحديد حجم المعلومات؟ ما هي قوة الأبجدية؟ كيفية العثور على قوة الأبجدية: الصيغة. وحدات حجم الملف

الغرض من الدرس:

  1. الحصول على فكرة عن النهج الأبجدي لتحديد كمية المعلومات؛
  2. تعرف على صيغة تحديد عدد رسائل المعلومات، وكمية المعلومات في الرسائل؛
  3. تكون قادرًا على حل المشكلات لتحديد عدد رسائل المعلومات وكمية المعلومات التي تحملها الرسالة المستلمة.

خلال الفصول الدراسية

1. تحديث المعرفة:

يا رفاق، دعونا نشاهد ما نراه خارج النافذة. ماذا يمكنك أن تقول عن الطبيعة؟ (جاء الشتاء.)
- ولكن لماذا قررت أن الشتاء قد جاء؟ (الجو بارد، والثلج يتساقط.)
- ولكن لم يُكتب في أي مكان أن هذه علامات الشتاء. (لكننا نعرف ما يعنيه كل ذلك: لقد جاء الشتاء).

ولذلك يتبين أن المعرفة التي نستخرجها من الواقع المحيط هي معلومة. (شريحة 1)

تسخين.

املأ الجدول واستخدم الأسهم لإظهار التطابقات.

هل من الممكن قياس كمية المعلومات وكيفية القيام بذلك؟ (نعم)

اتضح أنه يمكن أيضًا قياس المعلومات والعثور على كميتها.

هناك طريقتان لقياس المعلومات. سنلتقي بواحد منهم اليوم. (انظر إلى التطبيق الشريحة 2)

2. دراسة مواد جديدة.

كيف يمكنك العثور على كمية المعلومات؟

لنلقي نظرة على مثال.

لدينا نص قصير مكتوب باللغة الروسية. يتكون من حروف الأبجدية الروسية والأرقام وعلامات الترقيم. للتبسيط، سنفترض أن الأحرف موجودة في النص باحتمالية متساوية.

تسمى مجموعة الأحرف المستخدمة في النص الأبجدية.

في علوم الكمبيوتر، لا تعني الأبجدية الحروف فحسب، بل تعني أيضًا الأرقام وعلامات الترقيم والأحرف الخاصة الأخرى.

الأبجدية لها حجم (العدد الكامل للأحرف)من اتصل قوة الأبجدية.مع النهج الأبجدي، يُعتقد أن كل حرف في النص له "وزن معلوماتي" معين. مع زيادة قوة الأبجدية، يزداد الوزن المعلوماتي لرموز هذه الأبجدية.

دعونا نشير إلى قوة الأبجدية بواسطة N.

لنجد العلاقة بين الوزن المعلوماتي للرمز (i) وقوة الأبجدية (N). تحتوي أصغر أبجدية على حرفين، هما "0" و"1". يتم أخذ وزن المعلومات لرمز الأبجدية الثنائية كوحدة معلومات ويسمى 1 بت. (انظر المرفق الشريحة 3)

ن 2 4 8 16 32 64 128 256
أنا 1 بت 2 بت 3bit 4bit 5bit 6 بت 7 بت 8 بت

يستخدم الكمبيوتر أيضًا أبجدية خاصة به، والتي يمكن تسميتها بالكمبيوتر. عدد الحروف التي يتضمنها هو 256 حرفا. هذه هي قوة أبجدية الكمبيوتر.

وجدنا أيضًا أنه يمكن تشفير 256 حرفًا مختلفًا باستخدام 8 بتات.

8 بت هي قيمة مميزة لدرجة أنها أعطيت اسمها الخاص - بايت.

1 بايت = 8 بت

باستخدام هذه الحقيقة: يمكنك حساب كمية المعلومات الموجودة في نص الكمبيوتر بسرعة، أي في النص المكتوب باستخدام الكمبيوتر، نظرًا لأن معظم المقالات والكتب والمنشورات وما إلى ذلك يتم تخزينها على الكمبيوتر. مكتوبًا باستخدام برامج تحرير النصوص، وبهذه الطريقة يمكنك العثور على حجم المعلومات لأي رسالة تم إنشاؤها بطريقة مماثلة.

دعونا نرى قاعدة قياس المعلومات من وجهة نظر النهج الأبجدي على الشريحة. (انظر المرفق الشريحة 4)

مثال:

ابحث عن حجم المعلومات لصفحة نص الكمبيوتر.

حل:

دعونا نستخدم القاعدة.

1. أوجد القوة: N=256
2. ابحث عن حجم المعلومات لشخصية واحدة: ن = 2طأنا = 8 بت = 1 بايت.
3. ابحث عن عدد الأحرف في الصفحة. تقريبًا.

(ابحث عن عدد الأحرف في السطر واضربه في عدد الأسطر)

توضيح:

اسمح للأطفال باختيار سلسلة عشوائية وحساب عدد الأحرف فيها، مع مراعاة جميع علامات الترقيم والمسافات.

40 حرفًا * 50 سطرًا = 2000 حرفًا.

4. ابحث عن حجم المعلومات للصفحة بأكملها: 2000 * 1 = 2000 بايت

توافق على أن البايت هو وحدة صغيرة من المعلومات. لقياس كميات كبيرة من المعلومات، يتم استخدام الوحدات التالية (انظر المرفق الشريحة5)

3. توحيد المادة المدروسة.

على المكتب:

املأ الفراغات بالأرقام وتأكد من دقتها.

1 كيلو بايت = ___ بايت = ______ بت،
2 كيلو بايت = _____ بايت = ______ بت،
24576 بت =______ بايت =______ كيلو بايت،
512 كيلو بايت = ___ بايت = ____ بت.

يتم تقديم المهام للطلاب:

1) تتم كتابة الرسالة باستخدام أبجدية تحتوي على 8 أحرف. ما مقدار المعلومات التي يحملها حرف واحد من هذه الأبجدية؟

حل: N = 8، ثم i = 3 بت

2) رسالة مكتوبة بأحرف أبجدية مكونة من 128 حرف تحتوي على 30 حرف. ما مقدار المعلومات التي يحملها؟

1. ن= 128، ك=30
2. ن= 2 ط ط= 7أجزاء (حجم حرف واحد)
3. أنا = 30*7 = 210 بت (حجم الرسالة بأكملها)

4. العمل الإبداعي.

اكتب نصًا على جهاز الكمبيوتر الخاص بك يبلغ حجم معلوماته 240 بايت.

5. ملخص الدرس.

ما الجديد الذي تعلمناه في الفصل اليوم؟
- كيف يتم تحديد كمية المعلومات من الناحية الأبجدية؟
- كيف تجد قوة الأبجدية؟
- ما هو 1 بايت يساوي؟

6. الواجبات المنزلية (انظر المرفق الشريحة 6).

تعلم قاعدة قياس المعلومات من حيث المنهج الأبجدي.

التعرف على وحدات قياس المعلومات.

حل مشكلة:

1) سعة بعض الحروف الهجائية 64 حرفاً. ما هو مقدار المعلومات في النص الذي يتكون من 100 حرف؟
2) حجم معلومات الرسالة 4096 بت. يحتوي على 1024 حرفًا. ما هي قوة الأبجدية التي تتكون منها هذه الرسالة؟

والعديد من المفاهيم الأخرى لها روابط مباشرة مع بعضها البعض. عدد قليل جدًا من المستخدمين اليوم على دراية جيدة بهذه المشكلات. دعونا نحاول توضيح قوة الأبجدية وكيفية حسابها وتطبيقها عمليًا. وفي المستقبل، قد يكون هذا بلا شك مفيدًا في الممارسة العملية.

كيف يتم قياس المعلومات

قبل أن نبدأ في دراسة مسألة ما هي قوة الأبجدية، وما هي بشكل عام، يجب أن نبدأ، إذا جاز التعبير، بالأساسيات.

من المؤكد أن الجميع يعلم أن هناك اليوم أنظمة خاصة لقياس أي كميات بناءً على القيم المرجعية. على سبيل المثال، بالنسبة للمسافات والكميات المشابهة، فهي الأمتار، وللكتلة والوزن - بالكيلوجرام، وللفواصل الزمنية - الثواني، وما إلى ذلك.

ولكن كيف نقيس المعلومات من حيث حجم النص؟ وهذا هو بالضبط سبب ظهور مفهوم قوة الأبجدية.

ما هي قوة الأبجدية: مفهوم أولي

لذا، إذا اتبعنا القاعدة المقبولة عمومًا والتي تنص على أن القيمة النهائية لأي كمية هي معلمة تحدد عدد المرات التي يتم فيها تضمين الوحدة المرجعية في الكمية المقاسة، فيمكننا أن نستنتج: قوة الأبجدية هي إجمالي عدد الرموز المستخدمة للغة معينة.

ولتوضيح الأمر أكثر، دعونا نترك مسألة كيفية العثور على قوة الأبجدية جانبًا في الوقت الحالي، وننتبه إلى الرموز نفسها، بطبيعة الحال، من وجهة نظر تكنولوجيا المعلومات. بشكل تقريبي، تحتوي القائمة الكاملة للأحرف المستخدمة على أحرف وأرقام وجميع أنواع الأقواس والأحرف الخاصة وعلامات الترقيم وما إلى ذلك. ومع ذلك، إذا تناولنا مسألة قوة الأبجدية بطريقة الكمبيوتر، فيجب علينا أيضًا تضمين مسافة (فجوة واحدة بين الكلمات أو الأحرف الأخرى).

لنأخذ اللغة الروسية، أو بالأحرى، تخطيط لوحة المفاتيح، كمثال. وبناءً على ما سبق فإن القائمة الكاملة تحتوي على 33 حرفًا و10 أرقام و11 حرفًا خاصًا. وبالتالي، فإن القوة الإجمالية للأبجدية هي 54.

الوزن المعلوماتي للشخصيات

ومع ذلك، فإن المفهوم العام لقوة الأبجدية لا يحدد جوهر حوسبة أحجام المعلومات من النص الذي يحتوي على الحروف والأرقام والرموز. وهذا يتطلب نهجا خاصا.

في الأساس، فكر في الأمر، ما هو الحد الأدنى الذي يمكن تعيينه من وجهة نظر نظام الكمبيوتر، وكم عدد الأحرف التي يمكن أن يحتوي عليها؟ الجواب: اثنان. وهذا هو السبب. والحقيقة هي أن كل رمز، سواء كان حرفًا أو رقمًا، له وزن معلوماتي خاص به، والذي من خلاله تتعرف الآلة على ما هو أمامها بالضبط. لكن الكمبيوتر لا يفهم إلا التمثيل في صورة الآحاد والأصفار، وهو في الواقع ما تقوم عليه كل علوم الكمبيوتر.

وبالتالي، يمكن تمثيل أي حرف على شكل تسلسلات تحتوي على الرقمين 1 و0، أي أن الحد الأدنى للتسلسل الذي يشير إلى حرف أو رقم أو رمز يتكون من مكونين.

ويسمى وزن المعلومات نفسه، الذي يتم اعتباره وحدة قياس معلومات قياسية، بالبت (1 بت). وبناء على ذلك، فإن 8 بتات تشكل بايت واحد.

تمثيل الأحرف في الكود الثنائي

لذا، ما هي قوة الأبجدية، أعتقد أنه واضح بالفعل بعض الشيء. الآن دعونا نلقي نظرة على جانب آخر، ولا سيما التمثيل العملي للقوة باستخدام كمثال، للتبسيط، لنأخذ أبجدية تحتوي على 4 أحرف فقط.

في الكود الثنائي المكون من رقمين، يمكن وصف التسلسل وتمثيل المعلومات الخاصة به على النحو التالي:

رقم سري

الرمز الثنائي

ومن هنا أبسط استنتاج: مع قوة الأبجدية N = 4، يكون وزن الحرف الواحد 2 بت.

إذا استخدمنا رمزًا ثنائيًا مكونًا من ثلاثة أرقام لأبجدية مكونة من 8 أحرف على سبيل المثال، فسيكون عدد المجموعات كما يلي:

رقم سري

الرمز الثنائي

بمعنى آخر، مع قوة الأبجدية N = 8، فإن وزن رمز واحد للكود الثنائي المكون من ثلاثة أرقام سيكون مساويًا لـ 3 بتات.

الأبجدية واستخدامها في التعبير الكمبيوتر

الآن دعونا نحاول إلقاء نظرة على العلاقة التي يعبر عنها عدد الأحرف في الكود وقوة الأبجدية. الصيغة، حيث N هي القوة الأبجدية للأبجدية، وb هو عدد الأحرف في الكود الثنائي، ستبدو كما يلي:

أي 2 1 = 2، 2 2 = 4، 2 3 = 8، 2 4 = 16، إلخ. بشكل تقريبي، العدد المطلوب من أحرف الكود الثنائي نفسه هو وزن الرمز. من الناحية المعلوماتية يبدو الأمر كما يلي:

قياس حجم المعلومات

ومع ذلك، كانت هذه مجرد أمثلة بسيطة، إذا جاز التعبير، لفهم أولي لقوة الأبجدية. دعنا ننتقل إلى الممارسة.

في هذه المرحلة من تطور تكنولوجيا الكمبيوتر لكتابة النص، مع مراعاة الحروف الكبيرة والأحرف الكبيرة والسيريلية واللاتينية وعلامات الترقيم والأقواس والرموز الحسابية وما إلى ذلك. يتم استخدام 256 حرفًا. استنادا إلى حقيقة أن 256 هو 2 8، ليس من الصعب تخمين أن وزن كل حرف في مثل هذه الأبجدية هو 8، أي 8 بت أو 1 بايت.

استنادا إلى جميع المعلمات المعروفة، يمكننا بسهولة الحصول على حجم المعلومات المطلوبة لأي نص. على سبيل المثال، لدينا نص كمبيوتر يحتوي على 30 صفحة. تحتوي الصفحة الواحدة على 50 سطرًا من 60 حرفًا أو رمزًا، بما في ذلك المسافات.

وبالتالي، ستحتوي صفحة واحدة على 50 × 60 = 3000 بايت من المعلومات، وسيحتوي النص بأكمله على 3000 × 50 = 150000 بايت. كما ترون، فإن قياس النصوص الصغيرة بالبايت أمر غير مريح. ماذا عن المكتبات بأكملها؟

في هذه الحالة، من الأفضل تحويل الحجم إلى وحدات أكثر قوة - كيلو بايت، ميغا بايت، غيغابايت، إلخ. استنادًا إلى حقيقة أن 1 كيلو بايت، على سبيل المثال، يساوي 1024 بايت (2 10)، والميجابايت يساوي 2 10 كيلو بايت (1024 كيلو بايت)، فمن السهل حساب حجم النص في المعلومات والتعبير الرياضي لدينا. المثال سيكون 150000/1024 = 146، 484375 كيلو بايت أو حوالي 0.14305 ميغا بايت.

بدلا من الكلمة الختامية

بشكل عام، هذا باختصار هو كل ما يتعلق بالنظر في مسألة ما هي قوة الأبجدية. يبقى أن نضيف أنه في هذا الوصف تم استخدام نهج رياضي بحت. وغني عن القول أن الحمل الدلالي للنص لا يؤخذ بعين الاعتبار في هذه الحالة.

ولكن، إذا تعاملنا مع القضايا ذات الأهمية على وجه التحديد من موقف يمنح الشخص شيئًا ما لفهمه، فإن مجموعة من المجموعات أو تسلسلات الرموز التي لا معنى لها في هذا الصدد لن يكون لها أي حمل معلوماتي، على الرغم من أنه من وجهة نظر مفهوم المعلومات الحجم، لا يزال من الممكن حساب النتيجة.

بشكل عام، المعرفة حول قوة الأبجدية والمفاهيم ذات الصلة ليس من الصعب فهمها ويمكن تطبيقها ببساطة بمعنى الإجراءات العملية. علاوة على ذلك، يواجه أي مستخدم هذا كل يوم تقريبًا. يكفي إعطاء مثال محرر Word الشهير أو أي محرر آخر من نفس المستوى يستخدم مثل هذا النظام. لكن لا تخلط بينه وبين المفكرة العادية. هنا تكون قوة الأبجدية أقل، لأن الكتابة لا تستخدم، على سبيل المثال، الحروف الكبيرة.

حجم المعلومات للنص ووحدات قياس المعلومات


يمكن للكمبيوتر الحديث معالجة المعلومات الرقمية والنصية والرسومية والصوتية والفيديو. يتم تقديم جميع هذه الأنواع من المعلومات في الكمبيوتر بالرمز الثنائي، أي يتم استخدام حرفين فقط 0 و 1. ويرجع ذلك إلى حقيقة أنه من الملائم تمثيل المعلومات في شكل سلسلة من النبضات الكهربائية: هناك لا يوجد دافع (0)، هناك دافع (1).

عادةً ما يُطلق على هذا الترميز اسم ثنائي، ويُطلق على التسلسل المنطقي للأصفار والواحدات نفسها اسم لغة الآلة.

ما هو طول الرمز الثنائي حتى يمكن استخدامه لتشفير الأحرف الموجودة على لوحة مفاتيح الكمبيوتر؟

هكذا، وزن المعلومات لحرف واحد من الأبجدية الكافية هو 1 بايت.

لقياس كميات كبيرة من المعلومات، يتم استخدام وحدات أكبر من المعلومات:

وحدات قياس كمية المعلومات:

1 بايت = 8 بت

1 كيلو بايت = 1 كيلو بايت = 1024 بايت

1 ميجابايت = 1 ميجابايت = 1024 كيلو بايت

1 جيجا بايت = 1 جيجا بايت = 1024 جيجا بايت

حجم المعلومات من النص

1. عدد حروف الكتاب :

60 * 40 * 150 = 360.000 حرف.

2. لأن حرف واحد يزن 1 بايت، ويساوي حجم معلومات الكتاب

360.000 بايت.

3. دعنا نحول البايتات إلى وحدات أكبر:

360,000 / 1024 = 351.56 كيلو بايت

351.56 / 1024 = 0.34 ميجابايت

الإجابة: حجم معلومات النص هو 0.34 ميجابايت.

مهمة:

يبلغ حجم معلومات النص المعد باستخدام الكمبيوتر 3.5 كيلو بايت. كم عدد الأحرف التي يحتوي عليها هذا النص؟

1. لنقم بتحويل الحجم من ميغابايت إلى بايت:

3.5 ميجابايت * 1024 = 3584 كيلو بايت

3584 كيلو بايت * 1024 = 3,670,016 بايت

2. لأن حرف واحد يزن 1 بايت، وهو عدد الأحرف في النص

يتم استخدام النهج الأبجدي للقياس كمية المعلوماتفي نص يتم تقديمه كسلسلة من أحرف بعض الحروف الأبجدية. ولا يرتبط هذا النهج بمحتوى النص.يتم استدعاء كمية المعلومات في هذه الحالة حجم المعلومات في النصوالذي يتناسب مع حجم النص - عدد الأحرف التي يتكون منها النص. يُطلق على هذا النهج لقياس المعلومات أحيانًا اسم النهج الحجمي.

يحمل كل حرف في النص قدرًا معينًا من المعلومات. يسمى الوزن المعلوماتي للرمز. ولذلك، فإن حجم المعلومات في النص يساوي مجموع أوزان المعلومات لجميع الأحرف التي يتكون منها النص.

يفترض هنا أن النص عبارة عن سلسلة متسلسلة من الأحرف المرقمة. في الصيغة (1) أنا 1 يدل على وزن المعلومات للحرف الأول من النص، أنا 2 - الوزن المعلوماتي للحرف الثاني من النص، وما إلى ذلك؛ ك- حجم النص، أي إجمالي عدد الأحرف في النص.

جميع الرموز المختلفة المستخدمة لكتابة النصوص، مُسَمًّى الأبجدية. حجم الأبجدية هو عدد صحيح يسمى قوة الأبجدية. يجب أن يؤخذ في الاعتبار أن الأبجدية لا تتضمن فقط أحرف لغة معينة، ولكن جميع الرموز الأخرى التي يمكن استخدامها في النص: الأرقام، وعلامات الترقيم، والأقواس المختلفة، والمسافات، وما إلى ذلك.

يمكن تحديد أوزان المعلومات للرموز بطريقتين تقريبيتين:

1) افتراض احتمالية متساوية (تكرار حدوث متساوي) لأي حرف في النص؛

2) مراعاة الاحتمالات المختلفة (اختلاف تكرار حدوث) الأحرف المختلفة في النص.

تقريب الاحتمال المتساوي للأحرف في النص

إذا افترضنا أن جميع الأحرف الأبجدية في أي نص تظهر بنفس التكرار، فإن وزن المعلومات لجميع الأحرف سيكون هو نفسه. يترك ن- قوة الأبجدية. إذن كسر أي حرف في النص هو 1/ نالجزء ث من النص. حسب تعريف الاحتمال (انظر ) هذه القيمة تساوي احتمال ظهور حرف في كل موضع نص:

ص = 1/ن

وفقا لصيغة ك. شانون (انظر. "قياس المعلومات. نهج المحتوى")، يتم حساب كمية المعلومات التي يحملها الرمز على النحو التالي:

أنا = سجل2(1/ ص) = سجل2 ن(قليل) (2)

وبالتالي فإن الوزن المعلوماتي للرمز ( أنا) وقوة الأبجدية ( ن) ترتبط ببعضها البعض وفقًا لصيغة هارتلي (انظر " معلومات القياس. نهج المحتوى" )

2 أنا = ن.

معرفة الوزن المعلوماتي للحرف الواحد ( أنا) وحجم النص معبرًا عنه بعدد الأحرف ( ك)، يمكنك حساب حجم معلومات النص باستخدام الصيغة:

أنا = ك · أنا (3)

هذه الصيغة هي نسخة خاصة من الصيغة (1)، في حالة أن جميع الرموز لها نفس وزن المعلومات.

من الصيغة (2) يترتب على ذلك متى ن= 2 (أبجدية ثنائية) وزن المعلومات للحرف الواحد هو 1 بت.

من منظور المنهج الأبجدي لقياس المعلومات1 بت -هذا هو الوزن المعلوماتي لحرف من الأبجدية الثنائية.

وحدة أكبر لقياس المعلومات هي بايت.

1 بايت -هذا هو الوزن المعلوماتي لرمز من الأبجدية بقوة 256.

بما أن 256 = 2 8، فإن العلاقة بين البت والبايت تتبع صيغة هارتلي:

2 أنا = 256 = 2 8

من هنا: أنا= 8 بت = 1 بايت

لتمثيل النصوص المخزنة والمعالجة على جهاز الكمبيوتر، يتم استخدام الأبجدية بسعة 256 حرفًا في أغلب الأحيان. لذلك،
حرف واحد من هذا النص "يزن" 1 بايت.

بالإضافة إلى البت والبايت، تُستخدم أيضًا وحدات أكبر لقياس المعلومات:

1 كيلو بايت (كيلوبايت) = 210 بايت = 1024 بايت،

1 ميجا بايت (ميجابايت) = 2 10 كيلو بايت = 1024 كيلو بايت،

1 جيجابايت (جيجابايت) = 2 10 ميجابايت = 1024 ميجابايت.

تقريب الاحتمالات المختلفة لظهور الأحرف في النص

يأخذ هذا التقريب في الاعتبار أنه في النص الحقيقي تظهر أحرف مختلفة بترددات مختلفة. ويترتب على ذلك أن احتمالات ظهور أحرف مختلفة في موضع معين من النص مختلفة، وبالتالي تختلف أوزان المعلومات الخاصة بها.

يوضح التحليل الإحصائي للنصوص الروسية أن تكرار ظهور الحرف "o" هو 0.09. وهذا يعني أنه مقابل كل 100 حرف، يظهر الحرف "o" في المتوسط ​​9 مرات. يشير نفس الرقم إلى احتمال ظهور الحرف "o" في موضع معين في النص: صس = 0.09. ويترتب على ذلك أن الوزن المعلوماتي للحرف "o" في النص الروسي يساوي:

أندر حرف في النصوص هو حرف "f". تردده 0.002. من هنا:

يؤدي هذا إلى نتيجة نوعية: وزن المعلومات للأحرف النادرة أكبر من وزن الحروف المتكررة.

كيف يتم حساب حجم المعلومات للنص مع مراعاة أوزان المعلومات المختلفة للأحرف الأبجدية؟ ويتم ذلك وفقا للصيغة التالية:

هنا ن- حجم (قوة) الأبجدية؛ ن ي- عدد مرات تكرار رقم الرمز يفي النص؛ اي جاي- وزن المعلومات لرقم الرمز ي.

النهج الأبجدي في دورة علوم الكمبيوتر هو أساس المدرسة

في دورة علوم الكمبيوتر في إحدى المدارس الأساسية، غالبًا ما يحدث تعريف الطلاب بالنهج الأبجدي لقياس المعلومات في سياق تمثيل الكمبيوتر للمعلومات. البيان الرئيسي يذهب مثل هذا:

يتم قياس كمية المعلومات بحجم الكود الثنائي الذي يتم تمثيل هذه المعلومات به

وبما أن أي نوع من المعلومات يتم تمثيله في ذاكرة الكمبيوتر في شكل رمز ثنائي، فإن هذا التعريف عالمي. وهي صالحة للمعلومات الرمزية والرقمية والرسومية والصوتية.

إشارة واحدة ( تسريح)يحمل الرمز الثنائي 1قليلا من المعلومات.

عند شرح طريقة قياس حجم المعلومات لنص ما في مقرر علوم الحاسب الآلي الأساسي، يتم تناول هذه المسألة من خلال تسلسل المفاهيم التالي: الأبجدية-حجم الرمز الثنائي للأحرف-حجم المعلومات في النص.

وينطلق منطق الاستدلال من أمثلة معينة للحصول على قاعدة عامة. دع الأبجدية للغة معينة تتكون من 4 أحرف فقط. دعنا نشير إليهم: , , , . يمكن تشفير هذه الرموز باستخدام أربعة رموز ثنائية مكونة من رقمين: - 00، - 01، - 10، - 11. يتم استخدام جميع المتغيرات لمواضع الرمزين هنا، وعددها هو 2 2 = 4. وبالتالي فإن الاستنتاج هو مرسومة: الوزن المعلوماتي للرمز هو من الأبجدية المكونة من 4 أحرف ويساوي بتتين.

الحالة الخاصة التالية هي أبجدية مكونة من 8 أحرف، يمكن تشفير كل حرف منها في كود ثنائي 3 بت، حيث أن عدد مواضع حرفين في مجموعات مكونة من 3 هو 2 3 = 8. وبالتالي، فإن وزن المعلومات لـ الحرف من الأبجدية المكونة من 8 أحرف هو 3 بت. إلخ.

وبالتعميم من أمثلة معينة نحصل على قاعدة عامة: الاستخدام ب-يمكن للرمز الثنائي البت ترميز أبجدية تتكون من ن = 2 ب- حرف او رمز.

مثال 1.لكتابة النص، يتم استخدام الحروف الصغيرة فقط من الأبجدية الروسية و"الفضاء" لفصل الكلمات. ما هو حجم المعلومات لنص مكون من 2000 حرف (صفحة مطبوعة واحدة)؟

حل.هناك 33 حرفًا في الأبجدية الروسية. من خلال اختصاره بحرفين (على سبيل المثال، "е" و "й") وإدخال مسافة، نحصل على عدد مناسب جدًا من الأحرف - 32. باستخدام تقريب الاحتمالية المتساوية للأحرف، نكتب صيغة هارتلي:

2أنا= 32 = 2 5

من هنا: أنا= 5 بت - الوزن المعلوماتي لكل حرف من حروف الأبجدية الروسية. إذن حجم المعلومات للنص بأكمله يساوي:

أنا= 2000 5 = 10,000 قليل

مثال 2.احسب حجم المعلومات لنص مكون من 2000 حرف، يتم تسجيله باستخدام أبجدية تمثيل الكمبيوتر للنصوص بسعة 256.

حل.في هذه الأبجدية، يبلغ وزن المعلومات لكل حرف 1 بايت (8 بت). ولذلك، فإن حجم المعلومات للنص هو 2000 بايت.

في المهام العملية حول هذا الموضوع، من المهم ممارسة مهارات الطلاب في تحويل كمية المعلومات إلى وحدات مختلفة: البت - البايت - الكيلو بايت - الميجابايت - الجيجابايت. إذا قمنا بإعادة حساب حجم المعلومات للنص من المثال 2 إلى الكيلوبايت، فسنحصل على:

2000 بايت = 2000/1024 1.9531 كيلو بايت

مثال 3.وكان حجم الرسالة، التي تحتوي على 2048 حرفاً، 1/512 ميغا بايت. ما هو حجم الأبجدية التي كتبت بها الرسالة؟

حل.لنقم بتحويل حجم معلومات الرسالة من الميجابايت إلى البتات. للقيام بذلك، اضرب هذه القيمة مرتين في 1024 (نحصل على بايت) ومرة ​​واحدة في 8:

أنا= 1/512 · 1024 · 1024 · 8 = 16,384 بت.

نظرًا لأن هذا الحجم من المعلومات يحمل 1024 حرفًا ( ل)، ثم لكل حرف هناك:

أنا = أنا/ك= 16,384/1024 = 16 بت.

ويترتب على ذلك أن حجم (قوة) الأبجدية المستخدمة هو 216 = 65.536 حرفًا.

نهج الحجم في دورات علوم الكمبيوتر في المدرسة الثانوية

من خلال دراسة علوم الكمبيوتر في الصفوف 10-11 على مستوى التعليم العام الأساسي، من الممكن ترك معرفة الطلاب بالنهج الحجمي لقياس المعلومات في نفس المستوى كما هو موضح أعلاه، أي. في سياق حجم رمز الكمبيوتر الثنائي.

عند دراسة علوم الكمبيوتر على مستوى الملف الشخصي، ينبغي النظر في النهج الحجمي من منظور رياضي أكثر عمومية، وذلك باستخدام أفكار حول تكرار الأحرف في النص والاحتمالات وارتباط الاحتمالات بأوزان المعلومات الخاصة بالأحرف.

تبين أن معرفة هذه المشكلات أمر مهم لفهم أعمق للاختلافات في استخدام التشفير الثنائي الموحد وغير الموحد (انظر. "تشفير المعلومات")، لفهم بعض تقنيات ضغط البيانات (انظر "ضغط البيانات") وخوارزميات التشفير (انظر. "التشفير" ).

مثال 4.تتكون أبجدية قبيلة MUMU من 4 أحرف فقط (A، U، M، K)، وعلامة ترقيم واحدة (نقطة) ويتم استخدام مسافة للفصل بين الكلمات. تم حساب أن الرواية الشعبية "Mumuka" تحتوي على 10000 حرف فقط، منها: الحروف A - 4000، الحروف U - 1000، الحروف M - 2000، الحروف K - 1500، النقاط - 500، المسافات - 1000. ما مقدار المعلومات التي تحتوي عليها تحتوي على كتاب؟

حل.نظرًا لأن حجم الكتاب كبير جدًا، يمكننا أن نفترض أن تكرار ظهور كل رمز أبجدي في النص المحسوب منه هو نموذجي لأي نص في لغة MUMU. لنحسب تكرار حدوث كل رمز في نص الكتاب بأكمله (أي الاحتمالية) والأوزان المعلوماتية للرموز

نحسب إجمالي كمية المعلومات في الكتاب كمجموع حاصل ضرب وزن المعلومات لكل رمز وعدد تكرارات هذا الرمز في الكتاب: