الميزات الخاصة لتكنولوجيا أولاب هي. أنظمة OLAP التحليلية. ما هو OLAP

في عام 1993 ، نشر مؤسس النهج العلائقي لبناء قواعد البيانات ، Edgar Codd وشركاؤه (Edgar Codd ، عالم الرياضيات وزميل IBM) ، مقالًا بدأته Arbor Software (اليوم هي الشركة الشهيرة Hyperion Solutions) ، بعنوان "توفير OLAP ( المعالجة التحليلية التشغيلية) لمحللي المستخدمين "، الذي يصوغ 12 ميزة لتقنية OLAP ، والتي تم استكمالها لاحقًا بستة ميزات أخرى. أصبحت هذه الأحكام هي المحتوى الرئيسي لتكنولوجيا جديدة وواعدة للغاية.

الميزات الرئيسية لتقنية OLAP (أساسي):

  • التمثيل المفاهيمي متعدد الأبعاد للبيانات ؛
  • معالجة بديهية للبيانات ؛
  • توافر البيانات وتفاصيلها ؛
  • استخراج البيانات دفعة مقابل التفسير ؛
  • نماذج تحليل OLAP ؛
  • بنية خادم العميل (يمكن الوصول إلى OLAP من سطح المكتب) ؛
  • الشفافية (شفافية الوصول إلى البيانات الخارجية) ؛
  • دعم متعدد اللاعبين.

مميزات خاصة:

  • معالجة البيانات غير الرسمية ؛
  • حفظ نتائج OLAP: إبقائها منفصلة عن البيانات الأصلية ؛
  • القضاء على القيم المفقودة ؛
  • التعامل مع القيم المفقودة.

ملامح عرض التقارير (تقرير):

  • المرونة في إنشاء التقارير ؛
  • أداء التقارير القياسية ؛
  • التكوين التلقائي للطبقة المادية لاستخراج البيانات.

إدارة الأبعاد:

  • عالمية القياسات
  • عدد غير محدود من الأبعاد ومستويات التجميع ؛
  • عدد غير محدود من العمليات بين الأبعاد.

تاريخيًا ، يشير مصطلح "OLAP" اليوم ليس فقط إلى عرض متعدد الأبعاد للبيانات من المستخدم النهائي ، ولكن أيضًا عرض متعدد الأبعاد للبيانات في قاعدة البيانات الهدف. هذا هو سبب ظهور المصطلحين المستقلين "العلائقية OLAP" (ROLAP) و "OLAP متعدد الأبعاد" (MOLAP).

خدمة OLAP هي أداة لتحليل كميات كبيرة من البيانات في الوقت الحقيقي. من خلال التفاعل مع نظام OLAP ، سيتمكن المستخدم من عرض المعلومات بمرونة والحصول على شرائح بيانات عشوائية وإجراء عمليات تحليلية للتفاصيل والتفاف والتوزيع الشامل والمقارنة في الوقت المناسب في العديد من المعلمات في وقت واحد. تتم جميع الأعمال مع نظام OLAP من حيث مجال الموضوع ويسمح لك ببناء نماذج سليمة إحصائيًا لحالة الأعمال.

برنامج OLAP هو أداة للتحليل عبر الإنترنت للبيانات الموجودة في المستودع. الميزة الرئيسية هي أن هذه الأدوات مخصصة للاستخدام ليس من قبل متخصص في مجال تكنولوجيا المعلومات ، وليس من قبل خبير إحصائي ، ولكن من قبل متخصص في مجال الإدارة التطبيقي - مدير قسم ، قسم ، إدارة وأخيرًا مدير. الأدوات مخصصة للمحلل للتواصل مع المشكلة وليس مع الكمبيوتر. في التين. يُظهر الشكل 6.14 مكعب OLAP أوليًا يسمح لك بتقييم البيانات في ثلاثة أبعاد.


يتيح لك مكعب OLAP متعدد الأبعاد ونظام الخوارزميات الرياضية المقابلة للمعالجة الإحصائية تحليل البيانات من أي تعقيد في أي فترات زمنية.

أرز. 6.14.مكعب OLAP الأولي

نظرًا لوجود آليات مرنة تحت تصرفه لمعالجة البيانات والعرض المرئي (الشكل 6.15 ، الشكل 6.16) ، ينظر المدير أولاً في البيانات من زوايا مختلفة ، والتي قد تكون مرتبطة أو غير مرتبطة بالمشكلة التي يتم حلها.

ثم يقارن مؤشرات العمل المختلفة مع بعضها البعض ، محاولًا الكشف عن العلاقات المخفية ؛ يمكن أن تنظر إلى البيانات عن كثب ، وتفصيلها ، على سبيل المثال ، عن طريق تحليلها إلى مكونات حسب الوقت ، أو حسب المنطقة ، أو حسب العميل ، أو على العكس ، تعميم عرض المعلومات بشكل أكبر لإزالة التفاصيل المشتتة للانتباه. بعد ذلك ، باستخدام وحدة التقدير الإحصائي ونمذجة المحاكاة ، يتم إنشاء عدة سيناريوهات لتطوير الأحداث ، ويتم تحديد الخيار الأكثر قبولًا منها.

أرز. 6.15.

قد يضع مدير الشركة ، على سبيل المثال ، فرضية مفادها أن انتشار نمو الأصول في مختلف فروع الشركة يعتمد على نسبة المتخصصين ذوي التعليم الفني والاقتصادي فيها. لاختبار هذه الفرضية ، يمكن للمدير الاستعلام من المستودع وعرض على الرسم البياني نسبة الفائدة لتلك الفروع التي انخفض نمو أصولها بأكثر من 10٪ في الربع الحالي مقارنة بالعام السابق ، وتلك التي زادت بأكثر من 25٪. يجب أن يكون قادرًا على استخدام اختيار بسيط من القائمة المعروضة. إذا كانت النتائج التي تم الحصول عليها تندرج بشكل ملحوظ في مجموعتين متطابقتين ، فيجب أن يصبح هذا حافزًا لمزيد من اختبار الفرضية المطروحة.

حاليًا ، تم تطوير اتجاه يسمى Dynamic Simulation بسرعة ، والذي يطبق بشكل كامل مبدأ FASMI أعلاه.

باستخدام النمذجة الديناميكية ، يبني المحلل نموذجًا لحالة عمل تتطور بمرور الوقت ، وفقًا لسيناريو معين. في الوقت نفسه ، يمكن أن تكون نتيجة مثل هذه النمذجة عدة مواقف تجارية جديدة تولد شجرة من الحلول الممكنة مع تقييم احتمالية كل منها وتوقعاتها.

أرز. 6.16. IS التحليلي لاستخراج البيانات ومعالجتها وعرضها

يوضح الجدول 6.3 الخصائص المقارنة للتحليل الثابت والديناميكي.

في سلسلة من المقالات "مقدمة إلى قواعد البيانات" ، المنشورة مؤخرًا (انظر ComputerPress # 3'2000 - 3'2001) ، ناقشنا العديد من التقنيات وأدوات البرامج المستخدمة في إنشاء أنظمة المعلومات - سطح المكتب والخادم DBMS ، أدوات تصميم البيانات ، أدوات تطوير التطبيقات ، وكذلك ذكاء الأعمال - أدوات تحليل ومعالجة البيانات على مستوى المؤسسة ، والتي أصبحت الآن أكثر شيوعًا في العالم ، بما في ذلك في بلدنا. لاحظ ، مع ذلك ، أن قضايا استخدام أدوات ذكاء الأعمال والتقنيات المستخدمة لإنشاء تطبيقات لهذه الفئة لم يتم تناولها بشكل كافٍ في الأدبيات المحلية. في سلسلة جديدة من المقالات ، سنحاول سد هذه الفجوة والتحدث عن ماهية التقنيات التي تقوم عليها هذه التطبيقات. كأمثلة على التنفيذ ، سنستخدم بشكل أساسي تقنيات OLAP من Microsoft (بشكل أساسي خدمات التحليل في Microsoft SQL Server 2000) ، لكننا نأمل أن يكون الجزء الأكبر من المواد مفيدًا لمستخدمي الأدوات الأخرى.

تم تخصيص المقالة الأولى في هذه السلسلة لأساسيات OLAP (المعالجة التحليلية عبر الإنترنت) - وهي تقنية لتحليل البيانات متعددة الأبعاد. سنغطي فيه مفاهيم مستودعات البيانات و OLAP ، ومتطلبات مخازن البيانات وأدوات OLAP ، والتنظيم المنطقي لبيانات OLAP ، والمصطلحات والمفاهيم الأساسية المستخدمة عند مناقشة التحليل متعدد الأبعاد.

ما هو مستودع البيانات

تحتوي أنظمة المعلومات على مستوى المؤسسة ، كقاعدة عامة ، على تطبيقات مصممة للتحليل المعقد متعدد المتغيرات للبيانات ، ودينامياتها ، واتجاهاتها ، وما إلى ذلك. يهدف هذا التحليل في النهاية إلى تسهيل اتخاذ القرار. غالبًا ما تسمى هذه الأنظمة بأنظمة دعم القرار.

من المستحيل اتخاذ أي قرار إداري دون الحصول على المعلومات اللازمة لذلك ، وعادة ما تكون كمية. يتطلب ذلك إنشاء مستودعات بيانات ، أي عملية جمع البيانات وتصفيتها ومعالجتها مسبقًا من أجل توفير المعلومات الناتجة للمستخدمين من أجل التحليل الإحصائي (وغالبًا ما يتم إنشاء تقارير تحليلية).

وصف رالف كيمبال ، أحد منشئي مفهوم مستودع البيانات ، مخزن البيانات بأنه "مكان يمكن للأشخاص الوصول إلى بياناتهم فيه" (انظر ، على سبيل المثال ، Ralph Kimball ، "مجموعة أدوات مستودع البيانات: تقنيات عملية لبناء مستودعات بيانات الأبعاد "، John Wiley & Sons ، 1996 و" The Data Webhouse Toolkit: Building the Web-Enabled Data Warehouse "، John Wiley & Sons ، 2000). كما صاغ المتطلبات الأساسية لمخازن البيانات:

  • دعم السرعة العالية لاسترجاع البيانات من التخزين ؛
  • الحفاظ على اتساق البيانات الداخلية ؛
  • القدرة على الحصول على ومقارنة شرائح البيانات المزعومة (الشرائح والنرد) ؛
  • توافر أدوات ملائمة لعرض البيانات في التخزين ؛
  • اكتمال وموثوقية البيانات المخزنة ؛
  • دعم عملية تجديد البيانات عالية الجودة.

غالبًا ما يكون من غير الممكن تلبية جميع المتطلبات المذكورة داخل نفس المنتج. لذلك ، من أجل تنفيذ مستودعات البيانات ، عادة ما يتم استخدام العديد من المنتجات ، بعضها وسيلة فعلية لتخزين البيانات ، والبعض الآخر وسيلة لاستخراجها وعرضها ، والبعض الآخر وسيلة لتجديدها ، وما إلى ذلك.

يميل تخزين البيانات النموذجي إلى الاختلاف عن قاعدة البيانات العلائقية النموذجية. أولاً ، تم تصميم قواعد البيانات العادية لمساعدة المستخدمين على القيام بعملهم اليومي ، بينما تم تصميم مستودعات البيانات لاتخاذ القرارات. على سبيل المثال ، تتم مبيعات البضائع والفواتير باستخدام قاعدة بيانات لمعالجة المعاملات ، ويتم تحليل ديناميكيات المبيعات على مدار عدة سنوات ، مما يسمح لك بالتخطيط للعمل مع الموردين ، باستخدام مستودع بيانات.

ثانيًا ، تخضع قواعد البيانات التقليدية للتغيير المستمر أثناء عمل المستخدمين ، ومستودع البيانات مستقر نسبيًا: عادةً ما يتم تحديث البيانات الموجودة فيه وفقًا لجدول زمني (على سبيل المثال ، أسبوعيًا أو يوميًا أو كل ساعة ، حسب الاحتياجات). من الناحية المثالية ، فإن عملية التزويد هي ببساطة إضافة بيانات جديدة على مدار فترة زمنية دون تغيير المعلومات القديمة الموجودة بالفعل في التخزين.

وثالثًا ، غالبًا ما تكون قواعد البيانات العادية مصدر البيانات التي تدخل المستودع. بالإضافة إلى ذلك ، يمكن تجديد المستودع بمصادر خارجية ، مثل التقارير الإحصائية.

ما هو OLAP

عادة ما يكون لأنظمة دعم القرار وسائل لتزويد المستخدم ببيانات مجمعة لعينات مختلفة من المجموعة الأولية في شكل مناسب للإدراك والتحليل. عادةً ما تشكل هذه الوظائف المجمعة مجموعة بيانات متعددة الأبعاد (وبالتالي غير علائقية) (غالبًا ما تسمى hypercube أو metacube) ، تحتوي محاورها على معلمات ، وتحتوي خلاياها على بيانات مجمعة تعتمد عليها. على طول كل محور ، يمكن تنظيم البيانات في تسلسل هرمي يمثل مستويات مختلفة من التفاصيل. بفضل نموذج البيانات هذا ، يمكن للمستخدمين صياغة استعلامات معقدة وإنشاء تقارير واسترداد مجموعات فرعية من البيانات.

تسمى تقنية تحليل البيانات المعقدة متعددة المتغيرات OLAP (المعالجة التحليلية عبر الإنترنت). OLAP هو عنصر أساسي في تنظيم مستودع البيانات. تم وصف مفهوم OLAP في عام 1993 من قبل Edgar Codd ، باحث قاعدة بيانات مشهور ومؤلف نموذج البيانات العلائقية (انظر EF Codd و SB Codd و CTSalley ، توفير OLAP (المعالجة التحليلية عبر الإنترنت) لمحللي المستخدم: تفويض تكنولوجيا المعلومات تقرير تقني ، 1993). في عام 1995 ، بناءً على المتطلبات التي حددتها Codd ، تمت صياغة ما يسمى باختبار التحليل السريع للمعلومات المشتركة متعددة الأبعاد (FASMI) ، والذي يتضمن المتطلبات التالية لتطبيقات التحليل متعدد المتغيرات:

  • تزويد المستخدم بنتائج التحليل في وقت معقول (لا يزيد عادة عن 5 ثوانٍ) ، حتى على حساب تحليل أقل تفصيلاً ؛
  • القدرة على إجراء أي تحليل منطقي وإحصائي نموذجي لهذا التطبيق ، وحفظه في نموذج يمكن للمستخدم النهائي الوصول إليه ؛
  • وصول متعدد المستخدمين إلى البيانات بدعم من آليات القفل المناسبة ووسائل الوصول المصرح بها ؛
  • التمثيل المفاهيمي متعدد الأبعاد للبيانات ، بما في ذلك الدعم الكامل للتسلسلات الهرمية والتسلسلات الهرمية المتعددة (هذا مطلب أساسي لـ OLAP) ؛
  • القدرة على الوصول إلى أي معلومات ضرورية ، بغض النظر عن حجمها وموقع التخزين.

تجدر الإشارة إلى أنه يمكن تنفيذ وظيفة OLAP بطرق مختلفة ، بدءًا من أبسط أدوات تحليل البيانات في التطبيقات المكتبية إلى الأنظمة التحليلية الموزعة القائمة على منتجات الخادم. ولكن قبل أن نتحدث عن التطبيقات المختلفة لهذه الوظيفة ، دعنا نلقي نظرة على ماهية مكعبات OLAP من وجهة نظر منطقية.

مكعبات متعددة الأبعاد

في هذا القسم ، سوف نلقي نظرة فاحصة على مفهوم OLAP والمكعبات متعددة الأبعاد. كمثال لقاعدة البيانات العلائقية التي سنستخدمها لتوضيح مبادئ OLAP ، سنستخدم قاعدة بيانات Northwind التي تأتي مع Microsoft SQL Server أو Microsoft Access ، وهي قاعدة بيانات نموذجية تخزن معلومات حول تجارة تاجر جملة للأغذية. تتضمن هذه البيانات معلومات حول الموردين والعملاء وشركات التوصيل وقائمة البضائع الموردة وفئاتها وبيانات عن الطلبات والسلع المطلوبة وقائمة بموظفي الشركة. يمكن العثور على وصف تفصيلي لقاعدة بيانات Northwind في أنظمة المساعدة الخاصة بـ Microsoft SQL Server أو Microsoft Access - لا نقوم بتضمينه هنا بسبب قيود المساحة.

لاستكشاف مفهوم OLAP ، سنستخدم طريقة عرض الفواتير وجداول المنتجات والفئات من قاعدة بيانات Northwind لإنشاء استعلام يقوم باسترداد تفاصيل جميع العناصر المطلوبة والفواتير الصادرة:

SELECT dbo.Invoices.Country، dbo.Invoices.City، dbo.Invoices.CustomerName، dbo.Invoices.Salesperson، dbo.Invoices.OrderDate، dbo.Categories.CategoryName، dbo.Invoices.ProductName، dbo.Invoices.ShipperName .Invoices السعر الممتد من dbo.Products INNER JOIN dbo.Categories على dbo.Products.CategoryID = dbo.Categories.CategoryID INNER JOIN dbo.Invoices ON dbo.Products.ProductID = dbo.Invoices.ProductID

في Access 2000 ، يبدو استعلام مشابه كالتالي:

حدد الفواتير ، البلد ، الفواتير.المدينة ، الفواتير.العملاء.اسم الشركة AS اسم العميل ، الفواتير ، مندوب المبيعات ، الفواتير ، تاريخ الطلب ، الفئات ، اسم الفئة ، الفواتير ، اسم المنتج ، الفواتير ، الشاحنين ، اسم الشركة ، اسم الشاحن ، الفواتير ، السعر الممتد من المنتجات عبر الإنترنت .ProductID = Products.ProductID) على Categories.CategoryID = Products.CategoryID؛

يصل هذا الاستعلام إلى طريقة عرض الفواتير ، التي تحتوي على معلومات حول جميع الفواتير الصادرة ، وجداول الفئات والمنتجات ، التي تحتوي على معلومات حول فئات المنتجات التي تم طلبها والمنتجات نفسها ، على التوالي. نتيجة لهذا الطلب ، سوف نتلقى مجموعة من بيانات الطلب ، بما في ذلك فئة العنصر المطلوب واسمه ، وتاريخ تقديم الطلب ، واسم موظف الفواتير ، والمدينة ، والبلد ، واسم الشركة الذي قدم الطلب. وكذلك اسم الشركة المسؤولة عن التوصيل.

للراحة ، دعنا نحفظ هذا الطلب كعرض ونسميه Invoices1. تظهر نتيجة الوصول إلى هذا العرض في الشكل. 1.

ما هي البيانات الإجمالية التي يمكننا الحصول عليها من هذا العرض؟ عادة ما تكون هذه إجابات لأسئلة مثل:

  • ما هي القيمة الإجمالية للطلبات المقدمة من العملاء من فرنسا؟
  • ما هي القيمة الإجمالية للطلبات المقدمة من العملاء في فرنسا والتي يتم تسليمها عن طريق سبيدي إكسبريس؟
  • ما هي القيمة الإجمالية للطلبات المقدمة من العملاء الفرنسيين في عام 1997 والتي تم تسليمها بواسطة سبيدي إكسبريس؟

دعنا نترجم هذه الأسئلة إلى استعلامات بلغة SQL (الجدول 1).

أي من الاستعلامات أعلاه سيعود برقم. إذا استبدلت "فرنسا" بـ "النمسا" أو بلد آخر في طلب البحث الأول ، فيمكنك تشغيل الاستعلام مرة أخرى والحصول على رقم مختلف. من خلال تنفيذ هذا الإجراء في جميع البلدان ، نحصل على مجموعة البيانات التالية (المقتطف موضح أدناه):

دولة سوم (السعر الممدد)
الأرجنتين 7327.3
النمسا 110788.4
بلجيكا 28491.65
البرازيل 97407.74
كندا 46190.1
الدنمارك 28392.32
فنلندا 15296.35
فرنسا 69185.48
ألمانيا 209373.6

يمكن تفسير المجموعة الناتجة من القيم الإجمالية (في هذه الحالة ، المجاميع) على أنها مجموعة بيانات أحادية البعد. يمكن الحصول على مجموعة البيانات نفسها كنتيجة لاستعلام مع عبارة GROUP BY في النموذج التالي:

حدد الدولة ، المجموع (السعر الممتد) من الفواتير 1 المجموعة حسب الدولة

الآن دعنا ننتقل إلى الاستعلامات الثانية أعلاه ، والتي تحتوي على شرطين في جملة WHERE. إذا قمنا بتنفيذ هذا الاستعلام ، واستبدلنا جميع القيم الممكنة لمعلمات Country و ShipperName فيه ، فسنحصل على مجموعة بيانات ثنائية الأبعاد من النموذج التالي (الجزء موضح أدناه):

أسم المورد
دولة الشحن الفيدرالي سريع سريع الحزمة المتحدة
الأرجنتين 1 210.30 1 816.20 5 092.60
النمسا 40 870.77 41 004.13 46 128.93
بلجيكا 11 393.30 4 717.56 17 713.99
البرازيل 16 514.56 35 398.14 55 013.08
كندا 19 598.78 5 440.42 25 157.08
الدنمارك 18 295.30 6 573.97 7 791.74
فنلندا 4 889.84 5 966.21 7 954.00
فرنسا 28 737.23 21 140.18 31 480.90
ألمانيا 53 474.88 94 847.12 81 962.58

تسمى مجموعة البيانات هذه الجدول المحوري أو الجدول المتقاطع (الجدول الترافقي). تسمح لك العديد من جداول البيانات وأنظمة DBMS لسطح المكتب بإنشاء مثل هذه الجداول - من Paradox لـ DOS إلى Microsoft Excel 2000. على سبيل المثال ، هذا هو شكل استعلام مشابه في Microsoft Access 2000:

تحويل المجموع (Invoices1.ExtendedPrice) AS SumOfExtendedPrice حدد الفواتير 1. البلد من الفواتير 1 المجموعة حسب الفواتير 1.Country PIVOT Invoices1.ShipperName؛

يمكن أيضًا الحصول على البيانات المجمعة لمثل هذا الجدول المحوري باستخدام استعلام GROUP BY العادي:

حدد البلد ، اسم الشاحن ، SUM (السعر الممتد) من الفواتير 1 المجموعة حسب البلد ، اسم الشاحن لاحظ ، مع ذلك ، أن نتيجة هذا الاستعلام لن تكون الجدول المحوري نفسه ، ولكن فقط مجموعة من البيانات المجمعة لتكوينها (الجزء موضح أدناه ):

دولة أسم المورد سوم (السعر الممدد)
الأرجنتين الشحن الفيدرالي 845.5
النمسا الشحن الفيدرالي 35696.78
بلجيكا الشحن الفيدرالي 8747.3
البرازيل الشحن الفيدرالي 13998.26

يحتوي الاستفسار الثالث من الاستعلامات أعلاه على ثلاث معلمات بالفعل في جملة WHERE. من خلال تغييرها ، نحصل على مجموعة بيانات ثلاثية الأبعاد (الشكل 2).

خلايا المكعب الموضحة في الشكل. 2 ، تحتوي على بيانات مجمعة تتوافق مع قيم معلمات الاستعلام في جملة WHERE الموجودة على محاور المكعب.

يمكنك الحصول على مجموعة من الجداول ثنائية الأبعاد عن طريق قطع مكعب بمستويات موازية لوجوهه (يُشار إليها بمصطلحات المقاطع العرضية والشرائح).

من الواضح أنه يمكن أيضًا الحصول على البيانات الموجودة في خلايا المكعب باستخدام الاستعلام المقابل مع عبارة GROUP BY. بالإضافة إلى ذلك ، تسمح لك بعض جداول البيانات (على وجه الخصوص ، Microsoft Excel 2000) أيضًا ببناء مجموعة بيانات ثلاثية الأبعاد وعرض أقسام مختلفة من المكعب ، بالتوازي مع وجهه ، على ورقة من مصنف (مصنف).

إذا احتوت جملة WHERE على أربعة معلمات أو أكثر ، فيمكن أن تكون مجموعة القيم الناتجة (تسمى أيضًا مكعب OLAP) رباعية الأبعاد وخماسية الأبعاد وما إلى ذلك.

بعد النظر في ماهية مكعبات OLAP متعددة الأبعاد ، دعنا ننتقل إلى بعض المصطلحات والمفاهيم الأساسية المستخدمة في تحليل البيانات متعددة الأبعاد.

بعض المصطلحات والمفاهيم

إلى جانب المجاميع ، يمكن أن تحتوي خلايا مكعب OLAP على نتائج تنفيذ الوظائف المجمعة الأخرى للغة SQL ، مثل MIN و MAX و AVG و COUNT وفي بعض الحالات - وغيرها (التباين والانحراف المعياري ، إلخ.). لوصف قيم البيانات في الخلايا ، يتم استخدام المصطلح ملخص (بشكل عام ، يمكن أن يكون هناك العديد منها في مكعب واحد) ، للإشارة إلى البيانات الأولية التي تم حسابها على أساسها ، ومصطلح القياس ، و تشير إلى معلمات الاستعلام ، مصطلح البعد (يُترجم إلى اللغة الروسية عادةً كـ "بُعد" عند الحديث عن مكعبات OLAP ، و "بُعد" عند الحديث عن مستودعات البيانات). تسمى القيم المرسومة على المحاور أعضاء.

عند الحديث عن الأبعاد ، تجدر الإشارة إلى أن القيم المرسومة على المحاور يمكن أن يكون لها مستويات مختلفة من التفاصيل. على سبيل المثال ، قد نكون مهتمين بالقيمة الإجمالية للطلبات المقدمة من العملاء في بلدان مختلفة ، أو القيمة الإجمالية للطلبات المقدمة من قبل العملاء غير المقيمين أو حتى العملاء الأفراد. بطبيعة الحال ، ستكون مجموعة البيانات المجمعة الناتجة في الحالتين الثانية والثالثة أكثر تفصيلاً مما كانت عليه في الأولى. لاحظ أن القدرة على الحصول على بيانات مجمعة بدرجات متفاوتة من التفصيل تتوافق مع أحد متطلبات مستودعات البيانات - متطلبات توفر شرائح البيانات المختلفة للمقارنة والتحليل.

نظرًا لأنه في المثال المدروس ، في الحالة العامة ، قد يكون لكل بلد عدة مدن ، وقد يكون للمدينة العديد من العملاء ، يمكننا التحدث عن التسلسلات الهرمية للقيم في الأبعاد. في هذه الحالة ، تقع البلدان في المستوى الأول من التسلسل الهرمي ، والمدن في المستوى الثاني ، والعملاء في المستوى الثالث (الشكل 3).

لاحظ أنه يمكن موازنة التسلسلات الهرمية ، مثل التسلسل الهرمي الموضح في الشكل. 3 ، فضلا عن التسلسلات الهرمية والوقت والتاريخ غير المتوازنة. مثال نموذجي للتسلسل الهرمي غير المتوازن هو التسلسل الهرمي "الرئيس-المرؤوس" (يمكن بناؤه ، على سبيل المثال ، باستخدام قيم حقل مندوب المبيعات في مجموعة البيانات الأصلية من المثال أعلاه) ، كما هو موضح في الشكل. 4.

في بعض الأحيان يتم استخدام مصطلح التسلسل الهرمي بين الوالدين والطفل لمثل هذه التسلسلات الهرمية.

هناك أيضًا تسلسلات هرمية وسيطة بين المتوازنة وغير المتوازنة (تسمى خشنة). عادةً ما تحتوي على أعضاء لا يكون "آباؤهم" المنطقيون على المستوى الأصلي المباشر (على سبيل المثال ، هناك مستويات البلد والمدينة والولاية في التسلسل الهرمي الجغرافي ، ولكن هناك بلدان في مجموعة البيانات ليس لديها ولايات أو مناطق بين مستوى الدولة والمدينة) ؛ شكل 5).

لاحظ أن التدرجات الهرمية غير المتوازنة و "غير المتساوية" غير معتمدة من قبل كافة أدوات OLAP. على سبيل المثال ، تدعم Microsoft Analysis Services 2000 كلا النوعين من التسلسل الهرمي ، بينما تدعم Microsoft OLAP Services 7.0 الأنواع المتوازنة فقط. يمكن أن يكون الاختلاف في أدوات OLAP المختلفة هو عدد مستويات التدرج الهرمي ، والحد الأقصى المسموح به لعدد الأعضاء في مستوى واحد ، والحد الأقصى لعدد الأبعاد الممكنة نفسها.

استنتاج

في هذه المقالة ، تعرفنا على أساسيات OLAP. تعلمنا ما يلي:

  • الغرض من مستودعات البيانات هو تزويد المستخدمين بالمعلومات اللازمة للتحليل الإحصائي واتخاذ القرارات الإدارية.
  • يجب أن توفر مستودعات البيانات سرعة عالية لاسترجاع البيانات ، والقدرة على الحصول على ومقارنة شرائح البيانات المزعومة ، فضلاً عن اتساق البيانات واكتمالها وموثوقيتها.
  • OLAP (المعالجة التحليلية عبر الإنترنت) هي عنصر أساسي في بناء مستودعات البيانات واستخدامها. تعتمد هذه التقنية على إنشاء مجموعات بيانات متعددة الأبعاد - مكعبات OLAP ، تحتوي محاورها على معلمات ، والخلايا - البيانات المجمعة بناءً عليها.
  • يجب أن تزود التطبيقات ذات وظائف OLAP المستخدم بنتائج التحليل في وقت معقول ، وإجراء التحليل المنطقي والإحصائي ، ودعم وصول المستخدمين المتعددين إلى البيانات ، وتنفيذ التمثيلات المفاهيمية متعددة الأبعاد للبيانات ، والقدرة على الوصول إلى أي معلومات مطلوبة.

بالإضافة إلى ذلك ، قمنا بفحص المبادئ الأساسية للتنظيم المنطقي لمكعبات OLAP ، وتعلمنا أيضًا المصطلحات والمفاهيم الأساسية المستخدمة في التحليل متعدد المتغيرات. أخيرًا ، اكتشفنا أنواع التدرجات الهرمية المختلفة في أبعاد مكعب OLAP.

في المقالة التالية في هذه السلسلة ، سنلقي نظرة على هيكل مستودع بيانات نموذجي ، ونتحدث عن ماهية العميل والخادم OLAP ، وسنتناول بعض الجوانب الفنية لتخزين البيانات متعددة الأبعاد.

كمبيوتر برس 4 "2001

OLAP (المعالجة التحليلية عبر الإنترنت) ليس اسم منتج معين ، ولكنه تقنية كاملة للمعالجة التحليلية عبر الإنترنت ، بما في ذلك تحليل البيانات وإعداد التقارير. يتم تزويد المستخدم بجدول متعدد الأبعاد يلخص البيانات تلقائيًا في أقسام مختلفة ويسمح لك بإدارة العمليات الحسابية وشكل التقرير بسرعة.

على الرغم من أن بعض المنشورات تشير إلى المعالجة التحليلية على أنها عبر الإنترنت وتفاعلية ، فإن صفة "عبر الإنترنت" هي أدق انعكاس لمعنى تقنية OLAP. يندرج تطوير حلول الإدارة من قبل مدير في فئة المجالات الأكثر قابلية زوراً للأتمتة. ومع ذلك ، توجد اليوم فرصة لمساعدة المدير في تطوير القرارات ، والأهم من ذلك ، الإسراع بشكل كبير في عملية تطوير القرارات واختيارها واعتمادها.

عادة ما يكون لأنظمة دعم القرار وسائل لتزويد المستخدم ببيانات مجمعة لعينات مختلفة من المجموعة الأولية في شكل مناسب للإدراك والتحليل. كقاعدة عامة ، تشكل هذه الوظائف المجمعة مجموعة بيانات متعددة الأبعاد ، غالبًا ما تسمى hypercube أو metacube ، تحتوي محاورها على معلمات ، والخلايا - البيانات المجمعة التي تعتمد عليها - ويمكن تخزين هذه البيانات في جداول علائقية ، ولكن في هذه الحالة ، نتحدث عن بيانات تنظيمية منطقية ، وليس عن التنفيذ المادي للتخزين الخاص بهم.

على طول كل محور ، يمكن تنظيم البيانات في تسلسل هرمي يمثل مستويات مختلفة من التفاصيل.

وفقًا للأبعاد الموجودة في النموذج متعدد الأبعاد ، يتم تأجيل العوامل التي تؤثر على أنشطة المؤسسة (على سبيل المثال: الوقت ، والمنتجات ، وفروع الشركة ، وما إلى ذلك). ثم يتم تعبئة مكعب OLAP الناتج بمؤشرات نشاط المؤسسة (الأسعار ، المبيعات ، الخطة ، الربح ، الحياة اليومية ، إلخ). تجدر الإشارة إلى أنه ، على عكس المكعب الهندسي ، لا يجب أن يكون لوجوه مكعب OLAP نفس الحجم. يمكن إجراء هذا الملء مع كل من البيانات الحقيقية لأنظمة التشغيل والتنبؤ بها على أساس البيانات التاريخية. يمكن أن تكون أبعاد المكعب التشعبي معقدة وهرمية ويمكن إنشاء علاقات بينهما. في عملية التحليل ، يمكن للمستخدم تغيير وجهة نظر البيانات (ما يسمى بعملية تغيير النظرة المنطقية) ، وبالتالي عرض البيانات في أقسام مختلفة وحل مشاكل محددة. يمكن إجراء عمليات مختلفة على المكعبات ، بما في ذلك التنبؤ والتخطيط الشرطي (تحليل ماذا لو).

بفضل نموذج البيانات هذا ، يمكن للمستخدمين صياغة استعلامات معقدة وإنشاء تقارير واسترداد مجموعات فرعية من البيانات. تسمح لك المعالجة التحليلية التشغيلية بتبسيط وتسريع عملية التحضير واتخاذ القرار من قبل موظفي الإدارة. تخدم المعالجة التحليلية عبر الإنترنت الغرض من تحويل البيانات إلى معلومات. وهي تختلف اختلافًا جوهريًا عن عملية دعم القرار التقليدية ، والتي غالبًا ما تستند إلى النظر في التقارير المنظمة.


تشير تقنية OLAP إلى نوع التعدين وتتضمن 12 مبدأ:

1. التمثيل المفاهيمي متعدد الأبعاد... يرى المستخدم المحلل أن عالم المؤسسة متعدد الأبعاد بطبيعته ، وبالتالي ، يجب أن يكون نموذج OLAP متعدد الأبعاد في جوهره.

2. الشفافية... يجب أن تكون بنية نظام OLAP مفتوحة ، مما يسمح للمستخدم ، أينما كان ، بالتواصل مع الأداة التحليلية - العميل - مع الخادم.

3. التوفر... يجب أن يكون مستخدم محلل OLAP قادرًا على إجراء التحليل بناءً على مخطط مفاهيمي مشترك يحتوي على بيانات على مستوى المؤسسة في قاعدة بيانات علائقية ، بالإضافة إلى بيانات من قواعد البيانات القديمة وطرق الوصول المشتركة ونموذج تحليلي مشترك. يجب أن يصل نظام OLAP إلى البيانات المطلوبة فعليًا فقط ، ولا يطبق المبدأ العام لـ "قمع المطبخ" ، والذي يستلزم مدخلات غير ضرورية.

4. إنتاجية متسقة عند تطوير التقارير... مع زيادة عدد الأبعاد أو حجم قاعدة البيانات ، يجب ألا يشعر المستخدم المحلل بتدهور كبير في الأداء.

5. بنية خادم العميل... يتم احتواء معظم البيانات التي تحتاج اليوم إلى المعالجة التحليلية عبر الإنترنت على حواسيب كبيرة مع إمكانية الوصول إلى محطات عمل المستخدم عبر شبكة LAN. هذا يعني أن منتجات OLAP يجب أن تكون قادرة على العمل في بيئة خادم العميل.

6. تعدد الأبعاد العامة... يجب تطبيق كل بُعد بغض النظر عن هيكله وقدراته التشغيلية. يجب ألا تتحول هياكل البيانات الأساسية والصيغ وتنسيقات التقارير إلى أي بُعد واحد.

7. الإدارة الديناميكية للمصفوفات المتفرقة... يجب أن يتكيف التصميم المادي لأداة OLAP تمامًا مع النموذج التحليلي المحدد للإدارة المثلى للمصفوفات المتفرقة. التباين (يقاس كنسبة الخلايا الفارغة لكل ما هو ممكن) هو أحد خصائص نشر البيانات.

8. دعم متعدد اللاعبين... يجب أن توفر أداة OLAP مشاركة الاستعلام وإمكانيات التعزيز للعديد من المستخدمين المحللين مع الحفاظ على النزاهة والأمان.

9. عمليات الانتقال غير المحدودة... يمكن أن تمثل العمليات المختلفة ، بسبب طبيعتها الهرمية ، العلاقات التابعة في نموذج OLAP ، أي أنها متقاطعة. يجب ألا يتطلب تنفيذها من المستخدم المحلل إعادة تعريف هذه الحسابات والعمليات.

10. معالجة بديهية للبيانات... يجب أن تحتوي رؤية المستخدم التحليلي للأبعاد المحددة في النموذج التحليلي على جميع المعلومات الضرورية لتنفيذ الإجراءات على نموذج OLAP ، أي يجب ألا تتطلب استخدام نظام قائمة أو غيرها من عمليات واجهة المستخدم المتعددة.

11. خيارات مرنة لإعداد التقارير... يجب أن تكون أدوات إعداد التقارير عبارة عن بيانات مجمعة أو معلومات ناتجة عن نموذج البيانات في أي اتجاه محتمل. هذا يعني أن الصفوف أو الأعمدة أو صفحات التقرير يجب أن تعرض أبعادًا متعددة لنموذج OLAP في نفس الوقت مع إمكانية عرض أي مجموعة فرعية من العناصر (القيم) المضمنة في البعد وبأي ترتيب.

12. أبعاد وعدد غير محدود من مستويات التجميع... أظهر التحقيق في العدد المحتمل للأبعاد المطلوبة المطلوبة في نموذج تحليلي أنه يمكن استخدام ما يصل إلى 19 بعدًا في وقت واحد من قبل المستخدم المحلل. ومن هنا جاءت التوصية حول عدد الأبعاد التي يدعمها نظام OLAP. علاوة على ذلك ، لا ينبغي تقييد كل بُعد من الأبعاد العامة بعدد مستويات التجميع المحددة بواسطة المستخدم.

يمكن تحديد CalliGraph ، ذكاء الأعمال على أنه أنظمة OLAP المتخصصة المتوفرة حاليًا في السوق.

لحل المهام البسيطة لتحليل البيانات ، من الممكن استخدام حل الميزانية - تطبيقات Office Excel و Access من Microsoft ، والتي تحتوي على أدوات تقنية OLAP الأولية التي تسمح لك بإنشاء جداول محورية وإنشاء تقارير متنوعة على أساسها.

يرتبط مفهوم تحليل البيانات متعدد المتغيرات ارتباطًا وثيقًا بالتحليل التشغيلي ، والذي يتم تنفيذه بواسطة أنظمة OLAP.

OLAP (المعالجة التحليلية عبر الإنترنت) هي تقنية لمعالجة البيانات التحليلية عبر الإنترنت تستخدم أساليب وأدوات لجمع البيانات متعددة الأبعاد وتخزينها وتحليلها من أجل دعم عمليات صنع القرار.

الغرض الرئيسي من أنظمة OLAP هو دعم الأنشطة التحليلية والاستعلامات التعسفية (غالبًا ما تستخدم مصطلح ad-hoc) لمحللي المستخدمين. الغرض من تحليل OLAP هو اختبار الفرضيات الناشئة.

في أصول تقنية OLAP ، كان مؤسس النهج العلائقي E. Codd. في عام 1993 ، نشر مقالًا بعنوان "OLAP للمستخدمين التحليليين: ما يجب أن يكون". تحدد هذه الورقة المفاهيم الأساسية للمعالجة التحليلية عبر الإنترنت وتحدد المتطلبات الـ 12 التالية التي يجب أن تلبيها المنتجات التي تسمح بمعالجة التحليل عبر الإنترنت. توكماكوف ج. قاعدة البيانات. مفهوم قواعد البيانات ، نموذج البيانات العلائقية ، لغات SQL. ص 51

المدرجة أدناه هي قواعد 12 التي حددها Codd التي تحدد OLAP.

1. تعددية الأبعاد - يجب أن يمثل نظام OLAP على المستوى المفاهيمي البيانات في شكل نموذج متعدد الأبعاد ، مما يبسط عمليات التحليل وإدراك المعلومات.

2. الشفافية - يجب أن يخفي نظام OLAP عن المستخدم التنفيذ الحقيقي للنموذج متعدد الأبعاد ، وطريقة التنظيم ، والمصادر ، ومرافق المعالجة والتخزين.

3. التوفر - يجب أن يوفر نظام OLAP للمستخدم نموذج بيانات واحدًا متسقًا وكاملاً ، مما يوفر الوصول إلى البيانات بغض النظر عن كيفية ومكان تخزينها.

4. أداء متسق عند تطوير التقارير - يجب ألا يتدهور أداء أنظمة OLAP بشكل كبير مع زيادة عدد الأبعاد التي يتم تحليلها.

5. هيكل خادم العميل - يجب أن يكون نظام OLAP قادرًا على العمل في بيئة خادم العميل ، لأن يتم تخزين معظم البيانات التي يجب أن تخضع اليوم للمعالجة التحليلية عبر الإنترنت بطريقة موزعة. الفكرة الرئيسية هنا هي أن مكون الخادم لأداة OLAP يجب أن يكون ذكيًا بدرجة كافية ويسمح ببناء مخطط مفاهيمي عام يعتمد على تعميم وتوحيد المخططات المنطقية والمادية المختلفة لقواعد بيانات الشركة لضمان تأثير الشفافية.

6. مساواة الأبعاد - يجب أن يدعم نظام OLAP نموذجًا متعدد الأبعاد تتساوى فيه جميع الأبعاد. إذا لزم الأمر ، يمكن توفير خصائص إضافية للأبعاد الفردية ، ولكن يجب توفير هذه الإمكانية لأي بُعد.

7. الإدارة الديناميكية للمصفوفات المتفرقة - يجب أن يوفر نظام OLAP المعالجة المثلى للمصفوفات المتفرقة. يجب الحفاظ على سرعة الوصول بغض النظر عن موقع خلايا البيانات وأن تكون ثابتة للنماذج ذات الأرقام المختلفة للأبعاد ودرجات مختلفة من تباين البيانات.

8. دعم الوضع متعدد المستخدمين - يجب أن يوفر نظام OLAP القدرة على العمل مع مستخدمين متعددين مع نموذج تحليلي واحد أو إنشاء نماذج مختلفة لهم من بيانات واحدة. في هذه الحالة ، يمكن قراءة البيانات وكتابتها ، وبالتالي يجب على النظام ضمان سلامتها وأمانها.

9. عمليات متقاطعة غير محدودة - يجب أن يضمن نظام OLAP الحفاظ على العلاقات الوظيفية الموصوفة باستخدام لغة رسمية معينة بين خلايا المكعب الفائق عند إجراء أي عمليات شريحة أو تدوير أو توحيد أو تفصيل. يجب أن يقوم النظام بشكل مستقل (تلقائيًا) بتحويل العلاقات القائمة دون مطالبة المستخدم بإعادة تعريفها.

10. معالجة بديهية للبيانات - يجب أن يوفر نظام OLAP طريقة لأداء عمليات التقطيع والتناوب والدمج والتنقيب على المكعب الفائق دون أن يضطر المستخدم إلى القيام بالكثير من إجراءات الواجهة. يجب أن تحتوي القياسات المحددة في النموذج التحليلي على جميع المعلومات اللازمة لتنفيذ العمليات المذكورة أعلاه.

11. إمكانيات مرنة لتلقي التقارير - يجب أن يدعم نظام OLAP طرقًا مختلفة لتصور البيانات ، أي. يجب تقديم التقارير في أي اتجاه ممكن. يجب أن تقدم أدوات إعداد التقارير البيانات المركبة أو المعلومات الناتجة عن نموذج البيانات في أي اتجاه محتمل. هذا يعني أن الصفوف أو الأعمدة أو الصفحات يجب أن تظهر في وقت واحد من 0 إلى N أبعاد ، حيث N هو عدد الأبعاد في النموذج التحليلي بأكمله. بالإضافة إلى ذلك ، يجب أن يكون كل بُعد محتوى معروض في سجل أو عمود أو صفحة واحدة قادرًا على عرض أي مجموعة فرعية من العناصر (القيم) المضمنة في البعد ، بأي ترتيب.

12. البعد غير المحدود وعدد مستويات التجميع - أظهرت دراسة حول العدد المحتمل للأبعاد المطلوبة المطلوبة في نموذج تحليلي أنه يمكن استخدام ما يصل إلى 19 بعدًا في وقت واحد. ومن هنا جاءت التوصية القوية بأن الأداة التحليلية يمكن أن توفر في نفس الوقت ما لا يقل عن 15 قياسًا ، ويفضل 20 قياسًا. علاوة على ذلك ، لا ينبغي تقييد كل بُعد من الأبعاد العامة بعدد مستويات التجميع التحليلية التي يحددها المستخدم ومسارات التوحيد.

قواعد Codd الإضافية.

مجموعة هذه المتطلبات ، التي كانت بمثابة التعريف الفعلي لـ OLAP ، غالبًا ما تسبب شكاوى مختلفة ، على سبيل المثال ، القواعد 1 ، 2 ، 3 ، 6 هي متطلبات ، والقواعد 10 ، 11 هي رغبات غير رسمية. توكماكوف ج. قاعدة البيانات. مفهوم قواعد البيانات ، نموذج البيانات العلائقية ، لغات SQL. ص 68 وهكذا ، فإن المتطلبات الـ 12 المدرجة في Codd لا تسمح بتعريف OLAP بدقة. في عام 1995 ، أضافت Codd القواعد الست التالية إلى القائمة:

13. استخراج الدُفعات مقابل التفسير - يجب أن يوفر نظام OLAP إمكانية الوصول إلى البيانات الأصلية والخارجية على حد سواء بشكل فعال.

14. دعم جميع نماذج تحليل OLAP - يجب أن يدعم نظام OLAP جميع نماذج تحليل البيانات الأربعة المحددة بواسطة Codd: الفئوية والتفسيرية والتخمينية والنمطية.

15. معالجة البيانات غير الطبيعية - يجب أن يتكامل نظام OLAP مع مصادر البيانات غير الطبيعية. يجب ألا تؤدي تعديلات البيانات التي تم إجراؤها في بيئة OLAP إلى تغيير البيانات المخزنة في الأنظمة الخارجية الأصلية.

16. حفظ نتائج OLAP: تخزينها بشكل منفصل عن البيانات الأصلية - يجب أن يقوم نظام OLAP الذي يعمل في وضع القراءة والكتابة بحفظ النتائج بشكل منفصل بعد تعديل البيانات الأصلية. بمعنى آخر ، يتم ضمان أمان البيانات الأصلية.

17. حذف القيم المفقودة - يجب أن يتجاهل نظام OLAP ، الذي يقدم البيانات إلى المستخدم ، جميع القيم المفقودة. بمعنى آخر ، يجب أن تكون القيم المفقودة مختلفة عن القيم الصفرية.

18. معالجة القيم المفقودة - يجب أن يتجاهل نظام OLAP جميع القيم المفقودة بغض النظر عن مصدرها. هذه الميزة مرتبطة بالقاعدة السابعة عشر.

بالإضافة إلى ذلك ، قسمت Codd جميع القواعد الثمانية عشر إلى المجموعات الأربع التالية ، واصفة إياها بالميزات. تم تسمية هذه المجموعات باسم B و S و R و D.

الميزات الرئيسية (ب) تشمل القواعد التالية:

التمثيل المفاهيمي متعدد الأبعاد للبيانات (القاعدة 1) ؛

معالجة بديهية للبيانات (القاعدة 10) ؛

التوفر (القاعدة 3) ؛

استخراج الدُفعات مقابل التفسير (القاعدة 13) ؛

دعم جميع نماذج تحليل OLAP (القاعدة 14) ؛

بنية خادم العميل (القاعدة 5) ؛

الشفافية (القاعدة 2) ؛

دعم متعدد اللاعبين (القاعدة 8)

الميزات الخاصة (الميزات):

معالجة البيانات غير الطبيعية (القاعدة 15) ؛

حفظ نتائج OLAP: إبقائها منفصلة عن البيانات الأصلية (القاعدة 16) ؛

حذف القيم الناقصة (المادة 17) ؛

معالجة القيم المفقودة (القاعدة 18). ميزات التقارير (R):

المرونة في إعداد التقارير (المادة 11) ؛

أداء الإبلاغ القياسي (القاعدة 4) ؛

التكوين التلقائي للطبقة المادية (القاعدة الأصلية المعدلة 7).

التحكم في القياس (د):

عالمية القياسات (القاعدة 6) ؛

عدد غير محدود من الأبعاد ومستويات التجميع (القاعدة 12) ؛

عمليات غير محدودة بين الأبعاد (القاعدة 9).

إجراء

في الآونة الأخيرة ، تمت كتابة الكثير عن OLAP. يمكننا القول أنه كان هناك بعض الازدهار حول هذه التقنيات. صحيح أن هذه الطفرة كانت متأخرة بعض الشيء بالنسبة لنا ، لكن هذا بالطبع مرتبط بالوضع العام في البلاد.

تحتوي أنظمة المعلومات على مستوى المؤسسة ، كقاعدة عامة ، على تطبيقات مصممة للتحليل المعقد متعدد المتغيرات للبيانات ، ودينامياتها ، واتجاهاتها ، وما إلى ذلك. يهدف هذا التحليل في النهاية إلى تسهيل اتخاذ القرار. غالبًا ما تسمى هذه الأنظمة بأنظمة دعم القرار.

عادة ما يكون لأنظمة دعم القرار وسائل لتزويد المستخدم ببيانات مجمعة لعينات مختلفة من المجموعة الأولية في شكل مناسب للإدراك والتحليل. عادةً ما تشكل هذه الوظائف المجمعة مجموعة بيانات متعددة الأبعاد (وبالتالي غير علائقية) (غالبًا ما تسمى hypercube أو metacube) ، تحتوي محاورها على معلمات ، والخلايا - البيانات المجمعة التي تعتمد عليها - ويمكن لهذه البيانات يتم تخزينها في جداول علائقية ، ولكن في هذه الحالة ، نتحدث عن التنظيم المنطقي للبيانات ، وليس عن التنفيذ المادي لتخزينها). على طول كل محور ، يمكن تنظيم البيانات في تسلسل هرمي يمثل مستويات مختلفة من التفاصيل. بفضل نموذج البيانات هذا ، يمكن للمستخدمين صياغة استعلامات معقدة وإنشاء تقارير واسترداد مجموعات فرعية من البيانات.

تسمى تقنية تحليل البيانات المعقدة متعددة المتغيرات OLAP (المعالجة التحليلية عبر الإنترنت).

OLAP هو عنصر أساسي في منظمة تخزين البيانات.

تم وصف مفهوم OLAP لأول مرة في عام 1993 بواسطة Edgar Codd ، وهو باحث مشهور في قواعد البيانات ومؤلف نموذج البيانات العلائقية.إي. كود ، س. Codd و C.T. Salley ، توفير OLAP (المعالجة التحليلية عبر الإنترنت) لمحللي المستخدمين: تفويض تكنولوجيا المعلومات.تقرير تقني ، 1993).

في عام 1995 ، بناءً على المتطلبات التي حددتها Codd ، تمت صياغة ما يسمى باختبار التحليل السريع للمعلومات المشتركة متعددة الأبعاد (FASMI) ، والذي يتضمن المتطلبات التالية لتطبيقات التحليل متعدد المتغيرات:

· تزويد المستخدم بنتائج التحليل في وقت معقول (لا يزيد عادة عن 5 ثوانٍ) ، حتى على حساب تحليل أقل تفصيلاً ؛

· القدرة على إجراء أي تحليل منطقي وإحصائي نموذجي لهذا التطبيق ، وحفظه في نموذج يمكن للمستخدم النهائي الوصول إليه ؛

· وصول متعدد المستخدمين إلى البيانات بدعم من آليات القفل المناسبة ووسائل الوصول المصرح بها ؛

· التمثيل المفاهيمي متعدد الأبعاد للبيانات ، بما في ذلك الدعم الكامل للتسلسلات الهرمية والتسلسلات الهرمية المتعددة (هذا مطلب أساسي لـ OLAP) ؛

· القدرة على الوصول إلى أي معلومات ضرورية ، بغض النظر عن حجمها وموقع التخزين.

تجدر الإشارة إلى أنه يمكن تنفيذ وظيفة OLAP بطرق مختلفة ، بدءًا من أبسط أدوات تحليل البيانات في التطبيقات المكتبية إلى الأنظمة التحليلية الموزعة القائمة على منتجات الخادم.يمكن للمستخدمين بسهولة عرض البيانات في هيكل متعدد الأبعاد كما هو مطبق على احتياجاتهم الخاصة.

2. ما هو OLAP

OLAP - اختصار للمعالجة التحليلية عبر الإنترنت - ليس اسمًا لمنتج معين ، ولكن لتقنية كاملة. في اللغة الروسية ، من الأنسب الاتصال بمعالجة OLAP التحليلية عبر الإنترنت. على الرغم من أن المعالجة التحليلية في بعض المنشورات تسمى كلاً من الإنترنت والتفاعلية ، فإن الصفة "التشغيلية" هي الانعكاس الأكثر دقة لمعنى تقنية OLAP.

يندرج تطوير حلول الإدارة من قبل المدير في فئة المجالات الأكثر صعوبة في التشغيل الآلي. ومع ذلك ، توجد اليوم فرصة لمساعدة المدير في تطوير القرارات ، والأهم من ذلك ، الإسراع بشكل كبير في عملية تطوير القرارات واختيارها واعتمادها. يمكنك استخدام OLAP لهذا الغرض.

دعنا نلقي نظرة على كيفية عمل عملية تطوير الحلول عادة.

من الناحية التاريخية ، تعد حلول أتمتة الأنشطة التشغيلية هي الأكثر تطورًا. نحن نتحدث عن أنظمة معالجة بيانات المعاملات (OLTP) ، والتي تسمى ببساطة أنظمة التشغيل. توفر هذه الأنظمة تسجيل بعض الحقائق ، وقصر تخزينها وتخزينها في الأرشيف. يتم توفير أساس هذه الأنظمة من خلال أنظمة إدارة قواعد البيانات العلائقية (RDBMS). النهج التقليدي هو محاولة استخدام أنظمة التشغيل التي تم إنشاؤها بالفعل لدعم اتخاذ القرار. عادة ما يحاولون بناء نظام مطور للطلبات على النظام التشغيلي واستخدام التقارير التي تم الحصول عليها بعد التفسير المباشر لدعم القرار. يمكن إنشاء التقارير على أساس مخصص ، أي يطلب المشرف تقريرًا ، وعلى أساس منتظم ، عندما يتم إنشاء التقارير عند الوصول إلى حدث أو وقت ما. على سبيل المثال ، قد تبدو عملية دعم القرار التقليدية كما يلي: يذهب المدير إلى أخصائي قسم المعلومات ويشاركه سؤاله. يقوم أخصائي CIO بعد ذلك ببناء طلب إلى النظام التشغيلي ، ويتلقى تقريرًا إلكترونيًا ، ويفسره ، ثم يرسله إلى فريق الإدارة. بالطبع ، يوفر مثل هذا المخطط إلى حد ما دعم القرار ، لكنه يتميز بكفاءة منخفضة للغاية وعدد كبير من العيوب. يتم استخدام القليل من البيانات لدعم القرارات الحاسمة للمهمة. هناك مشاكل أخرى أيضا. هذه العملية بطيئة للغاية ، لأن عملية كتابة الطلبات وتفسير التقرير الإلكتروني تستغرق وقتًا طويلاً. يستغرق الأمر عدة أيام ، في وقت قد يحتاج فيه القائد إلى اتخاذ قرار الآن ، على الفور. إذا أخذنا في الاعتبار أن المدير ، بعد تلقي التقرير ، قد يكون مهتمًا بسؤال آخر (على سبيل المثال ، توضيح أو طلب النظر في البيانات في سياق مختلف) ، فيجب تكرار هذه الدورة البطيئة ، ومنذ عملية التحليل ستحدث بيانات أنظمة التشغيل بشكل متكرر ، حتى يتم إنفاق المزيد من الوقت. مشكلة أخرى هي مشكلة المجالات المختلفة لنشاط متخصص تكنولوجيا المعلومات والقائد ، الذي قد يفكر في فئات مختلفة ، ونتيجة لذلك ، لا يفهم كل منهما الآخر. ثم ستكون هناك حاجة إلى تكرارات تنقية إضافية ، وهذا هو الوقت مرة أخرى ، وهذا لا يكفي دائمًا. مسألة أخرى مهمة هي تعقيد التقارير لفهمها. ليس لدى المدير الوقت لاختيار الأرقام المهمة من التقرير ، خاصة أنه قد يكون هناك الكثير منها (تذكر التقارير الضخمة متعددة الصفحات التي يتم فيها استخدام عدة صفحات بالفعل ، والباقي - فقط في حالة). نلاحظ أيضًا أن أعمال الترجمة الفورية تقع غالبًا على عاتق المتخصصين في أقسام المعلومات. أي أن الاختصاصي المختص يصرف انتباهه عن العمل الروتيني وغير الفعال لرسم المخططات ، وما إلى ذلك ، والذي ، بطبيعة الحال ، لا يمكن أن يكون له تأثير إيجابي على مؤهلاته. بالإضافة إلى ذلك ، لا يخفى على أحد أن هناك أشخاصًا متمنّين في سلسلة الترجمة التفسيرية يهتمون بتشويه المعلومات الواردة عمداً.

إن أوجه القصور المذكورة أعلاه تجعل المرء يفكر في كل من الكفاءة الكلية للنظام التشغيلي والتكاليف المرتبطة بوجوده ، حيث اتضح أن تكاليف إنشاء نظام تشغيلي لا يتم تعويضها بشكل كافٍ من خلال كفاءة عمله.

في الواقع ، هذه المشاكل ليست نتيجة لسوء نوعية النظام التشغيلي أو بنيته الرديئة. تكمن جذور المشاكل في الاختلاف الأساسي بين الأنشطة التشغيلية المؤتمتة بواسطة النظام التشغيلي وأنشطة التطوير وصنع القرار. يكمن هذا الاختلاف في حقيقة أن بيانات الأنظمة التشغيلية هي مجرد سجلات لبعض الأحداث التي وقعت ، والحقائق ، ولكنها ليست بأي حال من الأحوال معلومات بالمعنى العام للكلمة. المعلومات هي التي تقلل من عدم اليقين في أي منطقة. وسيكون من الجيد جدًا أن تقلل المعلومات من عدم اليقين في مجال إعداد القرارات. سيئ السمعة E.F. Codd ، رائد تقنيات إدارة قواعد البيانات العلائقية في السبعينيات: "في حين أن أنظمة إدارة قواعد البيانات العلائقية متاحة للمستخدمين ، لم يُنظر إليها أبدًا على أنها أداة قوية لتوليف وتحليل ودمج (وظائف تسمى تحليل البيانات متعدد المتغيرات).)" . يتعلق الأمر على وجه التحديد بتوليف المعلومات ، وحول كيفية تحويل بيانات أنظمة التشغيل إلى معلومات وحتى إلى تقييمات نوعية. يتيح لك OLAP إجراء هذا التحويل.

يعتمد OLAP على فكرة نموذج بيانات متعدد الأبعاد. التفكير البشري متعدد الأبعاد من حيث التعريف. عندما يطرح الشخص أسئلة ، فإنه يفرض قيودًا ، وبالتالي صياغة أسئلة بأبعاد عديدة ، وبالتالي فإن عملية التحليل في نموذج متعدد الأبعاد قريبة جدًا من واقع التفكير البشري. وفقًا للأبعاد الموجودة في النموذج متعدد الأبعاد ، يتم تأجيل العوامل التي تؤثر على أنشطة المؤسسة (على سبيل المثال: الوقت ، والمنتجات ، وأقسام الشركة ، والجغرافيا ، وما إلى ذلك). وبالتالي ، يتم الحصول على مكعب مفرط (بالطبع ، الاسم ليس جيدًا جدًا ، نظرًا لأن المكعب يُفهم عادةً على أنه شكل ذو حواف متساوية ، وهو ، في هذه الحالة ، بعيدًا عن الحالة) ، والذي يتم ملؤه بعد ذلك بمؤشرات نشاط المنشأة (أسعار ، مبيعات ، خطة ، أرباح ، خسائر ... إلخ). يمكن إجراء هذا الملء مع كل من البيانات الحقيقية لأنظمة التشغيل والتنبؤ بها على أساس البيانات التاريخية. يمكن أن تكون أبعاد المكعب التشعبي معقدة وهرمية ويمكن إنشاء علاقات بينهما. في عملية التحليل ، يمكن للمستخدم تغيير وجهة نظر البيانات (ما يسمى بعملية تغيير العرض المنطقي) ، وبالتالي عرض البيانات في أقسام مختلفة وحل مشاكل محددة. يمكن إجراء عمليات مختلفة على المكعبات ، بما في ذلك التنبؤ والتخطيط الشرطي (تحليل ماذا لو). علاوة على ذلك ، يتم تنفيذ العمليات مرة واحدة على المكعبات ، أي منتج ، على سبيل المثال ، سينتج عن منتج hypercube ، كل خلية منها هي نتاج خلايا المكعبات المفرطة المضاعفة المقابلة. بطبيعة الحال ، من الممكن إجراء عمليات على المكعبات المفرطة بأعداد مختلفة من الأبعاد.

3. تاريخ إنشاء تقنية OLAP

فكرة معالجة البيانات على المصفوفات متعددة الأبعاد ليست جديدة. يعود تاريخه إلى عام 1962 ، عندما نشر كين إيفرسون كتابه A Programming Language (APL). تم تنفيذ أول تطبيق عملي لـ APL في أواخر الستينيات من قبل شركة IBM. APL هي لغة أنيقة للغاية ومحددة رياضيًا مع متغيرات متعددة الأبعاد وعمليات قابلة للمعالجة. كان من المفترض أن تكون أداة التحويل القوية متعددة الأبعاد الأصلية مقارنةً بلغات البرمجة العملية الأخرى.

ومع ذلك ، لم يتم استخدام الفكرة على نطاق واسع لفترة طويلة ، حيث لم يأت وقت الواجهات الرسومية وأجهزة الطباعة عالية الجودة ، وكان عرض الأحرف اليونانية يتطلب شاشات خاصة ولوحات مفاتيح وأجهزة طباعة. في وقت لاحق ، تم استخدام الكلمات الإنجليزية في بعض الأحيان لتحل محل المشغلين اليونانيين ، لكن دعاة نقاء APL أحبطوا محاولات تعميم لغتهم المفضلة. استهلك APL أيضًا موارد الماكينة. كان استخدامه باهظ الثمن في تلك الأيام. كانت البرامج بطيئة جدًا في التنفيذ ، علاوة على ذلك ، كانت التكلفة ذاتها لتشغيلها. استغرق الأمر الكثير من الذاكرة ، في ذلك الوقت مجرد مجلدات مروعة (حوالي 6 ميغا بايت).

ومع ذلك ، فإن الإحباط من هذه الأخطاء الأولية لم يقضي على الفكرة. تم استخدامه في العديد من تطبيقات الأعمال في السبعينيات والثمانينيات. العديد من هذه التطبيقات لها ميزات أنظمة المعالجة التحليلية الحديثة. على سبيل المثال ، طورت شركة IBM نظام تشغيل لـ APL يسمى VSPC ، والذي اعتبره بعض الناس بيئة مثالية للاستخدام الشخصي حتى أصبحت جداول البيانات في كل مكان.

لكن APL كان من الصعب جدًا استخدامه ، خاصة أنه في كل مرة كان هناك تناقضات بين اللغة نفسها والأجهزة التي تم إجراء محاولات لتطبيقها عليها.

في الثمانينيات ، أصبحت APL متاحة على الأجهزة الشخصية ولكنها لم تجد استخدامها في السوق. كان البديل هو برمجة تطبيقات متعددة الأبعاد باستخدام المصفوفات بلغات أخرى. كانت هذه مهمة صعبة للغاية حتى بالنسبة للمبرمجين المحترفين ، مما أجبر الجيل التالي من منتجات البرامج متعددة الأبعاد على الانتظار.

في عام 1972 ، وجدت العديد من منتجات البرامج التطبيقية متعددة الأبعاد المستخدمة سابقًا للأغراض التعليمية استخدامًا تجاريًا: Express. لا يزال في شكل معاد كتابته بالكامل حتى الآن ، لكن المفاهيم الأصلية للسبعينيات لم تعد ذات صلة. تعد Express واحدة من أكثر تقنيات OLAP شيوعًا في التسعينيات اليوم ، وستقوم Oracle (r) بدفعها إلى الأمام وإضافة ميزات جديدة.

ظهرت المزيد من المنتجات متعددة الأبعاد في الثمانينيات. في بداية العقد - منتج يسمى Stratagem ، أطلق عليه لاحقًا اسم Acumate (مملوك حاليًا لشركة Kenan Technologies) ، والذي كان لا يزال يتم الترويج له حتى أوائل التسعينيات ، ولكن اليوم ، على عكس Express ، لا يتم استخدامه عمليًا.

كان Comshare System W منتجًا متعدد الأبعاد بأسلوب مختلف. تم تقديمه في عام 1981 ، وكان أول من يقدم المزيد من تطوير التطبيقات المالية للمستخدم النهائي. لقد جلب العديد من المفاهيم التي لم يتم تكييفها بشكل جيد ، مثل القواعد غير الإجرائية تمامًا ، وعرض ملء الشاشة وتحرير البيانات متعددة الأبعاد ، وإعادة الحساب التلقائي ، وتكامل الدُفعات مع البيانات العلائقية. ومع ذلك ، كان نظام Comshare System W ثقيلًا بدرجة كافية بالنسبة للأجهزة في ذلك الوقت مقارنة بالمنتجات الأخرى ، وتم استخدامه بشكل أقل في المستقبل ، وتم بيعه بشكل أقل ، ولم يتم إجراء أي تحسينات على المنتج. على الرغم من أنه لا يزال متاحًا على UNIX اليوم ، إلا أنه ليس خادم عميل ، مما لا يزيد من عرضه في السوق التحليلي. في أواخر الثمانينيات من القرن الماضي ، أصدرت Comshare منتجًا لـ DOS ولاحقًا لنظام Windows. تم تسمية هذه المنتجات باسم Commander Prism واستخدمت نفس المفاهيم مثل System W.

منتج إبداعي آخر في أواخر الثمانينيات كان يسمى الاستعارة. كان يستهدف المسوقين المحترفين. كما اقترح العديد من المفاهيم الجديدة التي بدأ استخدامها على نطاق واسع اليوم فقط: الحوسبة بين العميل والخادم ، واستخدام نموذج متعدد الأبعاد في البيانات العلائقية ، وتطوير التطبيقات الموجهة للكائنات. ومع ذلك ، لم تكن أجهزة الآلات الشخصية القياسية في تلك الأيام قادرة على العمل مع Metaphor واضطر البائعون إلى تطوير معاييرهم الخاصة للآلات والشبكات الشخصية. بدأت Metaphor تدريجيًا في العمل بنجاح على الأجهزة الشخصية التسلسلية ، ولكن المنتج تم تصنيعه حصريًا لنظام التشغيل OS / 2 ولديه واجهة مستخدم رسومية خاصة به.

دخلت Metaphor بعد ذلك في تحالف تسويقي مع IBM ، والذي تم الاستحواذ عليه لاحقًا. في منتصف عام 1994 ، قررت شركة IBM دمج تقنية Metaphor (أعيدت تسميتها DIS) مع تقنياتها المستقبلية وبالتالي إنهاء التمويل لاتجاه منفصل ، لكن العملاء أعربوا عن استيائهم وطالبوا بدعم مستمر للمنتج. استمر الدعم للعملاء الباقين ، وأعادت شركة IBM إصدار المنتج تحت اسم جديد DIS ، والذي ، مع ذلك ، لم يجعله شائعًا. لكن المفاهيم الإبداعية والمبتكرة للاستعارة لم تُنسى وهي مرئية اليوم في العديد من المنتجات.

في منتصف الثمانينيات ، وُلد مصطلح EIS (نظام المعلومات التنفيذي). كان أول منتج يوضح هذا الاتجاه بوضوح هو مركز قيادة الطيار. لقد كان منتجًا سمح بالحوسبة التعاونية ، وهو ما نسميه حوسبة العميل والخادم اليوم. نظرًا لأن قوة أجهزة الكمبيوتر الشخصية في الثمانينيات كانت محدودة ، كان المنتج "مرتكزًا على الخادم" للغاية ، لكن المبدأ لا يزال شائعًا للغاية حتى يومنا هذا. لم تبيع Pilot مركز القيادة لفترة طويلة ، ولكنها قدمت العديد من المفاهيم التي يمكن تعلمها في منتجات OLAP الحالية ، بما في ذلك التوقيت التلقائي ، وحوسبة العميل / الخادم متعددة الأبعاد ، والتحكم المبسط في عملية التحليل (الماوس ، والشاشات الحساسة ، وما إلى ذلك). تمت إعادة تطبيق بعض هذه المفاهيم لاحقًا في خادم التحليل التجريبي.

في أواخر الثمانينيات ، كانت جداول البيانات هي الأداة المهيمنة في السوق لتوفير التحليل للمستخدمين النهائيين. تم تقديم أول جدول بيانات متعدد الأبعاد بواسطة Compete. تم تسويقه كمنتج مكلف للغاية للمتخصصين ، لكن البائعين لم يوفروا فرصة اقتناص السوق لهذا المنتج ، واكتسبت شركة Computer Associates حقوقه مع منتجات أخرى ، بما في ذلك Supercalc و 20/20. كان التأثير الرئيسي للاستحواذ على CA Compete هو الانخفاض الحاد في سعره وإزالة حماية النسخ ، مما ساهم بشكل طبيعي في توزيعه. ومع ذلك ، لم تكن ناجحة. تقع المنافسة في قلب Supercalc 5 ، ولكن لم يتم الترويج لجانبها متعدد الأبعاد. لا يزال تطبيق Compete القديم مستخدمًا في بعض الأحيان نظرًا لحقيقة أنه تم استثمار الكثير من الأموال فيه في وقت واحد.

كان Lotus هو التالي لمحاولة الدخول إلى سوق جداول البيانات متعددة الأبعاد من خلال تحسين ، والذي يعمل على جهاز NeXT. كفل هذا ، على الأقل ، أن مبيعات 1-2-3 لم تنخفض ، ولكن عندما تم إصدارها في نهاية المطاف لنظام Windows ، كان لبرنامج Excel بالفعل حصة كبيرة في السوق ، مما منع Lotus من إجراء أي تغييرات على توزيع السوق. قامت Lotus ، مثل CA مع Compete ، بنقل "تحسين" إلى الطرف الأدنى من السوق ، ولكن هذا لم يكن شرطًا أساسيًا لتقدم السوق بنجاح ، ولم تستمر التطورات الجديدة في هذا المجال. اتضح أن مستخدمي الكمبيوتر الشخصي يفضلون جداول البيانات 1-2-3 ولم يكونوا مهتمين بقدرات جديدة متعددة الأبعاد إذا لم تكن متوافقة تمامًا مع جداول البيانات القديمة. وبالمثل ، فإن مفاهيم جداول البيانات الصغيرة لسطح المكتب المقدمة كتطبيقات شخصية لم تثبت حقًا أنها ملائمة ولم تتجذر في عالم الأعمال الحقيقي. اتخذت Microsoft (r) هذا المسار ، مضيفةً جداول PivotTables (تسمى في النسخة الروسية "الجداول المحورية") إلى Excel. بينما استفاد عدد قليل من مستخدمي Excel من هذه الإمكانية ، فمن المحتمل أن تكون الحقيقة الوحيدة هي أن إمكانات التحليل متعدد الأبعاد مستخدمة على نطاق واسع في العالم لمجرد وجود عدد كبير جدًا من مستخدمي Excel في العالم.

4. OLAP ، ROLAP ، MOLAP ...

من المعروف أنه عندما نشر Codd قواعده لبناء نظم إدارة قواعد البيانات العلائقية في عام 1985 ، تسببت في رد فعل قوي وكان لها تأثير قوي على صناعة نظم إدارة قواعد البيانات بشكل عام. ومع ذلك ، قلة من الناس يعرفون أنه في عام 1993 نشر Codd عملاً بعنوان "OLAP للمستخدمين التحليليين: ما يجب أن يكون". في ذلك ، حدد المفاهيم الأساسية للمعالجة التحليلية عبر الإنترنت وحدد 12 قاعدة يجب أن تلبيها المنتجات التي تمكن المعالجة التحليلية عبر الإنترنت.

هذه هي القواعد (يتم الاحتفاظ بالنص الأصلي حيثما أمكن):

1. التمثيل المفاهيمي متعدد الأبعاد. يرى المستخدم المحلل أن عالم المؤسسة متعدد الأبعاد بطبيعته. وفقًا لذلك ، يجب أن يكون نموذج OLAP متعدد الأبعاد في جوهره. يسهل المخطط المفاهيمي متعدد الأبعاد أو العرض المخصص النمذجة والتحليل وكذلك الحساب.

2. الشفافية. بغض النظر عما إذا كان منتج OLAP جزءًا من أموال المستخدم أم لا ، يجب أن تكون هذه الحقيقة شفافة للمستخدم. إذا تم توفير OLAP بواسطة حوسبة خادم العميل ، فيجب أن تكون هذه الحقيقة أيضًا ، إن أمكن ، غير مرئية للمستخدم. يجب تقديم OLAP في سياق بنية مفتوحة حقًا ، مما يسمح للمستخدم ، أينما كان ، بالاتصال بالخادم باستخدام أداة تحليلية. بالإضافة إلى ذلك ، يجب تحقيق الشفافية عندما تتفاعل الأداة التحليلية مع بيئات قواعد البيانات المتجانسة وغير المتجانسة.

3. التوفر. يجب أن يكون مستخدم محلل OLAP قادرًا على إجراء التحليل بناءً على مخطط مفاهيمي مشترك يحتوي على بيانات على مستوى المؤسسة في قاعدة بيانات علائقية ، بالإضافة إلى بيانات من قواعد البيانات القديمة وطرق الوصول المشتركة ونموذج تحليلي مشترك. هذا يعني أن OLAP يجب أن يوفر منطقه الخاص للوصول في بيئة قاعدة بيانات غير متجانسة وإجراء تحويلات مناسبة لتقديم البيانات إلى المستخدم. علاوة على ذلك ، من الضروري التفكير مسبقًا في مكان وكيفية استخدام تنظيم البيانات المادية وأنواعه. يجب أن يصل نظام OLAP إلى البيانات المطلوبة فعليًا فقط ، ولا يطبق المبدأ العام لـ "قمع المطبخ" الذي يستلزم إدخالاً غير ضروري.

4. إنتاجية متسقة عند تطوير التقارير. إذا زاد عدد الأبعاد أو حجم قاعدة البيانات ، يجب ألا يشعر المستخدم المحلل بأي تدهور كبير في الأداء. يعد الأداء المتسق أمرًا ضروريًا لدعم المستخدم النهائي بسهولة الاستخدام والحد من تعقيد OLAP. إذا واجه المحلل المستخدم اختلافات كبيرة في الأداء وفقًا لعدد الأبعاد ، فسيسعى لتعويض هذه الاختلافات باستراتيجية التصميم ، والتي ستؤدي إلى تقديم البيانات بطرق أخرى ، ولكن ليس بالطريقة التي تكون بها البيانات حقًا يجب تقديمها. إن تخصيص الوقت للتجول في النظام للتعويض عن عدم كفايته ليس ما تم تصميم منتجات التحليلات من أجله.

5. هندسة العميل الخادم. معظم البيانات التي يجب معالجتها عبر الإنترنت اليوم موجودة في حواسيب كبيرة ويمكن الوصول إليها عبر جهاز كمبيوتر. هذا يعني ، بالتالي ، أن منتجات OLAP يجب أن تكون قادرة على العمل في بيئة خادم العميل. من وجهة النظر هذه ، من الضروري أن يكون مكون الخادم للأداة التحليلية "ذكيًا" إلى حد كبير بحيث يمكن للعملاء المختلفين الاتصال بالخادم بأقل قدر من المتاعب وبرمجة التكامل. يجب أن يكون الخادم "الذكي" قادرًا على إجراء التعيين والدمج بين مخططات قاعدة البيانات المنطقية والمادية غير المناسبة. سيوفر هذا الشفافية ويبني مخططًا مفاهيميًا ومنطقيًا وماديًا شاملاً.

6. تعددية الأبعاد العامة. يجب تطبيق كل بُعد بغض النظر عن هيكله وقدراته التشغيلية. يمكن توفير قدرات تشغيلية إضافية لأبعاد محددة ، وبما أن الأبعاد متناظرة ، يمكن توفير وظيفة واحدة لأي بُعد. لا ينبغي تحيز هياكل البيانات الأساسية والصيغ وتنسيقات التقارير تجاه أي بُعد.

7. الإدارة الديناميكية لمصفوفات متفرقة. يجب أن يتكيف التصميم المادي لأداة OLAP تمامًا مع النموذج التحليلي المحدد للإدارة المثلى للمصفوفات المتفرقة. لأي مصفوفة متفرقة معينة ، هناك مخطط فيزيائي مثالي واحد وواحد فقط. يوفر هذا المخطط أقصى كفاءة للذاكرة وإمكانية تشغيل المصفوفة ، ما لم تكن مجموعة البيانات بأكملها بالطبع غير مناسبة للذاكرة. يجب تكوين الفيزياء الأساسية لأداة OLAP لأي مجموعة فرعية من الأبعاد ، بأي ترتيب ، للعمليات العملية باستخدام النماذج التحليلية الكبيرة. يجب أن تتغير الموصِّل المادي أيضًا ديناميكيًا وأن تحتوي على أنواع مختلفة من الآليات ، مثل: الحساب المباشر ، والأشجار B والمشتقات ، والتجزئة ، والقدرة على الجمع بين هذه الآليات إذا لزم الأمر. التباين (يقاس كنسبة الخلايا الفارغة لكل ما هو ممكن) هو أحد خصائص نشر البيانات. يمكن أن يؤدي عدم القدرة على تنظيم التناثر إلى جعل كفاءة العمليات غير قابلة للتحقيق. إذا لم تتمكن أداة OLAP من التحكم في توزيع قيم البيانات التي تم تحليلها وتنظيمها ، فقد يكون النموذج الذي يدعي أنه عملي ، استنادًا إلى العديد من مسارات الدمج والأبعاد ، في الواقع ، غير ضروري ويائس.

8. دعم متعدد المستخدمين. في كثير من الأحيان ، يحتاج العديد من المستخدمين التحليليين إلى العمل مع نفس النموذج التحليلي أو إنشاء نماذج مختلفة من نفس البيانات. لذلك ، يجب أن توفر أداة OLAP إمكانية المشاركة (الاستعلام والمكمل) والتكامل والأمان.

9. عمليات الانتقال غير محدودة. تمثل مستويات التجميع ومسارات التوحيد المتنوعة ، نظرًا لطبيعة التدرج الهرمي ، العلاقات التابعة في نموذج أو تطبيق OLAP. لذلك ، يجب أن تتضمن الأداة نفسها الحسابات المناسبة ولا تطلب من المستخدم المحلل إعادة تعريف تلك الحسابات والعمليات. تتطلب الحسابات التي لا تتبع من هذه العلاقات الموروثة تحديد صيغ مختلفة وفقًا لبعض اللغة المعمول بها. يمكن لمثل هذه اللغة أن تسمح بحساب ومعالجة البيانات من أي بُعد وعدم تقييد العلاقة بين خلايا البيانات ، وعدم الانتباه إلى عدد سمات البيانات الشائعة لخلايا معينة.

10. معالجة البيانات بشكل بديهي. يجب تطبيق إعادة توجيه مسارات الدمج والتفاصيل والتكبير والمعالجات الأخرى التي تنظمها مسارات الدمج من خلال تأثير منفصل على خلايا النموذج التحليلي ، ويجب ألا تتطلب استخدام نظام قائمة أو إجراءات متعددة أخرى مع واجهة المستخدم . يجب أن يحتوي منظور المستخدم المحلل للأبعاد المحددة في النموذج التحليلي على جميع المعلومات اللازمة لتنفيذ الإجراءات المذكورة أعلاه.

11. خيارات إعداد التقارير المرنة. يعد تحليل البيانات وتقديمها أمرًا بسيطًا عندما تكون صفوف وأعمدة وخلايا البيانات التي سيتم مقارنتها بصريًا مع بعضها البعض قريبة من بعضها البعض أو وفقًا لبعض الوظائف المنطقية التي تحدث في المؤسسة. يجب أن تقدم أدوات إعداد التقارير البيانات المركبة أو المعلومات الناتجة عن نموذج البيانات في أي اتجاه محتمل. هذا يعني أن الصفوف أو الأعمدة أو الصفحات يجب أن تظهر من 0 إلى N أبعاد في وقت واحد ، حيث N هو عدد الأبعاد في النموذج التحليلي بأكمله. بالإضافة إلى ذلك ، يجب أن يكون كل بُعد محتوى معروض في سجل أو عمود أو صفحة واحدة قادرًا أيضًا على إظهار أي مجموعة فرعية من العناصر (القيم) المضمنة في البعد ، بأي ترتيب.

12. أبعاد وعدد غير محدود من مستويات التجميع. أظهر البحث في العدد المحتمل للقياسات المطلوبة المطلوبة في نموذج تحليلي أنه يمكن استخدام ما يصل إلى 19 قياسًا في وقت واحد. ومن هنا جاءت التوصية القوية بأن تكون الأداة التحليلية قادرة على توفير 15 بُعدًا على الأقل في وقت واحد ويفضل أن يكون ذلك 20. علاوة على ذلك ، لا ينبغي تقييد كل بُعد من الأبعاد العامة بعدد مستويات التجميع التحليلية التي يحددها المستخدم ومسارات التوحيد.

في الواقع ، يتبع مطورو منتجات OLAP اليوم هذه القواعد ، أو على الأقل يسعون جاهدين لاتباعها. يمكن اعتبار هذه القواعد الأساس النظري للمعالجة التحليلية التشغيلية ، ومن الصعب الجدال معها. في وقت لاحق ، نشأت العديد من العواقب من القواعد الاثني عشر ، والتي ، مع ذلك ، لن نذكرها ، حتى لا نعقد القصة بلا داعٍ.

دعنا نلقي نظرة فاحصة على كيفية اختلاف منتجات OLAP في تنفيذها المادي.

كما هو مذكور أعلاه ، يعتمد OLAP على فكرة معالجة البيانات على الهياكل متعددة الأبعاد. عندما نقول OLAP ، فإننا نعني أن بنية البيانات لمنتج تحليلي متعددة الأبعاد منطقيًا. كيف يتم تنفيذ هذا بالضبط هو أمر آخر. هناك نوعان رئيسيان من المعالجة التحليلية ، والتي تشمل منتجات معينة.

MOLAP ... متعدد الأبعاد OLAP نفسه. يعتمد المنتج على بنية بيانات غير علائقية توفر تخزينًا متعدد الأبعاد ومعالجة وعرض البيانات. وفقًا لذلك ، تسمى قواعد البيانات متعددة الأبعاد. عادةً ما تحتوي المنتجات التي تنتمي إلى هذه الفئة على خادم قاعدة بيانات متعدد الأبعاد. يتم اختيار البيانات في عملية التحليل حصريًا من هيكل متعدد الأبعاد. هذا الهيكل ذو كفاءة عالية.

رولاب ... OLAP العلائقية. كما يوحي الاسم ، يتم تنفيذ الهيكل متعدد الأبعاد في هذه الأدوات بواسطة الجداول العلائقية. ويتم اختيار البيانات في عملية التحليل ، على التوالي ، من قاعدة بيانات علائقية بواسطة أداة تحليلية.

عيوب ومزايا كل نهج ، بشكل عام ، واضحة. يوفر OLAP متعدد الأبعاد أداءً أفضل ، ولكن لا يمكن استخدام الهياكل لمعالجة كميات كبيرة من البيانات ، نظرًا لأن الأبعاد الكبيرة ستتطلب موارد أجهزة كبيرة ، وفي الوقت نفسه ، يمكن أن يكون تباين المكعبات المفرطة مرتفعًا جدًا ، وبالتالي ، استخدام سعة الأجهزة لن يكون له ما يبرره. على العكس من ذلك ، يوفر OLAP العلائقي معالجة على صفائف كبيرة من البيانات المخزنة ، حيث أنه من الممكن توفير تخزين أكثر اقتصادا ، ولكنه في نفس الوقت يخسر بشكل كبير في سرعة العمل متعدد الأبعاد. أدى هذا التفكير إلى تحديد فئة جديدة من الأدوات التحليلية - HOLAP. هذه معالجة تحليلية مختلطة عبر الإنترنت. تتيح لك أدوات هذه الفئة الجمع بين كلا النهجين - العلائقية والمتعددة الأبعاد. يمكن الوصول إلى بيانات قاعدة البيانات متعددة الأبعاد والبيانات العلائقية.

هناك نوع آخر غريب إلى حد ما من المعالجة التحليلية عبر الإنترنت - DOLAP. هذا هو سطح المكتب OLAP. نحن نتحدث عن مثل هذه المعالجة التحليلية ، حيث تكون المكعبات المفرطة صغيرة ، وأبعادها صغيرة ، والاحتياجات متواضعة ، ولمثل هذه المعالجة التحليلية ، يكفي وجود آلة شخصية على سطح المكتب.

تسمح لك المعالجة التحليلية التشغيلية بتبسيط وتسريع عملية التحضير واتخاذ القرار من قبل موظفي الإدارة. تخدم المعالجة التحليلية عبر الإنترنت الغرض من تحويل البيانات إلى معلومات. وهي تختلف اختلافًا جوهريًا عن عملية دعم القرار التقليدية ، والتي غالبًا ما تستند إلى النظر في التقارير المنظمة. بالقياس ، الفرق بين التقارير المنظمة و OLAP هو نفسه بين القيادة في جميع أنحاء المدينة بالترام وبالسيارة. عندما تركب ترامًا ، فإنه يتحرك على طول القضبان ، مما لا يسمح لك برؤية المباني البعيدة بشكل جيد ، بل وأكثر من ذلك للاقتراب منها. على العكس من ذلك ، تمنحك قيادة السيارة الخاصة حرية الحركة الكاملة (بالطبع ، يجب مراعاة قواعد المرور). يمكنك القيادة إلى أي مبنى والوصول إلى الأماكن التي لا تعمل فيها عربات الترام.

التقارير المنظمة هي القضبان التي تعيق حرية إعداد القرارات. OLAP هي وسيلة لحركة المرور الفعالة على طرق المعلومات السريعة.