كيف تعمل محركات البحث. ما هو محرك البحث

يعد الإنترنت ضروريًا للعديد من المستخدمين من أجل الحصول على إجابات للاستفسارات (الأسئلة) التي يدخلونها.

إذا لم تكن هناك محركات بحث، فسيتعين على المستخدمين البحث بشكل مستقل عن المواقع التي يحتاجون إليها، وتذكرها، وكتابتها. في كثير من الحالات، يكون العثور على شيء مناسب "يدويًا" أمرًا صعبًا للغاية، بل وفي كثير من الأحيان مستحيلًا.

نحن نقوم بكل هذا العمل الروتيني المتمثل في البحث عن المعلومات وتخزينها وفرزها على مواقع الويب.

لنبدأ بمحركات البحث Runet الشهيرة.

محركات البحث على الإنترنت باللغة الروسية

1) لنبدأ بمحرك البحث المحلي. لا تعمل Yandex في روسيا فحسب، بل تعمل أيضًا في بيلاروسيا وكازاخستان وأوكرانيا وتركيا. يوجد أيضًا Yandex باللغة الإنجليزية.

2) جاء إلينا محرك بحث Google من أمريكا وله ترجمة باللغة الروسية:

3) محرك البحث المحلي Mail ru، والذي يمثل في نفس الوقت شبكة التواصل الاجتماعي VKontakte وOdnoklassniki وأيضًا My World و Answers Mail.ru الشهيرة ومشاريع أخرى.

4) محرك بحث ذكي

نيجما (نيجما) http://www.nigma.ru/

منذ 19 سبتمبر 2017، لم تنجح صفة "المثقف". لم تعد ذات فائدة مالية لمبدعيها، بل تحولوا إلى محرك بحث آخر يسمى CocCoc.

5) قامت شركة Rostelecom المعروفة بإنشاء محرك بحث Sputnik.

هناك محرك بحث اسمه سبوتنيك، مصمم خصيصًا للأطفال، والذي كتبت عنه.

6) كان Rambler من أوائل محركات البحث المحلية:

وهناك محركات بحث أخرى مشهورة في العالم:

  • بنج,
  • ياهو!,
  • بايدو،
  • إيكوسيا,

دعونا نحاول معرفة كيفية عمل محرك البحث، أي كيفية فهرسة المواقع وتحليل نتائج الفهرسة وإنشاء نتائج البحث. مبادئ تشغيل محركات البحث هي نفسها تقريبًا: البحث عن المعلومات على الإنترنت وتخزينها وفرزها لتسليمها استجابة لطلبات المستخدم. لكن الخوارزميات التي تستخدمها محركات البحث يمكن أن تختلف بشكل كبير. تظل هذه الخوارزميات سرية ويحظر الكشف عنها.

عن طريق إدخال نفس الاستعلام في سلاسل البحث لمحركات البحث المختلفة، يمكنك الحصول على إجابات مختلفة. والسبب هو أن جميع محركات البحث تستخدم خوارزمياتها الخاصة.

الغرض من محركات البحث

أولًا، عليك أن تعرف أن محركات البحث هي منظمات تجارية. هدفهم هو تحقيق الربح. يمكنك تحقيق الربح من الإعلانات السياقية وأنواع الإعلانات الأخرى ومن الترويج للمواقع الضرورية إلى أعلى نتائج البحث. بشكل عام، هناك العديد من الطرق.

يعتمد ذلك على حجم الجمهور، أي عدد الأشخاص الذين يستخدمون محرك البحث هذا. كلما زاد حجم الجمهور، زاد عدد الأشخاص الذين سيتم عرض الإعلان لهم. وبناء على ذلك، فإن هذا الإعلان سيكلف أكثر. يمكن لمحركات البحث زيادة جمهورها من خلال إعلاناتها الخاصة، وكذلك من خلال جذب المستخدمين من خلال تحسين جودة خدماتها والخوارزميات وسهولة البحث.

الشيء الأكثر أهمية وصعوبة هنا هو تطوير خوارزمية بحث تعمل بكامل طاقتها والتي من شأنها أن توفر النتائج ذات الصلة لغالبية استعلامات المستخدم.

عمل محرك البحث وتصرفات مشرفي المواقع

يحتوي كل محرك بحث على خوارزمية خاصة به، والتي يجب أن تأخذ في الاعتبار عددًا كبيرًا من العوامل المختلفة عند تحليل المعلومات وتجميع النتائج استجابةً لطلب المستخدم:

  • عمر موقع معين،
  • خصائص نطاق موقع الويب،
  • جودة المحتوى على الموقع وأنواعه،
  • ميزات التنقل وبنية الموقع،
  • سهولة الاستخدام (الراحة للمستخدمين) ،
  • العوامل السلوكية (يمكن لمحرك البحث تحديد ما إذا كان المستخدم قد وجد ما كان يبحث عنه في الموقع أم أن المستخدم عاد إلى محرك البحث مرة أخرى وهناك مرة أخرى يبحث عن إجابة لنفس الاستعلام)
  • إلخ.

كل هذا ضروري على وجه التحديد حتى تكون النتائج بناءً على طلب المستخدم ذات صلة قدر الإمكان، وتلبية طلبات المستخدم. وفي الوقت نفسه، تتغير خوارزميات محرك البحث باستمرار ويتم تحسينها. وكما يقولون، ليس هناك حد للكمال.

ومن ناحية أخرى، يبتكر مشرفو المواقع والمحسنون باستمرار طرقًا جديدة للترويج لمواقعهم، وهي طرق ليست صادقة دائمًا. تتمثل مهمة مطوري خوارزمية محرك البحث في إجراء تغييرات عليها بحيث لا تسمح للمواقع "السيئة" للمُحسِّنين غير الشرفاء بالظهور في الأعلى.

كيف يعمل محرك البحث؟

الآن دعونا نتحدث عن كيفية عمل محرك البحث فعليًا. وتتكون من ثلاث مراحل على الأقل:

  • يتم المسح،
  • الفهرسة,
  • تتراوح.

عدد المواقع على الإنترنت هو ببساطة عدد فلكي. وكل موقع عبارة عن معلومات ومحتوى معلوماتي يتم إنشاؤه للقراء (الأشخاص الأحياء).

يتم المسح

هذا هو محرك بحث يتجول في شبكة الإنترنت لجمع معلومات جديدة وتحليل الروابط والبحث عن محتوى جديد يمكن استخدامه للعودة إلى المستخدم استجابة لطلباته. للمسح، تحتوي محركات البحث على روبوتات خاصة تسمى روبوتات البحث أو العناكب.

روبوتات البحث هي برامج تقوم تلقائيًا بزيارة مواقع الويب وتجمع المعلومات منها. يمكن أن يكون الزحف أساسيًا (يزور الروبوت موقعًا جديدًا للمرة الأولى). بعد التجميع الأولي للمعلومات من الموقع وإدخالها في قاعدة بيانات محرك البحث، يبدأ الروبوت في زيارة صفحاته ببعض الانتظام. إذا حدثت أي تغييرات (تمت إضافة محتوى جديد، تم حذف المحتوى القديم)، فسيتم تسجيل كل هذه التغييرات بواسطة محرك البحث.

تتمثل المهمة الرئيسية لعنكبوت البحث في العثور على معلومات جديدة وإرسالها إلى محرك البحث للمرحلة التالية من المعالجة، أي للفهرسة.

الفهرسة

يمكن لمحرك البحث البحث عن المعلومات فقط بين تلك المواقع المضمنة بالفعل في قاعدة بياناته (المفهرسة بواسطته). إذا كان الزحف هو عملية البحث وجمع المعلومات المتوفرة في موقع معين، فإن الفهرسة هي عملية إدخال هذه المعلومات في قاعدة بيانات محرك البحث. في هذه المرحلة، يقرر محرك البحث تلقائيا ما إذا كان سيتم إدخال هذه المعلومات أو تلك في قاعدة بياناته ومكان إدخالها، وفي أي قسم من قاعدة البيانات. على سبيل المثال، تقوم Google بفهرسة جميع المعلومات التي عثرت عليها الروبوتات الخاصة بها تقريبًا على الإنترنت، في حين أن Yandex أكثر انتقائية ولا تقوم بفهرسة كل شيء.

بالنسبة للمواقع الجديدة، يمكن أن تكون مرحلة الفهرسة طويلة، لذلك قد ينتظر الزوار من محركات البحث وقتا طويلا للوصول إلى المواقع الجديدة. والمعلومات الجديدة التي تظهر على المواقع القديمة التي يتم الترويج لها جيدًا يمكن فهرستها على الفور تقريبًا وينتهي بها الأمر على الفور تقريبًا في "الفهرس"، أي في قاعدة بيانات محرك البحث.

تتراوح

التصنيف هو ترتيب المعلومات التي تم فهرستها مسبقًا وإدخالها في قاعدة بيانات محرك بحث معين، حسب الترتيب، أي ما هي المعلومات التي سيظهرها محرك البحث لمستخدميه في المقام الأول، وما هي المعلومات التي سيتم وضعها “ مرتبة "أدنى. يمكن أن يعزى التصنيف إلى مرحلة خدمة محرك البحث لعميله – المستخدم.

تتم معالجة المعلومات المستلمة على خوادم محرك البحث ويتم إنشاء النتائج لمجموعة كبيرة من جميع أنواع الاستعلامات. هذا هو المكان الذي تلعب فيه خوارزميات محرك البحث. يتم تصنيف جميع المواقع المدرجة في قاعدة البيانات حسب الموضوع، ويتم تقسيم المواضيع إلى مجموعات من الطلبات. لكل مجموعة من الطلبات، يمكن تجميع مسألة أولية، والتي سيتم تعديلها لاحقا.

مرحبا عزيزي القراء لموقع بلوق. عند القيام، أو بمعنى آخر، تحسين محرك البحث، سواء على المستوى المهني (الترويج للمشاريع التجارية مقابل المال) أو على مستوى الهواة ()، ستواجه بالتأكيد حقيقة أنك بحاجة إلى معرفة مبادئ العمل بشكل عام من أجل تحسين موقع الويب الخاص بك أو موقع شخص آخر بنجاح.

العدو، كما يقولون، يجب أن يعرف بالعين المجردة، على الرغم من أنهم بالطبع (بالنسبة لـ RuNet، هذا هو Yandex و) ليسوا أعداء لنا على الإطلاق، بل شركاء، لأن حصتهم من حركة المرور هي السائدة في معظم الحالات والرئيسية. هناك، بالطبع، استثناءات، لكنها تؤكد هذه القاعدة فقط.

ما هو المقتطف وكيف تعمل محركات البحث؟

ولكن هنا، تحتاج أولاً إلى معرفة ماهية المقتطف، وما الغرض منه، ولماذا يعد محتواه مهمًا جدًا للمُحسِّن؟ يوجد في نتائج البحث مباشرة أسفل رابط المستند الذي تم العثور عليه (نصه مأخوذ مما كتبته بالفعل):

تُستخدم عادةً أجزاء النص من هذا المستند كمقتطف. تم تصميم الخيار المثالي لتزويد المستخدم بفرصة تكوين رأي حول محتوى الصفحة دون الذهاب إليها (ولكن هذا إذا تبين أنه ناجح، وهذا ليس هو الحال دائمًا).

يتم إنشاء المقتطف تلقائيًا، والأمر متروك لك لتحديد أجزاء النص التي سيتم استخدامها فيه، والأهم من ذلك، ستحتوي صفحة الويب نفسها على مقتطفات مختلفة لطلبات مختلفة.

ولكن هناك احتمال أن يتم في بعض الأحيان استخدام محتويات علامة الوصف (خاصة في Google) كمقتطف. وبطبيعة الحال، سيعتمد هذا أيضًا على المشكلة التي تظهر في نتائج البحث.

ولكن يمكن عرض محتويات علامة الوصف، على سبيل المثال، إذا كانت الكلمات الرئيسية للاستعلام تتطابق مع الكلمات التي استخدمتها في الوصف أو إذا لم تعثر الخوارزمية نفسها بعد على أجزاء نصية على موقعك لجميع الاستعلامات التي تظهر صفحتك فيها نتائج ياندكس أو جوجل.

لذلك، لا تتكاسل واملأ محتويات علامة الوصف لكل مقالة. يمكن القيام بذلك في WordPress إذا كنت تستخدم ما هو موضح (وأوصي بشدة باستخدامه).

إذا كنت من محبي Joomla، يمكنك استخدام هذه المادة -.

لكن لا يمكن الحصول على المقتطف من الفهرس العكسي، لأنه يقوم بتخزين معلومات فقط حول الكلمات المستخدمة في الصفحة وموضعها في النص. إنه على وجه التحديد إنشاء مقتطفات من نفس المستند في نتائج بحث مختلفة (للاستعلامات المختلفة) التي يحفظها ياندكس وجوجل المفضلان لدينا، بالإضافة إلى الفهرس العكسي (المطلوب مباشرة لإجراء البحث - اقرأ عنه أدناه) مؤشر مباشر، أي. نسخة من صفحة الويب.

ومن خلال حفظ نسخة من المستند في قاعدة البيانات الخاصة بهم، يصبح من السهل عليهم قطع المقتطفات الضرورية منها، دون الرجوع إلى الأصل.

الذي - التي. اتضح أن محركات البحث تقوم بتخزين الفهرس الأمامي والخلفي لصفحة الويب في قاعدة بياناتها. بالمناسبة، يمكنك التأثير بشكل غير مباشر على تكوين المقتطفات من خلال تحسين نص صفحة الويب بطريقة تجعل الخوارزمية تختار بالضبط جزء النص الذي تفكر فيه. لكننا سنتحدث عن هذا في مقال آخر في هذا القسم.

كيفية عمل محركات البحث بشكل عام

يتمثل جوهر التحسين في "مساعدة" خوارزميات محرك البحث على رفع صفحات المواقع التي تروج لها إلى أعلى موضع ممكن في نتائج البحث لاستعلامات معينة.

لقد وضعت كلمة "مساعدة" في الجملة السابقة بين علامتي تنصيص، لأن... من خلال إجراءات التحسين لدينا، نحن لا نساعد حقًا، وغالبًا ما نمنع الخوارزمية تمامًا من تحقيق نتائج ذات صلة تمامًا بالطلب (حول النتائج الغامضة).

ولكن هذا هو جوهر أدوات تحسين الأداء، وحتى تصبح خوارزميات البحث مثالية، ستكون هناك فرص من خلال التحسين الداخلي والخارجي لتحسين مواقعها في نتائج ياندكس وجوجل.

ولكن قبل الانتقال إلى دراسة أساليب التحسين، ستحتاج إلى فهم سطحي على الأقل لمبادئ كيفية عمل محركات البحث، حتى تتمكن من القيام بجميع الإجراءات الإضافية بوعي وفهم سبب ضرورة ذلك وكيف سيفعل أولئك الذين نحاول خداعهم الرد عليه.

من الواضح أننا لن نكون قادرين على فهم منطق عملهم بالكامل من البداية إلى النهاية، لأن الكثير من المعلومات لا تخضع للإفصاح، ولكن بالنسبة لنا، في البداية، سيكون فهم المبادئ الأساسية كافيا. اذا هيا بنا نبدأ.

كيف تعمل محركات البحث على أية حال؟ ومن الغريب أن منطق عملهم هو نفسه من حيث المبدأ وهو كما يلي: يتم جمع المعلومات حول جميع صفحات الويب التي يمكنهم الوصول إليها على الشبكة، وبعد ذلك تتم معالجة هذه البيانات بمهارة بحيث تكون مناسبة لهم لهم إجراء البحث. هذا كل شيء، في الواقع، يمكن اعتبار هذه المقالة كاملة، ولكن دعونا نضيف القليل من التفاصيل.

أولاً، دعونا نوضح أن المستند يشير إلى ما نسميه عادةً صفحة الموقع. علاوة على ذلك، يجب أن يكون له عنوان فريد خاص به ()، ومن الجدير بالذكر أن روابط التجزئة لن تؤدي إلى ظهور مستند جديد (حول).

ثانيا، يستحق التوقف عند الخوارزميات (الأساليب) للبحث عن المعلومات في قاعدة بيانات المستندات المجمعة.

خوارزميات الفهرس المباشر والعكس

من الواضح أن طريقة التكرار عبر جميع الصفحات المخزنة في قاعدة البيانات لن تكون الأمثل. هذه الطريقة تسمى الخوارزمية بحث مباشروعلى الرغم من أن هذه الطريقة تتيح لك بالتأكيد العثور على المعلومات الضرورية دون فقدان أي شيء مهم، إلا أنها غير مناسبة تمامًا للعمل مع كميات كبيرة من البيانات، لأن البحث سيستغرق الكثير من الوقت.

لذلك، للعمل بفعالية مع كميات كبيرة من البيانات، تم تطوير خوارزمية فهرس معكوسة (مقلوبة). ومن اللافت للنظر أنه هو الذي تستخدمه جميع محركات البحث الرئيسية في العالم. لذلك، سوف نتناولها بمزيد من التفصيل وننظر في مبادئ عملها.

عند استخدام الخوارزمية المؤشرات العكسيةيتم تحويل المستندات إلى ملفات نصية تحتوي على قائمة بجميع الكلمات التي تحتوي عليها.

يتم ترتيب الكلمات في هذه القوائم (ملفات الفهرس) حسب الترتيب الأبجدي وبجوار كل منها يشار إليها في شكل إحداثيات الأماكن على صفحة الويب التي تظهر فيها هذه الكلمة. بالإضافة إلى الموضع في المستند، يوجد لكل كلمة أيضًا معلمات أخرى تحدد معناها.

إذا كنت تتذكر، في العديد من الكتب (معظمها تقنية أو علمية) في الصفحات الأخيرة توجد قائمة بالكلمات المستخدمة في هذا الكتاب، مع الإشارة إلى أرقام الصفحات التي تظهر فيها. بالطبع، هذه القائمة لا تشمل جميع الكلمات المستخدمة في الكتاب، لكنها مع ذلك يمكن أن تكون بمثابة مثال لإنشاء ملف فهرس باستخدام الفهارس المقلوبة.

يرجى ملاحظة أن محركات البحث تبحث عن المعلومات ليس على شبكة الإنترنتوفي الفهارس العكسية لصفحات الويب التي قاموا بمعالجتها. على الرغم من أنها تقوم أيضًا بحفظ الفهارس المباشرة (النص الأصلي)، لأن ستكون هناك حاجة إليه لاحقًا لتجميع المقتطفات، لكننا تحدثنا بالفعل عن هذا في بداية هذا المنشور.

يتم استخدام خوارزمية الفهرس العكسي من قبل جميع الأنظمة، لأن فهو يسمح لك بتسريع العملية، ولكن في نفس الوقت سيكون هناك فقدان لا مفر منه للمعلومات بسبب التشوهات التي تحدث عن طريق تحويل المستند إلى ملف فهرس. لسهولة التخزين، عادةً ما يتم ضغط ملفات الفهرس العكسي بطريقة ذكية.

النموذج الرياضي المستخدم للتصنيف

من أجل البحث باستخدام الفهارس العكسية، يتم استخدام نموذج رياضي لتبسيط عملية اكتشاف صفحات الويب الضرورية (بناءً على الاستعلام الذي أدخله المستخدم) وعملية تحديد مدى ملاءمة جميع المستندات التي تم العثور عليها لهذا الاستعلام. كلما زاد تطابقه مع طلب معين (كلما كان أكثر صلة بالموضوع)، كلما كان ظهوره أعلى في نتائج البحث.

وهذا يعني أن المهمة الرئيسية التي يؤديها النموذج الرياضي هي البحث عن الصفحات في قاعدة بياناته الخاصة بالفهارس العكسية المقابلة لاستعلام معين وفرزها لاحقًا بترتيب تنازلي حسب صلتها بهذا الاستعلام.

إن استخدام نموذج منطقي بسيط، عند العثور على مستند إذا وجدت فيه العبارة التي تم البحث عنها، لن يناسبنا، نظرًا للعدد الهائل من صفحات الويب هذه المقدمة للمستخدم للنظر فيها.

يجب ألا يقتصر الأمر على توفير محرك البحث قائمة بجميع صفحات الويب التي تظهر عليها الكلمات الواردة في الاستعلام. يجب عليها تقديم هذه القائمة بشكل بحيث تكون المستندات الأكثر صلة بطلب المستخدم في البداية (مرتبة حسب الصلة). هذه المهمة ليست تافهة ولا يمكن تنفيذها بشكل مثالي افتراضيًا.

بالمناسبة، يستفيد المحسنون من عدم وجود أي نموذج رياضي، مما يؤثر بطريقة أو بأخرى على ترتيب المستندات في نتائج البحث (لصالح الموقع الذي يروجون له، بالطبع). ينتمي النموذج الرياضي الذي تستخدمه جميع محركات البحث إلى فئة المتجهات. يستخدم مفهومًا مثل وزن المستند فيما يتعلق بالاستعلام المحدد من قبل المستخدم.

في النموذج المتجه الأساسي، يتم حساب وزن المستند لاستعلام معين بناءً على معلمتين رئيسيتين: التكرار الذي تظهر به كلمة معينة فيه (TF - تردد المصطلح) ومدى ندرة ظهور هذه الكلمة في جميع الصفحات الأخرى من المجموعة (IDF - تردد الوثيقة العكسي).

نعني بالمجموعة المجموعة الكاملة من الصفحات المعروفة لمحرك البحث. ومن خلال ضرب هذين المعلمتين ببعضهما البعض، نحصل على وزن المستند لطلب معين.

بطبيعة الحال، تستخدم محركات البحث المختلفة، بالإضافة إلى معلمات TF وIDF، العديد من المعاملات المختلفة لحساب الوزن، ولكن الجوهر يظل كما هو: سيكون وزن الصفحة أكبر، كلما ظهرت الكلمة من استعلام البحث في كثير من الأحيان فيه (إلى حدود معينة، وبعد ذلك يمكن التعرف على المستند كبريد عشوائي) وكلما قل ظهور هذه الكلمة في جميع المستندات الأخرى المفهرسة بواسطة هذا النظام.

تقييم جودة الصيغة من قبل المقيمين

وهكذا يتبين أنه يتم تنفيذ توليد النتائج لطلبات معينة تماما وفقا للصيغةدون تدخل بشري. ولكن لن تعمل أي صيغة بشكل مثالي، خاصة في البداية، لذلك تحتاج إلى مراقبة عمل النموذج الرياضي.

لهذه الأغراض، يتم الاستعانة بأشخاص مدربين خصيصًا - الذين يقومون بعرض النتائج (تحديدًا محرك البحث الذي وظفهم) لمختلف الاستفسارات وتقييم جودة الصيغة الحالية.

يتم أخذ جميع التعليقات التي يقدمونها بعين الاعتبار من قبل الأشخاص المسؤولين عن إعداد النموذج الرياضي. يتم إجراء تغييرات أو إضافات على صيغته، ونتيجة لذلك تتحسن جودة عمل محرك البحث. اتضح أن المُقيّمين يعملون كنوع من ردود الفعل بين مطوري الخوارزمية ومستخدميها، وهو أمر ضروري لتحسين الجودة.

المعايير الرئيسية لتقييم جودة الصيغة هي:

  1. دقة نتائج محرك البحث هي النسبة المئوية للمستندات ذات الصلة (التي تطابق الاستعلام). كلما قل عدد صفحات الويب (على سبيل المثال، المداخل) التي لا تتعلق بموضوع الطلب، كلما كان ذلك أفضل.
  2. اكتمال نتائج البحث هو النسبة المئوية لصفحات الويب المقابلة لاستعلام معين (ذو صلة) إلى إجمالي عدد المستندات ذات الصلة المتوفرة في المجموعة بأكملها. أولئك. اتضح أنه في قاعدة بيانات المستندات بأكملها المعروفة بالبحث، سيكون هناك عدد أكبر من صفحات الويب المقابلة لاستعلام معين مما يظهر في نتائج البحث. في هذه الحالة يمكننا الحديث عن عدم اكتمال الإصدار. من الممكن أن تكون بعض الصفحات ذات الصلة قد خضعت للتصفية وتم الخلط بينها، على سبيل المثال، على أنها مداخل أو أي خبث آخر.
  3. إن أهمية نتائج البحث هي مدى توافق صفحة الويب الحقيقية على موقع ويب على الإنترنت مع ما هو مكتوب عنها في نتائج البحث. على سبيل المثال، قد لا يكون المستند موجودًا أو قد يتغير بشكل كبير، ولكنه سيكون موجودًا في نتائج البحث لطلب معين، على الرغم من غيابه الفعلي في العنوان المحدد أو عدم امتثاله الحالي للطلب المحدد. تعتمد أهمية النتائج على تكرار قيام روبوتات البحث بمسح المستندات من مجموعتها.

كيف تقوم ياندكس وجوجل بجمع مجموعتهما

على الرغم من البساطة الظاهرة لفهرسة صفحات الويب، هناك الكثير من الفروق الدقيقة التي تحتاج إلى معرفتها واستخدامها لاحقًا عند تحسين (SEO) مواقع الويب الخاصة بك أو مواقع الويب المخصصة. يتم تنفيذ فهرسة الشبكة (مجموعة المجموعة) بواسطة برنامج مصمم خصيصًا يسمى روبوت البحث (bot).

يتلقى الروبوت قائمة أولية بالعناوين التي سيتعين عليه زيارتها، ونسخ محتويات هذه الصفحات وإعطاء هذا المحتوى لمزيد من المعالجة إلى الخوارزمية (يحولها إلى فهارس عكسية).

لا يستطيع الروبوت اتباع القائمة المعطاة له مسبقًا فحسب، بل يمكنه أيضًا متابعة الروابط من هذه الصفحات وفهرسة المستندات الموجودة على هذه الروابط. الذي - التي. يتصرف الروبوت تمامًا مثل المستخدم العادي الذي يتبع الروابط.

لذلك، اتضح أنه بمساعدة الروبوت، من الممكن فهرسة كل ما هو متاح عادةً للمستخدم باستخدام متصفح للتصفح (تقوم محركات البحث بفهرسة مستندات الرؤية المباشرة التي يمكن لأي مستخدم للإنترنت رؤيتها).

هناك عدد من الميزات المرتبطة بفهرسة المستندات على الإنترنت (دعني أذكرك أننا ناقشناها بالفعل).

الميزة الأولى يمكن اعتبارها أنه بالإضافة إلى الفهرس العكسي، الذي يتم إنشاؤه من المستند الأصلي الذي تم تنزيله من الشبكة، يقوم محرك البحث أيضًا بتخزين نسخة منه، بمعنى آخر، تقوم محركات البحث أيضًا بتخزين الفهرس المباشر. لماذا هذا ضروري؟ لقد ذكرت بالفعل قبل قليل أن هذا ضروري لإنشاء مقتطفات مختلفة اعتمادًا على الاستعلام الذي تم إدخاله.

كم عدد صفحات موقع واحد التي يعرضها Yandex في نتائج البحث والفهرس؟

أود أن ألفت انتباهكم إلى إحدى ميزات عمل Yandex مثل وجود مستند واحد فقط من كل موقع في نتائج البحث لطلب معين. حتى وقت قريب، لم يكن من الممكن أن تكون هناك صفحتان من نفس المورد في مواضع مختلفة في نتائج البحث.

كانت هذه إحدى القواعد الأساسية لبرنامج Yandex. حتى لو كانت هناك مائة صفحة ذات صلة باستعلام معين في موقع واحد، فستظهر صفحة واحدة فقط (الأكثر صلة) في النتائج.

يهتم Yandex بتلقي المستخدم مجموعة متنوعة من المعلومات، وعدم التمرير عبر عدة صفحات من نتائج البحث بصفحات من نفس الموقع، والتي تبين أن هذا المستخدم لم يكن مثيرًا للاهتمام لسبب أو لآخر.

ومع ذلك، أسارع إلى تصحيح نفسي، لأنني عندما انتهيت من كتابة هذا المقال، علمت بالخبر أنه اتضح أن ياندكس بدأت في السماح بعرض مستند ثانٍ من نفس المورد في نتائج البحث، كاستثناء، إذا كانت هذه الصفحة تبين أنه "جيد جدًا ومناسب" (بمعنى آخر، أنه وثيق الصلة بالطلب).

واللافت هو أن هذه النتائج الإضافية من نفس الموقع مرقمة أيضًا، ولهذا السبب، ستسقط بعض الموارد التي تشغل مراكز أقل من الأعلى. فيما يلي مثال لمخرجات Yandex الجديدة:

تسعى محركات البحث إلى فهرسة جميع مواقع الويب بالتساوي، لكن هذا ليس بالأمر السهل في كثير من الأحيان نظرًا للاختلاف التام في عدد الصفحات الموجودة عليها (بعضها يحتوي على عشرة، بينما يحتوي البعض الآخر على عشرة ملايين). كيف تكون في هذه الحالة؟

تخرج ياندكس من هذا الموقف عن طريق الحد من عدد المستندات التي يمكنها وضعها في الفهرس من موقع واحد.

بالنسبة للمشاريع التي تحتوي على اسم نطاق من المستوى الثاني، على سبيل المثال، موقع ويب، فإن الحد الأقصى لعدد الصفحات التي يمكن فهرستها بواسطة مرآة Runet يتراوح بين مائة إلى مائة وخمسين ألفًا (يعتمد العدد المحدد على العلاقة للمشروع المحدد).

للموارد ذات اسم مجال المستوى الثالث - من عشرة إلى ثلاثين ألف صفحة (مستندات).

إذا كان لديك موقع ويب بنطاق المستوى الثاني ()، وتحتاج إلى فهرسة مليون صفحة ويب، على سبيل المثال، فإن السبيل الوحيد للخروج من هذا الموقف هو إنشاء العديد من النطاقات الفرعية ().

قد تبدو النطاقات الفرعية لمجال المستوى الثاني بالشكل التالي: JOOMLA.site. عدد النطاقات الفرعية للمستوى الثاني التي يمكن لـ Yandex فهرستها يزيد قليلاً عن 200 (أحيانًا يصل إلى ألف)، لذلك بهذه الطريقة البسيطة يمكنك وضع عدة ملايين من صفحات الويب في فهرس مرآة RuNet.

كيف تتعامل ياندكس مع المواقع في مناطق النطاق غير الروسية

نظرًا لحقيقة أنه حتى وقت قريب، بحثت Yandex فقط في الجزء الناطق باللغة الروسية من الإنترنت، فقد قامت بفهرسة المشاريع الناطقة باللغة الروسية بشكل أساسي.

لذلك، إذا كنت تقوم بإنشاء موقع ويب ليس في مناطق المجال، والتي يتم تصنيفها افتراضيًا على أنها باللغة الروسية (RU وSU وUA)، فلا تتوقع فهرسة سريعة، لأن على الأرجح أنه سيجده في موعد لا يتجاوز شهرًا. لكن الفهرسة اللاحقة ستحدث بنفس التردد كما هو الحال في مناطق المجال باللغة الروسية.

أولئك. تؤثر منطقة المجال فقط على الوقت الذي سيمضي قبل بدء الفهرسة، ولكنها لن تؤثر لاحقًا على تكرارها. بالمناسبة، على ماذا يعتمد هذا التردد؟

يعود منطق كيفية عمل محركات البحث لإعادة فهرسة الصفحات إلى ما يلي تقريبًا:

  1. بعد العثور على صفحة جديدة وفهرستها، يقوم الروبوت بزيارتها في اليوم التالي
  2. بعد مقارنة المحتويات بما كان بالأمس وعدم العثور على أي اختلافات، سيأتي الروبوت إليه مرة أخرى خلال ثلاثة أيام فقط
  3. إذا لم يتغير شيء هذه المرة، فسوف يأتي في غضون أسبوع، وما إلى ذلك.

الذي - التي. وبمرور الوقت، سيكون تكرار زيارات الروبوت لهذه الصفحة مساويًا أو مشابهًا لتكرار تحديثاته. علاوة على ذلك، يمكن قياس زمن عودة الروبوت لمواقع مختلفة بالدقائق والسنوات.

هذه هي محركات البحث الذكية التي تنشئ جدول زيارات فرديًا لصفحات مختلفة من موارد متنوعة. ومع ذلك، من الممكن إجبار محركات البحث على إعادة فهرسة صفحة ما بناءً على طلبنا، حتى لو لم يتغير شيء عليها، ولكن المزيد عن ذلك في مقال آخر.

سنواصل دراسة مبادئ البحث في المقال القادم، حيث سننظر إلى المشاكل التي تواجهها محركات البحث ونأخذ في الاعتبار الفروق الدقيقة. حسنًا، وأكثر من ذلك بكثير، بالطبع، يساعد بطريقة أو بأخرى.

كل التوفيق لك! نراكم قريبا على صفحات موقع المدونة

أنت قد تكون مهتم

Rel Nofollow وNoindex - كيفية منع الروابط الخارجية على موقع ويب من الفهرسة بواسطة Yandex وGoogle
مع الأخذ في الاعتبار شكل اللغة والمشكلات الأخرى التي تحلها محركات البحث، وكذلك الفرق بين الاستعلامات عالية التردد ومتوسطة المدى ومنخفضة التردد
ثقة الموقع - ما هي وكيفية قياسها في XTools وما الذي يؤثر عليها وكيفية زيادة سلطة موقعك
مصطلحات تحسين محركات البحث (SEO) والمختصرات والمصطلحات
الملاءمة والتصنيف - ما هو وما هي العوامل التي تؤثر على موضع المواقع في نتائج Yandex وGoogle
ما هي عوامل تحسين محرك البحث التي تؤثر على الترويج لموقع الويب وإلى أي مدى؟
تحسين النصوص في محرك البحث - التكرار الأمثل للكلمات الرئيسية وطولها المثالي
محتوى الموقع - كيف يساعد ملئه بمحتوى فريد ومفيد في الترويج لموقع الويب الحديث
العنوان والوصف والكلمات الرئيسية للعلامات الوصفية تعيق الترويج
تحديثات Yandex - ما هي وكيفية تتبع الثدي والتغييرات في نتائج البحث وجميع التحديثات الأخرى

في السنوات الأخيرة، أصبحت خدمات Google وYandex جزءًا من حياتنا. في هذا الصدد، ربما يتساءل الكثيرون ما هو محرك البحث؟ بعبارات بسيطة، هو نظام برمجي مصمم للبحث عن المعلومات على شبكة الإنترنت العالمية. وعادة ما يتم عرض نتائجها في شكل قائمة، تسمى غالبًا صفحات نتائج محرك البحث (SERPs). قد تكون المعلومات عبارة عن مجموعة من صفحات الويب والصور وأنواع الملفات الأخرى. تحتوي بعض محركات البحث أيضًا على معلومات متوفرة في قواعد البيانات أو الأدلة العامة.

على عكس أدلة الويب، التي لا يدعمها إلا المحررون الخاصون بها، تحتوي محركات البحث أيضًا على معلومات في الوقت الفعلي عن طريق تشغيل خوارزمية على زاحف الويب.

تاريخ المنشأ

ظهرت محركات البحث نفسها قبل ظهور شبكة الويب العالمية - في ديسمبر 1990. كانت الخدمة الأولى من نوعها تسمى Archie، وكانت تبحث في محتويات ملفات FTP باستخدام الأوامر.

ما هو محرك البحث على الإنترنت؟ حتى سبتمبر 1993، كانت شبكة الويب العالمية تتم فهرستها يدويًا بالكامل. كانت هناك قائمة بخوادم الويب التي تم تحريرها بواسطة Tim Berners-Lee والتي تمت استضافتها على خادم الويب CERN. مع اتصال المزيد والمزيد من الخوادم بالإنترنت، لم تتمكن الخدمة المذكورة أعلاه من مواكبة معالجة هذا القدر من المعلومات.

كان WebCrawler هو أحد محركات البحث الأولى التي تعتمد على عمليات البحث على الويب، والذي تم إصداره في عام 1994. على عكس سابقاتها، فقد سمح للمستخدمين بالبحث عن أي كلمة في أي صفحة ويب. أصبحت هذه الخوارزمية منذ ذلك الحين هي المعيار لجميع محركات البحث الرئيسية. وكان أيضًا أول قرار معروف على نطاق واسع للجمهور. وفي عام 1994 أيضًا، تم إطلاق خدمة لايكوس، والتي أصبحت فيما بعد مشروعًا تجاريًا كبيرًا.

وبعد فترة وجيزة ظهرت العديد من محركات البحث وازدادت شعبيتها بشكل ملحوظ. وتشمل هذه المواقع Magellan، وExcite، وInfoseek، وInktomi، وNorthern Light، وAltaVista. ياهو! كانت واحدة من أكثر الطرق شيوعًا للعثور على صفحات الويب ذات الأهمية، ولكن خوارزمية البحث الخاصة بها تعمل على دليل الويب الخاص بها بدلاً من نسخ النص الكامل للصفحات. يمكن للباحثين عن المعلومات أيضًا تصفح الدليل بدلاً من إجراء بحث عن الكلمات الرئيسية.

جولة جديدة من التطوير

تبنت جوجل فكرة بيع استعلامات البحث في عام 1998، وبدأت بشركة صغيرة تدعى goto.com. وكان لهذه الخطوة تأثير كبير على أعمال تحسين محركات البحث (SEO)، والتي أصبحت بمرور الوقت واحدة من أكثر الأنشطة ربحية على الإنترنت.

حوالي عام 2000، أصبح محرك بحث Google معروفًا على نطاق واسع. حققت الشركة نتائج أفضل للعديد من عمليات البحث من خلال ابتكار يسمى PageRank. تقوم هذه الخوارزمية التكرارية بتصنيف صفحات الويب بناءً على ارتباطاتها بالمواقع والصفحات الأخرى، استنادًا إلى فرضية أن المصادر الجيدة أو المرغوبة غالبًا ما يتم ذكرها من قبل الآخرين. حافظت Google أيضًا على واجهة بسيطة لمحرك البحث الخاص بها. على العكس من ذلك، قام العديد من المنافسين ببناء محرك بحث في بوابة الويب. في الواقع، أصبح Google مشهورًا جدًا لدرجة ظهور محركات الاحتيال مثل Mystery Seeker. يوجد اليوم العديد من الإصدارات الإقليمية لهذه الخدمة، على وجه الخصوص، محرك البحث Google.ru، المصمم للمستخدمين الناطقين باللغة الروسية.

كيف تعمل هذه الخدمات؟

كيف يتم عرض التصنيف والنتائج؟ ما هي محركات البحث من وجهة نظر خوارزمية العمل؟ يحصلون على المعلومات من خلال الزحف على شبكة الإنترنت من موقع إلى آخر. يتحقق الروبوت أو العنكبوت من اسم ملف robots.txt القياسي الموجه إليه قبل إرسال معلومات معينة للفهرسة. وهو يركز على العديد من العوامل، وهي الرؤوس ومحتوى الصفحة وجافا سكريبت وأوراق الأنماط المتتالية (CSS) وترميز HTML القياسي للمحتوى المعلوماتي أو بيانات التعريف في علامات تعريف HTML.

تعني الفهرسة ربط الكلمات والرموز المميزة الأخرى الموجودة على صفحات الويب بأسماء النطاقات الخاصة بها والحقول المستندة إلى HTML. يتم إنشاء الارتباطات في قاعدة بيانات يمكن الوصول إليها بشكل عام ومتاحة لاستعلامات بحث الويب. يمكن أن يكون الطلب من المستخدم كلمة واحدة. يساعدك الفهرس في العثور على المعلومات المتعلقة بالاستعلام في أسرع وقت ممكن.

بعض تقنيات الفهرسة والتخزين المؤقت هي أسرار تجارية، في حين أن الزحف على الويب هو عملية بسيطة لزيارة جميع مواقع الويب بطريقة منظمة.

بين زيارات الروبوت، يتم إرسال نسخة مخبأة من الصفحة (بعض أو كل المحتوى المطلوب لعرضها) المخزنة في الذاكرة العاملة لمحرك البحث بسرعة إلى المستخدم الطالب. إذا كانت الزيارة متأخرة، فيمكن لمحرك البحث أن يعمل ببساطة كوكيل ويب. وفي هذه الحالة، قد تختلف الصفحة عن فهارس البحث. يعرض المصدر المخبأ الإصدار الذي تمت فهرسة كلماته، لذا قد يكون مفيدًا في حالة فقدان الصفحة الفعلية.

هندسة معمارية رفيعة المستوى

عادةً ما يقوم المستخدم بإدخال استعلام في محرك البحث في شكل عدة كلمات رئيسية. يحتوي الفهرس بالفعل على أسماء المواقع التي تحتوي على هذه الكلمات الرئيسية، ويتم عرضها على الفور. عبء العمل الحقيقي هو إنشاء صفحات ويب تمثل قائمة بنتائج البحث. يجب ترتيب كل صفحة في القائمة بأكملها وفقًا للمعلومات الموجودة في الفهارس.

في هذه الحالة، يتطلب عنصر النتيجة العلوي البحث عن الأجزاء وإعادة بنائها وترميزها لإظهار السياق من الكلمات الأساسية المطابقة. وهذا ليس سوى جزء من معالجة كل صفحة ويب في نتائج البحث، وتتطلب الصفحات الأخرى (المجاورة لها) معظم هذه المعالجة اللاحقة.

بالإضافة إلى مجرد البحث عن الكلمات الرئيسية، تقدم محركات البحث عوامل التشغيل ومعلمات البحث الخاصة بها التي تعتمد على واجهة المستخدم الرسومية أو الأوامر لتحسين النتائج.

أنها توفر الضوابط اللازمة للمستخدم من خلال حلقة ردود الفعل والتصفية والوزن أثناء تحسين البيانات المطلوبة بناءً على الصفحات الأولية لنتائج البحث الأولى. على سبيل المثال، منذ عام 2007، أتاح موقع Google.com إمكانية تصفية القائمة الناتجة حسب التاريخ عن طريق النقر على "إظهار أدوات البحث" في العمود الموجود في أقصى اليسار في صفحة النتائج الأصلية ثم تحديد النطاق الزمني الذي تريده.

طلبات متفاوتة

تدعم معظم محركات البحث استخدام عوامل التشغيل المنطقية AND وOR وNOT لمساعدة المستخدمين النهائيين على تحسين استعلامهم. تم تصميم بعض عوامل التشغيل للأحرف الحرفية، مما يسمح للمستخدم بتحسين مصطلحات البحث وتوسيعها. يبحث الروبوت عن الكلمات أو العبارات بنفس الطريقة التي يبحث بها عن الأوامر المدخلة. توفر بعض محركات البحث ميزة بحث متقدمة تتيح للمستخدمين تحديد المسافة بين الكلمات الرئيسية.

هناك أيضًا بحث قائم على المفاهيم، حيث يتضمن البحث استخدام التحليل الإحصائي على الصفحات التي تحتوي على الكلمات أو العبارات التي تبحث عنها. بالإضافة إلى ذلك، تتيح الاستعلامات باللغة الطبيعية للمستخدم إدخال سؤال بنفس الطريقة التي يسأل بها الإنسان (المثال الأكثر شيوعًا هو Ask.com).

تعتمد فائدة محرك البحث على مدى ملاءمة مجموعة النتائج التي يعرضها. قد تكون هناك الملايين من صفحات الويب التي تحتوي على كلمة أو عبارة معينة، ولكن قد يكون بعضها أكثر صلة أو شهرة أو موثوقية من غيرها. تستخدم معظم محركات البحث أساليب التصنيف لضمان أفضل النتائج.

تختلف الطريقة التي يقرر بها محرك البحث أي الصفحات هي الأفضل للاستعلام، وبأي ترتيب يجب عرض المصادر التي تم العثور عليها، بشكل كبير من روبوت إلى آخر. تتغير هذه الأساليب أيضًا بمرور الوقت مع تغير استخدام الإنترنت وتطور التقنيات الجديدة.

ما هو محرك البحث: الأصناف

هناك نوعان رئيسيان من محركات البحث. الأول هو نظام من الكلمات الرئيسية المحددة مسبقًا والمرتبة هرميًا والتي برمجها الأشخاص بشكل جماعي باستخدامها. والثاني هو النظام الذي يولد "فهرسًا مقلوبًا" من خلال تحليل النصوص الموجودة.

معظم محركات البحث عبارة عن خدمات تجارية مدعومة بعائدات الإعلانات، وبالتالي يسمح بعضها للمعلنين بالترتيب في النتائج التي يعرضونها مقابل رسوم. الخدمات التي لا تقبل المال مقابل التصنيف تجني الأموال عن طريق تشغيل إعلانات سياقية بجوار المواقع التي تعرضها. يعد الترويج في محركات البحث اليوم أحد أكثر الأرباح ربحية على الإنترنت.

ما هي الخدمات الأكثر شيوعا؟

يعد Google محرك البحث الأكثر شعبية في العالم بحصة سوقية تبلغ 80.52% اعتبارًا من مارس 2017.

  • جوجل - 80.52%
  • بنج - 6.92%
  • بايدو - 5.94%
  • ياهو! - 5.35%

محركات البحث في روسيا وشرق آسيا

في روسيا وبعض دول شرق آسيا، جوجل ليست الخدمة الأكثر شعبية. بين المستخدمين الروس، يتصدر محرك بحث Yandex شعبيته (61.9٪) مقارنة بـ Google (28.3٪). في الصين، بايدو هي الخدمة الأكثر شعبية. يتم استخدام بوابة البحث Naver في كوريا الجنوبية في 70% من عمليات البحث عبر الإنترنت في البلاد. وأيضا ياهو! وهي الأداة الأكثر شيوعًا للعثور على البيانات الضرورية في اليابان وتايوان.

ومن محركات البحث الروسية الشهيرة الأخرى Mail وRambler. مع بداية تطوير Runet، استمتعوا بشعبية واسعة، لكنهم الآن فقدوا موقفهم إلى حد كبير.

قيود ومعايير البحث

على الرغم من أن محركات البحث مبرمجة لتصنيف مواقع الويب على أساس بعض شعبيتها وأهميتها، تشير الأبحاث التجريبية إلى معايير سياسية واقتصادية واجتماعية مختلفة لاختيار المعلومات التي تقدمها. قد تكون هذه التحيزات نتيجة مباشرة لأسباب اقتصادية (على سبيل المثال، الشركات التي تعلن عن محرك بحث قد تصبح أيضًا أكثر شعبية في نتائج البحث العضوية) والعمليات السياسية (على سبيل المثال، إزالة نتائج البحث بسبب القوانين المحلية). على سبيل المثال، لن يعرض جوجل بعض مواقع النازيين الجدد في فرنسا وألمانيا، حيث يعتبر إنكار الهولوكوست أمراً غير قانوني.

محركات البحث المسيحية والإسلامية واليهودية

لقد دفع النمو العالمي للإنترنت ووسائل الإعلام الإلكترونية في العالم الإسلامي على مدى العقد الماضي أتباع الإسلام في الشرق الأوسط وشبه القارة الآسيوية إلى محاولة إنشاء محركات البحث الخاصة بهم والبوابات المفلترة التي من شأنها أن تسمح للمستخدمين بإجراء عمليات بحث آمنة.

تحتوي هذه الخدمات على مرشحات تصنف مواقع الويب على أنها "حلال" أو "حرام" بناءً على تفسير الخبراء الحديث لـ "شريعة الإسلام".

ظهرت بوابة ImHalal على الإنترنت في سبتمبر 2011، وHalalgoogling في يوليو 2013. يستخدمون مرشحات حرام بناءً على خوارزميات من Google وBing.

وتشمل محركات البحث الأخرى ذات التوجه الديني Jewgle (النسخة اليهودية من Google) والموقع المسيحي SeekFind.org. يقومون بتصفية المواقع التي تنكر أو تحط من عقيدتهم.

خدمة الويب الأكثر شعبية في عصرنا هي محرك البحث. كل شيء مفهوم هنا، لأن الأيام التي كان فيها ممثلو مستخدمي الإنترنت الأوائل يمكنهم مراقبة المنتجات الجديدة على الإنترنت قد ولت منذ فترة طويلة.

تظهر وتتراكم الكثير من المعلومات بحيث أصبح من الصعب جدًا على الشخص العثور على ما يحتاج إليه بالضبط. تخيل كيف سيكون الأمر عند البحث على الإنترنت إذا كان على المستخدم العادي أن يبحث عن معلومات من أين الله أعلم. لكن لا تفهم أين، لأنك لن تجد الكثير من المعلومات من خلال البحث اليدوي.

محرك البحث، ما هو؟

من الجيد أن يعرف المستخدم بالفعل المواقع التي قد تحتوي على المعلومات الضرورية، ولكن ماذا يفعل بخلاف ذلك؟ من أجل تسهيل حياة الشخص في العثور على المعلومات الضرورية على الإنترنت، تم اختراع محركات البحث أو ببساطة محركات البحث. يؤدي محرك البحث وظيفة واحدة مهمة جدًا، والتي بدونها لن يكون الإنترنت كما اعتدنا على رؤيته - وهو البحث عن معلومات على الإنترنت.

نظام البحث- هذا موقع ويب خاص أو بمعنى آخر موقع يوفر للمستخدمين، بناءً على طلباتهم، روابط تشعبية لصفحات المواقع التي تستجيب لاستعلام بحث معين.

لكي نكون أكثر دقة، فهو بحث عن معلومات على الإنترنت، يتم إجراؤه بفضل مجموعة وظائف البرامج والأجهزة وواجهة الويب للتفاعل مع المستخدمين.

بالنسبة للتفاعل البشري مع محرك البحث، تم إنشاء واجهة ويب، أي قذيفة مرئية ومفهومة. هذا النهج الذي يتبعه مطورو محركات البحث يجعل البحث أسهل للعديد من الأشخاص. كقاعدة عامة، يتم إجراء عمليات البحث على الإنترنت باستخدام محركات البحث، ولكن هناك أيضًا أنظمة بحث لخوادم FTP، أو أنواع معينة من البضائع على شبكة الويب العالمية، أو معلومات الأخبار أو اتجاهات البحث الأخرى.

يمكن إجراء البحث ليس فقط من خلال المحتوى النصي للمواقع، ولكن أيضًا من خلال أنواع أخرى من المعلومات التي يمكن للشخص البحث عنها: الصور ومقاطع الفيديو وملفات الصوت وما إلى ذلك.

كيف يقوم محرك البحث بالبحث؟

من الممكن البحث في الإنترنت نفسه، تمامًا مثل تصفح مواقع الويب، باستخدام متصفح الإنترنت. فقط بعد أن يحدد المستخدم استعلامه في شريط البحث، يتم إجراء البحث مباشرة.

يحتوي أي نظام بحث على جزء برمجي تعتمد عليه آلية البحث بأكملها، ويسمى محرك البحث - وهي عبارة عن حزمة برامج توفر القدرة على البحث عن المعلومات. بعد الاتصال بمحرك بحث، يقوم الشخص بإنشاء استعلام بحث وإدخاله في شريط البحث، يقوم محرك البحث بإنشاء صفحة تحتوي على قائمة نتائج البحث، والأكثر صلة، في رأي محرك البحث، موجودة أعلى.

ملاءمة البحث - البحث عن المواد الأكثر صلة بطلب المستخدم ووضع روابط تشعبية عليها في صفحة نتائج البحث مع نتائج أكثر دقة عن غيرها. توزيع النتائج في حد ذاته يسمى تصنيف الموقع.

إذًا كيف يقوم محرك البحث بإعداد مواده للنشر وكيف يقوم محرك البحث نفسه بالبحث عن المعلومات؟ يتم تسهيل جمع المعلومات على الشبكة عن طريق روبوت أو بوت فريد لكل محرك بحث، والذي له أيضًا عدد من المرادفات الأخرى مثل الزاحف أو العنكبوت، ويمكن تقسيم عمل نظام البحث نفسه إلى ثلاث مراحل:

تتضمن المرحلة الأولى من تشغيل محرك البحث مسح المواقع الموجودة على الشبكة العالمية وجمع نسخ من صفحات الويب على خوادمه الخاصة. يؤدي هذا إلى إنشاء كمية هائلة من المعلومات التي لم تتم معالجتها بعد وغير مناسبة لنتائج البحث.

تتلخص المرحلة الثانية من عمل محرك البحث في ترتيب المعلومات الواردة مسبقًا، في المرحلة الأولى، من المواقع. يتم إجراء الفرز بطريقة تؤدي في أقل قدر من الوقت إلى البحث عالي الجودة الذي يتوقعه المستخدمون بالفعل من محرك البحث. تسمى المرحلة بالفهرسة، مما يعني أن الصفحات معدة بالفعل للإصدار، وستعتبر قاعدة البيانات الحالية فهرسًا.

وهي المرحلة الثالثة بالتحديد التي تحدد نتائج البحث، بعد تلقي طلب من عميلها، بناءً على الكلمات المفتاحية أو الكلمات المفتاحية القريبة المحددة في الطلب. وهذا يسهل اختيار المعلومات الأكثر صلة بالطلب وتسليمها لاحقًا. نظرًا لوجود الكثير والكثير من المعلومات، يقوم محرك البحث بالتصنيف وفقًا لخوارزمياته.
يعتبر أفضل محرك بحث هو المحرك الذي يمكنه توفير المواد التي تستجيب بشكل صحيح لطلب المستخدم. ولكن هنا أيضًا قد تكون هناك نتائج تأثرت بأشخاص مهتمين بالترويج لموقعهم، فمثل هذه المواقع، وإن لم يكن دائمًا، تظهر غالبًا في نتائج البحث، ولكن ليس لفترة طويلة.

على الرغم من أنه تم بالفعل تحديد قادة العالم في العديد من المناطق، إلا أن محركات البحث تواصل تطوير بحثها عالي الجودة. كلما كان البحث أفضل يمكنهم تقديمه، كلما زاد عدد الأشخاص الذين يستخدمونه.

كيفية استخدام محرك البحث؟

ما هو محرك البحث وكيف يعمل واضح بالفعل، ولكن كيفية استخدامه بشكل صحيح؟ تحتوي معظم المواقع دائمًا على شريط بحث، وبجانبه يوجد زر بحث أو بحث. يتم إدخال استعلام في سطر البحث، وبعد ذلك تحتاج إلى الضغط على زر البحث أو، كما هو الحال في أغلب الأحيان، اضغط على مفتاح Enter على لوحة المفاتيح وفي غضون ثوان تتلقى نتيجة الاستعلام في النموذج من القائمة.

ولكن ليس من الممكن دائمًا الحصول على الإجابة الصحيحة لاستعلام البحث في المرة الأولى. للتأكد من أن البحث عما تريده لا يصبح مؤلمًا، يجب عليك إنشاء استعلام البحث الخاص بك بشكل صحيح واتباع التوصيات الموضحة أدناه.

نحن نؤلف استعلام البحث بشكل صحيح

فيما يلي نصائح لاستخدام محرك البحث. إن اتباع بعض الحيل والقواعد عند البحث عن المعلومات في محرك البحث سيجعل من الممكن الحصول على النتيجة المرجوة بشكل أسرع بكثير. اتبع هذه الإرشادات:

  1. يضمن التهجئة الصحيحة للكلمات الحد الأقصى لعدد التطابقات مع كائن المعلومات المطلوب (على الرغم من أن محركات البحث الحديثة قد تعلمت بالفعل تصحيح الأخطاء الإملائية، إلا أنه لا ينبغي إهمال هذه النصيحة).
  2. باستخدام المرادفات في الاستعلام الخاص بك، يمكنك تغطية نطاق بحث أوسع.
  3. في بعض الأحيان، قد يؤدي تغيير كلمة في نص الاستعلام إلى نتائج أفضل؛ لذا قم بإعادة تنسيق الاستعلام.
  4. أضف الخصوصية إلى استعلامك، واستخدم التكرارات الدقيقة للعبارات التي يجب أن تحدد الجوهر الرئيسي للبحث.
  5. تجربة مع الكلمات الرئيسية. يمكن أن يساعد استخدام الكلمات الرئيسية والعبارات في تحديد النقطة الرئيسية، وسيعرض محرك البحث نتائج أكثر صلة.

لذا فإن محرك البحث ليس أكثر من مجرد فرصة للعثور على معلومات تهمك وعادةً ما تستخدمها مجانًا تمامًا، أو تتعلم شيئًا ما، أو تفهم شيئًا ما، أو تتوصل إلى الاستنتاج الصحيح بنفسك. لم يعد بإمكان الكثير من الأشخاص تخيل حياتهم بدون البحث الصوتي، حيث ليست هناك حاجة لكتابة نص، ما عليك سوى نطق طلبك، وجهاز إدخال المعلومات هنا هو الميكروفون. كل هذا يشير إلى التطور المستمر لتقنيات البحث على الإنترنت والحاجة إليها.

محرك البحث هو قاعدة بيانات لمعلومات محددة على الإنترنت. يعتقد العديد من المستخدمين أنه بمجرد إدخال استعلام في محرك البحث، يتم الزحف إلى الإنترنت بالكامل على الفور، لكن هذا ليس صحيحًا على الإطلاق. يتم فحص الإنترنت بشكل مستمر، عن طريق العديد من البرامج، ويتم إدخال البيانات الخاصة بالمواقع في قاعدة بيانات، حيث يتم، وفقًا لمعايير معينة، توزيع جميع المواقع وجميع صفحاتها إلى أنواع مختلفة من القوائم وقواعد البيانات. وهذا يعني أنه نوع من خزانة الملفات، ولا يتم البحث على الإنترنت، ولكن في خزانة الملفات هذه.

جوجل هو محرك البحث الأكثر شعبية في العالم.

وبالإضافة إلى محرك البحث، تقدم شركة جوجل العديد من الخدمات والبرامج والأجهزة الإضافية، بما في ذلك خدمة البريد الإلكتروني ومتصفح جوجل كروم وأكبر مكتبة فيديو على اليوتيوب والعديد من المشاريع الأخرى. تشتري Google بثقة العديد من المشاريع التي تحقق أرباحًا كبيرة. معظم الخدمات لا تستهدف المستخدم المباشر، بل تهدف إلى كسب المال على الإنترنت وهي متكاملة مع التركيز على مصالح المستخدمين الأوروبيين والأمريكيين.

البريد هو محرك بحث يحظى بشعبية كبيرة بسبب خدمة البريد الإلكتروني التي يقدمها.

هناك العديد من الخدمات الإضافية، مفتاحها هو Mail، في الوقت الحالي تمتلك شركة Mail شبكة التواصل الاجتماعي Odnoklassniki، وشبكتها الخاصة "My World"، وخدمة Money-mail، والعديد من الألعاب عبر الإنترنت، وثلاثة متصفحات متطابقة تقريبًا بأسماء مختلفة . تحتوي جميع التطبيقات والخدمات على الكثير من المحتوى الإعلاني. تحظر الشبكة الاجتماعية VKonatkte الانتقالات المباشرة إلى خدمات البريد، مما يبررها بعدد كبير من الفيروسات.

ويكيبيديا.

ويكيبيديا هي نظام مرجعي للبحث.

وبالتالي فإن محرك البحث غير الربحي، الذي يعمل على التبرعات الخاصة، لا يملأ صفحاته بالإعلانات. مشروع متعدد اللغات هدفه إنشاء موسوعة مرجعية كاملة بجميع لغات العالم. ليس لديها مؤلفين محددين ويتم ملؤها وإدارتها من قبل متطوعين من جميع أنحاء العالم. يمكن لكل مستخدم كتابة وتحرير مقال.

الصفحة الرسمية - www.wikipedia.org.

يوتيوب هو أكبر مكتبة لملفات الفيديو.

استضافة الفيديو مع عناصر الشبكة الاجتماعية، حيث يمكن لكل مستخدم إضافة مقطع فيديو. منذ استحواذ شركة Google Ink عليها، لم تعد هناك حاجة للتسجيل المنفصل لموقع YouTube، فقط قم بالتسجيل في خدمة البريد الإلكتروني الخاصة بشركة Google.

الصفحة الرسمية - youtube.com.

ياهو! هو ثاني أهم محرك بحث في العالم.

وهناك خدمات إضافية أشهرها بريد الياهو. كجزء من تحسين جودة محرك البحث، تنقل Yahoo البيانات المتعلقة بالمستخدمين واستعلاماتهم إلى Microsoft. ومن هذه البيانات يتم تكوين فكرة عن اهتمامات المستخدمين، ويتم تشكيل سوق للمحتوى الإعلاني. يشارك محرك بحث Yahoo، مثل، في الاستحواذ على شركات أخرى، على سبيل المثال، تمتلك Yahoo خدمة البحث Altavista وموقع التجارة الإلكترونية Alibaba.

الصفحة الرسمية - www.yahoo.com.

WDL هي مكتبة رقمية.

تقوم المكتبة بجمع الكتب التي تقدم قيمة ثقافية في شكل رقمي. الهدف الرئيسي هو زيادة مستوى المحتوى الثقافي للإنترنت. الدخول إلى المكتبة مجاني.

الصفحة الرسمية - www.wdl.org/ru/.

Bing هو محرك بحث من Microsoft.

الصفحة الرسمية - www.baidu.com.

محركات البحث في روسيا

Rambler هو محرك بحث "مؤيد لأمريكا".

في البداية تم إنشاؤه كبوابة إعلامية عبر الإنترنت. مثل العديد من محركات البحث الأخرى، فهو يحتوي على خدمات بحث للصور وملفات الفيديو والخرائط والتنبؤات الجوية وقسم الأخبار وغير ذلك الكثير. يقدم الناشرون أيضًا متصفحًا مجانيًا، Rambler-Nichrome.

الصفحة الرسمية - www.rambler.ru.

Nigma هو محرك بحث ذكي.

محرك بحث أكثر ملاءمة لوجود العديد من المرشحات والإعدادات. تتيح لك الواجهة تضمين أو استبعاد القيم المشابهة المقترحة في البحث للحصول على نتائج أفضل. وأيضًا، عند تلقي نتيجة بحث، فإنه يسمح لك باستخدام المعلومات من محركات البحث الرئيسية الأخرى.

الصفحة الرسمية - www.nigma.ru.

Aport - كتالوج المنتجات عبر الإنترنت.

في الماضي كان محرك بحث، ولكن بعد توقف التطوير والابتكار، فقد بسرعة مكانته و . تعد Aport حاليًا منصة تداول حيث يتم عرض منتجات أكثر من 1500 شركة.

الصفحة الرسمية - www.aport.ru.

سبوتنيك هو محرك بحث وطني وبوابة إنترنت.

تم إنشاؤها بواسطة روستيليكوم. حاليا في مرحلة الاختبار.

الصفحة الرسمية - www.sputnik.ru.

Metabot هو محرك بحث متنامي.

تتمثل مهام Metabot في إنشاء محرك بحث لجميع محركات البحث الأخرى، وإنشاء مواضع النتائج مع مراعاة البيانات من القائمة الكاملة لمحركات البحث. أي أنه محرك بحث لمحركات البحث.

الصفحة الرسمية - www.metabot.ru.

لقد تم تعليق محرك البحث.

الصفحة الرسمية - www.turtle.ru.

KM هو متعدد البوابات.

في البداية، كان الموقع متعدد البوابات، ثم تم إدخال محرك البحث لاحقًا. يمكن إجراء البحث داخل الموقع وعبر جميع مواقع RuNet المراقبة.

الصفحة الرسمية - www.km.ru.

جوجو - لا يعمل، يعيد التوجيه إلى محرك البحث.

الصفحة الرسمية - www.gogo.ru.

إن البوابات الروسية المتعددة، التي لا تحظى بشعبية كبيرة، تتطلب التحسين. يتضمن محرك البحث الأخبار والتلفزيون والألعاب والخريطة.

الصفحة الرسمية - www.zoneru.org.

محرك البحث لا يعمل، يقترح المطورون استخدام محرك البحث.