مسرد الموثوقية

ما هي مراقبة زمن التشغيل؟

مراقبة زمن التشغيل ممارسة فحص توفّر الخدمة واستجابتها بشكل متكرّر من خارج النظام، كي تعرف أنها متوقّفة في اللحظة التي يعرفها مستخدموك.

تعريف مراقبة زمن التشغيل

تعمل مراقبة زمن التشغيل بإرسال طلبات إلى خدمتك من نقاط مراقبة خارجية وفق جدول ثابت — مثلًا كل 30 ثانية — وتسجيل ما إذا نجح كلٌّ منها وكم استغرق. ولأن الفحوص تنشأ خارج بنيتك التحتية، فهي تلتقط أعطالًا قد تفوتها المراقبة الداخلية: موزّع حمل ميّت، أو شهادة TLS منتهية، أو إعداد DNS خاطئ يجعل الخدمة كلها غير قابلة للوصول.

يحدّد المرقاب معنى «يعمل»: حالة HTTP ناجحة، أو استجابة ضمن عتبة زمنية، أو وجود نصّ متوقّع في الجسم. وحين تفشل فحوص متتالية كافية، يُعلن المرقاب توقّف الخدمة ويُطلق تنبيهًا. والفترة، والمواقع الجغرافية للفاحصين، ومعايير الفشل، كلها أمور تضبطها أنت.

كيف تعمل مراقبة زمن التشغيل

بضعة خيارات في الإعداد تحدّد سرعة مراقبتك لزمن التشغيل ومدى موثوقيتها وأهميّتها.

فترة الفحص

كم مرّة يفحص المرقاب خدمتك. فالفترة الأقصر تكتشف الأعطال أسرع لكنها تولّد حركة أكثر؛ ودقيقة واحدة توازن شائع لمعظم الخدمات.

مواقع الفحص

الفحص من مناطق متعدّدة يميّز العطل الحقيقي عن خلل شبكي عابر في موقع واحد، ويكشف مشكلات تؤثّر فقط على مستخدمين في مناطق جغرافية معيّنة.

ما الذي يُعتبر توقّفًا

يمكن للمرقاب أن يتحقّق من رمز الحالة أو زمن الاستجابة أو محتوى الجسم أو صلاحية الشهادة. ولتفادي الإنذارات الكاذبة، يشترط معظمها عدّة إخفاقات متتالية قبل إعلان العطل.

التنبيه

حين يُطلَق المرقاب، يُخطر فريقك عبر القنوات التي تضبطها، فيعلم من يستطيع الإصلاح قبل أن يعلم سيل من شكاوى العملاء.

فحوص الشهادة وDNS

إلى جانب التوفّر البسيط، يمكن للمراقيب التحذير قبل انتهاء شهادة TLS أو كشف مشكلات DNS — أعطال تُسقِط خدمة كاملة لكنها ليست عيوبًا برمجية.

لماذا تهمّ مراقبة زمن التشغيل

مراقبة زمن التشغيل شبكة أمانك من الخارج إلى الداخل. فقد تبدو لوحاتك الداخلية خضراء تمامًا بينما لا يستطيع العملاء الوصول إليك إطلاقًا، لأن العطل في طبقة لا تراها قياساتك أبدًا. والفحص من الخارج هو السبيل الوحيد للثقة بأن الخدمة قابلة للوصول فعلًا.

وهي أيضًا أساس مؤشّر التوفّر لديك: فنسبة الفحوص الخارجية الناجحة عبر الزمن مقياس نظيف ومتوافق مع تجربة المستخدم لما إذا كنت تحقّق أهداف موثوقيتك. والاكتشاف السريع هنا يخفض MTTD مباشرةً — وبالتالي MTTR.

مراقبة زمن التشغيل في AllStak

تفحص مراقبة زمن التشغيل في AllStak نقاط نهايتك وفق جدول وتنبّه فريقك عند فشلها، فتعرف بالأعطال من أدواتك لا من عملائك. اقرنها بقواعد الإشعارات لتوجيه التنبيهات إلى الأشخاص المناسبين.

ولأن زمن التشغيل يعيش في المنصّة نفسها مع صفحات الحالة وتتبّع الأخطاء وإدارة الحوادث، يمكن لعطل خارجي أن ينتقل مباشرةً من الاكتشاف إلى تحديث حالة يواجه العميل دون مغادرة AllStak.

أسئلة شائعة عن مراقبة زمن التشغيل

كيف تختلف مراقبة زمن التشغيل عن APM؟

تفحص مراقبة زمن التشغيل التوفّر من خارج نظامك، فتجيب «هل يستطيع المستخدمون الوصول؟». أما APM فيُجهّز الشيفرة من الداخل ليشرح لماذا الطلب بطيء أو فاشل. وهما متكاملان: اكتشاف من الخارج وتشخيص من الداخل.

كم مرّة ينبغي تشغيل الفحوص؟

دقيقة واحدة افتراضي شائع. فالفترات الأقصر تكتشف الأعطال أسرع وتخفض زمن اكتشافك، لكنها تولّد حركة فحص أكثر — اختر بناءً على مدى أهمية نقطة النهاية.

ما الذي يُحتسب تعطّلًا؟

ما تحدّده معايير مرقابك — رمز حالة خاطئ، أو استجابة أبطأ من عتبتك، أو غياب محتوى متوقّع، أو شهادة غير صالحة. ولتقليل الإنذارات الكاذبة، تشترط معظم الأدوات عدّة إخفاقات متتالية.

لماذا المراقبة من مواقع متعدّدة؟

قد يبلّغ فاحص واحد عن إخفاق هو في الحقيقة مجرّد خلل في شبكته. والفحص من عدّة مناطق يؤكّد ما إذا كان العطل حقيقيًا، ويكشف مشكلات تؤثّر على بعض المناطق فقط.

اعرف بالأعطال قبل مستخدميك

تفحص مراقبة زمن التشغيل في AllStak نقاط نهايتك وتنبّه فريقك لحظة فشلها — موصولةً بصفحات حالتك وحوادثك. ابدأ مجانًا.