venturebeatمنذ 11 ي
لقد سارعت المؤسسات بتبني استرجاع المعلومات المعزز بالتوليد (RAG) لتأسيس نماذج اللغات الكبيرة (LLMs) على بيانات مملوكة. إلا أنه عمليًا، تكتشف العديد من المؤسسات أن الاسترجاع لم يعد ميزة ملحقة باستنتاج النموذج - بل أصبح اعتمادًا نظاميًا أساسيًا. بمجرد نشر أنظمة الذكاء الاصطناعي لدعم اتخاذ القرارات أو أتمتة سير العمل أو العمل بشكل شبه مستقل، فإن الإخفاقات في الاسترجاع تنتقل مباشرة إلى مخاطر الأعمال. إن السياق القديم ومسارات الوصول غير المنظمة وخطوط أنابيب الاسترجاع التي تم تقييمها بشكل سيئ لا تقلل فقط من جودة الإجابة؛ بل تقوض الثقة والامتثال والموثوقية التشغيلية.
تعيد هذه المقالة صياغة الاسترجاع على أنه بنية تحتية وليس منطق تطبيق. وتقدم نموذجًا على مستوى النظام لتصميم منصات استرجاع تدعم الحداثة والحوكمة والتقييم باعتبارها اهتمامات معمارية أساسية. الهدف هو مساعدة مهندسي المؤسسات وقادة منصات الذكاء الاصطناعي وفرق البنية التحتية للبيانات على التفكير في أنظمة الاسترجاع بنفس الدقة التي كانت تُطبق تاريخيًا على الحوسبة والشبكات والتخزين.
الاسترجاع كبنية تحتية - بنية مرجعية توضح كيف تعمل الحداثة والحوكمة والتقييم كطبقات نظام أساسية وليست منطق تطبيق مضمن. رسم تخطيطي مفاهيمي تم إنشاؤه بواسطة المؤلف.
لماذا تنهار RAG على نطاق واسع في المؤسسات
تم تصميم تطبيقات RAG المبكرة لحالات استخدام ضيقة: البحث عن المستندات والأسئلة والأجوبة الداخلية والطيارين الآليين الذين يعملون ضمن نطاقات محددة بإحكام. افترضت هذه التصميمات مجموعات بيانات ثابتة نسبيًا وأنماط وصول يمكن التنبؤ بها ورقابة بشرية في الحلقة. لم تعد هذه الافتراضات صالحة.
تعتمد أنظمة الذكاء الاصطناعي الحديثة في المؤسسات بشكل متزايد على:
مصادر بيانات متغيرة باستمرار
الاستدلال متعدد الخطوات عبر المجالات
سير عمل مدفوع بالوكلاء يسترجع السياق بشكل مستقل
المتطلبات التنظيمية ومتطلبات التدقيق المرتبطة باستخدام البيانات
في هذه البيئات، تتضاعف إخفاقات الاسترجاع بسرعة. يمكن لفهرس واحد قديم أو سياسة وصول غير صحيحة أن تنتقل عبر قرارات متعددة في المراحل النهائية. إن معاملة الاسترجاع على أنه تحسين بسيط لمنطق الاستنتاج تخفي دوره المتزايد كسطح مخاطر نظامية.
حداثة الاسترجاع هي مشكلة نظام، وليست مشكلة ضبط
نادراً ما تنشأ إخفاقات الحداثة في نماذج التضمين. إنها تنشأ في النظام المحيط.
تكافح معظم مجموعات استرجاع المعلومات في المؤسسات للإجابة على الأسئلة التشغيلية الأساسية:
ما مدى سرعة انتقال التغييرات المصدر إلى الفهارس؟
من هم المستهلكون الذين ما زالوا يستعلمون عن التمثيلات القديمة؟
ما هي الضمانات الموجودة عند تغيير البيانات في منتصف الجلسة؟
في المنصات الناضجة، يتم فرض الحداثة من خلال آليات معمارية صريحة بدلاً من عمليات إعادة بناء دورية. وتشمل هذه إعادة الفهرسة المدفوعة بالأحداث والتضمينات ذات الإصدارات والوعي في وقت الاسترجاع بتقادم البيانات.
عبر عمليات نشر المؤسسات، فإن النمط المتكرر هو أن إخفاقات الحداثة نادرًا ما تأتي من جودة التضمين؛ فهي تظهر عندما تتغير الأنظمة المصدر باستمرار بينما يتم تحديث خطوط أنابيب الفهرسة والتضمين بشكل غير متزامن، مما يترك مستهلكي الاسترجاع يعملون دون علم على سياق قديم. نظرًا لأن النظام لا يزال ينتج إجابات بطلاقة ومقبولة، غالبًا ما تمر هذه الفجوات دون أن يلاحظها أحد حتى تعتمد مهام سير العمل المستقلة على الاسترجاع باستمرار وتظهر مشكلات الموثوقية على نطاق واسع.
يجب أن تمتد الحوكمة إلى طبقة الاسترجاع
تم تصميم معظم نماذج حوكمة المؤسسات للوصول إلى البيانات واستخدام النموذج بشكل مستقل. تجلس أنظمة الاسترجاع بشكل غير مريح بين الاثنين.
يقدم الاسترجاع غير