Meta تعلن عن تقنية جديد تستغنى عن العنصر البشري في تدريبات الذكاء الاصطناعي
الترند العربي – متابعات
أعلنت شركة Meta ، عن نموذج ذكاء اصطناعي يعلم نفسه والآخرين بشكل أساسي دون ردود فعل بشرية، جاء ذلك بعد أن أصبح الذكاء الاصطناعي متوفرًا في كل مكان في الوقت الحاضر، فقد رحبت العديد من شركات التكنولوجيا بالذكاء الاصطناعي كما أنشأ البعض نماذجهم الخاصة بدلاً من الاستفادة من نماذج الشركات الأخرى.
كل ماتريد معرفته عن تقنية Self-Taught Evaluator
وتعد Meta واحدة من اللاعبين الكبار في عالم التكنولوجيا، وقد أعلنت الآن عن نموذج ذكاء اصطناعي جديد يسمى “Self-Taught Evaluator” والهدف منه هو تقييم وتدريب نماذج الذكاء الاصطناعي الأخرى بشكل مستقل، خاصة أن تدريب الذكاء الاصطناعي مسعى مكلف للغاية، وهو سباق صعب للغاية في الوقت الحالي مع كل المنافسة.
ويستخدم المطورون تقنية تسمى “التعلم التعزيزي من ردود الفعل البشرية”، أو ما يشار إليه باسم RLAIF، لتدريب نماذج الذكاء الاصطناعي.
وتحتاج هذه التقنية إلى ردود فعل بشرية، وهذا يمكن أن يؤدي إلى عملية أبطأ ، حيث تعمل Meta على هذا الأمر من خلال “المقيِّم الذاتي التعلم” الجديد.
كيف تعمل هذه التقنية الجديدة؟
وأكد المطورون أن ردود الفعل البشرية ضرورية لضمان أن الذكاء الاصطناعي الذي في طور التطوير يقدم إجابات دقيقة وموثوقة، كما يتحقق من الأخطاء في معالجة البيانات، ومع ذلك، فإن النموذج الجديد قادر على تقييم وتدريب نماذج أخرى، وهو يستخدم تقنية تسمى “سلسلة الأفكار” التي استخدمتها OpenAI في نماذج o1
وتعالج تقنية “سلسلة الأفكار” المشكلات المعقدة من خلال تقسيمها إلى خطوات منطقية أصغر، وهذا يجعل الذكاء الاصطناعي يقدم إجابات أكثر دقة للمشكلات العلمية أو البرمجية أو الرياضية، كما تم تطوير نموذج Meta الجديد باستخدام هذه التقنية.
وبهذه الطريقة، يتدرب الذكاء الاصطناعي على البيانات التي يولدها الذكاء الاصطناعي.