جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المحور يوجد النموذج اللغوي الكبير، واختيار النموذج الصحيح أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة جرى فيها اختبار 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل حجم الإخراج، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفادة. نتوقع أن تقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء الاختبارات القياسية والتضخيم الإعلامي - وما يعنيه ذلك بالنسبة لبناء مساعدي البرمجة، والمساعدين الرقميين للمطورين، والوكلاء متعددي الوسائط.