جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المراكز الأساسية توجد النماذج اللغوية الكبيرة، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذه الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل حجم الإخراج، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفاد. نُتوقع أن تحصل على رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء المقاييس القياسية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء أدوات مساعدة البرمجة، وزملاء المطورين الافتراضيين، والوكلاء متعددي الوسائط.