جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في الجوهر هناك النموذج اللغوي الكبير، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مستنيرة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائداً في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل حجم النص الناتج، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع تقديم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء مقاييس الأداء العامة والإثارة الإعلامية - وما يعنيه ذلك لبناء أدوات مساعدة في البرمجة، ومساعدين للمطورين، ووكلاء متعددي الوسائط.