جميعهم يبنون وكلاء الذكاء الاصطناعي - ولكن في المقام الأول يأتي النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في عملية اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة جرى فيها اختبار 15 نموذجًا رائداً في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل التفاصيل الزائدة، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفاد. ننتظر أن نقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء الاختبارات القياسية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء وكلاء مساعدين للبرمجة، ومساعدين للمطورين، وأوكلاء متعددي الوسائط.