جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في الجوهر هناك النموذج اللغوي الكبير (LLM)، واختيار النموذج الصحيح أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة اختبرت 15 نموذجًا رائداً في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل الإسهاب، زمن الاستجابة، التكلفة، الدقة، وكم المعلومات المستفاد. نتوقع أن تقدم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء المعايير المرجعية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء أدوات مساعدة في البرمجة، ومساعدات للمطورين، ووكلاء متعددي الوسائط.