جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في الجوهر تكمن النماذج اللغوية الكبيرة (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة ومبنية على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنزود بنتائج دراسة جرى فيها اختبار 15 نموذجًا رائدة في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل الطول الزائد، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع أن تحصلوا على رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء الاختبارات المعيارية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء وكلاء مساعدين للبرمجة، ومساعدين للمطورين، وأجهزة متعددة الوسائط.