جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المقام الأول يأتي النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة وقائمة على البيانات؟ في هذه الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنتشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل التوسع في العبارات، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نُتوقع أن تحصلوا على رؤى واضحة حول أداء النماذج الحالية فعليًا - بعيدًا عن الاختبارات القياسية والتضخيم الإعلامي - وماذا يعني ذلك بالنسبة لبناء أدوات مساعدة في البرمجة، ومساعدات المطورين، والوكلاء متعددي الوسائط.