جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في الجوهر يوجد النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة وقائمة على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدة في مهام تلخيص التعليمات البرمجية الواقعية، باستخدام مقاييس عملية مثل الطول الزائد، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع تقديم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء المعايير المرجعية والضجة الإعلامية - وما يعنيه ذلك لبناء مساعدين برمجيين، ومساعدين مطورين، ووكلاء متعددي الوسائط.