كل شخص يبني وكلاء ذكاء اصطناعي - ولكن في المقام الأول يأتي النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة تعتمد على البيانات؟ في هذا الجلسة، سنغوص في اختيار النماذج اللغوية الكبيرة. وسنشارك نتائج دراسة اختبرت 15 نموذجًا رائدًا في مهام تلخيص الشيفرات البرمجية الواقعية، باستخدام مقاييس عملية مثل التوسع في العبارات، زمن الانتظار، التكلفة، الدقة، وكمية المعلومات المستفادة. نُتوقع وضوحًا في الرؤى حول أداء النماذج الحالية فعليًا - وراء مقاييس الأداء والضجة الإعلامية - وماذا يعني ذلك لبناء وكلاء مساعدين في البرمجة، ومساعدين مطورين، ووكلاء متعددي الوسائط.