جميعهم يبنون وكلاء ذكاء اصطناعي - ولكن في المقام الأول يأتي النموذج اللغوي الكبير (LLM)، واختيار النموذج المناسب أمر بالغ الأهمية. ومع إطلاق نماذج جديدة كل أسبوع، كيف يمكننا اتخاذ قرارات مدروسة تعتمد على البيانات؟ في هذا الجلسة، سنغوص في موضوع اختيار النماذج اللغوية الكبيرة. سنشارك نتائج دراسة قمنا بها لاختبار 15 نموذجًا رائدة في مهام تلخيص الشيفرات البرمجية الواقعية، مستخدمين مقاييس عملية مثل حجم الإخراج، زمن الاستجابة، التكلفة، الدقة، وكمية المعلومات المستفادة. نتوقع أن تُقدَّم لكم رؤى واضحة حول أداء النماذج الحالية فعليًا - وراء المعايير المرجعية والضجة الإعلامية - وما يعنيه ذلك بالنسبة لبناء مساعدات البرمجة، ومساعدات المطورين، والوكلاء متعددي الوسائط.