Artwork

المحتوى المقدم من Ziad Danasouri. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Ziad Danasouri أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

Salesforce Just KILLED ChatGPT

10:30
 
مشاركة
 

Manage episode 442563209 series 3447274
المحتوى المقدم من Ziad Danasouri. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Ziad Danasouri أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

The Salesforce AI Research team has developed a family of large language models (LLMs) called SFR-Judge. These models are designed to automatically evaluate the outputs of other LLMs, acting as "judge models" that provide feedback on the quality and effectiveness of responses. SFR-Judge models are trained on a diverse range of evaluation tasks, including pairwise comparisons, single ratings, and binary classification. The researchers demonstrate that SFR-Judge consistently outperforms other open-source and proprietary judge models, particularly in areas like reward modeling and instruction following. SFR-Judge is not only useful for evaluating LLMs but also for improving their performance through reinforcement learning from human feedback (RLHF). The team found that using explanations generated by SFR-Judge during RLHF training led to significant improvements in downstream model outputs.

  continue reading

29 حلقات

Artwork
iconمشاركة
 
Manage episode 442563209 series 3447274
المحتوى المقدم من Ziad Danasouri. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Ziad Danasouri أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

The Salesforce AI Research team has developed a family of large language models (LLMs) called SFR-Judge. These models are designed to automatically evaluate the outputs of other LLMs, acting as "judge models" that provide feedback on the quality and effectiveness of responses. SFR-Judge models are trained on a diverse range of evaluation tasks, including pairwise comparisons, single ratings, and binary classification. The researchers demonstrate that SFR-Judge consistently outperforms other open-source and proprietary judge models, particularly in areas like reward modeling and instruction following. SFR-Judge is not only useful for evaluating LLMs but also for improving their performance through reinforcement learning from human feedback (RLHF). The team found that using explanations generated by SFR-Judge during RLHF training led to significant improvements in downstream model outputs.

  continue reading

29 حلقات

كل الحلقات

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع