Artwork

المحتوى المقدم من Whitehat SEO and Whitehat Inbound Marketing Agency. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Whitehat SEO and Whitehat Inbound Marketing Agency أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

Unpacking OpenAI's Latest Reasoning Models

11:32
 
مشاركة
 

Manage episode 442461526 series 2330470
المحتوى المقدم من Whitehat SEO and Whitehat Inbound Marketing Agency. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Whitehat SEO and Whitehat Inbound Marketing Agency أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

93 حلقات

Artwork
iconمشاركة
 
Manage episode 442461526 series 2330470
المحتوى المقدم من Whitehat SEO and Whitehat Inbound Marketing Agency. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Whitehat SEO and Whitehat Inbound Marketing Agency أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

93 حلقات

كل الحلقات

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع

استمع إلى هذا العرض أثناء الاستكشاف
تشغيل