Artwork

المحتوى المقدم من Conviction. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Conviction أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

Asimov: Building An Omniscient RL Oracle with ReflectionAI’s Misha Laskin

1:02:54
 
مشاركة
 

Manage episode 494936280 series 3444082
المحتوى المقدم من Conviction. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Conviction أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Superintelligence, at least in an academic sense, has already been achieved. But Misha Laskin thinks that the next step towards artificial superintelligence, or ASI, should look both more user and problem-focused. ReflectionAI co-founder and CEO Misha Laskin joins Sarah Guo to introduce Asimov, their new code comprehension agent built on reinforcement learning (RL). Misha talks about creating tools and designing AI agents based on customer needs, and how that influences eval development and the scope of the agent’s memory. The two also discuss the challenges in solving scaling for RL, the future of ASI, and the implications for Google’s “non-acquisition” of Windsurf.

Sign up for new podcasts every week. Email feedback to [email protected]

Follow us on Twitter: @NoPriorsPod | @Saranormous | @EladGil | @MishaLaskin | @reflection_ai

Chapters:

00:00 – Misha Laskin Introduction

00:44 – Superintelligence vs. Super Intelligent Autonomous Systems

03:26 – Misha’s Journey from Physics to AI

07:48 – Asimov Product Release

11:52 – What Differentiates Asimov from Other Agents

16:15 – Asimov’s Eval Philosophy

21:52 – The Types of Queries Where Asimov Shines

24:35 – Designing a Team-Wide Memory for Asimov

28:38 – Leveraging Pre-Trained Models

32:47 – The Challenges of Solving Scaling in RL

37:21 – Training Agents in Copycat Software Environments

38:25 – When Will We See ASI?

44:27 – Thoughts on Windsurf’s Non-Acquisition

48:10 – Exploring Non-RL Datasets

55:12 – Tackling Problems Beyond Engineering and Coding

57:54 – Where We’re At in Deploying ASI in Different Fields

01:02:30 – Conclusion

  continue reading

135 حلقات

Artwork
iconمشاركة
 
Manage episode 494936280 series 3444082
المحتوى المقدم من Conviction. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Conviction أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Superintelligence, at least in an academic sense, has already been achieved. But Misha Laskin thinks that the next step towards artificial superintelligence, or ASI, should look both more user and problem-focused. ReflectionAI co-founder and CEO Misha Laskin joins Sarah Guo to introduce Asimov, their new code comprehension agent built on reinforcement learning (RL). Misha talks about creating tools and designing AI agents based on customer needs, and how that influences eval development and the scope of the agent’s memory. The two also discuss the challenges in solving scaling for RL, the future of ASI, and the implications for Google’s “non-acquisition” of Windsurf.

Sign up for new podcasts every week. Email feedback to [email protected]

Follow us on Twitter: @NoPriorsPod | @Saranormous | @EladGil | @MishaLaskin | @reflection_ai

Chapters:

00:00 – Misha Laskin Introduction

00:44 – Superintelligence vs. Super Intelligent Autonomous Systems

03:26 – Misha’s Journey from Physics to AI

07:48 – Asimov Product Release

11:52 – What Differentiates Asimov from Other Agents

16:15 – Asimov’s Eval Philosophy

21:52 – The Types of Queries Where Asimov Shines

24:35 – Designing a Team-Wide Memory for Asimov

28:38 – Leveraging Pre-Trained Models

32:47 – The Challenges of Solving Scaling in RL

37:21 – Training Agents in Copycat Software Environments

38:25 – When Will We See ASI?

44:27 – Thoughts on Windsurf’s Non-Acquisition

48:10 – Exploring Non-RL Datasets

55:12 – Tackling Problems Beyond Engineering and Coding

57:54 – Where We’re At in Deploying ASI in Different Fields

01:02:30 – Conclusion

  continue reading

135 حلقات

كل الحلقات

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع

حقوق الطبع والنشر 2025 | سياسة الخصوصية | شروط الخدمة | | حقوق النشر
استمع إلى هذا العرض أثناء الاستكشاف
تشغيل