Artwork

المحتوى المقدم من Daniel Filan. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Daniel Filan أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

18 - Concept Extrapolation with Stuart Armstrong

1:46:19
 
مشاركة
 

Manage episode 340068925 series 2844728
المحتوى المقدم من Daniel Filan. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Daniel Filan أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Concept extrapolation is the idea of taking concepts an AI has about the world - say, "mass" or "does this picture contain a hot dog" - and extending them sensibly to situations where things are different - like learning that the world works via special relativity, or seeing a picture of a novel sausage-bread combination. For a while, Stuart Armstrong has been thinking about concept extrapolation and how it relates to AI alignment. In this episode, we discuss where his thoughts are at on this topic, what the relationship to AI alignment is, and what the open questions are.

Topics we discuss, and timestamps:

- 00:00:44 - What is concept extrapolation

- 00:15:25 - When is concept extrapolation possible

- 00:30:44 - A toy formalism

- 00:37:25 - Uniqueness of extrapolations

- 00:48:34 - Unity of concept extrapolation methods

- 00:53:25 - Concept extrapolation and corrigibility

- 00:59:51 - Is concept extrapolation possible?

- 01:37:05 - Misunderstandings of Stuart's approach

- 01:44:13 - Following Stuart's work

The transcript: axrp.net/episode/2022/09/03/episode-18-concept-extrapolation-stuart-armstrong.html

Stuart's startup, Aligned AI: aligned-ai.com

Research we discuss:

- The Concept Extrapolation sequence: alignmentforum.org/s/u9uawicHx7Ng7vwxA

- The HappyFaces benchmark: github.com/alignedai/HappyFaces

- Goal Misgeneralization in Deep Reinforcement Learning: arxiv.org/abs/2105.14111

  continue reading

41 حلقات

Artwork
iconمشاركة
 
Manage episode 340068925 series 2844728
المحتوى المقدم من Daniel Filan. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Daniel Filan أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Concept extrapolation is the idea of taking concepts an AI has about the world - say, "mass" or "does this picture contain a hot dog" - and extending them sensibly to situations where things are different - like learning that the world works via special relativity, or seeing a picture of a novel sausage-bread combination. For a while, Stuart Armstrong has been thinking about concept extrapolation and how it relates to AI alignment. In this episode, we discuss where his thoughts are at on this topic, what the relationship to AI alignment is, and what the open questions are.

Topics we discuss, and timestamps:

- 00:00:44 - What is concept extrapolation

- 00:15:25 - When is concept extrapolation possible

- 00:30:44 - A toy formalism

- 00:37:25 - Uniqueness of extrapolations

- 00:48:34 - Unity of concept extrapolation methods

- 00:53:25 - Concept extrapolation and corrigibility

- 00:59:51 - Is concept extrapolation possible?

- 01:37:05 - Misunderstandings of Stuart's approach

- 01:44:13 - Following Stuart's work

The transcript: axrp.net/episode/2022/09/03/episode-18-concept-extrapolation-stuart-armstrong.html

Stuart's startup, Aligned AI: aligned-ai.com

Research we discuss:

- The Concept Extrapolation sequence: alignmentforum.org/s/u9uawicHx7Ng7vwxA

- The HappyFaces benchmark: github.com/alignedai/HappyFaces

- Goal Misgeneralization in Deep Reinforcement Learning: arxiv.org/abs/2105.14111

  continue reading

41 حلقات

كل الحلقات

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع