Artwork

المحتوى المقدم من Deep Learning Deep Dive. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Deep Learning Deep Dive أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

Episode #2: DALL-E and friends in image generation

1:51:27
 
مشاركة
 

Manage episode 336489917 series 3274640
المحتوى المقدم من Deep Learning Deep Dive. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Deep Learning Deep Dive أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Andrej Karpathy and Justin Johnson deep dive into OpenAI's DALL-E and use it as an anchor point to recurse into some of the recent work in AI on image generation. Approximate agenda:

DALL-E Blog Post:
https://openai.com/blog/dall-e/

ImageGPT
https://openai.com/blog/image-gpt/

VQ-VAE
https://arxiv.org/abs/1711.00937

VQ-VAE-2
https://arxiv.org/abs/1906.00446

Gumbel-Softmax / Concrete Distribution
https://arxiv.org/abs/1611.01144
https://arxiv.org/abs/1611.00712

VQGAN
https://arxiv.org/abs/2012.09841

Andrej's attempted re-implementation of VQVAE and GumbelSoftmax:
https://github.com/karpathy/deep-vector-quantization/blob/main/model.py

You can see a video version of this episode on YouTube:
https://www.youtube.com/watch?v=gMc90bqHMSM

We reached out to all speakers and obtained their written consent to appear in this recording.

  continue reading

2 حلقات

Artwork
iconمشاركة
 
Manage episode 336489917 series 3274640
المحتوى المقدم من Deep Learning Deep Dive. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Deep Learning Deep Dive أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Andrej Karpathy and Justin Johnson deep dive into OpenAI's DALL-E and use it as an anchor point to recurse into some of the recent work in AI on image generation. Approximate agenda:

DALL-E Blog Post:
https://openai.com/blog/dall-e/

ImageGPT
https://openai.com/blog/image-gpt/

VQ-VAE
https://arxiv.org/abs/1711.00937

VQ-VAE-2
https://arxiv.org/abs/1906.00446

Gumbel-Softmax / Concrete Distribution
https://arxiv.org/abs/1611.01144
https://arxiv.org/abs/1611.00712

VQGAN
https://arxiv.org/abs/2012.09841

Andrej's attempted re-implementation of VQVAE and GumbelSoftmax:
https://github.com/karpathy/deep-vector-quantization/blob/main/model.py

You can see a video version of this episode on YouTube:
https://www.youtube.com/watch?v=gMc90bqHMSM

We reached out to all speakers and obtained their written consent to appear in this recording.

  continue reading

2 حلقات

كل الحلقات

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع

حقوق الطبع والنشر 2025 | سياسة الخصوصية | شروط الخدمة | | حقوق النشر
استمع إلى هذا العرض أثناء الاستكشاف
تشغيل