Artwork

المحتوى المقدم من Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.
Player FM - تطبيق بودكاست
انتقل إلى وضع عدم الاتصال باستخدام تطبيق Player FM !

Comment l'augmentation de données permet de mieux faire fonctionner des IA

2:53
 
مشاركة
 

Manage episode 501702018 series 3383386
المحتوى المقدم من Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Aujourd’hui, on parle d’augmentation des données dans le monde de l'intelligence artificielle. Derrière ce terme, une idée simple. Il s'agit de créer, à partir de vos données existantes, de nouvelles variantes synthétiques pour entraîner des modèles de machine learning plus robustes.

Pourquoi c’est utile ? Parce que dans la vraie vie, les jeux de données sont souvent limités, sensibles, ou pas assez variés. Alors on enrichit artificiellement le jeu d’entraînement… mais intelligemment.

Je vous propose trois points pour tout comprendre avec l'aide d'une documentation AWS sur le sujet.

L'augmentation de données, à quoi ça sert, concrètement ?

L’augmentation des données améliore la performance et la généralisation des modèles. En multipliant les versions d’une même donnée, une image un peu plus sombre, un texte reformulé, un son avec un léger bruit, le modèle voit plus de cas et se trompe moins sur des données qu’il n’a jamais vues.

Et cette augmentation des données réduit la dépendance à de très gros jeux de données, donc coûte moins cher.

Elle limite également le sur-apprentissage, le fameux overfitting, où le modèle « apprend par cœur » ses exemples sans savoir généraliser.

L'augmentation de données, comment ça marche, en pratique ?

D'abord, les spécialistes de l'IA auditent le jeu de données et appliquent des transformations et des déclinaisons adaptées. Il peut s'agir de retournement et de changement de contraste pour une image.

Mais aussi d'ajout de bruit et de variation de vitesse pour un son. Ou encore de permutation de mots et de paraphrases pour un texte.

Mais attention, si vos données de départ sont biaisées, vos données augmentées hériteront de ces biais. Il faut donc les corriger à la source avant l'entraînement.

Enfin troisième point, quels sont les premiers cas d'usage ?

Dans le domaine de la santé, on multiplie les versions des images médicales pour mieux détecter des pathologies rares.

En finance, on génère des scénarios de fraude ou des séries de risque pour entraîner la détection et le scoring.

Dans la grande distribution, on varie angles, fonds et éclairages de photos de produits pour les faire reconnaître par l'IA en conditions réelles.

Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

426 حلقات

Artwork
iconمشاركة
 
Manage episode 501702018 series 3383386
المحتوى المقدم من Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. يتم تحميل جميع محتويات البودكاست بما في ذلك الحلقات والرسومات وأوصاف البودكاست وتقديمها مباشرة بواسطة Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes أو شريك منصة البودكاست الخاص بهم. إذا كنت تعتقد أن شخصًا ما يستخدم عملك المحمي بحقوق الطبع والنشر دون إذنك، فيمكنك اتباع العملية الموضحة هنا https://ar.player.fm/legal.

Aujourd’hui, on parle d’augmentation des données dans le monde de l'intelligence artificielle. Derrière ce terme, une idée simple. Il s'agit de créer, à partir de vos données existantes, de nouvelles variantes synthétiques pour entraîner des modèles de machine learning plus robustes.

Pourquoi c’est utile ? Parce que dans la vraie vie, les jeux de données sont souvent limités, sensibles, ou pas assez variés. Alors on enrichit artificiellement le jeu d’entraînement… mais intelligemment.

Je vous propose trois points pour tout comprendre avec l'aide d'une documentation AWS sur le sujet.

L'augmentation de données, à quoi ça sert, concrètement ?

L’augmentation des données améliore la performance et la généralisation des modèles. En multipliant les versions d’une même donnée, une image un peu plus sombre, un texte reformulé, un son avec un léger bruit, le modèle voit plus de cas et se trompe moins sur des données qu’il n’a jamais vues.

Et cette augmentation des données réduit la dépendance à de très gros jeux de données, donc coûte moins cher.

Elle limite également le sur-apprentissage, le fameux overfitting, où le modèle « apprend par cœur » ses exemples sans savoir généraliser.

L'augmentation de données, comment ça marche, en pratique ?

D'abord, les spécialistes de l'IA auditent le jeu de données et appliquent des transformations et des déclinaisons adaptées. Il peut s'agir de retournement et de changement de contraste pour une image.

Mais aussi d'ajout de bruit et de variation de vitesse pour un son. Ou encore de permutation de mots et de paraphrases pour un texte.

Mais attention, si vos données de départ sont biaisées, vos données augmentées hériteront de ces biais. Il faut donc les corriger à la source avant l'entraînement.

Enfin troisième point, quels sont les premiers cas d'usage ?

Dans le domaine de la santé, on multiplie les versions des images médicales pour mieux détecter des pathologies rares.

En finance, on génère des scénarios de fraude ou des séries de risque pour entraîner la détection et le scoring.

Dans la grande distribution, on varie angles, fonds et éclairages de photos de produits pour les faire reconnaître par l'IA en conditions réelles.

Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

426 حلقات

Tous les épisodes

×
 
Loading …

مرحبًا بك في مشغل أف ام!

يقوم برنامج مشغل أف أم بمسح الويب للحصول على بودكاست عالية الجودة لتستمتع بها الآن. إنه أفضل تطبيق بودكاست ويعمل على أجهزة اندرويد والأيفون والويب. قم بالتسجيل لمزامنة الاشتراكات عبر الأجهزة.

 

دليل مرجعي سريع

حقوق الطبع والنشر 2025 | سياسة الخصوصية | شروط الخدمة | | حقوق النشر
استمع إلى هذا العرض أثناء الاستكشاف
تشغيل