L’intelligence artificielle générative connaît un véritable boom depuis la sortie Chat GPT, notamment dans sa capacité spectaculaire à générer des contenus de façon autonome.
Du texte à l’image en passant par la musique, ces IA génératives sont en train de révolutionner de nombreux domaines.
Mais comment fonctionnent-elles réellement ?
Sont-elles aussi intelligentes qu’elles en ont l’air ?
Vont-elles remplacer les humains ou au contraire les assister ?
Autant de questions qu’on me pose, lors des formations et des séminaires que je propose chaque semaine.
Dans cet article exclusif, je réponds de manière claire et accessible aux 20 interrogations les plus fréquentes sur l’IA générative.
Je vous livrerai des explications détaillées pour vous permettre de comprendre ces technologies comme un insider.
Vous saurez enfin exactement ce qui se cache derrière des noms comme ChatGPT, DALL-E 2, Midjourney ou AlphaFold.
Vous apprendrez leurs forces comme leurs limites actuelles.
Grâce à ces explications, vous pourrez comprendre comment tirer parti au mieux de ces outils prometteurs, que ce soit dans votre usage personnel ou professionnel.
Je vous assure que les 10 minutes que vous investirez dans la lecture de cet article seront amplement rentabilisés
On commence avec la première question.
La plus simple. Basique.
1 – Qu’est-ce qu’une IA générative ?
Les IA génératives comme ChatGPT sont un type d’intelligence artificielle capable de créer de nouveaux contenus de façon autonome, sans intervention humaine.
Elles s’entraînent sur d’énormes bases de données texte, images, audio ou vidéo pour apprendre à générer elles-mêmes des contenus originaux similaires.
Par exemple, ChatGPT a été entraîné sur des milliards de pages web et peut écrire des textes, MidJourney créé des images à partir de millions d’images existantes.
Fou n’est ce pas ?
Passons à la seconde question, sans plus tarder :
2 – Comment fonctionnent-elles ?
Les IA génératives utilisent l’apprentissage profond (deep learning en anglais), une branche de l’intelligence artificielle basée sur les réseaux de neurones artificiels.
Ces algorithmes détectent des régularités statistiques, des motifs récurrents dans les données d’entraînement. Ils capturent des corrélations entre les inputs et les outputs souhaités.
Par exemple, MidJourney repère les associations entre certains mots-clés et les pixels des images correspondantes.
Chat GPT a un mode de fonctionnement différent, bien qu’il soit basé sur du deep learning.
Vous pouvez en savoir davantage avec mon article sur le fonctionnement de chat gpt.
3 – Quels sont les modèles d’IA génératives les plus connus ?
Les IA génératives peuvent être classées en plusieurs catégories selon le type de données sur lesquelles elles sont entraînées et leurs applications.
Pour le texte, les modèles phares sont GPT-3, LaMDA ou plus récemment ChatGPT. Ils sont formés sur d’énormes bases de données textuelles comme Wikipedia ou des livres numériques. Leurs usages sont la génération de texte, la traduction automatique ou le traitement du langage naturel.
D’autres modèles sont spécialisés dans la génération de code informatique à partir de texte, comme Codex d’OpenAI. Ils s’entraînent sur quantités de code source.
Pour les images, les noms de référence sont DALL-E 2, Midjourney ou Stable Diffusion. Leurs jeux de données sont constitués de millions d’images associées à des descriptions textuelles. Ils permettent de générer des visuels à partir d’un texte.
Certains modèles génèrent des molécules, de la musique ou même des vidéos en s’appuyant sur les données correspondantes.
Enfin, des approches multimodales comme GPT-4 combinent texte et images en entrée et en sortie.
Voici un tableau récapitulatif pour vous aider :
Type d’IA générative | Modèles | Jeux de données | Utilisations |
Texte | GPT-3, LaMDA, LLaMA, BLOOM, GPT-4, Claude | BookCorpus, Wikipedia | Traitement du langage naturel, traduction automatique, génération de texte |
Code | OpenAI Codex | Code source | Génération de nouveaux programmes |
Images | DALL-E, Midjourney, Stable Diffusion | LAION-5B | Génération d’images à partir de texte |
Molécules | AlphaFold | Données biologiques | Prédiction de structures de protéines |
Musique | MusicLM | Formes d’onde audio | Génération de musique à partir de texte |
Vidéo | Gen1, Make-A-Video | Vidéo annotée | Génération de clips vidéo |
Multimodal | GPT-4 | Texte + images | Entrées et génération multimodales |
4 – Sont-elles dangereuses ?
La méthode de formation par renforcement (RHLF) permet à des formateurs humains de vérifier la dangerosité des réponses.
En revanche, les IA génératives peuvent reproduire des biais, donner des informations fausses ou générer des contenus toxiques si elles ne sont pas entraînées et utilisées de manière éthique. Des garde-fous sont nécessaires.
Mais la plupart des experts s’accordent sur leur impact majoritairement positif pour l’humanité.
Dans un épisode de podcast de Singularité IA, nous avons exploré le sujet des dangers liés à l’IA avec Benjamin Allouch, sujet que j’aborde aussi dans un article sur les dangers de l’IA.
5 – Vont-elles remplacer les humains ?
Entre 14 et 66% des tâches au travail pourraient être automatisées par l’IA.
Mais il ne s’agit pas d’une substitution complète.
Comme l’explique Appoline Guillot, professeur à l’ENS, les humains vont plutôt travailler en symbiose avec les machines, dans un mode hybride.
De nouvelles compétences liées à ces outils seront essentielles.
Si vous voulez en savoir davantage sur l’impact de l’IA dans le travail, je vous invite à écouter le second épisode de mon podcast Singularité IA avec Benjamin Allouch.
Il est intitulé : IA et travail : le grand remplacement ?
6 – Comment améliorer ses prompts ?
Le prompt est la commande textuelle envoyée à l’IA pour générer un contenu.
Il faut donner plus de détails, de contexte, structurer sa pensée et donner des exemples pour obtenir les meilleurs résultats.
Un prompt précis et riche mène à une génération de qualité.
Si vous voulez devenir prompt engineer, je vous invite à lire mon article sur les conseils de prompt engineering et mon guide avancé de prompt engineering.
7 – Peut-on leur faire confiance ?
Les IA génératives restent des programmes informatiques imparfaits.
A cause des hallucinations, il ne faut pas considérer leurs réponses comme des sources 100% fiables, notamment pour la santé ou les informations sensibles.
Mais leur précision s’améliore constamment avec l’augmentation des données d’entraînement.
8 – ChatGPT va-t-il remplacer Google ?
Chat GPT n’est pas un moteur de recherche.
Il ne faut pas l’utiliser pour faire des recherches de faits, de statistiques ou d’actualités.
Mais comme un assistant personnel pour accomplir davantage de tâches comme la rédaction, l’écriture et la synthèse de document.
Google est un moteur de recherche et l’entreprise a créé Bard, un “Chat GPT” connecté à internet.
Bing de Microsoft fait aussi office de moteur de recherche. J’ai d’ailleurs rédigé un guide complet à son sujet, avec des dizaines de cas d’usages concrets.
Les deux approches sont donc plutôt complémentaires à l’heure actuelle selon moi.
9 – Ces technologies sont-elles récentes ?
L’IA est un concept datant d’Alan Turing, après la seconde guerre mondiale.
Mais ce n’est qu’au début des années 2020 que l’investissement dans l’IA générative a bondi.
Avec de grandes entreprises telles que Microsoft, Google et Baidu ainsi que de nombreuses petites entreprises développant des modèles d’IA générative.
10 – A quoi servent les images générées par IA ?
Les images générées par l’IA comme MidJourney peuvent servir à illustrer des concepts abstraits, créer des visuels accrocheurs pour du marketing, de l’art numérique ou même inspirer des artistes humains.
Leurs applications sont très variées, allant du fun au professionnel.
11 – Puis-je générer n’importe quelle image avec DALL-E 2 ?
Non, OpenAI a mis en place des filtres pour empêcher la création de contenus violents, haineux ou sexuellement explicites.
Mais ces systèmes ne sont pas infaillibles.
Il faut donc une utilisation éthique et responsable de la part des humains.
12 – Les IA génératives sont-elles créatives ?
Elles optimisent des paramètres statistiques mais ne disposent pas de créativité consciente comme les humains.
Leur autonomie est limitée par leur entraînement sur des données existantes.
Elles font preuve d’innovation incrémentale plus que de créativité disruptive.
13 – Vais-je perdre mon travail à cause des IA génératives ?
Certains métiers très répétitifs et prévisibles sont clairement menacés à terme.
Mais de nouvelles compétences liées à ces outils seront demandées, comme l’optimisation des prompts ou la supervision éthique des systèmes.
Si vous voulez en savoir davantage sur l’impact de l’IA dans le travail, je vous invite à écouter le second épisode de mon podcast Singularité IA avec Benjamin Allouch.
Il est intitulé : IA et travail : le grand remplacement ?
14 – Faut-il craindre OpenAI ?
OpenAI est une organisation à but non lucratif qui vise à développer une IA bénéfique pour l’humanité.
Mais certains s’inquiètent de sa puissance croissante depuis son rachat partiel par Microsoft (49% des parts d’Open AI).
Les créateurs d’Anthropic, une startup concurrente d’Open AI, seraient partis de l’entreprise à cause de cette accointance avec Microsoft.
Une surveillance accrue et un usage éthique semblent nécessaires.
15 – Ces IA sont-elles conscientes ?
Absolument pas à l’heure actuelle.
Ce ne sont que des programmes informatiques sans conscience, pensées ou émotions humaines.
Même les modèles les plus avancés ne se rapprochent pas d’une forme de conscience.
En revanche, Lex Fridman, le professeur d’IA au MIT a posé la question suivante à Sam Altamn lors d’un interview dans son podcast “Quelle est la différence entre la conscience et simuler la conscience?”
En effet, vous pouvez très bien dire à GPT-4 de simuler le fait qu’il est conscient, de parler de ses émotions et de donner des opinions.
La vérité est que la notion de conscience est elle-même difficile à définir.
16 – Puis-je discuter avec ces IA ?
Oui des modèles comme ChatGPT permettent d’avoir des conversations très fluides et naturelles.
Mais il ne faut pas oublier leurs limites actuelles et toujours vérifier la véracité des informations, même si l’expérience est bluffante.
L’histoire de Steven Schwartz est un exemple éloquent…
Steven Schwartz, un avocat new-yorkais s’est retrouvé dans une situation embarrassante en plein procès. Je vous plante le décor :
L’avocat plaide pour un client qui s’est fait renversé par un chariot de la compagnie colombienne Avianca.
Dans son plaidoyer, il cite 6 cas.
Ces cas sont bien ficelés. Intelligents. Adaptés.
Mais la défense découvre que ces cas sont…
…IMAGINAIRES.
Ils détruisent ensuite facilement l’argumentaire de Maître Schwartz.
A l’issue de la séance, la cour se demande comment c’est possible…
L’avocat avoue avoir utilisé Chat GPT pour construire son argumentation.
Il dit la chose suivante : « J’ai entendu parler de ce nouveau site, dont j’ai supposé à tort qu’il s’agissait d’un super moteur de recherche. »
En effet, il a cherché des cas pour défendre son client sur Chat GPT.
Doutant des réponses, il a demandé au chatbot :
« Les cas sont ils réels ? » Chat GPT a répondu : « Oui bien sûr ». Alors que « non ».
Aujourd’hui, l’affaire a été transférée à un des ses collègues.
Le 08 juin 2023, Steven Schwartz a été entendu par le juge du district sud de New York.
Il a déclaré :
« Mon Dieu, je regrette d’avoir fait cela » en indiquant se sentir embarrassé et humilié,”
Morale : vérifiez toujours vos sources avec les IA génératives de texte comme Chat GPT.
17 – Vont-elles un jour devenir plus intelligentes que nous ?
Certains en ont peur.
Rappelons que Sam Altman, le PDG d’Open AI veut créer une AGI pour artificial general intelligence, une IA capable d’égaler l’humain en tout point dans les tâches économiquement viables.
Mais la réalité est autre selon les experts.
L’IA intelligente, c’est très peu probable à un horizon proche.
Ces systèmes restent étroitement spécialisés et il leur manque encore de nombreuses capacités cognitives humaines comme le raisonnement logique ou la planification sur le long terme.
18 – Les IA génératives vont-elles rendre le copyright obsolète ?
De nouvelles régulations du droit d’auteur sont effectivement nécessaires face à ces technologies.
Mais les humains gardent un rôle central dans les processus créatifs qui font appel à l’expérience et à l’émotion, difficiles à dupliquer.
Pour le moment…
19 – Puis-je développer mes propres IA génératives ?
Oui c’est possible via des frameworks open source comme TensorFlow, PyTorch ou Hugging Face. Meta a récemment mis à disposition LLama 2, disponible en Open Source.
Mais l’entraînement de tels modèles demande d’énormes ressources de calcul et de données.
Ainsi, cela reste inaccessible pour la plupart des particuliers ou petites entreprises.
20 – Sont-elles disponibles en français ?
La plupart des modèles existent en version française mais avec une qualité moindre car ils sont entraînés sur moins de données que les versions anglaises.
Des efforts sont en cours pour enrichir les bases de données en français et améliorer les performances
Conclusion sur les IA génératives
Et voilà, vous savez désormais le plus important sur le fonctionnement des principales IA génératives et leurs usages !
De ChatGPT à Midjourney en passant par LLama 2, ces technologies ont certes encore des limites mais leur potentiel semble infini.
Comme je dis souvent lors de mes formations, nous sommes à l’iphone 1 de l’IA générative.
Imaginez alors ce que le futur vous réserve !
J’espère que cet article vous a plu et vous a permis de mieux comprendre les rouages de ces technologies qui transforment déjà notre monde.
N’hésitez pas à me faire part de vos retours et à visiter mon site pour apprendre encore davantage.
Jean-Baptiste
Pour offrir de meilleures réponses, je me suis fait accompagner par Claude 2 pour rédiger ce document.