GPT-4o : le nouveau modèle multimodal d’Open AI

Bonjour, 

OpenAI vient de frapper fort avec la sortie de GPT-4o, son nouveau modèle de langage multimodal aux capacités stupéfiantes de voir, d’entendre, de raisonner et surtout de parler comme un être humain !

En plus, il est accessible gratuitement à toutes et à tous, qui que vous soyez, peu importe où vous habitez. 

Dans cet article, nous vous invitons à découvrir en détail les avancées GPT-4o. 

Vous serez impressionnés par sa capacité à gérer en entrée et en sortie du texte, de l’audio et des images de manière fluide et intégrée. 

Vous explorerez également les applications concrètes de ce nouveau modèle, ainsi que les questions passionnantes qu’elle soulève. 

GPT-4o, une IA qui voit, entend et parle

Première chose à savoir sur cette nouvelle IA : ce modèle est multimodal, c’est-à-dire qu’il peut gérer en entrée et en sortie du texte, de l’audio et des images, et ce de manière fluide et intégrée. 

Impressionnant, n’est-ce pas ?

Concrètement, cela signifie que vous pouvez interagir avec GPT-4o presque comme vous le feriez avec un être humain. 

Vous lui parlez, il comprend et vous répond de façon naturelle. 

Vous lui montrez une image, il l’analyse et vous en parle. 

Et tout cela, presque instantanément, sans latence perceptible.

Si vous êtes familier de l’interface vocale de l’application Chat GPT, vous savez à quel point il était auparavant embêtant de parler avec Chat GPT. 

Une puissance et une rapidité inégalées

Autre point fort de GPT-4o : sa fenêtre contextuelle de 128 000 tokens, qui lui permet d’appréhender et de générer des contenus d’une grande complexité. 

Avant dans la version gratuite (GPT-3.5), vous pouviez mettre une PDF de 6000 mots maximum. 

Désormais, vous pouvez ajouter un PDF de 100 000 mots (correspondant à 128 000 tokens).

De plus, le modèle a été entraîné jusqu’en octobre 2023, ce qui lui confère une connaissance plus fine de notre monde actuel.

Résultat, GPT-4o surclasse allègrement son prédécesseur GPT-4 Turbo sur de nombreuses tâches, tout en étant plus rapide. Et ne parlons même pas de GPT-3.5 !!

D’après Ethan Mollick, avoir accès à GPT-4o au lieu de GPT-3.5 

« C’est comme si un doctorant travaillait avec vous au lieu d’un étudiant de deuxième année d’université »

Accessible gratuitement sur ChatGPT

Vous voulez tester les prouesses de GPT-4o ? 

Rien de plus simple ! 

Ce nouveau modèle est d’ores et déjà disponible gratuitement pour tous les utilisateurs sur le site de ChatGPT.

Interface de Chat GPT 4o

Le modèle est sélectionné par défaut. 

Vous pourrez dialoguer avec lui, lui soumettre des images à analyser, lui faire résumer des PDFs complexes ou encore lui confier l’analyse de vos fichiers Excel. Pour cela, servez-vous de la petite épingle à gauche quand vous envoyez vos instructions ! 

Les possibilités sont quasi-illimitées !

Bien sûr, pour éviter les abus, l’utilisation de GPT-4o sera un peu plus restreinte pour les utilisateurs gratuits que pour les abonnés payants. 

Mais rassurez-vous, même avec un compte gratuit, vous aurez largement de quoi exploiter le potentiel de ce chatbot nouvelle génération

Le chatbot est connecté à internet et accéde aux GPTs

Grande nouveauté avec GPT-4o : il est désormais directement connecté à internet, ce qui permet de limiter les hallucinations. 


Vous savez quand Chat GPT affirme quelque chose avec l’aplomb d’un expert, alors que l’information est factuellement fausse ! 

D’ailleurs, c’est cadeau, voici mon antisèche pour éviter les hallucinations : 

Comment limiter les hallucinations de Chat GPT, Claude 3 et Gemini

Mais encore.

Open AI devrait donner accès à toutes et tous aux GPTs. 

Vous pourrez accéder à des milliers de Chat GPT personnalisés sur des tâches. 

Par exemple, un GPT pour organiser vos voyages, un GPT pour écrire des mails, un GPT pour faire des cartes mentales. 

Et ce n’est qu’un début.

Bientôt une version vocale ultra-fluide

OpenAI a fait la démo de sa nouvelle version vocale. Elle promet une fluidité et un naturel déconcertants dans les échanges oraux.

Avec un temps de latence de seulement 320 millisecondes (contre 2 secondes auparavant), cette interface vocale donnera l’impression de converser avec un être humain. 

GPT-4o pourra même être interrompu ou relancé de façon naturelle, comme dans une vraie discussion.

À terme, cette IA sera même capable d’analyser des vidéos. 

Nous n’en sommes qu’aux prémices de l’exploitation du potentiel de GPT-4o !

4 exemples concrets de GPT-4o 

Vous avez du mal à visualiser ce que GPT-4o peut faire pour vous ? 

Voici quelques exemples concrets d’applications qui donnent le tournis :

– GPT-4o pourrait devenir les yeux d’une personne aveugle, en lui décrivant en temps réel son environnement et les situations qu’elle rencontre.

Regardez cette vidéo pour vous rendre compte du combo Voix X Vidéo : 

Be My Eyes Accessibility with GPT-4o

– Il pourrait assister un chirurgien en suivant une opération et en lui fournissant des informations clés en direct.

– Il serait un tuteur hors pair en adaptant ses explications au niveau et au rythme de chaque élève.

Regardez cette vidéo pour vous en persuader : Math problems with GPT-4o

– Il pourrait même être votre partenaire d’improvisation théâtrale en incarnant différents personnages de façon crédible.

Avec sa capacité à simuler les émotions dans sa voix, GPT-4o rend les interactions homme-machine plus réelles et plus riches que jamais. 

C’est fascinant et un peu vertigineux, vous ne trouvez pas ?

Terminons en beauté : 

OpenAI démocratise l’IA de pointe

En proposant gratuitement son modèle le plus avancé, OpenAI franchit une étape décisive dans la démocratisation de l’intelligence artificielle.

Regardez les choses sous cette angle : 

Open AI avait 100 millions d’utilisateur actifs mensuellement, et 1 millions d’utilisateurs payants avec accès au meilleur modèle. 

Avec GPT-4o, Open AI met dans les mains de 100 millions d’utilisateurs son modèle le plus puissant !! 

Conclusion sur GPT-4o

Le chatbot d’OpenAI marque incontestablement un tournant dans l’histoire de l’intelligence artificielle. 

Avec ce modèle multimodal surpuissant, capable de voir, d’entendre, de parler et de raisonner à haut niveau, OpenAI nous fait tous entrer de plain-pied dans une nouvelle ère technologique.

Je vous invite à tester sans plus attendre les prouesses de GPT-4o sur le site de ChatGPT, et à partager avec moi vos découvertes, vos expériences et vos réflexions. 

J’attends vos retours avec impatience !

JB

.
Partagez cet article !
Jean-Baptiste
Jean-Baptiste
Publications: 92