Cela sonne comme une seconde déflagration dans la course aux IA. 18 mois après la sortie publique de ChatGPT 3.5, GPT-4o est disponible depuis le 13 mai, gratuitement.
Et c’est un déluge de questions ! Avez-vous essayé ? Courrez-y !
Ce qu'il faut savoir sur GPT-4o
“O”, c’est pour Omni, comme Omni Modèles. ChatGPT analyse la voix, le texte, les images, les fichiers et par la caméra et le micro, décode les émotions.
La version est disponible gratuitement, pour tous, en 50 langues.
Avec l’application mobile, on peut donc dialoguer directement en posant des questions, en l’interrompant et en ajoutant des demandes. Rien de plus facile que de téléverser un article, un document Word ou un fichier mp4 pour résumer, traduire ou questionner.
On peut tout lui montrer : un croquis, de l’algèbre, son visage à la caméra ou encore une partition de musique.
L’agent conversationnel GTP-4o peut moduler ses réponses en fonction de l’intonation de la voix ou des émotions perçues sur la caméra de notre téléphone intelligent ou au son de notre voix.
C’est ce qui fait dire à Sam Altman dans son billet de blog que :
“Parler à un ordinateur ne m’a jamais semblé vraiment naturel ; maintenant c'est le cas”.
Source : https://blog.samaltman.com/gpt-4o
Le film « Her », sorti en 2013, devient donc réalité. Le personnage joué par Joaquin Phoenix dans un Los Angeles post-moderne trompe son ennui avec l’IA dont il tombe amoureux. La douce voix interprétée par Scarlett Johansson est empathique et logique. Nous y sommes.
Et cela change tout, très vite :
Les étudiants et les chercheurs d’emploi s’entrainent déjà aux entrevues.
Les employés écoutent la voix d’un coach qui leur suggère des comportements pour réussir leur intégration ou préparer la négociation du salaire.
Les recruteurs questionnent pour savoir quelles questions poser aux candidats entraîner à l’IA, qui pourra répondre directement aux questions des recruteurs.
Les apprenants demandent la synthèse d’un article ou d’un guide long et fastidieux.
Les syndicalistes demandent l’analyse comparative de deux conventions collectives et préparent les négociations en entrant les arguments.
Les pédagogues ingèrent les titres de programmes pour générer les plans détaillés de cours et produire des textes de vidéos introductives.
Les coachs revoient leur plan d’intervention agrémenté d’exercices comportementaux.
Les formateurs téléchargent des photos pour décrire les situations d'entraînement.
Les psychologues testent les capacités à traduire les émotions.
Et ce n’est pas fini !
Mais alors, quelles différences avec les IA commerciales que nous préparent les start-ups et les grands éditeurs ?
GPT-4o : Pour encore combien de temps le génératif restera générique ?
A cette étape, je vois 3 avantages aux IA commerciales, entrainées plus spécifiquement que GTP-4o :
Une mise à jour rapide avec les connecteurs (API). La plupart des applications d'IA génératives spécifiques proviennent certes d’OpenAI ou d’autres fournisseurs de plateforme d’IA (AWS, Microsoft Azure, Meta, Cohere, Anthropic, etc.). C’est une question de semaines pour que leurs éditeurs connectent leurs services à Open AI ou aux plus récentes versions des autres fournisseurs. Les prompts spécifiques et les entrainements sur des lots de données additionnels donne du poids et de la profondeur à leur capacités de traitement.
GPT-4o est brillant, rapide et multi-sources, mais, au fond, il est générique. Après quelques temps d’utilisation, on comprendre que les réponses générées sont riches, mais assez génériques aussi. Normal, les IA génératives grand public s’appuient sur de très prodigieux volumes de données multiples.
L’expertise et la finesse des IA génératives proviennent de modèles spécifiques, « Fine Tuned » et de méthodologies RAG (Retrival Augmented Generation) qui aident le grand modèle de données (LLM) à se valider sur des lots d’informations précises, calibrées et récentes, donnant ainsi pertinence et récence. C’est ainsi que les entreprises et les RH peuvent utiliser des applications puissantes mais personnalisées, exploitant et protégeant leurs données et leurs secrets d’entreprise.
Assistant GPT-4o : "O" pour Omniscient ?
A la course à l’IA, Sam Altman et OpenAI viennent de marquer un grand coup et frappent une nouvelle fois les esprits.
Gardons en tête que les applications des IA sont multiples et que cette course est folle. Le premier aujourd’hui, sera dépassé par un autre demain. Tout se construit sous nos yeux.
ChatGPT est une démonstration de force de ses capacités générales, fondées sur l’immensité d’un océan de données.
Mais pour chaque solution fondée sur les IA génératives, si elle puise dans un large modèle pour comprendre, raisonner, traduire, synthétiser, répondre, dialogue, écrire, coder ou dessiner, elle doit surtout répondre aux intentions précises de ces clients / utilisateurs :
Ces concepteurs doivent connaître leurs domaines d'expertise et d’application professionnelle, les besoins, les utilisations et les lots de données.
C'est une combinaison essentielle pour comprendre avec justesse et répondre ou dialoguer avec un but et un extrant pertinent.
C'est donc à ces conditions que la pertinence d'une solution sera évaluée par un jury d’experts pour que l’outil soit dit intelligent.
La différence est fine mais elle est énorme pour se distinguer de GTP-4o et créer une valeur commerciale additionnelle.
On nage donc en pleine profusion et confusion dans le marché actuellement.
En somme, GPT-4o, c’est le fastfood des IA génératives
Il offre un service rapide, bon marché, avec une production à grande échelle, un réseau de proximité et il est ultra-efficace. C'est la démocratisation de l'intelligence au creux de nos mains. On se sent tous à la fois conquis, subjugué et un effrayé ou coupable (je pense à McDo !).
A côté de la restauration rapide, il existe toujours les restaurants de quartier, gastronomiques et dits de spécialité. A nous de faire valoir l'expertise, l'art et la science pour servir de l'intelligence savoureuse, relevée et bien travaillée.
Et vous, vous en pensez quoi ?
Je réponds à vos commentaires ci-dessous.
Comments