Déplier le sommaire Replier le sommaire
La promesse d’une fusion entre la technologie de traitement du langage naturel et celle de la vision par ordinateur est enfin réalisée avec le lancement conjoint de ChatGPT et GPT-Vision. En respectant scrupuleusement la date butoir du 15 Octobre, cette initiative marque un pas de géant dans la quête d’une intelligence artificielle plus performante. Les exemples qui suivent démontrent la variété et la profondeur des applications possibles, ouvrant ainsi un vaste champ d’exploration et d’innovation. Découvrez comment ces technologies transforment la manière dont nous interagissons avec les données visuelles et textuelles.
Exploration des Applications
La synergie entre ChatGPT et GPT-Vision déverrouille des fonctionnalités inédites. Nous avons sélectionné quelques exemples captivants qui illustrent la diversité des applications possibles.
- Modélisation à partir d’une image
Découvrez ici comment une simple image se transforme en une modélisation 3D impressionnante :
ChatGPT Vision starting to write Gcode (for a Haas) from prints pic.twitter.com/IgXeMEAS8e
— Aaron Slodov (@aphysicist) October 10, 2023
À lire L’impact de l’intelligence artificielle sur les ressources humaines
- Programme de musculation personnalisé selon votre équipement
Laissez-vous guider par un programme de musculation sur-mesure en fonction de votre matériel disponible :
ChatGPT Vision turned a picture of my home gym equipment into a full 8-week workout program.
This is better than 99% of any programs I've ever bought. pic.twitter.com/ToACYgzTyf
— Rowan Cheung (@rowancheung) October 11, 2023
Et explorez d’autres idées de programme ici :
À lire L’impact de l’intelligence artificielle sur l’art
ChatGPT Vision:
Fitness plan ideas based on limited equipment.
Adjust prompt, if you see mistakes in the recognition. pic.twitter.com/LslHBeDFlX
— Borriss (@_Borriss_) October 12, 2023
- Analyse et décodage de documents floutés
Découvrez comment un document flouté révèle ses secrets grâce à l’analyse approfondie :
À lire L’impact de l’intelligence artificielle sur le travail : un débat en plein ébullition
ChatGPT-4V Multimodal decodes a Redacted government document on a UFO sighting released by NASA.
I have tested this on 100s of redacted documents and I can say we are in a new world. pic.twitter.com/aCKOm577TO
— Brian Roemmele (@BrianRoemmele) October 6, 2023
- Conversion de photos en texte pour une lettre complexe
La technologie transforme une image de lettre en texte éditable :
???? ChatGPT Vision is fk'in nuts lol pic.twitter.com/Ccsl7tFgkD
— peter! ???? (@pwang_szn) October 4, 2023
À lire L’impact de l’intelligence artificielle sur la comptabilité : une révolution en marche
- Récupération d’objets complexes dans une image
Explorez comment la technologie identifie et récupère des objets complexes :
Power of ChatGPT vision capability ???? pic.twitter.com/cr1izVP9df
— Kashan Ahmed???????????? (@KashanAhmed) October 6, 2023
- Détection d’images issues de Google Street View ou de satellites
Une démonstration de détection précise d’images satellitaires ou de Google Street View :
À lire Impact de l’intelligence artificielle sur les entreprises : opportunités et défis
ChatGPT Vision pic.twitter.com/X619nlCdBW
— Anu Aakash (@anukaakash) October 11, 2023
- Analyse détaillée d’une radiographie
Une analyse de radiographie, bien que impressionnante, il est recommandé de consulter un spécialiste :
ChatGPT: The doctor in your pocket ????
ChatGPT can now look at X-rays, prescriptions, or medical reports and answer any question in a matter of seconds.
Future of health talk – simple, snappy, and AI! pic.twitter.com/nXgEfEvEsn
— Shubham Saboo (@Saboo_Shubham_) October 6, 2023
- Analyse d’images complexes
Plongez dans l’analyse d’une image hautement complexe :
ChatGPT-4V Multimodal please decode this.
Thank you. pic.twitter.com/seOuma96QO
— Brian Roemmele (@BrianRoemmele) October 2, 2023
- Création de scénarios à partir de l’analyse de plusieurs images
Découvrez comment quatre images distinctes se muent en un scénario cohérent :
I gave GPT-4V four "movie stills" I generated with Midjourney and asked it to construct a plotline tying them together.
A good example of how AI is more "creative" and surprising when given constraints, much like humans. Its not as creative as the best people, but interesting. pic.twitter.com/tzYJmMChsn
— Ethan Mollick (@emollick) October 2, 2023
- Analyse d’un moteur de voiture
Une analyse minutieuse d’un moteur de voiture, encore une fois, la consultation d’un professionnel est conseillée :
6. Car Maintenance
Prompt: "Analyze the issue shown in this car photo, explain likely causes, and provide actionable DIY repairs or professional servicing recommendations." pic.twitter.com/mSfUTp0j5n
— Bryan Marley (@_bryanmarley) October 9, 2023
- Optimisation de code
Un regard sur l’optimisation de code grâce à cette technologie :
8. Code Optimization
Prompt: "Analyze this code and suggest ways to improve performance, efficiency, conciseness, and adherence to best practices." pic.twitter.com/4leeDoVf53
— Bryan Marley (@_bryanmarley) October 9, 2023
Limitations Notables
Malgré les prouesses affichées, certaines limitations persistent. Il est crucial de noter que la lecture des QR Codes et le partage des conversations restent hors de portée pour le moment.
Si vous ne voyez pas ces nouvelles fonctionnalités, une simple actualisation de la page, ou une déconnexion/reconnexion peuvent résoudre le problème. En cas de persistance, la suppression du cache lié à openai.com pourrait être une solution à envisager.
La capture d’écran ci-dessous illustre une des interfaces utilisateur de ces nouvelles fonctionnalités :
Vidéo GPT-Vision
Il faut évidemment que je crédite l’excellente chaine YouTube de Emile Dev (à suivre si vous souhaitez vous tenir informé sur les actualités de l’intelligence artificielle) qui a inspiré cet article et dont voici la vidéo de présentation: