Dall-E 2.0 (OpenAI) Une IA créative !
Libérez votre créativité avec Dall-E
Sa fonction est simple : « Décrivez une illustration » et « DALL-E » s’occupe de la dessiner pour vous et même en proposer différentes variantes en quelques secondes.
L’édition de photos existantes est également possible via une simple description de la modification souhaitée.
Homme contre la machine ou synergie ?
Passer par les doigts experts d’un artiste avec ses stylets, tablettes graphiques, outils de DAO (Dessin assisté par ordinateur), peut prendre des heures et être couteux en fonction de la « patte » de l’artiste.
L’artiste de son côté doit constituer une banque d’images, de recherches d’illustrations, de traits, de styles pouvant correspondre au mieux à son client, proposer parfois plusieurs modèles sous formes de brouillons avant de proposer un résultat raffiné.
Les prémisses de Dall-E
Dans les coulisses de « DALL-E« , OpenAI, filiale d’Elon Musk, et son modèle phare d’IA : GPT-3, souvenez vous, les articles écrits automatiquement par une IA qui s’est fait remarqué à plusieurs reprises, c’était lui. Ou encore une de ses dernières œuvres : être capable d’écrire une publication scientifique sur elle même et tenter d’être publiée…
Dall-E repose sur une banque d’image où chacune d’elle est décrite le plus fidèlement possible : un chat qui saute, un homme qui boit un verre d’eau etc… Le modèle va mettre en corrélation les images avec leur description. Puis vient le texte saisit par un utilisateur en entrée et en sortie : une image ! Cela en est presque magique.
Le devenir des artistes en jeu ?
La fin de Photoshop et des artistes ? Outre le fait de risquer de faire perdre leur travail à de nombreux artistes, Dall-E pose également des problèmes éthiques, en effet il est facile de pouvoir produire toutes sortes d’images photoréalistes : quid des images pouvant heurter la sensibilité du public, voire produisant des contenus illégaux à la chaine et pouvant ainsi alimenter les réseaux sociaux en continu et autres usines à fake news ?
D’un autre point de vu les nouvelles technologies ont créé le cinéma, la télévision et toute une ribambelle de logiciels pour créatifs ceci ayant créé autant d’emplois que nécessaire. On pourrait dire que le théâtre par exemple est en compétition avec ces derniers, pourtant ce dernier n’a pas disparu et évolue avec son temps.
Ses nombreux usages et publics
Vous avez écrit un magnifique ouvrage de plusieurs centaines de pages… Il vous manque des illustrations ? En un clic vous pouvez créer automatiquement toutes les illustrations qui vous manquent. Que vous soyez community-manager, journaliste, et même… infographiste, Dall-E peut créer presque instantanément vos illustrations.
Vous avez passé des heures pour dessiner une oeuvre d’art numérique, mais votre client préfère un autre « style » avec quelques « fleurs » ici et là, une simple description suffit à modifier, créer des variants de vos propres illustrations.
Dall-E pour le médical et architectes ?
Outre sa dimension artistique, Dall-E pourrait être également alimenté d’images spécialisées, de cartes, schémas pour architectes, chirurgiens, spécialistes en imageries médicales et produire de nombreuses illustrations en fonction de la tâche demandée. Pour le moment, Dall-E se refuse des utilisations « médicales » de son outil, mais il est évident qu’avec les banques d’images nécessaires, une version « médicale » de Dall-E pourrait voir le jour et proposer des images IRM, radios et scanner de haute qualité pour illustrer certains gestes chirurgicaux, étayer des diagnostiques etc.
Les limites de Dall-E
En attendant profiter de ces quelques illustrations créés par Dall-E en quelques mots et clics, les résultats sont parfois un peu confus, on se rend compte par exemple qu’il n’y a peut être pas autant de « robots » dans le dataset que « d’humains », avec la description d’un « robot ouvrant une cage à oiseaux » l’IA ne comprend pas forcément ce qui doit être dans la cage, ou en dehors, les oiseaux sont quant à eux dessinés également de façon mécaniques. Tout le secret est dans la description que l’on va donner à Dall-E, je n’ai pas précisé en effet que les oiseaux étaient plutôt des canaris, petits, bleus, grands, et va donc appliquer un style correspondant aux autres mots de ma phrase. Dall-E ne se limite pas non plus à créer des images : il peut également proposer des « variantes » à partir d’images existantes et « Dall-E » peut également éditer une image existante de la façon la plus simple du monde : effacez une partie de votre image, décrivez ce que vous voulez voir à la place et … Abracadabra….
Une question de Dataset
Vous avez peut être aperçu quelques illustrations de personnages politiques créés par son « mini » concurrent « Dalle-E mini », maintenant nommé « CrAIyon pour des raisons de copyright, Dall-E 2, quant à lui cherche au contraire à utiliser des images source libre de droit et se pose depuis le premier jour de nombreuses questions éthiques, de représentation, de modération, de filtrage. Dall-E 2.0 n’a donc pas en son sein de photos de Tintin, Kid Paddle, ou autres photos de personnages politiques
Pas de visage SVP
Attention toutefois à une limite « éthique » ou « légale » de Dall-E : impossible d’uploader des photos aujourd’hui (peut être une limite bientôt levée) de visages, il vous faudra rogner ou effacer ce dernier pour pouvoir travailler dessus. En effet cela fait parti des conditions d’utilisation pour éviter tout usage « choquant » de cet nouvel outil. Car après tout rappelons nous qu’il s’agit bien d’un outil créé par des êtres humain, oui Dall-E peut créer des images presque parfaite bien plus vite que ce qu’il a été possible d’observé jusqu’à aujourd’hui mais demain l’effet de synergie IA+Humain peut nous laisser rêver à des illustrations qui dépassent les frontières de la technique et de notre imagination.
Dall-E 3.0 ?
Quel sera l’avenir de Dall-E ? Des concurrents proposent leurs propres modèles, mini Dall-E (devenu crAIyon pour des raisons de copyright), mais encore loin d’égaler la qualité de Dall-E. On peut très bien imaginer Dall-E devenir accessible à tous (les data scientists et autres artistes férus d’IA attendent de pied ferme un modèle de même qualité opensource/ dataset compris). Outre cette concurrence on peut très bien imaginer après le texte, l’image, voir prochainement certainement des « vidéos » complètes qui pourraient petit à petit mettre à mal ou au contraire « booster » le secteur du cinéma et la production artistique d’animations… Dernière annonce de Dall-E : sa commercialisation en Bêta est ouverte ! Oui il est maintenant possible d’acheter des crédits, créer autant d’images que souhaiter et exploiter les images résultantes à des fins commerciales !
Lien vers le site officiel de Dall-E 2 :
Retrouvez conférences, formations et séminaires sur l’IA du même auteur sur
Publications détaillées sur les rouages de Dall-E :
Commentaires récents