Dall-E 2.0 (OpenAI) Une IA créative !

Une fleur qui chante avec sa guitare…

Libérez votre créativité avec Dall-E

Sa fonction est simple : “Décrivez une illustration” et “DALL-E” s’occupe de la dessiner pour vous et même en proposer différentes variantes en quelques secondes.
L’édition de photos existantes est également possible via une simple description de la modification souhaitée.

Le sésame, une invitation pour accéder en avant première à Dall-E 2 pour le tester dans sa version Alpha.

Homme contre la machine ou synergie ?

Passer par les doigts experts d’un artiste avec ses stylets, tablettes graphiques, outils de DAO (Dessin assisté par ordinateur), peut prendre des heures et être couteux en fonction de la “patte” de l’artiste.

L’artiste de son côté doit constituer une banque d’images, de recherches d’illustrations, de traits, de styles pouvant correspondre au mieux à son client, proposer parfois plusieurs modèles sous formes de brouillons avant de proposer un résultat raffiné.

Les prémisses de Dall-E

Dans les coulisses de “DALL-E“, OpenAI, filiale d’Elon Musk, et son modèle phare d’IA : GPT-3, souvenez vous, les articles écrits automatiquement par une IA qui s’est fait remarqué à plusieurs reprises, c’était lui. Ou encore une de ses dernières œuvres : être capable d’écrire une publication scientifique sur elle même et tenter d’être publiée…

Dall-E repose sur une banque d’image où chacune d’elle est décrite le plus fidèlement possible : un chat qui saute, un homme qui boit un verre d’eau etc… Le modèle va mettre en corrélation les images avec leur description. Puis vient le texte saisit par un utilisateur en entrée et en sortie : une image ! Cela en est presque magique.

Un chat sur sa moto…

Le devenir des artistes en jeu ?

La fin de Photoshop et des artistes ? Outre le fait de risquer de faire perdre leur travail à de nombreux artistes, Dall-E pose également des problèmes éthiques, en effet il est facile de pouvoir produire toutes sortes d’images photoréalistes : quid des images pouvant heurter la sensibilité du public, voire produisant des contenus illégaux à la chaine et pouvant ainsi alimenter les réseaux sociaux en continu et autres usines à fake news ?

D’un autre point de vu les nouvelles technologies ont créé le cinéma, la télévision et toute une ribambelle de logiciels pour créatifs ceci ayant créé autant d’emplois que nécessaire. On pourrait dire que le théâtre par exemple est en compétition avec ces derniers, pourtant ce dernier n’a pas disparu et évolue avec son temps.

Il est possible d’éditer une image existante, les photos de visages sont interdites pour le moment… Vous ne verrez que ma main 🙂

Ses nombreux usages et publics

Vous avez écrit un magnifique ouvrage de plusieurs centaines de pages… Il vous manque des illustrations ? En un clic vous pouvez créer automatiquement toutes les illustrations qui vous manquent. Que vous soyez community-manager, journaliste, et même… infographiste, Dall-E peut créer presque instantanément vos illustrations.
Vous avez passé des heures pour dessiner une oeuvre d’art numérique, mais votre client préfère un autre “style” avec quelques “fleurs” ici et là, une simple description suffit à modifier, créer des variants de vos propres illustrations.

Une fleur “humanoïde” qui porte des lunettes et une guitare chante “Halleluiah” à Mexico.


Dall-E pour le médical et architectes ?

Outre sa dimension artistique, Dall-E pourrait être également alimenté d’images spécialisées, de cartes, schémas pour architectes, chirurgiens, spécialistes en imageries médicales et produire de nombreuses illustrations en fonction de la tâche demandée. Pour le moment, Dall-E se refuse des utilisations “médicales” de son outil, mais il est évident qu’avec les banques d’images nécessaires, une version “médicale” de Dall-E pourrait voir le jour et proposer des images IRM, radios et scanner de haute qualité pour illustrer certains gestes chirurgicaux, étayer des diagnostiques etc.

Des radios rayon-x créées par Dall-E 2

Les limites de Dall-E

En attendant profiter de ces quelques illustrations créés par Dall-E en quelques mots et clics, les résultats sont parfois un peu confus, on se rend compte par exemple qu’il n’y a peut être pas autant de “robots” dans le dataset que “d’humains”, avec la description d’un “robot ouvrant une cage à oiseaux” l’IA ne comprend pas forcément ce qui doit être dans la cage, ou en dehors, les oiseaux sont quant à eux dessinés également de façon mécaniques. Tout le secret est dans la description que l’on va donner à Dall-E, je n’ai pas précisé en effet que les oiseaux étaient plutôt des canaris, petits, bleus, grands, et va donc appliquer un style correspondant aux autres mots de ma phrase. Dall-E ne se limite pas non plus à créer des images : il peut également proposer des “variantes” à partir d’images existantes et “Dall-E” peut également éditer une image existante de la façon la plus simple du monde : effacez une partie de votre image, décrivez ce que vous voulez voir à la place et … Abracadabra….

Un robot géant ouvre une cage pour libérer des oiseaux… (Hommage au très beau dessin animé “Le roi et l’oiseau”)
Une danseuse en diamant danse sur l’océan…

Une question de Dataset

Vous avez peut être aperçu quelques illustrations de personnages politiques créés par son “mini” concurrent “Dalle-E mini”, maintenant nommé “CrAIyon pour des raisons de copyright, Dall-E 2, quant à lui cherche au contraire à utiliser des images source libre de droit et se pose depuis le premier jour de nombreuses questions éthiques, de représentation, de modération, de filtrage. Dall-E 2.0 n’a donc pas en son sein de photos de Tintin, Kid Paddle, ou autres photos de personnages politiques

C’est la fête chez les souris ! Les objets multiples / foules semble assez bien compris.

Pas de visage SVP

Attention toutefois à une limite “éthique” ou “légale” de Dall-E : impossible d’uploader des photos aujourd’hui (peut être une limite bientôt levée) de visages, il vous faudra rogner ou effacer ce dernier pour pouvoir travailler dessus. En effet cela fait parti des conditions d’utilisation pour éviter tout usage “choquant” de cet nouvel outil. Car après tout rappelons nous qu’il s’agit bien d’un outil créé par des êtres humain, oui Dall-E peut créer des images presque parfaite bien plus vite que ce qu’il a été possible d’observé jusqu’à aujourd’hui mais demain l’effet de synergie IA+Humain peut nous laisser rêver à des illustrations qui dépassent les frontières de la technique et de notre imagination.

Attention un canard avec un drôle de chapeau vous regarde…

Dall-E 3.0 ?

Quel sera l’avenir de Dall-E ? Des concurrents proposent leurs propres modèles, mini Dall-E (devenu crAIyon pour des raisons de copyright), mais encore loin d’égaler la qualité de Dall-E. On peut très bien imaginer Dall-E devenir accessible à tous (les data scientists et autres artistes férus d’IA attendent de pied ferme un modèle de même qualité opensource/ dataset compris). Outre cette concurrence on peut très bien imaginer après le texte, l’image, voir prochainement certainement des “vidéos” complètes qui pourraient petit à petit mettre à mal ou au contraire “booster” le secteur du cinéma et la production artistique d’animations… Dernière annonce de Dall-E : sa commercialisation en Bêta est ouverte ! Oui il est maintenant possible d’acheter des crédits, créer autant d’images que souhaiter et exploiter les images résultantes à des fins commerciales !

Un Zèbre conduit une voiture jaune tout en regardant un lion dans un miroir…

Aller de l’avant tout en jetant un coup d’oeil dans le retro : est-ce la solution à l’évolution des technologies ?

Lien vers le site officiel de Dall-E 2 :

Retrouvez conférences, formations et séminaires sur l’IA du même auteur sur

Publications détaillées sur les rouages de Dall-E :