DALL·E 3 arriba a ChatGPT, Bing i Microsoft Designer

[ad_1]

OpenAI ha compartit recentment detalls sobre DALL·E 3, l’última versió del sistema d’IA de text a imatge, que arribarà aquesta tardor a ChatGPT Plus, ChatGPT Enterprise, Bing’s AI Image Creator i Microsoft Designer.

Aquesta actualització promet una precisió de la imatge millorada, un major matís i atenció al text d’entrada de l’usuari.

Novetats amb DALL·E 3

Les iteracions anteriors de DALL·E requerien que els usuaris ajustessin les seves indicacions mitjançant un procés conegut com a enginyeria de promptes.

DALL·E 3 pretén eliminar aquesta molèstia generant imatges que s’adhereixin més a les instruccions de text inicials de l’usuari.

Per exemple, on DALL·E 2 pot representar un jugador de bàsquet vagament nebulós, DALL·E 3 crearà una representació més expressiva i precisa a partir del text proporcionat.

El nou sistema es basa en ChatGPT, permetent una interacció perfecta entre les plataformes de text i imatge.

Els usuaris poden implicar ChatGPT com a “partner de pluja d’idees” per refinar les seves idees d’imatge. Si a un usuari li agrada una imatge generada però vol canvis menors, una conversa amb ChatGPT pot produir aquestes alteracions amb una o dues frases.

DALL·E 3 Mecanismes de seguretat

Un enfocament afegit als mecanismes de seguretat també distingeix DALL·E 3. Aquests inclouen mitigacions per evitar la generació de contingut violent, per a adults o d’odi.

A més, DALL·E 3 declinarà generar imatges que incloguin personatges públics vius o que imitin l’estil dels artistes vius.

Aquestes precaucions es van desenvolupar en col·laboració amb experts del domini coneguts com a “equips vermells”, que posen a prova rigorosament el sistema per detectar vulnerabilitats de seguretat.

Els desenvolupadors també estan explorant maneres d’ajudar els usuaris a identificar imatges generades per IA. Estan investigant un “classificador de procedència”, una eina interna que pot reconèixer si una idea es va originar a partir de DALL·E 3.

Aquesta eina es troba en fase experimental, però el seu desenvolupament indica un enfocament proactiu per abordar problemes de desinformació i manipulació d’imatges.

Quan estarà disponible DALL·E 3?

DALL·E 3 està previst que estigui disponible per a ChatGPT Plus i Empresa clients aquest octubre.

OpenAI té previst oferir llicències liberals, que permetin als usuaris de ChatGPT utilitzar, vendre o comercialitzar lliurement les imatges que creen sense necessitat de permís de la plataforma.

Microsoft també té previst afegir suport DALL·E 3 Creador i dissenyador d’imatges AI de Bing en les properes setmanes.

Com els artistes i els creadors de contingut poden optar per la formació DALL·E 3

Com amb tots els models d’IA, DALL·E 3 aprèn les seves capacitats a partir d’una àmplia gamma de dades públiques, incloent text i imatges. Aquest procés d’aprenentatge reflecteix la manera com els humans adquireixen coneixement.

Per exemple, després d’examinar diverses imatges de gats, la IA pot generar una imatge única i completament nova d’un gat, com una persona podria dibuixar un gat després de veure prou exemples.

És fonamental tenir en compte que un cop aquests models han assimilat les seves dades d’entrenament, ja no hi tenen accés directe. Quan un usuari interactua amb el model, es basa en els seus conceptes interioritzats en lloc d’extreure d’una base de dades externa.

OpenAI, en un intent d’abordar les consideracions ètiques sobre la propietat del contingut, ha ofert als artistes dues maneres de no participar en la formació en IA.

Els propietaris del lloc web poden bloquejar GPTBot, un rastrejador web dissenyat per recopilar dades d’entrenament, des de l’accés al seu lloc. Afegir GPTBot als protocols robots.txt del lloc pot ser una ruta més eficient per a aquells amb grans volums d’imatges.

Alternativament, OpenAI va proporcionar a forma perquè les persones sol·licitin l’eliminació del seu contingut dels futurs conjunts de dades de formació.

Val la pena assenyalar que OpenAI també adquireix llicències per a conjunts de dades, de manera que si heu permès llicències de tercers en altres plataformes, és possible que ompliu el formulari no garanteixi l’eliminació completa.

El futur de la creació de contingut amb IA generativa

Això actualitzar a la generació d’imatges d’IA des d’OpenAI representa un altre avenç significatiu per als venedors i creadors de contingut.

Tot i que farà que el disseny gràfic sigui accessible a més gent, els avenços en aquest àmbit obren la porta a més complexitat legal i ètic qüestions.


Imatge destacada: producció de Vladimka/Shutterstock



[ad_2]

Source link

DALL·E 3 arriba a ChatGPT, Bing i Microsoft Designer