Cree arte de IA localmente: aplicaciones para difusión estable y otros modelos de aprendizaje profundo

Parece que el arte de la IA está actualmente en boca y en los ojos de todos. Además de composiciones completamente confusas, a veces hay imágenes muy respetables de los programas individuales que pueden crear imágenes localmente con "Difusión estable" y otros modelos de aprendizaje profundo. Con respecto a Apple Mac, estas aplicaciones están hechas principalmente para modelos con chips "Apple Silicon", no encontrarás versiones de Intel. Y el sistema operativo también debe estar actualizado, ya que los programas son en su mayoría Monterey oder sogar Ventura asumir. Lo siguiente es sobre Mochi Diffusion, Diffusers, AI Photo e Invoke AI.

A continuación, le presentaré cuatro programas para crear arte de IA localmente en Apple Mac. Probé tres de ellos yo mismo. El cuarto también debería ser bueno, pero fallé con la instalación.
A continuación, le presentaré cuatro programas para crear arte de IA localmente en Apple Mac. Probé tres de ellos yo mismo. El cuarto también debería ser bueno, pero fallé con la instalación.

Vista previa: la configuración que uso para probar aplicaciones

Las aplicaciones para crear arte con IA en Apple Mac están diseñadas principalmente para chips M, es decir, el M1 Pro y M1 Maxa la Chip M2 así como en los nuevos M2 Pro y M2 Max. Además, siempre debe tener instalado el último sistema operativo para garantizar la compatibilidad con los programas. Personalmente, actualmente estoy trabajando con esta configuración, que es muy adecuada para probar las aplicaciones de IA mencionadas:

  • Gerat: MacBook Pro de 16 pulgadas de 2021
  • Sistema en chip: Apple M1 Pro
  • Núcleos de CPU: 10 / Núcleos de GPU: 16
  • RAM: 16 GB de memoria compartida
  • Sistema operativo: macOS Ventura 13.2

Mochi Diffusion – Mi favorito actual

He dado mis primeros pasos en el campo del arte de la IA en los últimos días. Miré varias aplicaciones para macOS. El que creo que es el mejor hasta ahora se llama Mochi Diffusion. No es lo más fácil cuando se trata de instalar e integrar modelos de aprendizaje profundo, pero puede hacerlo. Luego puede ingresar descripciones de imágenes, especificar cosas que no deberían ocurrir, establecer la cantidad de pasos de trabajo y la intensidad de la IA y más. Además, no solo se puede generar una imagen, sino hasta 100 intentos por solicitud para implementar satisfactoriamente las instrucciones ingresadas.

Mochi Diffusion es actualmente mi favorito debido a las opciones de personalización y la facilidad de implementación de varios modelos de aprendizaje profundo. Sin embargo, apenas he comenzado a investigar el tema.
Mochi Diffusion es actualmente mi favorito debido a las opciones de personalización y la facilidad de implementación de varios modelos de aprendizaje profundo. Sin embargo, apenas he comenzado a investigar el tema.

Además de la difusión estable, también se pueden usar modelos de aprendizaje profundo como Fruity Mix, Anything, Redshift Diffusion y similares. Algunos son mejores para paisajes, otros para personas, otros para animales u objetos y otros para imitar estilos artísticos. Aquí debe leer o probar todo y tomar nota de qué modelos y qué configuraciones son mejores para sus propios propósitos. Desde una imagen de un personaje de D&D para la hoja de personaje hasta una obra de arte ficticia con el estilo de una persona específica, todo es posible. También se puede crear ciencia ficción o un cocodrilo con sombrero de copa.

Descarga de difusión Mochi

Puedes encontrar la descarga gratuita de Mochi Diffusion con este enlace en GitHub. El código fuente del software de código abierto también está disponible allí. Para alimentar el software con modelos, de los que luego se extraen los recursos necesarios para la creación de imágenes, lo mejor es visitar este sitio web. Hay modelos diseñados para la tecnología Apple “Core ML”, actualmente 38 piezas. Hay una pequeña descripción e imágenes de ejemplo para cada uno. Para imágenes cómicas con un diseño atractivo que deberían verse como si hubieran sido dibujadas con tinta, p. B. Hizo difusión Inkpunk. Los modelos tienen varios gigabytes de tamaño cada uno. Después de descargarlos y descomprimirlos, insértelos Macintosh HD/Usuarios/[nombre]/Documentos/MochiDiffusion/modelos.

A partir de ahora, hay 38 modelos que puede descargar para diferentes estilos de IA e implementarlos en Mochi Diffusion. Sin embargo, cada modelo ocupa varios gigabytes de espacio de almacenamiento en su disco duro.
A partir de ahora, hay 38 modelos que puede descargar para diferentes estilos de IA e implementarlos en Mochi Diffusion. Sin embargo, cada modelo ocupa varios gigabytes de espacio de almacenamiento en su disco duro.

Difusores: más simples, pero también bastante buenos

Aunque me gusta principalmente Mochi Diffusion, también tengo otras aplicaciones instaladas para crear arte de IA. Difusores es uno de ellos. Viene con varios modelos de "difusión estable" y también se puede alimentar con avisos (descripciones de imágenes) y avisos negativos (contenido que no debería aparecer en la imagen). Se pueden definir hasta 150 pasos de trabajo, pero ninguna intensidad de IA. En definitiva, es una aplicación similar, pero con menos opciones de personalización. Sin embargo, es útil para los primeros pasos, sobre todo porque también se puede descargar y utilizar de forma gratuita.

Diffusers también es una buena aplicación para crear arte con IA en macOS. Ya se incluyen varias versiones de "Difusión estable". Definitivamente adecuado para los primeros pasos y más allá.
Diffusers también es una buena aplicación para crear arte con IA en macOS. Ya se incluyen varias versiones de "Difusión estable". Definitivamente adecuado para los primeros pasos y más allá.

Descarga del difusor

Diffusers no necesita un viaje a GitHub y otros sitios web, y tampoco terminal-Entradas. Porque esta aplicación se ofrece en la Mac App Store. con este enlace llegas directamente a la oferta. Allí también encontrará las primeras imágenes de ejemplo, incluido el ejemplo "Labrador al estilo de Vermeer", que se muestra cuando abre la aplicación por primera vez. Recuerda un poco a una de las pinturas más famosas de Vermeer, La joven de la perla. 

AI Photo: la clasificación de imágenes como una gran fortaleza

Si bien he tenido buenas experiencias con Mochi Diffusion al crear paisajes, personajes de fantasía, animales, vehículos y escenas de ciencia ficción, la aplicación AI Photo me convenció con algo completamente diferente: ordenar las imágenes creadas. Además de una descripción general de "Todas las imágenes", hay varias "Colecciones" que puede expandir con sus propias carpetas como desee. Desde gatos hasta arquitectura y texturas, todo se puede organizar y encontrar rápidamente aquí. También hay una función de búsqueda y puede marcar favoritos. Entonces, si trabaja con grandes cantidades de imágenes de IA, debe probar AI Photo.

La fuerza de AI Photo, además de crear imágenes en una amplia variedad de estilos, radica en la clasificación de las distintas imágenes. Estos se guardan en la aplicación y no se pierden cuando se cierra (que es el caso de Mochi Diffusion, por ejemplo, si no guardas las imágenes manualmente).
La fuerza de AI Photo, además de crear imágenes en una amplia variedad de estilos, radica en la clasificación de las distintas imágenes. Estos se guardan en la aplicación y no se pierden cuando se cierra (que es el caso de Mochi Diffusion, por ejemplo, si no guardas las imágenes manualmente).

Descarga de fotos AI

AI Photo también se puede descargar fácilmente desde la Mac App Store oficial: Justo por aquí. Por lo tanto, no tiene que buscar la versión correcta en GitHub ni usar el terminal para ningún script. Y las imágenes útiles también salen con este programa. Por supuesto, también tiene que jugar un poco aquí y refinar las especificaciones de vez en cuando para obtener exactamente la imagen que desea. Pero lo que tienes que mantener en general y lo que tienes que describir en detalle, lo aprendes con el tiempo. Se requiere un poco de paciencia.

Invoke AI: la instalación más complicada de todas

Valoro a la comunidad de desarrolladores y me encanta GitHub, el software de código abierto proporcionado en otros lugares y las ofertas de aplicaciones gratuitas más allá de eso. Pero también puede complicar innecesariamente la instalación. En ocasiones, la (facilidad de) instalación y uso de la aplicación desarrollada no parece ser tan importante como la viabilidad del proyecto. Al menos eso es lo que siento por Invoke AI. Probé la descarga de GitHub (se encuentra aquí) con el instrucciones de esta página para ser implementado a través de la terminal. Pero no funcionó debido a algunos errores de Python o algo así. 

?

Tengo que admitir que no me demoré mucho aquí con la solución del error. Después de que un segundo intento no funcionó, pospuse la prueba de Invoke AI indefinidamente. Sin embargo, si pudo instalar la aplicación con éxito y notó ventajas especiales (especialmente en comparación con las otras aplicaciones presentadas aquí), deje un comentario. Estoy muy emocionado de ver lo que el programa puede hacer y si fue capaz de convencerte. Personalmente, en este momento me siento reforzado en mi deseo de que los desarrolladores piensen en el usuario normal y hagan que la instalación del software sea lo más fácil posible.

¿Te gustó el artículo y te ayudaron las instrucciones del blog? Entonces sería feliz si usted el blog a través de una membresía constante apoyaría.

8 pensamientos sobre "Creación de arte con IA localmente: aplicaciones para difusión estable y otros modelos de aprendizaje profundo"

  1. Descargué una aplicación como esta hace unos meses. Pero no recuerdo cuales. Era demasiado lento para mi Air. El resultado parecían bultos poco atractivos. Solo he probado cosas muy simples como "gato siamés".

    La programación es más difícil si se supone que otras personas también deben usar el programa. Todas estas aplicaciones parecen muy inmaduras.

    Si falta el comando python3, entonces todo el python de https://www.python.org/downloads/ . Y después de eso, probablemente será necesario ajustar las rutas. No me gusta eso en absoluto.

    También revisé un servidor de discordia. Pero de alguna manera no pude hacer nada con eso.

    1. Hola Beatrice,

      Sí, la mayoría de las veces tienes que hacer las entradas un poco más detalladas y probar ciertos términos y limitaciones. Los ejemplos de imágenes para este artículo quizás fueron elegidos de manera poco atractiva. Sin embargo, las aplicaciones pueden generar cosas bastante respetables. Voy a añadir algunas fotos más para que quede más claro. O haga una nueva publicación sobre indicaciones.

      Llamaría a las aplicaciones "simples" en lugar de "inmaduras". Si desea dar los primeros pasos en el arte de la IA, entonces son bastante útiles, al menos esa es mi observación hasta ahora.

      Sí, no quería experimentar con Python y demás. En la terminal, que se tenía que usar para la instalación, también se mostró que necesitaría Xcode. Pero, ¿por qué debo ensamblar la aplicación yo mismo (o hacer que la ensamble usando un script) cuando también podrías ofrecerla lista para descargar? Realmente no tiene sentido para mí en absoluto.

      La discordia es otro tema. Realmente no tiene nada que ver con la IA, excepto quizás en términos de bots. De todos modos, me gusta Discord.

      Saludos cordiales
      Juan

      1. Construir una aplicación es trabajo. Con Xojo, aprieto un botón. En Python, es mucho más complicado. Luego, el programa tiene que ser firmado y notariado, lo cual es más trabajo.

        Me inscribí en algo de inteligencia artificial (a mitad de camino???). Absolutamente terrible proceso de incorporación. Y luego pensé, puedo poner mis indicaciones allí en alguna parte. Pero no vi a través de eso en absoluto y no tenía ganas de trabajar en ello.

        1. Oh cierto, Midjourney usa Discord. Ahora entiendo la conexión. Lo probé hace meses, pero luego preferí esperar una aplicación web o una aplicación para uso local. Y por suerte hay bastantes de ellos. Ya había reprimido todo el problema de Discord porque principalmente uso Discord para comunicarme con otras personas o con ciertas comunidades, según el servidor.

          1. Mi prueba de mochi fue incluso más rápida que la aplicación que probé hace unos meses. La cosa se estrelló con fuerza después de unos minutos. ¡Chatarra!

    2. Así que soy un gran admirador de Midjourney. Lo que obtienes allí para las imágenes es una locura. Ya estaba usando Midjourney 6 hace 2 meses y estaba muy entusiasmado con él, pero la versión actual 4 me ha dejado boquiabierto. Pero la operación a través de Discord es solo una cosa en sí misma. Pero si puedo llevarme bien con eso, todos los demás deberían poder hacerlo también. 😊

  2. Una vez probé los difusores en mi Intel imac. Se ejecuta, calcula durante mucho tiempo, pero solo expulsa imágenes de la bandeja de basura. En otras palabras, ni la más mínima referencia a los términos en el aviso.

Escribe un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados con * markiert

En el Blog de Sir Apfelot encontrarás consejos, instrucciones y reseñas sobre productos de Apple como el iPhone, iPad, Apple Watch, AirPods, iMac, Mac Pro, Mac Mini y Mac Studio.

Especiales