¿No puedes notar la diferencia entre la versión MJ?

¿No puedes notar la diferencia entre la versión de MJ?

¿Qué significa versión MJ?

MJ lanzará periódicamente nuevos modelos de algoritmos y diferentes versiones del modelo son adecuadas para diferentes tipos de imágenes. La última versión es la V5 lanzada el 16 de marzo de 2023, pero la versión predeterminada sigue siendo la V4.

¿Cómo cambiar la versión utilizada actualmente?

Método 1: Ingrese/configure el comando y seleccione la versión en la configuración. La versión predeterminada es V4.

Método 2: agregue [-] + versión del modelo después del contenido del mensaje, como - v 5.

¿Puedes entender lo que se ha actualizado en OV5?

Se ha aumentado el rango de estilización de imágenes y la respuesta a las palabras clave es más precisa.

Mejore la calidad de la imagen, optimice el rango dinámico (rango rico en detalles de la imagen), agregue más detalles de la imagen, muestre el contenido con mayor precisión y elimine texto innecesario.

Se mejoró el peso de la información de las palabras que indican imágenes.

Admite [-tile] efecto de mosaico sin fisuras.

Admite una relación de aspecto [-AR] superior a 2:1.

Admite [-iw] para ajustar el peso de la información de las imágenes y el texto de los mensajes.

Las palabras clave prestan más atención a la descripción coloquial.

En la versión V5, las palabras clave están más estrechamente relacionadas con el contenido de la imagen, lo que requiere que prestemos más atención al descripción del contenido de la imagen. Además, el algoritmo optimiza la función de procesamiento del lenguaje natural (PLN), recordándonos que debemos utilizar un párrafo completo para describir en lugar de una sola palabra.

La resolución predeterminada de la imagen generada es mayor.

El mapa de cuatro cuadrículas predeterminado de la versión V5 se ha actualizado a una resolución de 1024x1024, mientras que el mapa de cuatro cuadrículas anterior de la versión V4 era 512x512, lo que solo se puede lograr actualizando a través de [ Botón U].

La siguiente imagen muestra los tamaños de imagen de diferentes versiones después de la conversión ascendente (solo para el cuadrado 1:1 predeterminado. Los datos rojos indican el tamaño de la versión actual después de la conversión ascendente, es decir, la imagen grande generada). después de hacer clic en el botón U. Tamaño de la figura.

Debido a que la resolución de imagen predeterminada actual de 1024x1024 en la versión V5 ya es la resolución máxima, la tecla U solo corta la imagen y no optimiza los detalles de la imagen.

Las operaciones detalladas de conversión ascendente de frecuencia y de conversión ascendente de frecuencia máxima son para las versiones anteriores de V1 a V3, y otras versiones nuevas posteriores tienen operaciones relacionadas agregadas de forma predeterminada.

Utilice parámetros estilizados con más frecuencia.

Anteriormente, en la versión V4, si se agregaban animaciones y otras indicaciones, el estilo de las imágenes generadas sería básicamente el mismo. Sin embargo, en la versión V5, el parámetro de estilización predeterminado es 1000, las imágenes generadas serán más realistas y el efecto se parecerá más a una fotografía que a una pintura artística. Por lo tanto, en V5, intente agregar parámetros estilizados a las indicaciones tanto como sea posible, lo que hará que las imágenes generadas sean más consistentes con el estilo que describimos.

√ iw regresión de parámetros, el gráfico de almohadillas es más útil.

El parámetro de peso de la imagen ha regresado en V5, que anteriormente solo era compatible con la versión V3. Este parámetro se utiliza principalmente para establecer el peso de las indicaciones de imagen en relación con las indicaciones de texto. El valor predeterminado en V5 es 1 y el rango de valores es 0,5 ~ 2.

El modo de fusión Remix es más potente.

El modo de fusión consiste en seguir componiendo la imagen generada y luego regenerar la imagen. Para imágenes nuevas, se pueden modificar el contenido del mensaje, los parámetros, el modelo de versión y la proporción de la imagen. En el modo mixto de la versión V4, incluso si las indicaciones son exactamente las mismas, el algoritmo generará nuevos conocimientos, por lo que las imágenes generadas serán muy diferentes. En V5, si las palabras solicitadas no se modifican, las imágenes recién generadas no serán muy diferentes.

Se solucionó el desorden de manos y pies

El desorden de manos y pies que se ha criticado en la versión V4 se ha optimizado en V5 (aunque todavía hay desalineaciones ocasionales).

Parámetros de mosaico que admiten efectos de mosaico continuo

Anteriormente, Tile solo estaba disponible para versiones anteriores de V1 a V3. Este parámetro se utiliza para generar imágenes de collage repetidas, como textiles, texturas de papel tapiz y otros patrones.

¿Generación de imágenes dos veces más rápida?

El 30 de marzo, MJ anunció oficialmente que había actualizado el algoritmo de la versión V5 (actualmente considerada la versión V5), que no consumirá recursos adicionales de GPU. En teoría, la velocidad de generación de imágenes será el doble. tan rápido y la calidad de la imagen no se verá afectada demasiado. Sin embargo, el servidor ha estado lleno recientemente, lo que provoca frecuentes retrasos. No hay diferencia en la velocidad al usarlo ahora.

V4 se lanzó en febrero del año pasado (12) y actualmente es la versión predeterminada de MJ. Aunque V5 ha mejorado en detalle y rendimiento, no es estable. Según la experiencia actual, se recomienda elegir según sus propios escenarios de uso.

V5 es adecuado para generar imágenes como fotografías que requieren alta definición y restauración de detalles, y V4 es adecuado para generar ilustraciones o imágenes tradicionales con un fuerte estilo artístico.

Antes del lanzamiento de V5, V4 ha estado optimizando continuamente el algoritmo. Los cambios más obvios se dividen en tres subversiones: V4a, V4b y V4c. La última V4c es la predeterminada. Puede agregar parámetros de estilo después de V4 y cambiar para verificar el efecto de generación de imágenes de las subversiones.

Modo de prueba Test/testp

Test/testp no es un producto oficial. Se utiliza para realizar pruebas y recopilar comentarios en la comunidad pública, con pruebas centradas en arte digital y pruebas centradas en imágenes fotográficas.

El modelo de prueba es menos compatible con sugerencias y parámetros, y se pueden generar imágenes más creativas agregando parámetros creativos.

El modelo Niji es un modelo de imagen bidimensional producido por MJ y Spellbrush. Es algorítmicamente bueno en varios estilos de animación, especialmente en términos de rendimiento dinámico, escenas de acción y expresión de personajes.

El equipo de Spellbrush se centra en el campo de la IA bidimensional. Si estás interesado, puedes seguirlos en Discord.

上篇: ¿Quién interpretó a la señorita Tang en Cangsheng Inn en Six Doors? 下篇: ¿Qué habilidades se necesitan para ser contador?