Midjourney lanza modelo de video: la nueva frontera de la generación audiovisual con IA

Mientras los generadores de imágenes por inteligencia artificial integrados en chatbots como ChatGPT o Gemini han acaparado gran parte de la atención mediática, Midjourney ha estado trabajando silenciosamente para mejorar su motor gráfico desde su lanzamiento hace tres años. Hoy, esta plataforma sorprende nuevamente con un nuevo modelo de video, que marca un paso clave hacia una ambiciosa meta: crear un simulador de mundos 3D en tiempo real.

Una visión futurista: de imagen estática a video animado

El nuevo generador de videos de Midjourney funciona de manera diferente a otras herramientas de IA. En lugar de partir de un texto, se parte de una imagen estática —ya sea generada por IA o una foto cargada por el usuario— y se crea a partir de ella una animación de cinco segundos. Estos clips pueden extenderse en bloques de cuatro segundos hasta cuatro veces, permitiendo así videos de hasta 21 segundos.

Esto convierte a Midjourney en una herramienta más interactiva y controlada que otras plataformas de video con IA, permitiendo al usuario definir con precisión cómo se desarrolla el movimiento en la escena.

¿Cómo se crea un video en Midjourney?

Para comenzar, el usuario debe generar una imagen en la interfaz web. Tras ingresar el prompt (descripción de texto), se puede ajustar la relación de aspecto y otros parámetros usando los controles disponibles. Luego, Midjourney presenta varias versiones de la imagen y, con ellas, aparecen nuevas opciones de animación:

Modo Auto: la IA decide por sí sola el tipo de movimiento.
Modo Manual: el usuario indica exactamente qué movimiento desea.

También se puede elegir entre:

Low Motion (bajo movimiento): animación sutil, con menos errores.
High Motion (alto movimiento): animación más intensa, con más riesgo de fallos visuales.

Tras generar el video, se puede optar por descargar la versión original o una optimizada para redes sociales, ideal para reducir pérdidas de calidad por compresión.

Calidad visual destacable, aunque con limitaciones

El modelo V1 de Midjourney ha demostrado ser pulido y potente, especialmente considerando que es su primera incursión formal en video. Las animaciones de paisajes naturales o ciudades futuristas resultan fluidas y fieles al prompt original. Sin embargo, persisten algunos rasgos típicos de los generadores por IA, como físicas poco naturales o degradación progresiva de detalles al extender el video.

Aún así, la consistencia entre los bloques animados (de cuatro segundos cada uno) es notable, y el enfoque paso a paso permite a los creadores construir videos de forma intencional y cuidadosa.

Comparativa con Sora de OpenAI y Veo 2 de Google

Para entender mejor las capacidades de Midjourney, se realizaron pruebas similares en otras plataformas como Sora (OpenAI) y Google Veo 2.

Sora

Permite crear videos de hasta 20 segundos.
Ofrece menos control: el usuario introduce el prompt y espera el resultado.
Los resultados fueron mixtos, con escenas visualmente interesantes pero plagadas de movimientos extraños y fondos poco realistas.
Ideal para proyectos casuales, pero no tan intuitiva ni confiable como Midjourney.

Veo 2 (Flow de Google)

Genera videos basados en imágenes, con posibilidad de mantener coherencia a lo largo de la escena.
Los resultados fueron los más cercanos a lo esperado, con animaciones suaves y fieles al prompt.
Sin embargo, se requiere una suscripción premium de al menos $20 mensuales, o incluso $250 para acceso completo al modelo Veo 3 (aún sin soporte para imágenes estáticas).

¿Qué herramienta elegir?

Midjourney: Mejor para quienes buscan control, coherencia y una experiencia guiada. Ideal para usuarios creativos, diseñadores o comunicadores.
Google Veo 2: Ofrece el mejor acabado general, ideal para proyectos más ambiciosos o profesionales.
Sora de OpenAI: Todavía en evolución, con resultados impredecibles y menos personalizables.

El nuevo modelo de video de Midjourney representa un avance significativo en la generación de contenido visual con IA, permitiendo a los usuarios dar vida a imágenes estáticas de manera sencilla, precisa y con una calidad destacable. Aunque aún hay limitaciones propias de esta tecnología emergente, el enfoque modular y su integración con un sistema de créditos flexible hacen de Midjourney una opción accesible y poderosa.

Para los creadores de contenido, artistas digitales y exploradores visuales del futuro, Midjourney se posiciona como una herramienta imprescindible en la nueva era audiovisual impulsada por inteligencia artificial.