Netflix dio un nuevo paso en su avance sobre la inteligencia artificial aplicada al audiovisual: la compañía presentó VOID, un sistema capaz de eliminar objetos de un video y reconstruir la escena completa para que el resultado mantenga coherencia visual y física. No se trata sólo de borrar un elemento y rellenar el fondo, sino de rehacer lo que ocurre alrededor como si ese objeto nunca hubiera estado allí.
La clave, según la documentación oficial del modelo, es que la herramienta no sólo identifica el objeto a eliminar, sino también las interacciones que ese elemento generaba en la escena —desde sombras o reflejos hasta movimientos o efectos físicos—, que luego son reinterpretadas por la IA para generar una nueva versión del video: una edición que no corrige, sino que reescribe.
En términos técnicos, el sistema combina un modelo de visión-lenguaje, que detecta qué partes del entorno quedaron afectadas, con un modelo de difusión de video que reconstruye la escena manteniendo una lógica coherente. Es decir, no “tapa” lo que falta: intenta simular qué habría pasado si ese objeto nunca hubiese estado en la toma.

Ese punto marca la diferencia con herramientas anteriores, que funcionaban bien cuando el objeto eliminado no alteraba demasiado el entorno, pero que fallaban frente a situaciones más complejas. VOID apunta justamente a resolver ese límite: pasar de una edición correctiva a una edición contrafáctica.
El modelo fue publicado a inicios de abril en plataformas como GitHub y Hugging Face, bajo licencia Apache 2.0, lo que implica que Netflix no sólo mostró la tecnología, sino que liberó tanto el código como el modelo entrenado para que terceros puedan adaptarlo o integrarlo en otras herramientas. Eso sí, por ahora no es una app de uso masivo, ya que requiere hardware de alto rendimiento y conocimientos técnicos para su implementación.
Netflix, de hecho, ya había dado una señal en esa dirección: la compañía reconoció el uso de inteligencia artificial en la serie El Eternauta, donde se recreó desde cero el desplome de un edificio mediante herramientas generativas. El dato no es menor, porque evidencia que la IA no sólo se proyecta como herramienta futura, sino que ya interviene en escenas concretas dentro de producciones reales.
El avance, de todos modos, no se agota en lo técnico: si una herramienta puede eliminar un objeto y reconstruir coherentemente lo que sucede en una escena, la línea entre edición y manipulación empieza a volverse más difusa. En otras palabras, ya no se trata sólo de mejorar una imagen, sino de modificar lo que esa imagen muestra como ocurrido y ese es el salto.
VOID aparece, además, como parte de una estrategia más amplia de Netflix en inteligencia artificial, que ya había dado señales en el desarrollo de herramientas de búsqueda basadas en lenguaje natural. Pero ahora el foco cambia de lugar: ya no es sólo qué ver, sino qué puede hacerse con lo que ya fue filmado.
Y ahí es donde el anuncio deja de ser una curiosidad tecnológica para convertirse en algo más profundo: una herramienta que no sólo edita videos, sino que empieza a reescribirlos.