El impacto de Sora, de OpenAI, en la industria china de la IA

Posted by Written by Giulia Interesse Reading Time: 8 minutes

Sora, el innovador modelo de conversión de texto en vídeo de OpenAI, ha despertado tanto entusiasmo como cautela en la industria tecnológica china.


Traducción: Katherine Cheung García 

El 16 de febrero de 2024, OpenAI presentó Sora, un software de inteligencia artificial (IA) diseñado para traducir a la perfección instrucciones de texto escrito a vídeos.

El debut de Sora representa un hito importante en el ámbito de los contenidos generados por inteligencia artificial (AIGC) y ha suscitado una gran atención entre los observadores del sector de todo el mundo. Mientras que los avances en la generación de imágenes han sido evidentes en los últimos tiempos, la generación de vídeo ha supuesto un reto formidable, sin avances significativos hasta ahora.

Sora representa el siguiente salto adelante, sobre la base de proyectos pioneros de OpenAI como DALL-E, que revolucionó la tecnología de generación de imágenes. De hecho, el software maximiza los puntos fuertes de OpenAI en grandes modelos de lenguaje (LLM), reafirmando su posición como líder del sector.

En el dinámico panorama empresarial y tecnológico de China, el último logro de OpenAI con el modelo de conversión de texto en vídeo Sora suscita tanto entusiasmo como preocupación. Aunque la innovación despierta expectación por los avances, también hay aprensión debido a la mayor competencia en el sector y a las posibles limitaciones derivadas de las tensiones comerciales entre Estados Unidos y China.

En este artículo, exploramos la aparición de Sora y su impacto en el dinámico panorama chino de la IA, destacando las oportunidades y los retos que presenta para las empresas, las comunidades tecnológicas y los reguladores por igual.

¿Qué es Sora?

Sora es una herramienta de inteligencia artificial diseñada para generar vídeos completos, de hasta un minuto de duración cada uno, a partir de instrucciones del usuario. En otras palabras, con una simple pregunta, Sora puede producir el vídeo correspondiente.

Para quienes no participan activamente en las redes sociales o en círculos informáticos especializados, el repentino ascenso de Sora podría haber pasado desapercibido. A diferencia de muchos avances tecnológicos, Sora llegó a la escena sin mucha fanfarria ni extensa publicidad; simplemente surgió.

OpenAI ha presentado una plétora de vídeos de ejemplo que ponen de relieve las impresionantes capacidades de Sora y demuestran su habilidad para crear animaciones de gran realismo, sobre todo su capacidad para producir animaciones increíblemente realistas.

Estos ejemplos presentan detalles intrincados, como reflejos en espejos, movimientos precisos de fluidos en líquidos e incluso simulaciones realistas de partículas de nieve que caen.

Ventajas de Sora

Sora representa un avance significativo en la creación de contenidos impulsada por la IA, especialmente en la generación de vídeos, ampliando las capacidades de los modelos basados en texto como ChatGPT. Pertenece a la categoría de grandes modelos multimodales, ampliando las capacidades de los grandes modelos lingüísticos como GPT al gestionar eficazmente varios tipos de vídeos.

Una innovación clave de Sora es su tratamiento de los fotogramas de vídeo como secuencias de parches, similares a los tokens de palabras en los modelos lingüísticos, lo que le permite generar vídeos contextualmente relevantes y visualmente coherentes a partir de pistas textuales.

El entrenamiento de vídeo de Sora consta de tres pasos principales: red de compresión de vídeo, extracción de parches espaciotemporales y generación de vídeo. Mediante estos pasos, Sora consigue mejoras notables tanto en la duración como en la resolución de los vídeos en comparación con los modelos anteriores. Puede generar vídeos de hasta 60 segundos de duración a 1080p de resolución, con capacidad para editar y ampliar el contenido basándose en indicaciones de texto.

Además, Sora demuestra una profunda comprensión del texto, captando con precisión el significado emocional que subyace a las instrucciones textuales y transformándolas en detallados contenidos de vídeo sin fisuras. Simula las leyes físicas de los mundos virtuales, produciendo vídeos realistas con un movimiento tridimensional coherente y un comportamiento consistente de los objetos a través de diferentes ángulos de visión.

A diferencia de los modelos anteriores, Sora destaca en el mantenimiento de la coherencia y consistencia dentro de los vídeos, incluyendo elementos como el estilo de color, las expresiones faciales y las interacciones entre sujetos y fondos. Su atención al detalle garantiza transiciones fluidas entre las escenas del guión gráfico, mejorando la calidad general y el realismo de los vídeos generados.

Aplicaciones y usos de Sora

La versatilidad de Sora abre diversas aplicaciones en varios sectores, entre ellos (pero no exclusivamente):

  • Campos creativos: Cineastas, artistas visuales y diseñadores pueden aprovechar Sora para explorar nuevas dimensiones de expresión. Pueden generar visuales para guiones gráficos o secuencias de cortometrajes directamente a partir de guiones, lo que simplifica las fases de conceptualización y preproducción.
  • Educación y formación: Las capacidades de Sora se extienden a la producción de intrincados materiales educativos, incluidas recreaciones históricas y simulaciones científicas. Esto mejora las experiencias de aprendizaje proporcionando contenidos atractivos y visualmente envolventes.
  • Publicidad y promoción: Las empresas pueden beneficiarse de la capacidad de Sora para crear contenidos de vídeo visualmente cautivadores para campañas de marketing basadas únicamente en descripciones textuales. Esto agiliza el proceso de creación de contenidos y fomenta enfoques innovadores de la publicidad.
  • Juegos y realidad virtual (RV): Los desarrolladores pueden integrar Sora para mejorar los entornos de juego y realidad virtual. Sora puede contribuir con fondos dinámicos, interacciones entre personajes y escenas completas, enriqueciendo los elementos narrativos y la experiencia general de los videojuegos y los entornos de RV.

¿Cómo ve China a Sora?

Los debates en torno a Sora en China han suscitado diversas reacciones, que van desde la admiración y el aprecio hasta cierta ansiedad por la posibilidad de quedarse atrás en el campo de la IA, que avanza a gran velocidad.

En los vibrantes círculos empresariales y tecnológicos chinos se palpa una mezcla de expectación y aprensión ante el último avance de OpenAI.

Tras el anuncio de la introducción de Sora, los inversores nacionales en China lo han interpretado como una señal positiva para el mercado. El índice Sora, que incluye 49 empresas de tecnología, entretenimiento y medios de comunicación cotizadas en Shanghái y Shenzhen y potencialmente influidas por el modelo de IA, subió un 11,4% el 20 de febrero de 2024, el primer día de negociación tras las vacaciones del Año Nuevo chino.

El mercado percibe un potencial considerable en el desarrollo de la IA generativa. Según un informe de Ping An Securities, se prevé que el sector en rápida expansión de los LLM y la IA generativa impulse un crecimiento sustancial de la potencia de cálculo tanto en China como en el resto del mundo. El informe también destaca los beneficios previstos para las industrias, como la potencia de cálculo, los algoritmos y la ciberseguridad.

Sin embargo, en medio de este entusiasmo se encuentra el telón de fondo de una competencia cada vez más feroz en el sector de la IA y los persistentes retos derivados de las actuales tensiones comerciales entre Estados Unidos y China. Los observadores han expresado su preocupación por los posibles “riesgos para la cadena de suministro” en caso de que Estados Unidos siga restringiendo las exportaciones de chips a China. Si bien estas sanciones podrían catalizar el desarrollo de la industria nacional de chips de IA en China, la búsqueda de soluciones alternativas podría exigir un tiempo y un esfuerzo considerables para satisfacer las altas expectativas creadas por la evolución del panorama.

¿Tiene China su propio Sora?

El Gobierno chino, a través de la Administración Nacional del Ciberespacio (CAC), exige el registro de todos los modelos lingüísticos de gran tamaño accesibles al público. A fecha de publicación de este artículo, ni OpenAI ni Google ofrecen servicios directos en China. Sin embargo, Copilot de Microsoft, que utiliza los modelos GPT de OpenAI, es accesible en Hong Kong.

Ante la ausencia de empresas extranjeras en el mercado continental, los gigantes tecnológicos locales están compitiendo agresivamente por establecer su presencia en un panorama plagado de más de 200 LLM. Empresas como Baidu, Tencent Holdings y Alibaba Group Holding han puesto en marcha sus propios LLM.

Cloudwalk Technology, por ejemplo, se ha posicionado estratégicamente en el ámbito de los LLM multimodales, concentrándose en mejorar las funcionalidades de texto a imagen y texto a vídeo. La empresa ha presentado recientemente una plataforma de generación de “humanos digitales”, lo que subraya su compromiso con la expansión y la innovación.

Del mismo modo, Sumavision ha realizado importantes inversiones en la producción de contenidos de vídeo y ha expresado su dedicación a seguir explorando las tecnologías de contenidos generados por IA.

Estos movimientos estratégicos reflejan una tendencia más amplia entre las empresas chinas de IA a aprovechar los avances en las tecnologías de generación de vídeo y ampliar su oferta en el ámbito de los contenidos digitales. Sin embargo, actualmente muy pocas pueden igualar la destreza de Sora.

ByteDance, la empresa matriz de TikTok, reconoce que su herramienta interna de control de movimiento de vídeo, Boximator, se encuentra aún en una fase incipiente y no está preparada para un lanzamiento generalizado debido a las importantes diferencias de calidad de imagen, fidelidad y duración con respecto a los principales modelos de generación de vídeo.

Para salvar la distancia, los innovadores chinos deben dar prioridad a la investigación y el desarrollo tecnológicos, el cultivo de talentos y el conocimiento del mercado, al tiempo que navegan por los matices del mercado nacional e internacional y los requisitos de conformidad. La colaboración con equipos tecnológicos establecidos, el intercambio de recursos técnicos y la innovación en productos y aplicaciones adaptados a las necesidades del mercado nacional son imprescindibles para que las empresas chinas de IA superen a sus homólogas mundiales.

En lugar de competir directamente con Sora, algunas empresas del sector dan prioridad al acceso al modelo de OpenAI. Al parecer, Sinodata, con sede en Pekín, pretende ser una de las primeras empresas en solicitar una suscripción a la API de Sora una vez que la herramienta de conversión de texto en vídeo esté disponible en Azure, la plataforma de computación en la nube de Microsoft y principal patrocinador de OpenAI.

Este enfoque sugiere que es más probable que los actores chinos acepten talentos, conocimientos y colaboración extranjeros para hacer avanzar sus propios LLM. En última instancia, estas asociaciones podrían crear oportunidades de crecimiento mutuo, innovación y competitividad en el panorama más amplio de la IA.

Regulación de las aplicaciones de IA tipo Sora en China

China se ha convertido en pionera en la regulación de la IA.

Por un lado, China ha lanzado múltiples planes para promover el desarrollo de las tecnologías de IA, con diversas iniciativas como Made in China 2025, el Esquema de Acción para Promover el Desarrollo de Big Data (2015) y el Plan de Desarrollo de la Inteligencia Artificial de Nueva Generación (2017). Estos esfuerzos pretenden fomentar y supervisar el crecimiento del sector de la IA al tiempo que establecen leyes explícitas que regulan la ética de las empresas y los algoritmos de IA.

Además, el gobierno chino ha promovido activamente la expansión de su economía de datos como “factor de producción fundamental”, esbozando planes para construir la infraestructura necesaria para apoyar el desarrollo de sistemas de datos básicos.

Por otro lado, el gobierno chino quiere que el sector de la IA crezca de forma ordenada. China ha tomado medidas proactivas para establecer leyes que regulen las prácticas éticas de las empresas y algoritmos de IA. Como parte de su iniciativa más amplia para regular el sector tecnológico, es posible que el gobierno chino introduzca cada vez más normativas dirigidas específicamente a los modelos lingüísticos basados en IA como ChatGPT y Sora.

En julio de 2023, la CAC, junto con otros organismos, publicó las Medidas Administrativas Provisionales para los Servicios de Inteligencia Artificial Generativa (en lo sucesivo, las “Medidas de IA Generativa”). Las Medidas sobre IA Generativa, que constituyen la primera normativa exhaustiva sobre IA en China, abarcan una amplia gama de temas relacionados con la creación y prestación de servicios de IA generativa. Se hace especial hincapié en el avance del desarrollo y la aplicación de la IA, lo que subraya la dedicación y el respaldo de China al progreso tecnológico.

Mediante el establecimiento de un entorno operativo seguro y favorable, China pretende promover la innovación y, al mismo tiempo, supervisar la aplicación consciente y ética de la IA en diversos sectores.

Oportunidades en el sector chino de la IA

El sector de la IA presenta prometedoras oportunidades de inversión en China y se ha convertido en un área de interés clave para el gobierno. A pesar de los retos normativos, China está trabajando para crear un entorno propicio para la inversión extranjera y el talento en el sector de la IA.

Así, se prevé que la inversión china en IA alcance los 26 690 millones de dólares en 2026, lo que representa aproximadamente el 8,9% de la inversión mundial total. Además, la expansión del mercado del país, la floreciente base de consumidores y las avanzadas infraestructuras aumentan aún más las oportunidades para que las empresas desarrollen y amplíen sus productos y servicios de IA.

Para prosperar en el mercado chino de la IA, en rápida evolución, las empresas deben aprender a aprovechar las políticas de apoyo del país para perfeccionar sus estrategias. Alineándose con los objetivos gubernamentales y aprovechando los incentivos disponibles, los inversores pueden desbloquear una amplia gama de oportunidades de negocio. Además, deben mantener su capacidad de adaptación para navegar con eficacia por el cambiante panorama empresarial y la dinámica política inherente al competitivo mercado de la IA.

Dezan Shira & Associates

Con décadas de experiencia operando en el continente asiático, los especialistas de Dezan Shira y Asociados se encuentran bien posicionados para ayudar a las compañías de habla hispana a superar los obstáculos encontrados y lograr el éxito empresarial no sólo en China, sino en el resto de la región, a través de nuestro Spanish Desk. Para obtener más información, por favor contáctenos en la siguiente dirección: spanishdesk@dezshira.com