Cine Mudo (Digital)
"La cámara inventó una nueva forma de arte: el cine. Si pensamos en la IA como un nuevo tipo de cámara, estamos a punto de ver el nacimiento de una nueva forma de arte." (Cristóbal Valenzuela)
Cristóbal Valenzuela es uno de los fundadores de RunwayML, hasta hace algún tiempo la niña bonita del GenAI de video.
Cristóbal y sus socios son chilenos. Desarrollaron su proyecto desde la NYU, pero el talento lo traían de antes, de Sudamérica. Esa capacidad de innovar, de avanzar pasito a pasito con pocos recursos, con las uñas y con los dientes, solamente se experimenta en un contexto de escaseces como el latino.
Saber manejar la escasez en medio de un mundo digital de abundancia es una destreza bastante inusual en mercados maduros. Las grandes empresas tecnológicas lo han ido aprendiendo en este último año, en su adecuada dimensión.
Creo que Runway ha logrado desarrollar su nicho de negocios, más allá o más acá de lo que suceda con aquellos grandotes que vienen por todo. Quizás termine siendo absorbida por alguien más, o se vaya achicando y se quede en algún segmento desatendido o ya conquistado, como si fuera un nuevo ciclo disruptivo, su nuevo dilema a resolver. Quien sabe, les deseo lo mejor.
El reloj digital es así: “hace algún tiempo” sería como 2 semanas atrás, más o menos. Lo suficiente para un nuevo lanzamiento que deslumbre y provoque mil y un análisis y pronósticos, hasta que aparezca el siguiente que nos distraiga como a perros amagando lanzarles una pelota.
O hasta que aparezca una nueva falla absurda, ridícula, de esas de las que solo los privilegiados se pueden recuperar.
Filosofaba estos días cosas como estas, mientras me hacía de algunos pocos minutos libres para entender qué catzo era Sora: si va a revolucionar el negocio audiovisual para siempre, si realmente “será escalado, perfeccionado, afinado y optimizado a partir de aquí, lo peor que jamás será”, si la verdadera diferencia es el volumen inmenso de datos capturados para el entrenamiento, o quizás la mezcla inteligente y única de “transformers” y “diffusions”.
Y si, como predecía Doug Shapiro, al final el video es un problema que también tendrá solución.
Sin embargo, mis pensamientos se iban retorciendo, alejando del centro. Y terminé concluyendo que hemos entrado a otro día de la marmota (uno más, y van…). Pero que también los días digitales son cada vez más cortos, de 24 segundos tal vez…
Attention is All You Need
Este círculo digital comenzó en 2017 con ese paper: “Attention is all you need”, redactado por investigadores que trabajaban en los laboratorios de Google Brain, en la época en que Google no andaba tan… no sé.
Ahí estuvo el inicio del loop, el algoritmo Transformer, el que aprendió a predecir la siguiente palabra... o token.
Una época en donde la IA parecía seguir el camino original de Internet: un mundo abierto en el que todos aportaban y recibían, colaboraban. Por eso se publicó, no se filtró. El conocimiento es universal, para toda la humanidad. La experiencia y el saber hacer marcan la diferencia.
La atención está en el centro del algoritmo, lo que le permite ir hacia adelante, hacia atrás y los costados en su álgebra vectorial, encontrar la semántica de una palabra un token y -con mucho esfuerzo computacional, infinitos datos y sobrado entrenamiento y re-entrenamiento, más toda la plata que quizás le faltó a Cristóbal- predecir maravillosamente lo que viene después.
Lo que vino después fue… el caos. Y como corresponde a la Teoría del Caos: “… pequeñas variaciones en las condiciones iniciales pueden implicar grandes diferencias en el comportamiento futuro, imposibilitando la predicción a largo plazo”.
Así estamos y es bueno entenderlo: imposibilitados de predecir el largo plazo. En medio del caos.
Tal vez solamente tengamos indicios, incluso opiniones, algunas guías o personas a quienes uno les cree más (o menos). Quizás sea por los mismos sesgos personales, como decía Marty Baron: “Mucha gente no busca estar informada, busca ser afirmada”. A lo mejor me pasó.
Así como la atención es lo que le sobra a Transformer, es lo que escasea en las personas. Vivimos una vida acelerada donde cada vez tenemos más actividades, más distractores y menos tiempo, como explicaba maravillosamente Ben Thompson en esta conversación con Matt Belloni:
Entonces, si cada quien decidiera dedicarse a lo que sabe hacer, las piezas del rompecabezas empezarían a ubicarse en su lugar.
En este mundo hiper-tecnologizado que corre a la velocidad de la luz, el siguiente desafío de la GenAI de video (incluso para Sora) será poder sincronizar el movimiento de los labios con la voz, permitir que las personas sintéticas en un video sintético puedan hablar.
Sucederá dentro de 10… ¿minutos? Mientras tanto, sí, hoy estamos de vuelta, como en un círculo, en los inicios del cine: mudos, pero digitales. “Una nueva forma de arte”.
¡Sean bienvenidos a otro día de la marmota!
Leyendo el fin de semana pasado a Trung Phan, no pude dejar de hacer la analogía con lo que me sucede hoy. Transcribo entonces en este cierre “extra”, las palabras de Václav Havel:
“Tarde o temprano, sin embargo, un escritor (o al menos un escritor de mi tipo) se encuentra en una encrucijada: ha agotado su experiencia inicial del mundo y las formas de expresarlo y debe decidir cómo proceder a partir de ahí.
Por supuesto, puede buscar maneras cada vez más brillantes de decir las cosas que ya ha dicho; es decir, esencialmente puede repetirse a sí mismo.
O puede descansar en la posición que alcanzó en su primer estallido de creatividad, subordinar todo lo que aprendió a los intereses de consolidar esa posición, y así asegurarse un lugar en el Parnaso.
Pero tiene una tercera opción: puede abandonar todo lo probado, dar un paso más allá de su experiencia inicial del mundo, con la que ahora está demasiado familiarizado, liberarse de lo que lo ata a su propia tradición, a la expectativa pública y a su propia posición establecida, e intentar una nueva y más madura autoconciencia, aquella que corresponde a su experiencia actual y auténtica del mundo.
En resumen, podrá encontrar su "SEGUNDO VIENTO".
Quien elija este camino, el único (si se quiere seguir escribiendo) que realmente tiene sentido, no lo tendrá, por regla general, fácil. En esta etapa de su vida, un escritor ya no es una hoja de papel en blanco y es difícil desprenderse de algunas cosas. Su entusiasmo original, su confianza en sí mismo y su apertura espontánea han desaparecido, pero aún no se vislumbra una madurez genuina; De hecho, debe empezar de nuevo, pero en condiciones esencialmente más difíciles”.
Gracias por acompañarme. Los recibo aquí, junto con mi familia, en mi “Segundo Viento”. ¡Benvinguts!
Buenos segundos vientos y buenos mares para ti y tu familia!