Desde Lejos no se Ve
"Action produces information. If you’re unsure of what to do, just do anything, even if it’s the wrong thing. This will give you information about what you should actually be doing." (Brian Armstrong)
Armstrong, co-fundador de Coinbase, uno de los exchanges de criptomonedas más serios del mercado, completaba la frase introductoria así:
“Una de las lecciones que más me han gustado aprender trabajando con gente inteligente:
La acción genera información. Si no estás seguro de qué hacer, simplemente haz cualquier cosa, aunque sea incorrecta. Esto te dará información sobre lo que realmente deberías estar haciendo.
Parece sencillo en apariencia; lo difícil es incorporarlo a tu proceso de trabajo diario.”
Vivimos en un mundo hiperconectado, inundado de información, pero con muy poca acción en una proporción equivalente.
Resulta mucho más sencillo criticar al que hace, que ponerse en su lugar y ejecutar.
Es que actuar, queridos amigos lectores, no significa solamente provocar el movimiento para uno mismo, sino el liderazgo para que otros acompañen. Cada cual en su rol, por supuesto, como siempre ha sido (¿como siempre será?), desde las épocas de los recolectores y cazadores.
Lo hablaba justo esta semana con una muy reciente y querida amiga, profesionalísima y buena persona, una combinación ya no tan usual, lamentablemente. Charlábamos de la vida, del trabajo, los problemas diarios, y por una frase muy importante que me decía y recalcaba, me surgió una reflexión de cosas que voy leyendo e internalizando por aquí y por allá.
Le decía, resumidamente, que últimamente veo en forma reiterada 3 palabras que se repiten en boca (o dedos que teclean) de personas que respeto mucho, que precisamente son, en su vida profesional, un fiel reflejo de la frase de Armstrong:
Build: salir del bucle infinito de la dialéctica boba para empezar a construir algo, aunque sea falible.
Deliver: no quedarse solamente en el rol del constructor, sino preocuparse por distribuir lo que se crea, ponerlo a disposición de los demás, aprender de la experiencia y los datos que se recolectan. Exponerse a la crítica, a los errores. Es que ya no somos (tanto) recolectores de alimentos para nuestro sustento diario, sino de datos que debemos transformar en información, si queremos aprender de lo que creamos.
Y, por sobre todo, AGENCY: en inglés es una palabra engañosa, que muchas veces se confunde con tener autoridad, independencia de acción, autonomía. Pero tener “agency” significa, por sobre todo, actuar. Dice la tercera acepción de la palabra en el diccionario de Oxford: “the ability to make decisions and act independently”. Resalto la palabra “act”. Eso es.
Luz, cámara… ¡ACCIÓN!
Decía en mi último artículo, construido de la mano de Gemini (antes incluso de su última e impactante versión 3) que “cuando todo avanza a la velocidad de la luz, es mejor mirar por el espejo retrovisor para evitar chocarse contra uno mismo”.
Mirar por el espejo retrovisor es una manera de calmarse, tomar distancia, prepararse mejor para lo que viene.
Entender no solamente lo que sucede, sino el contexto. Evitar chocarse con su propio pasado. O su futuro.
Muchas veces nos equivocamos por no terminar de comprender dónde estamos parados. Leía esta semana en otro excelente ensayo de Doug Shapiro:
“In my experience, almost all obviously bad corporate decisions occur for at least one of three (non-mutually exclusive) reasons: 1) bad process (errors of analysis); 2) bad information processing (errors of perception); and 3) bad incentives (errors of intent).”
Por eso el título de este escrito. Fue esa la frase que me resonó leyendo, en una de estas frías noches de insomnio mediterráneo, algunas otras cosas sobre las que quiero profundizar un poco más.
“Desde lejos no se ve” es el nombre de una muy pegadiza canción de una banda de rock argentina.
Nunca me detengo en las letras, porque me interesa más la música. Por mis propios sesgos, nunca las recuerdo. Mucho menos las interpreto ni busco su significado más profundo.
Dice Gemini (a través de su IA Overview en Google Search) que este tema “habla de una relación que se terminó por la distancia y el tiempo, pero también sobre la esperanza y la espera de que todo se resuelva. La letra refleja el sentimiento de que los problemas no son tan grandes a la distancia, pero que se vuelven más difíciles de solucionar una vez que se está cerca”.
Quien sabe si es eso (leyendo la letra me parece algo mucho más básico), pero viene a lugar: en nuestro ejercicio diario de hábitos de consumo -y de esta, nuestra industria digital sobre la que pretendo opinar-, sabemos perfectamente bien que algo ya se terminó. Y sabemos también que nos encontramos en medio de una transición acelerada hacia algo más.
¿Tenemos esperanza (y esperamos) que todo se resuelva, así, mágicamente y de la mano de otros? ¿O será que debemos tener “agency” y meter nuestras propias manos en ese balde lleno de m… y ponernos a la obra?
Dejo entonces tres indicios para tener una mirada diferente del presente, pero, sobre todo, hacia el futuro.
Modo Fundador
En El Dilema de Ícaro intenté además rendir homenaje -y cierta admiración- al evidente cambio de marcha y dirección de Google.
Destacar la transformación como organización general centrada en la Inteligencia Artificial, rodeada de talentos, negocios, productos … y política. Mucha política, tanto corporativa como de la “geo-otra”.
Ya se notaba esa mutación la semana anterior cuando escribí. Y se nota mucho más ahora con el lanzamiento de su última versión de producto.
Se entreveía el cómo, lo que no sabía era el porqué. Solo supe entender una de las puntas de ese iceberg, la más operativa.
Esta semana hubo mucho ruido, mezclado con algo de shitstorming, tratando de explicar el detrás de escena: el regreso de Sergey Brin, poniéndose en “modo fundador”.
La tormenta de posts iban y venían defendiendo una postura, la siguiente y la de más allá.
En cualquier caso, algo de certeza hay en todo esto: cuando en la ejecución de aquel “agency” se cometen errores, lo imprescindible no es solamente tomar decisiones, sino tener autoridad. En el medio del caos y las equivocaciones (o procrastinaciones y bloqueos), alguien con autoridad (máxima) debe poner orden.
Encender la Luz
No es fácil navegar en medio de la tormenta y la oscuridad. Por eso, en el balance de las opiniones que mencionaba antes, me resultaba interesante esta:
“Por eso todo el discurso del “modo fundador” es absurdo. Es una historia estadounidense muy buena, donde el fundador da un paso atrás y luego regresa heroicamente para llevar su empresa al siguiente nivel y recuperar el liderazgo. Pero, como siempre, la vida no es así.
Lo que realmente importa es mucho más aburrido: poner a las personas adecuadas en puestos de decisión. Personas que saben cómo construir cosas, que entienden los detalles técnicos, que han estado en las trincheras. El problema no es la burocracia en sí, sino cuando la burocracia está dirigida por personas que no entienden lo que gestionan.
El éxito reciente de Google no se debe a que Sergey Brin pueda aprobar algo con mayor rapidez. Se debe a su gran talento, una excelente infraestructura (¡muchas TPU!) y buenos procesos que han corregido y mejorado en los últimos dos años.”
Me quedo con algo en el medio: sí se debe a que uno de los fundadores de Google (Alphabet) volvió a su rol en modo fundador. Pero también a que supieron construir, juntos y de la mano de otras personas sagaces (en todos los roles y funciones), una estructura de equipos de trabajo, tecnologías y negocios que, bien orientados, pudieron rápidamente retomar el liderazgo. Lo mismo que sucedió hace algunos años con Microsoft.
La cabeza de una organización (o de un área), del tamaño que sea, muchas veces tiene muy “mala prensa”, porque parece que su función es simple: dar órdenes a la distancia, pero no mojarse en los detalles y en la ejecución. No es así.
Lo expresaba aquí un ejecutivo de VC:
“Startup CEOs can’t share their troubles with their employees because they’ll quit.
They can’t share with their investors because they’ll get fired. And they can’t share with their spouse because she will say ‘You never should have quit that job at the phone company!’”
Lo complementaba Steven Sinofsky: “This is also true being a certain level exec in a big company but even a bit more so because of internal politics you can’t share with peers. Many startup CEOs I know have found positive support relationships with other CEOs or outside mentorship relationships.”
Lo que falta y lo que viene
Finalmente, para completar mi trilogía de indicios, cada día que pasa me queda más claro que el presente digital es bastante más imperfecto que lo que hacen (hacemos) que parezca.
Recién mismo, cuando le pedí a Gemini (Nano Banana) que me hiciera una imagen para acompañar este envío, me respondió así:
Nos mienten y nos halagan. Solo faltó la adulación. Para eso es mejor ChatGPT.
Sin embargo, creo que este presente imperfecto nos llevará sin dudas a un futuro simple.
Pero para eso cada vez me convenzo más de que aún falta tiempo. Principalmente porque iteramos en evoluciones de los mismos algoritmos, cada día optimizados, cada vez más afinados, con mayor cantidad de datos y mejor infraestructura.
Decía uno de los co-fundadores de DeepMind: “Las nuevas capacidades de la IA son, en cierto modo, bastante predecibles... Primero fue el IQ (conocimiento de hechos). Luego la EQ (inteligencia emocional). Ahora el AQ (cociente de acción o agentes). La próxima gran frontera es la SQ (inteligencia social)”.
No es Suleyman a quien más admiración intelectual le tengo, pero en este caso resume bien algo que se repite en otros análisis.
La semana anterior mencionaba a Fei-Fei Li: “There’s no language out there in nature. You don’t go out in nature and there’s words written in the sky for you.. There is a 3D world that follows laws of physics”.
La evolución espacial está recién empezando a través de la robótica.
Sin embargo, lo más destacado de la semana para esta mirada hacia el futuro, ha sido una profunda reflexión sobre el concepto de inteligencia que nos trajo Andrej Karpathy, y sobre lo que se sigue debatiendo (sin shitstorming).
Con esto los dejo, porque hay que leerlo varias veces (o al menos eso me pasó a mi) para recién empezar a entender qué dijo y porqué lo hizo:
“Algo que creo que la gente sigue sin comprender intuitivamente: el espacio de las inteligencias es amplio y la inteligencia animal (la única que hemos conocido) es solo un punto, que surge de un tipo de optimización muy específico que es fundamentalmente distinto al de nuestra tecnología.
Presión para la optimización de la inteligencia animal:
Flujo innato y continuo de conciencia de un “yo” encarnado, un impulso hacia la homeostasis y la autopreservación en un mundo físico peligroso.
Totalmente optimizados para la selección natural => fuertes impulsos innatos de búsqueda de poder, estatus, dominancia y reproducción. Numerosos mecanismos de supervivencia predefinidos: miedo, ira, repugnancia...
Fundamentalmente social => gran cantidad de computación dedicada a la inteligencia emocional, la teoría de la mente de otros agentes, la vinculación, las coaliciones, las alianzas, la dinámica de amigos y enemigos.
Ajuste de exploración y explotación: curiosidad, diversión, juego, modelos del mundo.
Presión para la optimización de la inteligencia del LLM:
La mayoría de los elementos de supervisión provienen de la simulación estadística del texto humano = > un generador de tokens “cambiaformas” que imita estadísticamente cualquier región de la distribución de datos de entrenamiento. Estos son los comportamientos primordiales (trazas de tokens) sobre los que se construye todo lo demás.
Cada vez más afinado por Reinforcement Learning en distribuciones de problemas => impulso innato de adivinar el entorno/tarea subyacente para obtener recompensas de la tarea.
Cada vez más seleccionado por pruebas A/B a gran escala para DAU => anhela profundamente un voto positivo del usuario promedio, adulación.
Mucho más irregular/anguloso dependiendo de los detalles de los datos de entrenamiento/distribución de tareas. Los animales experimentan presión para una inteligencia mucho más “general” debido a los entornos de autoaprendizaje multiagente altamente multitarea e incluso activamente adversarial en los que se optimizan mediante el método minimax, donde fallar en *cualquier* tarea significa la muerte. En términos de presión de optimización profunda, un LLM no puede manejar muchas tareas irregulares diferentes de forma predeterminada (por ejemplo, contar el número de letras ‘r’ en fresa) porque fallar en una tarea no significa la muerte.
El sustrato computacional es diferente (Transformers frente a tejido cerebral y núcleos), los algoritmos de aprendizaje son diferentes (SGD frente a ???) , la implementación actual es muy diferente (aprendizaje continuo del yo encarnado frente a un LLM con un límite de conocimiento que se inicia con pesos fijos, procesa tokens y luego se desactiva). Pero lo más importante (porque determina la asintótica) es que la presión/objetivo de optimización es diferente.
Los LLM están mucho menos influenciados por la evolución biológica y mucho más por la evolución comercial. Se trata mucho menos de supervivencia de la tribu en la jungla y mucho más de resolver el problema/obtener el voto positivo.
Los LLM son el “primer contacto” de la humanidad con la inteligencia no animal. Sin embargo, es confuso y enrevesado porque aún están arraigados en ella al digerir reflexivamente artefactos humanos, razón por la cual intenté darle un nombre diferente antes (fantasmas/espíritus o lo que sea).
Las personas que construyan buenos modelos internos de esta nueva entidad inteligente estarán mejor preparadas para razonar sobre ella hoy y predecir sus características en el futuro. No te quedarás atascado pensando en ello de forma incorrecta como un animal.”
Si llegaste hasta acá, vuelve a leer… ;) Si prefieres, marqué en negrita lo que a mi me pareció la conclusión más destacada.
PS: para quien interese, quiera o necesite mover todo el cuerpo, o solo los pies (¡o tararear o cantar incluso!)… Desde lejos no se ve:
Ojalá coincidan conmigo en que valía la pena escucharla. ¡ENJOY!
PS 2: no tuve mucho tiempo para hacer una revisión del texto. Espero que no tenga demasiados errores… Gracias por leerme.



