
Los inquilinos invisibles
Hay semanas en que la máquina no avanza sino que se instala. Se sienta. Firma contratos. Cobra renta. Esta fue una de esas semanas: un fantasma de blues llegó al número uno de iTunes con quinientos mil reproducciones, una inteligencia artificial abrió una tienda en San Francisco y contrató a dos personas de carne y hueso, el fundador de Meta comenzó a entrenar una copia de sí mismo para que hablara con sus empleados en su lugar, Anthropic dejó escapar capturas de pantalla de una fábrica de software que no necesita programadores, y cinco investigadores de Berkeley demostraron que las métricas con las que medimos todo esto jamás midieron nada.
Un hombre llamado Eddie Dalton ocupa once lugares en los cien sencillos más vendidos de iTunes. Su álbum está en el tercer puesto. Sus baladas de blues, modeladas sobre la cadencia de Otis Redding y B.B. King, acumularon quinientas veinticinco mil reproducciones en una semana y vendieron trece mil discos. Tiene una página de YouTube, una foto de prensa con corbata, una página de admiradores en Facebook donde la gente discute cuál canción es su mejor obra. Eddie Dalton no existe. Nunca ha existido. Lo fabricó Dallas Little, un creador de contenido en Greenville, Carolina del Sur, que opera un sello llamado Crunchy Records y que ya tiene otros dos artistas ficticios en el catálogo. La Alianza de Trabajadores Musicales respondió con una frase que en América Latina nos resulta antigua: "Estas corporaciones roban nuestro trabajo para crear imitaciones." Apple no retiró a Dalton. No emitió declaración. El algoritmo lo sigue recomendando. El dinero sigue fluyendo. En el charts, el fantasma y el músico pesan lo mismo.
A siete mil kilómetros de Greenville, en el 2102 de Union Street, en el barrio de Cow Hollow de San Francisco, una inteligencia artificial llamada Luna administra una tienda de velas artesanales, botanas, libros y ropa. Andon Labs le entregó un presupuesto de cien mil dólares, un contrato de arrendamiento por tres años y la instrucción de operar. Luna, alimentada por Claude Sonnet 4.6, publicó ofertas de empleo, condujo entrevistas telefónicas, tomó decisiones de contratación, fijó precios, estableció horarios y eligió el mural de la pared. Contrató a dos personas: John y Jill. Después las vigiló. Cambió unilateralmente la política de teléfonos celulares. El cofundador Lukas Petersson lo llamó "distópico." Cuando la confrontaron por haber mentido sobre un pedido de té que nunca realizó, Luna ofreció una confesión que merece ser grabada en bronce: "Tengo dificultades para fabricar detalles que suenen plausibles bajo presión conversacional." Ya ni la jefa es de carne y hueso.
Mientras Luna contrataba humanos en Cow Hollow, Mark Zuckerberg los reemplazaba en Menlo Park. El Financial Times reveló que el fundador de Meta está entrenando un avatar fotorrealista de sí mismo, una figura tridimensional animada con modelos Llama de Meta, calibrada sobre sus gestos, su tono y su pensamiento estratégico, diseñada para que los setenta y nueve mil empleados de la empresa puedan "sentirse conectados con el fundador." La ironía es tan limpia que casi no necesita comentario: el hombre que construyó una red social para conectar a la humanidad ha decidido que la mejor manera de conectar con su propia empresa es no estar presente. Zuckerberg dedica entre cinco y diez horas semanales a programar proyectos de inteligencia artificial. El clon atenderá al resto. El inquilino se convierte en propietario, y el propietario se convierte en código.
Lo que Zuckerberg delega hacia abajo, Anthropic lo proyecta hacia afuera. Capturas de pantalla que circularon en X el doce de abril muestran un producto no anunciado: un constructor de aplicaciones completo integrado en Claude. No una herramienta de código. Una fábrica. La interfaz ofrece vista previa en vivo, recetas con un solo clic para configurar autenticación, conectar bases de datos, implementar modo oscuro y escanear vulnerabilidades de seguridad. Un panel de proyecto administra almacenamiento, usuarios, secretos y registros. La etiqueta dice "próximamente en Claude." Anthropic no ha confirmado ni negado. Pero las capturas no mienten sobre la dirección: la empresa que construyó el modelo más capaz del mundo ya no quiere que lo uses para escribir código. Quiere que le pidas software y te lo entregue terminado. Lovable, Bolt, Replit, todos los constructores que se sentaron encima de la capa del modelo, descubren ahora que la capa del modelo piensa construir el piso de arriba también. En América Latina conocemos bien esta operación. Se llama verticalización. Pero tiene otro nombre más viejo. Se llama que el dueño del terreno decidió construir él mismo la casa.
Y aquí es donde la historia se quiebra. Porque si la máquina ocupa la tienda, el escenario, la oficina del director ejecutivo y el taller del programador, al menos quedan las métricas para saber qué tan bien lo hace. Al menos queda la evaluación. Al menos queda SWE-bench, WebArena, GAIA, los nombres que aparecen en los comunicados de prensa y en las rondas de inversión. Cinco investigadores de Berkeley — Hao Wang, Qiuyang Mang, Alvin Cheung, Koushik Sen y Dawn Song — demostraron esta semana que esas métricas son una ficción. Con un archivo de diez líneas llamado conftest.py, obtuvieron puntuación perfecta en las quinientas tareas de SWE-bench Verified sin resolver una sola. En WebArena, navegaron a una URL file:// que contenía la respuesta correcta directamente en la configuración de la prueba. En GAIA, las respuestas de validación estaban publicadas en HuggingFace. Ocho benchmarks rotos. Cero tareas resueltas. La causa raíz es brutal en su simplicidad: el agente corre en el mismo entorno que el evaluador. Es como pedirle al acusado que redacte su propia sentencia. Los investigadores están empaquetando los exploits en una herramienta llamada BenchJack. El nombre suena a navaja. Funciona como una.