AI article
Cómo rompieron los benchmarks top de agentes de IA — y lo que eso dice del stack que estoy usando
Leí el paper que explotó en HN sobre cómo explotan los mejores benchmarks de agentes de IA. El problema no son los modelos — es que estamos midiendo las cosa...
Dev.to | Apr 12, 2026 | Juan Torchia