Cinco Claudes, cinco implementaciones. ¿Cuál es la tuya?

Ejecuta cinco instancias de Claude Code sobre el mismo ticket. Obtienes cinco implementaciones funcionales. Todas pasan los tests. Todas resuelven el problema. Ninguna se parece al código que tu equipo habría escrito hace seis meses.

Ese es el nuevo punto de partida. El espacio de probabilidad de implementaciones válidas acaba de explotar, y no va a colapsar por sí solo.

La IA no volvió obsoleto el code review. Lo convirtió en el cuello de botella.

Durante diez años, la generación fue la limitación y la revisión era la limpieza. La tarde de un ingeniero senior era 30% escribir código, 70% revisar lo que otros escribían. El cuello de botella era qué tan rápido podían pensar los humanos.

Esa proporción se invirtió. La generación es prácticamente gratuita. Un desarrollador solo, con Claude Code o Cursor, puede producir en una semana más código que un equipo de cinco en un año.

El cuello de botella se movió. Ahora es: ¿cuál de estas cinco implementaciones funcionales pertenece realmente a nuestro código?

Esa pregunta no tiene una respuesta de modelo. Tiene una respuesta de equipo. El gusto acumulado del equipo es lo único que distingue entre “código que funciona” y “código que pertenece aquí”. Cómo nombras cosas. Cómo estructuras módulos. Qué te niegas a importar. Cuándo haces early exit. Cómo escribes tests.

Sin eso, cada PR es un lanzamiento de moneda entre cinco opciones razonables.

Tu gusto es el moat. Codifícalo.

Aquí es donde la mayoría de los equipos se queda atascada. El gusto existe. Vive en la cabeza de tres ingenieros. Sale en comentarios de PR, en hilos de Slack, en la mirada de desaprobación que un senior le da a un junior un martes por la tarde. Es real, y es lo que diferencia un código que acumula valor de uno que deriva hacia el caos.

Pero no está codificado en ningún lugar que una máquina pueda leer. Eso significa que los agentes no pueden seguirlo. Las personas nuevas tampoco. Ni siquiera los seniors lo aplican de forma consistente, porque están cansados, de guardia o en una reunión cuando llega el PR.

La mayoría de los equipos ya tiene un CLAUDE.md o .cursorrules. Son instrucciones de cómo los agentes deben escribir código en tu repo. Fíjate en la asimetría. Hay un contrato de escritura y no hay un contrato de revisión. CLAUDE.md le dice al agente qué producir. No hay un archivo equivalente que le diga a nadie, humano o máquina, qué es aceptable para hacer merge.

Ese archivo es STANDARDS.md. Markdown plano, en el repo, versionado junto al código. Las decisiones acumuladas del equipo, hechas explícitas. No mejores prácticas genéricas. Tus opiniones concretas sobre cómo construyes.

Nada de esto es nuevo. Kleppmann, en Designing Data-Intensive Applications, explica que los sistemas acumulan valor cuando sus contratos son explícitos y verificables por máquinas. Esquema, no intuición. STANDARDS.md es esa misma disciplina un nivel más arriba. El contrato ya no es entre servicios. Es entre el PR de un ingeniero y el gusto acumulado del equipo.

Cuando ese archivo existe, pasan tres cosas.

Los agentes generan código contra él. Tu gusto restringe el espacio de probabilidad antes de que se escriba el código.

Cada PR se revisa automáticamente contra él, sin importar si el autor fue humano o agente. Sin drift, sin excepciones, sin “lo agarramos el próximo sprint”.

Las personas nuevas leen un solo documento y absorben la visión del equipo en una tarde.

STANDARDS.md no es documentación. Es la función de colapso. Toma la explosión de implementaciones válidas y la proyecta hacia tu implementación.

Triplicamos la velocidad del equipo haciendo que la IA revise cada PR contra nuestros estándares.

Chocamos con este muro internamente hace tres meses. Construimos Surmado Code Review primero para nosotros. Herramienta interna, v7. Corre en 14 repos en cada commit.

Nuestros estándares viven en un STANDARDS.md por repo. Scout lo lee, lee el diff y le dice al revisor humano qué está bien, qué falta, dónde mirar y qué supuestos está haciendo el PR.

El 3× es tiempo hasta merge en nuestros 14 repos. Nuestros PRs no se quedan esperando. Avanzan.

Esa velocidad no vino de que el bot hiciera la revisión. Vino de que el bot eliminó el ruido para que los humanos se concentraran en lo que importaba. El ingeniero senior dejó de cazar las mismas cinco cosas en cada PR. El junior dejó de adivinar convenciones. Los PRs generados por agentes dejaron de derivar hacia formas que nadie del equipo habría escrito.

Si todavía no tienes un STANDARDS.md, Scout lo escribe contigo. Dos clics para instalar. Scout te entrevista sobre tu stack, tus convenciones, tu postura de testing y las decisiones arquitectónicas que ya tomaste.

Donde tienes opiniones, Scout las escribe. Donde todavía no, Scout propone defaults que puedes aceptar, editar o sobrescribir. Si eres un vibe coder que nunca tuvo que articular sus estándares, Scout estructura el pensamiento y saca a la luz las preguntas que no habías pensado hacerte.

Las opiniones siguen siendo tuyas. El andamiaje es el mismo que usamos internamente para nuestros STANDARDS.md. La clase de disciplina de estándares que a un equipo más grande le toma semanas consensuar, tú la tienes corriendo esta tarde.

Mi equipo de desarrollo me obligó a lanzarlo. Estaban cansados de decirle a amigos fundadores que no, que no podían tenerlo, que era interno. Así que lo convertimos en producto.

Sobre tu código

No lo almacenamos. No entrenamos con él. No leemos todo tu repositorio.

Scout corre sobre modelos de frontera de Anthropic y OpenAI. Cada revisión de PR envía solo el diff a sus APIs bajo acuerdos estándar. Sin retención. Sin entrenamiento. Nada sobre tu código persiste en nuestros sistemas después de que la revisión termina.

Lee la política de privacidad y los términos completos. Todo está documentado.

Para qué es realmente esto

El pitch que hacen la mayoría de las herramientas de IA es: el modelo reemplaza al humano. Ese encuadre está mal desde los primeros principios, y está especialmente mal ahora.

La generación con IA está haciendo a los equipos más rápidos, pero también está haciendo que las bases de código deriven más rápido. El acelerador y la entropía vienen del mismo lugar. Los equipos que avanzan son los que descubrieron cómo elevar el juicio humano para seguirle el paso a la velocidad de la máquina, no los que lo reemplazaron.

Surmado Code Review no es un revisor autónomo. Es un multiplicador del gusto de tu equipo. Tus estándares, aplicados a cada PR, cada push, cada ejecución de agente. Los humanos siguen haciendo el trabajo humano: decidir cuáles son los estándares, tomar las decisiones arquitectónicas, mentorar al equipo, conocer el negocio. El bot hace la parte que estaba agotando a tus seniors: detectar desviaciones de decisiones que ya tomaste.

El futuro de la IA en el código no es agentes reemplazando ingenieros. Es el gusto del ingeniero, codificado una vez, aplicado en todas partes, a velocidad de máquina. Los equipos que descubran esto primero van a parecer irreconocibles para los que no lo hicieron. No porque sus desarrolladores sean más inteligentes. Porque su gusto está operando en cada línea de código, incluidas las que ellos no escribieron.

Como todo lo que construimos en Surmado, esto centra al humano y potencia al agente. Tu gusto, amplificado.

Pruébalo en tu próximo PR

Surmado Code Review. Dos clics para instalar. $15/mes por 100 PRs. Sin precio por usuario. Cero retención sobre tus diffs. Hecho para desarrolladores solos y equipos pequeños que se mueven rápido. No para empresa.

Instalar Surmado Code Review o lee cómo lo construimos.

Lecturas relacionadas:

La IA no volvió obsoleto el code review. Lo convirtió en el cuello de botella.

Tu gusto es el moat. Codifícalo.

Triplicamos la velocidad del equipo haciendo que la IA revise cada PR contra nuestros estándares.

Sobre tu código

Para qué es realmente esto

Pruébalo en tu próximo PR

¿Listo para actuar?

Seguir leyendo

Cómo hicimos un bot de revisión de código con vibe coding (y dónde nos detuvimos)

Scout ya está en móvil

Surmado es el producto n.º 1 del día en PeerPush