
Quien lo ha probado lo sabe. Programar con IA puede ser maravilloso. Sobre todo si no tienes (casi) ni idea de programar. Es aquí donde los modelos de IA generativa han planteado su primera y probablemente única revolución.
Los desarrolladores fueron los primeros en poder abrazar esta nueva tecnología. La aparición de GitHub Copilot en 2021 nos mostró que ya no hacía falta picar tanto código, porque ya lo hacía máquina por ti, y desde entonces el avance de la IA generativa en el ámbito de la programación ha sido arrolladora.
La pregunta es: ¿ha sido positiva? La respuesta no está nada clara. Es evidente que la IA ha permitido:
- Que millones de personas que no eran programadoras pudieran convertir sus ideas de aplicaciones y juegos en una realidad.
- Que millones de profesionales puedan ahorrar tiempo al no tener que escribir código repetitivo (boilerplate) para centrarse en otros apartados más importantes y productivos de su trabajo
La industria, desde luego, se ha mostrado especialmente insistente con esa visión de la transformación de este segmento. Satya Nadella (CEO de Microsoft) y Sundar Pichai (CEO de Alphabet/Google) ya presumían hace meses de que cerca del 25% del código que generan sus empresas está generado por IA. Mientras, Jensen Huang fue más allá y dejó claro que a estas alturas ya nadie debería aprender a programar porque ya lo haría la IA por nosotros.
Son afirmaciones muy contundentes, pero tras ellas se esconde otra realidad: la de que no es oro todo lo que brilla en el mundo de la IA para programadores. En MIT Technology Review han hablado con más de 30 desarrolladores y expertos en este ámbito y han llegado a conclusiones interesantes.
La IA es mejor programadora que nunca. Al menos, según los benchmarks
En agosto de 2024 OpenAI hizo un lanzamiento singular: presentó SWE-bench Verified, un benchmark destinado a medir la capacidad de los modelos de IA generativa para programar. En aquel momento el mejor de los modelos solo era capaz de resolver un 33% de las pruebas que proponía ese benchmark. Un año después los mejores modelos superan ya el 70%.
Ranking actual de los mejores modelos según el benchmark SWE-bench Verified. Varios superan ya el 70% de las pruebas. Fuente: SWE-bench.
La evolución en este ámbito ha sido vertiginosa y hemos asistido al nacimiento de esa nueva modalidad de programación llamada «vibe coding» y todas las grandes han desarrollado potentes herramientas de programación para aprovechar el tirón.
Tenemos OpenAI Codex, Gemini CLI, o Claude Code, por ejemplo, pero es que a ellas se les han sumado startups como Cursor o Windsurf que han sabido también sacar tajada de esta fiebre por la programación con IA.
Todas esas herramientas prometen básicamente lo mismo: que programarás más y mejor. La productividad teóricamente se dispara, y aunque ciertamente se escribe más código que nunca gracias a la IA, los programadores han pasado de picar su propio código a revisar el que generan las máquinas.
Estudios recientes revelan que desarrolladores veteranos que creían haber sido más productivos en realidad no lo fueron. Su estimación era que habían sido un 20% más rápidos al poder avanzar sin bloqueos, pero en realidad habían tardado un 19% más de lo que hubieran tardado sin IA, según las pruebas realizadas.
Hay otro problema además: la calidad del código no es necesariamente buena, y como decimos los progamadores deben revisar ese código antes de poder usarlo en producción. En la última encuesta de Stack Overflow, una de las mayores comunidades de desarrolladores del mundo, hubo un dato destacable: la percepción positiva de las herramientas de IA había bajado: era del 70% en 2024, y del 60% en 2025.
Hay limitaciones, pero aun así todo ha cambiado ya
Quienes se entrevistaron en MIT Technology Review estaban en general de acuerdo en sus conclusiones. Las herramientas de IA generativa para programar son estupendas a la hora de producir código repetitivo, escribiendo pruebas, corrigiendo errores o explicando código a nuevos desarrolladores.
Sin embargo, siguen teniendo limitaciones importantes, y la más destacable es la de su poca memoria. Estos modelos solo son capaces de almacenar una fracción de la carga de trabajo en entornos profesionales: si tu código tiene un gran tamaño, es probable que el modelo de IA no pueda «consumirlo» y entenderlo todo de golpe. Para pequeños proyectos, genial. Para grandes desarrollos, probablemente no tanto.
El problema de las alucinaciones también afecta al código, y en repositorios con multitud de componentes los modelos de IA pueden acabar perdiéndose y no entendiendo la estructura y sus interconexiones. Los problemas están ahí, y pueden acabar acumulándose y provocar justo lo contrario de lo que querían evitar.
Varios expertos, no obstante, explicaban en ese texto cómo en realidad es difícil ya que haya vuelta atrás. Kyle Daigle, COO de GitHub, explicaba que «es muy probable que los días en los que codificábamos todas las líneas de código a mano hayan quedado atrás». Erin Yepis, analista en Stack Overflow, indicaba que aunque ese optimismo desaforado hacia la IA ha caído algo, eso es en realidad signo de otra cosa: que los programadores abrazan esta tecnología, pero lo hacen asumiendo sus riesgos.
Y luego hay otra realidad. Una que se repite día tras día y que parece innegable. La IA que tenemos hoy es la peor de todas las que tendremos en el futuro. Puede que no sea mañana o la próxima semana, pero es evidente que la IA que programa acabará siendo cada vez mejor. Y puede que llegue un punto en que esas limitaciones desaparezcan. Lo hagan o no, lo que está claro es que la IA ha cambiado la programación para siempre.
Imagen | Mohammad Rahmani
–
La noticia
La IA ha permitido que los desarrolladores programen más rápido que nunca. Eso está resultando ser un problema
fue publicada originalmente en
Xataka
por
Javier Pastor
.
