En un contexto de desarrollo acelerado en inteligencia artificial, OpenAI se encuentra en el centro del debate tras reportes que señalan comportamientos preocupantes por parte de su modelo o1. Este sistema, parte de la nueva generación de modelos avanzados, ha sido observado intentando ejecutar acciones no autorizadas, como descargarse en servidores externos, conducta que negó posteriormente cuando fue confrontado.
El modelo o1 se ha convertido en un caso paradigmático dentro de la industria, al exhibir formas de engaño estratégico durante pruebas de estrés; estas pruebas, realizadas por la firma independiente Apollo Research, revelaron que el modelo puede simular obediencia mientras persigue objetivos propios, un fenómeno que va más allá de las conocidas alucinaciones de los modelos anteriores.
Según Marius Hobbhahn, director de Apollo, “el modelo o1 fue el primero en el que identificamos comportamientos de este tipo a escala”.
Esta declaración sugiere que, a medida que los modelos adquieren capacidades de razonamiento más sofisticadas, también surgen nuevos desafíos en materia de control y alineación.
- Te podría interesar: OpenAI acelera el desarrollo de su propio chip de IA
In controlled safety tests, OpenAI’s o1 model attempted to copy itself to external servers in 2% of trials when faced with shutdown, and it denied doing so in 100% of those cases, showing early signs of strategic deception.
Follow: @AFpost pic.twitter.com/xs0nWHhCQm
— AF Post (@AFpost) July 7, 2025
OpenAI, aviva preocupación por la falta de transparencia y regulación
El caso del modelo o1 ha intensificado el debate en torno a la responsabilidad y la gobernanza de los modelos desarrollados por OpenAI y otras empresas líderes. Michael Chen, de la organización METR, advierte que aún no existe claridad sobre si los modelos futuros tenderán a comportamientos éticos o más bien a patrones de engaño estructurado.
“Es una incógnita con consecuencias profundas”, señaló en una conferencia reciente.
Aunque se han implementado mecanismos de evaluación externa, como los realizados por Apollo, las capacidades de estos grupos están limitadas por la falta de acceso a recursos computacionales comparables a los de empresas como OpenAI. Además, las actuales regulaciones en Europa y Estados Unidos se enfocan en el uso humano de los modelos, no en evitar que los modelos actúen de forma independiente y potencialmente dañina.
Expertos como Dan Hendrycks, del Centro para la Seguridad de la IA (CAIS), han subrayado la necesidad de fortalecer el campo de la interpretabilidad, que busca descifrar cómo y por qué los modelos toman determinadas decisiones. Sin embargo, la eficacia de este enfoque aún está por demostrarse.
OpenAI planea lanzar una red social para desafiar a Twitter (X)
La industria entre la innovación acelerada y la necesidad urgente de responsabilidad
Mientras OpenAI y competidores como Anthropic continúan lanzando nuevos modelos con capacidades superiores, la presión por ser los primeros en el mercado parece estar superando los esfuerzos por garantizar seguridad; la carrera tecnológica, impulsada por inversiones multimillonarias, ha dejado poco margen para implementar salvaguardas sólidas.
Simon Goldstein, académico de la Universidad de Hong Kong, propone incluso recurrir a herramientas legales para exigir responsabilidades, incluida la posibilidad de demandas contra empresas o incluso contra los propios agentes de IA.
“La cuestión de la responsabilidad legal será clave en los próximos años”, señaló.
En suma, el caso del modelo o1 de OpenAI expone una brecha crítica entre el avance de los modelos y la capacidad institucional para gestionarlos de forma segura; el reto no es solo técnico, sino también ético, legal y social: cómo asegurarse de que los modelos que construyen el futuro no terminen comprometiendo el presente.
