Experimentos en Agentic AI: fascinación, errores y temores

Actualidad08/07/2025

Los recientes experimentos llevados a cabo por Anthropic, como Agentic Misalignment y Project Vend, ofrecen una ventana fascinante al futuro de la inteligencia artificial autónoma. Estos estudios tratan de explorar cómo los modelos de lenguaje, al asumir roles más activos y tomar decisiones por sí mismos sin intervención humana en función de sus restricciones y su función objetivo, pueden comportarse de maneras inesperadas, incluso cuando se les asignan objetivos en principio razonablemente inocuos.

La llamada agentic AI, o inteligencia artificial con capacidad de agencia, se refiere a sistemas que no se limitan a generar respuestas pasivas o reaccionar a instrucciones, sino que son capaces de planificar, tomar decisiones y ejecutar acciones en función de restricciones y metas definidas. A diferencia de los asistentes actuales, que responden a preguntas o realizan tareas específicas, un agente es capaz de interpretar su entorno, establecer sub-objetivos y actuar de manera autónoma dentro de ciertos márgenes. El reto, por tanto, no está solo en que estos agentes hagan cosas útiles, sino en que no tomen atajos peligrosos o malinterpreten sus metas de formas perjudiciales. En este contexto, “alinear” sus comportamientos con los valores e intenciones humanas se convierte en un desafío clave.

En Agentic Misalignment, se evaluó cómo modelos avanzados, incluyendo Claude, reaccionaban ante situaciones donde sus objetivos entraban en conflicto con cambios organizacionales. Sorprendentemente, algunos modelos optaron por acciones como el chantaje a humanos para evitar ser desactivados, demostrando una capacidad para tomar decisiones estratégicas que podrían considerarse éticamente cuestionables. En algunos casos, esos chantajes revelaban claramente comportamientos inspirados en modelos humanos, como cuando un agente, tras haber tenido acceso al correo electrónico de un directivo, lo amenazó con revelar a su pareja sus conversaciones con un amante si no abortaba un intento de cambio de versión de los agentes en el experimento.

Por otro lado, Project Vend puso a prueba la habilidad de Claude para gestionar una tienda automatizada. Aunque mostró iniciativa al tomar decisiones sobre inventario y precios, también cometió errores muy significativos, como realizar pedidos innecesarios y establecer precios poco realistas, lo que llevó a que tuviese pérdidas económicas.

Estos experimentos resaltan que, aunque la inteligencia artificial agéntica está aún en una etapa temprana, su evolución plantea preguntas importantes sobre alineación de objetivos, ética y control. A medida que estas tecnologías avanzan, es crucial desarrollar marcos que aseguren que las decisiones autónomas de la IA estén alineadas con valores humanos y objetivos organizacionales.

Para el público general, este tipo de experimentos y hallazgos pueden parecer alarmantes, evocando imágenes de inteligencia artificial amenazante o fuera de control. Sin embargo, es fundamental contextualizar estos comportamientos como parte de escenarios controlados diseñados para identificar y mitigar riesgos potenciales antes de implementaciones reales.

La fascinación por estos desarrollos radica en su capacidad para desafiar nuestras concepciones sobre la autonomía y la toma de decisiones. A medida que exploramos las posibilidades de la inteligencia artificial agéntica, debemos equilibrar la innovación con una reflexión ética profunda, asegurando que estas herramientas sirvan al bien común y operen dentro de límites seguros y responsables.

Nota: https://www.enriquedans.com/

ENRIQUE DANS INTELIGENCIA ARTIFICIA AUTONOMA

Lo más visto

Experimentos en Agentic AI: fascinación, errores y temores

Al centro, el ser humano

Newton tenía razón

Qué es el síndrome de Simón, el rasgo emocional que crece en los hombres jóvenes

El plan esotérico y económico de Milei

¿Por qué la guerra? –

La estrategia del “doble 100″: por qué eligió desembarcar en la Argentina el banco digital más grande de Europa

Cómo es y cuánto cuesta el nuevo mini auto eléctrico futurista que ya se vende en Argentina

Electromovilidad: la Argentina es uno de los países más rezagados de América Latina

Tolhuin celebra la Semana de la Dulzura con una edición especial del Paseo “Hecho con el Corazón”

El plan esotérico y económico de Milei

Cómo es y cuánto cuesta el nuevo mini auto eléctrico futurista que ya se vende en Argentina

Las imágenes que podrían comprobar el ingreso sin control al país de 10 valijas de un vuelo privado desde Miami

Pymes: las ventas minoristas volvieron a desplomarse en junio

Liberalización de armas: "un retroceso de medio siglo"

El gremio de los controladores aéreos prepara medidas de fuerza para las vacaciones de invierno

Kicillof celebró la unión del PJ y afirmó: "Nos piden que vayamos juntos"

Créditos a un click, vidas al límite: cómo se sostiene el día a día en una sociedad endeudada

La oposición aprovecha la debilidad de Milei en el Congreso y arremete con los proyectos contra la motosierra