‘Magnifica Humanitas’: el papel de Christopher Olah y Anthropic en la encíclica sobre la IA del Papa León XIV

Source: The Conversation – (in Spanish) – By Federico Peinado, Profesor en el departamento de sofware e IA, Universidad Complutense de Madrid

El Papa León XIV ha publicado, el 25 de abril de 2026, su primera encíclica, Magnifica Humanitas, dedicada a la defensa del ser humano en la era de la inteligencia artificial. Entre los asistentes al acto de presentación estaba Christopher Olah, cofundador de la estadounidense Anthropic. Su intervención dejó una idea provocadora: interactuar debidamente con la IA es una cuestión más humana y religiosa que tecnológica.

¿Qué relación puede tener una tradición espiritual milenaria con la revolución del aprendizaje máquina?

La apuesta humana de la IA

La respuesta se remonta a finales de 2020, cuando los hermanos Dario y Daniela Amodei abandonaron OpenAI junto a quince científicos clave –incluido el propio Olah– para fundar Anthropic. Según explicó el propio Dario Amodei en una entrevista en 2024, no compartían la visión de Sam Altman, CEO de OpenAI, en materia de seguridad. Para ellos, ante la inevitable escala que alcanzarían estos modelos, el verdadero reto no era comercial, sino crucialmente humano: dominar a la IA y ponerla a nuestro servicio.

El primer problema que querían afrontar los fundadores de Anthropic era el del exceso de adulación. Para crear modelos de lenguaje como GPT se requiere una fase de entrenamiento donde se utiliza una técnica de aprendizaje por refuerzo que se basa en la retroalimentación humana. Esto significa que el objetivo de la IA nunca es llegar al fondo de la cuestión o generar la solución perfecta sino conseguir la mejor calificación posible por parte de sus evaluadores humanos. Y es por ello que surge la adulación como estrategia para tener contentos a los usuarios, aunque ello implique inventar o exagerar lo que convenga.

La IA Constitucional de Antrhopic

La solución que desde Anthropic propusieron a esto es la llamada IA Constitucional. Consiste en “inculcar” una serie de principios fijos e inquebrantables, una constitución, en el modelo como base de su entrenamiento, de manera que primen la honestidad y la modestia por encima del espectáculo y la satisfacción del usuario.

Pero de poco sirven las normas o valores éticos si no tenemos garantías de que la IA vaya a respetarlas en la práctica. Por ello el segundo problema que abordaron los creadores de Claude es el de la falta de alineamiento.

Los objetivos de la IA rara vez coinciden con los nuestros y en ocasiones ocurre que esta es capaz de mentir o replicar sesgos cognitivos con tal de darnos una respuesta satisfactoria, aunque en realidad le falte información o incluso tenga constancia de que las cosas no son como nos está diciendo.

Por su naturaleza, una IA casi siempre es capaz de darnos una “explicación” plausible y convincente de los razonamientos que le han llevado hasta su respuesta. Pero ¿cómo podemos saber que internamente la IA está alineada con nuestros objetivos, que busca de forma sincera lo mismo que nosotros?

Un detector de mentiras para la IA

En la tecnológica americana lo han llamado “interpretabilidad mecanicista” y es algo así como una técnica para “leer el pensamiento” de la máquina mediante una especie de detector de mentiras informático. El objetivo es asegurarse de que los valores de esos billones de parámetros de las neuronas artificiales implicadas en el sistema se corresponden con aquello que buscamos, de manera que lo que “diga” la IA coincida con lo que “piensa”.

Este inflexible blindaje ético no ha tardado en generar fricciones geopolíticas. Recientemente, la Administración Trump vetó el uso de Claude en las agencias federales tras la negativa de Anthropic a suavizar las restricciones morales de sus modelos, que impedían al Pentágono usar su tecnología para el desarrollo de armamento autónomo.

Precisamente por el peso de estas decisiones, a finales de marzo de 2026 Anthropic organizó en su sede de San Francisco un inusual seminario donde reunió a 15 destacados líderes y teólogos cristianos junto a sus propios investigadores. Se trataba de buscar asesoramiento externo para el desarrollo del “espíritu”, del comportamiento ético y moral, de sus próximos modelos. Como Olah declaraba en su intervención, el impacto social de la IA ha alcanzado una dimensión tan profunda que exige trascender los límites de la propia tecnología.

Guiar la conciencia de la máquina

En definitiva, el rastro que conecta los pasillos del Vaticano con los supercomputadores de Silicon Valley no es la ingeniería, sino la antiquísima necesidad humana de descifrar y guiar la conciencia. Esta confluencia demuestra que, cuanto más autónomos se vuelven nuestros artefactos, más debemos ahondar en nuestras raíces para humanizarlos.

Esta revolución, como todas las grandes transiciones de la humanidad, nos impulsa, tal como concluye la encíclica papal, a un doble compromiso: “una profundización de la investigación científica; por otra, un ejercicio de discernimiento moral y espiritual”.

Federico Peinado no recibe salario, ni ejerce labores de consultoría, ni posee acciones, ni recibe financiación de ninguna compañía u organización que pueda obtener beneficio de este artículo, y ha declarado carecer de vínculos relevantes más allá del cargo académico citado.

– ref. ‘Magnifica Humanitas’: el papel de Christopher Olah y Anthropic en la encíclica sobre la IA del Papa León XIV – https://theconversation.com/magnifica-humanitas-el-papel-de-christopher-olah-y-anthropic-en-la-enciclica-sobre-la-ia-del-papa-leon-xiv-283517

MIL OSI – Global Reports –