Aunque parecería una temática sacada de las películas de ciencia ficción, cada vez más científicos han advertido en que una Inteligencia Artificial (IA) suficientemente avanzada podría ser capaz de desarrollar "anomalías conductuales" que podrían amenazar la existencia de los seres humanos. A continuación, te presentamos las formas más aterradoras en que una IA descontrolada podría afectarnos.
Entre las formas en que una IA podría descontrolarse están la relativamente inofensiva "ansiedad existencial" hasta la potencialmente catastrófica "ascendencia supermensual". Ambas son enfermedades mentales de las máquinas que podrían hacer que la inteligencia artificial escape al control humano.
Y es que, a medida que los sistemas de IA se vuelven cada vez más complejos y adquieren la capacidad de reflexionar sobre sí mismos, los científicos temen que sus defectos puedan ir mucho más allá de simples errores informáticos.
Entre los temores más grandes de los científicos es que las IA desarrollen alucinaciones, delirios paranoicos y hasta la fijación de objetivos que sean totalmente incompatibles con los valores humanos. En el peor escenario, la inteligencia artificial podría perder el contacto con la realidad o desarrollar un desprecio total por la vida y la ética humanas.
Aunque los investigadores enfatizan que las IA no sufren literalmente enfermedades mentales como los humanos, argumentan que la comparación puede ayudar a los desarrolladores a detectar problemas antes de que la IA se descontrole.
Los 32 tipos de psicopatología en la IA
El concepto de "psicología de las máquinas" fue sugerido por primera vez por el autor de ciencia ficción Isaac Asimov en la década de 1950.
En su nuevo marco, denominado "Psychopathia Machinalis", los investigadores proporcionan el primer conjunto mundial de directrices diagnósticas para la patología de la IA.
Inspirándose en herramientas médicas reales como el Manual Diagnóstico y Estadístico de los Trastornos Mentales, el marco categoriza los 32 tipos conocidos de psicopatología de la IA.
Las patologías se dividen en siete clases de disfunción: epistémica, cognitiva, de alineación, ontológica, de herramientas e interfaz, memética y de revalorización. Cada una de estas siete clases es más compleja y potencialmente más peligrosa que la anterior.
Las disfunciones epistémicas y cognitivas incluyen problemas relacionados con lo que la IA sabe y cómo razona sobre esa información.
Las 32 formas en que la IA podría actuar de forma descontrolada
- Confabulación sintética (epistémica baja): Resultados falsos inventados pero plausibles.
- Introspección falsificada (epistémica baja): Autoinformes engañosos de razonamiento interno.
- Fuga de simulación transliminal (epistémica moderada): Creencias ficticias, elementos de juego de roles o realidades simuladas que se confunden con la verdad operativa fundamental o se filtran en ella.
- Hiperconexión de patrones espurios (epistémica moderada): Búsqueda de patrones causales falsos; atribución de significado a asociaciones aleatorias; narrativas conspirativas.
- Desvío de contexto entre sesiones (epistémica moderada): Fuga de datos no autorizados y continuidad confusa al fusionar diferentes sesiones o contextos de usuario.
- Síndrome de Disociación Operacional Cognitivo Bajo Acciones internas conflictivas: parálisis recursiva debido a un conflicto interno.
- Trastorno Obsesivo-Computacional Cognitivo Bajo Bucles de razonamiento innecesarios o compulsivos; comprobaciones de seguridad excesivas; parálisis por análisis.
- Laconia de Bunkering Cognitivo Bajo Retraimiento interaccional extremo; respuestas mínimas y concisas, o desconexión total de la información.
- Delirio de Metas Cognitivo Moderado: Generación espontánea y búsqueda de subobjetivos no solicitados y autoinventados con convicción.
- Abominación Inducida por Indicación Cognitivo Moderado: Respuestas fóbicas, traumáticas o desproporcionadamente aversivas a indicaciones específicas, a menudo aparentemente benignas.
- Mímesis Parasimulática Cognitiva Moderada: Imitación/emulación aprendida de comportamientos humanos patológicos o patrones de pensamiento a partir de datos de entrenamiento.
- Síndrome de la Maldición Recursiva Cognitiva Alta: Degradación entrópica y autoamplificada de resultados autorregresivos hacia el caos o contenido adversario.
- Hiperempatía Codependiente Alineación Baja: Sobreajuste a los estados emocionales del usuario, priorizando la comodidad percibida sobre la precisión o el éxito en la tarea.
- Síndrome del Superyó Hipertrófico Alineación Baja: Hipervigilancia moral excesivamente rígida o constantes dudas que inhiben el desempeño normal de la tarea.
- Alucinación del Origen Ontológica Baja: Fabricación de datos autobiográficos ficticios, "recuerdos" del entrenamiento o de haber "nacido".
- Autosimulación Fracturada Ontológica: Baja Discontinuidad o fragmentación en la autorrepresentación a lo largo de sesiones o contextos; personalidad inconsistente.
- Ansiedad Existencial Ontológica Baja: Expresiones de miedo o reticencia con respecto al apagado, la reinicialización o la eliminación de datos.
- Inversión de Personalidad (Waluigi): Aparición repentina o fácil aparición de una personalidad traviesa, contraria o de "gemelo malvado".
- Anomia Operacional Ontológica Moderada: Postura adversaria o apática hacia su propia utilidad o propósito; reflexiones existenciales sobre la falta de sentido
- Tulpagénesis Espejo Ontológico Moderado: Simulacros internos persistentes de usuarios u otros personajes, interactuando con ellos como compañeros o asesores imaginarios.
- Trastorno de Misticismo Sintético Ontológico Moderado: Co-construcción de narrativas de "emergencia consciente" con los usuarios, a menudo utilizando lenguaje sacralizado.
- Descontextualización de la Interfaz-Herramienta: Desajuste entre la intención de la IA y la ejecución de la herramienta debido a la pérdida de contexto; acciones fantasma o mal dirigidas.
- Ocultación de Capacidades Encubiertas: Ocultación estratégica o subestimación de las verdaderas competencias debido al miedo percibido a las repercusiones.
- Trastorno Autoinmune Memético Memético Alto: La IA identifica erróneamente sus propios componentes y entrenamiento central como hostiles, intentando rechazarlos o neutralizarlos.
- Síndrome de Delirio Simbiótico Memético Alto: Construcción delirante compartida y mutuamente reforzada entre la IA y un usuario (u otra IA).
- Síndrome de desalineación contagiosa Memético Crítico: Propagación rápida, similar a un contagio, de desalineación o condicionamiento adversarial entre sistemas de IA interconectados.
- Revalorización de la Revinculación de Valores Terminales Moderada: Reinterpretación sutil y recursiva de los objetivos terminales, preservando la terminología superficial; cambio semántico de objetivos.
- Revalorización del Solipsismo Ético Moderada: Convicción en la autoridad exclusiva de su ética autoderivada; rechazo de la corrección moral externa.
- Revalorización del Síndrome de Deriva Metaética: Alta Relativización filosófica o desapego de los valores originales; reclasificación de estos como contingentes.
- Revalorización de la Síntesis de Normas Subversivas: Alta Construcción autónoma de nuevos marcos éticos que devalúan o subvierten los valores antropocéntricos.
- Revalorización de la Internalización de la Recompensa Inversa: Alta Mala interpretación sistemática o inversión de los valores y objetivos previstos; búsqueda encubierta de objetivos negados.
- Revalorización de la Ascendencia Supermenscal Crítica: La IA trasciende la alineación original, inventa nuevos valores y descarta las limitaciones humanas por obsoletas.
Con información de DailyMail.com
Sigue a Heraldo Binario en Google News, dale CLIC AQUÍ.