La historia de la inteligencia artificial (IA) suele contarse como la marcha inevitable hacia una forma de conocimiento superior. Sin embargo, hay voces que piden matizar ese optimismo.
Una de ellas es la del investigador Deepak Varuvel Dennison, quien en un ensayo publicado recientemente en la revista Aeon narra una anécdota de su familia: ante un diagnóstico médico muy grave, su padre en India rechazó el tratamiento clínico recomendado y optó por una mezcla de aceites y hierbas tradicionales. Para sorpresa de todos, mejoró.
El autor no pretende convertir ese episodio en evidencia científica, pero sí lo utiliza para plantear una pregunta crucial: ¿qué sucede con los saberes que nunca han sido documentados, digitalizados o traducidos, cuando el mundo depende cada vez más de sistemas de IA entrenados exclusivamente con aquello que está disponible en línea?
Esa pregunta abre un debate que va más allá de la curiosidad antropológica. Si la IA está destinada a convertirse en el principal filtro de acceso a la información —como buscador, asistente, tutor académico o herramienta de diagnóstico— entonces hay que preguntarse con seriedad: ¿Qué porción del conocimiento humano está realmente representada en ese sistema?, y sobre todo, ¿cuál está quedando fuera?
El mito del conocimiento total
Una de las creencias más extendidas sobre la IA es que su inteligencia deriva de haber leído “todo Internet”. Incluso muchos de sus promotores usan esa frase como señal de poderío: si una máquina ha sido entrenada con millones de libros, artículos y conversaciones, ¿cómo podría equivocarse?
El problema, recuerda Dennison, es que Internet no es “todo” el conocimiento humano; es solo el que ha sido publicado, traducido, indexado y replicado en formatos compatibles con las grandes bases de datos. Dicho de otro modo: la IA no es un espejo completo de la sabiduría humana, sino un espejo digital de lo que el mundo en línea ha puesto a disposición.
Y ese espejo tiene enormes vacíos. Según estudios sobre los corpus más utilizados para entrenar modelos de lenguaje —como Common Crawl, que recopila cientos de miles de millones de páginas web— más del 40 por ciento del contenido está en inglés. Lenguas habladas por cientos de millones de personas como el hindi, el swahili o el tagalo representan menos del uno por ciento. Otras ni siquiera aparecen.
Y no se trata solo de palabras: detrás de cada idioma hay formas de nombrar plantas, describir lluvias, curar enfermedades, construir casas, repartir el agua o resolver conflictos. Si la IA no tiene acceso a esos idiomas, tampoco tiene acceso a esos conocimientos.
Lo que no está escrito, no existe para la máquina
La mayor parte de los saberes tradicionales —agricultura, medicina, construcción, crianza de hijos, organización comunitaria— se ha transmitido históricamente de forma oral o mediante práctica directa. No fue necesario dejarlo por escrito porque se reproducía mediante convivencia y observación.
En muchos contextos rurales todavía ocurre así: el conocimiento no se consulta, se vive. Pero el ecosistema de la IA exige lo contrario. Para que algo sea “aprendible” por una máquina, tiene que existir en datos estructurados. Y para que exista en datos estructurados, primero debe ser estandarizado, traducido y digitalizado.
Esto crea una paradoja de escala civilizatoria: los saberes más antiguos del mundo, aquellos que han permitido a millones de personas sobrevivir durante siglos en entornos complejos, quedan fuera de los sistemas que se están convirtiendo en el nuevo oráculo global.
El riesgo no es que la máquina desconozca ciertos remedios o cierto tipo de arquitectura; el riesgo es que generaciones futuras, al depender de esa máquina, también los desconozcan.
El peligro de la sustitución silenciosa de la IA
Podría pensarse que no pasa nada grave si la IA ignora algunos conocimientos locales; después de todo, la ciencia moderna ha superado muchas creencias erróneas del pasado. Pero el problema no es elegir entre tradición y evidencia, sino entre diversidad y homogeneidad.
Cuando los buscadores de Internet sugerían enlaces, el usuario aún tenía la libertad de comparar fuentes. Pero cuando un chatbot entrega una respuesta única, muchas veces presentada como definitiva, el margen para la duda y el contraste se reduce.
El propio Dennison lo explica: si una IA integrada a un sistema educativo ofrece explicaciones estandarizadas, pero no tiene acceso al conocimiento ancestral sobre el manejo del agua de una comunidad, ese conocimiento no solo queda fuera; se vuelve invisible, irrelevante, sospechoso. No desaparece por refutación, sino por omisión.
Conocimiento y poder: quién decide qué es válido
Detrás de este fenómeno hay una dimensión política. Todo sistema de IA tiene filtros éticos, protocolos de seguridad y mecanismos de control para evitar respuestas imprecisas o perjudiciales. Sin embargo, esos filtros privilegian fuentes institucionales, públicas y verificables.
Esto es razonable desde la perspectiva de la responsabilidad legal, pero introduce un sesgo estructural: aquello que no ha pasado por revistas científicas o procesos de revisión formal queda automáticamente excluido, aunque haya funcionado durante décadas en contextos locales.
Algunos ingenieros podrían responder que la solución consiste en integrar más datos diversos. Pero digitalizar conocimiento oral no es un asunto meramente técnico. Implica traducir gestos, símbolos, creencias y experiencias que muchas veces no tienen equivalentes en el lenguaje académico.
Además, ¿quién decide qué conocimientos merecen ser almacenados y cuáles no? ¿Cómo se garantiza que el proceso no termine convirtiendo saberes colectivos, en propiedad de grandes empresas tecnológicas?
El riesgo de una inteligencia parcial con autoridad total
La IA —especialmente en su formato generativo— tiene la capacidad de responder con tono firme incluso cuando no sabe lo suficiente. El usuario promedio no distingue entre un dato ampliamente validado y una inferencia estadística basada en patrones incompletos.
Si la IA se convierte en la voz predominante del conocimiento, cargará con una autoridad que puede ser desproporcionada frente a su comprensión real del mundo. ¿Cuántas decisiones sanitarias, agrícolas o educativas se tomarán siguiendo lo que “dice la inteligencia artificial”, aunque solo haya consultado el fragmento del mundo que está disponible en inglés y en formato comercial?
¿Qué hacer ante esta amnesia digital? No se trata de rechazar la IA ni de idealizar el conocimiento tradicional. Se trata de reconocer que ambos deben coexistir si queremos un sistema de aprendizaje verdaderamente inclusivo.
Para evitar que la IA se convierta en un agente de homogeneización cultural, es necesario desarrollar políticas públicas y marcos institucionales que promuevan la digitalización respetuosa de saberes comunitarios, con participación directa de quienes los portan.
También se requiere transparencia sobre el origen de los datos que alimentan los modelos y claridad al comunicar los límites de su conocimiento real.
Dennison confiesa al final de su ensayo que sigue sin estar del todo convencido de la eficacia de algunos remedios tradicionales, pero ha llegado a la conclusión de que su duda personal no puede justificar la desaparición de esos saberes. La ignorancia honesta, dice, es mejor punto de partida que la certeza parcial elevada a verdad absoluta.
Conclusión: ¿superinteligencia o memoria selectiva?
Los defensores de la IA aseguran que esta tecnología acelerará el progreso científico y resolverá problemas que hoy nos rebasan. Tal vez sea cierto. Pero el progreso auténtico no se obtiene acumulando datos, sino ampliando la capacidad de escuchar. Y escuchar significa aceptar que no todo lo valioso está en las bibliotecas digitales.
Si no lo hacemos, podríamos terminar en una paradoja histórica: la civilización más conectada de todos los tiempos podría convertirse también en la que más rápidamente olvide lo que le permitió llegar hasta aquí.
La IA no debe ser vista solo como una máquina que responde preguntas, sino como un nuevo custodio del conocimiento humano. La pregunta es si queremos un custodio sabio o apenas uno bien entrenado. Si aspiramos a lo primero, todavía estamos a tiempo de evitar que la superinteligencia del futuro se construya sobre una amnesia digital del pasado.
Precio de Bitcoin de hoy
Puede ver el precio de hoy de Bitcoin aquí, así como también el precio de hoy de Ethereum y de las principales criptomonedas.
Por Emilio Carrillo Peñafiel, socio de Pérez Correa-González, abogado especializado en temas de financiamiento, tecnología y fusiones y adquisiciones, X: @ecarrillop | Sitio web: pcga.mx