Nuestro legado a ojos de la máquina

Nuestra civilización se sustenta sobre los hombros de quienes nos precedieron en este camino que llamamos vida.

Es fácil dar por sentado que el alfabeto, el derecho, la filosofía, el álgebra, la contabilidad, la poesía… son consustanciales al ser humano y a la vida en sociedad. Sin embargo, durante milenios la Humanidad vivió ajena a estas ideas. Hace aproximadamente 5500 años la vida del Hombre da un giro inesperado, y comienza a dejar constancia escrita de sus experiencias y conocimientos. Pero tanto su lenguaje como la mentalidad de estos pueblos se nos hace casi alienígena en nuestros tiempos. Incluso para los especialistas en el campo, el desafío es muchas veces inabordable por métodos convencionales. ¡Y adivinen! También aquí podemos valernos de la Inteligencia Artificial para acercarnos a ese mundo que un día fue. Como cada mes, en Catch.batches.

Figura 1: Fragmento de una tablilla sumeria, totalmente cubierta de signos cuneiformes, hasta donde sabemos el primer método de escritura de la Historia. Con ayuda de la Inteligencia Artificial podemos facilitar el estudio de estas fuentes.

¿Algoritmos historiadores?

Sabemos (y en España tenemos el privilegio de contar con varias de las muestras más importantes del mundo) que el ser humano comenzó a dejar constancia de sus pensamientos e inquietudes hace más de 40.000 años[1]. Sin embargo no fue hasta hace muy poco, en términos relativos considerando cuándo surgieron los primeros Sapiens, que éstecomenzó a intentar trascender de tal forma que su existencia fuera proyectada a sus congéneres en el espacio y en el tiempo. En Egipto, en Mesopotamia y en la China de los Shang se descubre así hace milenios un mecanismo para transcribir los sonidos de palabras a símbolos visuales establecidos, ordenados y estructurados, de tal manera que otras personas pudieran descifrar el contenido y entenderlo. Con la habilidad para dibujar los sonidos había nacido la escritura, y con ella el género humano entraba en una nueva era.

Cada generación ha querido dejar testimonio de su paso por la Tierra. Desde grandiosos tratados filosóficos a breves crónicas, registros actuariales o epopeyas épicas, la Humanidad ha sentido el impulso de trascender a través de la palabra escrita. No obstante, adentrarse en el estudio de textos antigüos no es en absoluto sencillo. Para empezar, gran parte de la producción escrita a lo largo de la Historia se ha perdido. Por ejemplo, sabemos a través de Platón que aunque la poetisa Safo de Lesbos era considerada una autoridad literaria de su tiempo, no nos han llegado más que algunas líneas de toda su producción[2], y lo mismo ocurre con lo que denominamos filósofos presocráticos.

También somos conscientes de que la percepción del mundo que nos rodea está muy influida por la época en que vivimos y las ideas que dominan a la sociedad que nos arropa. Por eso otro aspecto fundamental en el estudio histórico es ser capaz de datar correctamente un texto. De hecho, uno de los grandes debates actuales en el estudio de la Antigüedad griega, el 3-bar sigma debate, centrado en entender el progreso de la política expansionista de la Atenas post-Pericles[3], pasa por conocer la fecha de producción de una serie de decretos atenienses durante su época imperial (para el lector más interesado, sirva como introducción en inglés este enlace).

Todos estos problemas son abordados actualmente rastreando patrones en las técnicas de escritura, en la evolución del lenguaje y la manera de transcribirlo en documentos escritos. Por eso mismo, suponen un escenario perfecto para el uso de herramientas de Inteligencia Artificial. Gracias a la automatización de ciertas partes del estudio arqueológico somos capaces de llegar más lejos y entender mejor qué quisieron decirnos sus autores. A la manera de un Parque Jurásico lingüístico, nuestro objetivo será traer de vuelta idiomas y pensamientos que anduvieron por la Tierra antes de que nosotros llegáramos.

Un registro incompleto, o cómo Sócrates no dijo eso

El primer problema a abordar tiene que ver con la conservación y legibilidad del material a nuestra disposición. Por su misma naturaleza, el registro de que disponemos es limitado, muchas veces a consecuencia de acciones humanas (quema de libros, destrucción de símbolos nacionales…), o como resultado del mero transcurrir del tiempo. A fin de cuentas, una tablilla de barro o un edicto en piedra se desgasta fácilmente, haciendo que incluso las muestras mejor conservadas estén incompletas. Como ejemplo, véase el edicto de Eritras de la Figura 2, en que Atenas exige una constitución democrática a la ciudad de Eritras, en la actual Turquía, en algún punto del siglo V a.C. La Ilíada, la Odisea, los Diálogos platónicos, la epopeya de Gilgamesh… Todos han precisado de alguien que completara los huecos presentes en las fuentes originales. De este modo, la lectura que hacemos de los clásicos no deja de ser hasta cierto punto una interpretación moderna de las palabras de su autor original.

Figura 2: Documento ateniense del siglo V a.C. Puede observarse el deterioro de algunos fragmentos (marcados en rojo), así como la falta de signos de puntuación, ambos factores que dificultan su lectura. Créditos: Colección del Museo Británico, bajo licencia Creative Commons (CC BY-NC-SA 4.0).

Recientemente copaba la portada de la revista científica Nature un sistema desarrollado por la empresa especializada en Inteligencia Artificial Deepmind capaz de realizar este trabajo, así como de asignar una fecha de escritura a textos en griego clásico[4]. Esta Inteligencia Artificial, que los autores han llamado Ithaca, aborda los dos principales problemas en epigrafía – el estudio de inscripciones en roca –  que mencionábamos anteriormente. El sistema en sí es muy similar a otros ya vistos en Catch.batches.

Figura 3. Sistema de asistencia al historiador propuesto por investigadores de la empresa Deepmind. No es la intención sustituir al especialista, sino agilizar su trabajo. Versión de prueba gratuita en este enlace.

Introducimos el texto del que dispongamos como si fuera cualquier otro idioma, y para entrenar al algoritmo, consistente en una red neuronal profunda, ocultaremos al azar palabras que sí conozcamos de dicho texto para que sea el propio modelo computacional el que aprenda dónde tiene sentido cada palabra. De manera iterativa comenzará a encontrar patrones en la disposición de palabras y letras, esto es, en el lenguaje usado en distintos momentos de la historia de la Antigüa Grecia. En el caso que nos ocupa la red neuronal pudo acceder a más de 75.000 textos griegos que abarcan un intervalo entre los años 350 y el 200 a.C. Una vez entrenado, ante un texto nuevo, podemos ayudarnos de las predicciones realizadas por este modelo para elegir aquella palabra que a nuestro criterio (y sobre todo, al de los expertos en el tema) resulta más probable que fuera la real.

La colaboración entre humano y máquina, la clave del éxito

Uno de los aspectos más llamativos de este trabajo es el énfasis de sus autores en explicar que la Inteligencia Artificial que han diseñado no pretende, bajo ningún concepto, reemplazar a nadie. Nuestros algoritmos carecen de las cualidades de procesamiento lógico-simbólico de la información que serían necesarias para interpretar adecuadamente el significado, no sólo literal sino social, filosófico e histórico que el registro arqueológico pone ante nosotros. Por tanto, los algoritmos inteligentes se convierten en una poderosísima herramienta, pero herramienta a fin de cuentas, para potenciar las habilidades de los expertos humanos.

En su investigación, los autores compararon cómo de acertadas eran las predicciones realizadas por dos doctores en la materia de completar textos inscritos griegos contra las realizadas de manera automática por el algoritmo, una vez éste había sido entrenado. Mientras que los historiadores lograron predecir correctamente un 25% de los huecos por sí mismos, la red neuronal fue capaz de acertar el 62% de las veces. Pero cuando combinaron las sugerencias realizadas por el algoritmo con el conocimiento experto humano, dicha tasa se elevó hasta el 72%. Un hito que sin duda marcará un antes y un después en la manera en que desvelamos qué quisieron contarnos aquellos que vivieron antes.

Ver el mundo con una nueva perspectiva

Figura 4: El estudio del pensamiento antigüo es, sin ningún género de duda y muy a pesar de ciertos políticos, uno de los pilares fundamentales de nuestra sociedad. La unión de disciplinas técnicas con las humanísticas es, a juicio del autor, uno de los aspectos que definen nuestra cultura. Nos permite ser competitivos en este mundo que parece moverse “demasiado” rápido. Fuente: Fotografía tomada por el autor.

Si bien es un estudio llamativo, desarrollado por algunos de los nombres más conocidos del mundillo de la IA y del que se han hecho eco los medios especializados, lo cierto es que todo el campo del estudio de la Antigüedad se está beneficiando de estas nuevas herramientas computacionales. A fin de cuentas, el griego clásico emplea un alfabeto todavía en uso y representa uno de los pilares fundamentales, junto con el latín[5] de la sociedad occidental. Lo que es apasionante es ser capaces de aplicar el mismo esquema, basado en encontrar patrones a gran escala, para idiomas escritos en sistemas como el cuneiforme de tiempos del Imperio Acadio[6, 7], o de la Babilonia en época bíblica[8]. Acceder a esa parte de la Historia a través de los ojos de quienes lo vivieron nos permite conocer mejor de dónde venimos, y en qué se fundamenta el mundo que habitamos.

Ahora la pregunta es, ¿qué será lo próximo? Quizá gracias a sistemas computacionales como éstos seamos capaces algún día de revivir idiomas perdidos hace siglos, pero ¿seremos capaces de traer de vuelta una lengua completamente extinta? Sólo el futuro lo dirá, pero lo que está claro es que la Inteligencia Artificial abre horizontes hasta ahora ignotos en absolutamente todos los campos del conocimiento humanos, y que todos debemos aprender cómo funciona esta tecnología que nos fascina y asusta a partes iguales.


[1]: Brumm, A., Oktaviana, A. A., Burhan, B., Hakim, B., Lebe, R., Zhao, J., Sulistyarto, P. H., Ririmasse, M., Adhityatama, S., Sumantri, I., & Aubert, M. (2021). Oldest cave art found in Sulawesi. Science Advances7(3), eabd4648. https://doi.org/10.1126/sciadv.abd4648.

[2]: Prólogo de Marta González González a Safo de Lesbos (2021). El Canto Lesbio. Colección Textos Clásicos, Biblioteca Clásica Gredos, ISBN: 9788424939656.

[3]: Jr., C. W. H. (1999). Democracy and the Athenian Epigraphical Habit. Hesperia, 68(3), 387. https://doi.org/10.2307/148494.

[4]: Assael, Y., Sommerschield, T., Shillingford, B., Bordbar, M., Pavlopoulos, J., Chatzipanagiotou, M., Androutsopoulos, I., Prag, J., & de Freitas, N. (2022). Restoring and attributing ancient texts using deep neural networks. Nature, 603(7900), 280–283. https://doi.org/10.1038/s41586-022-04448-z.

[5]: Bamman, D., & Burns, P.J. (2020). Latin BERT: A Contextual Language Model for Classical Philology. ArXiv, abs/2009.10053.

[6]: Gordin, S., Gutherz, G., Elazary, A., Romach, A., Jiménez, E., Berant, J., & Cohen, Y. (2020). Reading Akkadian cuneiform using natural language processing. PLoS ONE, 15(10 October), e0240511. https://doi.org/10.1371/journal.pone.0240511.

[7]: Bogacz, B., & Mara, H. (2020). Period Classification of 3D Cuneiform Tablets with Geometric Neural Networks. Proceedings of International Conference on Frontiers in Handwriting Recognition, ICFHR, 2020-Septe, 246–251. https://doi.org/10.1109/ICFHR2020.2020.00053.

[8]: Fetaya, E., Lifshitz, Y., Aaron, E., & Gordin, S. (2020). Restoration of fragmentary Babylonian texts using recurrent neural networks. Proceedings of the National Academy of Sciences of the United States of America, 117(37), 22743–22751. https://doi.org/10.1073/pnas.2003794117.

Compartir :
Compartir en facebook
Compartir en twitter
Compartir en linkedin

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

¿Alguna pregunta?

Para más información sobre lo que hacemos, ponte en contacto con nosotros.