viernes, 24 de abril de 2009

Descifrando la Escritura Perdida del Indo mediante Cadenas de Márkov

La denominada Escritura del Indo consiste en los restos escritos de la lengua usada hace 4000 años por la civilización que floreció en torno al 2500 a.c. y se extinguió aproximadamente en el 1500 a.c. en la cuenca del río Indo, entre lo que sería la India y el Pakistán actuales. Los restos que quedan de este oscuro sistema de comunicación suelen estar grabados en piedras lisas rectangulares, denominadas sellos. Las inscripciones destacan por su estilo particular de incisión y una apariencia exquisita. Es un claro ejemplo de escritura "perdida": hoy por hoy nadie sabe como leerla.


Muchas son las hipótesis lanzadas acerca de esa escritura. Desde el siglo XIX estos símbolos se han ido relacionando sucesivamente con remotos precursores del chino, el sumerio, el egipcio, así como con los grupos de lenguas drávicas, hindús, eslavas y hasta con la hablada en la isla de Pascua... para llegar a la formulación final de una controvertida hipótesis según la cual estos símbolos en realidad podrían no representar ninguna lengua en absoluto, generando el llamado debate lengua-versus-símbolo. Estas inscripciones ¿representan una lengua, o son simplemente elementos decorativos?


Avancemos por un momento hasta la Rusia zarista del siglo XIX. Allí el matemático ruso Andréi Andréyevich Márkov (Андре́й Андре́евич Ма́рков, 1856-1922), también conocido como "el militante" por su activismo político, desarrolla un instrumento matemático que ayuda a estudiar situaciones en las que la probabilidad de que ocurra un evento está en función directa del evento inmediatamente anterior. Esta herramienta, denominada cadena de Márkov en su honor, tiene memoria (aunque algo limitada ya que sólo "recuerda" el evento precedente) pero, pese a su sencillez, resulta extremadamente útil a la hora de modelizar múltiples situaciones físicas, económicas, biológicas y sociales (así como también a la hora de crear contraseñas seguras pero fáciles de pronunciar :-)

La forma más característica de representar estas cadenas es mediante grafos dirigidos en los que los nodos representan los estados del sistema y los arcos representan la probabilidad de saltar de un estado a otro. Estos grafos pueden también representarse por medio de su matriz numérica equivalente, forma que se presta muy bien a su manipulación por medios informáticos.

Una valiosa aplicación de estas cadenas está en los llamados modelos ocultos de Márkov, modelos estadísticos en los que se asume que el sistema a modelar es un proceso de Márkov de parámetros desconocidos. Observando las transiciones de estados de un sistema se puede llegar a reconocer patrones ocultos. Con lo que por fin llegamos al siglo XXI: investigadores de la Universidad de Washington han analizando las escrituras del Indo mediante un modelo de Márkov con el objeto de resolver el debate lengua-versus-símbolo.

En primer lugar analizaron en primer lugar los patrones pertenecientes a cuatro lenguas (sumerio, sánscrito, tamil e inglés moderno) así como los patrones pertenecientes a sistemas de comunicación no verbales (tales como secuencias de ADN o programas informáticos escritos en el lenguaje de programación Fortran). El programa calculó el nivel de orden presente en cada uno de los sistemas, mostrando claramente como las lenguas humanas se caracterizaban por unos patrones característicos claramente diferenciados de los de los sistemas no verbales.

A continuación alimentaron el sistema con los fragmentos del Indo, encontrando que se ajustan claramente a los patrones extraídos al analizar los lenguajes hablados. Dicen los investigadores que "el siguiente paso consiste en extraer una gramática a partir de los datos disponibles, y preguntarnos si es similar a la del sánscrito, a las lenguas drávicas o a las indoeuropeas. Hace muy poco que los arqueólogos han empezado a usar técnicas computacionales estrictas. Es el momento."

Fuente: Wired. "Entropic Evidence for Linguistic Structure in the Indus Script" por Rajesh P. N. Rao, Nisha Yadav, Mayank N. Vahia, Hrishikesh Joglekar, R. Adhikari e Iravatham Mahadevan. Science, Vol. 324 núm. 5926, 24 de Abril de 2009. Como siempre, gracias por venir. Si te gustó el post puedes apuntarte a través del correo electrónico o por medio del feed RSS (más acerca del RSS). También puedes echarle un vistazo a mis elementos compartidos. Y recuerda, Wan Link Sniper no fabrica para otras marcas.

1 comentario:

Pureza dijo...

Me parece increíble y maravilloso. Qué lejos (y qué cerca, al mismo tiempo) estamos de Champollion. Recomiendo un libro un poco "a contramoda" que a mí me gustó en tiempos (a encontrar en librerías de viejo o anaqueles polvorientos y poco frecuentados de bibliotecas): "Dioses, tumbas y sabios" de Ceram.