Investigadores de la UNAM realizaron un estudio en el que muestran, por primera vez, la forma en que ha evolucionado la frecuencia del uso de las palabras a lo largo de los tres últimos siglos. Los hallazgos fueron publicados en Plos One, revista científica electrónica de reconocimiento internacional.
Así, por ejemplo, en 1700, los cinco sustantivos más usados en español eran “fe”, “señor”, “cardenal”, “rey”, “ácido” y “Dios”; en el año 2000, todos estos desaparecieron de los primeros lugares y han sido sustituidos por “parte”, “estado”, “años”, “vida”, “política” y “nacional”.
Lo que ocurrió en esos tres siglos, la forma en que se ha modificado la frecuencia de las palabras año con año en seis idiomas distintos, ha sido modelado, por primera vez, por los universitarios Germinal Cocho, Jorge Flores y Carlos Pineda, del Instituto de Física (IF), en colaboración con Carlos Gershenson, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), y Sergio Sánchez, de la Facultad de Ciencias (FC), quienes llevaron a cabo la indagación para seis idiomas distintos: inglés, alemán, español, francés, italiano y ruso.
Lo interesante es que, a pesar de las grandes revoluciones culturales y de que Alemania, por ejemplo, es muy diferente a Latinoamérica, todas las palabras, en los distintos idiomas, “parecen seguir un patrón similar: a mayor uso de una, ésta tiene menor variable de rango, mientras que a menor empleo, su cambio en el rango es mayor. Ese esquema fue nuestro principal hallazgo. Además, logramos modelarlo a partir de un caminante aleatorio”, señala Carlos Pineda.
Por ejemplo, la palabra “the” (artículo en inglés) es una de bajo rango, porque su uso es muy frecuente y resulta que se ha mantenido así en todos los momentos de la historia, es decir, no hay cambios significativos en su uso en ninguno de los idiomas, añade.
“Pero hay otras cuyo uso es menos frecuente y entonces cambian en función de algún contexto histórico, como ‘dios’ o ‘rey’, que eran palabras muy importantes pero cuya frecuencia ha disminuido actualmente. Cuando se fundó la ciudad, ‘Nueva York’ comenzó a volverse muy popular, hubo un pico en su uso y después disminuyó. ‘Internet’ es muy común pero antes ni siquiera existía”.
Su modelo les permitió definir varios tipos de rangos en el uso de las palabras y determinar tres regímenes: “cabeza”, “cuerpo” y “cola”, que corresponden a las palabras estructurales más comunes, las de uso general y las que son de uso más especializado, respectivamente.
Carlos Pineda explica que el propósito del proyecto es el estudio de las variaciones en el lenguaje; para ello, aprovecharon el proceso de escaneo masivo de libros de todo el mundo desde 1508 hasta 2012 (emprendido por Google).
“No sólo tenemos un ‘corte’ en el tiempo de cómo es el lenguaje de hoy, sino cómo se ha modificado. Estudiamos aspectos básicos, pues somos físicos y no lingüistas; vemos cuáles fueron las 100 mil palabras más usadas cada año, a fin de determinar los cambios”.
La idea utilizada para modelar los cambios del rango de las palabras en el tiempo es una caminata aleatoria, en la que se escoge al azar el tamaño del siguiente paso, pero con cierta desviación estándar que indica qué tanto puede variar el paso.
Otra de las aportaciones es la posibilidad de hacer algunas predicciones estadísticas que pueden aportar mucha información a los lingüistas. Por ejemplo, explica Pineda, “si alguien desea saber en cuánto tiempo va a desaparecer la palabra “little”, podríamos ubicar la palabra en cierta parte de la escala y determinar un rango para su desaparición: 100 años; sería muy raro que desaparezca en un año pero también muy difícil que sobreviva 500 años”.