El desarrollo de la cultura deja huellas indelebles, artefactos, restos fósiles, que nos permiten rastrear, reconstruir y comprender cómo han evolucionado nuestros hábitos, nuestro lenguaje o nuestra manera de ver el mundo, y el corpus literario constituye sin duda uno de los yacimientos arqueológicos más importantes para buscar fósiles culturales. Recientemente, un grupo de investigadores de diferentes universidades de Estados Unidos, junto con The Google Books Team, han digitalizado más de cinco millones de libros publicados entre 1800 y 2000 (un 4% de todos los libros publicados en la historia de la humanidad). El proyecto se denomina Culturomics y el estudio ha sido publicado en la revista Science. El análisis de este inmenso corpus literario ha permitido investigar de manera cuantitativa temas tan diversos como las tendencias culturales, la evolución de las cuestiones de género, la memoria colectiva o la incorporación de la tecnología en la vida cotidiana.

Actualmente, los investigadores de humanidades deben hacer inferencias acerca de la evolución de la cultura a partir de la atenta lectura de una reducida selección de obras. Y esto es así porque ninguna persona es capaz de leer todo lo que se publica. Sólo en el año 2000 se han publicado 11 mil millones de palabras. Leyendo día y noche, sin parar para comer ni dormir, a razón de 200 palabras/min, una persona tardaría más de 100 años en leer lo publicado sólo en el año 2000. Si bien todo lo publicado no es relevante (sobre todo desde un punto de vista literario) sí contiene la clase de restos fósiles que pueden ayudarnos a estudiar las tendencias y los cambios culturales. En este contexto, el tratamiento informático de millones de libros digitalizados nos permite aventurarnos en un análisis cuantitativo de la cultura que hasta ahora era impensable. Os propongo entonces hacer un viaje por Culturomics para descubrir cómo han cambiado determinados aspectos de nuestra cultura durante los últimos 200 años.

Una de las maneras más sencillas de analizar los cambios culturales consiste en observar la frecuencia de uso de cada palabra a lo largo del tiempo. Esta frecuencia se puede calcular dividiendo el número de veces que una dada palabra aparece en un determinado año por el número total de palabras publicadas ese año. La evolución de la frecuencia de uso de una dada palabra, o la comparación entre palabras, nos permite saber cómo han cambiado ciertas costumbres o preferencias a lo largo del tiempo. Podemos rastrear, por ejemplo, cómo han evolucionado algunas cuestiones de género. Hacia el año 1800, la palabra men aparecía con una frecuencia ocho veces superior a women; sin embargo, hacia 1900 la relación se reduce a seis y hacia mediados de los 80´ambas palabras aparecen la misma cantidad de veces en los textos publicados ese año (en inglés). En el año 2000 la palabra women aparece impresa cuatro veces por cada tres men.

Otro análisis interesante que puede hacerse a partir de estos datos está relacionado con nuestra capacidad (o interés) como sociedad por recordar u olvidar hechos del pasado. Una manera de estudiar esto es observando cuántas veces se menciona un determinado año en el corpus literario. En la siguiente figura podemos observar la frecuencia relativa de las “palabras” 1883, 1910 y 1950 a lo largo del tiempo. Las tres curvas muestran una forma característica, un patrón; el año en cuestión no se menciona en la literatura hasta que llega, indicando un gran interés en el presente. Luego, la curva crece muy rápidamente y comienza a decaer tras un par de años; comenzamos a olvidar. El tiempo necesario para que la curva alcance la mitad de su valor máximo nos da una medida de nuestra capacidad (o interés) por recordar el pasado. Así, “1883” declina a la mitad de su valor máximo en unos 32 años; “1910” en unos 16 años y “1950” en sólo 12 años. Olvidamos nuestro pasado más rápido con cada año que pasa.

Curiosamente, nuestra tendencia a olvidar cada vez más deprisa está acompañada por una asimilación cada vez más rápida de las novedades. Consideremos, por ejemplo, los inventos más destacados entre 1800 y 1920. Podemos dividirlos en tres intervalos (de acuerdo al año de su invención – 1800-1840, 1840-1880, 1880-1920) y rastrear la frecuencia relativa con la que son mencionados en los textos publicados en los años posteriores a su invención. En la siguiente figura vemos que los inventos correspondientes al intervalo 1800-1840 necesitan unos 130 años desde su invención para alcanzar su máxima difusión. Sin embargo, los inventos del período 1840-1880 necesitan unos 80 años para alcanzar el mismo nivel de difusión mientras que los del último período sólo necesitan unos 50 años. La adopción cultural de los descubrimientos tecnológicos se ha ido acelerando considerablemente durante los últimos doscientos años.

Hemos presentado aquí sólo una pequeña muestra de lo que es posible conocer a partir del análisis cuantitativo de la cultura. Para los interesados en curiosear y hacer sus propias búsquedas, pueden pegarse una vuelta por Google Books nGram Viewer. Culturomics representa una nueva herramienta para las humanidades que permite encontrar tendencias, huellas, restos fósiles culturales. El gran reto para los humanistas consiste ahora en interpretar esos fósiles y reconstruir a partir de ellos el gran esqueleto de nuestra cultura.


 

3 comments on “Culturomics

  1. Y además la herramienta tiene un cierto componente lúdico, ¿no? Como un programa de televisión al estilo ‘Saber y ganar’, vaya: en busca del dato cultural curioso me ha pasado un cuartito de hora jugueteando. Si uno lo piensa bien, esto no está lejos de parte de las esencias de Google.

  2. Pingback: EVOLUCIÓN DE NUESTROS HÁBITOS | Esther Zorrozua

Y tú... Qué opinas?

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: