Los lectores se han hecho leer (también)

Ha llegado el momento de mi investigación en el que los cuestionamientos duros y las dificultades se apresuraron todas juntas. La base de datos inicial – la medusa – ha resultado un trabajo relativamente claro y simple de organizar. De hecho, es el esqueleto que va a sostener todo lo demás: los aparatos editorial y literario/periodístico de Orsai son en sí el lado autorial, pero ¿qué hay de los lectores?

¿Los lectores? Los lectores se han hecho escuchar leer (también).

Los nodos de las piezas que componen la base de datos se han multiplicado, al menos, por 100 en las respuestas de los lectores. En promedio cada una de las noventa y tantas entradas de blog en el periodo que cubro (septiembre de 2009 al presente) recibe 300 comentarios, las casi 200 piezas de la revista publicadas hasta ahora al rededor de 150 y los blogs “menores” entre 50 y 70. Sin hacer la matemática exacta estamos hablando de cualquier cosa entre 50 y 70 mil comentarios de los lectores. (Finalmente estoy viviendo en carne propia el término que se repite en todos los ensayos sobre Humanidades Digitales: large datasets). Es realmente impresionante que incluso en número de palabras cualquier texto de Orsai se multiplica exponencialmente en manos de los lectores. Alegremente esto confirma un punto clave de la parte teórica de la tesis: la cualidad orgánica de un texto en su contexto (en su comunidad para decirlo de forma menos cacofónica) es que un input mínimo produce un output mucho mayor. Para los que seguimos a Boyd, esto es, incluso, un aspecto que distingue el hecho de leer en sí.

Entonces el problema es cómo manejar todo esto para poder analizarlo. Tres opciones claras, aunque seguro se me están pasando otras. Si alguien tiene sugerencias son infinitamente bienvenidas.

1) Comentario por comentario a la base de datos tal y como está el esquema. Sus ventajas son claras, sería una especie de close reading que permitiría un nivel de detalle del análisis minucioso, como poder identificar, e incluso caracterizar, a algunos de los lectores casi como si se tratara de personajes; notar los matices de las intervenciones de los lectores, etc. Sus desventajas no hay ni que mencionarlas.

2) Hacer una clasificación breve de nodos tipo, no más de 20 tal vez, en las que acomode (si bien un poco arbitrariamente – ahí la prueba de que todo esto sigue siendo labor interpretativa) cada comentario. Por ejemplo: en una categoría todos los “pri”, “dos”, “tres” que siempre aparecen al principio, en otra los agradecimientos a los autores, en otra las correcciones de estilo, etc. Lo que se volvería visible aquí es la frecuencia con la que los lectores recurren al tipo de comentario en qué piezas. ¿Quién sabe? A lo mejor todos los tipos de comentarios están balanceados en cada pieza o, dependiendo del tema de la pieza, predomina alguno.

3) El distant reading – probablemente usando el NLTK de Python – para formar una base de datos paralela que pueda empalmarse a la medusa. Con esta metodología podría, por ejemplo, obtener buenas mediciones de la frecuencia con la que los comentarios “pri” aparecen y ver como se distribuyen a lo largo del corpus de Orsai, o qué tan común es que los lectores se dirijan a los autores a otros lectores, establecer palabras clave que denoten emociones despertadas en los lectores o formas en las que se relacionan con el proyecto en general, no sería tan complicado. Me atrae mucho probar esta metodología aunque el nivel de detalle puede no ser minucioso en el sentido en el que lo sería con la primera opción, el dataset es tan grande que la información que obtenga de este análisis dificilmente sería irrelevante. Desventajas: apenas estoy aprendiendo a usar Python.

Independientemente de con qué metodología termine hay dos cosas que me tienen fascinada – incluir el dataset enorme hace necesario poner el énfasis en las “manifestaciones” de los lectores, de ninguna forma aisladas de los textos primarios, sino al contrario casi como parte de ellos. Y dos, observar cómo se ha establecido la comunidad en términos textuales.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: