Hoy en Lo que viene siendo una documentalista, entrevisto a un gran profesional que con motivo de las 3ras jornadas valencianas de documentación. A continuación, nos explica cómo ha sido trabajar en un proyecto interesantísimo de búsqueda y filtrado de información, en el que trabajo con Bárbara Pérez y Carlos Montagut. Pasad y leed.
1.
¿Cómo surgió ser #líderoculto
en las 3ras Jornadas de Documentación Valencianas?
Nos lo propusieron desde el COBDCV. Conocían el proyecto en
que estábamos trabajando, y nos propusieron que nos presentáramos.
2.
¿Cuál es el proyecto por el que fuiste
elegido? Explícalo
El proyecto constaba de partes: un “canvas” donde
poder trabajar con información y datos para preparar trabajos y presentaciones;
y un buscador especializado en información de mercado. Era un único
producto, puesto que iban a estar integradas las dos partes, pero eran dos
trabajos y esfuerzos totalmente diferentes.
Nosotros trabajábamos en la parte del buscador. En un primer
momento (fue la mayor parte del tiempo) teníamos que nutrir al buscador de
fuentes de información que consideráramos interesantes para conseguir
información de mercado. Teníamos fuentes de información institucionales,
asociaciones, publicaciones periódicas... Llegamos a recopilar alrededor de
50000 fuentes de información. Un ejemplo de fuente de información que
considerábamos era http://www.ceoe.es/
Posteriormente, pasamos a trabajar más estrechamente con los
desarrolladores. Aquí había dos frentes abiertos: por un lado poder conseguir
todas las páginas interesantes que tenía cada fuente de información (siguiendo
con el ejemplo anterior de la CEOE, teníamos que obtener todas las páginas que
pudieran contener información relevante para nuestro fin, por ejemplo, estas
páginas: http://www.ceoe.es/publicaciones_periodicas-situacion_socioeconomica-cat308.html)
y por el otro que la recuperación de la información fuera relevante y precisa.
En la parte de obtener la mayor cantidad de páginas, los
documentalistas realizábamos comprobaciones de que el crawler
(Robot que se encarga de extraer las páginas internas de una web), que
se encargaba de obtener estas páginas lo hiciera correctamente (o al menos
fuera consistente), ya fuera mediante análisis manual o mediante comparativas
entre diferentes herramientas de extracción de urls.
En la parte de la recuperación de información, los
documentalistas teníamos como misión conseguir que las páginas que habíamos
obtenido mediante el crawler, fueran etiquetadas correctamente. Construímos
vocabularios de diferentes ámbitos: de diferentes sectores económicos (no es lo
mismo un documento que habla de arroz que otro que habla de coches), de
diferentes localizaciones geográficas (un documento puede hablar de China y
otro de España, hablar del mismo tema, y no interesar por igual a todos los
usuarios), de diferentes tipos de necesidades de información (no es lo mismo
hablar de exportaciones e importaciones que de legislación)...
En un último paso, evaluábamos que los resultados obtenidos
en el buscador fueran relevantes y precisos, como un Google rater.
Ese era nuestro trabajo como documentalistas, conseguir
junto a los desarrolladores un Google
especializado en información de mercado. Tuvimos errores y aciertos, y
lamentablemente no pudimos salir al mercado, pero la experiencia de vivir un
proyecto tan interesante no nos la va a quitar nadie.
3.
¿Cómo ves la situación actual de
bibliotecarios, documentalistas y profesionales de la información?
Pues actualmente veo un momento de cambio constante. Hemos
pasado de ser archiveros, bibliotecarios y documentalistas a ampliar nuestro
campo metiendo la cabeza en el mundo “Community Manager”, marketing on-line,
gestión de contenidos, SEO-SEM... Pero aún nos queda un paso más que dar: el
BIG DATA. Hay tenemos un filón por explotar. Se supone que somos profesionales
de la información, pues démosles lo que necesitan, consigamos que ese big data
pase a ser información, o al menos sea lo más parecido a ella.
Creo que tenemos que dar un pequeño giro a nuestra formación
clásica y movernos hacia el mundo digital, pero no sólo a pequeña escala de
redes sociales, páginas web... Sino al mundo de la ingente cantidad de datos
que pueden manejar las empresas (todas, grandes y pequeñas) en estos momentos.
4.
¿Crees que es necesario adaptar la
profesión a las nuevas formas de la difusión de la información como redes
sociales, big data, etc?
Por supuesto, como decía antes, creo que el futuro de la
profesión está más ligado al big data, redes sociales, machine learning, que al
clásico bibliotecario sentado en su ordenador sacando estadísticas de uso de la
colección (que por cierto, también es apasionante), o al archivero manchado de
polvo.
5.
¿Cómo podemos hacernos más visibles en
esta sociedad extra informada?
Creo que para hacernos más visibles tenemos que movernos
más, salir de nuestra zona de confort. Está muy bien contar nuestras
experiencias de trabajo a compañeros de profesión, pero ellos ya saben lo que
podemos aportar. Lo importante es contar nuestras experiencias a aquellos que
no conocen nuestra profesión.
Te cuento una anécdota que me pasó en unas conferencias
sobre Machine Learning. Después de una de las charlas, me dirigí al orador para
conocer acerca de su trabajo. Él se encargaba mediante una herramienta de
Machine Learning de hacer predicciones sobre la cantidad de reservas que iba a
tener un hotel y el origen de esas reservas, edades... Para hacer esas
predicciones, necesitaba tener una gran muestra de datos, que él mismo se había
encargado de normalizar y revisar que estuviera correctamente organizada, este
trabajo le había llevado el 80% del tiempo que había dedicado a hacer la
predicción, al cual sólo le había dedicado el 20%. Es decir, al trabajo
principal le había dedicado el 20% y al adherido el 80%. Ese 80% del tiempo es
básicamente un trabajo fácilmente realizable por un documentalista (el otro 20%
también, pero necesitas un poco más de formación complementaria), y cuando se
lo comenté me dijo que no lo había pensado, pero que nadie se lo había dicho
nunca tampoco.
Creo que ese es nuestro problema. No salimos hacia mundos
desconocidos, y por eso nunca dejan de ser desconocidos. Y lo que es peor,
nosotros tampoco dejamos de ser invisibles y desconocidos.
6.
¿Cuál será tu trabajo dentro de 20 años?
No me aventuro a hacer esta predicción, puesto que hace dos
años no se me hubiera ocurrido que pudiera trabajar en la creación de un
buscador tipo google, y hace un año no se me pasaba por la cabeza estar en un
archivo. Y puedo decir que he trabajado en la creación de un buscador tipo
google y ahora estoy en un archivo municipal.
Lo que sí puedo decir es que mi trabajo estará relacionado
con la información y con facilitar su acceso a ella a todos aquellos que la
necesiten.
Héctor Canorea Martínez
No hay comentarios :
Publicar un comentario