
Periodicals Index Online (PIO) es una base de datos de publicaciones académicas y periodísticas que cubre un período de tres siglos: desde 1665 hasta finales de los noventa del siglo XX.
A esta inusual cobertura temporal, se unen dos características también peculiares:
- En primer lugar, incluye tanto publicaciones populares o periodísticas, como académicas, aunque estas últimas son mayoritarias.
- En segundo lugar, desde el punto de vista temático, las publicaciones se centran en Humanidades y Ciencias Sociales.
El objetivo de esta base de datos (PIO) es centrarse en el periodo indicado debido a que, a partir de fines de los noventa del siglo XX e inicio del 2000 la posibilidad de conseguir acceso a las publicaciones, por su progresiva digitalización, mejora notablemente, si nos movemos hacia adelante. En cambio, hacia atrás empeora cada vez más.
Otro rasgo característico de PIO es que, pese a incluir publicaciones de tipo periodístico, excluye de sus colecciones los periódicos diarios, así como las publicaciones con contenidos exclusivamente gráficos.
La productora de la base de datos (ProQuest) continua añadiendo publicaciones al ritmo de unas 300-500 por año, por lo cual los contenidos de esta base de datos es de suponer que no dejarán de crecer en el futuro.
Otro aspecto interesante, para nuestro contexto, de Periodicals Index Online es que contiene un subconjunto denominado PCI Español, como suponemos que debe ocurrir con los principales idiomas representados en esta base de datos (ver más adelante).
A continuación, reproducimos la información que esta base de datos proporciona en su página «Acerca de», actualmente producida y distribuida por la empresa ProQuest:
Periodicals Index Online es un índice electrónico de millones de artículos publicados en más de 6.000 revistas de humanidades y ciencias sociales. Permite a los estudiantes, licenciados, investigadores universitarios e investigadores en general localizar con rapidez artículos relevantes en su campo de estudio concreto, y reduce lo que podría llevar años de investigación a cuestión de minutos.
(…) Periodicals Index Online actualmente recopila más de 20 millones de artículos que datan desde 1665, y cada artículo de cada revista está indexado, desde el volumen 1 y el número 1 hasta la actualidad.
La catalogación no se limita al idioma o la fecha. Periodicals Index Online abarca tres siglos de publicaciones académicas en más de 60 idiomas y dialectos, entre ellos inglés, francés, alemán, italiano, español y otros idiomas occidentales.
Cabe destacar que en el momento de llevar a cabo esta revisión, el número de revistas era cercano a las 8.000, por lo tanto, ciertamente, en los últimos 2-3 años se han añadido casi 2.000 revistas.
Por su parte, el subconjunto denominado PCI Español, se describe así:
PCI Español es un índice electrónico subconjunto de Periodicals Index Online al completo. Ofrece acceso a los registros bibliográficos de las publicaciones periódicas más representativas en español, así como a revistas en otros idiomas que tratan acerca de España o América Latina. PCI Español trata las siguientes áreas temáticas: arqueología y antigüedades, antropología y etnología, arte y arquitectura, historia, filosofía, geografía, lingüística y filosofía, literatura, ciencias políticas y administración pública, ciencias sociales, ciencias económicas y empresariales, derecho y psicología.
Características principales de las colecciones
A continuación, mostramos tres dimensiones por las cuales podemos caracterizar este base de datos. En concreto, mostraremos la distribución de publicaciones por:
- Idiomas
- Temas
- Tipo de publicación.
Obsérvese que las cifras que veremos para las tres distribuciones se refieren al número de revistas, no de artículos. Por ejemplo, en la primera lista veremos que, para el idioma español, se indica 1.048, esto es, el número de revistas en este idioma disponibles en PIO. El idioma catalán, por si alguno de mis colegas se lo pregunta, está representado por 43 títulos (esperemos que siga creciendo).
Pero cada revista puede tener decenas o cientos de artículos, por tanto el número total de documentos será un múltiplo (en principio, bastante alto) de esa cifra inicial.
Idiomas – 1

Vemos, entre otros datos, los cuatro idiomas que superan el millar de títulos (Inglés, Francés, Alemán, Español) en la base de datos. Por otro lado, considerando su ámbito temporal, no debería sorprender ver que el Latín está representado con casi dos centenares de publicaciones.
Idiomas – 2

En esta segunda captura vemos otros idiomas presentes en la base de datos. Podemos ver el dato de otro de los idiomas que nos afecta por contexto: el catalán. En este caso, representado con 43 títulos, como hemos señalado antes.
Vemos que el número de publicaciones aún es muy reducido en esta franja comparado con los cinco principales idiomas (ver captura precedente), con un orden de magnitud de diferencia: hemos pasado de varios cientos, incluso varios miles, a unas pocas decenas.
Ahora bien, ProQuest señala que cada año añaden entre 300 y 500 publicaciones, por lo que esperemos un incremento progresivo de estas métricas en el futuro.
Principales temas

Una parte considerable de las publicaciones presentes en PIO son de carácter académico y profesional. Entendemos que esta distribución ayuda a caracteriza tales publicaciones. Sin embargo, como veremos después, también incluye revistas de carácter general.
Tipo de publicación

Las revistas de carácter científico constituyen, con diferencia, el grueso del tipo de fuentes. Por su parte, podemos considerar un solo grupo las de carácter general, las profesionales y las identificadas como históricas, en cuyo caso nos acercamos a las 600 revistas de tipo no académico.
No podemos dejar de señalar la sorpresa que produce ver en esta distribución tipos de fuente con conteos de 3, 2 y 1 ítem. Tiene sentido si, tal como ya hemos señalado, la idea es que estas cifras no van a dejar de aumentar regularmente.
Encontramos a faltar una distribución por años, dada la amplia cobertura de 3 siglos ya comentada y que es la característica que, precisamente, más llama la atención.
Pruebas no sistemáticas nos dan a entender que el grueso de las publicaciones, con bastante diferencia, proceden de los últimos 100 o 150 años, lo cual ya es un período notable, no vamos a ser nosotros quienes le quitemos importancia, sino todo lo contrario.
ANÁLISIS DE LAS FUNCIONES PRINCIPALES DE PERIODICALS INDEX ONLINE (PIO)
Una vez caracterizado el contenido de PIO, mostraremos mediante capturas de pantalla las principales funciones de búsqueda y acceso a la información de esta base de datos
Búsqueda avanzada

La búsqueda avanzada utiliza uno de los mejores patterns para esta función: un número de filas, según sea necesario, para poder utilizar ecuaciones mixtas con la máxima comodidad. En este caso, vemos una búsqueda con tres palabras clave unidas mediante un AND y con un rango de años (de 1975 hasta la actualidad).
Parámetros adicionales de la búsqueda avanzada

Además de las opciones vistas en la captura superior, tenemos un amplio número de opciones para focalizar la consulta.
Página de resultados

La página de resultados presenta una estructura funcional y mantiene el pattern habitual, con el grueso de la página destinado a mostrar los títulos y otras informaciones de cada documento encontrado.
Entre las opciones de filtrado, a la que dedicamos la captura siguiente para mostrar mejor sus posibilidades, destaca la distribución por décadas, con el grueso de las resultados desplazado a hacia la mitad derecha.
Opciones de filtrado de la página de resultados

Las diferentes opciones de filtrado. Véase la forma del gráfico que, además de informar del período que cubren las publicaciones recuperadas, nos permite acotar por décadas.
Esta forma, desplazada a la derecha, y con una cola que se hace progresivamente pequeña a la izquierda, suele repetirse en las búsquedas lo que parece mostrar que el grueso de los documentos proceden de los últimos 100 o 150 años.
Registro

En la captura prcedente podemos ver las diferentes opciones para consultar el artículo completo y las de desplazamiento por su contenido.
Búsqueda de títulos de publicaciones

Una sección especialmente útil de PIO nos permite explorar la totalidad de las publicaciones por diferentes criterios, desde el más elemental: el título de la publicación, incluyendo la búsqueda por palabras clavem hasta otras opciones como el idioma o el tipo de fuente.
No obstante, encontramos a faltar una opción cronológica que permitiera explorar las publicaciones disponibles por años o por décadas.
Ficha de una publicación

Las fichas de las publicaciones incluyen datos catalográficos detallados sobre cada una de las cabeceras, incluyendo el dato del último número disponible.
Listado de títulos disponibles en un idioma determinado

Si filtramos por idiomas, por ejemplo, o por cualquier otro criterio, además de los datos que hemos visto antes, tenemos indicación sobre la existencia (o no) de los documentos completos de cada publicación.
Registro de un artículo

Finalmente, vemos la ficha o registro de un artículo concreto del que, en este caso, vemos por las diferentes pestañas, que disponemos del documento completo en dos formatos: facísimil y pdf.
Conclusiones
Aunque el número total de registros individuales es bastante alto (20 millones), se hace extraño trabajar con un sistema que reúne «solamente» 8000 títulos de revista. Suponemos además, que la incorporación de tales títulos responde a criterios de oportunidad, es decir, se catalogan e introducen aquellos que, por alguna razón, están más disponibles para la empresa productora, por lo cual la representatividad, necesariamente se resentirá para ciertos idiomas y temas.
Como sea, cuando se trabaja con una colección así, hay que dar por sentadas las limitaciones y aprovechar lo mejor de la misma para nuestros propósitos. Para el investigador al que esta base de datos proporcione acceso a colecciones y documentos que, de otro modo, no podría conseguir de ningún otro modo, simplemente no tiene precio.
En todo caso, hemos querido honrar con este análisis un proyecto peculiar, y seguramente imprescindible, que se centra en tres siglos de publicaciones, y que consiste en empezar en la era que se supone el inicio de la tendencia a la digitalización (entre finales de los noventa e inicios del 2000) para retroceder hasta el 1665 y, en medio de este amplio período tratar de recuperar todo lo posible.
Pruebas no sistemáticas indican, no obstante, que el grueso de los documentos (¿80-90%?) proceden de algún momento del siglo XIX en adelante. No hemos encontrado (o no hemos sabido encontrar) información concreta sobre este extremo, por tanto solamente es una estimación, y como tal está sujeta a error.
Como sea, no cabe duda de que, en casos concretos, será una herramienta no solo valiosa, sino simplemente imprescindible, como ya hemos señalado, para muchos investigadores.
Esperamos que el proyecto siga creciendo y que las colecciones se vuelvan más representativas, cada vez, respecto de idiomas, zonas geográficas y temas. Nuestro máximo reconocimiento a este interesante e intrínsecamente valioso proyecto para las Humanidades y las Ciencias Sociales que, como suele decirse, si no existiera, habría que inventarlo.
Nos autoemplazamos a revisar esta base de datos el próximo curso para constrastar sus avances.
Otros artículos de esta serie dedicada a bases de datos de prensa:
Si el amable lector o lectora no desea perder actualizaciones de esta entrada y otras novedades, puede suscribirse y recibir las entradas en su correo (ver el formulario en la zona inferior de la página)