Curación de contenidos con Google: Formulario de búsqueda avanzada y definición de alertas

Las alertas son una parte esencial de la curación de contenidos. En la imagen Google Alerts.
La nueva fórmula secreta que altos dirigentes de Naciones Unidas están poniendo a prueba para salvar al mundo: el sistema de alertas de Google.

Por una parte, en una serie sobre sistemas de información y curación de contenidos no podemos dejar de lado a Google, pero por otra, parece como si los seres humanos nacieran sabiendo ya utilizar este buscador. ¿Qué hacer?

La opción por la que nos inclinamos es revisar dos de sus mejores y quizás, paradójicamente, peor conocidas funciones, por lo cual los aspectos que abordaremos son los siguientes:

  • Uso adecuado del formulario de búsqueda avanzada
  • Configuración de alertas para monitorizar temas

De este modo, nos ocupamos, además de las dos funciones que son, con diferencia, las más útiles para periodistas y comunicadores, y por supuesto, para curadores de contenidos.

En esta entrada, nos centraremos en el que podemos llamar uso adecuado, que se opone al uso que podríamos llamar apañárselas. Los aspectos teórico-doctrinales sobre la responsabilidad social de comunicadores y periodistas a la hora de saber utilizar sistemas de información, los dejamos para otra ocasión, mientras que los aspectos lógico-formales detrás de la búsqueda avanzada, se pueden consultar aquí

Cómo utilizar la búsqueda avanzada en Google


Acceso al formulario de búsqueda avanzada

  • Por URL
     https://www.google.es/advanced_search
  • Por navegación: en la página de Google, hacer clic en Configuración, en las opciones que aparecen situadas abajo y a la derecha, como muestra la captura, y hacer clic en Búsqueda avanzada.
Búsqueda avanzada de Google. Uno de los instrumentos de curación de contenidos examinados.
Se puede acceder al formulario de búsqueda avanzada mediante las opciones de Configuración.

A partir de aquí, accederemos al formulario de búsqueda avanzada, que presenta dos partes bien identificadas, cada una de ellas rotulada con una frase:

  1. Buscar páginas con…
  2. A continuación, limitar los resultados por… 
Búsqueda avanzada mediante formulario
El formulario de búsqueda avanzada de Google mostrado de forma compeleta con sus dos partes bien diferenciadas.

Parte superior (Buscar páginas con…) – Búsqueda booleana

Las búsquedas booleanas sirven, entre otras cosas, para expresar la intersección lógica de conceptos. Para ilustrar su uso, vamos a suponer que necesitamos diseñar una curación de contenidos con el fin de monitorizar el tema de la realidad virtual aplicada a la comunicación

Esto significa que estamos interesados en la intersección de dos ámbitos independientes: (1) realidad virtual y (2) comunicación. Sigamos suponiendo que entendemos que comunicación a los efectos que nos interesan equivale a los conceptos de periodismo y de televisión.

Óbviamente, no se trata de sinónimos, pero nosotros, a efectos de búsqueda, los vamos a tratar como si lo fueran, en el sentido de que nos interesa tanto uno como otro concepto. Para expresar esta relación de unión o suma lógica también podemos utilizar operadores booleanos.

Entonces, la intersección entre el concepto 1 “realidad virtual” y el concepto 2 “comunicación”, quedaría de esta manera:

  • El concepto 1 lo vamos a expresar con la frase literal realidad virtual
  • El concepto 2 lo vamos a expresar con las palabras clave periodismo, televisión

En la captura siguiente se ilustra la forma de preparar esta consulta:

Búsqueda booleana con Google

Como vemos, hemos distribuido las palabras clave de este modo:

  • En el apartado esta palabra o frase exactas hemos entrado el primer concepto, formado por una expresión compuesta (realidad virtual), lo que equivale a una frase.
  • En el apartado cualquiera de estas palabras hemos entrado las dos palabras (periodismo, televisión) que para nosotros actúan como si fueran sinónimos. No aparece de forma explícita, pero la relación entre estos dos términos es la suma lógica (OR).
  • No aparece de forma explícita, pero la relación entre la primera fila y la segunda fila es la de intersección (AND).

La ecuación de búsqueda

Al hacer clic en el botón de búsqueda, Google genera la siguiente ecuación:

Cuando lanzamos la consulta desde el formulario, Google genera una ecuación de búsqueda

Vamos a revisar la ecuación que Google ha generado a partir de los datos del formulario:

periodismo OR televisión AND “realidad virtual”

Un espacio en blanco entre palabras clave equivale para Google al operador AND, razón por la cual nosotros lo hemos añadido en la versión precedente para que resulte más claro.

Esta ecuación, si se tratase de una instrucción a un ser humano (y no a un robot) diría lo siguiente:

“Necesito información sobre periodismo o sobre televisión, siempre que tenga relación con la realidad virtual”

La instrucción anterior supone que: (1) páginas que tratan la realidad virtual solamente en relación con la televisión, (2) páginas que tratan la realidad virtual solamente en relación al periodismo, y (3) aquellas que tratan la realidad virtual tanto con el periodismo como con la televisión, serán consideradas (todas ellas) relevantes.

La página de resultados

Primera prágina de resultados de la búsqueda sobre realidad virtual aplicada a la comunicación

En la captura, vemos los primeros resultados de la búsqueda. Hemos destacado algunos de los resultados solamente para mostrar que de no haber utilizado sinónimos (funcionales) podríamos haber perdido información.

Vemos concretamente, que todas las páginas tratan de realidad virtual, pero algunas solo de periodismo, otras solo de vídeo o televisión y algunas de ambos. Que es justo lo que pretendíamos con nuestra ecuación de búsqueda.

Lo que nunca hay que hacer

Una vez que hemos visto como actúa el formulario, volveremos al mismo, pero ahora para considerar lo que no tenemos que hacer. Si observamos el texto de ayuda al lado de cada opción del formulario encontramos esto:

Probablemente, la ayuda más desafortunada de la historia de la informática

Se da la circunstancia de que lo que nunca debemos hacer es proceder como propone la ayuda, porque estos consejos son, precisamente, para el caso de no usar el formulario de búsqueda. Es decir, son orientaciones si queremos usar la caja de búsqueda simple para hacer búsquedas avanzadas. Pero no debemos usarlas en el formulario.

En cambio, si usamos la caja de búsqueda simple esas informaciones  serían correctas, y deberíamos escribir así nuestra ecuación (obsérvese que estamos usando la página de búsqueda simple):

Una búsqueda avanzada expresada de forma directa sin uso de formulario, mediante comillas y el operador OR.

En resumen: en el formulario nunca hay que usar símbolos, ni las comillas ni el operador OR, porque los añade Google, con lo cual, aparecería todo repetido, las comillas y el operador OR. Haga la prueba el lector.

La única forma correcta de hacer la misma búsqueda que hemos mostramos en la caja de búsqueda simple, pero usando el formulario, es la que hemos mostrado en la captura superior, donde se puede ver que no hemos usado ni comillas ni el operador OR. Por si acaso, repetimos la parte esencial de la captura:

Forma correcta de usar el formulario: sin comillas y sin el operador (lo añadirá Google al lanzar la búsqueda)

Una vez aclarado esto, pasemos a examinar la segunda sección del formulario de búsqueda avanzada.

Parte inferior (A continuación, limitar los resultados por…) – Búsqueda parametrizada

Vamos a ver ahora que la forma más potente de usar el formulario de búsqueda avanzada es combinando la búsqueda booleana de la primera parte del mismo, con esta segunda parte:

La segunda parte del formulario permite combinar búsquedas booleanas con búsquedas parametrizadas

La idea de que lo más útil consiste en usar primero palabras clave, en la parte superior del formulario para luego parametrizar o enfocar la búsqueda con la parte inferior viene sugerida por Google con la frase que encabeza esta parte: A continuación, limitar los resultados por…

En este caso, creemos que los cinco parámetros que más ayuda pueden proporcionar a un periodista para filtrar información son los siguientes

  • Informaciones publicadas a partir de una fecha determinada, por ejemplo, para segurarse de obtener informacione recientes, o todo o contrario, para recuperar los antecedentes de un tema, o para verificación, etc.
  • Informaciones publicadas en un sitio o dominio determinado, para conocer de forma precisa qué  informaciones ha publicado un determinado organismo, o para filtrar las fuentes y el origen de la información.
  • Lugar de la página donde aparece la palabra clave, por ejemplo, para asegurarse que las palabras clave aparecen en el título, con lo cual incrementamos la relevancia de forma radical.
  • Tipo de archivo, por ejemplo, para buscar hojas de cálculo (periodismo de datos) o documentos en pdf, con lo cual se incrementa la calidad, etc.
  • Tipo de licencia de uso, por ejemplo para buscar imágenes con licencia de uso libre, etc.

Vamos a verlo con un ejemplo:

Uso del formulario para seleccionar dos características de la búsqueda parametrizada que añaden mucha precisión y calidad en los resultados.

La ecuación de búsqueda resultante

La ecuación de búsqueda, con palabras clave y los parámetros de título y tipo de documento, tal como la genera Google

Lo que vemos en la captura precedente es la ecuación que ha generado Google como consecuencia de interpretar los datos que hemos entrado en el formulario. 

Esta ecuación es una linea de texto, por tanto, podemos seleccionarla y copiarla para después pegarla donde nos convenga, por ejemplo, para la creación de una alerta, aunque esto lo veremos después. Ahora vamos a seguir examinando el efecto de aplicar esta ecuación.

Y ahora, el resultado:

Hemos conseguido reducir un resultado que antes nos arrojaba varias decenas de miles de documentos, a ¡9 documentos!, todos de una relevancia enorme.

La captura anterior muestra el resultado de haber combinado búsqueda booleana con búsqueda parametrizada. En concreto, hemos conseguido 9 documentos con una relevancia total. Cero ruido, y mucha precisión.

Variación seleccionando sitios académicos

Ahora, vamos a probar una variación muy potente. Vamos a repetir las misma búsqueda, pero en este caso, en la zona de parámetros vamos a selección sitios de tipo académico-científico, poniendo en el campo correspondiente que queremos limitar los resultados a sitios del tipo .edu. También limitaremos la búsqueda a documentos en los que las palabras clave aparezcan en el título. Veamos:

Y ahora, el nuevo resultado

Parte de la extremadamente relevante página de resultados que podemos obtener limitando la búsqueda al título y a sitios académicos (sitios .edu)

Buscar información sobre un tema publicada por un organismo determinado

Una variante sumamente interesante del parámetro que permite limitar las búsquedas por dominio es la consiste en hacer con lo mismo, pero con sitios concretos.

Por ejemplo, podemos lanzar una búsqueda por determinados temas y limitarla al sitio, por decir algo, de las Naciones Unidas, de un partido político, de una multinacional, de un ministerio o de un gobierno, etc.

En el siguiente ejemplo, vamos a lanzar una búsqueda por el tema de ayudas y subvenciones al cine, pero queremos limitar la búsqueda al sitio web del Ministerio de Cultura, porque se supone que queremos revisar las políticas del Ministerio y necesitamos una precisión total:

  • Lo primero que debemos hacer es identificar la URL exacta del sitio al que queremos limitar las búsquedas. En este caso, con una simple búsqueda previa podemos ver que es http://www.mecd.gob.es
  • A continuación, preparamos la búsqueda según muestra la captura siguiente:
Búsqueda avanzada para encontrar información publicada en un sitio concreto.

La ecuación de búsqueda tal como la ha generado Google

Una ecuación de búsqueda que incluye un filtro por un dominio concreto

En la siguiente captura vemos algunos de los primeros resultados.

Y de nuevo, el resultado

El resultado de la búsqueda lanzada contra un dominio completo.

La captura precedente muestra la enorme relevancia de los resultados encontrados. Esta clase de búsquedas tienen sentido por igual para conseguir documentación sobre un tema para poderlo tratar con mejor conocimiento, como para periodismo de datos y periodismo de investigación.

Concretamente, el examen de los documentos obtenidos así nos puede ayudar a entender mejor las convocatorias, identificar actores, organismos y fuentes para contactar, así como extraer toda clase de informaciones cualitativas, pero también podemos extraer datos numéricos y trabajar el tema de forma cuantitativa. Estos nos permitiría trabajar posibles temas para periodismo de datos, periodismo de investigación, etc.

Contra lo que pueda parecer, suele resultar incomparablemente más útil utilizar el filtro por dominios de Google que utilizar los buscadores internos de los propios sitios, suponiendo que existan. En ocasiones, por propia experiencia, puedo decir que resulta más certero utilizar esta posibilidad de Google para encontrar noticias publicadas por un medio, que utilizar la propia hemeroteca digital del medio. 

La base para las alertas

Armados con un cierto conocimiento de las búsquedas avanzadas, podemos ya entrar en la segunda de las mejores funciones de Google, la definición de alertas para monitorizar temas. Como veremos, es imprescindible conocer bien primero la búsqueda avanzada para poder aprovechar esta segunda herramienta.

Google Alertas


Las alertas o sistemas de difusión selectiva de la información son esenciales para la curación de contenidos. En la captura, Alertas de Google.
La página de inicio de Google Alertas con algunas sugerencias de monitorización de temas basados en ejemplos de marcas y grupos musicales

Acceso

Una alerta, en este contexto, es una búsqueda predefinida que un sistema de información como Google lanza de forma periódica y automática, y cuyo resultado nos hace llegar por correo.

En su momento, esta técnica de documentación recibió el nombre de difusión selectiva de la información. Otra denominación más imaginativa es la de búsquedas al futuro, porque nos permte definir hoy lo que queremos encontrar en el futuro.

Como sea, es fácil ver que se trata de la manera perfecta de monitorizar un tema, por tanto, debería ser uno de los instrumentos preferidos de curadores de contenidos y de periodistas temáticos.

Lo que no tenemos que hacer

La página principal de Google Alertas nos anima, nada más acceder, a crear una alerta mediante el mensaje que aparece en la caja de búsqueda:

Pero, como en el caso anterior, esto es justo lo que no tenemos que hacer. La simple razón es que, si entramos palabras clave, sin más y creamos así la alerta, perdemos la capacidad de crear una alerta que nos pueda ser realmente útil.

En lugar de proceder así, lo lógica es usar primero la búsqueda avanzada de Google, preferentemente con el formulario (a menos que tengamos un buen conocimiento de los operadores y del lenguaje de búsquedas de Google)  y, una vez hemos comprobado que una determinado búsqueda funciona, entonces podemos copiar la ecuación de búsqueda que Google genera y pegarla en la caja correspondiente de Google Alertas. Y esta es la forma adecuada de crear una alerta.

Vamos a verlo por pasos:

1. Dejamos de momento Google Alerts y en su lugar, volvemos a Google para poder utilizar el formulario de Google y preparamos una búsqueda. Para el tema que queremos monitorizar, a saber, la realidad virtual y la comunicación social, nos podría convenir la misma búsqueda de antes, que por facilidad volvemos a reproducir:

La búsqueda en el formulario de Google.

2. Lanzamos la búsqueda y chequeamos los primeros resultados, para comprobar que genera resultados relevantes. S es así, procedemos a copiar la ecuación de búsqueda que ha generado Google y que siempre tenemos en la cabecera de la página de resultados:

La ecuación de búsqueda generada por Google tras usar el formulario y lanzar una búsqueda

3. La cadena de caracteres que hemos copiado la pegamos, ahora sí, en Google Alertas y configuramos el resto de opciones:

Creación de una alerta, tras copiar y pegar la ecuación de búsqueda que hemos generado previamente.

A partir de ahora, con la periodicidad que hayamos marcado, recibiremos en el correo electrónico que hayamos indicado, las nuevas páginas web (o los documentos de otro tipo) que Google encuentre en futuros rastreos de la web.

Naturalmente, si estamos muy familiarizados con la sintaxis de búsqueda de Google no necesitamos usar el formulario, podemos formular la ecuación directamente, pero de todos modos es importante primero poner a prueba su eficacia.

Como sea, solamente nos quedará esperar a los correos que, por ejemplo, una vez a la semana recibiremos de Google con las novedades en el tema de la alerta. Cabe señalar que solo tendremos tales correos si la búsqueda genera resultados nuevos. Esto es, es posible que recibamos novedades cada semana, si el tema genera mucha producción de páginas web, o por el contrario, que puede suceder que algunas semanas no recibamos ningún correo.

Edición de alertas

Páginas de edición de alertas

A partir de ahora, siempre podremos volver a nuestra página de Google Aletas y editar o eliminar alertas y, por supuesto, crear nuevas.

Conclusiones

Hemos visto algunas posibilidades de la búsqueda avanzada de Google mediante el uso de su formulario. Aunque usar el formulario tiene algunas limitaciones, es una manera segura y fácil de usar los operadores de búsqueda y otros recursos técnicos sin necesidad de aprender la sintaxis ni memorizar comandos. 

Hemos visto que podemos usar las ecuaciones de búsqueda de forma directa si llegado un momento tenemos suficiente familiaridad con el sistema, aunque Google no lo pone fácil precisamente, porque no hay ninguna página oficial donde explique la totalidad de los operadores y otros recursos. No obstante, lo cierto es que hay, en cambio, bastantes páginas no oficiales que los explican, con algunos errores, todo hay que decirlo.

Hemos visto también que Google pone a nuestra disposición una valiosa herramienta, Alertas, para que podamos automatizar la monitorización de temas sin necesidad de llevar a cabo la misma búsqueda de forma recurrente. Al contrario, gracias a la posibilidad de definir alertas, vamos a recibir puntualmente en nuestro correo las novedades del tema que monitorizamos de forma automática.

Para saber más