
Introducción
Periodistas y comunicadores necesitan conocer lo mejor posible la naturaleza del medio donde desarrollan buena parte de su actividad. Este medio es Internet, la Web o el ecosistema digital, como queramos llamarle.
En el caso de la comunicación social, periodistas y profesionales de la comunicación audiovisual comparten la doble necesidad de saber utilizar los sistemas de búsqueda en la web y de evaluar la calidad de los páginas o sitios encontrados en sus actividades de búsqueda.
Para los profesionales intensivos en información, como lo son periodistas y comunicadores del audiovisual, es imperativo saber resolver sus necesidades de información de forma profesional y eficiente.
Además, buena parte de estos profesionales van a tener la necesidad de llevar a cabo algún tipo de emprendimiento en el mundo digital, lo que conlleva también la de conocer al menos los fundamentos del posicionamiento web, también denominado SEO.
En esta obra, llevada a cabo con objetivos claramente docentes, se introduce a los estudiantes de Periodismo y de Comunicación Audiovisual en los fundamentos de la búsqueda en Internet, se presenta una primera introducción al posicionamiento web y por último se ofrecen nociones sobre evaluación de sitios web.
Los diferentes
apartados van acompañados de Actividades cuyo buen desempeño proporcionarán al
estudiante una base sólida de aprendizaje de las tres materias de las que este
documento pretende ser una introducción para posteriores desarrollos.
Búsqueda
Antes de introducirnos en el uso efectivo de los buscadores debemos considerar cómo funcionan y cuál es la anatomía de un buscador. El objetivo es tener un grado de comprensión de su naturaleza, aunque sea a mil metros de altura, que nos ayude a utilizarlos mejor. En realidad, es difícil imaginar el papel de los medios actualmente sin su relación con los buscadores. Conocerlos mejor nos ayudará no solamente a ser más eficientes encontrando información para nuestro trabajo como periodistas o comunicadores, sino también a que nuestras producciones periodísticas tengan mayor visibilidad en la web.
La cuestión es que los motores de búsqueda son los más importantes sistemas de información de nuestro tiempo. Forman parte del paisaje de Internet de una manera que parece definitiva. Nadie imagina hoy la posibilidad de explotar la inmensa riqueza de la Web sin el auxilio de los motores de búsqueda cuyas funciones no han dejado ni de aumentar ni de experimentar cambios desde su temprana aparición en los años 90.
Sistemas de información documental
Una forma que puede resultar útil para concebir a los buscadores consiste en considerarlos como una clase de sistema de información documental. El calificativo documental se refiere a que buscan y analizan informan registrada en documentos, esto es, en páginas web, por ejemplo.
Los sistemas de información documentales se pueden representar con el diagrama (Ilustración 1) que mostramos a continuación:

Podemos ver que un sistema documental (tal como un buscador) acepta dos clases de entradas: Documentos y Necesidades de Información. Los documentos en nuestro caso son páginas web (pero no únicamente, ya que los servidores web incluyen también documentos en pdf u otros formatos) y las necesidades de información son las palabras clave o preguntas de los usuarios.
En un buscador, la salida del sistema es una lista de enlaces a sitios web que, presumiblemente, contienen información capaz de satisfacer las necesidades de información del usuario, de aquí que la salida se rotule con el (optimista) texto de Personas informadas. En nuestro caso, Periodistas Informados.
Naturalmente, si la primera consulta no da buenos resultados, lo lógico es que el usuario (el periodista, p.e.) haga algún intento más. Esto queda representado por la elipse rotulada con la palabra Control. Es decir, se supone que el usuario examina la relevancia de los resultados y si no le satisfacen, reitera la pregunta usando otros términos o parametrizando la consulta mediante la búsqueda avanzada.
Estructura de un motor de búsqueda
Un buscador consiste en un conjunto de programas que trabajan en cooperación. Estos programas se pueden distribuir en dos grupos principales:
- Sistema de exploración, también llamado Rastreador (spyder o crawler)
- Sistema de recuperación de información (information retrieval system)
Cada uno de estos sistemas se compone de otros subsistemas (Ilustración 2):

Rastreador
El rastreador, o sistema de exploración tiene la misión de descubrir y descargar páginas web y otros documentos de Internet. Para ello, parte de una lista inicial de URL o direcciones de páginas web (1). A partir de ella accede a documentos (2) publicados en la web. Descarga esos documentos, en su mayoría páginas web, pero también documentos ofimáticos, presentaciones, archivos de imágenes, etc. en el almacén o repositorio de documentos del Buscador (3). A partir de las páginas descargadas, el rastreador obtiene nuevas URL (4) que añade a su lista de URL pendientes de analizar (5). Cuando producimos una página web nueva, nuestra esperanza es que los Buscador la detecten y la indicen. Pero no tenemos porqué esperar a que esto suceda. Podemos tomar la iniciativa y avisar a los Buscador, y en particular a Google de que tal página existe y conseguir así que la incluya en sus índices.
(…)
Acceso al documento completo
· Ficha en el Repositorio de la UPF