Taxonomías y estructuras de navegación web · 1: Definiciones

Una clasificación o una taxonomía puede ser vista como un espacio virtual o real donde «colocar» cosas en recipientes físicos o conceptuales. Para que el símil funcione, debemos imaginar que cada recipiente de este espacio está identificado de forma individual, Fuente: Pixabay

Vamos a presentar en primer lugar un juego de definiciones alrededor de los conceptos de clasificación taxonomía para poder pasar después a examinar su implementación en estructuras de navegación web.

Utilizaremos el contexto de los sitios intensivos en contenidos, como el de un cibermedio, gestionado con un CMS como WordPress, eventualmente, con el concurso de determinadas extensiones de software (plugins).

Dado el contexto señalado, debemos intentar conciliar la teoría de los sistemas de organización del conocimiento, a su vez muy influenciada por las Ciencias de la Documentación (Information and Library Science) y el corpus de conocimiento sobre diseño de sitios web, a su vez inevitablemente influenciado por el Codex de WordPress y la disciplina de la Arquitectura de la Información.

Enfocado de este modo, los términos que necesitamos definir para poder operar después con ellos, son los siguientes:

Primera parte · Definiciones > esta entrada

  • Clasificación
    • Como actividad o categorización
    • Como instrumento o mapa
  • Categoría
  • Sistema de información
  • Recuperación de información
  • Término de indización
  • Taxonomías
    • Planas
    • Jerárquicas 
    • Extendidas

Una vez presentadas las definiciones precedentes nos ocuparemos en futuras entregas de las otras dos partes de esta serie:

Segunda parte · Edición y aplicación 

  • Componentes y aplicación
    • Entradas vs Páginas
    • Categorías
    • Etiquetas
  • Edición y mantenimiento de taxonomías
    • Principios generales
    • Edición de taxonomías en WordPress
    • Plugin Yoast SEO
  • Categorías y menús en medios de comunicación
    • Ilustración de casos

Tercera parte: Navegación web > próxima publicación

  • Sistema de menús
    • Menú principal
    • Menú secundario
    • Menús complementarios
    • Submenús
    • Menú desplegable 
    • Nube de etiquetas
  • Navegación semántica
    • Categorías y Etiquetas en Entradas
    • Contenidos relacionados
  • Estructuras de silo
    • Implementación con Categorías

Primera parte
DEFINICIONES


Clasificación como categorización o actividad y como mapa o instrumento

El término clasificación sirva para referirse tanto a una actividad como al instrumento que permite llevar a cabo.

  • Clasificación como actividad consiste en la acción de distribuir entidades de naturaleza homogénea al menos en algún sentido, entre diferentes categorías, con el objetivo de predecir su ubicación en el momento de su recuperación. Esta actividad u operación puede denominarse también categorización.

  • Clasificación como instrumento consiste en un conjunto previamente organizado de categorías. A su vez, este conjunto puede estar representado en la propia distribución de las entidades o en un documento que actúa como un mapa del conjunto de categorías, con el objetivo de garantizar la coherencia del sistema de información.

  • Categorización: al asignar cosas a categorías, la actividad correspondiente puede denominarse categorización, por lo cual este término es un sinónimo del primero. La eficiencia de la categorización queda garantizada si se dispone de un conjunto previo de tales categorías, lo que nos lleva a la segunda definición.

Por la definición precedentes y para fijar algunas ideas, vemos que una clasificación es, a la vez:

  • Una actividad, a la que podemos denominar categorización, y de este modo mejoramos la precisión del lenguaje y ya no resulta imprescindible utilizar el mismo término para dos cosas distintas.

  • Un instrumento, al que podemos reservar el término clasificación o al que podemos referirnos como mapa en caso necesario.

En una biblioteca, no importa lo grande que sea, podemos predecir la ubicación de un documento gracias a su sistema de clasificación. Biblioteca de la ciudad de Stutgard. Fuente: Pixabay

Obsérvese que en la definición de clasificación como actividad, o como categorización, hemos dicho que se trata de «distribuir entidades de naturaleza homogénea, al menos en algún sentido, …». El concepto de entidad se refiere a cualquier cosa que puede ser identificada de forma individual. Puede ser un libro o una página web, o cualquier clase de cosas con tal que, al menos, tengan una dimensión de homogenidad que permita su caracterización utilizando un grupo de categorías.

Por ejemplo, las publicaciones de un medio de comunicación, por muy distintas que sean, se pueden organizar en función de su alcance (nacional o internacional) o del tipo de actividad social afectada (economía, política, cultura..). Un conjunto de novelas, aunque sean muy distintas entre ellas, se pueden clasificar en función de los géneros literarios (aventura, ciencia ficción, bélico, etc.). Las páginas de un sitio se puede categorizar utilizando una o más clasificaciones en función del público, los contenidos, etc. del mismo.

Categorías y términos en un sistema de recuperación de información

La siguientes definiciones, una vez establecidas las mas importantes, las presentaremos en una tabla unificada utilizando la pareja definiendum/definiens

DefiniendumDefiniens
Categoría /
Categorización

Categoría: cada una de las clases o divisiones establecidas al clasificar algo (RAE). 

Desde el punto de vista lógico las categorías son clases. Las clases agrupan entidades que poseen una determinada propiedad. Así, la clase «países mediterráneos», agrupa los países a los que baña este mar.

Desde el punto de vista matemático una categoría corresponde a un conjunto.

Las categorías pueden tener subcategorías, en el mismo sentido que las clases pueden tener subclases y los conjuntos pueden tener subconjuntos.

La acción consistente en distribuir cosas en categorias se denomina categorización.

Sistema de 
información
Los sistema de información aceptan documentos y necesidades de información como entradas, y producen personas informadas como salida. Un sitio web con una adecuada estructura (o estructuras) de navegación puede comportarse como un sistema de información. En nuestro contexto, los documentos son páginas web u otros materiales documentales y las necesidades de información corresponden a las actividades de búsqueda de los usuarios en un sitio web.
Recuperación
de 

información
Una operación que consiste en obtener, de forma selectiva, una información determinada de entre un fondo documental.

Término

Un término es una palabra simple o compuesta que forma parte de una clasificación y que se utiliza para identificar conceptos de forma unívoca. En algunos contextos, se denominan etiquetas (labels o tags).  

Término de
indización o 
término
preferido

Cuando se selecciona uno entre diversos sinónimos candidatos para ser utilizado de forma preferida como término de una clasificación, se denomina término de indización o, por la razón indicada,  término preferido.
Término 
sinónimo
Un término que no se utiliza para categorizar contenidos pero que puede formar parte de una clasificación en un sistema de reenvios, se denomina término sinónimo o término no preferido. El término no preferido, o sinónimo, figura en la clasificación para reenviar al término preferido. Por ejemplo, en una clasificación determinada, el término «movimientos sísmicos» puede figurar solo para poder reenviar al término «terremotos» que es el debe utilizarse en una categorización llevada a cabo con esa clasficación.

Fuente: elaboración propia.
Bases conceptuales: corpus de conocimiento de la Semántica Documental y los Lenguajes Documentales.

La función principal de las Categorías en un sistema de información consiste en ordenar ítems de información (p.e. libros en una biblioteca y páginas en una web), pero esta función, a su vez, sería poco útil si no estuviera vinculada con una función de predicción.

Mediante esta función, no es necesario recorrer secuencialmente un espacio real o virtual para encontrar un ítem, sino que podemos predecir dónde va a estar.

En la redacción y gestión de entradas mediante WordPress, las taxonomías pueden ocupar un lugar central en el SEO de contenidos y en la Arquitectura de la Información. El café siempre es bienvenido, pero es opcional. Fuente: Pixabay

Taxonomías

Dado el lugar central que las taxonomías ocupan en las estructuras de navegación de sitios web, de hecho, el foco de nuestro interés, dedicamos un apartado específico para presentar a estas.

Taxonomía en el contexto general de la ciencia

  • Según la RAE: «Ciencia que trata de los principios, métodos y fines de la clasificación. Se aplica en particular, dentro de la biología, para la ordenación jerarquizada y sistemática, con sus nombres, de los grupos de animales y de vegetales». 

  • En segunda acepción, y esto es muy importante, la RAE señala que la palabra taxonomía es un sinónimo de clasificación

Es muy importante, como nos hemos preocupado de destacar en el cuadro precedente, tener en cuenta que una taxonomía es una clasificación de acuerdo con la RAE (y con el grueso de la disciplina de los Lenguajes Documentales).

Por tanto, todo lo señalado en relación con las categorías es aplicable a las taxonomías. La única razón para utilizar aquí, y en otros contextos, el término taxonomía (en lugar de clasificación) es de tipo pragmático. Ahora bien, la cuestión es que las razones pragmáticas nunca son triviales en la lengua. Utilizar el término adecuado en el contexto adecuado facilita la comunicación e incrementa la precisión.

Por otro lado, nos gusta insistir en que una taxonomía es una clasificación porque de este modo combatimos (o eso esperamos) el aire intimidante del término taxonomía. Si tenemos claro que una simple y familiar clasificación es una taxonomía, tal vez avancemos mucho.

Taxonomía en el Codex de WordPress y en el contexto de las estructuras de navegación web

De acuerdo con el Codex de WordPress una taxonomía es una forma de mantener cosas [similares] unidas. Siempre de acuerdo con el mismo, las taxonomías se componen de términos, y éstos pueden tener, o no, términos-hijos, según se trata de una taxonomía jerárquica o plana.

Como vemos, para un CMS (Content Management System) como WordPress, una taxonomía sirve para unir páginas web. Asignando una misma categoría a diferentes páginas, es posible unirlas a efectos de navegación y de recuperación de información.

Un término tratado por el tesauro de la Unesco, muestra el término preferido «Sistema económico» y, en este caso, dos tipos de asociaciones: la de jerarquía, al mostrar conceptos (más) específicos, y la de conceptos relacionados al mostrar términos que, aunque no tengan ninguna relación jerárquica ni de sinonimia, permanecen relacionados por alguna clase de vinculación semántica con el término tratado.

Teniendo en cuenta la definición del Codex, y su influencia en el ámbito del diseño de la navegación de los sitios web, pero considerando también lo que sabemos por las Ciencias de la Documentación, establecemos tres tipos de taxonomías,

  • Taxonomías planas o impropias. Los términos en una categoría plana no pueden tener términos-hijo o clases y subclases. Las denominamos impropias porque de acuerdo con la definición de clasificación, una taxonomía siempre debería poder tener jerarquías. No obstante, ya hemos dicho que asumimos el contexto del Codex de WordPress y de las estructuras de navegación web, lo que nos lleva a esta solución de tipo transaccional.

  • Taxonomías jerárquicas o propiamente dichas. Los términos pueden tener términos-hijo, términos-nieto, etc., por tanto, pueden tener clases y subclases. Son taxonomías propiamente dichas porque las clasificaciones implican siempre la posibilidad de relaciones o asociaciones jerárquicas.

  • Taxonomías extendidas o tesauros. Las taxonomías que incluyen otras asociaciones además de las de tipo jerárquico, como las de sinonimia y las de término relacionado, se denomina tesauros. Es el grado superior de estructuración al que puede aspirar una taxonomía. Los tesauros pueden ser utilizados también para ordenar la información en sitios web, no solo en estructuras de navegación, sino en operaciones de indización de documentos para su recuperación mediante operaciones de búsqueda.  No obstante, dada su limitada aplicación a las estructuras de navegación web, no nos ocuparemos de ellas en esta serie, sin perjuicio de volver sobre ellas en otros trabajos.

Las categorías de un sitio web deben servir para agrupar páginas que facilitan información sobre unos mismos temas, lo que conduce a taxonomías que no siempre mantienen un mismo eje. Por ejemplo, las de un museo deben incluir categorías sobre las visitas, la colección las actividades, etc., lo cual rompe la idea de una clasificación como un conjunto de clases organizadas bajo principios temáticos.

Mapa del Museo Picasso de Málaga formado por las principales categorías y subcategorías de su sistema de navegación.

Navegación principal del sitio The Conversation.

En cambio, las categorías de un sitio de comunicación, como The Conversation muestran que hay un principio unificador en sus categorías, a saber, los diferentes ámbito sociales sobre los que informan sus noticias, tales como el Arte, la Economía, etc.

Las taxonomías de WordPress

Nos centraremos a partir de ahora en los dos primeros tipos de taxonomías (planas y jerárquicas) ya que son los que contemplan la navegación web y CMS como WordPress.

La edición de taxonomías, Categorías en este caso, con WordPress

Taxonomías nativas de WordPress

EtiquetasLas Etiquetas son taxonomías planas puesto que no pueden tener términos-hijo (subetiquetas). Las Etiquetas pueden expresar mediante conjuntos de palabras clave los diferentes conceptos tratados en una Entrada a un nivel de especificidad, en principio, arbitrario. En el plano de su implementación, en cambio aparecen restricciones que serán tratadas en su momento.
CategoríasLas Categorías son taxonomías jerárquicas puesto que pueden tener términos-hijo (subcategorías). Se pueden utilizar para representar los conceptos principales abordados en una Entrada. En su implementación en estructuras de navegación suelen corresponder a las secciones temáticas principales de un sitio.  Las Categorías pueden tener subcategorías. 

En próximas entregas de esta serie trataremos la implementación de las taxonomías en Enytradas y el diseño de estructuras de navegación web. Presentaremos también una bibliografía básica sobre el tema en la última entrada. Puede suscribirse (ver al final de la navegación lateral de este sitio el formulario para ello) para recibir el aviso cuando se publiquen nuevas entradas.


ANEXO. Visiones complementarias

1. Las clasificaciones y taxonomías como sistemas de predicción

Las clasificaciones y, por tanto, las taxonomías son útiles en cualquier sistemas de información, ya sea en una biblioteca o en un sitio web, porque permiten predecir dónde encontrar el ítem deseado. Gracias a las clasificaciones no necesitamos explorar secuencialmente todas las estanterías de una biblioteca, sino que podemos ir directamente a la sección temática que corresponda mejor a la obra que buscamos. En en sitio web, la situación es idéntica. En lugar de intentar recorrer el conjunto de páginas del sitio, una a una, podemos predecir dónde se encuentra el contenido que buscamos usando las categorías de los menús.

2. Las clasificaciones y taxonomías como mapas

Un mapa es la representación a escala de un territorio o de un espacio físico o virtual. Una taxonomías ofrece la presentación a escala, por abstracción, de los contenidos de un sitio. Por tanto, podemos considerar que una taxonomía es una clase de mapa.

3. Clasificaciones y teoría de conjuntos

Una categoría corresponde, en una clasificación, a un conjunto en la teoría de conjuntos. Los ítems que han sido asignados a una categoría, corresponden a los elementos de un conjunto. Entonces, la pertenencia a tal conjunto es equivalente a tener asignada una determinada categoría. Lo mismo sucede tanto si nos referimos a categorías o taxones en sentido genérico como a las Categorías y Etiquetas en el contexto de WordPress. Desde el punto de vista lógico, asignar una Etiqueta o una Categoría a una página web, equivale al hecho de que tal página deviene un elemento del conjunto que identifica la Etiqueta o Categoría. Entonces, hay una relación de pertenencia y se puede decir que la página x pertenece al conjunto C. 


Para el lector interesado, las tres entradas son las siguientes:


Referencias

Las cuatro obras principales en las que nos hemos basado para las tres entradas precedentes son las siguientes:

  • John F. Sowa. «Chapter 2: Ontology». En: Knowledge Representation: Logical, Philosophical and Computational Foundations. Pacific Grove (California): Brooks/Cove, 2000.
  • Heather Hedden. The Accidental Taxonomist. Medford: Information Today, 2016.
  • Louis Rosenfeld, Peter Morville. Information Architecture: for the Web and Beyond. Sebastopol (Californdia): O’Reilly Media, 2015.
  • Mario Pérez-Montoro, Lluís CodinaNavigation Design and SEO for Content-Intensive Websites: A Guide for an Efficient Digital Communication. Oxford: Chandos Publishing-Elsevier, 2017 (ver reseña).
  • Rafael Pedraza-Jiménez, Lluís Codina, Javier Guallar. Calidad en sitios web
    Método de análisis general, e-commerce, imágenes, hemerotecas y turismo. Colección: EPI Scholar. Barcelona: UOC, 2016