martes, 31 de mayo de 2022

Elaboración de Tesauros

 

Consideraciones previas

 

Para la elaboración de un thesaurus contamos en la actualidad con la inestimable ayuda de la informática, que simplifica el trabajo y ahorra tiempo al autor y a su equipo. Por fortuna, existen en el mercado programas específicos para la construcción y manejo de términos de un thesaurus.

 

El primer paso para la elaboración de un thesaurus consiste en comprobar la existencia de otros en el mismo campo.

 

Si ya existe uno, habrá que valorar si nos puede ayudar, y en ese caso adaptarlo a nuestras necesidades. En caso de que dicho thesaurus esté en otro idioma, además habrá que traducirlo.

 

Pasos

 

Para adaptar o fabricar un thesaurus nuevo, hay que seguir unos pasos, que son los siguientes:

1.    Delimitar los temas de trabajo: aunque cada centro de documentación esté centrado en un tema especializado, siempre existen ramificaciones y conexiones con otros temas que deberemos tener en cuenta. Son los llamados temas marginales. Asimismo, hay que plantearse el grado de precisión con el que se desee trabajar.

2.    Recopilar términos: elaborar una lista de las palabras más utilizadas y significativas en ese campo, anotando la frecuencia de aparición de cada término. Estas palabras pueden extraerse de distintas fuentes, tales como: diccionarios, léxicos especializados, enciclopedias, bases de datos, libros, consultas de usuarios, estrategias de búsqueda realizadas, etc.


A la hora de escoger de entre toda la lista de candidatos los términos que serán descriptores, deben escogerse los más usados en el ámbito de que se trate y los más actuales. Se utilizará la forma sustantiva y la ortografía más admitida, se diferenciarán los descriptores del resto de términos mediante tipografía negrita o mayúscula, los nombres contables irán normalmente en plural y los incontables en singular y se evitarán las abreviaturas, siglas y signos de puntuación.

3.    Crear relaciones: el siguiente paso para la elaboración de un thesaurus es establecer las relaciones entre los términos. En la práctica, esta tarea y la anterior pueden ser simultáneas. Como hemos visto, las relaciones entre los términos pueden ser de equivalencia, de jerarquía y de asociación.

 

 

 

 

 

 

 

 

4.    Comprobar el funcionamiento: una vez que hemos organizado los descriptores, los no descriptores y las relaciones entre ellos, hay que hacer pruebas para probar la eficacia del lenguaje, ya sea con situaciones reales o ficticias. Es más operativo ir haciendo pruebas a lo largo del proceso de elaboración, según se van cubriendo campos temáticos, para detectar errores a tiempo. El objetivo de estos ensayos es comprobar que la estructura planteada responde a las necesidades del centro donde se va a utilizar, que los descriptores son útiles y representan verdaderamente el concepto que se proponen y que las relaciones establecidas son suficientes y funcionan correctamente.


Los cambios y ajustes realizados durante esta fase de la elaboración no serán los únicos que se le hagan al thesaurus. Éste debe ser revisado a lo largo de toda su vida y será objeto de actualizaciones cuando se considere conveniente, sin periodicidad fija.

 

jueves, 26 de mayo de 2022

Elementos del Tesauro

 

Descriptores y No descriptores


Las unidades léxicas más importantes que componen un thesaurus son los descriptores.

El descriptor o término preferente es la palabra o palabras escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedades una noción determinada.

 

Por tanto, los términos no preferentes, es decir, los no elegidos como descriptores se llaman no descriptores.

 

Desde el punto de vista sintáctico, un descriptor es simple cuando está formado por una sola palabra, y compuesto cuando está formado por más de una palabra. Los descriptores compuestos se dan cuando es necesaria la representación de un concepto mediante un sintagma de varias palabras para no perder su significado.

 

En cuanto a su tipología, los descriptores son en su mayoría temáticos, aunque también pueden encontrarse descriptores onomásticos, geográficos y cronológicos.

 

ESTRUCTURA

 

Los tesauros pueden presentar sus términos y las relaciones entre estos de diversas maneras. De hecho, normalmente coexisten varias presentaciones dentro del mismo thesaurus.


Exponemos a continuación los más comunes:

 

-       ÍNDICE ALFABÉTICO: es la parte más importante y puede constituir por sí sola todo el thesaurus. Contiene los descriptores y no descriptores ordenados de forma alfabética, acompañados cada uno de los términos con los que están relacionados. Estas relaciones semánticas entre los términos es lo que distingue a un thesaurus de un glosario o de un léxico.

Las Relaciones entre los términos pueden ser:

o    Relaciones de equivalencia: controlan la sinonimia del lenguaje natural. Todos los términos equivalentes (no descriptores) apuntan al descriptor correspondiente mediante la notación USE. El descriptor muestra a su vez cuáles son sus sinónimos o cuasisinónimos mediante la expresión UP (usado por).

o    Relaciones de jerarquía: expresan la relación de superioridad o inferioridad semántica entre los conceptos mediante las expresiones TG (término genérico) y TE (término específico).

o    Relaciones de asociación: la relación entre los términos es recíproca, los descriptores aparecen asociados porque las materias que representan están ligadas conceptualmente de alguna manera. La relación se expresa mediante la expresión TR (término relacionado).

Además de estas expresiones, existe la notación NA, que significa nota de alcance y sirve para aclarar o precisar el uso de un término en un contexto determinado.


Todos estas abreviaturas pueden encontrarse en inglés en multitud de tesauros, por lo que hay que conocer ambas para manejar con soltura diferentes herramientas (BT, NT, RT, SN…)

-       ÍNDICE SISTEMÁTICO: contiene los descriptores estructurados en función de las jerarquías establecidas en el tesauro. Ofrece las “familias” de términos, lo que facilita la obtención de una visión de conjunto de la información que contiene el tesauro, al poder observar los descriptores rodeados de sus conceptos más próximos.

 
El término con una carga semántica más amplia dentro de cada familia de términos se llama macrodescriptor, pero no tiene categoría de descriptor. Cada uno de estos macrodescriptores y su descendencia conforma un microthesaurus.

-       PRESENTACIÓN GRÁFICA: las tres formas más características de la presentación gráfica son:

 

-       Diagramas arborescentes.

-       Diagramas de flechas.

-       Terminogramas.

Cabe decir que este tipo de ordenaciones gráficas son muy laboriosas y su utilidad esta bastante cuestionada hoy por hoy, por lo que han comenzado a desaparecer.

-       ÍNDICE PERMUTADO: Además de las formas de presentación analizadas anteriormente, el tesauro suele traer un índice permutado o índice KWIC. Este recoge los descriptores y no descriptores ordenados alfabéticamente, aunque su particularidad  reside en que recoge también todos los elementos de los términos compuestos, para facilitar la búsqueda por la segunda parte de cualquier sintagma. Los descriptores sintagmáticos y no sintagmáticos se encuentran en este índice tantas veces como términos los componen.

-       INTRODUCCIÓN: Además de estas presentaciones que un thesaurus puede traer, nos gustaría mencionar la importancia de la introducción en este tipo de obras. En ella se explica el objetivo y la estructura del thesaurus, así como la autoría, el campo semántico que abarca, los idiomas, el número de términos, la metodología empleada para su recopilación, las instrucciones de uso, las previsiones de actualización, etc.

 

-       Por último en cuanto a la presentación, comentamos que los tesauros se han manejado tradicionalmente en soporte papel, aunque hoy en día resulta también habitual trabajar con tesauros en línea. De hecho, muchas Bases de Datos comerciales traen incorporado su propio thesaurus para facilitar las búsquedas.

 

martes, 24 de mayo de 2022

Concepto de Tesauro

 

DEFINICIÓN ISO

 

La norma ISO dice que un thesaurus se puede definir según su función y según su estructura.


Desde el punto de vista de su función, un thesaurus es un instrumento de control de la terminología utilizado para trasladar a un lenguaje más estricto (lenguaje documental) el lenguaje natural utilizado en los documentos.

 

Desde el punto de vista de su estructura, un thesaurus es un vocabulario controlado y dinámico de términos que tienen entre sí relaciones semánticas y genéricas, y que se aplica a un campo particular del conocimiento.

 

La indización

 

En un centro de documentación, el thesaurus es el instrumento básico de trabajo para realizar la indización.

 
La indización es la operación documental que se encuadra dentro del análisis de contenido de los documentos y que sirve por una parte para  describir el contenido intelectual de dichos documentos y por otra  posibilita la recuperación de información mediante el empleo de una serie de términos normalizados.

 

 

 

Las tres operaciones documentales básicas para el análisis de contenido de los documentos son la clasificación, la indización y el resumen. El documentalista hace uso de los llamados lenguajes documentales para clasificar y para indizar. El lenguaje documental que emplea el indizador durante el tratamiento documental está contenido en el thesaurus. Este mismo lenguaje será el que utilice a su vez el usuario para describir sus necesidades de información y realizar sus búsquedas documentales.


Por tanto, el thesaurus sirve de puente entre el documento y el usuario, donde el documentalista tiene el papel clave.

 

CARACTERÍSTICAS

 

Un thesaurus se caracteriza por ser un lenguaje documental controlado y de estructura combinatoria. Esto quiere decir que los términos se relacionan entre sí, dando lugar a multiplicidad de combinaciones, lo que otorga a este lenguaje gran flexibilidad.

 

Además, es un lenguaje postcoordinado, en el que los términos se combinan entre sí durante la búsqueda o recuperación de la información y no antes. Otros rasgos a reseñar son su carácter especializado, su alto control terminológico y su facilidad de revisión y puesta al día.

El thesaurus se presenta como una lista de palabras que conducen al uso del léxico apropiado para describir con precisión el contenido de los documentos. Muestra además los reenvíos necesarios desde las palabras que no deben usarse hacia los términos válidos. La filosofía del thesaurus es huir de la riqueza del lenguaje natural y de todos los fenómenos lingüísticos que se dan con él, como la sinonimia, la polisemia, la redundancia y la ambigüedad.

 

TIPOS

 

Existen tesauros de muchos tipos, atendiendo a gran variedad de criterios. Citamos brevemente algunos:

-       Según su ámbito, pueden ser: institucionales, públicos, nacionales, internacionales.

-       Según su contenido, pueden ser: monodisciplinares, multidisciplinares.

-       Según su lengua, pueden ser: monolingües, bilingües, multilingües.


2. ELEMENTOS

jueves, 19 de mayo de 2022

Diferencias y semejanzas de los lenguajes documentales

-       El lenguaje documental que se emplea tanto en el thesaurus como en las listas de encabezamientos es de estructura combinatoria. Esto quiere decir que los términos se relacionan unos con otros, permitiendo cantidad de combinaciones entre ellos, lo que otorga al dicho lenguaje gran flexibilidad en la recuperación de información.

 

-       Sin embargo, la coordinación de los términos varía en el thesaurus y en la lista: los lenguajes documentales orientados a la clasificación, es decir, el lenguaje usado en la lista, es precoordinado, lo que quiere decir que los términos se combinan con anterioridad al tratamiento documental.

Por otro lado, los lenguajes documentales orientados a la indización, es decir, el lenguaje usado en el thesaurus, es poostcoodinado, lo que quiere decir que los términos se combinan en el momento de la búsqueda o de la recuperación de información.

-       Aunque la finalidad común de los descriptores y de los encabezamientos de materia es proporcionar puntos de acceso temáticos al documento, éstos figuran en fuentes secundarias diferentes: los encabezamientos de materia, en caso de aparecer, forman parte de los registros bibliográficos que componen el Catálogo, mientras que los descriptores aparecen generalmente como un campo de la Base de Datos que corresponda.

-       Los descriptores son en general menos complejos que los encabezamientos y son más abundantes a la hora de describir el contenido de un documento. Tienen más movilidad entre sí, al no existir un orden prefijado de antemano.

Los descriptores pertenecen a un lenguaje especializado y/o técnico, y necesitan de una sintaxis más rica para su enlace. De hecho, la diferencia radical que marca el thesaurus es su sistematización jerárquica, aunque bien es verdad que las listas de encabezamientos muestran vagos intentos de establecer escalas semánticas.

-       Debilidades del Thesaurus: Otro rasgo del thesaurus, es que en la práctica, para indizar convenientemente, hay que conocer muy bien la herramienta de trabajo. Tanto es así que, ni aun conociendo el thesaurus en profundidad, es fácil lograr una uniformidad de criterios entre los documentalistas de un mismo centro de trabajo. Esto se debe a la subjetividad que conlleva toda tarea intelectual, que en ocasiones hace que, un mismo documentalista pudiera utilizar unos términos u otros semejantes para la descripción del mismo documento, según el día.

 

 

 

 

  

martes, 17 de mayo de 2022

por qué fotos

Las fotos son la prueba de que hemos hecho o visto algo. Permiten proporcionar un elemento visual de cualquier cosa en la que estemos trabajando.

 

El sitio en el que publiquemos las fotos determinará quien podrá verlas. Picassa es el sitio web especializado en compartir fotografías. Picassa ofrece a los usuarios 1024 MB de almacenamiento. Picassa permite insertar fotografías dentro de los post.

 

Flickr es otro centro para compartir información. Es una comunidad online para compartir fotos. Flickr tiene una función de búsqueda extraordinaria que hace que las fotos sean fáciles de localizar. Podemos acceder a fotos y vídeos de Flickr sin necesidad de tener una cuenta, pero si necesitamos una para subir fotografías. Photobucket e Instagram son otros almacenes de fotos. En Facebook también se comparten fotos.

 

  

jueves, 12 de mayo de 2022

Encabezamientos de materia

·         Concepto

 

Las listas de encabezamientos de materia se componen de  encabezamientos y  subencabezamientos.

 

El encabezamiento intenta condensar el tema sobre el que trata el documento.

 

El subencabezamiento puede acompañar al encabezamiento para precisar o delimitar el sentido de la materia. Se coloca detrás del encabezamiento, separado por un guión. Los subencabezamientos pueden ser de materia, topográficos, cronológicos y de forma.

 

·         ESTRUCTURA

 

A su vez, los encabezamientos pueden ser simples o compuestos. El encabezamiento simple expresa la materia con una sola palabra y el encabezamiento compuesto expresa el tema del documento mediante dos o más palabras.

 

La forma ideal de encabezamiento es el formado por una sola palabra. Los encabezamientos simples son, como ocurre normalmente con los lenguajes documentales, sustantivos, los nombres contables van en plural y los incontables en singular.

 

Los encabezamientos compuestos pueden ser de:

 

- nombre + adjetivo

- nombre + nombre

- una frase (poco uso)

- encabezamiento + subencabezamiento. Esta última forma es en la práctica la más usada, porque permite confeccionar una entrada temática más específica.

 

La lista de encabezamientos de materia trae también un sistema de referencias. Existe el Véase (V.) y el Usado por (U.p.) para mostrar la reciprocidad entre términos aceptados y no aceptados, el Véase además (V.a.) para completar la información con otros asuntos relacionados y el Relacionado con (R.e.) que indica al bibliotecario la posibilidad de usar encabezamientos más específicos dentro de una materia.

Existen otras explicaciones de utilidad que pueden aparecer junto a un encabezamiento en particular. Son: “Úsase como…”, “Úsase también…”, Pueden usarse además…”

·         Las LISTAS DE ENCABEZAMIENTO DE MATERIA del MINISTERIO DE Cultura

 

La lista de encabezamientos de materia en la que hemos basado la explicación, por ser de uso habitual en bibliotecas españolas, es la “Lista de encabezamientos de materia para las bibliotecas públicas”, del Ministerio de Cultura, cuya última edición fue publicada en 1987.

 

No son por supuesto las únicas listas existentes, ya que muchas bibliotecas usan otras más completas y actualizadas.

·         PRINCIPIOS

Para asignar correctamente las materias a un documento, deberemos seguir los siguientes principios:

-       Principio de economía: evitar dar más de 3 entradas a un documento. Las obras sin tema definido y las de creación literaria no llevan materia.

-       Principio de especificidad: el término escogido debe representar esa materia concreta, eligiendo la más específica frente a la más general.

-       Principio lingüístico: uso del idioma del centro de información para las listas

-       Principio de uniformidad: cada materia debe ser denominada siempre de la misma manera, huyendo de la ambigüedad y la polisemia.

-       Principio de uso: los términos deben establecerse en función de los usos terminológicos más habituales en el centro de trabajo y de las necesidades de los usuarios.

  

martes, 10 de mayo de 2022

Descriptores

 

·         concepto

 

Los términos aceptados de un thesaurus se llaman descriptores.
Son las unidades léxicas más importantes de esta herramienta. El descriptor muestra la palabra o palabras escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedades una noción determinada.

 

Los términos no preferentes, es decir, los no elegidos como descriptor, se llaman no descriptores.

 

·         TIPOS

 

Desde el punto de vista sintáctico, un descriptor es simple cuando está formado por una sola palabra, y compuesto cuando está formado por más de una palabra. Los descriptores compuestos se dan cuando es necesaria la representación de un concepto mediante un sintagma de varias palabras para no perder su significado (por ejemplo llave inglesa).

 

En cuanto a la cobertura temática, los descriptores son en su mayoría temáticos, aunque también pueden encontrarse descriptores onomásticos, geográficos y cronológicos.

 

·         PRESENTACIÓN

 

Los términos que conforman un thesaurus pueden venir presentados de distintas formas. De hecho, normalmente coexisten dentro del mismo varias presentaciones. Citamos las más comunes:

 

-       Índice alfabético de descriptores y no descriptores: Dentro de este índice, las relaciones que pueden darse entre los términos son las siguientes:

o    Relaciones de equivalencia: controlan la sinonimia del lenguaje natural.
Todos los términos equivalentes (no descriptores) apuntan al descriptor correspondiente mediante la notación USE. El descriptor muestra a su vez cuáles son sus sinónimos o cuasisinónimos mediante la expresión UP (usado por).

o    Relaciones de jerarquía: expresan la relación de superioridad o inferioridad entre los conceptos mediante las expresiones TG (término genérico) y TE (término específico).

 

o    Relaciones de asociación: la relación entre los términos es recíproca, los descriptores aparecen asociados porque las materias que representan están ligadas conceptualmente. La relación se expresa mediante la expresión TR (término relacionado).

-       Índice sistemático: contiene los descriptores estructurados en función de las jerarquías establecidas en el tesauro. Ofrece las “familias” de términos, lo que facilita la obtención de una visión de conjunto de la información que contiene el tesauro.

-       Índice permutado: Además de las formas de presentación analizadas anteriormente, el tesauro suele traer un índice permutado o índice KWIC. Este recoge los descriptores y no descriptores ordenados alfabéticamente, aunque su particularidad  reside en que recoge también todos los elementos de los términos compuestos, para facilitar la búsqueda por la segunda parte de cualquier sintagma.

Aunque cada tesauro tiene sus características físicas y estructurales, se tiende a que los descriptores se diferencien del resto del texto mediante la tipografía negrita o mayúscula. Además, los descriptores suelen ser sustantivos, los nombres contables van en plural y los incontables en singular.

 

 

·         REVISIÓN

 

Dado que el lenguaje documental es producto basado en el lenguaje natural, y que éste evoluciona a lo largo del tiempo, el thesaurus y los descriptores que contiene deben ser revisados periódicamente para comprobar que los términos en uso y sus relaciones siguen vigentes.

 

jueves, 5 de mayo de 2022

El tratamiento documental

 

·         CONCEPTO

 

Los descriptores y los encabezamientos de materia son las unidades léxicas mínimas que componen dos instrumentos documentales respectivamente: el thesaurus y la lista de encabezamientos de materia.

Vamos a encuadrar el tema en el mundo de los lenguajes documentales, para pasar a describir los descriptores y los encabezamientos por separado y en detalle.

 

·         El proceso documental

 

Todos los documentos que forman parte de un fondo documental determinado deben recibir un tratamiento documental.

 

El proceso documental por el que pasa todo documento empieza primeramente en la  fase de análisis, antes de poner el documento a disposición de los usuarios, y después en la  fase de búsqueda y recuperación de la información, de cara a su difusión.

·         El análisis documental y el análisis de contenido

 

La primera fase, la de análisis documental, pretende describir el contenido formal e intelectual de cada documento y es uno de los trabajos básicos del profesional de la información.

 

Concretamente, la extracción de las ideas fundamentales que transmite el documento se llama análisis de contenido, y es la esencia del tratamiento documental.

 

Las técnicas documentales que se desarrollan para la descripción del contenido de un documento son la clasificación, la indización y el resumen. Nos centraremos en la clasificación y en la indización, por ser las operaciones donde se lleva a cabo la aplicación de encabezamientos de materia o de descriptores, según el caso.

 

·         CLASIFICACIÓN

 

La Clasificación es la tarea documental que consiste en agrupar los materiales por su contenido con objeto de facilitar su situación y búsqueda. Clasificar un documento supone por tanto adjudicar a un documento, en función de su contenido intelectual, uno o varios encabezamientos de materia, extraídos de una lista previamente definida.

 

La herramienta básica del clasificador es la Lista de Encabezamientos de Materia, que no es más que un conjunto de palabras que pretende recoger los conceptos susceptibles de representar en el contenido de los documentos.

 

Las listas de encabezamientos de materia son las clasificaciones alfabéticas más utilizadas en bibliotecas.

 

Existen muchas listas de encabezamientos diferentes, pero cada centro utiliza la suya en función de sus necesidades o normativa. La lista de encabezamientos de materia más grande del mundo es la LC Subject Headings.

 

·         INDIZACIÓN

 

La Indización, por otro lado, es la técnica documental que consiste en caracterizar el contenido de un documento reteniendo las ideas representativas para traducirlas a unos términos de indización adecuados, procedentes de un lenguaje documental previamente elaborado.

 

El instrumento básico de trabajo para el indizador es el Thesaurus, que es un vocabulario estructurado que recoge los términos válidos a emplear y las relaciones existentes entre ellos.

 

El ámbito de trabajo del thesaurus es tradicionalmente el centro de documentación.

 

A diferencia de la Clasificación, que intenta reflejar el contenido del documento a grandes rasgos con uno o dos conceptos (máximo 3), la Indización pretende representar todos los conceptos significativos, aunque esto se hará en mayor o menor profundidad en función de la política de cada centro.

 

·         LOS LENGUAJES DOCUMENTALES

 

El lenguaje plasmado tanto en el thesaurus como en la lista de encabezamientos de materia se llama lenguaje documental. Es un lenguaje controlado, basado en el lenguaje natural, pero que huye de su riqueza y de todos los fenómenos lingüísticos que se dan con él, como la sinonimia, la polisemia, la redundancia y la ambigüedad.

Las características que debe reunir todo lenguaje documental son la Exhaustividad y la Especificidad.

 

El lenguaje documental es utilizado tanto por el documentalista durante el tratamiento documental como por el usuario para la búsqueda y recuperación de información. Por tanto, el lenguaje documental también hace de puente entre el documento y el usuario.