08 febrero 2023

Introducción a la web semántica

 

v  LA WEB HOY

La Web es uno de los servicios de Internet más importantes y que más ha conseguido popularizar la red. Fue concebida por Tim Berners-Lee, quien presentó el proyecto de la W en 1989, en el CERN (Suiza). Este proyecto era, sin embargo, mucho más ambicioso de lo que conocemos hoy en día de la Web.

 

Las posibilidades que ofrece la Web en la actualidad son, a pesar de ello, asombrosas, e impensables hace tan sólo unas décadas. La Web nos permite realizar de forma remota infinidad de actividades de todos los ámbitos: educativo (e-learning), cultural (visitas virtuales a museos, bibliotecas, ciudades), administrativo (declaración de la renta), económico (cuentas corrientes, compra-venta de valores), laboral (teletrabajo), ocio (juegos, literatura, prensa, fotos), etc.

 

El volumen de información que alberga la red es inabarcable. Se dice que “todo está en la red”, y lo que no está es porque no existe. A la Web superficial se le suma la Web profunda (Internet invisible), compuesta por todos los contenidos que están ahí pero que no aparecen en los buscadores cuando preguntamos por ellos, debido normalmente a que son recursos dinámicos pertenecientes a Bases de Datos.

 

Sin embargo, a pesar de contar con este ingente almacén de información, es bien sabido que la capacidad de la red para satisfacer necesidades de información es limitada. La calidad, volatilidad y obsolescencia de los contenidos ponen trabas a la satisfacción de muchos internautas. Otro gran problema de la Web es su abrumadora obtención de resultados ante una búsqueda genérica, lo que denota una gran falta de precisión.

 

Esta falta de precisión se hace patente cuando lanzamos una búsqueda cualquiera en alguno de los motores o directorios existentes, por ejemplo, preguntando por “San Bernardo” y nos devuelve resultados acerca de distintas realidades inconexas: una raza de perro, una calle de Madrid o un Santo devoto.

 

Este problema, tan habitual por otra parte, ocurre porque la Web actual carece de capacidad para expresar significados. Únicamente se limita a recoger cadenas de caracteres indizadas en grandes Bases de Datos, buscar por ellas cuando son requeridas y presentarlas en la pantalla del ordenador para su visualización por parte de un ser inteligente. Pero la máquina no sabe realmente lo que la información significa.

 

Aquí es donde surge la apuesta por la construcción de una Web Semántica (WS), también llamada Web Inteligente.

 

v  LA WEB DEL FUTURO: LA WEB SEMÁNTICA

La WS es una corriente promovida por el propio inventor de la Web, Tim Berners-Lee, cuyo fin es lograr que las máquinas puedan entender y por tanto utilizar lo que la Web contiene. De ahí que se haya tomado el concepto de Semántica, que desde el punto de vista lingüístico es la disciplina que estudia el significado de los términos.

 

Se pretende desarrollar una Web más cohesionada, donde sea más fácil localizar, compartir e integrar información y servicios, para sacar un mayor partido a los recursos disponibles.

 

Tal y como expresó el mismo Berners-Lee en un artículo publicado por la revista Scientific American en 2001, la WS es una extensión de la Web actual, no una sustitución. La WS no pierde las características esenciales de la Web actual, como por ejemplo ser descentralizada.

 

Para poder llegar a este (por ahora) lejano objetivo de WS hay que recorrer un largo camino, primero de desarrollo de estándares para la representación, organización y recuperación de información en la red, y segundo de promoción y concienciación por parte de toda la comunidad web para su uso.

 

La WS persigue el establecimiento de una forma universal de representar las relaciones entre los datos, y entre éstos y sus significados para que un sistema automático (agente) sea capaz de sacar sus propias conclusiones respecto a la búsqueda que se está realizando.

 

Para que las máquinas empiecen a procesar “conocimientoy no únicamente “datos, hay que conseguir que la información esté convenientemente estructurada y clasificada. Esto conlleva la utilización de los llamados “lenguajes para la representación del conocimiento”. Para las personas vinculadas al mundo de la documentación y de los lenguajes documentales, esto no es una novedad. De hecho, uno de los lenguajes más conocidos en este ámbito para describir recursos en Internet es el sistema de metadatos Dublín Core, respaldado por la DCMI.

 

En este tema vamos a tratar otros lenguajes: las tecnologías más importantes planteadas por el W3C para construir la WS: el metalenguaje XML, la arquitectura RDF, y el lenguaje OWL.

No hay comentarios:

Publicar un comentario