Reflexión #4: Bases de Datos y Web

La Primera Generación de la Web se caracteriza porque las páginas Web son completamente estáticas, es decir, el contenido que presentan es el que es y no permiten al usuario realizar ningún tipo de interacción con las mismas, salvo la manipulación propia del manejo del hipertexto y los hiperenlaces, esto es, saltar de una página web a otra. La segunda Generación de la Web ha creado un punto de inflexion, se corresponde con la Web en la que aparecen las primeras técnicas para permitir la inclusión de contenido dinámico.

La tercera Generación de la Web es “web semántica” permite que la experiencia del usuario con la Web mejore espectacularmente, que trae propósito que la información será manejada por las máquinas. Web Semántica hará que los servicios más inteligentes.

Web Semántica no es una web separada sino una Web extendida. dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida. Web Semántica está formada por la idea de Tim Berners-Lee creador de la WWW, y otras personas relacionados con el W3C (World Wide Web Consortium). Ello proporciona un entorno compartido y el procesamiento automatizado de datos por un ordenador.

Qué beneficios trae una web semántica?

  • La máquina puede comprender la información en la Web.
  • Buscar información más rápida y más precisa.
  • Los datos de enlace dinámico.
  • Herramientas de automatización.

Según Berners-Lee, la arquitectura de la Web Semántica se podría representar de la siguiente forma:

zzz

Los principales componentes de la Web Semántica son: XML, XML Schema, RDF, RDF Schemay OWL.

XML: le provee a la web semántica una sintaxis elemental para las estructuras de contenidos dentro de documentos.

XML Schema: Es un lenguaje para proporcionar y restringir la estructura y el contenido de los elementos contenidos dentro de documentos XML.

Unicode: Es un estándar cuyo objetivo es proporcionar el medio por el cual un texto en cualquier forma e idioma pueda ser codificado para el uso informático. El mismo nos permite mostrar información en cualquier idioma y con la certeza de que no aparezcan símbolos extraños.

URI: Son cadenas que permiten acceder a cualquier recurso de la Web. En la Web Semántica las URIs son las encargadas de identificar objetos. Todos los objetos pueden ser identificados mediante una URI. Si dos objetos cuentan con la misma URI pueden existir colisiones. El grupo de trabajo del W3C está intentando resolver este problema.

XML+NS+xmlschema: Esta es la capa más técnica de la Web Semántica. En la que se encuentran agrupadas las diferentes tecnologías que posibilitan la comunicación entre las diferentes aplicaciones.

El estándar Extensible Markup Language (XML) ofrece un formato común para el intercambio de documentos,

Namespaces (NS) proporciona el método para cualificar los elementos y atributos de nombres usados en los documentos XML asociándolos con los espacios de nombre identificados por referencias URIs.

XML Schema es un lenguaje que permite describir la estructura y restringir el contenido de los documentos XML.

RDF: es un lenguaje simple que define un modelo de datos para describir a los objetos “recursos” y a sus relaciones, mediante tripletas sujeto-predicado-objeto. Los dos primeros serán URIs y el tercero puede ser URI o un valor literal. Este modelo de RDF se puede representar en sintaxis de XML

RDF Schema: Es un vocabulario RDF para describir propiedades y clases de recursos RDF, con semántica para generalizar-jerarquías de las propiedades y clases.

RDF+rdfschema: Está basada en la capa anterior (XML NL, XML-SCHEMA), define el lenguaje universal con el que podemos expresar diferentes ideas en la Web Semántica.

OWL: Es un mecanismo para desarrollar temas o vocabularios específicos en los que podamos asociar esos recursos.

Algunos de los desafíos de la Web 3.0 que enfrenta incluyen: Volúmenes de datos masivos, Datos poco clara, Inconsistencias, Seguridad..

Referencias:

María Jesús Lamarca Lapuente. “Hacia la web semántica?”(2013). Hipertexto, el nuevo concepto de documento en la cultura de la imagen. Enlace:  Web semántica

German E. Yahuita Quisbert. “Web Semántica y Representación del Conocimiento con Ontologías” (2014). Revista del Postgrado en Informática. Enlace:  Web Semántica y Representación del Conocimiento con Ontologías

Wikipedia

 

Reflexión #3: Base de datos emergentes (BDOO)

Como su propio nombre indica, la característica principal de las bases de datos orientadas a objetos (BDOO) está permitiendo la definición de los objetos que son diferentes de los objetos de base de datos normales. Los objetos en una BDOO, hacen referencia a la capacidad de desarrollar un producto, entonces identificado y nombrado. Los objetos se pueden hacer referencia o llamó más tarde, como una unidad sin tener que entrar en sus complejidades. Esto es muy similar a los objetos usados en la programación orientada a objetos.

Una vida real paralela a objetos es un motor de coche. Se compone de varias partes: el bloque de cilindro principal, el sistema de escape, colector de admisión… Cada uno de éstos es un componente independiente, pero cuando mecanizada y atornillada en un solo objeto, ahora que se denominan en conjunto como un motor. La utilización de una BDOO simplifica la conceptualización ya que la utilización de objetos permite representar de una manera más natural la información que se quiere guardar.

Las BDOO se deben utilizar cuando hay datos complejos y / o hay relaciones de datos complejos. Esto incluye una relación de muchos a muchos objetos. Bases de datos de objetos no debe ser usado cuando habría pocas unir tablas y hay grandes volúmenes de datos transaccionales simples.

Las bases de datos se han convertido en piezas fundamentales de muchos sistemas de información y las bases de datos tradicionales son difíciles de utilizar cuando las aplicaciones que acceden a ellas estén escritas en un lenguaje de programación orientado a objetos. Las BDOO se diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos como Java, C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación.

Las características principales de las BDOO:

  • Mandatorias: Son aquellas obligatorias
  • Opcionales: No son obligatorias y se ponen para hacer que el sistema sea major
  • Abiertas: Son aquellas en las que el diseñador puede poner de su parte y que están relacionadas con la programación.

Además de diseñarse para trabajar con lenguajes de programación orientado a objetos, las bases de datos orientadas a objetos incluyen los conceptos clave del modelo de objetos, como son las siguientes propiedades:

  • Encapsulación: Propiedad que permite ocultar la información al resto de los objetos, impidiendo así accesos incorrectos o conflictos.
  • Herencia: Propiedad a través de la cual los objetos heredan comportamiento dentro de una jerarquía de clases.
  • Polimorfismo: Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.

bdoo

Los ODBMS son una buena elección para aquellos sistemas que necesitan un buen rendimiento en la manipulación de tipos de dato complejos.

Las BDOO tienen las siguientes ventajas y desventajas:

VENTAJAS

  • Mayor capacidad de modelado.
  • Ampliabilidad
  • Lenguaje de consulta más expresivo.
  • Adecuación a las aplicaciones avanzadas de base de datos.
  • Mayores prestaciones.

DESVENTAJAS

  • Carencia de un modelo de datos universal.
  • Carencia de experiencia.
  • Carencia de estándares.
  • Con respecto a los SGBDR y los SGBDOR.
  • La optimización de consultas compromete la encapsulación.
  • El modelo de objetos aun no tiene una teoría matematica coherente que le sirva de base.

Los ejemplos de motores de BDOO incluyen db4o, Smalltalk and Cache…

Referencias:

Toni Medina. “Bases de datos orientadas a objetos” (2013). Enlace: Bases de datos orientadas a objetos

Lucia Coronel, Eulalia Lozano, Miguel Moreno. “Bases de datos orientadas a objetos”. (2009).  Bases de datos orientadas a objetos

Andrés de la Torre. “Bases de datos orientadas a objetos” (2009). Monografias. Enlace: BDOO

Wikipedia

Reflexión #2: Sistemas de Recuperación de Información – SRI

Recuperación de la información tiene una larga historia adjunto a la biblioteca y centro de la búsqueda de la información. Anteriormente, cuando no hay ordenadores y conexión a internet, aquellos que necesitan información, además de la ayuda de la información de amigos y parientes pueden venir a la biblioteca o centro de información para encontrar la información necesaria. Representación, almacenamiento, organización  y difusión de la información de la biblioteca se considera la forma tradicional de un sistema de recuperación de información.

Según María Pinto

“La recuperación de información es el siguiente paso a la determinación de las necesidades de información. Se puede recuperar a través de diferentes herramientas: bases de datos, Internet, tesauros, ontologías, mapas… Conocer y manejar estas herramientas contribuye a una recuperación de calidad.”

Los SRI pretender ofrecer al usuario diferentes mecanismos de acceso a las fuentes documentales, con el fin de que sea extraida la información relevante o pertinente cuyos contenidos respondan a las necesidades cognitivas. El propósito del sistema recuperación de información es para mostrar información al usuario un conjunto de información para satisfacer las necesidades de información.

El sistema debe soportar con la realización de tres tareas:

  • Crear representación documento estructurado
  • Crear representación de consulta estructurado
  • “Matching” entre el documento y la consulta

Picture1

Los sistemas de recuperación de información SRI se componen de tres componentes transcendentales: La base de datos documental, el subsistema de consultas y el componente de igualación o evaluación.

Los modelos de recuperación más populares:

  • Modelo Booleano: Es un modelo de recuperación simple, basado en la teoría de conjuntos y el álgebra booleana. Dada su inherente simplicidad y su pulcro formalismo ha recibido gran atención y sido  adoptado por muchos de los primeros sistemas bibliográficos comerciales. Su estrategia de recuperación está basada en un criterio de decisión binario (pertinente o no pertinente) sin ninguna noción de escala de medida, sin noción de un emparejamiento parcial en las condiciones de la pregunta.
  • Modelo Vectorial: El modelo de recuperación vectorial o de espacio vectorial propone un marco en el que es posible el emparejamiento parcial, asignando pesos no binarios a los términos índice de las preguntas y de los documentos. Estos pesos de los términos se usan para computar el grado de similitud entre cada documento guardado en el sistema y la pregunta del usuario.
  • Modelo Probabilistico: El modelo de recuperación probabilistico se basa en la equiparación probabilística, dados un documento y una pregunta, es posible calcular la probabilidad de que ese documento sea relevante para esa pregunta.

Se pueden distinguir tres sistemas básicos de recuperación de la información:

Catálogos de biblioteca: Es el inventario o relación de los fondos de la biblioteca, y contiene la descripción de cada uno de los documentos, convirtiéndose en un instrumento para la identificación y localización de los mismos.

Bases de datos bibliográficas: Son conjuntos de información estructurada en registros (que describen documentos), y almacenada en un soporte electrónico legible desde un ordenador. Su finalidad es organizar dichos registros para, posteriormente, poder realizar búsquedas y recuperar la información. Hay dos tipos de bases de datos: referenciales (ofrecen los datos identificativos de los documentos y, a veces, un resúmen o abstract), y a texto completo (incluyen el texto completo de los documentos)

Buscadores de Internet: Son aplicaciones que rastrean la red recopilando datos e información sobre las páginas web, e incorporando esta información en su propia base de datos

El propósito específico de cada uno de los sistemas de recuperación de la información es distinto, pero todos ellos presentan unas características básicas similares: Posibilidad de navegación/búsqueda, Uso de lenguaje libre/controlado, Búsqueda sencilla y avanzada y Uso de operadores.

Los SRI populares hoy en día es el motor de búsqueda en la web: Google, Yahoo …

Referencias:

SISINFO-SRI. “Componentes de los sistemas de recuperación de información” (2009). Recuperación de Información en Internet . Enlace:  Componentes de los sistemas de recuperación de información

Universidad carlos III de Madrid. “Recuperacion y Organizacion de la informacion -MODELOS DE RECUPERACIÓN” (2006). Enlace: http://modelosrecuperacion.tripod.com/

Wikipedia