Reflexión #7: Bases de datos NoSQL

En los últimos años hemos visto el surgimiento de un nuevo tipo de base de datos, como bases de datos NoSQL, que está desafiando el dominio de la base de datos relacionales. Base de datos relacionales han dominado la industria del software durante mucho tiempo se ha proporcionado mecanismos para almacenamiento de datos persistentes, simultáneamente control, transacciones sobre todo las interfaces estándar y mecanismos para integrar datos de aplicación, la presentación de informes. Sin embargo, hoy en día, con la aparición de grandes aplicaciones online, como Facebook, Twitter o LinkedIn, se plantea problemas de escalabilidad y rendimientos de las bases de datos relacionales con miles de usuarios concurrentes y con millones de consultas diarias, estas ventajas no existe para las bases de datos relacionales.

1015637-nosql-databases

NoSQL (Non-Relational) se entiende a menudo como “Not Only SQL”, es una forma de base de datos proporciona un mecanismo para almacenar y recuperar datos según otros modelos con bases de datos relacionales. NoSQL se evalúa que el enfoque con un diseño sencillo, fácilmente ampliable y fácil de controlar. Hay 5 tipos de bases de datos NoSQL, dependiendo de como almacenan la información: Key-Value, Basada en Documentos, Orientadas a Grafos, Orientadas a Columnas. En NoSQL no existe ACID (Atomicity, Consistency, Isolation, Durability) como en las bases de datos relacionales, pero existe algo llamado BASE (Basic Availability, Soft State, Eventual Consistency) que da características para el manejo de datos. Propiedades de almacenamiento simples, no vinculantes. por lo que el rendimiento de NoSQL es más rápido que RDBMS. NoSQL es especialmente útil cuando una empresa necesita acceder y analizar grandes cantidades de datos no estructurados o datos que se almacenan de forma remota en varios servidores virtuales en la nube.

Las ventajas más significativas de la arquitectura de datos NoSQL son:

  • Escalabilidad: Se pueden escalar con relativa facilidad ante demandas puntuales de sobre carga de datos.
  • Rendimiento: Para obtener un mejor rendimiento en el procesamiento de los datos sólo es necesario añadir más recursos en la plataforma hardware o priorizar cual son los servicios críticos en cada momento.
  • Estructura: Los desarrolladores de aplicaciones que trabajan con bases de datos relacionales muchas veces encuentran problemas con la cartografía de los datos y su impedancia. En las bases de datos NoSQL, esto no es generalmente un problema, ya que los datos no se almacenan en la misma manera.
  • Activación/Desactivación: Debido a la naturaleza distribuida de los datos, los modelos NoSQL responden muy bien ante la activación/desactivación de los servicios en base a las necesidades puntuales de demanda por parte de los usuarios o del mismo sistema.

SQL vs NoSQL:

sqlvsnosql

Referencias:

Ángel Leo-Revilla. “Ventajas de la arquitectura nosql” (2013).
Enlace: https://momentotic.com/2013/03/26/ventajas-de-la-arquitectura-nosql/

Antonio. “¿Qué es NoSQL?” (2011).
Enlace: http://codecriticon.com/que-es-nosql/

Wikipedia

Advertisements

Reflexión #6: Big Data

big-data

Big Data es un término se refiere a un conjunto de datos muy grandes y tan complejo que las herramientas, las aplicaciónes de procesamiento de datos tradicionales no pueden manejar. Sin embargo, en su Big Data contiene una gran cantidad de información valiosa, lo que si se extraen correctamente, ayudará mucho por negocios o de investigación científica, etc. Por lo tanto, estos datos deben ser recogidos, organizado, almacenamiento, búsqueda, compartiendo de una manera diferente de lo normal.

Con referencia al Big Data, las personas a menudo hablan sobre las 5Vs (volumen, veracidad, velocidad, variedad y valor), que son los cinco elementos fundamentales que caracterizan al Big Data.

  • Volumen de datos: es el crecimiento en términos de volumen. Los datos en los sistemas de información siempre y sigue creciendo en términos de tamaño (volumen). Podemos encontrar datos en grandes formatos (video, musica, imagen) en los canales de medios sociales. Volumen de datos de un SI puede ser de hasta terabytes y petabytes.
  • Velocidad: es el crecimiento en términos de velocidad. Además del crecimiento en el volumen. La tecnología Big data ha de ser capaz de almacenar y trabajar en tiempo real con las fuentes generadoras de información como sensores, cámaras de videos, redes sociales, blogs, páginas webs… fuentes que generan millones y millones de datos al segundo, por otro lado la capacidad de análisis de dichos datos han de ser rápidos reduciendo los largos tiempos de procesamiento que presentaban las herramientas tradicionales de análisis.
  • Variedad de datos: Los datos no sólo en la modalidad de acuerdos estructurados, pero también incluyen muchos tipos de datos no estructurados, tales como video, imagen, datos de sensores, así como “file log”
  • Veracidad: Por último el Big Data ha de ser capaz de tratar y analizar inteligentemente este vasto volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones.
  • Valor: Trabajar con Big Data tiene que servir para aportar valor a la sociedad, las empresas, los gobiernos, en definitiva, a las personas; todo el proceso tiene que ayudar a impulsar el desarrollo, la innovación y la competitividad, pero también mejorar la calidad de vida de las personas.

BD-5Vs

Big data como el conjunto de herramientas informáticas que nos permite captar, almacenar y gestionar un gran volumen de información variada a una alta tasa de velocidad permitiendo obtener unos datos veraces y útiles para la toma de decisión.

Tipos de datos en Big Data

  • Datos estructurados (Structured Data): Datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres. Se almacenan en tablas. Un ejemplo son las bases de datos relacionales y las hojas de cálculo.
  • Datos no estructurados (Unstructured Data): Datos en el formato tal y como fueron recolectados, carecen de un formato específico. No se pueden almacenar dentro de una tabla ya que no se puede desgranar su información a tipos básicos de datos. Algunos ejemplos son los PDF, documentos multimedia, e-mails o documentos de texto.
  • Datos semiestructurados (Semistructured Data): Datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar. Estos datos poseen sus propios metadatos semiestructurados16 que describen los objetos y las relaciones entre ellos, y pueden acabar siendo aceptados por convención. Un ejemplo es el HTML, el XML o el JSON.

La tecnología tratar con Big data es una combinación de una gran cantidad de tecnologías y técnicas diferentes. Cada una de estas tecnologías o técnicas son técnicamente difíciles, necesitan más tiempo para la investigación y el desarrollo. Algunos nombres de los más conocidos como Hadoop, NoSQL, Cassandra, Business Intelligence, Machine Learning, MapReduce…

Big data contenidos en ella una gran cantidad de información útil que si las empresas y organizaciones sepan cómo explotar es posible convertir esa información en el valor realista, reducir costos, trae muchos beneficios a las organizaciones y las empresas de su propiedad. Big Data es también un campo nuevo, sin embargo, su potencial minero es enorme, el campo será sin duda un crecimiento explosivo en un futuro próximo.

Referencias:

Estefania Guimil. “Las 5 V’s de Big Data” (2015). El nuevo mundo big data. Enlace: Las 5 V’s de Big Data – Big Data

“¿Qué es Big data?” (sin fecha). La web quees. Enlace: Big data – Explicación y definición de big data. 

Wikipedia

Reflexión #5: Sistema de Ayuda a la toma de decisiones

El éxito de cualquier empresa depende de decisiones precisas del administrador. Las decisiónes de la empresa también depende de factores externos como la situación económica, situación del mercado, las estrategias de los competidore, las operaciónes de la empresa, y los cambios en la tecnología .etc.. Por lo tanto, los gerentes deben tener todas las informacións necesarias en lugar de información incompleta o simplemente predicciones. Es por ello que las herramientas de la tecnología de la información (IT), tales como los sistemas de soporte de decisiones (DSS) se desarrolló para ayudar a los gerentes a tomar mejores decisiones.

Un Sistema de Soporte a la Decisión (DSS) es una herramienta de Business Intelligence enfocada al análisis de los datos de una organización. Un DSS es un software que intenta ayudar a las persones que toman las decisiones compilando información útil sobre los datos sin procesar, los documentos, el conocimiento personal, y/o los modelos de negocio para poder identificar y solucionar los problemas y poder tomar mejores decisiones. Algunos ejemplos de lo que los sistemas DDS nos permitan hacer son: análisis de vendas por regiones, planificación de la producción, análisis de costos y análisis de precios y rendibilidad.

El DSS es una de las herramientas más emblemáticas del Business Intelligence ya que, entre otras propiedades, permiten resolver gran parte de las limitaciones de los programas de gestión. Algunas de las características de los sistemas DSS son:

  • Extracción y manipulación de información de una manera flexible.
  • Ayudar y dar soporte a la toma de decisiones.
  • Definir la información que se necesita y como se debe de mostrar para que sea realmente útil para el usuario.
  • Tomar múltiples decisiones al mismo tiempo
  • Incluye varias herramientas, como simulación, modelización, etc.
  • Permite la combinación de información de los sistemas de la empresa con los de otra empresa externa

Es una combinación de los conocimientos y la toma de decisiones (Knowledge –Decision making).

Tres componentes fundamentales de una arquitectura de DSS son:

  1. Base de datos (o base de conocimientos): Data warehouse
  2. El modelo OLAP puede ser ROLAP, MOLAP, HOLAP.
  3. La interfaz de usuario: apoyo de herramientas de consulta, informes, análisis, minería de datos

Data warehouse no es un producto ni grupo de productos. DW ayuda para respuesta a preguntas sobre la mejor manera de tomar decisiones, pero lo que es sólo una parte de todo el proceso del sistema.

data_warehouse_architecture

Arquitectura de Data Warehouse

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.

Los beneficios que un Data Warehouse puede aportar:

  • Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
  • Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
  • Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
  • Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
  • Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.

Data Mart es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocios específica. Es consultado mediante herramientas OLAP que ofrecen una visión multidimensional de la información. Sobre estas bases de datos se pueden construir y DSS. Por otra parte, se conoce como Data Mining al proceso no trivial de análisis de grandes cantidades de datos con el objetivo de extraer información útil, por ejemplo para realizar clasificaciones o predicciones.

OLAP. Si Data Warehouse o Data Mart es el hogar de almacenamiento de datos centralizada para analizar, la tecnología OLAP que permite a las aplicaciones cliente recuperar los datos desde ese de manera eficiente.

A veces, el concepto DW y OLAP se utilizan indistintamente. Sin embargo, se necesita para distinguir la diferencia entre ellos.

Referencias:

Sílvia Ferrer Mos. “¿Qué son los Sistemas de Apoyo a la Toma de Decisiones (DDS)? (2015). Per tutatis. Enlace: ¿Qué son los Sistemas de Apoyo a la Toma de Decisiones (DDS)?

“Datawarehouse” (sin fecha). Sinnexus- la marca comercial de Sinergia e Inteligencia de Negocio S.L. Enlace: Business Intelligence – Datawarehouse

“Data warehouse” (sin fecha). Datawarehouse4u. Enlace: Datawarehouse Architecture

Wikipedia