Reflexión #6: Big Data

big-data

Big Data es un término se refiere a un conjunto de datos muy grandes y tan complejo que las herramientas, las aplicaciónes de procesamiento de datos tradicionales no pueden manejar. Sin embargo, en su Big Data contiene una gran cantidad de información valiosa, lo que si se extraen correctamente, ayudará mucho por negocios o de investigación científica, etc. Por lo tanto, estos datos deben ser recogidos, organizado, almacenamiento, búsqueda, compartiendo de una manera diferente de lo normal.

Con referencia al Big Data, las personas a menudo hablan sobre las 5Vs (volumen, veracidad, velocidad, variedad y valor), que son los cinco elementos fundamentales que caracterizan al Big Data.

  • Volumen de datos: es el crecimiento en términos de volumen. Los datos en los sistemas de información siempre y sigue creciendo en términos de tamaño (volumen). Podemos encontrar datos en grandes formatos (video, musica, imagen) en los canales de medios sociales. Volumen de datos de un SI puede ser de hasta terabytes y petabytes.
  • Velocidad: es el crecimiento en términos de velocidad. Además del crecimiento en el volumen. La tecnología Big data ha de ser capaz de almacenar y trabajar en tiempo real con las fuentes generadoras de información como sensores, cámaras de videos, redes sociales, blogs, páginas webs… fuentes que generan millones y millones de datos al segundo, por otro lado la capacidad de análisis de dichos datos han de ser rápidos reduciendo los largos tiempos de procesamiento que presentaban las herramientas tradicionales de análisis.
  • Variedad de datos: Los datos no sólo en la modalidad de acuerdos estructurados, pero también incluyen muchos tipos de datos no estructurados, tales como video, imagen, datos de sensores, así como “file log”
  • Veracidad: Por último el Big Data ha de ser capaz de tratar y analizar inteligentemente este vasto volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones.
  • Valor: Trabajar con Big Data tiene que servir para aportar valor a la sociedad, las empresas, los gobiernos, en definitiva, a las personas; todo el proceso tiene que ayudar a impulsar el desarrollo, la innovación y la competitividad, pero también mejorar la calidad de vida de las personas.

BD-5Vs

Big data como el conjunto de herramientas informáticas que nos permite captar, almacenar y gestionar un gran volumen de información variada a una alta tasa de velocidad permitiendo obtener unos datos veraces y útiles para la toma de decisión.

Tipos de datos en Big Data

  • Datos estructurados (Structured Data): Datos que tienen bien definidos su longitud y su formato, como las fechas, los números o las cadenas de caracteres. Se almacenan en tablas. Un ejemplo son las bases de datos relacionales y las hojas de cálculo.
  • Datos no estructurados (Unstructured Data): Datos en el formato tal y como fueron recolectados, carecen de un formato específico. No se pueden almacenar dentro de una tabla ya que no se puede desgranar su información a tipos básicos de datos. Algunos ejemplos son los PDF, documentos multimedia, e-mails o documentos de texto.
  • Datos semiestructurados (Semistructured Data): Datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos. Es una información poco regular como para ser gestionada de una forma estándar. Estos datos poseen sus propios metadatos semiestructurados16 que describen los objetos y las relaciones entre ellos, y pueden acabar siendo aceptados por convención. Un ejemplo es el HTML, el XML o el JSON.

La tecnología tratar con Big data es una combinación de una gran cantidad de tecnologías y técnicas diferentes. Cada una de estas tecnologías o técnicas son técnicamente difíciles, necesitan más tiempo para la investigación y el desarrollo. Algunos nombres de los más conocidos como Hadoop, NoSQL, Cassandra, Business Intelligence, Machine Learning, MapReduce…

Big data contenidos en ella una gran cantidad de información útil que si las empresas y organizaciones sepan cómo explotar es posible convertir esa información en el valor realista, reducir costos, trae muchos beneficios a las organizaciones y las empresas de su propiedad. Big Data es también un campo nuevo, sin embargo, su potencial minero es enorme, el campo será sin duda un crecimiento explosivo en un futuro próximo.

Referencias:

Estefania Guimil. “Las 5 V’s de Big Data” (2015). El nuevo mundo big data. Enlace: Las 5 V’s de Big Data – Big Data

“¿Qué es Big data?” (sin fecha). La web quees. Enlace: Big data – Explicación y definición de big data. 

Wikipedia

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s