Big Data: ¿Cuáles son los datos no estructurados generados por máquinas? ¿Y por las personas?
Es importante saber diferenciarlos
En anteriores ocasiones ya habíamos explicado qué es el Big Data, y sabemos que consiste, de forma breve y concisa, en grandes cantidades de datos complejos y variados que requieren de la aplicación de técnicas y tecnologías avanzadas para que se puedan capturar, almacenar, distribuir, gestionar y analizar adecuadamente.
El Big Data, además, trabaja principalmente con datos no estructurados, es decir, datos sin un formato específico y que no encajan con la filosofía de las bases de datos relacionales, con lo cual no se pueden almacenar en ellas.
Según datos estadísticos, aproximadamente el 20% de los datos con los que trabaja una empresa son estructurados, por lo que el 80% restante no lo son. En realidad, la mayoría de los datos manejables en cualquier entorno no son estructurados. Hasta hace relativamente poco tiempo, con las nuevas técnicas de tratamiento de datos, este tipo de información no permitía hacer demasiado con ella, sino simplemente almacenarla y analizarla manualmente.
Al igual que los datos estructurados, los que no lo son pueden ser generados tanto por máquinas como por seres humanos.
Datos no estructurados generados por máquinas
- Imágenes de Satélite: incluye datos del tiempo meteorológico y otros tipos de información recopilados por el Gobierno.
- Datos científicos: datos sísmicos, atmosféricos o físicos en general.
- Fotografía y video: incluye datos de seguridad, vídeos de tráfico o de vigilancia.
- Datos de radar o sonar: perfiles oceanográficos, etc.
Datos no estructurados generados por seres humanos
- Información interna de la empresa: incluye documentos, informes, emails y cualquier tipo de información textual intercambiada diariamente en la empresa. Este tipo de datos representa un gran porcentaje de la información textual mundial a día de hoy.
- Datos de redes sociales: datos generados de plataformas sociales como YouTube, Facebook, Twitter, LinkedIn o Flickr.
- Datos móviles: información como SMS o datos de geolocalización.
- Contenidos Web: incluye contenido sin estructura generados por cualquier sitio web.
Estos son solo algunos ejemplos de muchos. Los datos no estructurados son de lejos la pieza más grande del puzzle del Big Data, y el número de casos de uso está aumentando considerablemente.
¿Te gustaría contar con un sistema de Analítica en tu empresa? ¡Contáctanos!
Te recomendamos leer
Artículos Relacionados
- Pentaho, Business Intelligence y Open Data en Canarias
- ¿Qué es realmente el Big Data?
- ¿Cuáles son los componentes de Pentaho?