
Veamos en qué consiste cada una de las cuatro V:
Volumen
No es extraño escuchar comentarios como que Big Data no es más que Business Intelligence “a lo bestia”. Sin embargo, una mayor cantidad de datos no es suficiente para que podamos hablar, sin más, de Big Data. Sin las otras V, seguiríamos hablando de un esfuerzo de inteligencia de negocio “tradicional”, sólo que con volúmenes mucho mayores. En cualquier caso, los volúmenes de información disponible de los que disfrutamos actualmente suponen retos técnicos y analíticos singulares, habitualmente por encima de los esfuerzos de BI más ambiciosos del pasado.
Variedad
Hoy por hoy, podemos apoyar nuestras decisiones en orígenes de datos tan heterogéneos como podamos imaginar. Cada acción de nuestros clientes, competidores o proveedores genera una miríada de información de los tipos más diversos: desde datos estructurados y relativamente fáciles de gestionar hasta información no estructurada en forma de documentos, vídeos o mensajes de email. Cada tipo de información requerirá un tratamiento distinto y, probablemente, herramientas específicas, pero sin la capacidad de combinar y conjugar unos y otros no tendremos una iniciativa madura de Big Data.
Veracidad
Desde mi visión, esta V se refiere tanto a la calidad del dato como a su predictibilidad. Mejor dicho, se refiere a la variabilidad de su calidad y de su disponibilidad. La Variedad afecta a la Veracidad: la Veracidad es la variable menos uniforme a lo largo de los distintos tipos de dato que manejamos.
En un entorno de analítica de negocio tradicional, los orígenes de datos son mucho más reducidos en número y tipo (menor Variedad) y la organización suele tener más control sobre ellos y mucho más conocimiento sobre su volumen y calidad (mayor Veracidad). En un entorno Big Data, la mayor Variedad implica, necesariamente, mayor incertidumbre sobre la calidad de cada dato y su disponibilidad futura, así como sobre las nuevas fuentes de datos con las que tendremos que contar más adelante.
Velocidad
Seguramente, la Variedad y la Veracidad no serían tan relevantes ni supondrían tanto estrés al afrontar una iniciativa de Big Data si no fuera por el elevado Volumen de información que hay que manejar y, sobre todo, por la Velocidad con la que ocurre todo: tanto la generación de información (grandes volúmenes en poco tiempo) como la velocidad con la que es necesario analizarla y, sobre todo, reaccionar. La parte del input supone un reto, principalmente, para el área de tecnología, que ha de ser capaz de almacenar y digerir ingentes cantidades de información en lo que llamamos “tiempo casi real” pero la parte del output, de las decisiones y reacciones a los eventos detectados, implica más a las áreas de operaciones afectadas (ya sea logística, ventas, marketing…) y a sus personas y sus procesos, que han de trabajar a la velocidad de reacción necesaria para extraer el valor de negocio a los datos analizados antes de que pase la ventana de oportunidad.