¿Cuál es la diferencia entre ‘Data’ y ‘Big Data’?

Tendencias en Internet, desde Noviembre 7 hasta Diciembre 7, 2018.
diciembre 7, 2018
Los mejores comerciales del mes.
diciembre 12, 2018
Show all

No estoy seguro de que sea necesario, pero, francamente, cuando surge el tema (y lo hace todo el tiempo) es demasiado tentador dejarlo pasar. Cualquier definición es un poco circular, ya que los datos “Grandes” son todavía datos, por supuesto.

Los datos son un conjunto de variables cualitativas o cuantitativas: pueden ser estructuradas o no estructuradas, legibles por máquina o no, digitales o analógicas, personales o no. En última instancia, es un conjunto específico o conjuntos de puntos de datos individuales, que se pueden utilizar para generar ideas, se pueden combinar y resumir para crear información, conocimiento y sabiduría. Las herramientas y el software de análisis tradicionales se pueden utilizar para analizar y “procesar” datos.

Hay “dimensiones” que distinguen la data de la “BIG DATA”, resumidos como los “3 Vs” de los datos: volumen, variedad, velocidad. Por lo tanto, BIG DATA, no es solo “más” datos. Son tantos los datos, que están tan mezclados y desestructurados, y se están acumulando tan rápidamente, que las técnicas y metodologías tradicionales, incluido el software “normal”, en realidad no funcionan (como Excel, informes de Crystal o similares). Gartner declaró que en 2011, la tasa de crecimiento de datos a nivel mundial fue de alrededor del 59%. Esto significa que casi el 40% de todos los datos creados se crearon el año anterior y estoy seguro de que es aún más ahora.

Por lo tanto, “BIG DATA” puede ser un término de resumen para describir un conjunto de herramientas, metodologías y técnicas para poder derivar una nueva “visión” a partir de tamaños de muestra extremadamente grandes y complejos de datos y (lo más probable) la combinación de múltiples conjuntos de datos complejos extremadamente grandes. El potencial aquí es que si analizamos verdadera “BIG DATA”, podemos intentar establecer patrones y correlaciones entre eventos aparentemente aleatorios en el mundo. Luego, al establecer y probar hipótesis, podríamos entender la causalidad, por lo que se podrían hacer predicciones y profundos conocimientos.

Debido a la complejidad de la “BIG DATA” y los métodos de potencia computacional (nueva) requeridos, esto solo ha sido posible intentarlo en la última década. Incluso hoy en día, la mayoría de los proyectos de BIG DATA no intentan probar hipótesis o establecer patrones, por lo tanto, se pierden el potencial.

En la práctica, BIG DATA casi siempre tiene que ver con múltiples conjuntos de datos, y en la mayoría de los casos, tiene poco que ver con los datos personales (aunque es probable que los datos de identificación personal sean omnipresentes, dado que la correlación suficiente de múltiples conjuntos de datos podría ser personal).

Sin embargo, en mi experiencia, cuando se discute de “BIG DATA”, las discusiones no son realmente sobre “BIG DATA”. La mayoría de los ejemplos dados, como los de Big Data en la Conferencia de Gobierno, tienen que ver con un mejor uso de los datos, informes y análisis. No es nuevo, ni debe ser visto como nuevo. Podría decirse que ha estado (debería haber estado ocurriendo) desde el comienzo del gobierno organizado.

Además, no existe un consenso ni una comprensión compartida de que el uso de datos y BIG DATA sean cosas diferentes y puedan ofrecer resultados diferentes. Nadie sabe exactamente qué beneficios especiales podrían derivarse de BIG DATA, ni siquiera en el mundo del sector privado. No obstante, también ha habido algunos éxitos notables en el uso de BIG DATA, como Google Translate, la optimización de ventas al por menor Tesco Clubcard o el modelado de tarifas de aerolíneas y los algoritmos de predicción.

Así que volvamos a un tema más sencillo, como un buen uso de datos “pequeños”. Ninguno de los ejemplos dados en la reciente Big Data en la Conferencia de Gobierno fueron DATOS GRANDES. Lo que es más preocupante, ninguno de ellos afecta realmente a la vida cotidiana del gobierno, las decisiones reales que toman los funcionarios o gerentes. Lo repetiré: no escuché ningún ejemplo en el que un funcionario del gobierno o un funcionario público haya cambiado la decisión tomada (a nivel operativo) sobre la base del nuevo uso de “BIG DATA”. Los datos y su análisis parecían situarse como un “apéndice” del lado del gobierno. Estar en un apéndice significa que no está involucrado en los trabajos y procesos del gobierno del día a día. Esto puede haber sido culpa de los ejemplos específicos, pero me encantaría saber algo más en futuras conferencias.

Hoy en día, existen muchas más herramientas, plataformas e ideas excelentes en el campo de la buena gestión de datos (no solo BIG DATA). Esto crea un potencial enorme e inmediato para el Sector Público al realizar mejoras relevantes y oportunas en la gestión de datos “pequeños”, la integración de datos y la visualización. Más importante aún, al integrar datos “pequeños” en la toma de decisiones en tiempo real de los servidores públicos y hacerlos útiles. Creo que esto se logra mejor si no se distrae con títulos elegantes y de moda como “BIG DATA”, sino que se centra en la transformación aburrida (pero esencial) del Sector Público. Tengamos una “pequeña” información (o simplemente una simple conferencia de “información”. Menos sexy, pero más útil.

Por Denis Kaminskiy

Facebook
Twitter
Linkedin0
Google+0
GMail0
SMS0
Whatsapp0
Positive SSL