miércoles, junio 26, 2024

Big Data, desde la ciencia estadística hasta el análisis de datos masivos

Cada vez que utilizamos el teléfono móvil (Smartphone), realizamos una búsqueda en internet o usamos algún dispositivo inteligente estamos generando datos. Seguramente, al mismo tiempo, millones de personas en el mundo están realizando operaciones que generan información en todos los tipos, formatos y formas concebibles. A esa gran cantidad de datos que cada segundo se produce se le conoce como Big Data. El Big Data puede provenir de muchas fuentes como documentos, correos electrónicos, registros de manejo, médicos, de computadoras y dispositivos móviles; historial de Internet, actividad en las redes sociales, por nombrar algunos y, puede incluir imágenes, video, audio y texto. Su objetivo es desarrollar mecanismos capaces de procesar y gestionar los datos masivos.

Además, describe las grandes cantidades de información que pueden ser analizadas o no analizadas, estructuradas como datos del censo o no estructurada, como las imágenes de las publicaciones de redes sociales. El procesamiento de esa enorme cantidad de información y datos, requiere la creación de algoritmos complejos, dispositivos muy poderosos como supercomputadoras y/o la utilización de aprendizaje automático o inteligencia artificial (IA). Al analizar los datos, el Big Data los convierte en información útil que puede ser interpretada por el ser humano y que le ayuda a tomar decisiones informadas en temas que van desde formular estrategias de defensa específica, conservación y sostenibilidad, comportamiento de consumo hasta resultados médicos, al revelar patrones repetitivos, modelos predictivos, tendencias o probabilidades útiles.

Los orígenes de esta técnica se remontan a la peste bubónica, la primera vez que la ciencia estadística se puso al servicio de problemas complejos. En 1663, John Graunt fue quien aplicó sistemas estadísticos a las tasas de mortalidad y la evolución de la plaga en Inglaterra. Posteriormente, arribarían otros instrumentos de computación rudimentaria como la máquina perforadora en 1884. El despegue del Big Data se produce hasta la llegada de la computación moderna. En 2001 Doug Laney, un analista de la firma Gartner, definió las dimensiones y propiedades de los macrodatos que se conocen como las 3V (volumen, variedad y velocidad). Este hecho marca el comienzo de un nuevo período en el que big data inicia su desarrollo como herramienta importante del siglo XXI, posteriormente se añaden otras V a la lista, como la veracidad, el valor y la variabilidad.

En 2005 se desarrolló Apache Hadoop, uno de los primeros sistemas de código abierto para el análisis de datos masivos. Sin embargo, fue a finales de 2010 cuando se produjo la aceleración definitiva, con los servicios de almacenamiento de datos en la nube. En 2012, la administración Obama creó la Big Data Research and Development Initiative (Iniciativa de Investigación y Desarrollo de Big Data), a la que asignó 200 millones de dólares, buscando mejorar la capacidad de extraer información valiosa de los datos y acelerar el ritmo de crecimiento de STEM (ciencia, tecnología, ingeniería y matemáticas), aumentar la seguridad nacional y transformar el aprendizaje. 

La importancia o valor del Big Data radica en su capacidad de proporcionar información valiosa que facilita la toma decisiones inteligentes, respaldadas por datos exactos y relevantes obtenidos mediante el análisis de grandes volúmenes de información. Los usos que puede tener esta tecnología es diverso, entre ellos: la detección de fraude al analizar datos de transacciones y detectar patrones sospechosos; análisis predictivo, para detectar desgastes tempranos, fallas y prevenir accidentes; análisis espacial y seguridad pública, permite analizar el tráfico peatonal, identificar embotellamientos y detectar situaciones peligrosas, además de casos de emergencia; en redes de telecomunicaciones, inalámbricas y de informática para monitorear su desempeño, necesidades de infraestructura y priorizar las inversiones; en marketing para identificar tendencias, temas destacados y la opinión del público.

El futuro del Big Data se advierte promisorio, su utilización será de gran ayuda para comprender mejor las causas y efectos en aspectos medioambientales, sociales, gobernanza y seguridad. Contribuir a mejorar la atención médica, identificar patrones en la propagación de enfermedades y prevenir brotes epidémicos, así como para el análisis de imágenes médicas y para el desarrollo de algoritmos de diagnóstico. Además, su utilización y aprovechamiento se puede dar en cuestiones de marketing, transporte, educación, finanzas, deportes, entre otros.

Sin embargo, también hay desafíos significativos que deben abordarse para aprovechar al máximo su potencial. Entre estos se encuentran la seguridad, la privacidad y el cumplimiento normativo y la ética en el uso de los datos. Big data se constituye como un fenómeno realmente interesante. Su utilización está cambiando diversos procesos, además de brindar oportunidades que nunca habíamos visto antes de su implantación.

Ideario en Perspectiva

Proponer que el movimiento social, que representa una voz crítica a las acciones y decisiones del gobierno dentro de un ambiente conciliador y constructivo, donde se ha manifestado la defensa de la democracia y la estabilidad institucional, se convierta en un partido político a partir de los resultados electorales del 2 de junio, equivale a no comprender la necesidad de cambios políticos ni la relevancia de la participación ciudadana.

otros columnistas