Afirmaciones como la siguiente: “estamos en la era de BIG DATA” las encontramos sistemáticamente en los últimos tiempos tanto en el medio académico como en los medios de comunicación, las empresas y el gobierno.
Los conceptos de Data Driven Science y Big Data han llegado a ser motivos de prioridad de estado en las naciones más desarrolladas.
El volumen de datos disponibles que se pueden utilizar para mejorar las decisiones ha aumentado de forma exponencial en los últimos diez años. Internet, registros de salud, e incluso los teléfonos inteligentes se han convertido en sensores que proporcionan las fuentes de datos masivos.
Por ejemplo, se puede encontrar en la página del banco BBVA lo siguiente:
Sin embargo, en general, no se define con precisión a qué nos referimos con problemas de BIG DATA, y nos encontramos en muchos casos con aplicaciones rutinarias y mal desarrolladas que terminan en una gran frustración.
Las áreas de aplicación son muy variadas, desde la bioinformática, la matemática del genoma, las neurociencias, los sistemas biológicos complejos, la astroinformática, las finanzas, las redes de comunicaciones, las redes sociales, las transacciones comerciales, así como las ciencias sociales, el marketing y el marketing político entre otras muchas.
Sin pretender dar una definición precisa de los problemas de BIG DATA, desde nuestro punto de vista, involucran el análisis (estocástico en general) de grandes volúmenes de datos en dimensiones muy grandes o en dimensión infinita típicamente mal condicionados.
Los métodos tradicionales desarrollados por la estadística, en particular por la estadística multivariada clásica resultan inadecuados, y se requiere desarrollar nuevas teorías y métodos estadísticos y computacionales para abordarlos en forma responsable.
Nuestro objetivo es crear una Red de Centros de Investigación de carácter académico interesada en las aplicaciones de nuevos modelos matemáticos en problemas de Big Data a los efectos de potenciar las capacidades de análisis con que contamos en cada uno de los centros adheridos.
En una primera etapa participarán los siguientes Centros de Investigación:
Centros de Investigación
- Centro de Modelamiento Matemático (CMM)
Facultad de Ciencias Físicas y Matemáticas, Universidad de Chile
En particular los Laboratorios de Computación de Alto Rendimiento, de Bioinformática y Ciencias del Genoma y de Astroinformática. - Cepid NeuroMat
Universidad de Sao Paulo, Brasil - Centro de Investigación en Matemática (CIMAT)
México - Centro de Análisis de Big Data (CABIDA)
ANII – Centro de Matemática – Instituto Pasteur de Montevideo, Uruguay - Departamento de Matemática, Fac. de Ingeniería Química
UNL, Santa Fe, Argentina - Instituto de Matemática Pura e Aplicada (IMPA)
Rio de Janeiro, Brasil - Instituto de Cálculo
Facultad de Ciencias Exactas y Naturales de la UBA, Argentina - Facultad de Ingeniería y Ciencias
Universidad de La Frontera, Chile - Programa de Análisis Social de la Ciudadanía Audiovisual Latinoamericana (PASCAL)
Universidad de San Martín, Argentina - Instituto de Matemática e Estatística
Universidad de Sao Paulo, Brasil
Institutos, servicios y laboratorios asociados
- Instituto de Neurociencia Cognitiva y Traslacional (INCyT)
INECO, Universidad Favaloro, CONICET, Argentina - Laboratorio de Investigación en Neurociencias
Departamento de Matemática, Universidad de San Andrés, Argentina - Instituto Peruano de Investigación de Familia y Población (IPIFAP)
Perú - Servicio Agrícola y Ganadero (SAG)
Chile
Entre los distintos centros que integran la red, contamos con expertos que ya han abordado problemas de BIG DATA en bioinformática, la matemática del genoma, las neurociencias, la astroinformática, las finanzas, el análisis de imágenes, el aprendizaje supervisado y semisupervisado, el estudio de redes complejas (redes de comunicaciones, redes sociales, redes en neurociencias, internet) así como las ciencias sociales, y el marketing político entre otras, desde un punto de vista teórico y aplicado.