Desarrollar tecnología, métodos, herramientas y soluciones innovadoras en el ámbito del volumen, Velocidad, Variedad y Validez de los datos.
El objetivo del proyecto coordinado es desarrollar soluciones innovadoras que afronten los retos planteados en la gestión de datos en la nueva Sociedad Digital caracterizada por el gran volumen de datos accesibles, de calidad y proveniencia heterogénea y cuya integración puede producir un valor añadido que todavía no está siendo aprovechado. Se inscribe así en el reto Economía y Sociedad Digital que en su epígrafe II “Soluciones y Tecnologías innovadoras” destaca la línea prioritaria Open/Linked/Big Data.
Este objetivo está relacionado con las 4V que dan nombre a este proyecto y que actualmente son características de análisis e investigación en el entorno denominado Big Data. Así, para lograr el objetivo planteado se van a considerar la VELOCIDAD y el VOLUMEN en la producción de datos desde la perspectiva de la EFICIENCIA, tanto en el almacenamiento como en la consulta de grandes volúmenes de datos y/o streams de datos; la VARIEDAD desde la perspectiva de la EXPLOTACIÓN SEMÁNTICA de los datos tanto en entornos móviles como fijos, con el fin de obtener información de valor añadido a partir de los datos existentes; y, por último, la VALIDEZ desde la perspectiva del análisis de la CALIDAD de los datos abiertos y su reparación en el caso de que resulte necesario.
En el marco del proyecto coordinado global pretendemos desarrollar tecnología, métodos, herramientas y soluciones en el ámbito de las cuatro “V”s. Para ello hemos organizado 3 paquetes de trabajo de corte tecnológico que atienden respectivamente a la Eficiencia, a la explotación Semántica y la Calidad de los datos. Pero además proponemos un cuarto paquete de trabajo, de desarrollo de prototipos, en el que abordaremos de forma conjunta el desarrollo de aplicaciones en diferentes ámbitos tales como el sanitario, Smart Cities/Gobierno Abierto y Computación Móvil. Esos prototipos integrarán la tecnología desarrollada en los tres paquetes de trabajo anteriores y con ellos pretendemos, por un lado, que sirvan de prueba de concepto y validación de la utilidad de las soluciones propuestas y, por otro lado, poner de manifiesto las ventajas de una gestión alternativa e innovadora de datos. Además los prototipos constituirán por sí mismos un resultado útil del proyecto y permitirán la validación, en el mundo real, de la tecnología desarrollada.
La amplitud del objetivo considerado en el proyecto requiere un esfuerzo investigador en diferentes campos. Así, este proyecto coordinado está integrado por cuatro grupos con experiencia en distintas áreas de la Informática. En concreto, los grupos de la Universidad del País Vasco y de la Universidad de Zaragoza cuentan con experiencia en la utilización de tecnologías semánticas aplicadas a la gestión de datos y su aportación principal se centrará en el paquete relacionado con la explotación semántica de los datos. El grupo de la Universidad Politécnica de Madrid es un grupo con una trayectoria reconocida en el ámbito de Open/Linked Data y la gestión de stream data y su aportación principal se centrará en el paquete encargado de analizar la validez de los datos; y por último el grupo de la Universidad de A Coruña cuenta con una amplia experiencia en el desarrollo de estructuras de datos para la representación comprimida e indexada de los mismos y en el desarrollo de algoritmos de explotación de dichas estructuras y su aportación principal se centrará en el paquete encargado de gestionar el volumen y la velocidad en la procedencia de los datos.