GeoGig: un nuevo paradigma para la gestión de datos (geoespaciales)

Roldán, Gabriel
Compartir
Históricamente, gestionar un volumen mediano a grande de datos geoespaciales ha sido cuanto menos una tarea impráctica u onerosa. Bien se tiene un montón de versiones diferentes del mismo conjunto de datos (en diferentes shapefiles, bases de datos, etc), o se pierde flexibilidad adaptándose a la forma de trabajo impuesta por una herramienta en particular (generalmente propietaria/privativa como ArcSDE u Oracle Workspace Manager), que incluso resuelven solo una parte del problema, permitiendo sólo un enfoque centralizado y limitando la capacidad de seguir la historia y linaje completo de los datos. GeoGig es un sistema de control de revisión distribuido (DVCS) específicamente diseñado para gestionar datos geosespaciales. GeoGig es software libre, actualmente en incubación como proyecto miembro de la Fundación Eclipse bajo el auspicio de LocationTech, el grupo de trabajo de la fundación dedicado al desarrollo de tecnologías SIG. Se inspira en los principios de diseño del sistema de control distribuído GIT, adaptándolos para la gestión eficiente de grandes volúmenes de datos espaciales. Tras cinco años de desarrollo, ha alcanzado un nivel de madurez suficiente para constituirse en una herramienta para la creación de, e interacción con, repositorios de datos geoespaciales que contienen la historia de edición completa de los conjuntos de datos, de forma distribuida (y desconectada) por naturaleza, que permite la creación inmediata de “branches” o “what-if scenarios”, y permite prácticamente cualquier flujo de trajo para la colaboración en la contribución a la historia de los datos mediante repositorios remotos. Adicionalmente, permite gestionar desde pequeños hasta grandes repositorios mediante diferentes implementaciones de la capa de acceso a datos; la colaboración en la gestión de datos desde diferentes plataformas de cómputo (desktop, server, mobile); y la integración con diferentes herramientas FOSS4G como GeoTools, GeoServer, QGIS, y GeoNode. En esta ponencia presentaremos los principios básicos de funcionamiento de GeoGig y el ecosistema de integración con otras herramientas, desde la creación y gestión de repositorios desde la línea de comandos, la integración con GeoServer y QGIS, y la habilitación de un modelo de colaboración tipo github con GeoNode. Analizaremos diferentes flujos de trabajo posibles, y cómo el diseño y arquitectura de GeoGig abre las puertas a un nuevo paradigma en la gestión de datos geoespaciales, reconocidamente exitoso en el ámbito del control de versiones de código fuente de software, puesto que evita el “vendor lock-in”: tratando el control de versiones como un problema ortogonal a las herramientas utilizadas para la edición; permitiendo definir el flujo de trabajo más adecuado al dominio del problema o proyecto en particular, sin imponer una metodología basada en limitaciones técnicas o estrategias de negocio ​
​Tots els drets reservats