Análisis y consideraciones sobre la implementación del registro estadístico de territorio
Text Complet
Compartir
El Registro estadístico de territorio (RET) es un sistema de información basado en registros administrativos cuyo objetivo es la validación y geolocalización de las direcciones asociadas a los microdatos.
Tras un análisis exhaustivo, se determinaron como fuentes más adecuadas la información sobre fincas y bienes inmuebles del Catastro y los censos de edificios, con el apoyo servicios de geocodificación del Institut Cartogràfic i Geológic de Catalunya (ICGC).
Dado que Catastro e INE utilizan un conjunto de códigos de vías diferentes y expresiones diferentes de la parte vertical de las direcciones, ha sido necesario construir una tabla de equivalencias entre ellas, tanto de la parte horizontal (portal) como de la vertical (planta y puerta).
A nivel horizontal, la construcción de la tabla se ha realizado combinando la comparación entre literales y las relaciones geométricas entre polígonos que aproximan las vías, construidos mediante el “Concave Hull” o “Convex Hull” de los centroides de las fincas (fuente Catastro) y de los portales geocodificados (fuente INE).
Al construir las geometrías asociadas a las “vías Catastro” (aproximadamente 80.000 polígonos) se han detectado un subconjunto de polígonos que podrían contener puntos mal geolocalizados. Para comprobar la calidad de esta operación, se han calculado un conjunto de indicadores que clasifican los polígonos según la posibilidad de contener o no puntos mal geolocalizados.
Sobre una muestra de polígonos, se ha verificado si la predicción de los indicadores era correcta. Además, se han comparado los resultados según diferentes métodos estadísticos como análisis discriminante, árboles de inferencia condicional o análisis clúster.
Los indicadores se crearon combinando variables relacionadas con la distancia entre dos puntos de un polígono, como pueden ser su media, desviación estándar, distancia máxima, diferencia de distancias… A partir de la observación y análisis de las técnicas anteriormente citadas, los indicadores se optimizaron.
Adicionalmente, se han creado seis grupos en los indicadores seleccionados, dependiendo de la proporción de polígonos realmente erróneos. Por ejemplo, si se observan los dos grupos de valores más extremos, se obtiene un grupo “conflictivo” donde más del 90% de los polígonos de la muestra son realmente erróneos (esto afectaría a un porcentaje muy pequeño de los polígonos de Cataluña), en contraposición a otro donde el porcentaje de polígonos erróneos es menor al 10% (perteneciendo a este grupo un alto porcentaje de polígonos)
Tots els drets reservats