Please enable JS

Datos disociados y georreferenciados en las nuevas políticas de datos abiertos

Datos disociados y georreferenciados en las nuevas políticas de datos abiertos

Datos disociados y georreferenciados en las nuevas políticas de datos abiertos

13/03/2018 / Ignacio Durán Boo /Geo y Catastro

En un reciente evento sobre datos abiertos en el que participaron todos los sectores interesados, varios representantes de distintas Administraciones Públicas invitaron a las empresas reutilizadoras presentes a manifestar sus peticiones respecto a los datos que necesitan o gestionan, lo que permitió introducir el debate sobre los datos disociados y georreferenciados.


Atendiendo a esta invitación, algunas de las respuestas que se produjeron indicaron que, para que realmente pueda avanzarse en la construcción de modelos analíticos y de sistemas eficientes de inteligencia artificial, las Administraciones Públicas deberían abrir los datos personales, tras someterlos al adecuado proceso de  disociación, así como vincular toda su información a un dato geográfico (coordenada, referencia catastral, dirección postal, secciones INE, Distritos Postales, etc.) que permita su geolocalización. De forma concreta, se citó como ejemplos de datos disociados y georreferenciados de interés los datos fiscales y los sanitarios, sobre los cuales se podrían generar importantes servicios y productos de gran valor añadido, tras su disociación.

Para entender el alcance de esta propuesta se puede utilizar el siguiente ejemplo: Respondiendo a una petición de información sobre el impacto de la contaminación urbana sobre la salud de los vecinos de la Comunidad de Madrid, los responsables del sistema público de salud responden con una tabla que sólo aporta datos totales del número de enfermos por distintos tipos de enfermedades, agrupados por municipios.

Con estas limitaciones, se entiende fácilmente el bajo nivel calidad y precisión de la información que puede obtenerse tras la explotación de dichos datos.

Pero imaginemos ahora que los datos personales de los enfermos se suministran tras un proceso de disociación, -lo que facilitaría conocer por cada tipo de enfermedad cuestiones tan relevantes como el sexo, la edad o los hábitos de consumo de los enfermos, sin amenazar el origen protegido de los mismos-, y asociándolos posteriormente a un indicador geográfico, como puede ser el Distrito Postal donde se sitúa su domicilio y su lugar de trabajo. En este caso, el análisis que podría realizarse es totalmente diferente, puesto que la explotación de los datos nos permitiría responder a preguntas tales como:

- ¿Existe alguna relación entre una determinada enfermedad y el lugar de residencia o de trabajo del enfermo?

- ¿Las personas que realizan grandes desplazamientos entre su domicilio y su lugar de trabajo enferman más o menos que las que no se desplazan a grandes distancias?

Si además integramos en el análisis otros datos relevantes, como los de tráfico o los climatológicos, el resultado que se puede obtener es del máximo nivel.

La utilización de este tipo de análisis, poniendo especial interés en geolocalizar el dato, no sólo genera más riqueza en el resultado, sino que también permite “abrir las mentes” y ver la información de otra forma. Un ejemplo concreto lo tenemos en un reciente estudio realizado por la Universidad de St. Andrews en la que propone una “nueva manera” de calcular la densidad de habitantes de un país. Tradicionalmente se han utilizado sólo dos datos para ello: la superficie del país y el número de habitantes. Con este criterio, creado muchos años antes de que dispusiéramos de las actuales herramientas de geoanalítica, España se sitúa entre los países menos poblados de Europa, con 93 habitantes por kilómetro cuadrado. Muy lejos de Holanda (446), Inglaterra (405), o Bélgica (358).

Sin embargo, si fragmentamos el territorio de Europa en cuadrículas de un kilómetro cuadrado de superficie y estudiamos cuál es la densidad real de población que vive en cada uno de esos espacios, la información que obtenemos es radicalmente diferente. Resulta que de las 33 áreas de un kilómetro cuadrado que incluyen una población mayor a 40.000 habitantes, 23 de ellas se encuentran en España y 10 en Francia, pero no hay ninguna en Inglaterra, Holanda o Bélgica. En Barcelona, además, se sitúa el kilómetro cuadrado con más densidad de habitantes de Europa: 53.000 personas viven en él.

Con estos datos en la mano, ¿sigue siendo válido calcular la densidad de habitantes de un país sólo con los datos de extensión total y número de habitantes? Es evidente que no.

Siguiendo con la reflexión, es oportuno señalar que el pasado día 27 de febrero se abrió el periodo de exposición pública del Proyecto de Real Decreto por el que se regulará la reutilización de la información del sector público estatal. Durante este periodo el documento se somete al trámite de audiencia e información pública, lo que permite aportar sugerencias a su contenido.

Aprovechando esta oportunidad podrían hacerse dos sugerencias que agregarían valor al texto. En primer lugar, la norma debería reforzarse para lograr un mayor compromiso respecto a hacer efectivo el acceso a los datos personales previamente disociados, como parte de la nueva política de datos abiertos. Desde las primeras normas reguladoras ya se prevé esta posibilidad. Sin embargo, la práctica demuestra que muchos de estos datos, como los fiscales o los sanitarios, todavía no están disponibles. El texto del proyecto de Real Decreto en relación con esta cuestión no aporta nada que no exista ya, y ya sabemos que si seguimos igual sólo conseguiremos lo mismo.

Y en segundo lugar, sería muy positivo que el nuevo Real Decreto incluyera alguna previsión que impusiera a los productores y gestores de datos públicos un esfuerzo adicional para que toda la información ofrecida pudiera geoposicionarse en algún nivel. En este sentido la Dirección General del Catastro y el Instituto Geográfico Nacional ofrecen buenas herramientas para hacerlo.

Comentarios/0