Hace unos días, en la red social Linkedin, datos.gob.es publicaba lo siguiente «La Fundación COTEC ha lanzado recientemente un informe a través del cual mostrar el conocimiento actual sobre la reutilización de los datos abiertos, para identificar directrices y recomendaciones que ayuden a fomentar el uso de los datos en la generación de negocios» (ver enlace a la publicación).

Nuestro Sistema estructura, analiza y almacena miles de datos distintos reales definidos como anónimos, de múltiples fuentes oficiales de España que tienen que ver con personas reales anónimas, cuya información se encuentra almacenada en origen por diferentes categorías (comentario: hablaremos en una nueva y posterior publicación sobre qué hacen, utilizan y cómo tratan otros sistemas y aplicaciones determinados datos de personas), y con los resultados que ofrecemos, facilitamos a los clientes una información que les permite adoptar o modificar decisiones empresariales y direcciones estratégicas.

Por ello, gracias al conocimiento que tenemos de la información en origen, llevamos bastante tiempo comentando que en España, lamentablemente, el tratamiento que se le da a los datos dista mucho de ser el recomendable si de reutilización se trata y puesto que, en general, las distintas Administraciones e incluso entidades como el INE utilizan criterios dispares en cuestiones tan básicas y simples como es, por ejemplo, la ordenación de los datos cuando de reutilizarlos se trata y si lo que se pretende de verdad es darles auténtico valor a los datos, obteniendo conocimiento por medio de toda esa información.

¿Tan difícil es colocar variables de localización, y sus datos adjuntos, siguiendo la misma disposición?

Que algo tan sumamente sencillo se convierta en un ejercicio de «atención» para los usuarios de los bancos de datos de la Administración no tiene sentido, máxime si tenemos en cuenta que la información disgregada por determinados conceptos (seguridad social, contratos de trabajo, etc.) quizás tenga valor para conocer cuestiones puntuales relacionadas con el estado actual del mercado laboral pero el auténtico beneficio que aportan los datos se encuentra, en nuestra opinión, en la capacidad que tenemos de juntar y comparar cientos de variables distintas (mercado laboral, justicia, demografía, renta, etc.) y los miles de resultados diferentes que nos ofrecerían en un inmenso almacén de datos (eso más menos sería Big Data), obteniendo de esa forma respuestas y conocimiento. Debajo, captura con un ejemplo de mala ordenación y estructuración de los datos, en este caso, relacionados con mercado laboral: si ya resulta llamativo que Seguridad Social y SEPE no sigan los mismos criterios de orden o nombre, todavía resulta más chocante cuando la información por localización que ofrece la seguridad social no tiene la misma estructura (pensiones // altas-bajas).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

¿Tan difícil es facilitar información sobre todos los datos que (seguramente) se puedan conocer?

Esta ya es una cuestión que entra en el terreno de la hipótesis, saber el porqué determinados datos no se facilitan o directamente se facilitan sesgados, impidiendo de esa forma tener un conocimiento amplio y detallado de toda la información que suponemos obra en poder de la Administración-Organismo Público, y sea cual sea su tenedora o depositaria. Podríamos poner unos cuantos ejemplos pero por su importancia citaremos sólo dos relacionados con seguridad y justicia publicados en la web del INE:

  • Hasta el año 2012 los datos que se facilitaban relativos a delitos por CCAA se podían ver con distintas variables asociadas (tipo, edad, sexo, etc.), lo que permitiría conocer más y mejor ciertas tipologías, entre otras (ver captura de más abajo, columna de la derecha), y con ello, estudiar e intentar predecir posibles fenómenos y conductas.
  • En la misma imagen, columna de la izquierda, se puede observar que se facilitan múltiples variables asociadas a personas condenadas por resultados nacionales (edad, sexo y nacionalidad) pero dichas variables no se pueden encontrar, por ejemplo, para los resultados autonómicos (¿si tienen unos, porqué no constan los otros?); y al igual que lo apuntado en el punto anterior, gracias a toda esa información nos permitiría trabajar con más detalle fenómenos y conductas en campos tan importantes como la criminalidad y la seguridad ciudadana.

 

Compartir:

Deja una respuesta

Tu dirección de email no se hará pública.

You may use these <abbr title="HyperText Markup Language">HTML</abbr> tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

¿Cómo podemos ayudarte?