La oposición pidió al Gobierno vasco detalles de contratos, y recibió un PDF inservible: un hacker se ha ofrecido a extraer los datos

La primera vez que nos hicimos eco en Genbeta de los proyectos de Jaime Gómez-Obregón le presentábamos como "un ingeniero y hacker dedicado a desarrollar herramientas digitales que dan más transparencia a la cosa pública". Así mismo, citábamos una frase suya:

"No son lo mismo los datos públicos que los datos publicados".

Por aquel entonces, se dedicaba a crear un 'mapa de la contratación pública de Cantabria', extrayendo datos de más de 25.000 contratos de la Admón. regional. Ahora, se encuentra inmerso en otro proyecto. Y en este queda claro que no sólo importa que los datos públicos sean publicados… sino cómo se publiquen.

Un vistazo a…
Cómo solicitar el CERTIFICADO DIGITAL de PERSONA FÍSICA de la FNMT

En Twitter ha contado en estos días cómo comenzó el pasado mes de diciembre a extraer los datos de 1241 campañas del Gobierno Vasco en medios de comunicación.

"Llevo todo el día pensando cómo presentar mejor esta información a la ciudadanía. Me gustaría implicar a diputados de la oposición o periodistas en su escrutinio".
"Con esas memorias uno no puede saber cuánto se lleva cada medio, ni si el reparto total es equitativo. Con lo que estoy haciendo, sí".

Según cuenta él mismo, la Ley 6/2010 de Publicidad y Comunicación de la Comunidad Autónoma Vasca indica que el ejecutivo regional está obligado a remitir anualmente al Parlamento una memoria que recoja cómo se reparte el dinero público entre los diferentes medios de comunicación.

Y bueno, sí, se cumple. De hecho, la última de estas memorias se publicó el pasado viernes… pero es, como las de años anteriores, un mero PDF de 200 páginas creado con una plantilla de 2017 de Microsoft Word. Ni un triste documento Excel o .csv —ya ni hablemos de un JSON—, que permite acceder directamente a los datos para procesarlos y detectar, así, posibles errores… como éste:

Qué chapuza (vía @JaimeObregon)

Y los problemas no acaban ahí. Hay que sumar la "mala calidad de los datos". Es decir, cuando el dato está ahí, pero se convierte en el primer obstáculo para extraer información útil del mismo. Así, el mismo medio de comunicación aparece apuntado en cada ocasión de forma totalmente distinta, impidiendo que el ciudadano (o la oposición parlamentaria) pueda buscar y correlacionar:

Así, El País puede aparecer como El Pais, El país, elpais…, y El Diario Vasco aparece recogido con el muy explicativo nombre 'DV', por ejemplo. Ojalá existiera en España algún código numérico que identificara a las empresas de forma unívoca… qué sé yo, podríamos llamarlo 'CIF' o algo así.

"El Gobierno Vasco debería proporcionar al Parlamento y a toda la ciudadanía estos datos en un formato abierto y estructurado. ¡Y PDF no lo es! Es solo una falsa sensación de transparencia que obstaculiza la función de quienes queremos entender qué encierran realmente los datos".

Gómez-Obregón ha creado un software que procesa estas memorias, las estructura, e identifica —como en el ejemplo anterior— las partidas mal sumadas. Y de paso, una vez que los datos pasan a estar ordenados y ser computables, pueden saberse sin mucho esfuerzo cosas como

  • Cómo se reparte el dinero entre los medios.
  • Qué medios reciben más dinero público.
  • Si el reparto cumple con las leyes.

Cuando los hackers hacen lo que la Administración se niega a hacer

Y, gracias a eso, será él (que no cobra del erario) quien responda con datos concretos a una petición parlamentaria de la oposición relativa, precisamente, a los pagos realizados a medios de comunicación. Una petición que el gobierno vasco despachó en su momento con un "la Memoria está en elaboración, y tan pronto esté ultimada se remitirá".

Ahora tengo que ver cómo presentar visualmente esta información a través de una herramienta interactiva, similar a lo que hice en http://contratosdecantabria.es. ¡Aunque tengo lo más difícil! Todos datos estructurados en formato JSON! ✌️

En Genbeta | Esta web gratuita para trabajar con mis archivos PDF me ha salvado de presentar un mal trabajo

Ver todos los comentarios en https://www.genbeta.com

VER 6 Comentarios

Portada de Genbeta