En el discurso político cotidiano no es raro que salgan a colación conceptos como 'Administración Electrónica', 'accesibilidad' o 'transparencia'. Pero 'discurso' y 'hechos' suelen tener poco en común en este ámbito, y existe un vicio recurrente de la Administración Pública española que lo deja bien claro: el amor de ésta por los documentos PDF.
Pero, ¿por qué apostar por un formato de archivo concreto podría ir en detrimento de la accesibilidad y/o la transparencia? El ciberactivista (y hacker) Jaime Gómez-Obregón, conocido por su lucha contra la opacidad gubernamental, acaba de abordar en X este debate en particular.
Para el ciberactivista, la diferencia entre datos estructurados y desestructurados es clave, y lo explica con un ejemplo para 'dummies':
"Datos estructurados: lo que sale de Excel. Datos desestructurados: lo que sale de Word".
Hace un par de años, hablando sobre la importancia de liberar los datos del Registro Mercantil, Gómez-Obregón difundió este vídeo en el que Hitler explica qué se puede hacer con todos esos datos estructurados:
Ejemplos de 'malas prácticas'
Gómez-Obregón denuncia una tendencia preocupante entre los políticos y administraciones: el uso excesivo y muchas veces inapropiado del formato PDF para divulgar información que, por ley, debe ser pública y accesible. El ciberactivista critica que, cuando los gobiernos se ven obligados a publicar información, optan por hacerlo en PDF, complicando el análisis y la reutilización de los datos.
Un ejemplo claro de esta práctica es, según él, la publicación por parte del Gobierno de la lista de bienes inmatriculados por la Iglesia. La información, que debería ser accesible y fácilmente manejable por medios de comunicación y entidades cívicas, fue inicialmente publicada en un PDF de más de 5000 páginas. Esta maniobra fue calificada por Gómez-Obregón como "un insulto".
Solo después del revuelo causado, el gobierno decidió publicar la lista en un formato estructurado, como una hoja de cálculo, facilitando su consulta y análisis. También, a raíz precisamente de otro tuit suyo, la Cámara de Zaragoza retiró de su web un documento que Gómez-Obregón definió como un 'récord sideral': un documento PDF de 24.000 páginas. Aunque, en este caso, no se ha publicado en ningún otro formato alternativo.
Gómez-Obregón señala que desestructurar datos es fácil, pero estructurarlos de nuevo puede ser extremadamente complejo, un reto al que se enfrentan constantemente quienes vigilan la Administración Pública. Como parte de su propio trabajo en este sentido, Gómez-Obregón destaca lo logrado en su portal 'gobiernovasco.marketing', donde logró convertir datos desestructurados en PDF a un formato estructurado como JSON.
¿Qué tienen que tener claro los políticos y los funcionarios?
La crítica de Gómez-Obregón no se detiene ahí. Hay tres cosas que, según nuestro protagonista, "la gente de la Administración debería tener súper claro":
- PDF no es un contenedor para datos. "Si estás exportando de hoja de cálculo a PDF, o si tu PDF solo contiene tablas, seguramente estés haciéndolo mal".
- PDF no es un documento estructurado. "Sobre datos en PDF no se puede hacer análisis. No se pueden aplicar fórmulas. No se pueden utilizar métodos informáticos para extraer conclusiones".
- PDF no es un formato web. "Cada vez que desde un portal oficial enlazas a un PDF, un gatito muere". Aunque hay quien no estaría de acuerdo con esto último.
¿Usuarios con conocimientos básicos o políticos con conocimientos avanzados?
Lo cierto es que hace años que ciberactivistas y periodistas vienen insistiendo sobre este asunto, y los poderes públicos no sólo siguen usando PDFs, sino incluso PDFs compuestos de imágenes escaneadas, lo que en muchos casos obliga a recurrir también a herramientas OCR.
El 'Principio de Hanlon' reza "Nunca atribuyas a la maldad lo que se explica adecuadamente por la estupidez", pero es legítimo preguntarse si en este caso no están encubriendo como falta de conocimientos informáticos lo que, en realidad, no es sino un conveniente y constante boicot a la transparencia de la Administración.
Imagen | Marcos Merino mediante IA
Ver 2 comentarios