Italia crea una web de datos abiertos sobre sus casos de coronavirus: estas iniciativas particulares buscan lo mismo en España

Mucho se ha debatido en Italia acerca de si su alabada transparencia en la gestión del coronavirus no ha terminado jugando en su contra, proyectando una injusta imagen del país como "bomba vírica" y foco de difusión del virus. Tienen la sensación de haer sido unos "pardillos" por haber hecho más pruebas que otros países, lo que se ha traducido en más casos diagnosticados.

Sin embargo, pese a todas esas dudas, las autoridades italianas han seguido hasta ahora apostando por la transparencia. E incluso reforzándola, poniendo en marcha incluso una iniciativa de datos abiertos que ofrece las cifras y localización de los casos de coronavirus en el país.

"Para informar a los ciudadanos y poner a su disposición los datos recopilados, útiles únicamente para fines de comunicación e información, el Departamento de Protección Civil ha desarrollado un panel geográfico interactivo" (aquí la versión para móviles) con información sobre los casos diagnosticados, dados de alta y fallecidos a causa del coronavirus, diferenciado por provincias y regiones.

Pero lo importante de dicho 'panel' no es que sea una herramienta útil para visualizar el estado de la crisis del coronavirus en Italia, sino que está alimentado por datos que el gobierno italiano ha liberado bajo una licencia CC-BY (la versión más permisiva de las Creative Commons) y que ha colgado en un repositorio en GitHub, proporcionando libre acceso (y toda la información necesaria) para que otras instituciones públicas o privadas (o meros particulares, si lo desean) creen sus propias visualizaciones y aplicaciones haciendo uso de tecnologías como JSON.

En cualquier caso, las autoridades no hicieron más que ir a rebufo de la sociedad civil: la asociación pro-transparencia italiana OnData ya había habilitado en la misma plataforma un repositorio similar (ya inactivo, ante la existencia de una iniciativa oficial) que incluía la siguiente petición:

"Esta es una buena ocasión para pedir al Ministerio de Salud y Protección Civil que -además de los necesarios PDFs, útiles para la consabida reseña de prensa- genere archivos o servicios en formatos legibles para máquinas, de licencia abierta, certificados, completos, actualizados, lo más desglosados posible y que ofrezca el historial de los datos a lo largo del tiempo".

¿Y en España?

Captura de la web del Ministerio de Sanidad, donde se ven los enlaces a la información desglosada sobre el coronavirus en ficheros PDF.

Sin embargo, en España aún no estamos en ese punto: aunque a los medios se les proporciona también en otros formatos, la información disponible para el gran público en la web del Ministerio de Sanidad tan sólo se ofrece en los tradicionales PDFs, que no son comprensibles por máquinas, lo que exige a quien quiera utilizarlos en proyectos web automatizados la tarea semimanual de extraer los datos de las tablas gracias a herramientas como Tabula.

El primero que realizó tal tarea fue el usuario de Twitter Ecléctikus, que se define como "físico de formación" con "más de dos décadas de experiencia en la adquisición, análisis y tratamiento de datos" y que se lamenta de que los datos no se hagan accesibles "o al menos no fácilmente accesibles, centralizados, explotables... eso hay que hacerlo 'a mano'".

Nos cuenta que decidió crear su web de recopilación y visualización de datos "justo el fin de semana del 7 y el 8 durante el que no se publicaron datos, así que decidí crear una rutina para ir acumulando esa información de una manera automatizada cuando empezara a fluir, utilizando de prueba los dos ficheros que tenía, los del 5 y 6 de marzo".

Y le quita hierro al hecho de que el Gobierno sólo proporcione los datos en PDF:

"Por un lado no es tan grave, hoy es bastante sencillo extraer información de cualquier formato, al menos para los usuarios avanzados y profesionales. Pero por otro lado es un síntoma de algo concreto y evidente, el desfase de organización digital respecto a otros países, singularmente EE.UU. que además aporta todas las tecnologías implicadas".

"Sobre si debería la administración facilitar una mejor visualización, seguro que sí, y además facilitar a los ciudadanos un acceso (relativamente) completo, formatos .geoJSON, .shp... los estándares modernos aptos para transmitir datos geográficos para su explotación inmediata. Como ha hecho Italia, y como hace en EEUU por ejemplo el Johns Hopkins CSSE que utilizo también para los datos globales".

Ecléctikus ofrece en GitHub los archivos .csv con los datos que recopila bajo licencia CC-BY-NoComercial, "es la única limitación, y hasta esa es una limitación relativa, cualquiera puede copiar los datos y no decir nada, eso es inevitable".

Pero desde ayer, un medio de comunicación online especializado en periodismo de datos, Datadista, ofrece su propio dataset con la misma información y desde la misma plataforma, pero bajo licencia CC-BY, lo que abre su puerta a su uso legítimo en proyectos comerciales.

Ver todos los comentarios en https://www.genbeta.com

VER 1 Comentario

Portada de Genbeta