Microsoft ha lanzado una nueva actualización de la versión de escritorio de su suite ofimática Microsoft Office, y ha llegado acompañada de algunas mejoras significativas. En lo que respecta a Excel, la nueva función añadida posiblemente sea una de las más demandadas por sus usuarios.
Y es que los miembros del programa de pruebas de Office Insider Fast ya tienen acceso a la compilación '12905.20000' de Office para escritorios Windows, que incluye la opción de importar, actualizar y analizar datos a partir de documentos PDF.
Para hacer uso de esta función, los usuarios sólo tienen que situarse en la pestaña de 'Datos' de Excel y, en el menú 'Obtener datos', hacer clic en 'Desde archivos' > 'Desde PDF'.
Hay que señalar que los usuarios de Excel ya disponían (como complemento externo al programa) de la herramienta Power Query, que también permitía desde hace poco extraer datos a partir de un archivo PDF. Pero desde ahora será una funcionalidad integrada en Office, y carente de los problemas de seguridad que han caracterizado a Power Query.
¿Por qué es importante poder extraer datos desde un PDF?
El PDF (Portable Document Format) es un formato de archivo muy usado gracias a su capacidad para mostrarse en distintas combinaciones de hardware y software sin que eso modifique el aspecto ni la estructura del documento original.
Gracias a esa característica, probablemente a día de hoy sea el formato más usado por empresas e instituciones públicas para publicar notas de prensa, informes y estudios.
El problema de los PDFs es que, si bien nos permite seleccionar el texto contenido en el archivo, no es posible extraer del mismo tablas de datos, porque éstos, en el proceso de copiado y pegado, terminan perdiendo su orden original.
La importancia de poder extraer datos de los PDFs llevó a desarrollar herramientas como Tabula, un software 'open source' muy usado por periodistas y otros profesionales de los datos que necesitaban trabajar con esta clase de documentos.
Vía | Softpedia.com
Ver 2 comentarios