¿Necesitas un gráfico fiable? Este buscador te ayuda a identificarlo

Que los gráficos resultan tremendamente útiles y que nos ayudan a comprender con mayor profundidad ciertas cuestiones y datos es una realidad de la que la mayoría somos conscientes. De hecho, sirven para percatarse de determinadas tendencias, identificar cuestiones que podríamos haber pasado por alto y un amplio abanico de posibilidades.

Sin embargo, no todos resultan igual de útiles. Un asunto que no podemos perder de vista, especialmente si tenemos en cuenta que la calidad, las cifras representadas, etcétera, pueden, incluso, llegar a influir sobre el análisis final de los datos. Por fortuna el trabajo de un investigador de la Universidad de Washington ayuda a identificar y a buscar los de mayor impacto.

La importancia de las gráficas

Antes de entrar en mayores vicisitudes, sin embargo, merece la pena comentar que el punto de partida de su estudio no fue otro que el cuarteto de Anscombe de Francis Anscombe; un estadista que, ya en 1973 demostró la importancia de que los datos siempre fuesen representados antes de analizarse. Lo hizo de la mano de cuatro conjuntos de datos (de ahí el nombre del experimento) con propiedades estadísticas muy similares y que, en esencia, se parecían tremendamente.

Sin embargo, la sorpresa estribaba es que, una vez representados gráficamente, mostraron una apariencia distinta por completo, una realidad que llevó a replantearse esta cuestión y que, tal y como apuntábamos, ha tomado como referencia el equipo de la citada universidad, encabezado por Po-shen Lee.

Así, estos investigadores han dado con un algoritmo de aprendizaje capaz de buscar las gráficas de los trabajos científicos para, a posteriori, analizarlas y clasificarlas en diferentes categorías. Una “dedicación” que evidencia el “importante papel que las gráficas juegan en el proceso científico”.

“Hallamos una relación significativa entre el impacto científico y el uso de informaciones visuales, en la que los trabajos de mayor importancia tienden a incluir un número mayor de diagramas”, ha comentado Lee. ¿La razón? Según este experto, que “o bien la información visual mejora la claridad del trabajo y da paso a un impacto mayor, o que los trabajos de alto impacto tienden a incluir nuevas y complejas ideas que necesitan de una explicación visual”.

En concreto, su sistema analizó 4,8 millones de imágenes y similares de hasta 650 mil trabajos científicos de la base de datos online PubMed Central, especializada en biología y biomedicina. Algo que logró descomponiendo todas estas tablas y similares en diferentes componentes; una partición que, a su vez, agrandó la cantidad de datos hasta los 10 millones de imágenes.

El algoritmo, asimismo, tiene la capacidad de reconocer cinco tipos distintos: diagramas, fotos, tablas, ventanas de datos y ecuaciones. Una utilidad que le ha permitido establecer que las más comunes son estas penúltimas (que, por cierto, representan un 35% del total). Le siguen las fotos (22%), los diagramas (20%) y las ecuaciones (17%). Las menos frecuentes son las tablas, con una presencia del 5% en esta base de datos. En todo caso, su próximo experimento aplicará el sistema a las ciencias físicas.

Vía | Technology Review

Ver todos los comentarios en https://www.genbeta.com

VER 0 Comentario

Portada de Genbeta