Lucía Málaga y Hazel Rosas
Índice de contenido
1. Selección del tema
2. Descarga y procesamiento de datos
3. Selección de herramienta de visualización
3.1 R / RStudio
3.2 Tableau
3.3 Flourish
3.4 DataWrapper
3.5 Excel
4. Selección de medio narrativo
Selección del tema
En primer lugar decidimos que queríamos visualizar aspectos relacionados con la corrupción. Elaboramos un primer esquema conceptual de lo que creímos podíamos decir. Decidimos usar datos del Latinobarometro y elaboramos algunas visualizaciones exploratorias.
Nuestro tema tiene como foco de análisis examinar la brecha que hay en la capacidad institucional para enfrentar la corrupción y la confianza ciudadana a nivel de América Latina.
Descarga y procesamiento de datos
Se descargaron los datos de Latinobarometro para la región y para todos los años para así ver si había una tendencia de interés. Se consideraron dos aspectos: percepción de avances en la lucha contra la corrupción y las multiples dimensiones de confianza.
Los datos descargados de Latinobarometro requieren de algunas modificaciones para que se puede identificar las tablas, columnas, filas y encabezados. En algunos casos es suficiente con eliminar algunas filas y columnas para dejar en el documento sólo la estructura de la table. En otros, se requiere hacer alguna transposición de datos o generar variables nuevas. Ya que Latinobarometro permite la descarga en Excel esas modificaciones se hicieron directamente sobre el archivo utilizando las herramientas de este procesador.
Para evitar alterar los datos originales se mantuvo estos en otra hoja del mismo libro de excel. Puede ver todos los datos utilizados, las visualizaciones y las alteraciones efectuadas en esta carpeta.
Posteriormente identificamos un documento adicional que consideramos valioso en la narrativa planteada, el índice de Capacidad para Combatir la corrupción. En este caso no se contaba con una base de datos, sino con un documento en pdf. Los datos fueron recogido del pdf e ingresados en un excel para permitir el procesamiento.
Selección de herramienta de visualización
Se exploró cuatro herramientas de visualización y finalmente se utilizó los gráficos elaborados en Datawrapper. A continuación comentaré las herramientas utilizadas.
R / RStudio
Para instalación de R ver https://www.r-project.org y para instalación de RStudio, que es un IDE para R y Python ver https://posit.co/download/rstudio-desktop/
Esta fue la primera opción explorada. Permite personalizar los gráficos y da gran control sobre los resultados pero las visualizaciones no resultaban satisfactorias y hacer los ajustes que queríamos requerían hacer muchos códigos. Adicionalmente, si bien los resultados podían obtenerse en html, no daba opciones sencillas para incrustar los gráficos en una entrada de WordPress u otro documento HTML. Para un ejemplo de los resultados obtenidos ver este HTML de los gráficos elaborados y pasos realizados para obtenerlos.
Tableau
Para utilizar Tableau ver https://www.tableau.com. Además, Tableau ofrece una opción gratuita en la que se trabaja exclusivamente en línea https://public.tableau.com/app/discover.
En este caso sabíamos que la herramienta es poderosa y relativamente fácil de usar. Quisimos incluir en la visualización de los contenidos líneas de tendencia pues en la información descargada habíamos incluido mucho años, sin embargo, eso requirió una mayor modificación de los datos pues en tableau para hacerlo requeríamos tener una columna por año, una para el porcentaje y otra para país. Para la modificación requerida ver hoja Data-TLDR2 en este documento.
Tableau tiene muchas opciones para manejar los datos pero a veces las visualizaciones demoran en cargar, y requiere un nivel intermedio de procesamiento de los datos. Su diseño es más adecuado para un dashboard interactivo y no tiene opciones muy amigables para la descarga de imágenes manteniendo la transparencia del fondo, pero tiene varias opciones de personalización de los resultados finales. En este enlace a un perfil de Tableau se pueden ver algunos de los gráficos realizados y en este enlace un primer esquema con esbozo de contenidos que incluye imágenes diseñadas con Tablea.
Flourish
Para utilizar Flourish es suficiente con entrar a su web y explorar en su amplia gama de visualizaciones https://flourish.studio. En nuestro caso utilizamos algunos mapas e intentamos descargarlos manteniendo transparencias para poder utilizarlos en un video. Sin embargo, las opciones de descarga eran más limitadas que en datawrapper que utilizamos después.
Como Flourish tiene más opciones de gráficos que datawrapper utilizamos también un gráfico de personas para mostrar porcentajes, pero el resultado final no se ajustaba a nuestras necesidades visuales y las opciones de ajuste de la visualización no nos resultaban adecuados por lo que no lo utilizamos en el trabajo final.
Ver gráficos elaborados abajo
DataWrapper
Para utilizar DataWrapper pueden entrar a https://www.datawrapper.de. Ofrece un número de gráficos más reducido que Flourish pero la utilización de la plataforma es muy sencilla pues una vez colocamos los datos tal como los tenemos organizados nos presenta sugerencias de gráficos más adecuados.
Una de las ventajas es que permite la descarga de las imágenes en PNG de diferentes tamaños y manteniendo la transparencia del fondo.
A continuación puede verse una variedad de figuras que se trabajó para este trabajo. Sin embargo, no todas se incluyeron en la presentación final.
Capacidad de lucha Contra la Corrupción (2023)
Este indicador es elaborado en base a entrevistas con especialistas. Considera tres dimensiones y se elaboró un mapa para cada una de estas.
Percepción de avances en la lucha contra la corrupción (Latinobarometro 2023)
En este caso se contó a quienes consideraban que en los dos años previos a la encuesta se ha hecho POCO o NADA en la lucha contra la corrupción en su país.
Desconfianza (Latinobarometro 2023)
En estos casos se sumó el número de quienes decían que no confiaban NADA en la institución con quienes indicaban que confiaban POCO en la institución y se generó una sola categoría que denominamos desconfianza.
Desconfianza (Latinobarometro 2023 – mapas)
Excel
Finalmente, elaboramos uno de los gráficos en Excel. Era un gráfico de barras y datawrapper no permitía personalizar las dimensiones para ajustarse a las características que requeríamos. Como los datos ya estaban procesados y sólo requeríamos una imagen estática fue un caso adecuado para esa visualización puntual
Selección de medio narrativo
Después de explorar la opción de una redacción acompañada de gráfico (ver primer esquema con esbozo de contenidos aquí), optamos por un video corto lo cual permite retener más fácilmente la atención de la audiencia. Además, decidimos centrar nuestro análisis en un sólo año, 2023, para disminuir la posibilidad de una recarga excesiva de los contenidos informativos.