Ejercicios del curso ‘Introducción a la Infografía y la Visualización para Periodistas’ dictado por Alberto Cairo en el Knight Center for Journalism in the Americas y realizado entre enero y abril de 2012.

Ejercicio 1

Ejercicio 2

 Ejercicio_2_Pau_Llop (PDF)

Ejercicio 3

  Ejercicio_3_Pau_Llop (PDF)

Ejercicio 4

Ejercicio_4_Pau_Llop (PDF)

Ejercicio 6

Ejercicio_6_Pau_Llop (PDF)

—-

Ejercicio 5:

La siguiente página está hecha para completar el ejercicio 5 del curso ‘Introducción a la Infografía y la Visualización para Periodistas’ dictado por Alberto Cairo en el Knight Center for Journalism in the Americas.

Para acceder vía interactiva a este ejercicio (si lo está leyendo en PDF): https://paullop.es/visualizacion-datos/

Partiendo de este gráfico mis compañeros y yo debíamos proponer una mejor manera de lograr visualizar aquello que este gráfico no logra realmente:

Gráfico a analizar y mejorar en el ejercicio 5

El titular que el autor extrae de su visualización, como se ve, es “Conducir engorda”. Aunque yo más bien creo que en lugar de extraer el titular, lo que extrae es el gráfico de dicho titular.

Como ya expliqué en el foro del curso, estoy totalmente de acuerdo con lo que ya han aportado los compañeros, sobre todo en el tema de los números absolutos escondidos, la dificultad de comparación y la necesidad de una mayor correlación.

 Igual que en los últimos dos ejercicios ha sido obvio que estábamos ante ejemplos que priman la forma sobre la función, creo que con este gráfico pasa algo parecido, pero más que respecto a la forma, creo que aquí la testarudez radica en el foco netamente periodístico. Creo -quizá analizando datos a posteriori para hacer mi propuesta acabe rectificando- que el autor tenía ya el titular en su cabeza: conducir engorda. Y que al igual que el de las renovables se empeñó a toda costa en mostrarnos los datos en contadores de luz, este se empeña en que nos entre en la cabeza que “conducir, engorda”. ¿Por qué no muestra los datos absolutos? Por cierto, ¿cómo son las distancias en unos estados y otros? ¿Y la posibilidad de usar transporte público? ¿Cuantas calorías por habitante se consume en cada estado? Por mucho que uno ande al trabajo, si en su pueblo están habituados a comer como si no hubiera mañana, estará obeso igualmente.
Para resolver a mejor este gráfico creo que tendríamos que hacer un esfuerzo, antes que en la comparación (que también), en la correlación. No descarto mantener un mapa de EEUU, quizá pintar los estados en un gradiente rojo según la ingesta media de calorías diarias, para que luego podamos comparar con otro de barras otros parámetros, ya veremos, pero yo no tengo claro que podamos mantener ese titular (o al menos solo ese) al final del ejercicio.

Mi propuesta

Tenía claro desde el principio que mi propuesta debía ir a lo básico: contrastar el titular del gráfico propuesto. Comprobar si realmente conducir mucho hacia el lugar de trabajo es lo que hace a los estadounidenses ser la población más obesa del mundo, o si por contra ese (como a mi me parecía desde el primer momento) es un factor de por tan segmentado poco relevante, al menos no lo suficiente como para llevarlo al titular.
Por eso, lo primero que he hecho es: si lo que cuenta realmente (aparte del tipo de dieta) es la actividad física en su conjunto, veamos ésta. Por otro lado, ¿los índices de pobreza y de nivel de estudios no tienen nada que decir al respecto? Estadísticamente se han mostrado muchas veces correlaciones entre los niveles de pobreza y de obesidad en los países en global ricos, y obviamente también hay correlaciones entre nivel de pobreza y nivel de estudios terminados.
Por todo ello, usando la tecnología de Many Eyes y rebuscando y depurando los datos por estados en US Census y otras webs muy interesantes como la de Center for Disease Control and Prevention, traigo esta propuesta (que debe ser leída desde la perspectiva de un ciudadano de EEUU y teniendo en cuenta que el titular es un ‘revés’ al del original propuesto):

No estudiar es lo que te hace gordo

La relación entre los índices de obesidad y de estudios superiores terminados en las poblaciones de los 50 estados de EEUU revela que la formación incide más en estar obeso o no que la propia actividad física. ¿Quizá indica que a mayor nivel de estudios, la dieta es más sana y por tanto se está menos obeso?

Puede observar el gráfico en toda su resolución y capacidad en: Obesidad, pobreza, educación y actividad física en EEUU (barras). Para ver claramente la correlación de la que bebe el titular que sugiero, hay que seguir la siguiente interacción con el gráfico:

          1. Seleccionar arriba a la izquierda ‘Obesos’ (indica el % de personas con IBM superior a 30 en cada estado)

 

 

 

        • Seleccionar abajo a la derecha ‘Data Order’ de forma que se ordene el gráfico de mayor a menor.

 

 

 

        • Seleccionar simultáneamente el valor ‘Educación Superior’ (indica el % de personas con un Bachelor Degree o superior) simultáneamente  con ‘Obesos’ (pulsando Control o  CMD) arriba a la izquierda.

 

 

      Veremos así que los estados con menos obesos son (nada) casualmente los mismos que tienen un porcentaje de personas con estudios superiores mayor. Veámoslo ahora gráficamente por estados. Con el siguiente gráfico podemos ver por intensidad de color qué estados tienen los porcentajes de Obesidad, Pobreza, Menor Actividad Física, Educación más altos, lo que nos permite correlacionar causas y efectos:

Ver en todo su esplendor aquí. Este gráfico nos permite ver un solo mapa y seleccionar qué valor queremos que pinte o ver dos mapas partidos con valores diferentes para poder comparar o directamente ver un mapa por cada valor. Además, en cada mapa podemos seleccionar por franjas de similitud en porcentajes a los estados que las comparten. Por ejemplo, que nos muestre los estados que están por debajo de la media en Obesidad, o en cualquier de los otros 3 valores. Si lo hacemos, veremos como el de la obesidad es el valor que más concentra a todos los estados en la franja superior, de hecho dividiendo la franja posible en seis partes, solo en la tercera (15-20%) aparece un solo estado, Colorado, mientras que el resto están por arriba (20-35%) y ninguno por abajo (0-15%). No pasa con el resto de indicadores, lo cual también nos dice que la obesidad es un problema enorme en EEUU.

El gráfico de dispersión también nos puede proporcionar un punto de vista diferente con estos mismos datos:

Aquí, la forma más útil de visulaizar, en mi opinión, es con la siguiente configuración (aunque el usuario puede cambiarla a su antojo gracias a la interactividad):

          1. Eje Y: Educación superior

 

 

 

        • Eje X: Obesidad

 

 

 

        • Tamaño de la burbuja: nivel de pobreza

 

 

 

        • MouseOver: Estado

 

 

      Este gráfico es el que mejor nos permite correlacionar los diferentes valores. Vemos por ejemplo como Missouri tiene un enorme problema ligado de pobreza, bajo porcentaje de educación superior y un gran porcentaje de obesos (el mayor de EEUU). Lo contrario que Colorado, que queda muy claro que se desmarca por el lado opuesto. Y ya por último, me he atrevido a probar con un gráfico de Stack. La peculiaridad de este gráfico es que nos permite ver la disparidad entre estados en cuanto a las correlaciones entre los cuatro valores, en global y estado a estado, lo cual es muy útil en previsión de que el usuario quiera consultar el detalle de su propio estado (cosa que puede hacer desplegando la lista de la izquierda).

Para ver todo su potencial, antes de analizar estado por estado (que es como se muestra por defecto) conviene ver el agregado, para ello hay que hacer ‘drag&drop’ con la etiqueta “ESTADO” arriba a la izquierda para ponerla por delante de la etiqueta vacía. Mucho mejor ver el gráfico en toda su plenitud aquí.

Para completar el producto de cara al usuario, añadiría un simple calculador de la Masa Corporal (IBM) junto a una explicación de qué significa:

 

Por último: si hubiera encontrado datos desglosados por condados (e incluso por ciudades), sin duda hubiera sido mucho más interesante en cuanto a la interactividad del usuario, que podría haber sementado y comparado ciñéndose a su zona geográfica todavía más concreta. He encontrado datos para el valor de ‘Menor Actividad Física’ y de ‘Obesidad’ a nivel de condado en la web de la CDC, que comparte sus magníficos gráficos de forma abierta, pero al no encontrar tan sementados los otros dos valores, me he tenido que ceñir a los estados.