Contra los gráficos de tarta

people discuss about graphs and rates

La visualización de datos a través de gráficos, como los gráficos de tarta, no es únicamente una cuestión estética. En numerosas ocasiones y en textos de carácter científico, un gráfico puede expresar mucho más que una tabla de datos o una descripción textual. Un gráfico es una representación de una o varias series de datos, trasladando la misma relación que existe entre los mismos a un patrón geométrico-visual.

Tabla de contenidos

  1. ¿Cómo sabemos si un gráfico es bueno?
  2. Los gráficos de tarta (o diagramas de sectores)
  3. Argumentos a favor de los “gráficos de tarta”
  4. Argumentos científicos sobre el uso de «gráficos de tarta»
    1. La interpretación de gráficos de tarta: no tan precisa
    2. Nuestra percepción de áreas no es tan buena
  5. ¿Realmente necesito representar esos datos en un diagrama de sectores?
  6. En resumen
  7. Bibliografía

¿Cómo sabemos si un gráfico es bueno?

people discuss about graphs and rates
Mejor leerse el café antes de leer esta entrada que va para largo. Photo by fauxels on Pexels.com

Presentar los datos, no solamente de una forma atractiva, facilitando la interpretación y comprensión de los mismos, es una regla básica a la hora de escribir textos científicos, divulgativos o informativos. Los gráficos pueden (y deben) permitir observar de un vistazo tanto los propios datos como establecer comparaciones, tendencias entre los mismos o patrones más complejos.

Por lo tanto, un gráfico debe:

  1. Presentar la información de forma precisa.
  2. Presentar la información de forma accesible y clara, rápida.
  3. Representar que hay más allá de los datos: tendencias, comparaciones…

Por simple oposición a estos puntos básicos, un gráfico nunca será bueno si:

  1. Induce a error.
  2. Ofusca o presenta de forma muy compleja la información. (Mejor una tabla, ¿no?).
  3. No permite interpretar correctamente las relaciones entre los datos.

¿Intentando obtener medidas de los datos en una gráfica? Prueba En ese caso existe un modo sencillo de calibración de gráficas para poder tomar valores desde el archivo de imagen, con precisión.
Calibración de gráficas con Engauge Digitizer

Los gráficos de tarta (o diagramas de sectores)

Gráfico de tarta encontrado aleatoriamente en freepng. Es muy mejorable, tiene muchos sectores con valores muy similares que no permiten comparar bien. Además, tiene el valor encima porque no se entendería sin ellos.

Un diagrama de sectores es una representación gráfica de datos. Estos datos deben ser datos cualitativos (tanto ordinales como no) o cuantitativos, siempre que sean discretos para poder establecer una cantidad finita de valores que puede tomar.

Sobre un área circular se establece una relación de proporción entre un sector circular y el ángulo que corresponde y la frecuencia de cada valor que toma la variable (esto es, un sector, y por eso son gráficos de sectores y no de tarta).

Por lo tanto, el área circular entera corresponde al total de los datos y cada sector nos permite observar la relación respecto al “todo”. Aquí se nos plantean directamente dos cuestiones triviales:

  1. Parece buena idea para visualizar datos en conjunto al total y porcentajes.
  2. Parece buena idea para visualizar variables con pocos niveles de medición.

Aquí cabe destacar el caso de los diagramas de sectores “en 3D” en los que se introduce la información como un volumen cilíndrico dividido en sectores, donde el factor de la perspectiva anula cualquier tipo de escala uniforme que permita recuperar o comprar información, por lo que no se pueden considerar ni un gráfico.

Típico gráfico de tarta en que está TODO MAL. ©ThinknomicsGlobal. Tomado de Thinknomicsglobal.com.

Analicemos el gráfico anterior. ¿Qué es esto? Tenemos un montón de colores similares (o el mismo) para varios sectores. La intención es que cada gama de colores representa una categoría superior que agrupa varias categorías de la variable, pero apenas se distinguen. La variable tiene 13 categorías distintas, muchas forman sectores indistinguibles entre sí, otra es literalmente una línea. No hay leyenda porque también se pone cada categoría al lado.

Como no se puede recuperar o estimar ningún valor del gráfico, el autor tiene que poner al lado de cada sector el dato y, además, por duplicado: absoluto y relativo. ¿No ocuparía menos espacio hacer una pequeña tabla con 13 filas, quizás con valores descendentes o agrupados por categorías superiores? Quizás podría haber realizado un gráfico de barras apiladas, con una barra para cada categoría superior.

Y lo peor de todo, son sectores separados del centro y ENCIMA en «3D». La perspectiva hace que se pierda definitivamente cualquier relación de escala uniforme entre las áreas/ángulos. Es el ejemplo perfecto de un diagrama de sectores que:

  • No presenta la información de forma precisa.
  • No ofrece la información accesible y clara.
  • No permite ir más allá de los datos: no podemos comprar ni comprender qué relación hay entre ellos

Argumentos a favor de los “gráficos de tarta”

  1. Se encuentran prácticamente en cualquier texto divulgativo, informativo y hasta en textos científicos, por lo que pueden ser interpretados por el público en general.
  2. Te permite observar el “todo” para comprar respecto al total.
  3. La comparación es sencilla siempre que tengamos pocas categorías*

*O no, si estas son muy parecidas, ponemos «3D» o por diversas cuestiones que encontraremos a continuación.

sliced cake on plate
En contra de estas tartas no tengo nada. Photo by Abhinav Goswami on Pexels.com

Argumentos científicos sobre el uso de «gráficos de tarta»

Los estudios al respecto se aproximan desde dos direcciones. Primero pueden hallarse estudios a través de la psicofísica, que estudia cómo percibimos la realidad (física) y, por tanto, cómo percibimos longitudes, áreas, ángulos, volúmenes y las relaciones entre ellos.

La segunda vía de aproximación es en torno a la visualización de datos, diseño gráfico y los factores (también psicológicos) que intervienen en nuestra comprensión de los gráficos como una representación.

Lo primero de todo es que debemos tirar a la basura cualquier diagrama de sectores con categorías innumerables, que necesite tener los datos sobreimpresos o que no haga relación a los datos como parte de un todo. Estaríamos de partida en una situación que hace ininteligible o incompresibles los datos o en un formato de visualización que no es el idóneo (y necesitaríamos un histograma, barras…).

La interpretación de gráficos de tarta: no tan precisa

En la investigación sobre visualización de datos, Siirtola (2019) en The Cost of Pie Charts hace una revisión de lo que sabemos actualmente sobre la relación entre percepción y este tipo de gráficos:

“El gráfico de tarta es criticado como un formato ineficiente, dado que el dato que se representa puede ser interpretado desde distintas fuentes (ángulo, longitud del arco, área del segmento circular) (Siirtola et al., 2019). Es conocido que las longitudes (lineales) son mucho más fáciles de estimar que los ángulos, y que la estimación de áreas es mucho peor (Cleveland, 1987).”

En su experimento, comparan la percepción de un gráfico de barras, un gráfico de tarta y una tabla con los datos. Cuando la diferencia entre los sectores o barras es clara, ambos tipos tienen una interpretación mucho más efectiva que una tabla, siendo el gráfico de barras mucho más efectivo. Cuando las diferencias entre los elementos son muy pequeñas, el gráfico de tarta es menos efectivo y preciso que usar la tabla de los datos, pero esto no ocurre con un gráfico de barras.

Kosara y Skau (2016) llevaron a cabo un estudio en la percepción de los diagramas de sectores cuando estos se hallan, además, distorsionados. Esta distorsión bien corresponde a la relación de aspecto entre los dos ejes cartesianos (estirados o comprimidos en alguna dirección), a que los sectores se “separan” entre sí, etc. Además, analizaron los gráficos de este tipo presentes en medios escritos o medios de comunicación. Encontraron que es habitual encontrar diagramas de sectores que incluyen el propio dato sobreimpreso. Esto es una contradicción con la necesidad de utilizar un gráfico si voy a escribir los datos de todos modos (debería usar una tabla), pero mejoraban la comprensión de los mismos, ya que no los estimamos bien de partida. Señalan que, en cierta forma paradójica, los diseñadores gráficos que los han creado ya intuitivamente, comprenden que no son gráficos precisos. 

Ejemplo de un diagrama de sectores que no nos dice nada visualmente, los res sectores parecen exactamente iguales. Se hace necesario incluir el valor. ©ASPECT MR. Ejemplo tomado de Aspectmr.com.

Todos los casos de diagramas de sectores empleados en el estudio resultaron en una sobreestimación de los valores pequeños y una infraestimación de los valores mayores (esto tiene relación con la psicofísica de la percepción visual, como veremos más adelante). En cuanto a los diagramas de sectores “separados” son aún mucho menos precisos. Consideran que el área en blanco entre los sectores introduce un factor de confusión.

Además, en muchas ocasiones este tipo de gráficos toman mucho área en relación con lo que ocuparían los datos en formato texto, en una tabla o en otras opciones. Esta situación se agrava cuando a menudo se añaden etiquetas a los sectores que suelen ir mal dispuestas (con flechas, líneas, junto al área…) en lugar de en una leyenda, extendiendo el área del gráfico de forma innecesaria (y con mucho espacio en blanco, diría yo). Por lo tanto, en cuanto a una “economía textual” mucho más tenida en cuenta en la redacción de textos científicos, tenemos otra razón para evitarlos. No perder espacio.

Ejemplo de como la percepción con perspectiva distorsiona la interpretación del gráfico. En el ejemplo «3D» la categoría B parece ser idéntica a la categoría A, mientras que sin perspectiva se observa que uno es aproximadamente un 45% y un 30% respectivamente. Al mismo tiempo, las categorías C y D parecen tener valores idénticos, y en «3D» E también. Tomado de In y Lee (2017) Recuperado de este enlace.

Nuestra percepción de áreas no es tan buena

En cuanto a los estudios que fundamentan a estos anteriores, encontramos los que provienen de la psicofísica y sobre la percepción humana. En A Psychophysical Investigation of Size as a Physical Variable, Jansen and Hornbaek (2016) recapitulan lo conocido sobre la percepción visual humana. Esta funciona como una ley de potencias P=bS^a. Lo que percibimos (P) es una cantidad que escala un factor b la cantidad física real S, que además se comporta como una potencia. Este modelo se conoce como Ley de potencias de Steven.

Sus resultados concluyen que la percepción de volúmenes y superficies lineales es bastante más precisa que para esferas. Para las esferas, lo percibido rápidamente se malinterpreta si se encuentra codificado en el volumen de un cuerpo esférico. Cuando se codifica en la superficie, se mejora la precisión de la percepción, pero sigue desviándose de forma notable.

Si ya cuesta distinguir en volúmenes, ¿qué es lo que están tomando como referencia aquí? La pirámide azul parece varias veces la roja pero no así el valor que ofrecen. Tomado de Politikon.es.

Macdonald-Ross (1977) ya comprobó que la percepción de las áreas de sectores circulares/círculos son generalmente infraestimadas (el factor b y a son menores que 1). De esta forma, cuando observamos un gráfico percibimos mejor y comparamos mejor entre gráficos de barras que otros basados en áreas circulares o cuadradas, y mucho mejor que otros basados en volúmenes como cubos o esferas.

Y aquí entra también cómo percibimos otro tipo de infografías que usan círculos para representar datos, como por ejemplo, círculos que según su tamaño representan una cantidad numérica. En el caso de los círculos, ¿qué parámetro es el que recoge la variable: el radio-diámetro o el área? No es lo mismo la percepción de un círculo respecto a otro con un radio que es el doble que otro cuyo área es el doble. Se puede malinterpretar de una forma muy importante los datos cuando los representamos en áreas circulares codificando el dato en el radio respecto a emplear el área.

Cuando usamos el radio como variable, la diferencia es mucho más sobreestimada. Las diferencias utilizando el volumen como variable son mucho más realistas. Dentro del círculo que depende del radio para el valor 3000 parece caber una decena de círculos como los del valor 1000.

¿Realmente necesito representar esos datos en un diagrama de sectores?

A menudo encontramos diagramas de sectores que ocupan más espacio de lo que podría ser una referencia a los datos en el mismo texto. Por ejemplo, representar los resultados de una encuesta en la variable “sexo” siendo esta una variable dicotómica/binaria: hombre o mujer. ¿Tiene sentido representar un diagrama en que aproximadamente los dos valores son cercanos al 50%? Si lo que quisiéramos indicar que no existe esa igualdad (por la población objeto del estudio, por sesgos u otras razones), ¿no es más sencillo indicar y discutir dicho dato en el texto? Si indico que en mi estudio un 20% solamente son mujeres, por sencilla lógica la otra parte son el 80%.

¿Esto era necesario? Tomado de un trabajo escolar en Scribd.

Quizás el uso más racional e indicado para este tipo de diagramas o gráficos sea a nivel divulgativo, para introducirlo como parte del diseño gráfico o narrativa que acompaña a la información. Especialmente si tratamos con un concepto que englobe la totalidad.

Spence y Lewandowsky (1991) en Displaying Proportions and Percentages, así como Tufte (1983) en su obra de referencia casi universal sobre visualización de datos, recomiendan siempre usar tablas en detrimento de los gráficos cuando los conjuntos de datos son menores a 20 observaciones/muestras. Además, dado que la percepción de la longitud es mucho más exacta que la del área, recomiendan emplear un gráfico de barras o de cualquier otro tipo frente a un diagrama de sectores, al estar basados en el área.

Sin embargo, reconocen la utilidad del diagrama de sectores cuando se quiere representar proporciones y comparar entre estas respecto al total, entre ellas, o simplemente queremos que el lector tenga una idea estimada del orden de magnitud en lugar de un dato más preciso.

El empleo de estos gráficos en cualquier caso está supeditado a los primeros principios que enunciamos, que no se representen valores muy similares, ya que nos los distinguimos, a no usar un número elevado de categorías, que sea claro y legible. Los expertos en diseño gráfico y visualización de datos generalmente siempre recomiendan sustituir cualquier diagrama de sectores por otras opciones, pues estas son más fiables y nos pueden evitar caer en un horror barroco de gráficos de tarta ininteligibles.

El gráfico de tarta de las tartas. Aquí se usa el concepto del diagrama de sectores como parte de la infografía y la narrativa. La fuente original parece no existir ya, pese a que la imagen sobrevive a base de copias. El enlace original recuperado en Wayback Machine.

En resumen

  • Para pocos datos siempre suele ser más útil presentar una tabla, sobre todo si no vamos más allá con relaciones o tendencias de los datos.
  • Para datos que queremos comprar en función del total, usar un gráfico de barras apiladas.
  • Relegar a los diagramas de sectores a casos muy claros, divulgativos, donde queremos mostrar órdenes de magnitud y comparaciones.
  • Si empleamos áreas circulares para comprar entre sí, siempre usar el área como variable y no el diámetro.
  • Tener siempre en mente los principios que hacen que un gráfico sea bueno, idependientemente del formato elegido.

Bibliografía

Publicado por Rafael

Graduado en Física y docente en Educación Secundaria. En el Máster en Formación del Profesorado comenzó en la investigación en la Didáctica de las Ciencias Experimentales. Cuenta con comunicaciones y artículos publicados sobre su trabajo predoctoral. Ha colaborado en diversas iniciativas de divulgación científica y astronomía aficionada.