Media, mediana y otras medidas del montón

Por 100292017

El uso –muchas veces abuso- de la media aritmética (promedio) como medida de posición central es una constante en los medios de comunicación españoles. Es como si pensaran que su audiencia no va a entender otra medida que no sea la susodicha media, y aunque ese fuera el caso, qué mejor que un periódico o televisión haciendo pedagogía sobre ello.

Mi reflexión nace tras la lectura de un artículo de prensa, publicado el pasado 18 de abril en la versión digital de El País [1]. La pieza analiza  las consecuencias que tendría un tipo impositivo del 75% en el Impuesto sobre la Renta de las Personas Físicas (IRPF) [2], para aquellas rentas que superen el millón de euros, propuesta hecha en campaña por el ya presidente francés François Hollande.

Con el título «75% de IRPF para millonarios: ¿justicia social o castigo al rico?», el autor estudia la relación entre tipos impositivos medios y la brecha entre la renta de clases altas y bajas dentro de los países de la Organización para la Cooperación y el Desarrollo Económico (OCDE) [3]. Uno de los datos que apoya el artículo es la media de los tipos máximos de IRPF, que cifra en un 41,5% para el año 2010.  Si acudimos a los datos originales [4] y observamos la cuarta columna (Top tax rates, año 2010), podemos deducir que la mediana se sitúa en el 45,0% por encima del tipo medio máximo del IRPF para el citado año. La diferencia respecto a la media puede parecer pequeña, pero ¿acaso alguno de nosotros desearía ver subidos sus impuestos en cuatro puntos y medio? Estamos ante un ejemplo de robustez a datos atípicos de la mediana, que no se ve afectada en comparación con la media.

El gráfico de cajas

Aprovecho el tema media vs. mediana para introducir un tipo de gráfico que no hemos visto en las sesiones del curso: el gráfico de cajas, también conocido como de cajas y bigotes o boxplot.

Resulta muy ilustrativo a la hora de representar medidas de localización, como la mediana y los cuartiles; de dispersión, como el rango y el rango intercuartílico; y para visualizar la forma (asimetría).

Dibujamos un rectángulo cuyas bases representan el primer y tercer cuartil de la distribución que estemos estudiando. Además, el rectángulo se verá cortado a lo ancho por otra línea que trazaremos  a la altura del valor que se corresponda con la mediana (en ocasiones se marca, también, un punto o una cruz en el valor asociado a la media). Para completar la representación debemos dibujar una línea que vaya desde el centro de la base inferior, hasta el punto en el que se haya el límite inferior o valor mínimo en los datos. De forma análoga procederemos desde la otra base del rectángulo hasta el límite superior o valor máximo en los datos. Si quisiéramos hacer un gráfico más completo, sustituiríamos los límites inferior y superior por los límites a partir de los cuales consideramos que la variable toma valores atípicos que, usualmente, son Q1-1,5RI y Q3+1,5RI. Finalmente colocaríamos círculos o asteriscos en aquellos valores de la distribución que resultaran atípicos.

Lo interesante del gráfico de cajas es que permite reconocer de forma muy intuitiva cómo es la distribución de los valores de nuestra serie, cuál es la tendencia central y si la variable presenta mayor o menor dispersión.

En el siguiente gráfico tenemos la distribución del tipo máximo del IRPF en los 34 países miembros de la OCDE. El gráfico ha sido elaborado en Excel a partir de una hoja de cálculo que podemos encontrar en [5].

Boxplot del tipo máximo del IRPF en países miembros de la OCDEComo podemos apreciar, el grueso de la distribución se concentra en apenas 8 puntos y medio del IRPF. Añadimos que la muestra se ve desplazada hacia la derecha (asimetría por la izquierda: media < mediana < moda) debido a la existencia de algunos valores atípicos.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s