Si enciendes la televisión o abres un periódico, lo más probable es que aparezca una cocinera o un cocinero. La cocina está de moda. Por lo tanto, no es extraño que hasta las disciplinas científicas «se cocinen», es decir, se aderecen con la interpretación más conveniente para quien las analiza. En el caso de la estadística, y dado el periodo preelectoral-electoral-poselectoral (y vuelta al principio) en el que nos encontramos en nuestro país, «cocinar datos» se ha convertido en un término de uso habitual.

Pero ¿qué significa?

En el buen sentido se refiere a discriminar entre las variables y los datos que son relevantes para el estudio y a expresar los resultados obtenidos en términos fácilmente comprensibles. En el mal sentido, implica manipulación. Detengámonos en tres casos.

La primera forma de manipulación se produce en la elaboración de gráficos. Los dos diagramas que aparecen a continuación corresponden exactamente a los mismos datos: ingresos en millones de dólares de una empresa de telecomunicación desde el año 2011 hasta 2015 (tabla 1):

Tabla 1: Ingresos por año

Tabla 1. Ingresos por año

Figura 1: Gráfico de barras:  Relación entre año de jercicio e ingresos en millones de dólares

Figura 1. Gráfico de barras: relación entre año de ejercicio e ingresos en millones de dólares

El diagrama de barras de la figura 1 indica cómo apenas ha habido variación en las ganancias de la empresa. Pero si deseamos mostrar los datos en la junta de accionistas, podemos modificar el eje vertical del gráfico recortándolo; en vez de comenzar sus puntuaciones por el valor «0», partimos del valor «2,16». De este modo, el incremento de ingresos parece muy superior (figura 2).

Figura 2: Gráfico de barras:  Relación entre año de jercicio e ingresos de una empresa en millones de dólares

Figura 2. Gráfico de barras: relación entre año de ejercicio e ingresos de una empresa en millones de dólares

Mismos datos, diferente forma de organizarlos gráficamente, distinta interpretación.

Otro modo de falsear resultados es trabajar con muchas muestras pequeñas en lugar de tomar una única muestra más grande. Se emplea frecuentemente como forma de demostrar las bondades de determinados productos comerciales. Por ejemplo: se desea vender un producto con aparentes propiedades adelgazantes. Para comprobar sus efectos, se prueba en 20 muestras compuestas de 10 personas cada una de ellas. En 19 de las muestras, ninguna persona ha adelgazado significativamente con el producto. Pero en una de las muestras, por el mero efecto del azar o por la influencia de otras variables, 8 de las 10 personas adelgazan. Se toma dicha muestra como representativa del estudio y se afirma que el producto es eficaz el 80% de las veces.

Por último, siempre se pueden interpretar los resultados de diferente forma en función de los estadísticos que se calculen. Habitualmente se emplea la media aritmética (promedio de puntuaciones) como índice global de las puntuaciones de una muestra. Pero la media está influida por todas las puntuaciones del grupo y solo debería calcular cuando los datos se ajusten a la distribución normal. Por ejemplo, imaginemos que se calcula la media de edad de las personas que acuden a un local de ocio nocturno a partir de la 4 de la mañana y se obtiene un valor de 62,5 años. No parece muy real. ¿Qué ha ocurrido? Que ha entrado una persona de 85 años, vecino del edificio en el que se encuentra el local, para quejarse de que el ruido de la música no le permite dormir; su elevada edad ha incrementado la media convirtiéndola en un índice poco útil para conocer las características reales de la muestra.

Pero no solo mienten las estadísticas, sino también las personas a las que se pregunta mediante las encuestas. Estamos cansados de escuchar cómo la mayoría de las personas afirman que los programas que más ven en televisión son los documentales sobre naturaleza; sin embargo, el índice de audiencia de las cadenas que los emiten es el más bajo de todos.

¿Qué ha ocurrido con la falta de concordancia entre los resultados electorales que preveían las encuestas y los resultados reales? ¿Mentía la estadística? ¿Mentían las personas encuestadas? ¿O ambos? Una de las razones de estos errores es la inadecuada elección de la muestra de sujetos encuestados. Los resultados solo son confiables si la muestra de sujetos seleccionada para la encuesta es representativa de la población estudiada. Pero conseguirla es complicado y demasiado caro.

Seamos cautos a la hora de valorar los estudios estadísticos con los que nos encontremos y analicemos todas sus características antes de considerarlos fiables. Y más en psicología, teniendo en cuenta que las variables que afectan a los resultados son innumerables y, en ocasiones, indeterminables. Que la guarnición no enmascare la verdadera esencia de nuestro plato de comida.

Añadir nuevo comentario