Relaciones que no lo son (I)

Cada dos por tres nos encontramos en los medios de comunicación con noticias en las que se afirma que los científicos han hallado una relación entre el consumo de ciertos alimentos y diversas enfermedades, entre las líneas de alta tensión y el cáncer, entre el manejo de teléfonos móviles y problemas de salud, etc. Se trata, en muchos casos, de noticias sensacionalistas que buscan un titular impactante. Más aún: muchas de estas supuestas relaciones no son tales. Debemos aguzar nuestro sentido crítico. Por lo general, cuando los científicos leemos algo al estilo de «La Ciencia dice que…», nos echamos a temblar. 🙂

Lo que ocurre es que muchos estudios se limitan a detectar correlaciones, no relaciones. Y no es lo mismo; no, señor. O dicho más finamente, correlación no implica causalidad. Intentaremos explicarlo, porque las correlaciones las carga el diablo. 🙂

Empecemos por lo básico, citando, cómo no, de la Wikipedia:

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.

Aclarémoslo con un ejemplo hipotético. Se nos antoja averiguar si existe una correlación entre, pongamos por caso, el consumo de mermelada de pera y la distancia a la que somos capaces de escupir un hueso de aceituna (se han estudiado correlaciones más raras, palabra de honor). 🙂 Nos ponemos manos a la obra, convencemos a unos cuantos voluntarios para que participen y diseñamos unos experimentos en los que les damos determinadas cantidades (en gramos) de mermelada y luego medimos la distancia (en centímetros) a la que arrojan los huesos. Los resultados obtenidos podrían mostrarse en una gráfica:

Hay diversas formas de calcular la correlación entre variables. Una de ellas es el coeficiente de correlación de Pearson. Sin entrar en detalles, este coeficiente puede variar entre +1 y -1. Podría darse el caso de la Fig. 1: las dos variables se comportan de forma similar. Es decir, a mayor consumo de mermelada, más lejos se escupen las aceitunas, o viceversa. En este caso tendríamos un índice de correlación de +1: una correlación positiva perfecta.

En la Fig. 2 vemos lo que ocurriría si se diera el caso contrario: al aumentar el consumo de mermelada de pera, disminuye el vuelo de los huesos de aceituna. Hay una correlación negativa perfecta, con un índice de -1.

En la Fig. 3 nos encontramos con que cada una de las variables va a su aire. Al incrementar el consumo de mermelada, la distancia recorrida por los huesos puede aumentar o disminuir. No percibimos ningún patrón de comportamiento. El índice de correlación es 0. Eso indica que no existe una relación lineal entre ambas variables.

Por supuesto, podrían darse todos los casos intermedios, obteniéndose correlaciones positivas o negativas más o menos fuertes. En fin, el concepto de correlación es sencillo de comprender, ¿no?

Supongamos que el resultado obtenido en nuestro experimento es el que aparece en la Fig. 1: un índice de correlación de +1, o un valor muy próximo a este. Habríamos descubierto que existe una correlación entre ambas variables, sin duda. Y el periodista de turno publicaría en grandes titulares: «Los científicos descubren que hay una relación entre el consumo de mermelada de pera y la habilidad para escupir huesos de aceituna», o algo por el estilo.

¿Seguro? Recordemos la última frase de la definición de la Wikipedia, que resaltamos en rojo:

La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad.

De acuerdo, el índice de correlación nos indica que esta existe, pero nada más que eso. No nos dice el tipo de relación que hay entre ambas variables. En nuestro ejemplo hipotético, tal vez el consumo de mermelada permita escupir huesos de aceituna más lejos. O quizá sólo nos sugiere que a la gente aficionada a escupir huesos le gusta más la mermelada. O podría tratarse de una relación espuria, fruto de la casualidad, y que ambas cosas no tuvieran nada que ver la una con la otra.

Quédate con esta idea, amigo lector: el índice de correlación sólo nos dice si dos variables varían del mismo modo o no, pero no nos informa acerca de la relación entre ambas variables, ni si una influye en la otra o se trata de una casualidad… Para averiguar si cicha relación existe, necesitamos más estudios, tener en cuenta más factores, etc.

En la próxima entrada veremos algunos ejemplos hilarantes de correlaciones, en las que el azar nos juega malas pasadas. Pero la confusión entre correlación y relación también tiene un lado oscuro, y puede servir para justificar tremendas injusticias sociales o para estafar al prójimo.

Un comentario en “Relaciones que no lo son (I)

  1. Pingback: De patógenos, virus, pandemias y disparates (y VI) | Lo Fantástico

Deja un comentario