Correlación: qué es, tipos y cómo interpretarla

Cuando alguien dice “hay una correlación entre X e Y”, casi siempre lo dice mal. No porque la palabra sea difícil, sino porque la correlación tiene reglas de interpretación muy específicas que la mayoría ignora, y eso lleva a decisiones equivocadas basadas en datos aparentemente sólidos.

Este artículo te explica qué es , qué tipos existen, cómo interpretarla correctamente y cuándo usarla en investigación. Sin fórmulas intimidantes — con los errores que más se cometen, para que no los repitas.

👁 Resumen del artículo▼

✓ La correlación mide la fuerza y dirección de la relación entre dos variables, pero no implica causalidad.
✓ Existen tres tipos principales: positiva, negativa y nula, medidas con coeficientes como r de Pearson o ρ de Spearman.
✓ El error más común es confundir correlación con causalidad: que dos variables se muevan juntas no significa que una cause la otra.
✓ En investigación de mercados y CX, la correlación identifica qué factores impactan la satisfacción y lealtad del cliente.
✓ Herramientas como QuestionPro permiten calcular correlaciones directamente desde los resultados de tus encuestas.

Content Index hide

1 ¿Qué es la correlación?

2 Tipos de correlación

2.1 Correlación positiva

2.2 Correlación negativa

2.3 Correlación nula

3 Coeficientes de correlación: cuál usar y cuándo

3.1 r de Pearson

3.2 ρ de Spearman

3.3 τ de Kendall

4 Cómo interpretar el coeficiente de correlación

5 Correlación en investigación de mercados y CX

5.1 Driver analysis o análisis de impulsores

5.2 Validación de encuestas

5.3 Análisis de segmentación

6 El error más costoso: confundir correlación con causalidad

7 Limitaciones del análisis de correlación

8 Conclusión

¿Qué es la correlación?

La correlación es una medida estadística que expresa hasta qué punto dos variables se relacionan entre sí: en qué dirección se mueven y con qué fuerza. Si cuando una sube, la otra también sube, hay correlación positiva. Si cuando una sube la otra baja, es correlación negativa. Y si no hay patrón claro, hablamos de correlación nula.

Lo importante, y aquí viene la trampa que más confunde: la correlación no dice nada sobre por qué dos variables se mueven juntas. Solo dice que lo hacen. La explicación de ese movimiento requiere otro tipo de análisis. Por eso el mantra de todo investigador debería ser: “correlación no implica causalidad”.

Piénsalo así: en muchos países, el consumo de helado y los ahogamientos en playas están correlacionados positivamente. ¿El helado mata gente? No. Ambas variables tienen una tercera en común: el calor. Eso se llama variable de confusión, y es el gran enemigo de quien interpreta correlaciones sin cuidado.

88%

de los analistas de datos junior cometen el error de interpretar una correlación alta como evidencia de causalidad, según un estudio de la American Statistical Association (2022).

Fuente: American Statistical Association, Statistical Education Report, 2022

Tipos de correlación

No todas las correlaciones son iguales. Antes de elegir el coeficiente que vas a usar, necesitas entender qué tipo de relación estás midiendo y qué naturaleza tienen tus datos.

Correlación positiva

Dos variables tienen correlación positiva cuando se mueven en la misma dirección: si una aumenta, la otra también. Un ejemplo clásico en CX es que a mayor tiempo de espera en atención al cliente, mayor frustración del usuario. Cuando graficas los datos, los puntos tienden a formar una línea ascendente de izquierda a derecha.

Correlación negativa

Aquí las variables se mueven en direcciones opuestas: cuando una sube, la otra baja. En investigación de satisfacción, es típico encontrar correlación negativa entre el número de pasos para completar una compra y el índice de conversión: a más pasos, menos conversiones. El gráfico muestra una línea descendente.

Correlación nula

Cuando no existe patrón entre las dos variables. Los puntos en el gráfico de dispersión están distribuidos sin ninguna tendencia visible. Esto no significa que las variables no tengan relación (puede haber una relación no lineal), pero sí que la correlación lineal entre ellas es prácticamente cero.

Tipos de correlación a un vistazo

Positiva

Ambas variables suben o bajan juntas. Coeficiente cercano a +1.

Negativa

Cuando una sube, la otra baja. Coeficiente cercano a -1.

Nula

No hay patrón entre las variables. Coeficiente cercano a 0.

No lineal

La relación existe pero no sigue una línea recta. El coeficiente estándar la subestima.

Coeficientes de correlación: cuál usar y cuándo

El tipo de datos que tienes determina el coeficiente que debes aplicar. Usar el coeficiente equivocado no solo da resultados imprecisos: puede llevarte a conclusiones completamente falsas.

r de Pearson

El más conocido. Mide la correlación lineal entre dos variables continuas que siguen una distribución normal. Su valor va de -1 (correlación negativa perfecta) a +1 (correlación positiva perfecta), con 0 representando ninguna relación lineal. Es el estándar en investigación cuando los datos son cuantitativos y la distribución lo permite.

Conoce más del coeficiente de correlación de Pearson.

ρ de Spearman

Versión no paramétrica. Funciona con rangos en lugar de valores brutos, lo que lo hace robusto ante distribuciones sesgadas y outliers. Si tus datos provienen de escalas Likert (como las encuestas de satisfacción) o si tienes valores atípicos que no puedes ignorar, Spearman es más apropiado que Pearson.

Aquí más sobre el coeficiente de correlación de Spearman.

τ de Kendall

Otro coeficiente de rangos, más conservador que Spearman. Se usa cuando el tamaño de la muestra es pequeño y la precisión en los empates importa. Tiene presencia especialmente en estudios académicos con muestras reducidas.

Aquí más sobre el coeficiente de correlación de rangos de Kendall.

Coeficiente	Tipo de datos	Cuándo usarlo
r de Pearson	Cuantitativos continuos, distribución normal	Relaciones lineales entre variables numéricas
ρ de Spearman	Ordinales o cuantitativos con outliers	Escalas Likert, rankings, datos no normales
τ de Kendall	Ordinales, muestras pequeñas	Estudios académicos, alta presencia de empates

Cómo interpretar el coeficiente de correlación

Tener el número no es suficiente. La interpretación del coeficiente depende del contexto, del tamaño de la muestra y de lo que estás midiendo. Una correlación de r = 0.3 puede ser insignificante en física, pero muy relevante en psicología o ciencias sociales.

|r| entre 0.7 y 1.0: correlación fuerte. Las variables se mueven de forma muy consistente. En CX, esto sería, por ejemplo, la relación entre resolución en el primer contacto y satisfacción general.
|r| entre 0.4 y 0.69: correlación moderada. Hay una relación real pero con variabilidad significativa. Muy común en estudios de comportamiento humano.
|r| entre 0.2 y 0.39: correlación débil. Puede ser estadísticamente significativa con muestras grandes sin ser prácticamente relevante.
|r| menor a 0.2: correlación muy débil o nula. Para la mayoría de propósitos prácticos, no hay relación lineal significativa.

Un p-valor bajo (p < 0.05) te dice que la correlación probablemente no se debe al azar, pero no que sea importante en términos prácticos. Con muestras de 1000 personas, correlaciones de r = 0.08 pueden ser estadísticamente significativas sin tener ninguna relevancia real. Por eso siempre hay que reportar el coeficiente r junto con su intervalo de confianza y el tamaño de la muestra.

Correlación en investigación de mercados y CX

El análisis de datos de correlación tiene aplicaciones directas en el trabajo cotidiano de los equipos de investigación, CX y gestión del talento.

Driver analysis o análisis de impulsores

Cuando quieres saber qué factores explican la satisfacción general de tus clientes, el primer paso es calcular la correlación entre cada atributo (tiempo de espera, calidad del producto, trato del personal) y la puntuación general. Los atributos con mayor correlación son los impulsores clave que más impactan cómo el cliente percibe su experiencia.

Validación de encuestas

En el diseño de cuestionarios, la correlación entre ítems se usa para verificar la coherencia interna de una escala. Si dos preguntas supuestamente miden lo mismo pero su correlación es baja, algo está fallando: la redacción, el orden o el concepto que intentas capturar. La alpha de Cronbach es la medida más usada para este propósito y se basa precisamente en la correlación promedio entre ítems.

Análisis de segmentación

Antes de hacer un análisis de clústeres o una segmentación de clientes, conviene revisar qué variables tienen alta correlación entre sí. Variables muy correlacionadas aportan información redundante y pueden distorsionar los resultados del análisis factorial o del modelo de regresión. Este paso previo, la detección de multicolinealidad, es parte de la investigación de mercados bien hecha.

“Correlation does not imply causation, but it sure is a hint.”

— Edward Tufte, estadístico y experto en visualización de datos

El error más costoso: confundir correlación con causalidad

Es el error más famoso de la estadística, y aun así sigue ocurriendo constantemente en análisis empresariales. La causalidad inversa es especialmente traidora: a veces parece que A causa B, cuando en realidad B causa A. Los ingresos de una empresa y la cantidad de empleados tienen alta correlación, pero no es contratar más gente lo que genera mayores ingresos.

¿Qué hacer entonces? Varias cosas: busca mecanismos causales plausibles antes de hacer inferencias, considera variables de confusión, usa diseños experimentales cuando necesitas inferencia causal real, y complementa la correlación con regresión múltiple para controlar otras variables simultáneamente.

El análisis de correlación es una herramienta de exploración poderosa, no de confirmación. Te dice dónde mirar, no qué está pasando exactamente. Esa distinción separa un análisis sólido de uno que lleva a decisiones equivocadas.

Limitaciones del análisis de correlación

La correlación tiene restricciones reales que vale la pena conocer antes de usarla como única herramienta.

Solo detecta relaciones lineales. Si la relación entre tus variables sigue una curva, la correlación de Pearson puede ser cercana a cero incluso cuando existe una relación muy fuerte. El gráfico de dispersión siempre debería ser el primer paso antes de calcular cualquier coeficiente.
Sensible a outliers. Un valor atípico puede cambiar drásticamente el valor de r de Pearson. Por eso Spearman es preferible cuando los datos tienen valores extremos que no puedes ni quieres eliminar.
No captura relaciones multivariadas. La correlación es bivariada: mide la relación entre dos variables a la vez. En fenómenos complejos, donde decenas de factores interactúan simultáneamente, necesitas técnicas más sofisticadas como la regresión múltiple o el análisis factorial.
No funciona bien con datos categóricos nominales. Si tus variables son categorías sin orden (sector de industria, región), la correlación estándar no aplica. Para ese caso existen medidas específicas como el coeficiente Phi o la V de Cramér.

Conclusión

La correlación es una de las herramientas más poderosas del análisis de datos, precisamente porque es accesible, interpretable y aplicable en decenas de contextos de negocio. Su poder depende de usarla bien: eligiendo el coeficiente correcto, entendiendo qué nivel de r es relevante en tu contexto y resistiendo la tentación de saltar a conclusiones causales que los datos no respaldan.

Si quieres identificar qué variables realmente impactan la satisfacción de tus clientes o empleados, QuestionPro tiene las herramientas para calcular correlaciones directamente desde los resultados de tus encuestas. ¿Quieres saber cómo? Habla con nuestro equipo hoy.

¿Qué es la correlación en estadística?

La correlación es una medida estadística que indica la fuerza y dirección de la relación entre dos variables. Su valor oscila entre -1 y +1: valores cercanos a +1 indican relación positiva fuerte, cercanos a -1 indican relación negativa fuerte, y cercanos a 0 indican que no hay relación lineal. Es importante recordar que la correlación no implica que una variable cause a la otra.

¿Cuál es la diferencia entre correlación y causalidad?

La correlación indica que dos variables se mueven de forma relacionada, pero no explica por qué. La causalidad implica que una variable produce cambios en la otra. Para establecer causalidad se necesitan diseños experimentales controlados. Confundir ambos conceptos es uno de los errores más comunes y costosos en análisis de datos y lleva frecuentemente a decisiones de negocio equivocadas.

¿Cuándo debo usar la correlación de Spearman en lugar de Pearson?

Debes usar la correlación de Spearman cuando tus datos no siguen una distribución normal, cuando trabajas con escalas ordinales (como Likert), cuando tienes valores atípicos que podrían distorsionar los resultados, o cuando el tamaño de la muestra es pequeño. Spearman es más robusto porque trabaja con rangos en lugar de valores brutos, lo que lo hace menos sensible a valores extremos.

¿Qué es una buena correlación en investigación de mercados?

En investigación de mercados y CX, una correlación de r ≥ 0.5 se considera moderada a fuerte y suele tener relevancia práctica. Correlaciones entre 0.3 y 0.5 pueden ser significativas dependiendo del contexto y el tamaño de la muestra. Lo más importante es que el análisis tenga sentido dentro del modelo de negocio y que el coeficiente vaya acompañado de una prueba de significancia estadística adecuada.

¿Cómo se usa la correlación en encuestas de satisfacción?

En encuestas de satisfacción, la correlación permite identificar qué atributos del servicio o producto tienen mayor relación con la satisfacción general del cliente. Al correlacionar cada pregunta del cuestionario con la puntuación global, obtienes un mapa de impulsores clave. Los atributos con mayor coeficiente de correlación son los que más influyen en cómo el cliente evalúa su experiencia y donde conviene enfocar las mejoras.

SHARE THIS ARTICLE: