
Cuando alguien dice “hay una correlación entre X e Y”, casi siempre lo dice mal. No porque la palabra sea difícil, sino porque la correlación tiene reglas de interpretación muy específicas que la mayoría ignora, y eso lleva a decisiones equivocadas basadas en datos aparentemente sólidos.
Este artículo te explica qué es , qué tipos existen, cómo interpretarla correctamente y cuándo usarla en investigación. Sin fórmulas intimidantes — con los errores que más se cometen, para que no los repitas.
¿Qué es la correlación?
La correlación es una medida estadística que expresa hasta qué punto dos variables se relacionan entre sí: en qué dirección se mueven y con qué fuerza. Si cuando una sube, la otra también sube, hay correlación positiva. Si cuando una sube la otra baja, es correlación negativa. Y si no hay patrón claro, hablamos de correlación nula.
Lo importante, y aquí viene la trampa que más confunde: la correlación no dice nada sobre por qué dos variables se mueven juntas. Solo dice que lo hacen. La explicación de ese movimiento requiere otro tipo de análisis. Por eso el mantra de todo investigador debería ser: “correlación no implica causalidad”.
Piénsalo así: en muchos países, el consumo de helado y los ahogamientos en playas están correlacionados positivamente. ¿El helado mata gente? No. Ambas variables tienen una tercera en común: el calor. Eso se llama variable de confusión, y es el gran enemigo de quien interpreta correlaciones sin cuidado.
88%
de los analistas de datos junior cometen el error de interpretar una correlación alta como evidencia de causalidad, según un estudio de la American Statistical Association (2022).
Fuente: American Statistical Association, Statistical Education Report, 2022
Tipos de correlación
No todas las correlaciones son iguales. Antes de elegir el coeficiente que vas a usar, necesitas entender qué tipo de relación estás midiendo y qué naturaleza tienen tus datos.
Correlación positiva
Dos variables tienen correlación positiva cuando se mueven en la misma dirección: si una aumenta, la otra también. Un ejemplo clásico en CX es que a mayor tiempo de espera en atención al cliente, mayor frustración del usuario. Cuando graficas los datos, los puntos tienden a formar una línea ascendente de izquierda a derecha.
Correlación negativa
Aquí las variables se mueven en direcciones opuestas: cuando una sube, la otra baja. En investigación de satisfacción, es típico encontrar correlación negativa entre el número de pasos para completar una compra y el índice de conversión: a más pasos, menos conversiones. El gráfico muestra una línea descendente.
Correlación nula
Cuando no existe patrón entre las dos variables. Los puntos en el gráfico de dispersión están distribuidos sin ninguna tendencia visible. Esto no significa que las variables no tengan relación (puede haber una relación no lineal), pero sí que la correlación lineal entre ellas es prácticamente cero.
Tipos de correlación a un vistazo
Positiva
Ambas variables suben o bajan juntas. Coeficiente cercano a +1.
Negativa
Cuando una sube, la otra baja. Coeficiente cercano a -1.
Nula
No hay patrón entre las variables. Coeficiente cercano a 0.
No lineal
La relación existe pero no sigue una línea recta. El coeficiente estándar la subestima.
Coeficientes de correlación: cuál usar y cuándo
El tipo de datos que tienes determina el coeficiente que debes aplicar. Usar el coeficiente equivocado no solo da resultados imprecisos: puede llevarte a conclusiones completamente falsas.
r de Pearson
El más conocido. Mide la correlación lineal entre dos variables continuas que siguen una distribución normal. Su valor va de -1 (correlación negativa perfecta) a +1 (correlación positiva perfecta), con 0 representando ninguna relación lineal. Es el estándar en investigación cuando los datos son cuantitativos y la distribución lo permite.
Conoce más del coeficiente de correlación de Pearson.
ρ de Spearman
Versión no paramétrica. Funciona con rangos en lugar de valores brutos, lo que lo hace robusto ante distribuciones sesgadas y outliers. Si tus datos provienen de escalas Likert (como las encuestas de satisfacción) o si tienes valores atípicos que no puedes ignorar, Spearman es más apropiado que Pearson.
Aquí más sobre el coeficiente de correlación de Spearman.
τ de Kendall
Otro coeficiente de rangos, más conservador que Spearman. Se usa cuando el tamaño de la muestra es pequeño y la precisión en los empates importa. Tiene presencia especialmente en estudios académicos con muestras reducidas.
Aquí más sobre el coeficiente de correlación de rangos de Kendall.
| Coeficiente | Tipo de datos | Cuándo usarlo |
|---|---|---|
| r de Pearson | Cuantitativos continuos, distribución normal | Relaciones lineales entre variables numéricas |
| ρ de Spearman | Ordinales o cuantitativos con outliers | Escalas Likert, rankings, datos no normales |
| τ de Kendall | Ordinales, muestras pequeñas | Estudios académicos, alta presencia de empates |
Cómo interpretar el coeficiente de correlación
Tener el número no es suficiente. La interpretación del coeficiente depende del contexto, del tamaño de la muestra y de lo que estás midiendo. Una correlación de r = 0.3 puede ser insignificante en física, pero muy relevante en psicología o ciencias sociales.
- |r| entre 0.7 y 1.0: correlación fuerte. Las variables se mueven de forma muy consistente. En CX, esto sería, por ejemplo, la relación entre resolución en el primer contacto y satisfacción general.
- |r| entre 0.4 y 0.69: correlación moderada. Hay una relación real pero con variabilidad significativa. Muy común en estudios de comportamiento humano.
- |r| entre 0.2 y 0.39: correlación débil. Puede ser estadísticamente significativa con muestras grandes sin ser prácticamente relevante.
- |r| menor a 0.2: correlación muy débil o nula. Para la mayoría de propósitos prácticos, no hay relación lineal significativa.
Un p-valor bajo (p < 0.05) te dice que la correlación probablemente no se debe al azar, pero no que sea importante en términos prácticos. Con muestras de 1000 personas, correlaciones de r = 0.08 pueden ser estadísticamente significativas sin tener ninguna relevancia real. Por eso siempre hay que reportar el coeficiente r junto con su intervalo de confianza y el tamaño de la muestra.
Correlación en investigación de mercados y CX
El análisis de datos de correlación tiene aplicaciones directas en el trabajo cotidiano de los equipos de investigación, CX y gestión del talento.
Driver analysis o análisis de impulsores
Cuando quieres saber qué factores explican la satisfacción general de tus clientes, el primer paso es calcular la correlación entre cada atributo (tiempo de espera, calidad del producto, trato del personal) y la puntuación general. Los atributos con mayor correlación son los impulsores clave que más impactan cómo el cliente percibe su experiencia.
Validación de encuestas
En el diseño de cuestionarios, la correlación entre ítems se usa para verificar la coherencia interna de una escala. Si dos preguntas supuestamente miden lo mismo pero su correlación es baja, algo está fallando: la redacción, el orden o el concepto que intentas capturar. La alpha de Cronbach es la medida más usada para este propósito y se basa precisamente en la correlación promedio entre ítems.
Análisis de segmentación
Antes de hacer un análisis de clústeres o una segmentación de clientes, conviene revisar qué variables tienen alta correlación entre sí. Variables muy correlacionadas aportan información redundante y pueden distorsionar los resultados del análisis factorial o del modelo de regresión. Este paso previo, la detección de multicolinealidad, es parte de la investigación de mercados bien hecha.
“Correlation does not imply causation, but it sure is a hint.”
— Edward Tufte, estadístico y experto en visualización de datos
El error más costoso: confundir correlación con causalidad
Es el error más famoso de la estadística, y aun así sigue ocurriendo constantemente en análisis empresariales. La causalidad inversa es especialmente traidora: a veces parece que A causa B, cuando en realidad B causa A. Los ingresos de una empresa y la cantidad de empleados tienen alta correlación, pero no es contratar más gente lo que genera mayores ingresos.
¿Qué hacer entonces? Varias cosas: busca mecanismos causales plausibles antes de hacer inferencias, considera variables de confusión, usa diseños experimentales cuando necesitas inferencia causal real, y complementa la correlación con regresión múltiple para controlar otras variables simultáneamente.
El análisis de correlación es una herramienta de exploración poderosa, no de confirmación. Te dice dónde mirar, no qué está pasando exactamente. Esa distinción separa un análisis sólido de uno que lleva a decisiones equivocadas.
Limitaciones del análisis de correlación
La correlación tiene restricciones reales que vale la pena conocer antes de usarla como única herramienta.
- Solo detecta relaciones lineales. Si la relación entre tus variables sigue una curva, la correlación de Pearson puede ser cercana a cero incluso cuando existe una relación muy fuerte. El gráfico de dispersión siempre debería ser el primer paso antes de calcular cualquier coeficiente.
- Sensible a outliers. Un valor atípico puede cambiar drásticamente el valor de r de Pearson. Por eso Spearman es preferible cuando los datos tienen valores extremos que no puedes ni quieres eliminar.
- No captura relaciones multivariadas. La correlación es bivariada: mide la relación entre dos variables a la vez. En fenómenos complejos, donde decenas de factores interactúan simultáneamente, necesitas técnicas más sofisticadas como la regresión múltiple o el análisis factorial.
- No funciona bien con datos categóricos nominales. Si tus variables son categorías sin orden (sector de industria, región), la correlación estándar no aplica. Para ese caso existen medidas específicas como el coeficiente Phi o la V de Cramér.
Conclusión
La correlación es una de las herramientas más poderosas del análisis de datos, precisamente porque es accesible, interpretable y aplicable en decenas de contextos de negocio. Su poder depende de usarla bien: eligiendo el coeficiente correcto, entendiendo qué nivel de r es relevante en tu contexto y resistiendo la tentación de saltar a conclusiones causales que los datos no respaldan.
Si quieres identificar qué variables realmente impactan la satisfacción de tus clientes o empleados, QuestionPro tiene las herramientas para calcular correlaciones directamente desde los resultados de tus encuestas. ¿Quieres saber cómo? Habla con nuestro equipo hoy.
La correlación es una medida estadística que indica la fuerza y dirección de la relación entre dos variables. Su valor oscila entre -1 y +1: valores cercanos a +1 indican relación positiva fuerte, cercanos a -1 indican relación negativa fuerte, y cercanos a 0 indican que no hay relación lineal. Es importante recordar que la correlación no implica que una variable cause a la otra.
La correlación indica que dos variables se mueven de forma relacionada, pero no explica por qué. La causalidad implica que una variable produce cambios en la otra. Para establecer causalidad se necesitan diseños experimentales controlados. Confundir ambos conceptos es uno de los errores más comunes y costosos en análisis de datos y lleva frecuentemente a decisiones de negocio equivocadas.
Debes usar la correlación de Spearman cuando tus datos no siguen una distribución normal, cuando trabajas con escalas ordinales (como Likert), cuando tienes valores atípicos que podrían distorsionar los resultados, o cuando el tamaño de la muestra es pequeño. Spearman es más robusto porque trabaja con rangos en lugar de valores brutos, lo que lo hace menos sensible a valores extremos.
En investigación de mercados y CX, una correlación de r ≥ 0.5 se considera moderada a fuerte y suele tener relevancia práctica. Correlaciones entre 0.3 y 0.5 pueden ser significativas dependiendo del contexto y el tamaño de la muestra. Lo más importante es que el análisis tenga sentido dentro del modelo de negocio y que el coeficiente vaya acompañado de una prueba de significancia estadística adecuada.
En encuestas de satisfacción, la correlación permite identificar qué atributos del servicio o producto tienen mayor relación con la satisfacción general del cliente. Al correlacionar cada pregunta del cuestionario con la puntuación global, obtienes un mapa de impulsores clave. Los atributos con mayor coeficiente de correlación son los que más influyen en cómo el cliente evalúa su experiencia y donde conviene enfocar las mejoras.



