Supón que tú y tu amigo decidís hacer vuestra propia prueba de sabor de refrescos. Compráis (10) diferentes marcas de refrescos, y cada uno los probáis, clasificándolos del mejor al peor. ¿Qué pasaría si los dos dierais a algunos refrescos clasificaciones diferentes? ¿Cómo sabrías si tú y tu amigo habéis dado aproximadamente las mismas puntuaciones, aunque no hayáis dado exactamente las mismas puntuaciones? Eso es lo que puede decirte el coeficiente de correlación de rangos de Spearman.
Consulta los artículos Correlación y Coeficiente de correlación del momento del producto para obtener más detalles.
Pero, ¿y si tus datos no están correlacionados linealmente, o ni siquiera pueden medirse en una escala continua? En ese caso, puedes utilizar el coeficiente de correlación de rango de Spearman. De hecho, puedes utilizar el coeficiente de correlación de rango de Spearman como aproximación al coeficiente de correlación del momento producto aunque los datos estén correlacionados linealmente, simplemente porque el coeficiente de correlación de rango de Spearman es un cálculo más sencillo.
Para más detalles, consulta Comparar el coeficiente de correlación de rango de Spearman y el coeficiente de correlación del momento producto.
En general, utilizarías el coeficiente de correlación de rango de Spearman si
uno o ambos conjuntos de datos proceden de una población que no se distribuye normalmente;
la relación entre los conjuntos de datos no es lineal; o
uno o ambos conjuntos de datos ya están representados como una clasificación.
Los valores del coeficiente de correlación de rango de Spearman oscilan entre \(-1\) y \(1\).
Un coeficiente de correlación de rangos de Spearman de
\(1) significa que las clasificaciones coinciden perfectamente;
\(0) significa que no hay relación entre las clasificaciones; y
\(-1) significa que las clasificaciones están en orden inverso.
A menudo, el coeficiente de correlación de rangos de Spearman no será exactamente \(1\), \(0\) o \(-1\). Por lo general, cuando realizas una prueba de hipótesis utilizando el coeficiente de correlación de rangos de Spearman, estás comprobando si existe o no una relación entre las clasificaciones.
Para ver si existe una correlación al utilizar el rango de Spearman, puede ser útil representar gráficamente los datos. Recuerda que no buscas si los datos del gráfico forman una línea, sino si los rangos son iguales.
En el gráfico siguiente, puedes ver las clasificaciones que dos jueces dieron en una competición. Las clasificaciones que el juez A dio a los competidores están marcadas con círculos, mientras que las clasificaciones que dio el juez B están marcadas con cruces.
Fig. 1 - Gráfico de las clasificaciones dadas por dos jueces diferentes.
Por ejemplo, el juez A dio al primer competidor una puntuación de \(1\), mientras que el juez B le dio una puntuación de \(2\). Aunque los datos representados no forman una línea, parece que ambos jueces dieron aproximadamente la misma puntuación a todos los competidores, y en tres casos, dieron exactamente la misma puntuación. Por lo tanto, cabría esperar que el coeficiente de correlación de rangos de Spearman para las clasificaciones estuviera más cerca de \(1\) que de \(0\).
Fórmula del coeficiente de correlación de rangos de Spearman
Para utilizar la fórmula del coeficiente de correlación de rangos de Spearman es necesario clasificar los conjuntos de datos. No importa cómo los clasifiques (por ejemplo, de mejor a peor o de peor a mejor), siempre que clasifiques ambos conjuntos de la misma forma. Antes de ver la fórmula, veamos un ejemplo de organización de las clasificaciones.
Se pidió a dos catadores de café que clasificaran \(8\) marcas de café por orden de preferencia. Sus preferencias de orden para las marcas se indican en la tabla siguiente.
Tabla 1. Preferencias de café de los catadores.
Marca de café
A
B
C
D
E
F
G
H
Catador \(x\)
\(4\)
\(5\)
\(2\)
\(8\)
\(1\)
\(3\)
\(7\)
\(6\)
Catador \(y\)
\(4\)
\(6\)
\(1\)
\(7\)
\(3\)
\(2\)
\(5\)
\(8\)
El catador asigna a cada café un número de preferencia. Siempre que el catador \(x\) y el catador \(y\) utilicen \(1\) para referirse a lo mismo en la escala, podrás comparar las clasificaciones. Si no sabes que el catador \(x\) y el catador \(y\) utilizaron \(1\) para referirse al café que más prefieren, no podrás saber qué significa el coeficiente de correlación, aunque podrás calcularlo.
Para calcular el coeficiente de correlación, necesitarás los siguientes valores:
El coeficiente de correlación de Spearman puede calcularse mediante la fórmula
\[ r_s = \frac{S_{xy}} {{sqrt{S_{xx}}S_{yy}} .\]
Puedes encontrar un ejemplo en el que se dé la misma puntuación a más de un punto de datos. Esto se llama puntuación empatada.
Un rango empatado se produce cuando dos o más valores de datos de uno de los conjuntos de datos son iguales.
Veamos un ejemplo rápido.
Supongamos que a un catador de café se le pidiera que diera al café una calificación en letras según lo que le gustara. Para los cafés que probaron, dieron puntuaciones de: A, C, F, D, B, C, C, C. Observa que de los ocho cafés de la lista, ¡tres de ellos tienen una puntuación de C! Así que si intentaras hacer una tabla de clasificación obtendrías
Tabla 2. Posible tabla de clasificación
Clasificación
\(1\)
\(2\)
\(7\)
\(8\)
Grado
A
B
C
C
C
C
D
F
Pero, ¿qué haces con los cuatro cafés que han obtenido cada uno una C? ¿Les das un rango de \(3\), \(4\), \(5\) o \(6\)? Resulta que les das la media de los rangos, ya que están empatados. Hallar la media te da
\[ \frac{3+4+5+6}{4} = 4,5,\]
por lo que cada uno se clasificaría \(4,5\). La tabla de clasificación completa sería
Tabla 3. Tabla de clasificación completa
Clasificación
\(1\)
\(2\)
\(4.5\)
\(4.5\)
\(4.5\)
\(4.5\)
\(7\)
\(8\)
Grado
A
B
C
C
C
C
D
F
Observa que en el ejemplo anterior no estás comparando los rangos del catador \(x\) con los rangos del catador \(y\). Sólo estás comparando los rangos dados por un único catador.
Si hay más de dos rangos empatados, entonces la fórmula
\r_s = \frac{S_{xy}} {{sqrt{S_{xx}}S_{yy}}].
. Sin embargo, si hay dos o menos rangos empatados, puedes utilizar en su lugar la siguiente fórmula:
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2,\]
donde \(n\) es el número de pares de observaciones y \(d\) es la diferencia entre los rangos de cada observación. La fórmula de la diferencia te dará una buena aproximación del coeficiente de correlación de rangos de Spearman siempre que no haya rangos empatados.
Tabla de rangos de Spearman
Una vez que conozcas el coeficiente de correlación de rangos de Spearman, a menudo lo utilizarás para hacer una prueba de hipótesis. Aunque puedes utilizar la tecnología para hallar el valor crítico, es útil poder leer una tabla de rangos de Spearman. A continuación se muestra una sección de una tabla de rangos de Spearman.
Tabla 4. Tabla de rangos de Spearman
\(n\)/\(\alfa \)
\(0.1\)
\(0.05\)
\(0.25\)
\(0.01\)
\(6\)
\(0.657\)
\(0.829\)
\(0.886\)
\(0.943\)
\(7\)
\(0.571\)
\(0.714\)
\(0.786\)
\(0.893\)
\(8\)
\(0.524\)
\(0.643\)
\(0.738\)
\(0.833\)
La primera columna de la tabla es el tamaño de la muestra \(n\), y la primera fila de la tabla te da el nivel de confianza. Observa que, a medida que aumenta el tamaño de la muestra, disminuye el valor crítico para un nivel de confianza determinado. Recuerda que el margen de error depende del valor crítico:
margen de error = (valor crítico)(error típico).
Esto significa que si aumentas el tamaño de la muestra, el margen de error disminuirá.
Valor crítico del coeficiente de correlación de rango de Spearman
El valor crítico del coeficiente de correlación de rangos de Spearman depende del tamaño de la muestra y del nivel de confianza que estés utilizando. El valor crítico puede hallarse utilizando una tabla o mediante un software estadístico. Por ejemplo, si estás haciendo una prueba de una cola, con un tamaño de muestra de \(7\), con un nivel de confianza de \(0,25\), utilizarías una tabla de coeficientes de Spearman para ver que el valor crítico es \(0,786\). Puedes encontrar este valor crítico en la tabla anterior.
En otras palabras, para un tamaño de muestra de \(7\), el valor crítico de \(r_s\) es significativo al nivel \(0,25\) en una prueba de una cola a \(\pm 0,786\).
Ejemplo de coeficiente de correlación de rangos de Spearman
Volvamos al ejemplo del café y averigüemos cuál es el coeficiente de correlación.
Se pidió a dos catadores de café que clasificaran ocho marcas de café por orden de preferencia, siendo \(1\) el café que más les gustaba. Sus preferencias de orden para las marcas se indican en la tabla siguiente.
Tabla 5. Preferencias de café según el catador.
Marca de café
A
B
C
D
E
F
G
H
Catador \(x\)
\(4\)
\(5\)
\(2\)
\(8\)
\(1\)
\(3\)
\(7\)
\(6\)
Catador \(y\)
\(4\)
\(6\)
\(1\)
\(7\)
\(3\)
\(2\)
\(5\)
\(8\)
Halla e interpreta el coeficiente de correlación de rangos de Spearman.
Solución:
Observa que, aunque los dos catadores eligieron el café A como cuarta opción, no se trata de un ejemplo de empate. El empate se produciría si un catador diera a dos cafés la misma puntuación. Por tanto, es razonable utilizar la fórmula simplificada
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2 .\]
Aquí hay ocho marcas de café, así que \(n=8\). Mirando primero la suma
Como \(r_s \not= 0\), no puedes decir que no haya relación entre las clasificaciones. Sin embargo, como es cercana a cero, puedes decir que hay muy poca correlación entre las clasificaciones de los dos catadores.
Coeficiente de correlación de rangos de Spearman - Aspectos clave
Utiliza el coeficiente de correlación de rangos de Spearman si
uno o ambos conjuntos de datos proceden de una población que no se distribuye normalmente;
la relación entre los conjuntos de datos no es lineal; o
uno o ambos conjuntos de datos ya están representados como una clasificación.
Un coeficiente de correlación de rangos de Spearman de:
\(1) significa que las clasificaciones coinciden perfectamente;
\(0) significa que no hay relación entre las clasificaciones; y
\(-1) significa que las clasificaciones están en orden inverso.
Ense produce un empate cuando dos o más valores de uno de los conjuntos de datos son iguales.
Si hay dos o menos rangos empatados, puedes utilizar la fórmula
\[ r_s = 1 - \frac{6}{n(n^2-1)} \suma d^2,\2]
para aproximar el coeficiente de correlación de rangos de Spearman, donde \(n\) es el número de pares de observaciones y \(d\) es la diferencia entre los rangos de cada observación.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.