Saltar a un capítulo clave
Definición de la prueba Chi-cuadrado de homogeneidad
Cuando quieras saber si dos variables categóricas siguen la misma distribución de probabilidad (como en la pregunta anterior sobre la preferencia de películas), puedes utilizar una prueba de Chi-cuadrado para la homogeneidad.
Una prueba de Chi-cuadrado \( (\chi^{2}) \ ) para la homogeneidad es una prueba no paramétrica de Chi-cuadrado de Pearson que se aplica a una única variable categórica de dos o más poblaciones diferentes para determinar si tienen la misma distribución.
En esta prueba, recoges aleatoriamente datos de una población para determinar si existe una asociación significativa entre \(2\) o más variables categóricas.
Condiciones de una prueba Chi-cuadrado de homogeneidad
Todas las pruebas Chi-cuadrado de Pearson comparten las mismas condiciones básicas. La principal diferencia es cómo se aplican las condiciones en la práctica. Una prueba de Chi-cuadrado para la homogeneidad requiere una variable categórica de al menos dos poblaciones, y los datos tienen que ser el recuento bruto de miembros de cada categoría. Esta prueba se utiliza para comprobar si las dos variables siguen la misma distribución.
Para poder utilizar esta prueba, las condiciones de una prueba Chi-cuadrado de homogeneidad son:
Las variables deben ser categóricas.
Como estás comprobando la igualdad de las variables, tienen que tener los mismos grupos. Esta prueba de Chi-cuadrado utiliza tabulaciones cruzadas, contando las observaciones que entran en cada categoría.
Haz referencia al estudio: "Parada cardiaca extrahospitalaria en edificios altos: Delays to Patient Care and Effect on Survival "1 - que se publicó en el Canadian Medical Association Journal (CMAJ) el 5 de abril de 2016.
Este estudio comparó el modo de vida de los adultos (casa o adosado, piso \(1^) o \(2^), y piso \(3^) o superior) con su tasa de supervivencia a un infarto de miocardio (sobrevivió o no sobrevivió).
Tu objetivo es saber si hay alguna diferencia en las proporciones de las categorías de supervivencia (es decir, ¿tienes más probabilidades de sobrevivir a un infarto según dónde vivas?) para las poblaciones \(3\):
- víctimas de infarto que viven en una casa o en un adosado,
- víctimas de infarto que viven en el primer o segundo piso de un edificio de apartamentos, y
- víctimas de infarto que viven en la planta 3 o superior de un edificio de apartamentos.
Los grupos deben ser mutuamente excluyentes; es decir, la muestra se selecciona al azar.
Cada observación sólo puede estar en un grupo. Una persona puede vivir en una casa o en un apartamento, pero no puede vivir en ambos.
Tabla de contingencias | |||
---|---|---|---|
Arreglo de vida | Sobrevivió | No sobrevivió | Totales de filas |
Casa o adosado | 217 | 5314 | 5531 |
Apartamento en1ª o2ª planta | 35 | 632 | 667 |
Piso3 o superior | 46 | 1650 | 1696 |
Totales de columna | 298 | 7596 | \(n =\) 7894 |
Tabla 1. Tabla de contingencia, prueba de Chi-cuadrado para la homogeneidad.
Los recuentos esperados deben ser al menos \(5\).
Esto significa que el tamaño de la muestra debe ser lo suficientemente grande, pero cómo de grande es difícil de determinar de antemano. En general, basta con asegurarse de que hay más de \(5\) en cada categoría.
Las observaciones deben ser independientes.
Este supuesto depende de cómo recojas los datos. Si utilizas un muestreo aleatorio simple, casi siempre será estadísticamente válido.
Prueba Chi-cuadrado de homogeneidad: hipótesis nula e hipótesis alternativa
La pregunta subyacente a esta prueba de hipótesis es ¿Siguen estas dos variables la misma distribución?
Las hipótesis se formulan para responder a esa pregunta.
- La hipótesis n ula es que las dos variables proceden de la misma distribución.\[ \begin{align}H_{0}: p_{1,1} &= p_{2,1} \text{ Y } \\p_{1,2} &= p_{2,2} \Y \ldots \text{ AND } \\p_{1,n} &= p_{2,n}\end{align} \]
La hipótesis nula exige que cada categoría tenga la misma probabilidad entre las dos variables.
La hipótesis alternativa es que las dos variables no proceden de la misma distribución, es decir, al menos una de las hipótesis nulas es falsa.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\p_{1,2} &\neq p_{2,2} \O \puntos texto O \\p_{1,n} &\neq p_{2,n}\end{align} \]
Si incluso una categoría es diferente de una variable a otra, la prueba arrojará un resultado significativo y proporcionará pruebas para rechazar la hipótesis nula.
Las hipótesis nula y alternativa en el estudio de supervivencia al infarto de miocardio son:
La población son las personas que viven en casas, adosados o apartamentos y que han sufrido un infarto de miocardio.
- Hipótesisnula\( H_{0}: \) Las proporciones en cada categoría de supervivencia son las mismas para todos \(3\) los grupos de personas.
- Hipótesisalternativa\( H_{a}: \) Las proporciones de cada categoría de supervivencia no son las mismas para todos los \(3\) grupos de personas.
Frecuencias esperadas para una prueba chi-cuadrado de homogeneidad
Debes calcular las frecuencias esperadas para una prueba Chi-cuadrado de homogeneidad individualmente para cada población en cada nivel de la variable categórica, según la fórmula
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \]
donde
\(E_{r,c}) es la frecuencia esperada para la población \(r\) en el nivel \(c\) de la variable categórica,
\(r\) es el número de poblaciones, que también es el número de filas de una tabla de contingencia,
\es el número de niveles de la variable categórica, que también es el número de columnas de una tabla de contingencia,
\(n_{r}\) es el número de observaciones de la población \(r\),
\es el número de observaciones del nivel (c) de la variable categórica, y
\es el tamaño total de la muestra.
Continuando con el estudio de supervivencia al infarto de miocardio:
A continuación, calcula las frecuencias esperadas utilizando la fórmula anterior y la tabla de contingencia, poniendo tus resultados en una tabla de contingencia modificada para mantener tus datos organizados.
- \( E_{1,1} = \frac{5531 \cdot 298}{7894} = 208,795 \)
- E_{1,2} = frac{5531 \cdot 7596}{7894} = 5322,205 \cdot 7596}{7894} = 5322,205 \cdot 7596}{7894} = 5322,205 \cdot 7596}{7894})
- \E_{2,1} = \frac{667 \cdot 298}{7894} = 25.179
- E_{2,2} = frac{667 \cdot 7596}{7894} = 641,821 \cdot = 641,821 \cdot = 641,821 \cdot = 641,821 \cdot = 641,821)
- E_{3,1} = \frac{1696 \cdot 298}{7894} = 64,024 \cdot = 64,024 \cdot = 64,024 \cdot = 64,024 \cdot = 64,024)
- \E_3,2 = frac {1696 \cdot 7596} {7894} = 1631,976 \k)
Tabla 2. Tabla de contingencia con frecuencias observadas, prueba Chi-Cuadrado de homogeneidad.
Tabla de contingencia con frecuencias observadas (O) y frecuencias esperadas (E) | |||
---|---|---|---|
Modalidad de vida | Sobrevivió | No sobrevivió | Totales de filas |
Casa o adosado | O1,1: 217E1,1: 208.795 | O1,2: 5314E1,2: 5322.205 | 5531 |
Apartamento en1ª o2ª Planta | O2,1: 35E2,1: 25.179 | O2,2: 632E2,2: 641.821 | 667 |
Apartamento en planta3ª o superior | O3,1: 46E3,1: 64.024 | O3,2: 1650E3,2: 1631.976 | 1696 |
Totales de columna | 298 | 7596 | \(n =\) 7894 |
Los decimales de la tabla se redondean a \(3\) dígitos.
Grados de libertad para una prueba chi-cuadrado de homogeneidad
En una prueba Chi-cuadrado de homogeneidad hay dos variables. Por tanto, estás comparando dos variables y necesitas que la tabla de contingencia sume en ambas dimensiones.
Como necesitas que las filas sumen y las columnas sumen, los grados de libertad se calculan mediante:
\[ k = (r - 1) (c - 1) \]
donde,
\(k\) son los grados de libertad,
\(r\) es el número de poblaciones, que también es el número de filas de una tabla de contingencia, y
\(c\) es el número de niveles de la variable categórica, que también es el número de columnas de una tabla de contingencia.
Prueba Chi-cuadrado de homogeneidad: Fórmula
La fórmula (también llamada estadístico de prueba) de una prueba Chi-cuadrado de homogeneidad es:
\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}}]
donde
\(O_{r,c}) es la frecuencia observada para la población \(r\) en el nivel \(c\), y
\es la frecuencia esperada de la población (r) en el nivel (c).
Cómo calcular el estadístico de una prueba de homogeneidad chi-cuadrado
Paso \(1\): Crea una tabla
A partir de tu tabla de contingencia, elimina la columna "Totales de fila" y la fila "Totales de columna". A continuación, separa tus frecuencias observadas y esperadas en dos columnas, así
Tabla 3. Tabla de frecuencias observadas y esperadas, prueba Chi-cuadrado de homogeneidad.
Tabla de frecuencias observadas y esperadas | |||
---|---|---|---|
Modalidad de vida | Estado | Frecuencia Observada | Frecuencia esperada |
Casa o adosado | Sobrevivió | 217 | 208.795 |
No sobrevivió | 5314 | 5322.205 | |
Apartamento en1ª o2ª planta | Sobrevivió | 35 | 25.179 |
No sobrevivió | 632 | 641.821 | |
Apartamento en la3ª planta o superior | Sobrevivió | 46 | 64.024 |
No sobrevivió | 1650 | 1631.976 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
Paso \(2\): Resta las Frecuencias Esperadas de las Frecuencias Observadas
Añade una nueva columna a tu tabla llamada "O - E". En esta columna, pon el resultado de restar la frecuencia esperada de la frecuencia observada:
Tabla 4. Tabla de frecuencias observadas y esperadas, prueba Chi-Cuadrado de homogeneidad.
Tabla de frecuencias observadas, esperadas y O - E | |||||
---|---|---|---|---|---|
Modalidad de vida | Estado | Frecuencia observada | Frecuencia esperada | O - E | |
Casa o adosado | Sobrevivido | 217 | 208.795 | 8.205 | |
No sobrevivió | 5314 | 5322.205 | -8.205 | ||
Apartamento en1ª o2ª planta | Sobrevivió | 35 | 25.179 | 9.821 | |
No sobrevivieron | 632 | 641.821 | -9.821 | ||
Apartamento en la3ª planta o superior | Sobrevivió | 46 | 64.024 | -18.024 | |
No sobrevivió | 1650 | 1631.976 | 18.024 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
Paso \(3\): Eleva al cuadrado los resultados del Paso \(2\)Añade otra columna nueva a tu tabla llamada "(O - E)2". En esta columna, pon el resultado de elevar al cuadrado los resultados de la columna anterior:
Tabla 5. Tabla de frecuencias observadas y esperadas, prueba Chi-cuadrado de homogeneidad.
Tabla de frecuencias observadas, esperadas, O - E y (O - E) 2 | |||||||
---|---|---|---|---|---|---|---|
Modalidad de vida | Estado | Frecuencia Observada | Frecuencia Esperada | O - E | (O - E)2 | ||
Casa o adosado | Sobrevivió | 217 | 208.795 | 8.205 | 67.322 | ||
No sobrevivieron | 5314 | 5322.205 | -8.205 | 67.322 | |||
Apartamento en1ª o2ª planta | Sobrevivido | 35 | 25.179 | 9.821 | 96.452 | ||
No sobrevivieron | 632 | 641.821 | -9.821 | 96.452 | |||
Apartamento en la3ª planta o superior | Sobrevivientes | 46 | 64.024 | -18.024 | 324.865 | ||
No sobrevivieron | 1650 | 1631.976 | 18.024 | 324.865 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
Paso \(4\): Divide los Resultados del Paso \(3\) entre las Frecuencias EsperadasAñade una última columna nueva a tu tabla llamada "(O - E)2/E". En esta columna, pon el resultado de dividir los resultados de la columna anterior entre sus frecuencias esperadas:
Tabla 6. Tabla de frecuencias observadas y esperadas, prueba Chi-cuadrado de homogeneidad.
Tabla de frecuencias observadas, esperadas, O - E, (O - E)2 y (O - E)2/E | |||||||||
---|---|---|---|---|---|---|---|---|---|
Modalidad de vida | Estado | Frecuencia Observada | Frecuencia Esperada | O - E | (O - E)2 | (O - E)2/E | |||
Casa o adosado | Sobrevivientes | 217 | 208.795 | 8.205 | 67.322 | 0.322 | |||
No sobrevivió | 5314 | 5322.205 | -8.205 | 67.322 | 0.013 | ||||
Apartamento en1ª o2ª planta | Sobrevivido | 35 | 25.179 | 9.821 | 96.452 | 3.831 | |||
No sobrevivió | 632 | 641.821 | -9.821 | 96.452 | 0.150 | ||||
Piso3 o superior | Sobrevivientes | 46 | 64.024 | -18.024 | 324.865 | 5.074 | |||
No sobrevivió | 1650 | 1631.976 | 18.024 | 324.865 | 0.199 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
Paso \(5\): Suma los resultados del Paso \(4\) para obtener el estadístico de la prueba Chi-cuadradoPor último, suma todos los valores de la última columna de tu tabla para calcular tu estadístico de la prueba Chi-cuadrado:
\[ \begin{align}\chi^{2} &= \sum \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}} \\&= 0,322 + 0,013 + 3,831 + 0,150 + 5,074 + 0,199&= 9,589.\end{align} \]
Elestadístico de la prueba Chi-cuadrado para la prueba Chi-cuadrado de homogeneidad en el estudio de supervivencia al infarto de miocardio es:
\[ \chi^{2} = 9,589. \]
Pasos para realizar una prueba Chi-cuadrado de homogeneidad
Para determinar si el estadístico de la prueba es lo suficientemente grande como para rechazar la hipótesis nula, se compara el estadístico de la prueba con un valor crítico de una tabla de distribución Chi-cuadrado. Este acto de comparación es el núcleo de la prueba Chi-cuadrado de homogeneidad.
Sigue los pasos \(6\) que se indican a continuación para realizar una prueba de homogeneidad Chi-cuadrado.
Los pasos \(1, 2\) y \(3\) se describen detalladamente en las secciones anteriores: "Prueba de Chi-cuadrado para la homogeneidad: hipótesis nula e hipótesis alternativa", "Frecuencias esperadas para una prueba de Chi-cuadrado para la homogeneidad" y "Cómo calcular el estadístico de prueba para una prueba de Chi-cuadrado para la homogeneidad".
Paso 1: Plantea las hipótesis
- La hipótesis nula es que las dos variables proceden de la misma distribución.\[ \begin{align}H_{0}: p_{1,1} &= p_{2,1} \text{ AND } \\p_{1,2} &= p_{2,2} \Y \ldots \text{ AND } \\p_{1,n} &= p_{2,n}\end{align} \]
La hipótesis alternativa es que las dos variables no proceden de la misma distribución, es decir, al menos una de las hipótesis nulas es falsa.\[ \begin{align}H_{a}: p_{1,1} &\neq p_{2,1} \text{ OR } \\p_{1,2} &\neq p_{2,2} \O \puntos texto O \\p_{1,n} &\neq p_{2,n}\end{align} \]
Paso \(2\): Calcular las Frecuencias Esperadas
Consulta tu tabla de contingencia para calcular las frecuencias esperadas utilizando la fórmula
\E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}].
Paso \(3\): Calcular el estadístico de la prueba Chi-cuadrado
Utiliza la fórmula de la prueba Chi-cuadrado de homogeneidad para calcular el estadístico de la prueba Chi-cuadrado:
\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}}]
Paso \(4\): Hallar el valor crítico de Chi-cuadrado
Para hallar el valor crítico Chi-cuadrado, puedes
utilizar una tabla de distribución Chi-cuadrado, o bien
utilizar una calculadora de valores críticos.
Independientemente del método que elijas, necesitas \(2\) datos
los grados de libertad, \(k\), dados por la fórmula
\[ k = (r - 1) (c - 1) \]
y el nivel de significación, \(\alfa), que suele ser \(0,05\).
Halla el valor crítico del estudio de supervivencia al infarto.
Para hallar el valor crítico:
- Calcula los grados de libertad.
- Utilizando la tabla de contingencia, observa que hay \(3\) filas y \(2\) columnas de datos brutos. Por tanto, los grados de libertad son:\[ \begin{align}k &= (r - 1) (c - 1) \\&= (3-1) (2-1) \&= 2 \text{ grados de libertad}\end{align} \]
- Elige un nivel de significación.
- Generalmente, a menos que se especifique lo contrario, el nivel de significación de \( \alfa = 0,05 \) es el que debes utilizar. Este estudio también utilizó ese nivel de significación.
- Determina el valor crítico (puedes utilizar una tabla de distribución Chi-cuadrado o una calculadora). Aquí se utiliza una tabla de distribución Chi-cuadrado.
- Según la siguiente tabla de distribución Chi-cuadrado, para \( k = 2 \) y \( \alfa = 0,05 \), el valor crítico es:\[ \chi^{2} \text{ valor crítico} = 5,99. \].
Tabla 7. Tabla de puntos porcentuales, prueba Chi-Cuadrado de homogeneidad.
Puntos porcentuales de la distribución Chi-Cuadrado | |||||||||
---|---|---|---|---|---|---|---|---|---|
Grados de libertad(k) | Probabilidad de un valor mayor de X2; Nivel de significación (α) | ||||||||
0.99 | 0.95 | 0.90 | 0.75 | 0.50 | 0.25 | 0.10 | 0.05 | 0.01 | |
1 | 0.000 | 0.004 | 0.016 | 0.102 | 0.455 | 1.32 | 2.71 | 3.84 | 6.63 |
2 | 0.020 | 0.103 | 0.211 | 0.575 | 1.386 | 2.77 | 4.61 | 5.99 | 9.21 |
3 | 0.115 | 0.352 | 0.584 | 1.212 | 2.366 | 4.11 | 6.25 | 7.81 | 11.34 |
Paso \(5\): Compara el estadístico de la prueba Chi-cuadrado con el valor crítico Chi-cuadrado
¿Es tu estadístico de prueba lo suficientemente grande como para rechazar la hipótesis nula? Para averiguarlo, compáralo con el valor crítico.
Compara tu estadístico de prueba con el valor crítico en el estudio de supervivencia al infarto de miocardio:
El estadístico de la prueba Chi-cuadrado es \( \chi^{2} = 9,589 \)
El valor crítico de Chi-cuadrado es \( 5.99 \)
El estadístico de la prueba Chi-cuadradoes mayor que el valor crítico.
Paso \(6\): Decide si rechazas la hipótesis nula
Por último, decide si puedes rechazar la hipótesis nula.
Si el valor Chi-cuadrado es menor que el valor crítico, entonces tienes una diferencia insignificante entre las frecuencias observada y esperada; es decir, \( p > \alfa \).
Esto significa que no rechazas la hipótesis nula.
Si el valor de Chi-cuadrado es mayor que el valor crítico, existe una diferencia significativa entre las frecuencias observada y esperada, es decir, \( p < \alfa \).
Esto significa que tienes pruebas suficientes para rechazar la hipótesis nula.
Ahora puedes decidir si rechazas la hipótesis nula del estudio de supervivencia al infarto de miocardio:
El estadístico de la prueba Chi-cuadrado es mayor que el valor crítico; es decir, el valor \(p\)- es menor que el nivel de significación.
- Por tanto, tienes pruebas sólidas de que las proporciones en las categorías de supervivencia no son las mismas para los grupos \(3\).
Llegas a la conclusión de que existe una menor probabilidad de supervivencia para los que sufren un infarto de miocardio y viven en la tercera planta o superior de un piso, y por tanto rechazas la hipótesis nula.
Valor P de una prueba Chi-cuadrado de homogeneidad
El valor \(p\)-de una prueba Chi-cuadrado de homogeneidad es la probabilidad de que el estadístico de la prueba, con \(k\) grados de libertad, sea más extremo que su valor calculado. Puedes utilizar una calculadora de la distribución chi-cuadrado para hallar el valor \(p\) de un estadístico de prueba. También puedes utilizar una tabla de distribución chi-cuadrado para determinar si el valor de tu estadístico de la prueba chi-cuadrado está por encima de un determinado nivel de significación.
Prueba ji-cuadrado de homogeneidad VS independencia
Llegados a este punto, puede que te preguntes: ¿cuál es la diferencia entre una prueba de Chi-cuadrado para la homogeneidad y una prueba de Chi-cuadrado para la independencia?
Utilizarás la prueba de Chi-cuadrado para la homogeneidad cuando sólo tengas \(1\) variable categórica de \(2\) (o más) poblaciones.
En esta prueba, recoges aleatoriamente datos de una población para determinar si existe una asociación significativa entre \(2\) variables categóricas.
Al encuestar a los alumnos de un colegio, puedes preguntarles por su asignatura favorita. Haces la misma pregunta a \(2\) poblaciones diferentes de estudiantes:
- estudiantes de primer y
- estudiantes de último curso.
Utiliza la prueba Chi-cuadrado de homogeneidad para determinar si las preferencias de los estudiantes de primer año difieren significativamente de las de los estudiantes de último curso.
Utiliza la prueba de Chi-cuadrado para la independencia cuando tengas variables categóricas de la misma población.
En esta prueba, recoges aleatoriamente los datos de cada subgrupo por separado para determinar si el recuento de frecuencias difiere significativamente entre las distintas poblaciones.
En una escuela, los alumnos podrían clasificarse por:
- su lateralidad (zurdos o diestros) o por
- su campo de estudio (matemáticas, física, economía, etc.).
Utiliza una prueba Chi-cuadrado de independencia para determinar si la lateralidad está relacionada con la elección de estudios.
Ejemplo de prueba Chi-cuadrado de homogeneidad
Continuando con el ejemplo de la introducción, decides encontrar una respuesta a la pregunta: ¿tienen los hombres y las mujeres preferencias cinematográficas diferentes?
Seleccionas una muestra aleatoria de \(400\) estudiantes universitarios de primer año: \(200) hombres y (300) mujeres. Se pregunta a cada persona cuál de las siguientes películas le gusta más: Terminator, La princesa prometida o La Lego película. Los resultados se muestran en la siguiente tabla de contingencia.
Tabla 8. Tabla de contingencia, prueba de Chi-cuadrado para la homogeneidad.
Tabla de contingencia | |||
---|---|---|---|
Película | Hombres | Mujeres | Totales de filas |
Terminator | 120 | 50 | 170 |
La princesa prometida | 20 | 140 | 160 |
La Lego Película | 60 | 110 | 170 |
Totales de columna | 200 | 300 | \(n =\) 500 |
Solución:
Paso \(1\): Plantea las hipótesis.
- Hipótesisnula: la proporción de hombres que prefieren cada película es igual a la proporción de mujeres que prefieren cada película. Por tanto,[ \begin{align}H_{0}: p_{\text{a los hombres les gusta Terminator}} &= p_{\text{a las mujeres les gusta Terminator}} \Y \\H_{0}: p_{texto} a los hombres les gusta La Princesa Prometida} &= p_{texto} a las mujeres les gusta La Princesa Prometida} \Y \\H_{0}: p_{texto} a los hombres les gusta La Lego Película} &= p_{texto} a las mujeres les gusta La Lego Película}\end{align} \]
- Hipótesis alternativa: Al menos una de las hipótesis nulas es falsa. Así pues,[ \begin{align}H_{a}: p_{texto}{a los hombres les gusta Terminator}} &\neq p_{texto}{a las mujeres les gusta Terminator}} \O \\H: a los hombres les gusta La princesa prometida y a las mujeres les gusta La princesa prometida. \O\\ H: a los hombres les gusta La Lego Película y a las mujeres les gusta La Lego Película. \]
Paso 2: Calcula las frecuencias esperadas.
- Utilizando la tabla de contingencia anterior y la fórmula de las frecuencias esperadas:\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}, \]crea una tabla de frecuencias esperadas.
Tabla 9. Tabla de datos de las películas, prueba Chi-Cuadrado de homogeneidad.
Película | Hombres | Mujeres | Totales de filas |
Terminator | 68 | 102 | 170 |
La princesa prometida | 64 | 96 | 160 |
La Lego Película | 68 | 102 | 170 |
Totales de columna | 200 | 300 | \(n =\) 500 |
Paso \(3\): Calcula el estadístico de la prueba Chi-cuadrado.
- Crea una tabla para guardar tus valores calculados y utiliza la fórmula:\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}{E_{r,c}} \}para calcular tu estadístico de prueba.
Tabla 10. Tabla de datos de las películas, prueba Chi-cuadrado de homogeneidad.
Película | Persona | Frecuencia Observada | Frecuencia Esperada | O-E | (O-E)2 | (O-E)2/E |
Terminator | Hombres | 120 | 68 | 52 | 2704 | 39.767 |
Mujeres | 50 | 102 | -52 | 2704 | 26.510 | |
Princesa Novia | Hombres | 20 | 64 | -44 | 1936 | 30.250 |
Mujeres | 140 | 96 | 44 | 1936 | 20.167 | |
Lego Película | Hombres | 60 | 68 | -8 | 64 | 0.941 |
Mujeres | 110 | 102 | 8 | 64 | 0.627 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
- Suma todos los valores de la última columna de la tabla anterior para calcular el estadístico de la prueba Chi-cuadrado:\[ \begin{align}\chi^{2} &= 39.76470588 + 26.50980392 \&+ 30.25 + 20.16667 \&+ 0.9411764706 + 0.6274509804 \&= 118.2598039.\end{align} \]
Esta fórmula utiliza los números no redondeados de la tabla anterior para obtener una respuesta más precisa.
- El estadístico de la prueba Chi-cuadrado es:\[ \chi^{2} = 118,2598039. \]
Paso \(4\): Halla el valor crítico de Chi-cuadrado y el valor \(P\)-.
- Calcula los grados de libertad.\[ \begin{align}k &= (r - 1) (c - 1) \&= (3 - 1) (2 - 1) \&= 2 end{align} \]
- Utilizando una tabla de distribución Chi-cuadrado, observa la fila de \(2\) grados de libertad y la columna de \(0,05\) significación para hallar el valor crítico de \(5,99\).
- Para utilizar una calculadora del valor \(p\), necesitas el estadístico de la prueba y los grados de libertad.
- Introduce los grados de libertad y el valor crítico Chi-cuadrado en la calculadora para obtener:\[ P(\chi^{2} > 118,2598039) = 0. \]
Paso \(5\): Compara el estadístico de la prueba Chi-cuadrado con el valor crítico Chi-cuadrado.
- El estadístico de prueba de \(118,2598039\) es significativamente mayor que el valor crítico de \(5,99\).
- El valor \(p\) -también es mucho menor que el nivel de significación.
Paso 6: Decidesi rechazas la hipótesis nula.
- Como el estadístico de la prueba es mayor que el valor crítico y el valor \(p\)- es menor que el nivel de significación,
tienes pruebas suficientes para rechazar la hipótesis nula.
Prueba de Chi-cuadrado para la homogeneidad - Aspectos clave
- La prueba de Chi-cuadrado para la homogeneidad es una prueba de Chi-cuadrado que se aplica a una única variable categórica de dos o más poblaciones diferentes para determinar si tienen la misma distribución.
- Esta prueba tiene las mismas condiciones básicas que cualquier otra prueba Chi-cuadrado de Pearson;
- Las variables deben ser categóricas.
- Los grupos deben ser mutuamente excluyentes.
- Los recuentos esperados deben ser al menos \(5\).
- Las observaciones deben ser independientes.
- La hipótesis nula es que las variables proceden de la misma distribución.
- La hipótesis alternativa es que las variables no pertenecen a la misma distribución.
- Los grados de libertad de una prueba Chi-cuadrado de homogeneidad vienen dados por la fórmula:\[ k = (r - 1) (c - 1) \]
- La frecuencia esperada para la fila \(r\) y la columna \(c\) de una prueba de Chi-cuadrado para la homogeneidad viene dada por la fórmula:\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \}].
- La fórmula (o estadística de prueba) de una prueba de Chi-cuadrado para la homogeneidad viene dada por la fórmula:\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}} ].
Referencias
- https://pubmed.ncbi.nlm.nih.gov/26783332/
Aprende con 7 tarjetas de Prueba de Chi-Cuadrado para Homogeneidad en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Prueba de Chi-Cuadrado para Homogeneidad
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más