Saltar a un capítulo clave
enviar por correo un folleto educativo; y
llamar a cada residente.
A continuación, la ciudad selecciona al azar \(200\) hogares y los asigna aleatoriamente a una de estas tres categorías
recibir el folleto
recibir una llamada telefónica;
el grupo de control (ninguna forma de intervención).
Por último, la ciudad utilizará los resultados de esta prueba para decidir cuál es la mejor forma de pedir a sus residentes que reciclen más.
¿Adivinas qué prueba de hipótesis utilizarán para tomar esta decisión? ¡Una prueba Chi-cuadrado de independencia!
Definición de la prueba Chi-cuadrado de independencia
En ocasiones, quieres saber si existe una relación entre dos variables categóricas.
Piénsalo de este modo:
Si sabes algo sobre una variable, ¿puedes utilizar esa información para aprender sobre la otra variable?
Puedes utilizar una prueba Chi-cuadrado de independencia para hacer precisamente eso.
Una prueba de independencia Chi-cuadrado \( (\chi^{2}) \) es una prueba no paramétrica de Chi-cuadrado de Pearson que puedes utilizar para determinar si dos variables categóricas de una misma población están relacionadas entre sí o no.
Si existe una relación entre las dos variables categóricas, conocer el valor de una de ellas te dice algo sobre el valor de la otra.
Si no hay relación entre las dos variables categóricas, entonces son independientes.
Supuestos de una prueba Chi-cuadrado de independencia
Todas las pruebas Chi-cuadrado de Pearson, de independencia, homogeneidad y bondad de ajuste, comparten los mismos supuestos básicos. La principal diferencia es cómo se aplican los supuestos en la práctica. Para poder utilizar esta prueba, los supuestos de una prueba Chi-cuadrado de independencia son:
Las dos variables deben ser categóricas.
Esta prueba Chi-cuadrado utiliza tabulaciones cruzadas, contando las observaciones que entran en cada categoría.
Los grupos deben ser mutuamente excluyentes; es decir, la muestra se selecciona al azar.
Siguiendo con el ejemplo introductorio, tres meses después de probar los métodos de intervención de la ciudad, observan el resultado y ponen los datos en una tabla de contingencia. Los grupos que deben ser mutuamente excluyentes son los subgrupos: (Recicla-Panfleto), (No Recicla-Control), etc.
Tabla 1. Tabla de contingencia, prueba Chi-cuadrado de independencia.
Tabla de contingencia | |||
---|---|---|---|
Intervención | Recicla | No recicla | Totales de fila |
Panfleto | 46 | 18 | 56 |
Llamada telefónica | 47 | 19 | 77 |
Control | 49 | 21 | 67 |
Totales de columna | 142 | 58 | \(n =\) 200 |
Los recuentos esperados deben ser al menos \(5\).
Esto significa que el tamaño de la muestra debe ser lo suficientemente grande, pero cómo de grande es difícil de determinar de antemano. En general, basta con asegurarse de que hay más de \(5\) en cada categoría.
Las observaciones deben ser independientes.
Se trata de cómo se recogen los datos. En el ejemplo del reciclaje urbano, el investigador no debe tomar muestras de casas que estén cerca unas de otras. Es decir, es más probable que recicle una calle de casas que que reciclen casas elegidas de barrios distintos.
Hipótesis nula e hipótesis alternativa para una prueba chi-cuadrado de independencia
Cuando se trata de la independencia de variables, casi siempre se supone que dos variables son independientes, y luego se intenta demostrar que no lo son.
La hipótesis nula es que las dos variables categóricas son independientes, es decir, que no hay asociación entre ellas, no están relacionadas.[ H_{0}: \text{"Variable A" y "Variable B" no están relacionadas.} \]
La hipótesis alternativa es que las dos variables categóricas no son independientes, es decir, que existe una asociación entre ellas, que están relacionadas.\[ H_{a}: \text{"Variable A" y "Variable B" están relacionadas.} \]
Observa que la prueba Chi-cuadrado de independencia no hace ninguna afirmación sobre el tipo de relación entre las dos variables categóricas, sólo si existe una relación.
Sustituyendo "Variable A" y "Variable B" por las variables del ejemplo de reciclaje de ciudades, obtienes
Tu población son todos los hogares de tu ciudad.
- Hipótesis nula \[ \begin{align}H_{0}: &\text{"si un hogar recicla" y}} \\&\text{"el tipo de intervención recibida"} \\&\text{no están relacionados}.\end{align} \]
- Hipótesis alternativa \[\begin{align}H_{a}: &\text{\}"si un hogar recicla" y}} \\&\text{"el tipo de intervención recibida"} \\&\text{están relacionados}.\end{align} \]
Frecuencias esperadas de una prueba Chi-cuadrado de independencia
Al igual que otras pruebas Chi-cuadrado, una prueba Chi-cuadrado de independencia funciona comparando tus frecuencias observadas y esperadas. Calculas las frecuencias esperadas utilizando la tabla de contingencia. Así, la frecuencia esperada para la fila \(r\) y la columna \(c\) viene dada por la fórmula
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}]
donde
\(E_{r,c}) es la frecuencia esperada para la población (o, fila) \(r\) en el nivel (o, columna) \(c\) de la variable categórica,
\(r\) es el número de poblaciones, que también es el número de filas de una tabla de contingencia,
\(c\) es el número de niveles de la variable categórica, que también es el número de columnas de una tabla de contingencia,
\(n_{r}\) es el número de observaciones de la población (o, fila) \(r\),
\(n_{c}) es el número de observaciones del nivel (o columna) (c) de la variable categórica, y
\es el tamaño total de la muestra.
Siguiendo con el ejemplo del reciclaje en la ciudad:
Tu ciudad calcula ahora las frecuencias esperadas utilizando la fórmula anterior y la tabla de contingencia.
- \(E_{1,1}=\frac{56 \cdot 142}{200} = 39,76\})
- \(E_{1,2}=frac{56 \cdot 58}{200} = 16,24)
- \(E_{2,1}=frac{77}{cdot 142}{200} = 54,67)
- \(E_{2,2}=frac{77 \cdot 58}{200} = 22,33)
- \(E_{3,1}=frac{67}{cdot 142}{200} = 47,57)
- \(E_{3,2}=frac{67}{cdot 58}{200} = 19,43)
Tabla 2. Tabla de contingencia con frecuencias observadas y frecuencias esperadas, prueba Chi-cuadrado de independencia.
Tabla de contingencia con frecuencias observadas (O) y frecuencias esperadas (E) | |||
---|---|---|---|
Intervención | Recicla | No recicla | Totales de fila |
Panfleto | O1,1 = 46E1, 1 = 39,76 | O1,2 = 18E1,2 = 16,24 | 56 |
Llamada telefónica | O2,1 = 47E2, 1 = 54,67 | O2,2 = 19E2,2 = 22,33 | 77 |
Control | O3,1 = 49E3, 1 = 47,57 | O3,2 = 21E3,2 = 19,43 | 67 |
Totales de columna | 142 | 58 | \(n =\) 200 |
Grados de libertad para una prueba Chi-cuadrado de independencia
Como en la prueba Chi-cuadrado de homogeneidad, estás comparando dos variables y necesitas que la tabla de contingencia sume en ambas dimensiones.
La fórmula para los grados de libertad es la misma tanto en la prueba de homogeneidad como en la de independencia:
\[ k = (r - 1) (c - 1) \]
donde
\(k\) son los grados de libertad,
\(r\) es el número de poblaciones, que también es el número de filas de una tabla de contingencia, y
\(c\) es el número de niveles de la variable categórica, que también es el número de columnas de una tabla de contingencia.
Fórmula de la prueba de independencia Chi-cuadrado
La fórmula (también llamada estadístico de prueba) para una prueba Chi-cuadrado de independencia es:
\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}}]
donde,
\(O_{r,c}\) es la frecuencia observada para la población \(r\) en el nivel \(c\), y
\es la frecuencia esperada de la población (r) en el nivel (c).
El estadístico de la prueba Chi-cuadrado mide cuánto difieren tus frecuencias observadas de tus frecuencias esperadas si las dos variables no están relacionadas.
Pasos para calcular el estadístico de la prueba Chi-cuadrado de independencia
Paso \(1\): Crea una tabla
Utilizando tu tabla de contingencia, crea una tabla que separe tus valores observados y esperados en dos columnas.
Tabla 3. Tabla de frecuencias observadas y frecuencias esperadas, prueba de Chi-cuadrado para la independencia.
Tabla de frecuencias observadas y esperadas | |||
---|---|---|---|
Intervención | Resultado | Frecuencia Observada | Frecuencia Esperada |
Folleto | Recicla | 46 | 39.76 |
No recicla | 18 | 16.24 | |
Llama por teléfono | Recicla | 47 | 54.67 |
No recicla | 19 | 22.33 | |
Controla | Recicla | 49 | 47.57 |
No Recicla | 21 | 19.43 |
Paso \(2\): Resta las Frecuencias Esperadas de las Frecuencias Observadas
Añade una nueva columna a tu tabla llamada "O - E". En esta columna, pon el resultado de restar la frecuencia esperada de la frecuencia observada.
Tabla 4. Tabla de frecuencias observadas y frecuencias esperadas, prueba de Chi-cuadrado para la independencia.
Tabla de frecuencias observadas, esperadas y O-E | ||||
---|---|---|---|---|
Intervención | Resultado | Frecuencia Observada | Frecuencia Esperada | O - E |
Folleto | Recicla | 46 | 39.76 | 6.24 |
No recicla | 18 | 16.24 | 1.76 | |
Llama por teléfono | Recicla | 47 | 54.67 | -7.67 |
No recicla | 19 | 22.33 | -3.33 | |
Controla | Recicla | 49 | 47.57 | 1.43 |
No recicla | 21 | 19.43 | 1.57 |
Los decimales de esta tabla se redondean a \(2\) dígitos.
Paso \(3\): Eleva al cuadrado los resultados del Paso \(2\)
Añade una nueva columna a tu tabla llamada "(O - E)2". En esta columna, pon el resultado de elevar al cuadrado los resultados de la columna anterior.
Tabla 5. Tabla de frecuencias observadas y frecuencias esperadas, prueba de Chi-cuadrado para la independencia.
Tabla de frecuencias observadas, esperadas, O-E y (O-E)2 | |||||
---|---|---|---|---|---|
Intervención | Resultado | Frecuencia Observada | Frecuencia Esperada | O - E | (O - E)2 |
Folleto | Recicla | 46 | 39.76 | 6.24 | 38.94 |
No recicla | 18 | 16.24 | 1.76 | 3.10 | |
Llama por teléfono | Recicla | 47 | 54.67 | -7.67 | 58.83 |
No recicla | 19 | 22.33 | -3.33 | 11.09 | |
Controla | Recicla | 49 | 47.57 | 1.43 | 2.04 |
No recicla | 21 | 19.43 | 1.57 | 2.46 |
Los decimales de esta tabla se redondean a \(2\) dígitos.
Paso \(4\): Divide los Resultados del Paso \(3\) entre las Frecuencias Esperadas
Añade una nueva columna a tu tabla llamada "(O - E)2"/E. En esta columna, pon el resultado de dividir los resultados de la columna anterior entre sus frecuencias esperadas.
Tabla 6. Tabla de frecuencias observadas y frecuencias esperadas, prueba de Chi-cuadrado para la independencia.
Tabla de frecuencias observadas, esperadas, O-E, (O-E)2 y (O-E)2/E | ||||||
---|---|---|---|---|---|---|
Intervención | Resultado | Frecuencia Observada | Frecuencia Esperada | O - E | (O - E)2 | (O - E)2/E |
Folleto | Recicla | 46 | 39.76 | 6.24 | 38.94 | 0.98 |
No recicla | 18 | 16.24 | 1.76 | 3.10 | 0.19 | |
Llamadas telefónicas | Recicla | 47 | 54.67 | -7.67 | 58.83 | 1.08 |
No recicla | 19 | 22.33 | -3.33 | 11.09 | 0.50 | |
Control | Recicla | 49 | 47.57 | 1.43 | 2.04 | 0.04 |
No recicla | 21 | 19.43 | 1.57 | 2.46 | 0.13 |
Los decimales de esta tabla se redondean a \(2\) dígitos.
Paso \(5\): Suma los Resultados del Paso \(4\) para obtener el Estadístico de la Prueba Chi-cuadrado
Por último, suma todos los valores de la última columna de la tabla para calcular el estadístico de la prueba Chi-cuadrado:
\[ \begin{align}\chi^{2} &= \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}} \\&= 0,9793 + 0,1907 + 1,0761 + 0,4966 + 0,04299 + 0,1269&= 2,91259\end{align} \]
Esta fórmula utiliza los números no redondeados de las tablas anteriores para obtener una respuesta más precisa.
El estadístico de la prueba Chi-cuadrado para la prueba Chi-cuadrado de independencia en el ejemplo del reciclaje de ciudades es:
\[ \chi^{2} = 2,91259 \]
Pasos para realizar una prueba Chi-cuadrado de independencia
Si el estadístico de la prueba calculado es lo suficientemente grande, puedes llegar a la conclusión de que las frecuencias observadas no son las que cabría esperar si las variables no estuvieran relacionadas. Pero, ¿qué se considera "suficientemente grande"?
Para determinar si el estadístico de la prueba es lo suficientemente grande como para rechazar la hipótesis nula, compara el estadístico de la prueba con un valor crítico de una tabla de distribución Chi-cuadrado. Este acto de comparación es el núcleo de la prueba Chi-cuadrado de independencia.
Sigue los pasos \(6\) que se indican a continuación para realizar una prueba Chi-cuadrado de independencia.
Ten en cuenta que los pasos \(1, 2\) y \(3\) se han descrito detalladamente más arriba.
Paso \(1\): Plantea las hipótesis
La hipótesis nula es que las dos variables categóricas son independientes, es decir, no hay asociación entre ellas, no están relacionadas.\[ H_{0}: \text{"Variable A" y "Variable B" no están relacionadas.} \]
La hipótesis alternativa es que las dos variables categóricas no son independientes, es decir, que existe una asociación entre ellas, están relacionadas.\[ H_{a}: \text{"Variable A" y "Variable B" están relacionadas.} \]
Paso \(2\): Calcula las frecuencias esperadas
Utiliza tu tabla de contingencia para calcular las frecuencias esperadas mediante la fórmula
\E_{r,c} = \frac{n_{r} \cdot n_{c}}{n}].
Paso \(3\): Calcular el estadístico de la prueba Chi-cuadrado
Utiliza la fórmula de la prueba Chi-cuadrado de independencia para calcular el estadístico de la prueba Chi-cuadrado:
\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}} \]
Paso \(4\): Hallar el Valor Crítico Chi-Cuadrado
Tienes dos opciones para hallar el valor crítico:
utilizar una tabla de distribución Chi-cuadrado, o
utilizar una calculadora de valores críticos.
En cualquiera de los dos casos, hay dos datos que debes conocer para hallar el valor crítico
los grados de libertad, \(k\), dados por la fórmula
\[ k = (r - 1) (c - 1) \]
y el nivel de significación, \( \alfa \), que suele ser \( 0,05 \).
Volviendo al ejemplo del reciclaje urbano, halla el valor crítico.
Halla el valor crítico Chi-cuadrado.
- Calcula los grados de libertad.
- Utilizando la tabla de contingencia del ejemplo del reciclaje urbano, recuerda que hay \(3) grupos de intervención (las filas de la tabla de contingencia) y \(2\) grupos de resultados (las columnas de la tabla de contingencia). Así pues, los grados de libertad son:\[ \begin{align} k &= (r - 1) (c - 1) \&= (3 - 1) (2 - 1) \&= 2 \text{ grados de libertad}\end{align} \]
- Elige un nivel de significación.
- Normalmente, se utiliza un nivel de significación de 0,05, así que utilízalo aquí.
- Utilizando una tabla de distribución Chi-cuadrado o una calculadora de valores críticos, determina el valor crítico.
- Según la siguiente tabla de distribución Chi-cuadrado, para \(k = 2\) y \( \alfa = 0,05 \), el valor crítico es:\[ \chi^{2} \text{valor crítico} = 5,99 \].
Tabla 7. Porcentaje de puntos de la prueba Chi-cuadrado de independencia.
Porcentaje de puntos de la distribución Chi-cuadrado | |||||||||
---|---|---|---|---|---|---|---|---|---|
Grados de libertad(k) | Probabilidad de un valor mayor de X2; Nivel de significación (α) | ||||||||
0.99 | 0.95 | 0.90 | 0.75 | 0.50 | 0.25 | 0.10 | 0.05 | 0.01 | |
1 | 0.000 | 0.004 | 0.016 | 0.102 | 0.455 | 1.32 | 2.71 | 3.84 | 6.63 |
2 | 0.020 | 0.103 | 0.211 | 0.575 | 1.386 | 2.77 | 4.61 | 5.99 | 9.21 |
3 | 0.115 | 0.352 | 0.584 | 1.212 | 2.366 | 4.11 | 6.25 | 7.81 | 11.34 |
Paso \(5\): Compara el estadístico de la prueba Chi-cuadrado con el valor crítico Chi-cuadrado
¡Ahora llega el momento de la verdad! ¿Es tu estadístico de prueba lo suficientemente grande como para rechazar la hipótesis nula? Compáralo con el valor crítico que acabas de encontrar para averiguarlo.
Siguiendo con el ejemplo del reciclaje urbano, compara el estadístico de la prueba con el valor crítico.
El estadístico de la prueba Chi-cuadrado es \( \chi^{2} = 2,91259 \)
El valor crítico es \( 5.99 \)
El estadístico de la prueba Chi-cuadradoes menor que el valor crítico.
Paso \(6\): Decide si rechazas la hipótesis nula
Por último, decide si rechazas la hipótesis nula.
Si el valor de Chi-cuadrado es mayor que el valor crítico, entonces la diferencia entre las frecuencias observada y esperada es significativa; \( (p < \alfa) \)
Esto significa que rechazas la hipótesis nula de que las variables no están relacionadas, y tienes pruebas de que la hipótesis alternativa es cierta.
Si el valor de Chi-cuadrado es menor que el valor crítico, la diferencia entre las frecuencias observada y esperada no es significativa; \( (p > \alfa) \)
Esto significa que no rechazas la hipótesis nula, pero no tienes pruebas de que la hipótesis alternativa sea cierta.
Decide si rechazas la hipótesis nula para el ejemplo del reciclaje urbano.
El valor Chi-cuadrado es menor que el valor crítico.
- Por tanto, la ciudad no rechaza la hipótesis nula de que el hecho de que un hogar recicle y el tipo de intervención que recibe no están relacionados.
- No hay una diferencia significativa entre las frecuencias observadas y las esperadas. Esto sugiere que la proporción de hogares que reciclan es la misma para todas las intervenciones.
La ciudad concluye que sus intervenciones no tienen efecto sobre si los hogares deciden reciclar.
Uso del valor crítico VS Uso del valor P
En los pasos para realizar una prueba Chi-cuadrado de independencia, calculaste y utilizaste el valor crítico para decidir si rechazabas la hipótesis nula.
El valor crítico de una prueba Chi-cuadrado de independencia es un valor que se compara con el valor del estadístico de la prueba, para que puedas determinar si rechazas la hipótesis nula.
Sin embargo, es importante saber que hay otra opción que puedes utilizar: el valor \(p\)-.
El valor \( p\ )-de una prueba Chi-cuadrado de independencia está asociado al valor calculado de su estadístico de prueba. Es el área a la derecha del \( \chi^{2} \) bajo la curva chi cuadrado, y tiene \(k\) grados de libertad.
La imagen siguiente resume el enfoque del valor crítico frente al enfoque del valor \(p\)-.
Prueba Chi-cuadrado de independencia - Ejemplo
Hoy en día, muchas personas que buscan trabajo lo solicitan a través de portales de empleo online. Sitios como Indeed, ZipRecruiter y CareerBuilder tienen miles de tentadores anuncios invitando a la gente a presentar su candidatura. Nunca ha sido tan fácil para los reclutadores fraudulentos atraer a personas desprevenidas y vulnerables.
¿Los reclutadores fraudulentos son más frecuentes en unos sectores que en otros?
La siguiente tabla de contingencia contiene recuentos reales de ofertas de empleo online fraudulentas y no fraudulentas, por sectores. Éstas son las (10) industrias más comunes en el conjunto de datos. Es un conjunto de datos bastante grande, pero una buena representación de lo que hacen los estadísticos en el mundo real.
Tabla 7. Tabla de contingencia, prueba Chi-cuadrado de independencia.
Tabla de contingencia | |||
---|---|---|---|
Sector | Real | Fraude | Totales de fila |
Tecnología de la Información | 1702 | 32 | 1734 |
Software informático | 1371 | 5 | 1376 |
Internet | 1062 | 0 | 1062 |
Marketing / Publicidad | 783 | 45 | 828 |
Educación | 822 | 0 | 822 |
Servicios financieros | 744 | 35 | 779 |
Sanidad | 446 | 51 | 497 |
Servicios al consumidor | 334 | 24 | 358 |
Telecom. | 316 | 26 | 342 |
Petróleo / Energía | 178 | 109 | 287 |
Totales de columna | 7758 | 327 | \(n=\) 8085 |
Solución:
Paso \(1\): Plantea las hipótesis.
La hipótesis nula es que las dos variables categóricas son independientes, es decir, no hay asociación entre ellas, no están relacionadas.[ H_{0}: \text{"si un puesto de trabajo es real" y "la industria del empleo" no están relacionadas.} \]
La hipótesis alternativa es que las dos variables categóricas no son independientes, es decir, que existe una asociación entre ellas, están relacionadas.[ H_{a}: \text{"si un puesto de trabajo es real" y "la industria del empleo" están relacionadas.} \]
- Utilizando la tabla de contingencia anterior y la fórmula:\[ E_{r,c} = \frac{n_{r} \cdot n_{c}{n}, \]crea una tabla que tenga tus frecuencias esperadas calculadas.
Tabla 7. Tabla de frecuencias esperadas, prueba de Chi-cuadrado para la independencia.
Tabla de frecuencias esperadas | |||
---|---|---|---|
Sector | Real | Fraude | Totales de fila |
Tecnología de la información | 1663.8679 | 70.1321 | 1734 |
Software informático | 1320.3473 | 55.6527 | 1376 |
Internet | 1019.0471 | 42.9529 | 1062 |
Marketing / Publicidad | 794.5113 | 33.4887 | 828 |
Educación | 788.754 | 33.246 | 822 |
Servicios financieros | 747.4931 | 31.5069 | 779 |
Sanidad | 476.8987 | 20.1013 | 497 |
Servicios al consumidor | 343.5206 | 14.4794 | 358 |
Telecomunicaciones | 328.1677 | 13.8323 | 324 |
Petróleo / Energía | 275.3922 | 11.6078 | 287 |
Totales de columna | 7758 | 327 | \(n =\) 8085 |
Paso \(3\): Calcula el estadístico de la prueba Chi-cuadrado.
- Crea una tabla para guardar tus valores calculados y utiliza la fórmula:\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}{E_{r,c}} \}para calcular tu estadístico de prueba.
Tabla 7. Estadística de la prueba Chi-cuadrado.
Uso de una tabla para calcular el estadístico de la prueba Chi-cuadrado | ||||||
---|---|---|---|---|---|---|
Sector | Puesto de trabajo Estado | Frecuencia observada | Frecuencia Esperada | O - E | (O - E)2 | (O - E)2/E |
Tecnología de la información | Real | 1702 | 1633.868 | 68.132 | 4641.983 | 2.841 |
Fraude | 32 | 70.132 | -38.132 | 1454.057 | 20.733 | |
Programas informáticos | Real | 1371 | 1320.347 | 50.653 | 2565.696 | 1.943 |
Fraude | 5 | 55.653 | -50.653 | 2565.696 | 46.102 | |
Internet | Real | 1062 | 1019.047 | 42.953 | 1844.952 | 1.811 |
Fraude | 0 | 42.953 | -42.953 | 1844.952 | 42.953 | |
Marketing / Publicidad | Real | 783 | 794.511 | -11.511 | 132.510 | 0.167 |
Fraude | 45 | 33.4888 | 11.511 | 132.510 | 3.957 | |
Educación | Real | 822 | 788.754 | 33.246 | 1105.297 | 1.401 |
Fraude | 0 | 33.246 | -33.246 | 1105.297 | 33.246 | |
Servicios financieros | Inmobiliarios | 744 | 747.493 | -3.493 | 12.202 | 0.016 |
Fraude | 35 | 31.507 | 3.493 | 12.202 | 0.387 | |
Sanidad | Real | 446 | 476.899 | -30.899 | 954.730 | 2.002 |
Fraude | 51 | 20.101 | 30.899 | 954.730 | 47.496 | |
Servicios al consumidor | Inmuebles | 334 | 343.521 | -9.521 | 90.642 | 0.264 |
Fraude | 24 | 14.479 | 9.521 | 90.642 | 6.260 | |
Telecom. | Real | 316 | 328.168 | -12.168 | 148.053 | 0.451 |
Fraude | 26 | 13.832 | 12.168 | 148.053 | 10.703 | |
Petróleo / Energía | Real | 178 | 275.392 | -97.392 | 9485.241 | 34.443 |
Fraude | 109 | 11.608 | 97.392 | 9485.241 | 817.144 |
Los decimales de esta tabla se redondean a \(3\) dígitos.
- Suma todos los valores de la última columna de la tabla anterior para calcular la estadística de la prueba:\[ \begin{align}\chi^{2} &= 2,8411 + 20,7331 + 1,9432 + 46,1019 + 1,8105 \&+ 42.9529 + 0,1668 + 3,9569 + 1,4013 + 33,246&+ 0,0163 + 0,3873 + 2,0020 + 47,4959 + 0,2639&+ 6,2601 + 0,4512 + 10,7034 + 34,4427 + 817,1437&= 1074,319971.\end{align} \]
Esta fórmula utiliza los números no redondeados de la tabla anterior para obtener una respuesta más precisa.
- El estadístico de la prueba Chi-cuadrado es:\[ \chi^{2} = 1074,319971 .\\]
Paso \(4\): Halla el valor crítico Chi-cuadrado y el valor \(P\)-.
En el mundo real, un estadístico probablemente estaría más interesado en calcular el valor \(p\)-que simplemente en informar de si hay un resultado significativo, pero la gente prefiere obtener una conclusión más específica. Digamos que quieres estar realmente seguro de que existe una relación antes de informar de ella, y eliges un nivel de sign ificación de \(\alfa = 0,01\).
- Calcula los grados de libertad: \[ \begin{align}k &= (r - 1)(c - 1) \\&= (2 - 1) (10 - 1) \&= 1 \cdot 9 \&= 9 \text{ grados de libertad}\end{align} \]
- Utilizando una tabla de distribución Chi-cuadrado, mira la fila de \(9\) grados de libertad y la columna de \(0,01\) significación para hallar el valor crítico de \(21,67\).
- Para utilizar una calculadora del valor \(p\), necesitas la estadística de la prueba y los grados de libertad.
- Si introduces los grados de libertad y el estadístico de la prueba en una calculadora del valor \(p\), obtendrás un valor \(p\) muy próximo a \(0\).
Paso \(5\): Compara el estadístico de la prueba Chi-cuadrado con el valor crítico Chi-cuadrado.
- El estadístico de la prueba de \(1074,319971\) es mucho, mucho mayor que el valor crítico de \(21,67\), lo que significa que tienes pruebas suficientes para rechazar la hipótesis nula.
- Elvalor \(p\)-también es muy bajo, mucho menor que el nivel de significación, lo que también te permitiría rechazar la hipótesis nula.
Paso \(6\): Decidesi rechazas la hipótesis nula.
- Parece que existe una fuerte relación entre la industria y el número de reclutadores fraudulentos existentes.
- Mira la tabla del paso \(2\).
- Aquí puedes ver que el número de empleos fraudulentos en la industria petrolera es muy superior al esperado, y por sí solo contribuye lo suficiente para que concluyas que la industria y las estafas de los reclutadores no son independientes.
Por tanto, puedes rechazar con seguridad la hipótesis nula.
Prueba Chi-cuadrado de independencia - Aspectos clave
- La prueba Chi-cuadrado de independencia es una prueba no paramétrica de Chi-cuadrado de Pearson que puedes utilizar para determinar si dos variables categóricas de una misma población están relacionadas entre sí o no.
- Para utilizar una prueba Chi-cuadrado de independencia, debe cumplirse lo siguiente:
- Las dos variables deben ser categóricas.
- Los grupos deben ser mutuamente excluyentes; es decir, la muestra debe seleccionarse al azar.
- Los recuentos esperados deben ser al menos \(5\).
- Las observaciones deben ser independientes.
- La hipótesis nula es que las dos variables categóricas son independientes, es decir, no hay asociación entre ellas, no están relacionadas.
- La hipótesis alternativa es que las dos variables categóricas no son independientes, es decir, existe una asociación entre ellas, están relacionadas.
- La frecuencia esperada para la fila \(r\) y la columna \(c\) de una prueba Chi-cuadrado de independencia viene dada por la fórmula
\[ E_{r,c} = \frac{n_{r} \cdot n_{c}}{n} \].
- Los grados de libertad deuna prueba Chi-cuadrado de independencia vienen dados por la fórmula
\[ k = (r - 1) (c - 1) \]
La fórmula (también llamada estadística de prueba) para una prueba de independencia Chi-cuadrado es:
\[ \chi^{2} = \suma \frac{(O_{r,c}} - E_{r,c})^{2}}{E_{r,c}} \]
Aprende con 3 tarjetas de Prueba de Chi-Cuadrado de Independencia en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Prueba de Chi-Cuadrado de Independencia
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más