Saltar a un capítulo clave
Si no te sientes totalmente cómodo con la idea de una Distribución Chi-Cuadrado o con el concepto básico de las Pruebas Chi-Cuadrado, no te preocupes, ¡hay explicaciones de StudySmarter para ambas cosas!
Entonces no vale la pena esperar, ¡vamos a ello!
Definición de la prueba Chi-cuadrado de bondad de ajuste
¿Qué es la prueba Chi-cuadrado de bondad de ajuste? Pues...
La prueba Chi-cuadrado de bondad de ajustees una prueba estadística de hipótesis utilizada para determinar si una distribución esperada de resultados es significativamente diferente de la distribución real observada de resultados.
Esto es mucho hablar de resultados y distribuciones y todo tipo de palabrería estadística, pero ¿qué significa todo esto?
Imagina que lanzas un dado de 6 caras 100 veces. Esperarías que cayera en cada una de las caras aproximadamente el mismo número de veces.
Si realmente lo hicieras y registraras los resultados, podrías utilizar la prueba de bondad de ajuste de Chi-cuadrado para comprobar si los datos de la vida real coinciden con tus expectativas, dentro de unos límites razonables, por supuesto.
Útil, ¿verdad? Bien, ahora que ya conoces el qué y el por qué de las pruebas de bondad de ajuste Chi-cuadrado, pasemos a lo bueno. El cómo.
Prueba Chi-cuadrado de bondad de ajuste de hipótesis
La prueba Chi-cuadrado de bondad de ajuste es una prueba de hipótesis. Esto significa que, por supuesto, debe partir de un conjunto de hipótesis.
Ahora bien, para realizar una prueba de hipótesis como ésta, necesitas una hipótesis nula y una hipótesis alternativa.
Una hipótesis nula es una hipótesis que afirma que cualquier diferencia estadística entre poblaciones se debe al azar. Por ejemplo
\(H_0:\) Una moneda lanzada al aire saldrá cara \(50\%\) de las veces.
Si la hipótesis nula resulta falsa mediante la prueba, ¿qué se habrá encontrado? La hipótesis alternativa
\Una moneda lanzada al aire no saldrá cara el 50 % de las veces.
¿Cómo prueba o refuta la hipótesis nula la prueba Chi-cuadrado de bondad de ajuste? Bien, prueba la probabilidad de que se haya producido el resultado de la muestra si la hipótesis nula es cierta. Si la probabilidad es lo suficientemente baja, la hipótesis nula se considera falsa, y la hipótesis alternativa debe ser cierta.
Por ejemplo, supongamos que tu muestra fue de \(100\) lanzamientos de moneda y obtuviste el siguiente resultado.
Cara | Cruz |
\(99\) | \(1\) |
Tabla 1. Prueba de cara contra cruz.
Si hubiera una probabilidad de \(50\%\) de que saliera cara en cada lanzamiento, como afirma la hipótesis nula, ¿cuál sería la probabilidad de este resultado? Intuitivamente tiene sentido que la probabilidad sea tan baja que roce lo imposible.
¿Y si obtuvieras estos resultados?
Cara | Cruz |
\(58\) | \(42\) |
Tabla 2. Prueba de cara contra cruz.
Bueno, esto está un poco más cerca, así que es difícil de decir, pero utilizando la prueba Chi-cuadrado para la bondad del ajuste, se podría determinar si este resultado probaba o refutaba la hipótesis nula.
Prueba Chi-cuadrado de bondad de ajuste Supuestos y condiciones
La prueba Chi-cuadrado de bondad de ajuste no es adecuada para utilizarla con todos los datos. De hecho, hay fcondiciones(a veces denominadas supuestos) que deben cumplirse.
El método de muestreo es aleatorio simple.
La variable objeto de estudio es categórica.
El valor esperado de observaciones para cada categoría debe ser al menos cinco.
Cada resultado de la variable en estudio debe ser independiente.
Veamos cada una de estas condiciones un poco más de cerca.
Muestreo aleatorio
Para la prueba Chi-cuadrado de bondad de ajuste, la muestra analizada debe tener constituyentes elegidos al azar.
Supongamos que quieres intentar predecir la frecuencia con la que aparecen distintos tipos de caramelos en una bolsa mixta. Pues bien, si quisieras comprobar si tu predicción es exacta, podrías utilizar una prueba Chi-cuadrado de bondad de ajuste sólo si las bolsas que tomas para comprobarlo se eligen completamente al azar.
Variable categórica
¿Qué es una variable categórica? Bien, retomemos el ejemplo de las bolsas de caramelos mezcladas de antes. Cada uno de los caramelos de la bolsa puede clasificarse según el tipo de caramelo que sea. No existe un orden inherente a estas categorías, por lo que la variable es categórica. Si, por ejemplo, las categorías de tus datos fueran los cursos escolares, la variable estaría simplemente ordenada de menor a mayor, y por tanto sería una variable ordinal, no categórica.
De estos dos ejemplos de variables, sólo el ejemplo de los caramelos es categórico y, por tanto, sólo los caramelos pueden someterse a la prueba Chi-cuadrado de bondad de ajuste.
Valor esperado
La siguiente condición para una prueba Chi-cuadrado de bondad de ajuste es que las observaciones muestrales esperadas por categoría sean al menos cinco. Ésta es bonita y sencilla. Básicamente, esta prueba sólo puede utilizarse en muestras de tamaño suficientemente grande. Tu hipótesis podría ser que hay el mismo número de cada dulce repartido entre las bolsas. Si tu muestra incluye \(200\) caramelos y cinco tipos de caramelos, entonces el número esperado de cada caramelo encontrado en la muestra sería \(40\). Esto es superior a cinco, y por tanto cumple esta condición para la prueba
Independencia del resultado
La última condición para la prueba Chi-cuadrado de bondad de ajuste es la independencia de los resultados. Esto significa que la probabilidad de cada resultado no se ve afectada por los resultados anteriores. Por ejemplo, cuando se trata de la bolsa de caramelos, cada vez que se coge un caramelo de la bolsa hay una probabilidad de \(\frac{1}{5}\) de que sea una botella de cola. Esto es así independientemente de cuántas botellas de cola se hayan cogido antes, o de cuántos ositos de gominola. Los resultados anteriores no influyen en éste, así que los resultados son independientes y se cumple la condición.
Fórmula para el estadístico de la prueba de bondad de ajuste Chi-cuadrado
Una vez formuladas las hipótesis y confirmado que se cumplen las condiciones, es hora de calcular el estadístico de la prueba Chi-cuadrado. Esto se hace con esta sencilla fórmula
\[\chi^2 = \sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i}]
Donde \(O_i\) es el \(i^ésimo) valor observado y \(E_i\) es el \(i^ésimo) valor esperado.
Por ejemplo, con los siguientes valores esperado y observado, el cálculo se realizaría del siguiente modo
Botella de Cola | Platillo Volador | Oso de goma | Encaje de frutas | Caramelo | |
Esperado | \(40\) | \(40\) | \(40\) | \(40\) | \(40\) |
Observado | \(20\) | \(25\) | \(15\) | \(18\) | \(22\) |
Tabla 3. valores esperados y observados, prueba chi-cuadrado.
\[\begin{align} \chi^2 &= \sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i} \\\\ &= \frac{(20-40)^2}{40} + \frac {(25-40)^2} {40} + \frac{(15-40)^2}{40}+... \\\\ &= 51,45 \end{align} \]
Realización de la prueba de bondad de ajuste
En primer lugar, necesitarás conocer el nivel de significación , \(\alfa). El nivel de significación establece la fuerza de las pruebas que necesitas para poder considerar probada la hipótesis nula. A menudo, los niveles de significación se fijan en \(5\%\), (\(\alpha=0,05\)). Un nivel de significación más bajo indica que se requiere una mayor fuerza probatoria.
En segundo lugar, necesitarás conocer el número de grados de libertad del problema. El número de grados de libertad es simplemente el número de grupos independientes que tiene la variable. Este valor no es más que el número de grupos \(-1\). Por ejemplo, para una variable con cinco grupos, el número de grados de libertad es cuatro.
El siguiente paso en la prueba es hallar el valor Chi-cuadrado o el valor p. Cualquiera de estos valores puede utilizarse para completar la prueba.
Realizar la prueba con el valor Chi-cuadrado
A partir de la tabla Chi-cuadrado, puedes encontrar el valor Chi-cuadrado de tu prueba para el nivel de significación y los grados de libertad de tu problema concreto. A continuación se muestra un pequeño segmento de la tabla.
Grados de libertad | Nivel de significación | ||||
\(0.2\) | \(0.1\) | \(0.05\) | \(0.025\) | \(0.01\) | |
\(1\) | \(1.64\) | \(2.71\) | \(3.84\) | \(5.02\) | \(6.64\) |
\(2\) | \(3.22\) | \(4.61\) | \(5.99\) | \(7.38\) | \(9.21\) |
\(3\) | \(4.64\) | \(6.25\) | \(7.82\) | \(9.35\) | \(11.35\) |
\(4\) | \(5.99\) | \(7.78\) | \(9.49\) | \(11.14\) | \(13.28\) |
Tabla 4 - Valores de Chi-cuadrado
Volvamos al ejemplo de los caramelos. Si el nivel de significación se fija en \(5\%\), ¿cuál es el valor Chi-cuadrado? Pues bien, el valor en el que coinciden \(\alfa = 0,05\) y \(4\) es \(9,49\).
La cuestión que se plantea ahora es si el estadístico de la prueba es mayor o menor que el valor Chi-cuadrado. Si tu estadístico de prueba es menor que el valor Chi-cuadrado, entonces puedes considerar confirmada la hipótesis nula.
Realizar la prueba con el valor P
El valor \(p-\)es la probabilidad de que (si la hipótesis nula es cierta) la variación del muestreo produzca una estimación más alejada del valor de la hipótesis que la encontrada en la muestra actual. En otras palabras, es la probabilidad de que el muestreo aleatorio produzca un resultado menos exacto que el actual.
Una vez más, consulta la tabla. Esta vez, encuentra dónde se encuentra tu estadística de prueba en la tabla, y extrae el valor correspondiente de la fila del nivel de significación. Por ejemplo, para una estadística de prueba de \(5\) cuando los grados de libertad eran \(3\), \(0,2< p <0,1\). Mientras el valor \(p-\)sea mayor que el nivel de significación, no se ha refutado la hipótesis nula.
Prueba Chi-cuadrado de bondad de ajuste Ejemplo
Lubina | Tipo de pez | Pez luna |
\(32\) | \(52\) | \(36\) |
Tabla 5. Tabla de datos de peces.
Grados de libertad | Nivel de significación | ||||
\(0.2\) | \(0.1\) | \(0.05\) | \(0.025\) | \(0.01\) | |
\(1\) | \(1.64\) | \(2.71\) | \(3.84\) | \(5.02\) | \(6.64\) |
\(2\) | \(3.22\) | \(4.61\) | \(5.99\) | \(7.38\) | \(9.21\) |
\(3\) | \(4.64\) | \(6.25\) | \(7.82\) | \(9.35\) | \(11.35\) |
\(4\) | \(5.99\) | \(7.78\) | \(9.49\) | \(11.14\) | \(13.28\) |
Tabla 6. Grados de libertad y nivel significativo.
(a) Enuncia las hipótesis que se someten a prueba.( b) ¿Cumplen los datos que se someten a prueba las condiciones para una prueba Chi-cuadrado de bondad de ajuste?(c) Calcula el estadístico de la prueba Chi-cuadrado.(d) Halla el valor Chi-cuadrado de los datos, dado que el nivel de significación es \(5\%\).(e ) ¿Desmiente la muestra la hipótesis nula?Solución:(a) El primer paso es definir las hipótesis.\(H_0\): Cada tipo de pez se da en igual número en el estanque.\(H_a\): Cada tipo de pez no se da en igual número en el estanque.(b) La pregunta afirma que la muestra es aleatoria, por lo que se cumple la primera condición.La variable es categórica, ya que está formada por grupos no ordenados, por lo que se cumple la segunda condición.El valor esperado de cada grupo es \(\frac{120}{3} = 40\), que es superior a cinco, por lo que se cumple la tercera condición.Por último, cuando se saca un pez del agua siempre hay una probabilidad \(\frac{1}{3}) de que sea cualquiera de los tipos de peces, por lo que cada resultado es independiente, y por tanto se cumple la cuarta condición.Sí, se cumplen las cuatro condiciones(c) \[\begin{align} \chi^2& = \sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i} \\\\ &=\frac{(32-40)^2}{40} +\frac{(52-40)^2}{40} + \frac {(36-40)^2} {40} \\\\ &= 5,6 \end{align}\](d) \[\begin{align} df &= n - 1 \\\\ &= 3 - 1 \\\\ &= 2\end{align}\]
Con un nivel de significación de \(5\%\), \(\alfa = 0,05\), el valor de Chi-cuadrado de la tabla es \(5,99\).
(e) Como el estadístico de la prueba es menor que el valor Chi-cuadrado \((5,6 < 5,99)\), la prueba ha demostrado que no hay pruebas suficientes para refutar la hipótesis nula.
(2 ) Un colegio hace un estudio sobre la aparición de ojos de distinto color en sus alumnos. Se parte de la hipótesis de que \(15\%\) de los alumnos tendrán los ojos verdes, \(25\%\) de los alumnos tendrán los ojos azules, y \(60\%\) de los alumnos tendrán los ojos marrones. De los \(1000\) alumnos, \(80\) se eligen al azar. Los resultados de la muestra son los siguientes
Verde | Azul | Marrón |
\(18\) | \(28\) | \(34\) |
Tabla 7. Datos de color.
Tabla 8. Grados de libertad y nivel significativo.
Grados de libertad | Nivel de significación | ||||
\(0.2\) | \(0.1\) | \(0.05\) | \(0.025\) | \(0.01\) | |
\(1\) | \(1.64\) | \(2.71\) | \(3.84\) | \(5.02\) | \(6.64\) |
\(2\) | \(3.22\) | \(4.61\) | \(5.99\) | \(7.38\) | \(9.21\) |
\(3\) | \(4.64\) | \(6.25\) | \(7.82\) | \(9.35\) | \(11.35\) |
\(4\) | \(5.99\) | \(7.78\) | \(9.49\) | \(11.14\) | \(13.28\) |
(a) Enuncia las hipótesis que se someten a prueba.( b)¿Cumplen los datos que se someten a prueba las condiciones para una pruebaChi-cuadradode bondad de ajuste?(c )Calcula el estadístico de la prueba Chi-cuadrado.(d) Halla el valor \(p-\)de los datos, dado que el nivel de significación es \(5\%\).(e )¿Desmiente la muestra la hipótesis nula?
Responde:
(a) \(H_0\):\(15\%\) de los alumnos tendrán los ojos verdes, \(25\%\) de los alumnos tendrán los ojos azules, y \(60\%\) de los alumnos tendrán los ojos marrones.
\(H_a\): No es cierto que \(15\%\) de los alumnos tengan los ojos verdes, \(25\%\) de los alumnos tengan los ojos azules, y \(60\%\) de los alumnos tengan los ojos marrones.
(b) Lapregunta afirma que la muestra es aleatoria, por lo que se cumple la primera condición. La variable es categórica, ya que está formada por grupos no ordenados, por lo que se cumple la segun da condición.El valor esperado de cada grupo puede calcularse del siguiente modo
\[Verde = 80 \cdot 0,15 = 12\]
\Azul = 80 y 0,25 = 20].
\[Marrón = 80 \cdot 0,6 = 48\]
Como el valor esperado de cada grupo es mayor que \(5\), se cumple la terceracondición.Por último, el color de los ojos de un alumno no se ve afectado por el color de los ojos de ningún otro alumno, por lo que se cumple la cuarta condición.
(c) \[\begin{align} \chi^2& = \sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i} \\\\ &=\frac{(18-12)^2}{12} +\frac{(28-20)^2}{20} + \frac {(34-48)^2} {48} \\\\ &= 10,28 \end{align}\]
(d) Primero, halla los grados de libertad
\[\begin{align} df &= n - 1 \\\\ &= 3-1 \\\\ &=2 \end{align}\]
Ahora, como el estadístico de la prueba es \(10,28\), de la tabla
\[p < 0.01 \]
(e) Como el valor \(p-\)es menor que el nivel de significación, se han aportado pruebas suficientes para refutar la hipótesis nula.
\[p < 0.01 < 0.05\]
Prueba Chi-cuadrado de bondad de ajuste - Aspectos clave
- La prueba Chi-cuadrado de bondad de ajustees una prueba estadística de hipótesis utilizada para determinar si una distribución esperada de resultados es significativamente diferente de la distribución real observada de resultados.
- La prueba Chi-cuadrado de bondad de ajuste sólo puede realizarse con datos que cumplan las cuatro condiciones.
- La prueba Chi-cuadrado de la bondad del ajuste puede realizarse comparando el valor Chi-cuadrado y el estadístico de la prueba o comparando el valor \(p-\)de los datos y el nivel de significación.
Aprende con 0 tarjetas de Prueba de Chi-Cuadrado de Bondad de Ajuste en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Prueba de Chi-Cuadrado de Bondad de Ajuste
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más