Saltar a un capítulo clave
El significado de las inferencias en estadística
La estadística se define como una disciplina de la matemática aplicada que se ocupa del estudio sistemático de la recogida, presentación, análisis e interpretación de datos. La recogida y análisis de datos mediante distintas técnicas y métodos se denomina estadística descriptiva. Ahora bien, después de describir los datos con diversas técnicas, ¿qué sigue? Ahí es donde entran las inferencias en estadística. La estadística inferencial es la rama de la estadística que se ocupa de hacer conclusiones, interpretaciones y predicciones correctas a partir de los datos analizados.
Las inferencias en estadística son técnicas empleadas para examinar los resultados de los datos y llegar a conclusiones, interpretaciones y predicciones. Las inferencias en estadística también se denominan estadística inferencial o inferencia estadística.
Las inferencias en estadística pueden ayudarte a hacer predicciones y conclusiones sobre las poblaciones que estás examinando, interpretando los resultados de muestras aleatorias de esa población. Las dos aplicaciones principales de la estadística inferencial que nos ayudan a sacar estas conclusiones son las pruebas de hipótesis y los intervalos de confianza de los datos.
Las inferencias estadísticas dependen de tres componentes principales
el tamaño de las muestras
lavariabilidad de las muestras; y
el tamaño de las diferencias observadas.
En general, necesitas una forma de hablar de la diferencia entre el grupo entero que estás analizando y las personas concretas que respondieron a una encuesta o formaron parte de un estudio.
La población se refiere a un grupo de unidades (personas, objetos u otros elementos) enumeradas en un censo o de las que se extrae una muestra.
Puedes analizar varios subgrupos de la población. Estos subgrupos se denominan muestras.
Una muestra se define como un subconjunto de una población seleccionado para su medición, observación o interrogatorio, con el fin de proporcionar información estadística sobre la población.
Para realizar una inferencia estadística, deben cumplirse las siguientes condiciones:
Los datos del experimento deben obtenerse mediante muestras aleatorias o experimentos aleatorios
La distribución de las medias muestrales debe ser aproximadamente normal
Las observaciones individuales deben ser independientes
Métodos de inferencia en estadística
Hay dos métodos principales para hacer inferencias en estadística: las pruebas de hipótesis y los intervalos de confianza. Las pruebas de hipótesis implican demostrar o refutar una afirmación con métodos estadísticos apropiados. Los intervalos de confianza implican la creación de un rango o límite dentro del cual se espera encontrar el valor de un parámetro y con cierto grado de seguridad.
Estos son los pasos generales que podrían seguirse para hacer inferencias estadísticas:
Planifica y diseña tu estudio
Recoge datos
Analiza los datos
Interpreta los resultados
Presentar los resultados.
Veamos un ejemplo rápido de estos pasos.
En Estados Unidos hay cincuenta estados y, en total, una población de más de 300 millones de personas. Supongamos que el gobierno quiere determinar la edad media de la población para obtener información sobre las condiciones cambiantes de la población y las tendencias sociales y económicas.
Planificar el estudio: ¡Definitivamente no pueden ir puerta por puerta preguntando la edad a todas y cada una de las personas de Estados Unidos! Sin embargo, pueden utilizar formas más estratégicas e inferencias estadísticas para llegar a valores y hechos muy próximos o iguales a los de la población, y esto formará el plan y la estrategia del estudio. Una de las cosas de las que tendría que preocuparse el gobierno sería de las fuentes de sesgo en las encuestas para garantizar la exactitud de los datos.
Recogida de datos: Esto puede implicar consultar los datos del censo o tomar una muestra aleatoria de personas en Estados Unidos y preguntar la edad de las personas de su familia. Echa un vistazo a los artículos Muestreo aleatorio y Métodos de muestreo de encuestas para obtener más información.
Analizar los datos: Se trata de buscar la media (o promedio) de una población, por lo que el análisis adecuado de los datos serían pruebas de hipótesis para una media poblacional.
Interpretar los resultados: ¡Este paso es especialmente importante! A menudo verás cosas como "el índice de aprobación es \(54 \% \pm 3\%\), lo que significa que el índice no es exactamente \(54\%\), pero pueden decir con cierto grado de certeza que está dentro de \(3\%\) de \(54\%\)". Ser capaz de justificar las afirmaciones que haces es una parte importante de la inferencia en estadística.
Presentación de los resultados: Una vez determinada la edad media, hay que presentarla de forma que otras personas (locutores, blogueros, etc.) puedan entenderla y explicársela a otras personas.
Tipos de inferencias en estadística
Las inferencias en estadística pueden hacerse de varias formas, y una de las más frecuentes es la comprobación de hipótesis.
Una hipótesis es una suposición que se da por cierta para argumentar o investigar. Un ejemplo de hipótesis sería que el índice de aprobación del presidente ha disminuido desde el año pasado.
Lacomprobación de hipótesis se refiere al proceso de comprobar estas suposiciones y sacar conclusiones sobre los parámetros de una muestra respecto a la población. Se realiza para evaluar la credibilidad de una determinada hipótesis utilizando datos de una muestra.
Puedes consultar el artículo Comprobación de hipótesis para obtener más información sobre qué es realmente una hipótesis y cómo se realiza la comprobación.
Otro método utilizado en las inferencias es la elaboración y utilización de intervalos de confianza. Un intervalo de confianza se utiliza para generar un rango de valores en el que puedas concluir con razonable certeza que se encuentra el valor real. Puede que lo hayas visto en comentarios políticos cuando alguien dice algo parecido a "el candidato lleva una ventaja de \(18\) puntos, más o menos \(2\%\)". Eso significaría que han construido un intervalo de confianza para la ventaja del candidato, y que está dentro de \(2\%\), por debajo o por encima de \ (18\%\). Dependiendo de lo que estés midiendo, harías uno de los siguientes tipos de intervalos:
- Intervalos de confianza para una proporción de población
- Intervalos de confianza para una media poblacional
- Intervalos de confianza para la diferencia de dos proporciones
- Intervalos de confianza para la pendiente de un modelo de regresión
- Intervalos de confianza para la diferencia de dos medias
Como ya has visto en el artículo Análisis de datos, a veces los datos recogidos no son numéricos. Pueden ser categóricos, como en las encuestas. Si quieres hacer inferencias a partir de datos categóricos, generalmente utilizarás la Distribución Chi-cuadrado. Para más información sobre este tipo de inferencia, consulta el artículo Inferencia de Distribuciones de Datos Categóricos.
Soluciones de Inferencia Causal en Estadística
¿En qué piensas cuando oyes el término inferencia causal?
La inferenciacausal es el proceso de concluir que un determinado tratamiento dado a la variable independiente fue la causa del efecto observado en la variable dependiente.
Un campo académico conocido como inferencia causal examina las presunciones, los planes de investigación y las técnicas de estimación que permiten a los investigadores inferir relaciones causales a partir de los datos. Aquí, el tratamiento administrado a la variable independiente se conoce como intervención, mientras que el efecto observado en la variable dependiente es el resultado.
Se habla de inferencia causal cuando se deduce que algo es o es muy probable que sea la causa de otra cosa. Por ejemplo, se puede suponer que alguien toca (o tocaba) el piano basándose en el sonido de la música de piano.
Sin embargo, una correlación puede confundirse con la causalidad. Cuando determinadas variables muestran una relación o asociación, no debe confundirse que una afecta directamente a la aparición de la otra, ya que puede haber una tercera variable. Por ejemplo, que tanto los pepinos como los tomates tengan mayor producción un año no significa que el rendimiento de los tomates y los pepinos estén relacionados.
Ambos están asociados a otra variable que es el clima.
No obstante, si la reducción de una variable provoca un aumento o una disminución proporcional de la otra variable, entonces se puede estar de acuerdo en que sí existe una relación de causa-efecto entre ambas variables. Hay formas de diseñar experimentos de modo que se eliminen tantos efectos externos como sea posible. Para más información sobre estas técnicas, consulta Métodos de experimentación, Fuentes de sesgo en los experimentos y Diseño de bloques aleatorios.
Función de potencia en la inferencia estadística
Una función de potencia describe el valor verdadero de un parámetro con la probabilidad de rechazar una hipótesis nula sobre el valor de ese parámetro. Consulta el artículo Errores en las pruebas de hipótesis para obtener más información sobre los tipos de errores en las pruebas de hipótesis y qué puede causarlos.
Ejemplos de inferencia en estadística
Veamos un ejemplo de inferencia en estadística.
Supongamos que te interesa ver si existe una relación entre el número de horas que duerme alguien y lo buenas que son sus notas. Para responder a la pregunta, seleccionas personas al azar de tu clase (ésta sería tu muestra) y les preguntas cuántas horas duermen en una noche y cuál es su nota en clase. A continuación, puedes utilizar esta muestra de toda la clase (toda la clase es la población) para formular una hipótesis sobre el número de horas de sueño y la relación que tiene con las notas, y hacer una prueba de hipótesis para comprobar los resultados. A partir de ahí, puedes hacer una inferencia sobre la población basándote en tu muestra.
Veamos otro ejemplo.
Un fabricante de fármacos tiene un nuevo producto que espera que cure el cáncer y que quiere probar. Naturalmente, primero empiezan probándolo en ratones y no en personas. Seleccionan un grupo de ratones con cáncer y un segundo grupo de ratones sin cáncer. Algunos de cada grupo reciben el nuevo producto (son los grupos de tratamiento) y otros no (son los grupos de control). Entonces pueden medir cómo afecta el fármaco a los ratones que lo reciben y compararlo con cómo les va a los ratones que no lo recibieron.
Este es un ejemplo de realización de un experimento, y el fabricante tendría que hacer pruebas de hipótesis con dos muestras para ver si su fármaco es eficaz. A partir de ahí, pueden hacer una inferencia y decidir si quieren seguir desarrollando el fármaco.
Inferencias en Estadística - Conclusiones clave
- Las inferencias en estadística son técnicas empleadas para examinar los resultados de los datos y poder llegar a la conclusión e interpretación correctas a partir de la variación aleatoria. La inferencia en estadística también se denomina estadística inferencial o inferencia estadística.
- Para realizar inferencias en estadística, sigue los siguientes pasos
Planifica y diseña tu estudio
Recoge datos
Analiza los datos
Interpreta los resultados
Presentar los resultados.
La comprobación de hipótesis se refiere al proceso de comprobar supuestos y sacar conclusiones sobre parámetros de una muestra respecto a la población.
Aprende con 7 tarjetas de Inferencias en Estadísticas en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Inferencias en Estadísticas
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más