Supongamos que quieres saber el promedio de la nota media de los estudiantes de último curso de secundaria de Atlanta, Georgia. Para calcular el valor exacto, tendrías que preguntar a la población, es decir, a todos los estudiantes de último curso de Atlanta, Georgia, por su GPA. ¡Eso suena agotador! Pero, ¿y si, en lugar de preguntar a todos los alumnos de último curso, tomas una muestra? Esta es la idea que subyace a las distribuciones muestrales.
En este artículo encontrarás la definición de las distribuciones muestrales, los tipos de distribuciones muestrales, las fórmulas, la media y la desviación típica de las distribuciones muestrales, y ejemplos de aplicación.
Introducción a las distribuciones muestrales
Volviendo al ejemplo anterior, supongamos que seleccionas y muestras aleatoriamente \(100\) estudiantes de último curso y calculas la media de GPA a partir de esta muestra. Esta media no sería la misma que la media de todos los estudiantes de último curso de Atlanta. Podría ser más baja o más alta, pero lo más probable es que no fuera exactamente igual a la media de la población.
Si seleccionas una segunda muestra de \(100\) estudiantes de último curso, lo más probable es que la media de las notas de esta muestra difiera de la media de la primera. Así pues, las muestras aleatorias seleccionadas producirían valores medios diferentes. A pesar de esta variedad de valores, cuando se obtienen muchas medias muestrales, puedes trazar estas medias recogidas en un gráfico, y así se puede obtener una media estimada de toda la población. Este proceso explica el concepto de crear distribuciones muestrales de la media.
Definición de distribuciones muestrales
Un valor que se calcula tomando información de una muestra se denomina estadística. La estadística te permite estimar los datos de toda una población. Como has visto en el ejemplo anterior, diferentes muestras aleatorias pueden dar valores distintos para una estadística; esta diferencia se llama variabilidad mues tral (o error de muestreo). Esta variabilidad muestral puede reducirse aumentando el tamaño de la muestra.
La distribución formada por todos los valores posibles de los estadísticos muestrales obtenidos para cada muestra diferente posible de un tamaño dado se llama distribución muestral.
Condiciones de las distribuciones muestrales
Para garantizar que la distribución muestral estima realmente toda la población, debes asegurarte de que se verifican estos dos criterios:
Condición dealeatoriedad: la condición más importante necesaria para crear una distribución muestral es que tus datos procedan de muestras seleccionadas al azar.
Independencia (condición \(10\%\)): los valores muestreados deben ser independientes entre sí. Alcanzar esta condición equivale a considerar tamaños de muestra no superiores a \(10\%\) de toda la población.
Volvamos al ejemplo del promedio de GPA. Para la condición de aleatoriedad, a menos que tengas una lista de los alumnos con la nota media más alta de Atlanta, basta con elegir aleatoriamente a cualquier \(100) alumno para satisfacer esta condición.
Por otra parte, para la condición de independencia, no es descabellado suponer que hay más de \(10\, 000\) alumnos de último curso en Atlanta, por lo que el \(10\%\) de esto es \(1\,000\). Cualquier tamaño de muestra inferior a \(1.000\) satisface esta condición, por lo que considerar muestras de un \(100\) de tamaño es aceptable.
Tipos de distribuciones muestrales
Hay 3 tipos de distribuciones muestrales:
Distribución muestral de proporciones
Distribución muestral de medias
Distribución en T
Distribución muestral de proporciones
Se utiliza para estimar una proporción de la población. Calcula la proporción de éxito, o probabilidad, de que se produzca un suceso concreto. La media de cada grupo de la proporción muestral es una representación de la proporción estimada de éxito de toda la población.
Distribución muestral de medias
Consiste en calcular las medias de todos los grupos de la muestra de una población seleccionada. A continuación, la media de las medias de todas las muestras es una media estimada de toda la población.
Distribución en T
Se centra en una población pequeña. Se utiliza para medir la media de la población y otras medidas estadísticas, como intervalos de confianza, regresión lineal y diferencias estadísticas. Dado que esta distribución utiliza puntuaciones \(t\)- para calcular probabilidades, queda fuera del ámbito de este artículo.
Fórmula de las distribuciones muestrales
La proporción de la muestra, denotada por \(\widehat{p}\), se calcula contando cuántos éxitos hay en la muestra (éxito significa que un individuo posee la característica de interés) y dividiéndolo por el tamaño total de la muestra \(n\)
\[\widehat{p}=\frac{\text{número de éxitos en la muestra}}{n}.\}]
La media muestral, denotada por \(\sobrelínea{x}), se calcula sumando todos los valores obtenidos de la muestra y dividiéndolos por el tamaño total de la muestra \(n\). La idea es la misma que hallar la media de un conjunto de datos. La fórmula es
\[\overline{x}=\frac{x_1+x_2+...+x_n}{n},\]
donde \(\overline{x}\) es la media muestral, \(x_i\) es cada uno de los valores de la muestra, y \(n\) es el tamaño de la muestra.
Media y desviación típica de las distribuciones muestrales
Todas las distribuciones de probabilidad tienen características que las distinguen. Las distribuciones muestrales no son una excepción, conocer la media y la desviación típica puede darte mucha información sobre la forma de la distribución.
Media y desviación típica de la proporción muestral
Sea \(p\) la proporción de éxito en una población y \(\widehat{p}\) la proporción muestral, es decir, la proporción de éxito en una muestra aleatoria de tamaño \(n\), entonces la distribución muestral de \(\widehat{p}\) tiene media y desviación típica dadas por \[\mu_widehat{p}=p,\text{ y }\, \sigma_widehat{p}=\sqrt{\frac{p(1-p)}{n}.\]
Además, si \[np\geq 10,\text{ y }\, n(1-p)\geq 10,\] entonces, la distribución muestral de \(\widehat{p}) es similar a una distribución normal.
Se selecciona una muestra aleatoria de una población que tiene una proporción de aciertos \(p=0,72\). Calcula la media y la desviación típica de la distribución muestral de \(\widehat{p}\) con un tamaño de muestra \(n=20\).
Solución:
Utilizando las fórmulas anteriores, la media es igual a la proporción de aciertos de la población, luego \[\mu_\widehat{p}=0,72,\} mientras que la desviación típica viene dada por \[\sigma_\widehat{p} =\sqrt{\frac{0,72(0,28)}{20}}aproximadamente 0,100,\}.
Media y desviación típica de la media muestral
Sea \(\mu\) la media y \(\sigma\) la desviación típica de la población. Si \(\overline{x}\) es la media muestral de una muestra aleatoria de tamaño \(n\), la distribución muestral de \(\overline{x}\) tiene una media y una desviación típica dadas por \[\mu_overline{x}=\mu,\texto{ y }\, \sigma_overline{x}=\frac{\sigma}{cuadrado{n}.\}].
La desviación típica de la distribución muestral de las medias también se conoce como error típico de la media (EEM).
Si el tamaño de la muestra \(n\) es suficientemente grande (según el Teorema del Límite Central, \(n\geq 30\) es suficiente), entonces, la distribución muestral de \(\overline{x}\) es similar a una distribución normal.
Se selecciona una muestra aleatoria de una población con media \(\mu=80\) y desviación típica \(\sigma=5\). Calcula la media y la desviación típica de la distribución muestral de \(\overline{x}\) con tamaño de muestra \(n=35\).
Solución:
Utilizando las fórmulas anteriores, la media muestral es igual a la media de la población, por lo que \[\mu_overline{x}=80.\} Y para la desviación típica de la media muestral
Veamos un ejemplo en el que se utilizan distribuciones muestrales.
Un restaurante afirma que a \(30\%\) de sus clientes les gusta la piña en la pizza. Si hay \(100\) clientes un día determinado, ¿cuál es la probabilidad de que al menos \(40\%\) de esos clientes compren una pizza con piña?
Solución:
(1)Observa que \(p=0,30\), \((1-p)=0,70\) y el tamaño de la muestra es \(n=100\). Por tanto, la media \(\mu_{widehat{p}=0,30\}) y la desviación típica \[\sigma_{{widehat{p}}=\sqrt{\frac{(0,30)(0,70)}{100}}aproximadamente 0,046.\}].
(2) Como \(np=100(0,30)=30>10\) y \(n(1-p)=100(0,70)=70>10\), entonces la distribución muestral de \(\widehat{p}) es similar a una distribución normal, y puedes utilizarla después para calcular la probabilidad.
(3 ) Convirtiendo \(\widehat{p}\) en \(z\)-puntuación (para más detalles, consulta el artículo \(z\)-puntuaciones), tendrás
\[\inicio{alineación} P(\aquello{p}>40) &= P\a la izquierda(z>frac{0,40-0,30}{0,046}\a la derecha) \a y=P(z>2,17) \a y =1-P(z<2,17) \a y= 1-0,9850 \a y=0,015.end{align}\a].
Por tanto, la probabilidad de que al menos \(40\%\) de estos clientes pidan una pizza con piña es \(0,015\).
Veamos un ejemplo más.
Una empresa afirma que la vida media de sus bombillas es de \(2.000\) horas, con una desviación típica de \(300\) horas. ¿Cuál es la probabilidad de que una muestra aleatoria de 50 bombillas tenga una vida media inferior a 1.900 horas?
Solución:
(1) Como el tamaño de la muestra es \(n=50\), según el Teorema del Límite Central, la distribución muestral de la media \(\overline{x}\) sigue una distribución normal con media \(\mu_\overline{x}=2\,000\}) y desviación típica \[\sigma_overline{x}=\frac{300}{cuadrado{50}} \aprox 42,426. \].
(2) Convirtiendo las puntuaciones \(\sobrelínea{x}) en puntuaciones \(z\) y utilizando la tabla normal estándar (para más información, consulta el artículo Distribución normal estándar), tendrás
\[\begin{align} P(x<1,900) &=P(z<frac{1,900-2,000}{42,426}\a la derecha) &=P(z<-2,35) &= 0,0094. \end{align}\]
Por tanto, la probabilidad de que, de una muestra de tamaño \(n=50) bombillas, la vida media sea inferior a \(1.900\) horas es \(0,0094\).
Distribución muestral - Puntos clave
Una distribución muestral muestra todas las estadísticas posibles que pueden obtenerse de todas las muestras posibles de la población.
La distribución muestral de la proporción \(\widehat{p}\) tiene media y desviación típica \[\mu_\widehat{p}=p\, \text{ y } \,\sigma_\widehat{p}=\sqrt{\frac{p(1-p)}{n}}.\]
Cuando \(np\geq 10\) y \(n(1-p)\geq 10,\) la distribución muestral de la proporción \(\widehat{p}\) se comporta como una distribución normal.
La distribución muestral de la media \(\overline{x}\) tiene media y desviación típica \[\mu_\overline{x}=\mu,\text{ y }, \sigma_\overline{x}=\frac{\sigma}{\sqrt{n}.\}].
Cuando \(n\geq 30\), el Teorema del Límite Central establece que la distribución muestral de la media \(\overline{x}\) se comporta como una distribución normal.
Aprende más rápido con las 5 tarjetas sobre Distribuciones de muestreo
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Distribuciones de muestreo
¿Qué es una distribución de muestreo?
Una distribución de muestreo es la distribución de una estadística calculada a partir de todas las posibles muestras de un tamaño específico de una población.
¿Para qué se utilizan las distribuciones de muestreo?
Las distribuciones de muestreo se utilizan para entender el comportamiento de las estadística de las muestras y para formular inferencias sobre la población.
¿Cuál es la diferencia entre una distribución de muestreo y una distribución muestral?
La distribución muestral es la distribución de una estadística específica obtenida en una muestra, mientras que la distribución de muestreo comprende todas las posibles muestras de un tamaño dado.
¿Por qué es importante la distribución de muestreo?
Entender la distribución de muestreo es crucial para realizar inferencias precisas sobre una población, como estimaciones de intervalos y pruebas de hipótesis.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.