Supongamos que quieres saber cuál es el tamaño medio de un perro. Para hacerlo con estadísticas e intervalos de confianza, generalmente necesitarías saber algo sobre la varianza de los tamaños de los perros en general. Pero, en general, no conocerás la varianza de tu población, así que ¿qué hacer? Bueno, podrías aumentar el tamaño de tu muestra, pero eso puede requerir tiempo y dinero que quizá no tengas. Así que si sólo tienes una muestra pequeña, y no conoces la varianza de la población, ¡la distribución \(t\)-de student al rescate!
Fig. 1 - ¡Hay bastante variación en el tamaño de los perros!
Definición de la distribución t
Puede que conozcas la distribución normal como una curva en forma de campana, ¡pero no es la única distribución en forma de campana que existe!
Hay muchas otras que comparten esta forma, una de las cuales es la distribución \(t\)-. Aunque estas dos distribuciones son muy parecidas, se utilizan en situaciones diferentes.
Utilizarías una distribución normal si estuvieras haciendo un intervalo de confianza o una prueba de hipótesis en la que
las poblaciones se distribuyen normalmente y tienen igual varianza
se conoce la varianza de la población; o
el tamaño de la muestra es grande.
Por otra parte, utilizarías una distribución \(t\)- si estuvieras haciendo un intervalo de confianza o una prueba de hipótesis en los casos en que:
la población se distribuye normalmente y no conoces las varianzas de la población; o
la población se distribuye normalmente pero el tamaño de la muestra es pequeño.
Recuerda que si conoces la varianza poblacional, o tienes una muestra suficientemente grande, para una variable aleatoria distribuida normalmente, \(X\), donde
puedes construir un intervalo de confianza o una prueba de hipótesis.
En realidad, no es probable que conozcas la varianza real de la población, del mismo modo que no sueles conocer la media de la población, que suele ser lo que estás comprobando.
Cuando el tamaño de la muestra \(n\) es lo suficientemente grande, puedes utilizar la varianza muestral \(S\) en lugar de la varianza poblacional \(\sigma\).En este caso, el Teorema Central del Límite te da que
Cuando \(n\) es pequeño, en lugar de utilizar la distribución normal, puedes utilizar la distribución \(t\). El valor de \(t\) viene dado por
\[t=\frac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}.\]
A continuación puedes ver el gráfico de la distribución normal estándar comparada con la distribución \(t\) para distintos valores de \(n\).
Fig. 2 - Distribución normal estándar comparada con la distribución \(t\)-para distintos valores de \(n\).
Como puedes ver en el gráfico anterior, a medida que aumenta \(n\), la distribución \(t\)-se acerca más a la distribución normal estándar. Ésta es una de las razones por las que los estadísticos afirman que un tamaño de muestra de \(20\) suele ser lo suficientemente grande como para pasar de utilizar una distribución \(t\) a una distribución normal.
Como el tamaño de la muestra desempeña un papel importante en las distribuciones t, recibe un nombre especial, como verás en el siguiente apartado.
Grados de libertad en la distribución t
Al igual que ocurre con la distribución chi-cuadrado y la distribución \(F\), el tamaño de la muestra \(n\) determina el número degrados de libertad. El tamaño de la muestra te dice dos cosas sobre los grados de libertad de la distribución \(t\)-:
El número de grados de libertad, \(\upsilon\), viene determinado por el tamaño de la muestra menos \(1\): \(\upsilon = n-1\).
A medida que \(\upsilon \a \infty\), la distribución \(t\)-se aproxima a \(\text{N}(0,1^2)\).
De hecho, las distribuciones normal y \(t\)-son bastante similares. Ambas son simétricas y presentan una forma de curva de campana, y tienen el mismo comportamiento final.
Para indicar que estás utilizando un grado de libertad concreto para una distribución \(t\)-puedes escribir distribución \(t_\upsilon\).
La fórmula de la distribución t
La siguiente es la fórmula que necesitarás para la distribución t.
Si se selecciona una muestra aleatoria \(X_1,X_2,X_3, \dots,X_n\) de una distribución normal con una varianza desconocida \(\sigma ^2\), entonces
\[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{\sqrt{n}}}\]
donde \(t\) es una \(t_{n-1})-distribución y \(S^2\) es un estimador insesgado de \(|sigma^2\).
Para recordar lo que significa ser insesgado, consulta el artículo Sesgo del estimador.
Al igual que con la distribución normal estándar, existen tablas de valores que puedes utilizar con la distribución \(t\)-.
Tablas para la distribución t
La tabla siguiente es una sección de una tabla de probabilidades de la distribución t.
Tabla 1. \Tabla de probabilidad de la distribución t
\(0,100%)
\(0.100\)
\(0.050\)
\(0.025\)
\(1\)
\(3.0777\)
\(6.3138\)
\(12.7062\)
\(2\)
\(1.8856\)
\(2.9200\)
\(4.3027\)
\(3\)
\(1.6377\)
\(2.3534\)
\(3.1824\)
Los valores de la tabla son los que superan la probabilidad en la parte superior de la tabla dado un determinado número de grados de libertad.
Por ejemplo, supongamos que \(X\) tiene \(3\) grados de libertad. El número \(3,1824\) de la esquina inferior derecha de la tabla anterior significa que
\(P(X>3,1824) = 0,025\); y
\(P(X<3,1824) = 1-0,025=0,975\).
Como la distribución \(t\)-es simétrica para cualquier grado de libertad, también sabes que
\(P(X<-3,1824) = 0,025\); y
\(P(X>-3,1824) = 1-0,025=0,975\).
El área \(P(X>3.1824 )=0,025\) para una curva de distribución \(t\) con \(3\) grados de libertad está sombreada en el gráfico siguiente. Recuerda que cuando \(\upsilon = 3\) el tamaño de la muestra es \(n=4\).
Fig. 3 - Distribución \(t_3\) con el área sombreada igual a \(0,025\).
Veamos un ejemplo.
Supón que \(X\) es una variable aleatoria con grados de libertad \(\upsilon\). Halla el valor de \(s\) donde \(P(|X|<s)=0,80\) donde \(\upsilon = 3\).
Solución
Observa que \(P( |X|<s) =0,80\) es lo mismo que \(P(|X|>s)=0,20\) porque la distribución \(t\)-es simétrica. Esto parece un poco raro, pero significa simplemente que \(P(X<-s)=0,1\) y \(P(X>s)=0,1\). A menudo puede ser útil hacer un dibujo de lo que estás buscando.
Fig. 4 - El área sombreada total es \(0,2\).
Puedes utilizar la tabla de distribución \(t\) o una calculadora para averiguar que el valor de \(s\) que te da \(P (X>s)=0,1\) es \(s=1,6377 \).
Valores críticos de la distribución t
Los valores críticos se utilizan al construir intervalos de confianza. Los intervalos de confianza dependen del nivel de confianza que estés utilizando. Recuerda que los límites de confianza para un \(100(1-alfa)\%) siempre tienen la forma
estadístico de prueba \(\pm\) (\(t\)-valor crítico)(error típico).
En el caso de las distribuciones \(t\)-, el error típico viene dado por
Observa que, a medida que aumenta el nivel de confianza, también lo hace el valor crítico \(t\), lo que significa que tu intervalo de confianza aumenta. Esto tiene sentido por dos razones principales
cuanto más confías en una predicción, más difícil es garantizar que has capturado el parámetro poblacional en el intervalo de confianza; y
el valor crítico \(t\)-está relacionado con el área bajo la curva de distribución \(t\)-.
Por ejemplo, en el nivel de confianza \(80\%\) en realidad estás pidiendo que se capture \(80\%\) del área bajo la curva en el área sombreada. Cuanto mayor sea tu nivel de confianza, ¡mayor será el área sombreada!
Fig. 5 - Distribución \(t\)-que muestra cómo se relaciona el nivel de confianza con el área bajo la curva.
Esta es una de las razones por las que puede ser útil hacer un dibujo de lo que intentas averiguar antes de echar mano de la calculadora o de la tabla de la distribución T.
Distribución T - Puntos clave
Si la muestra aleatoria \(X_1,X_2,X_3, \dots,X_n\) se distribuye normalmente con una varianza desconocida, \(\sigma ^2\), entonces tienes \[t=\dfrac{\bar{X}-\mu}{\dfrac{S}{sqrt{n}}}] donde \(t\) tiene una distribución \(t_{n-1}) y \(S^2\) es un estimador insesgado de \(\sigma ^2\).
El número de grados de libertad viene determinado por el tamaño de la muestra menos \(1\),\(\upsilon = n-1\).
A medida que \(\upsilon \a \infty\), la distribución \(t\) se aproxima a \(\text{N}(0,1^2)\).
El valor crítico, \(t^*\), para el nivel de confianza \(\alpha\) puede hallarse con la fórmula \[ t^*= t_{n-1}\left(\frac{\alpha}{2}\right). \]
Aprende más rápido con las 11 tarjetas sobre Distribución T
Regístrate gratis para acceder a todas nuestras tarjetas.
Preguntas frecuentes sobre Distribución T
¿Qué es la Distribución T en matemática?
La Distribución T es una distribución de probabilidad utilizada en estadística para estimar la media de una población cuando la muestra es pequeña y la desviación estándar es desconocida.
¿Cuándo se usa la Distribución T?
Se usa la Distribución T cuando se trabaja con muestras pequeñas (n < 30) y se desconoce la desviación estándar poblacional.
¿Cuál es la diferencia entre la Distribución T y la normal?
La diferencia es que la Distribución T tiene colas más gruesas que la normal, lo que incrementa su varianza, siendo más adecuada para muestras pequeñas o varianza desconocida.
¿Qué es el estadístico t en la Distribución T?
El estadístico t es un valor calculado a partir de la muestra que sirve para determinar si existe una diferencia significativa entre las medias de la muestra y la población.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.