Bueno, la respuesta es sí; y lo más probable es que tenga una forma parecida a una campana, como la que sigue:
Fig. 1: Gráfica de una distribución normal.
Aquí, el eje de las \(x\) son las alturas de los alumnos y \(N\) son el número de los alumnos con esas alturas. Pero, si pensamos que tomamos una muestra \(m\) de la población general de los alumnos \(m_n\) y esta (por supuesto) es menor que la población total \(m_n<m_t\), el número \(N\) representaría la probabilidad de que encuentres esa altura \(P(x)\). La curva en este caso es una curva de probabilidad continua y es conocida como la curva de la distribución normal.
¿Cuál es la función de densidad de la distribución normal?
Debido a que la función describe una campana, esta curva puede definirse por una función que, en este caso sería:
\[f(x)=\dfrac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]
A esta función se le conoce como la función de densidad de probabilidad, porque nos dice el valor de la probabilidad de que un variable aleatoria \(x\) tenga un valor \(y\).
Si lo que se requiere es la probabilidad de que una variable \(x\) obtengan un valor entre \([a, b]\), lo que se tiene es una integral:
\[P(x)=\int^b_a \dfrac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx\]
En este caso lo que se obtiene es el área bajo la curva entre los dos puntos:
Fig. 2: El área entre los valores de a y b es la probabilidad de obtener un valor entre a y b.
Parámetros de la distribución normal
Debido a que, cualquier distribución normal sigue la fórmula:
\[f(x)=\dfrac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]
y que \(x\) es una variable general solo hay dos parámetros que definen las diferencias entre cada curva:
La desviación estándar
La desviación estándar es la medida que nos dice cómo de dispersos son los datos.
En general, debido a esto:
A mayor dispersión, los datos están más separados entre sí y la curva se hace más plana.
A menor dispersión, la curva se hace más pequeña y los datos se juntan más entre sí.
La fórmula para obtener la desviación estándar, usando la función de densidad, es:
\[\sigma^2 = \int^{\infty}_{\infty} (x-\mu)^2 f(x)dx\]
Aquí \(f(x)\) es la función de densidad.
La media
Te mencionamos que los datos se apilan o dispersan más, pero no solo entre ellos. En una distribución normal, los datos se apilan alrededor de de la media \(\mu\).
La media en una distribución normal es:
La media es el máximo de la curva; en este caso, la probabilidad de la media \(P(\mu)\) es mayor que la probabilidad de cualquier otro punto.
La media se puede calcular usando la función de densidad como: \[\mu = \int^{\infty}_{\infty} x f(x)dx\]
Probabilidades fuera del rango de la distribución
Habrás visto que definimos la función de la distribución normal en el rango \([a,b]\). Esto significa que la probabilidad fuera de ese rango es cero, por lo que podemos aplicar que la función esté definida de \([-\infty, \infty]\).
Debido a esto, podemos decir que cualquier distribución de probabilidad normal puede definirse usando las fórmulas que te hemos dado.
¿Qué es la distribución normal estándar?
Hay una clase especial de distribución: la distribución estándar; también conocida como la distribución \(z\).
Una distribución de este tipo tiene las siguientes características:
La media es igual a cero \(\mu=0\).
Es simétrica con respecto al origen.
Los límites de la distribución se pueden definir como \([-a, a]\).
Una imagen de la distribución normal estándar es la siguiente:
Fig. 3: Distribución de probabilidad estándar, o de tipo z, con media igual a cero.
Las ventajas de esta distribución son:
Que al calcular la probabilidad de un punto \(x=b\), se obtiene la probabilidad de un punto \(-b\).
Si la distribución entre los extremos y la media representa el \(50%\) de las probabilidades, entonces en el cálculo de la probabilidad:
El cálculo entre la media \(\mu\) y \(b<a\) es igual a la probabilidad acumulada en el rango \([-a, b]\).
El cálculo de la probabilidad entre un punto \(b<\mu\) y \(\mu\) es igual a la probabilidad acumulada en el rango \([-a, b]\); esto, si se resta la probabilidad obtenida entre \([b,\mu]\) y el \(50%\).
¿Cuáles son las propiedades de la desviación estándar de una distribución normal?
Recuerda que la desviación estándar \(\sigma\) es una medida que indica cómo de dispersos están los datos en una muestra.
Hay tres puntos importantes con respecto a la desviación estándar:
Entre la media y una desviación estándar \([-\sigma^2, \sigma^2]\) se encuentra casi el 66% de la población.
Entre la media y dos desviaciones estándar \([-2\sigma^2, 2\sigma^2]\) se encuentra casi el 95% de la población.
Entre la media y dos desviaciones estándar \([-3\sigma^2, 3\sigma^2]\) se encuentra más del 99% de la población.
Otra medida de dispersión es la varianza, esta es igual a la raíz cuadrada de la desviación estándar:
\[ \text{Var}=\sqrt{\sigma}\]
Si se tiene una desviación estándar grande, la curva sería la siguiente:
Fig. 4: Distribución normal con una alta dispersión.
Si se tiene una desviación estándar pequeña, la curva sería la siguiente.
Fig. 5: Distribución normal con baja dispersión.
Distribución normal - Puntos clave
- La distribución normal sigue la fórmula: \[\dfrac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]
- Debido a que \(x\) es una variable general, en realidad hay solo dos parámetros que definen las diferencias entre cada curva:
- La media \(\mu\).
- La desviación estándar \(\sigma\).
- Hay una clase especial de distribución; esta es la distribución estándar, también conocida como la distribución \(z\). Sus características son:
- La media es igual a cero \(\mu=0\).
- Es simétrica con respecto al origen.
- Los límites de la distribución se pueden definir como \([-a, a]\).
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Get to know Lily
Content Quality Monitored by:
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
Get to know Gabriel