Fórmula de la desviación típica
La fórmula de la desviación típica es
\[ \sigma = \sqrt{{dfrac{{suma(x_i-\mu)^2}{N}}].
Donde:
\(\sigma\) es la desviación típica
\(\suma\) es la suma
\(x_i\) es un número individual del conjunto de datos
\( \mu\) es la media del conjunto de datos
\(N\) es el número total de valores del conjunto de datos
Así que, en palabras, la desviación típica es la raíz cuadrada de la suma de lo lejos que está cada punto de datos de la media al cuadrado, dividida por el número total de puntos de datos.
La varianza de un conjunto de datos es igual a la desviación típica al cuadrado, \(\sigma^2\).
Gráfico de la desviación típica
El concepto de desviación típica es bastante útil porque nos ayuda a predecir cuántos de los valores de un conjunto de datos estarán a cierta distancia de la media. Al realizar una desviación típica, suponemos que los valores de nuestro conjunto de datos siguen una distribución normal. Esto significa que se distribuyen alrededor de la media en una curva en forma de campana, como la que se muestra a continuación.
Gráfico de la desviación típica. Imagen: M W Toews, CC BY-2.5 i
El eje \(x\)- representa las desviaciones típicas alrededor de la media, que en este caso es \(0\). El eje \(y\)- muestra la densidad de probabilidad, que significa cuántos de los valores del conjunto de datos caen entre las desviaciones típicas de la media. Este gráfico, por tanto, nos dice que \(68,2\%\) de los puntos de un conjunto de datos distribuidos normalmente caen entre \(-1\) desviación típica y \(+1\) desviación típica de la media, \(\mu\).
¿Cómo se calcula la desviación típica?
En este apartado, veremos un ejemplo de cómo calcular la desviación típica de un conjunto de datos de muestra. Supongamos que has medido la altura de tus compañeros de clase en cm y has anotado los resultados. Estos son tus datos
165, 187, 172, 166, 178, 175, 185, 163, 176, 183, 186, 179
A partir de estos datos ya podemos determinar \(N\), el número de puntos de datos. En este caso, \(N = 12\). Ahora tenemos que calcular la media, \(\mu\). Para ello, simplemente sumamos todos los valores y los dividimos por el número total de puntos de datos, \(N\).
\[ \begin{align} \mu &= \frac{165 + 187+172+166+178+175+185+163+176+183+186+179}{12}. \\ &= 176.25. \fin \]
Ahora tenemos que hallar
\[ \suma(x_i-\mu)^2.\]
Para ello podemos construir una tabla:
\(x_i\) | \(x_i - \mu\) | \((x_i-\mu)^2\) |
165 | -11.25 | 126.5625 |
187 | 10.75 | 115.5625 |
172 | -4.25 | 18.0625 |
166 | -10.25 | 105.0625 |
178 | 1.75 | 3.0625 |
175 | -1.25 | 1.5625 |
185 | 8.75 | 76.5625 |
163 | -13.25 | 175.5625 |
176 | -0.25 | 0.0625 |
183 | 6.75 | 45.5625 |
186 | 9.75 | 95.0625 |
179 | 2.75 | 7.5625 |
Para la ecuación de la desviación típica, necesitamos la suma sumando todos los valores de la última columna. Esto da \(770,25\).
\[ \suma(x_i-\mu)^2 = 770,25.\]
Ahora tenemos todos los valores que necesitamos para introducirlos en la ecuación y obtener la desviación típica de este conjunto de datos.
\[ \begin{align} \sigma &= μsqrt{dfrac{{suma(x_i-\mu)^2}{N}}. \\ y = el cuadrado del frac {770,25} {12}. \\ &= 8.012. \fin]
Esto significa que, por término medio, los valores del conjunto de datos se alejarán \(8,012\, cm\) de la media. Como se ve en el gráfico de distribución normal anterior, sabemos que \(68,2\%\) de los puntos de datos están entre \(-1\) desviación típica y \(+1\) desviación típica de la media. En este caso, la media es \(176,25\, cm\) y la desviación típica \ (8,012\, cm\). Por tanto, \( \mu - \sigma = 168,24\, cm\) y \ ( \mu - \sigma = 184,26\, cm\), lo que significa que \ (68,2\%\ ) de los valores están entre \(168,24\, cm\) y \(184,26, cm\) .
Se ha registrado la edad (en años) de cinco trabajadores de una oficina. Halla la desviación típica de las edades: 44, 35, 27, 56, 52.
Tenemos 5 puntos de datos, así que \(N=5\). Ahora podemos hallar la media, \(\mu\).
\[ \mu = \frac{44+35+27+56+52}{5} = 42,8\}].
Ahora tenemos que hallar
\[ \suma(x_i-\mu)^2.\]
Para ello, podemos construir una tabla como la anterior.
\(x_i\) | \(x_i - \mu\) | \((x_i-\mu)^2\) |
44 | 1.2 | 1.44 |
35 | -7.8 | 60.84 |
27 | -15.8 | 249.64 |
56 | 13.2 | 174.24 |
52 | 9.2 | 84.64 |
Para hallar
\[ \suma(x_i-\mu)^2,\]
podemos simplemente sumar todos los números de la última columna. El resultado es
\[ \suma(x_i-\mu)^2 = 570,8\]
Ahora podemos introducirlo todo en la ecuación de la desviación típica.
\[ \begin{align} \sigma &= cuadrado{dfrac{suma(x_i-\mu)^2}{N}} \\ y= el cuadrado del frac de 570,8 \\ &= 10.68. \end{align}\]
Por tanto, la desviación típica es de \(10,68\) años.
Desviación típica - Puntos clave
- La desviación típica es una medida de la dispersión, o de lo alejados que están los valores de un conjunto de datos de la media.
- El símbolo de la desviación típica es sigma, \(\sigma\)
![]()
- La ecuación de la desviación típica es \[ \sigma = \sqrt{\dfrac{\suma(x_i-\mu)^2}{N} \}.
![]()
- La varianza es igual a \(\sigma^2\)
![]()
- La desviación típica se utiliza para conjuntos de datos que siguen una distribución normal.
- El gráfico de una distribución normal tiene forma de campana.
- En un conjunto de datos que sigue una distribución normal, \(68,2\%\) de los valores caen dentro de \(\pm \sigma\) la media.
Imágenes
Gráfico de desviación típica: https://commons.wikimedia.org/wiki/File:Standard_deviation_diagram.svg