Saltar a un capítulo clave
Combinar y transformar variables aleatorias
Como ya has visto, muchas personas inspeccionan cosas como los coches antes de venderlos. Cada inspector individual tiene un tiempo medio de inspección y una varianza asociada a su tiempo de inspección. La variable aleatoria en este caso es el inspector, y lo que buscas es la suma de sus tiempos de inspección esperados.
Si se producen varios sucesos aleatorios asociados a un resultado, puedes sumarlos para formar una nueva distribución. La nueva distribución en el ejemplo del coche sería el tiempo total de inspección del coche.
Combinar variables ale atorias significa transformar dos o más variables aleatorias en una sola.
Por otra parte, transformar variables aleatorias implica escalarlas y desplazarlas. Esto ocurriría si estuvieras jugando a un juego varias veces e intentaras averiguar a cuánto ascendería el total de tus victorias y derrotas. Consulta el artículo Transformar variables aleatorias para obtener más detalles y ejemplos al respecto.
Una cosa muy importante que debes comprobar antes de combinar variables aleatorias es que sean independientes, o al menos que te resulte razonable suponer que lo son.
Respuesta:
Como ningún inspector interactúa nunca con un teléfono móvil al mismo tiempo que otro inspector, es razonable suponer que sus inspecciones no se afectan mutuamente. Eso significaría que sus tiempos de inspección son independientes, y puedes combinar las variables aleatorias.
¿Y en el siguiente ejemplo?
Supón que tu primera variable aleatoria es cuántas horas durmió ayer una persona elegida al azar, y tu segunda variable aleatoria es cuántas horas estuvo despierta esa misma persona. ¿Puedes combinar esas variables aleatorias?
Respuesta:
No. Cuántas horas está despierta una persona depende de cuántas horas estuvo dormida, por lo que no son variables aleatorias independientes y no pueden combinarse.
La notación \(T = X + Y\) puede resultar confusa. ¿Realmente sólo estás sumando cosas? Veamos un ejemplo.
Pensemos en dos personas que inspeccionan un teléfono móvil y hacen inspecciones por separado. La empresa lleva un registro de cuánto tarda cada persona en hacer una inspección. Entonces puedes establecer:
- \(X\) es el conjunto de veces que la primera persona inspecciona un teléfono; y
- \(Y\) es el conjunto de tiempos para que la primera persona inspeccione un teléfono.
En lugar de examinar a cada persona que inspecciona un teléfono individualmente, la empresa quiere hacerse una idea del tiempo total que se tarda en inspeccionar un teléfono. Así que, en este ejemplo, combinar las variables aleatorias \(X\) y \(Y\) significa crear una variable aleatoria \(T\) con \(T = X + Y\), donde en realidad estás sumando los tiempos de \(X\) a los tiempos de \(Y\) para obtener un tiempo total.
Puede ser útil fijarse en el rango de tiempos de \(T\). Si el rango de tiempos de \(X\) es de \(6\) minutos a \(8\) minutos, y el rango de tiempos de \(Y\) es de \(4\) minutos a \(5\) minutos, entonces el rango de \(T = X + Y\) es de \(6+4 =10\) minutos a \(8+5=13\) minutos.
Supongamos que la empresa toma \(20\) medidas de cada inspector, y las representa gráficamente en los histogramas siguientes.
La media del inspector nº 1 es de \(7,1\) minutos, y la del inspector nº 2 es de \(4,6\) minutos. A continuación, sus tiempos se combinan en una nueva distribución aleatoria, \(T\), y arriba se muestra el histograma de esos datos.
Observa que el intervalo de tiempos del histograma oscila entre \(10\) y \(13\) minutos. La media del histograma combinado es de 11,7 minutos, que es más o menos lo que cabría esperar dadas las medias de las inspecciones individuales.
¿Cómo afecta a la media la combinación de variables aleatorias?
Combinando variables aleatorias, la media
Aunque puedes combinar más de dos variables aleatorias siempre que sean independientes, para simplificar, el resto de este artículo se centra en la combinación de sólo dos de ellas.
Supongamos que \(X\) y \(Y\) son dos variables aleatorias independientes. Para la media de \(X\) escribe \(\mu_X\), y para la media de \(Y\) escribe \(\mu_Y\). ¿Cómo combinas sus medias?
La media de la suma de dos variables aleatorias es la suma de sus medias. En otras palabras, si \(T = X + Y\) entonces\[ \mu_T = \mu_X + \mu_Y.\]
Si tomas la diferencia de dos variables aleatorias, entonces la media de la diferencia es la diferencia de sus medias. Así que si \(T = X - Y\), entonces\[ \mu_T = \mu_X - \mu_Y.\]
Al igual que en la resta normal, el orden marca la diferencia. Veamos un par de ejemplos.
Jake y Anna trabajan en la misma tienda, pero en departamentos distintos. Jake espera vender una media de \(5\) camisas al día y Anna espera vender una media de \(3\). ¿Cuál es el número medio total esperado de camisas vendidas en la tienda al día?
Responde:
Sea \(X\) la variable aleatoria que representa cuántas camisas vende Jake, y \(Y\) la variable aleatoria que representa las ventas de Anna. Es de esperar que sean variables aleatorias independientes. Llamemos \(T\) a la variable aleatoria de las ventas totales de la tienda, así \(T = X + Y\).
Según el enunciado del problema
\[ \mu_X = 5 \text{ y } \mu_Y = 3.\]
Por tanto, pueden esperar vender \begin{align} \mu_T &= \mu_X + \mu_Y &= 5 + 3 &= 8, \end{align}\]o lo que es lo mismo, un total de \(8\) camisetas.
¿Y si te preguntan cuántas camisetas más espera vender Jake?
Jake y Anna trabajan en la misma tienda, pero en departamentos distintos. Jake espera vender una media de \(5\) camisas al día y Anna espera vender una media de \(3\). ¿Cuántas camisas más puede esperar vender Jake al día?
Solución:
Igual que antes,que \(X\) sea la variable aleatoria que representa cuántas camisetas vende Jake, y \(Y\) sea la variable aleatoria que representa las ventas de Anna, donde supones razonablemente que son independientes. Llama \(T\) a la variable aleatoria de la diferencia entre las ventas de Jake y Anna en la tienda. Entonces, como \(T = X - Y\),
\[ \begin{align} \mu_T &= \mu_X - \mu_Y &\= 5 - 3 \\\mu_Y &= 2. \end{align}\ ]
Por tanto, Jake puede esperar vender \(2\) camisetas más que Ana.
Supón que en lugar de eso hubieras mirado la diferencia entre las ventas de Anna y Jake. ¡Entonces habrías encontrado una media de \(-2\)! Eso puede ocurrir, y tienes que mirar la distribución combinada real para averiguar lo que implica en la vida real. Si encuentras un número negativo al observar la diferencia en las ventas, sólo implica que, en general, Anna vende menos camisetas que Jake.
Combinación de variables aleatorias, desviación típica
Al igual que con la media, combinar la varianza de dos variables aleatorias independientes es cuestión de sumar. Supongamos que \(X\) y \(Y\) son dos variables aleatorias independientes. Para la desviación típica de \(X\) escribe \(\sigma_X\), y para la desviación típica de \(Y\) escribe \(\sigma_Y\). Entonces:
La varianza de la suma de dos variables aleatorias es la suma de sus varianzas. En otras palabras, si \(T = X + Y\) entonces\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
Si tomas la diferencia de dos variables aleatorias, entonces la varianza de la diferencia es la suma de sus varianzas. Así que si \(T = X - Y\), entonces\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
Un momento, ¡esa segunda parte no parece correcta! ¿Por qué cuando restas dos distribuciones no estás restando sus varianzas? Porque la varianza es una medida de la dispersión de las distribuciones. Por tanto, si combinas dos distribuciones, la nueva tendrá una dispersión mayor que cualquiera de las dos originales.
¿Implica esto que también puedes combinar la desviación típica de dos variables aleatorias independientes con la suma? Por supuesto que no. Recuerda que la desviación típica es la raíz cuadrada de la varianza, y que
\[ \qrt{a + b} \ne \qrt{a} + \qrt{b}.\]
Por tanto, las desviaciones típicas no pueden sumarse del mismo modo que la varianza.
Veamos un ejemplo para mostrar cómo funciona.
Jake y Anna trabajan en la misma tienda, pero en departamentos distintos. Jake espera vender una media de \(5\) camisas al día y Anna espera vender una media de \(3\). Sin embargo, Jake tiene una desviación típica en sus ventas de \(1\) camisa, mientras que Anna tiene una desviación típica de \(4\) camisas. ¿Es la desviación típica de sus totales combinados de camisas la misma que la suma de la desviación típica de sus totales individuales?
Solución:
Estableciendo algunas variables:
- \(X\) es la variable aleatoria del número de camisas que vende Jake;
- \(Y\) es la variable aleatoria del número de camisas que vende Anna; y
- \(T\) es la variable aleatoria del número de camisetas que venden juntos.
Como ya has visto, \(\mu_T = 8\). ¿Y la varianza y la desviación típica? A partir del enunciado del problema, sus desviaciones típicas individuales son
\[ \sigma_X = 1 \mbox{ y } \sigma_Y = 4.\]
Entonces, para la varianza
\[ \begin{align} \sigma^2_T &= \sigma^2_X + \sigma^2_Y &= 1^2 + 4^2 &= 17, \end{align} \]
pero
\[ \sigma_T = \sqrt{17} \aprox 4,1\]
que no es lo mismo que
\[ \sigma_X + \sigma_Y = 1 + 4 = 5.\]
De hecho
\[ \sigma_T < \sigma_X + \sigma_Y.\]
Así que, aunque el número medio de camisetas que venden al día sigue siendo el mismo si trabajan juntos, la desviación típica del número de camisetas que venden juntos es menor que si permanecen separados.
Combinación de variables aleatorias normales
En los ejemplos que has visto hasta ahora, daba igual que las variables aleatorias siguieran una distribución normal. Lo único que importaba es que fueran variables aleatorias independientes.
Cuando tienes dos variables aleatorias continuas independientes, y ambas siguen una distribución normal, también lo hace su suma o su diferencia.
Veamos un ejemplo para ilustrarlo.
Supón que tienes un negocio en el que haces y entregas pizzas, en el que tanto hacer como entregar las pizzas son distribuciones normales, con
- hacer la pizza tiene un tiempo medio de \(18\) minutos con una desviación típica de \(1,5\) minutos; y
- la entrega de las pizzas tiene un tiempo medio de \(25\) minutos con una desviación típica de \(8\) minutos.
(a) ¿Cuál es la probabilidad de que hacer y entregar una pizza lleve más de una hora?
(b) ¿Qué porcentaje de las pizzas tardan más en hacerse que en entregarse?
Solución:
(a) En esta parte de la pregunta buscas el tiempo total, es decir, la suma de dos variables aleatorias independientes distribuidas normalmente. En primer lugar, definamos las variables aleatorias:
- \(X\) es la variable aleatoria del tiempo que se tarda en hacer una pizza;
- \(Y\) es la variable aleatoria del tiempo que se tarda en entregar una pizza; y
- \(T\) es la variable aleatoria del tiempo total para hacer y entregar una pizza.
Se te dice que ambas variables aleatorias son normales, y que es de esperar que hacer la pizza y entregarla sean independientes entre sí. Por tanto, \(T\) también se distribuye normalmente, con \(T = X + Y\).
El tiempo medio para hacer y entregar una pizza sería
\[ \begin{align} \mu_T &= \mu_X + \mu_Y &= 18 + 25 \\\ y= 43 \, min. \fin].
Como los tiempos son independientes
\[ \ iniciar{alignar} \sigma^2_T &= \sigma^2_X + \sigma^2_Y &= 1,5^2 + 8^2 &= 66,25,\end{align} \]
así que
\[ \sigma_T = \sqrt{66,25} \aprox 8,1 \, min.\]
En otras palabras, \(T\) es una distribución normal con media \(43\) y desviación típica \(8,1\).
Quieres saber la probabilidad de que hacer y entregar una pizza lleve más de una hora. El gráfico siguiente muestra la distribución normal para el tiempo total, y la región sombreada representa el tiempo superior a \(60\) minutos.
Entonces, la puntuación z asociada a 60 minutos es
\[ z = \frac{60-43}{8,1} = 2,099\}]
lo que, utilizando una tabla normal estándar, te da que la probabilidad de tardar más de \(60\) minutos es
\[ P(T>60) = P(z>2,099) = 0,0179.\]
En otras palabras, ¡sólo hay una probabilidad de \(1,79\%\) de que una pizza tarde más de una hora en hacerse y entregarse!
(b) A continuación quieres saber el porcentaje de pizzas que tardan más en hacerse que en entregarse. Esta vez quieres saber la diferencia entre \(X\) y \(Y\), así que necesitas una nueva variable aleatoria, llámala \(D\), para representarlo. En otras palabras, \(D = X - Y\). Sigue siendo cierto que tanto \(X\) como \(Y\) son variables aleatorias independientes que siguen una distribución normal.
La diferencia media de tiempo entre hacer y entregar una pizza sería
\[ \begin{align} \mu_D &= \mu_X - \mu_Y \\\= 18 - 25 \\\\= -8 \, min. \fin].
Como los tiempos son independientes
\[ \ iniciar{alignar} \sigma^2_D &= \sigma^2_X + \sigma^2_Y &= 1,5^2 + 8^2 &= 66,25,\end{align} \]
así que
\[ \sigma_D = \sqrt{66,25} \aprox 8,1 \, min.\]
En otras palabras, \(D\) es una distribución normal con media \(-8\) y desviación típica \(8,1\). Si una pizza tarda más en hacerse que en entregarse, lo que quieres hallar es \(P(D>0)\). En el gráfico siguiente, la región sombreada representa cuando la pizza tarda más en hacerse que en entregarse.
Entonces la puntuación \(z\)-asociada a \(0\) minutos es
\[ z = \frac{0-(-8)}{8,1} = 0,988\}]
lo que, utilizando una tabla normal estándar, te da que la probabilidad de tardar más de \(60\) minutos es
\[ P(D>0) = P(z>0,988) = 0,1611.\]
En otras palabras, aproximadamente el \(16\%\) de las veces, la pizza tardará más en hacerse que en entregarse.
¡Siempre vienen bien más ejemplos!
Ejemplos de combinación de variables aleatorias
Veamos algunos ejemplos más.
Supón que tienes dos inspectores trabajando para ti. Si cualquiera de ellos inspecciona un artículo, tarda una media de \(5,8\) minutos en hacer la inspección, con una desviación típica de \(8\) minutos. Sin embargo, si ambos trabajan juntos para inspeccionar el mismo artículo, tardan una media de \(11,6\) minutos, con una desviación típica de \(17\) minutos. ¿Es mejor que los inspectores trabajen por separado o juntos?
Solución:
En primer lugar, demos nombre a las variables:
- \(X\) es la variable del inspector A;
- \(Y\) es la variable del inspector B; y
- \(T\) es la variable de sus tiempos combinados.
Entonces \(T = X + Y\), por lo que
\[ \begin{align} \mu_T &= \mu_X + \mu_Y &= 5,8 + 5,8 \\mu_T &= 11,6 \, min. \fin]
Eso significa que no importa si trabajan juntos o por separado, en cualquier caso, su tiempo medio va a ser de \(11,6\) minutos.
Para que puedas ver sus varianzas combinadas, necesitas saber que son variables independientes. Así que, para el resto del ejemplo, tendrás que suponer que dos personas pueden inspeccionar un artículo al mismo tiempo sin interferir entre sí, lo que las convierte en variables independientes. Entonces la varianza es
\[\begin{align} \sigma^2_T &= \sigma^2_X + \sigma^2_Y \sigma^2_T &= 8^2 + 8^2 \sigma^2_T &= 128, \end{align} \]
y la desviación típica es
\[ \ inicio{align} \sigma_T &= \sqrt{ \sigma^2_T} \\ y = cuadrado 134,8 \\ & Aproximadamente 11,3, mín. \fin \]
Así que cuando los dos inspectores trabajan por separado, tienen una variación mucho menor en su tiempo de inspección.
¿Qué significa eso en términos de que trabajen juntos o por separado? Dado que su tiempo medio de inspección es el mismo en ambos casos, te compensa elegir la opción que te proporcione la menor variación en los tiempos de inspección. Eso significa que quieres que los dos inspectores trabajen por separado, ya que cuando trabajan juntos su desviación típica es de \(17\) minutos, en lugar de \(11,3\) minutos cuando trabajan por separado.
Veamos uno relacionado con juguetes.
Una tienda local vende coches de juguete. La probabilidad de vender entre \(0\) y \(5\) coches de juguete se da en la tabla siguiente.
Número de coches | Probabilidad |
\(0\) | \(0.03\) |
\(1\) | \(0.16\) |
\(2\) | \(0.30\) |
\(3\) | \(0.23\) |
\(4\) | \(0.17\) |
\(5\) | \(0.11\) |
Tabla 1. Probabilidad de venta.
Supongamos que la venta de coches de juguete es independiente.(a) Halla la media y la desviación típica del número de coches de juguete que vende la tienda en un día.(b) Si la tienda abre \(5\) días a la semana, ¿cuántos coches de juguete puede esperar vender la tienda, y cuál es la desviación típica?Solución:(a) Primero establezcamos algunas variables. Aquí, \(X\) es la variable aleatoria que representa el número de coches de juguete que vende la tienda en un día, siendo \(x_i\) el número de coches vendidos con probabilidad \(p_i\). Así que\[ \begin{align} \Mu_X &= suma_limits_i=0}^5 x_i p_i &= 0(0,03) + 1(0,16) + 2(0,30) + 3(0,23) + 4(0,17) + 5(0,11) &= 2,68. \end{align}\}]Hay \(6\) entradas en la tabla, por lo que la varianza viene dada por\[ \begin{align} \sigma^2_X &= \frac{ \sum\limits_{i=0}^5 (x_i - \mu_X)^2}{N} \\ ¾ &= ¾frac{{subpila{(0-2,68)^2+(1-2,68)^2+(2-2,68)^2+(3-2,68)^2+(4-2,68)^2+(5-2,68)^2}{6}. \\ y aproximadamente 2,95, fin. \] y la desviación típica viene dada por\[ \begin{align} \Sigma_X &= 2,95 \\ y aproximadamente 1,72. \fin \](b) Es de esperar que la venta de coches de juguete un día cualquiera no afecte a la venta de coches otro día, por lo que puedes suponer que el número diario de coches de juguete vendidos es independiente. Además, el número de coches de juguete que la tienda espera vender no cambia en ningún día. Entonces, para una semana, la tienda puede esperar:\[\begin{align} \text{total de ventas de coches esperadas semanalmente} &= 5(\text{total de ventas de coches esperadas diariamente}) \\text{total de ventas de coches esperadas semanalmente) &= 5(2,68) \text{total de ventas de coches esperadas semanalmente) &= 13,4, \end{align}. \]por lo que se venden unos \(13\) coches de juguete en una semana.Recuerda que no puedes limitarte a sumar para obtener la desviación típica. En lugar de eso, debes hallar la varianza de la semana y, a continuación, sacar la raíz cuadrada. La varianza de las ventas semanales de coches de juguete es aditiva, por lo que
\[ \begin{align} \text{varianza de las ventas semanales de coches} &= 5(2,95) &= 14,75 \end{align}\}].
lo que te da
|inicio \desviación típica de las ventas semanales de coches &= 14,75 \\ y aproximadamente 3,84 . \fin]]
Combinar variables aleatorias - Puntos clave
- Combinar variables aleatorias significa transformar dos o más variables aleatorias en una sola.
- ¡Combina sólo variables aleatorias que sean independientes!
- La media de la suma de dos variables aleatorias es la suma de sus medias. En otras palabras, si \(T = X + Y\) entonces\[ \mu_T = \mu_X + \mu_Y.\]
- Si tomas la diferencia de dos variables aleatorias, entonces la media de la diferencia es la diferencia de sus medias. Así que si \(T = X - Y\), entonces\[ \mu_T = \mu_X - \mu_Y.\]
- La varianza de la suma de dos variables aleatorias es la suma de sus varianzas. En otras palabras, si \(T = X + Y\) entonces\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
- Si tomas la diferencia de dos variables aleatorias, entonces la varianza de la diferencia es la suma de sus varianzas. Así que si \(T = X - Y\), entonces\[ \sigma^2_T = \sigma^2_X + \sigma^2_Y.\]
- ¡Las fórmulas de la suma y la diferencia no funcionan para la desviación típica!
Aprende con 7 tarjetas de Combinación de Variables Aleatorias en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Combinación de Variables Aleatorias
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más