Saltar a un capítulo clave
Sin embargo, esto ocurre cuando se tiene una sola variable y, en ciertos casos, te encontrarás con sistemas con más de una variable aleatoria. Esto es parte de una rama de las estadística llamada estadística multivariable. En este artículo nos enfocaremos en el caso de la bivariable:
En la estadística bivariable se miden las interacciones entre dos variables en un sistema y cómo los cambios de cada una afectan a la otra.
El coeficiente de correlación, que puede ser obtenido en estos, no permite saber la correlación entre ambas variables.
Estadística descriptiva bidimensional
Al igual que la estadística descriptiva para una simple variable aleatoria, en las distribuciones de datos donde hay más de una variable asociada a un resultado, existen ciertos puntos que debes reconocer:
La variable estadística multidimensional o bidimensional —en este caso, \(x=(X, Y)\)—.
Diagrama de dispersión, que en este caso es una gráfica que representa los puntos de las variables \((X,Y)\).
La covarianza muestral, que mide la dispersión conjunta de las variables \((X,Y)\).
El centro de gravedad, que son las medias de ambas variables \(X\) y \(Y\) en los rangos en los que existen.
Variable estadística bidimensional
En distribuciones que presentan más de una variable asociada a un resultado, se dice que se tiene una variable estadística multidimensional. En el caso que sean dos se tiene una variable estadística bidimensional.
Se dice que se tiene una variable estadística bidimensional si se tiene un experimento aleatorio, muestra o mediciones, donde cada objeto \(x\) puede ser asociado a dos variables cuyos resultados son distintos \((Y,X)\).
Un ejemplo de una variable aleatoria bidimensional sería el estudio entre el peso de las personas en un colegio y el salario que se obtiene en sus casas.
En este caso, es muy probable que una variable tenga un impacto en la otra, ya que la clase de dieta y alimentos disponibles sufrirán cambios —dependiendo de sus ingresos o, al menos, eso indicaría una posible teoría—.
Tabla de contingencia
Para poder representar los resultados de una variable bidimensional o multidimensional se usan tablas de contingencia.
En la primera columna de esta tabla se establecen las categorías o resultados que puede obtener la variable \(Y\). La primera fila, entonces, muestra las categorías o resultados que puede obtener las variables \(X\).
Cada celda representa la población que une los valores o categorías conjuntas de \((X=a_i,Y=b_i)\).
La columna y fila finales contienen las frecuencias relativas absolutas o el número de valores totales para cierto valor de \(X\) o \(Y\).
Esto lo podemos ver en la siguiente tabla:
\(1\) | \(2\) | ... | \(n\) | |
\(X\) | \(a_1\) | \(a_2\) | ... | \(a_n\) |
\(Y\) | \(b_1\) | \(b_2\) | ... | \(b_n\) |
Si quieres saber más acerca de qué son y cómo se calculan estas frecuencias relativas, no olvides leer nuestro artículo sobre tablas de contingencia.
Diagrama de dispersión
Una vez tenemos la tabla de contingencia, podemos representar todos estos datos en una gráfica denominada diagrama de dispersión o nube de puntos. En esta, uno de los ejes representa una de las variables \(X\) y el otro eje representa la otra variable \(Y\). La intencionalidad de esta gráfica es ver cómo se relacionan las variables. Así podemos entender si las variables tienen una dependencia directa (vemos que \(Y\) crece de manera proporcional con \(X\), o inversamente proporcional) o son independientes (no observamos ninguna relación entre las variables).
Por ejemplo, una nube homogénea de puntos te puede decir que el centro gravedad está en el centro de la nube ( como se ve en la gráfica a continuación).
En cambio, si existe una relación fuerte entre ambas variables, se generaría un patrón consistente de los resultados. Uno de estos patrones, fácilmente, podría ser una relación lineal. En la siguiente gráfica puedes observar la relación lineal de las variables \(X\) y \(Y\).
Covarianza y relaciones entre variables
El valor de la covarianza es muy importante: dependiendo de su resultado, podemos saber cómo se comportan las variables:
Si la covarianza es positiva, la relación es directa; entonces, los puntos se apilan cerca a una recta con pendiente positiva.
Si la covarianza es negativa, la relación es inversa; entonces, los puntos se apilan cerca a una recta con pendiente negativa.
Si la covarianza es cero, se dice que no hay relación entre ambas variables.
Debes saber que cuanto más alto sea el valor de la covarianza, la relación se asemejará cada vez más a una recta.
Recta de regresión
Cuando se tiene una relación lineal, se puede obtener la recta de regresión. Esta es la función igual a una recta de tipo \(y=mx+b\), que nos dice la relación entre ambas variables.
La fórmula para esto es:
\[y-\mu_y=\dfrac{ \sigma_{xy}}{\sigma^2_x} (x-\mu_x)\]
Aquí \( \sigma_{xy}\) es la covarianza, que se define como:
\[\sigma_{xy}=\dfrac{\sum x_i y_i}{n} - \sigma_x \sigma_y\]
Distribuciones bidimensionales - Puntos clave
La estadística multivariable estudia la relación entre dos o más variables.
En la estadística bivariable, dos variables se relacionan entre sí para observar cómo ambas influyen en la otra.
Las tablas de contingencia son muy útiles para representar las frecuencias relativas absolutas en estadística multivariable.
Ciertos parámetros que nos indican cosas importantes de las distribuciones con más de una variable son: la covarianza como medida de dispersión y el centro de gravedad como media.
Dadas la covarianza y el centro de gravedad, se puede obtener una recta, que representa la relación entre los datos; pero, esto solo en caso de que los datos tengan una relación directa o inversa.
Si la covarianza arroja un valor positivo, la relación es directamente proporcional; si la varianza arroja un valor negativo, es directamente proporcional con pendiente negativa; y si da un valor cercano a cero, no hay relación entre las variables.
Aprende con 7 tarjetas de Distribuciones bidimensionales en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Distribuciones bidimensionales
¿Qué es una distribución bidimensional?
Es una distribución de probabilidad que depende, no de una variable aleatoria, sino de dos de ellas.
¿Cuál es la utilidad de las distribuciones bidimensionales?
Nos permite relacionar dos variables y cómo se afectan mutuamente.
¿Qué es una variable estadística bidimensional?
Se dice que se tiene una variable estadística bidimensional si se tiene un experimento aleatorio, muestra o mediciones, donde cada objeto x puede ser asociado a dos variables cuyos resultados son distintos a X, Y.
¿Cómo se puede representar gráficamente una distribución bidimensional?
Una distribución bidimensional se puede tener en forma de tabla de contingencia, en la cual tenemos la relación entre las variables X e Y. A partir de esta, podemos representar los datos en una gráfica, de modo que obtenemos un diagrama de dispersión o nube de puntos.
¿Qué es la recta de regresión en probabilidad y estadística?
Es la recta calculada para la relación dada entre dos variables aleatorias.
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más