Saltar a un capítulo clave
Comparar distribuciones de datos
Al comparar varias distribuciones de datos, puedes comentar
Una medida de localización: una medida de localización se utiliza para resumir todo un conjunto de datos con un único valor. Por ejemplo, la media y la mediana son medidas de localización.
Una medida dedispersión - una medida de dispersión nos proporciona información sobre la variabilidad de los datos de un conjunto de datos determinado, es decir, lo cerca o lejos que están entre sí los distintos puntos de un conjunto de datos. La desviación típica y el rango intercuartílico son ejemplos de medidas de dispersión.
Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos. En los casos en que los conjuntos de datos contienen valores extremos y/o valores atípicos, suele ser más apropiado utilizar la mediana y los rangos intercuartílicos.
No utilices la mediana y la desviación típica juntas, ni la media y los rangos intercuartílicos juntos.
Profundicemos en el concepto con ayuda de ejemplos.
Comparar la media y las desviaciones típicas de conjuntos de datos
Las temperaturas medias diarias durante el mes de agosto se registran en Heathrow y Leeming. Para Heathrow, ∑x=562, ∑x²=10301,2. Para Leeming, la temperatura media fue de 15,6° C con una desviación típica de 2,01° C
a) Calcula la media y la desviación típica de Heathrow. b) Compara los datos de Heathrow con los de Leeming.
Soluciones
Para Heathrow
\(\begin{align} media &= \frac {\suma{x}}{n} \\ y= frac 562 31 = 18,1º C fin)
\(Desviación cuadrática estándar = \sqrt {\frac{suma{x^2}}{n} - (\frac{suma{x}}{n})^2} = \sqrt {\frac{10301,2}{31} - (\frac{562}{31})^2} = 1,91ºC\)
b) A partir de la información anterior, vemos que la temperatura media en Heathrow durante agosto fue superior a la de Leeming, y la dispersión/variabilidad de las temperaturas fue inferior a la de Leeming.
Una empresa recopila los plazos de entrega en minutos de los proveedores A y B durante un periodo de 20 días. A continuación se muestra el resultado de los datos recogidos. Compara los resultados de los dos proveedores.
proveedores | ∑x | ∑x² |
A | 360 | 18000 |
B | 300 | 29000 |
soluciones
Para el proveedor A
\(\begin{align} media_A &= \frac {\suma x}{n} \\ &= \frac {360}{20} = 18 fin)
Para el proveedor B
\(\begin{align} media_B &= \frac {\suma x}{n} \\ &= \frac {300}{20} = 15 \final)
A partir de la información anterior, vemos que el proveedor A tiene un plazo de entrega más largo, mientras que el proveedor B tiene una mayor dispersión en el plazo de entrega.
Considera el ejemplo anterior en un contexto real. Si la empresa quiere mantener a uno de sus proveedores y prescindir del otro, podría comparar los datos anteriores como lo hemos hecho nosotros. Si la prioridad de la empresa es reducir los plazos de entrega en promedio, favorecería al proveedor B. Si, por el contrario, la prioridad es una mayor fiabilidad, favorecería al proveedor con menor variabilidad, y ése sería el proveedor A.
Comparación de la mediana y el rango intercuartílico de conjuntos de datos
Los alumnos de dos secciones diferentes se presentan a un examen. Se proporciona el cuartil y la mediana de las notas de cada sección. Compara el rendimiento de las 2 secciones.
Sección | mediana | ||
Sección 1 | 58 | 71 | 87 |
Sección 2 | 62 | 74 | 83 |
Soluciones
El rango intercuartílico de la Sección 1 = Q3 - Q1= 87-58 = 29
El rango intercuartílico de la Sección 2 = Q3 - Q1= 83-62 = 21
A partir de los datos dados, vemos que la mediana de las notas es mayor en la sección 2, mientras que la variabilidad de las notas es mayor en la sección 1.
Una empresa recopila los plazos de entrega de los proveedores A y B durante un período de 20 días. La mediana del plazo de entrega fue de 4 horas para el proveedor A, y de 3 horas para el proveedor B. El intervalo intercuartílico para el proveedor A fue de 0,8 horas y para el proveedor B fue de 1,5 horas.
Compara el rendimiento de los proveedores en términos de rapidez y fiabilidad.
Soluciones
El proveedor B parece ser el más eficiente en términos de rapidez, con un plazo de entrega medio inferior. El proveedor A parece ser más fiable, con una menor dispersión/variabilidad en el plazo de entrega.
Comparación de datos - Conclusiones clave
- En muchas aplicaciones del mundo real tenemos que comparar información entre varios conjuntos de datos.
- Al comparar múltiples distribuciones de datos, puedes comentar
- una medida de localización
- una medida de dispersión
- Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos.
Aprende con 5 tarjetas de Comparación de datos en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Comparación de datos
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más