Es probable que ya te hayas encontrado con métodos de análisis e interpretación de datos en distribuciones de datos dadas. En muchas aplicaciones del mundo real, tenemos que comparar información entre varios conjuntos de datos. Veamos cómo comparar datos entre distribuciones de datos.
Al comparar varias distribuciones de datos, puedes comentar
Una medida de localización: una medida de localización se utiliza para resumir todo un conjunto de datos con un único valor. Por ejemplo, la media y la mediana son medidas de localización.
Una medida dedispersión - una medida de dispersión nos proporciona información sobre la variabilidad de los datos de un conjunto de datos determinado, es decir, lo cerca o lejos que están entre sí los distintos puntos de un conjunto de datos. La desviación típica y el rango intercuartílico son ejemplos de medidas de dispersión.
Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos. En los casos en que los conjuntos de datos contienen valores extremos y/o valores atípicos, suele ser más apropiado utilizar la mediana y los rangos intercuartílicos.
No utilices la mediana y la desviación típica juntas, ni la media y los rangos intercuartílicos juntos.
Profundicemos en el concepto con ayuda de ejemplos.
Comparar la media y las desviaciones típicas de conjuntos de datos
Las temperaturas medias diarias durante el mes de agosto se registran en Heathrow y Leeming. Para Heathrow, ∑x=562, ∑x²=10301,2. Para Leeming, la temperatura media fue de 15,6° C con una desviación típica de 2,01° C
a) Calcula la media y la desviación típica de Heathrow. b) Compara los datos de Heathrow con los de Leeming.
Soluciones
Para Heathrow
\(\begin{align} media &= \frac {\suma{x}}{n} \\ y= frac 562 31 = 18,1º C fin)
b) A partir de la información anterior, vemos que la temperatura media en Heathrow durante agosto fue superior a la de Leeming, y la dispersión/variabilidad de las temperaturas fue inferior a la de Leeming.
Una empresa recopila los plazos de entrega en minutos de los proveedores A y B durante un periodo de 20 días. A continuación se muestra el resultado de los datos recogidos. Compara los resultados de los dos proveedores.
A partir de la información anterior, vemos que el proveedor A tiene un plazo de entrega más largo, mientras que el proveedor B tiene una mayor dispersión en el plazo de entrega.
Considera el ejemplo anterior en un contexto real. Si la empresa quiere mantener a uno de sus proveedores y prescindir del otro, podría comparar los datos anteriores como lo hemos hecho nosotros. Si la prioridad de la empresa es reducir los plazos de entrega en promedio, favorecería al proveedor B. Si, por el contrario, la prioridad es una mayor fiabilidad, favorecería al proveedor con menor variabilidad, y ése sería el proveedor A.
Comparación de la mediana y el rango intercuartílico de conjuntos de datos
Los alumnos de dos secciones diferentes se presentan a un examen. Se proporciona el cuartil y la mediana de las notas de cada sección. Compara el rendimiento de las 2 secciones.
Sección
mediana
Sección 1
58
71
87
Sección 2
62
74
83
Soluciones
El rango intercuartílico de la Sección 1 = Q3 - Q1= 87-58 = 29
El rango intercuartílico de la Sección 2 = Q3 - Q1= 83-62 = 21
A partir de los datos dados, vemos que la mediana de las notas es mayor en la sección 2, mientras que la variabilidad de las notas es mayor en la sección 1.
Una empresa recopila los plazos de entrega de los proveedores A y B durante un período de 20 días. La mediana del plazo de entrega fue de 4 horas para el proveedor A, y de 3 horas para el proveedor B. El intervalo intercuartílico para el proveedor A fue de 0,8 horas y para el proveedor B fue de 1,5 horas.
Compara el rendimiento de los proveedores en términos de rapidez y fiabilidad.
Soluciones
El proveedor B parece ser el más eficiente en términos de rapidez, con un plazo de entrega medio inferior. El proveedor A parece ser más fiable, con una menor dispersión/variabilidad en el plazo de entrega.
Comparación de datos - Conclusiones clave
En muchas aplicaciones del mundo real tenemos que comparar información entre varios conjuntos de datos.
Al comparar múltiples distribuciones de datos, puedes comentar
una medida de localización
una medida de dispersión
Puedes comparar distintas distribuciones de datos utilizando la media y la desviación típica, o utilizando la mediana y los rangos intercuartílicos.
How we ensure our content is accurate and trustworthy?
At StudySmarter, we have created a learning platform that serves millions of students. Meet
the people who work hard to deliver fact based content as well as making sure it is verified.
Content Creation Process:
Lily Hulatt
Digital Content Specialist
Lily Hulatt is a Digital Content Specialist with over three years of experience in content strategy and curriculum design. She gained her PhD in English Literature from Durham University in 2022, taught in Durham University’s English Studies Department, and has contributed to a number of publications. Lily specialises in English Literature, English Language, History, and Philosophy.
Gabriel Freitas is an AI Engineer with a solid experience in software development, machine learning algorithms, and generative AI, including large language models’ (LLMs) applications. Graduated in Electrical Engineering at the University of São Paulo, he is currently pursuing an MSc in Computer Engineering at the University of Campinas, specializing in machine learning topics. Gabriel has a strong background in software engineering and has worked on projects involving computer vision, embedded AI, and LLM applications.
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.