Saltar a un capítulo clave
\(1) muy insatisfecho/a
\(2) algo insatisfecho/a
\(3) ni satisfecho ni insatisfecho
\(4) algo satisfecho
\(5\) muy satisfecho
¡Acabas de ver las variables categóricas!
¿Qué son las variables categóricas?
Recuerda que los datos univariantes, también conocidos como datos de una variable, son observaciones que se hacen sobre los individuos de una población o muestra. Esos datos son de distintos tipos, como cualitativos, cuantitativos, categóricos, continuos, discretos, etc. En concreto, te ocuparás de las variables categóricas, que también suelen denominarse datos categóricos. Veamos primero la definición.
Una variable se denomina categórica si los datos recogidos se clasifican en categorías. En otras palabras, losdatos categóricos son datos que pueden dividirse en diferentes grupos en lugar de medirse numéricamente.
Las variables categóricas son variables cualitativas porque se refieren a cualidades, no a cantidades. Así, algunos ejemplos de datos categóricos serían el color del pelo, el tipo de mascotas que tiene alguien y sus comidas favoritas. En cambio, cosas como la altura, el peso y el número de tazas de café que alguien bebe al día se medirían numéricamente, por lo que no son datos categóricos.
Para ver los distintos tipos de datos y cómo se utilizan, puedes echar un vistazo a Datos de una variable yAnálisis de datos .
Datos categóricos frente a datos cuantitativos
Ahora ya sabes qué son los datos categóricos, pero ¿en qué se diferencian de los cuantitativos? En primer lugar, es útil echar un vistazo a la definición.
Los datoscuantitativos son datos que son un recuento de cuántas cosas de un conjunto de datos tenemos de una determinada cualidad.
Los datoscuantitativos suelen responder a preguntas como "cuántos" o "cuánto". Por ejemplo, se recopilarían datos cuantitativos si quisieras saber cuánto gasta la gente en comprar un teléfono móvil. Los datos cuantitativos suelen utilizarse para comparar varios conjuntos de datos. Para un análisis más completo de los datos cuantitativos y para qué se utilizan, echa un vistazo a Variables cuantitativas.
Los datos categóricos son cualitativos, ¡no cuantitativos!
Datos categóricos frente a datos continuos
Muy bien, ¿qué pasa con los datos continuos? ¿Pueden ser categóricos? Echemos un vistazo a la definición de datos continuos.
Los datoscontinuos son datos que se miden en una escala de números, en la que los datos pueden ser cualquier número de la escala.
Un buen ejemplo de datos continuos es la altura. Para cualquiera de los números comprendidos entre \(4 \, pies.\) y \(5 \, pies.\) podría haber alguien de esa altura. En general, los datos categóricos no son datos continuos.
Tipos de variables categóricas
Hay dos tipos principales de variables categóricas: nominales y ordinales.
Variables categóricas ordinales
Una variable categórica se denomina ordinal si lleva implícito un orden.
Un ejemplo de datos categóricos ordinales sería la encuesta del principio de este artículo. En ella se te pedía que valoraras la satisfacción en una escala de \(1\) a \(5\), lo que significa que hay un orden implícito en tu valoración. Recuerda que los datos numéricos son datos que implican números, y el ejemplo de la encuesta los tiene. Así que es posible que los datos de una encuesta sean tanto ordinales como numéricos.
Variables categóricas nominales
Una variable categórica se llama nominal si las categorías tienen nombre, es decir, si los datos no tienen números asignados.
Supongamos que en una encuesta te preguntan en qué tipo de vivienda vives, y las opciones que puedes elegir son residencia, casa y apartamento. Ésos son ejemplos de categorías con nombre, por lo que se trata de datos categóricos nominales. En otras palabras, si tiene una categoría nominal pero no está ordenada numéricamente, entonces es una variable categórica nominal.
Variables categóricas en estadística
Antes de pasar a ver más ejemplos de variables categóricas, veamos algunas de las ventajas e inconvenientes de los datos categóricos.
En el lado de las ventajas están:
Los resultados son muy sencillos porque las personas sólo tienen unas pocas opciones entre las que elegir.
Como las opciones se establecen de antemano, no hay preguntas abiertas que deban analizarse. Los datos categóricos se denominan concretos por esta propiedad.
Los datos categóricos pueden ser mucho más fáciles de analizar (y menos costosos de analizar) que otros tipos de datos.
En el lado de las desventajas están:
En general, necesitas obtener bastantes muestras para asegurarte de que la encuesta representa fielmente a la población. Esto puede resultar caro.
Como las categorías se establecen al principio de la encuesta, no es muy sensible. Por ejemplo, si las dos únicas opciones de color de pelo en una encuesta son pelo castaño y pelo blanco, la gente tendrá problemas para decidir en qué categoría poner su color de pelo (suponiendo que tengan alguno). Esto puede dar lugar a que no haya respuestas y a que la gente haga elecciones imprevistas sobre cuál es su color de pelo, lo que sesga los datos.
¡No puedes hacer análisis cuantitativos con datos categóricos! Como no son datos numéricos, no puedes hacer operaciones aritméticas con ellos. Por ejemplo, no puedes tomar una satisfacción de encuesta de \(4\), y sumarla a una satisfacción de encuesta de \(3\) para obtener una satisfacción de encuesta de \(7\).
Puedes ver un resumen de las ventajas e inconvenientes de las variables categóricas en estadística en la siguiente tabla:
Tabla 1. Ventajas e inconvenientes de las variables categóricas | |
---|---|
Ventajas | Desventajas |
Los resultados son sencillos | Muestras grandes |
Datos concretos | Poco sensibles |
Más fácil y menos costoso de analizar | Sin análisis cuantitativo |
Recoger datos categóricos
¿Cómo se recogen los datos categóricos? A menudo se hace mediante entrevistas (en persona o por teléfono) o encuestas (en línea, por correo o en persona). En ambos casos, las preguntas no son abiertas. Siempre pedirán a la gente que elija entre un conjunto concreto de opciones.
Análisis de datos categóricos
Después hay que analizar los datos recogidos, así que ¿cómo se analizan los datos categóricos? A menudo se hace con proporciones o porcentajes, y puede ser en tablas o gráficos. Dos de las formas más frecuentes de analizar datos categóricos son los gráficos de barras y los gráficos circulares.
Supón que te piden que hagas una encuesta para decidir si a la gente le gusta un determinado refresco y obtienes la siguiente información
- A 14 personas les gustaba el refresco; y
- a 50 personas no les gustaba.
En primer lugar, debemos averiguar si se trata de datos categóricos.
Solución
Sí. Puedes dividir las respuestas en dos categorías, en este caso "le gustó" y "no le gustó". Esto sería un ejemplo de datos categóricos nominales.
Ahora bien, ¿cómo podríamos representar estos datos? Podríamos hacerlo con un gráfico de barras o de tarta.
Cualquiera de los dos te ofrece una comparación visual de los datos. Para ver muchos más ejemplos de cómo construir un gráfico para datos categóricos, consulta Gráficos de barras.
Ejemplos de variables categóricas
Veamos algunos ejemplos de lo que pueden ser los datos categóricos.
Supongamos que estás interesado en ver una película, y preguntas a un grupo de tus amigos si les ha gustado o no para decidir si quieres gastar dinero en ella. De tus amigos, a \(15\) les gustó la película y a \(50\) no les gustó. ¿Cuál es la variable aquí y de qué tipo es?
Solución
En primer lugar, se trata de datos categóricos. Se divide en dos categorías, "le gustó" y "no le gustó". Hay una variable en el conjunto de datos, que es la opinión de tus amigos sobre la película. De hecho, éste es un ejemplo de datos categóricos nominales.
Veamos otro ejemplo.
Volviendo al ejemplo de la película, supongamos que preguntas a tus amigos si les gusta o no una película determinada, y en qué ciudad viven. ¿Cuántas variables hay, y de qué tipo son?
Solución
Igual que en el ejemplo anterior, la opinión de tus amigos sobre la película es una variable, y es categórica. Como también has preguntado en qué ciudad viven tus amigos, aquí hay una segunda variable, y es el nombre del estado en el que viven. Sólo hay un número determinado de estados en EE.UU., por lo que hay un número finito de lugares que podrían enumerar como su estado. Así que el estado es una segunda variable categórica nominal sobre la que has recogido datos.
Cambiemos un poco lo que preguntas en tu encuesta.
Supongamos que has preguntado a tus amigos cuánto están dispuestos a pagar por ver la película, y les das tres rangos de precios: menos de 5$; entre 5$ y 10$; y más de 10$. ¿Qué tipo de datos son éstos?
Solución
Siguen siendo datos categóricos, porque has establecido las categorías en las que pueden responder tus amigos antes de pedirles que respondan a tu encuesta. Sin embargo, esta vez se trata de datos categóricos ordinales, ya que puedes ordenar las categorías por precio (que es un número).
Entonces, ¿cómo se comparan las variables categóricas?
Correlación entre variables categóricas
Supongamos que preguntas a tus amigos si les gusta o no una película determinada, y si pagaron menos de \(5 $), entre \(5 $) y \(10 $), o más de \(10 $) por verla. Se trata de dos variables categóricas, así que ¿cómo puedes compararlas? ¿Hay alguna forma de ver si lo que pagaron por ver la película influyó en lo mucho que les gustó?
Una cosa que puedes hacer es mirar gráficos de barras comparativos de los datos, o una tabla de dos vías. Puedes encontrar más información sobre ellos en el artículo Gráficos de barras. Otra cosa que puedes hacer es un tipo de prueba estadística más oficial, llamada prueba chi-cuadrado. Puedes encontrar este tema en el artículo Inferencia de distribuciones de datos categóricos.
Variables categóricas - Puntos clave
- Una variable se denomina variable categórica si los datos recogidos se clasifican en categorías.
- Las variables categóricasson variables cualitativas porque tratan de cualidades, no de cantidades.
- Una variable categórica se llama ordinal si lleva implícito un orden.
- Una variable categórica se denomina nominal si las categorías tienen un nombre.
- Entre las formas de ver las variables categóricas se incluyen las tablas y los gráficos de barras.
Aprende con 0 tarjetas de Variables categóricas en la aplicación StudySmarter gratis
¿Ya tienes una cuenta? Iniciar sesión
Preguntas frecuentes sobre Variables categóricas
Acerca de StudySmarter
StudySmarter es una compañía de tecnología educativa reconocida a nivel mundial, que ofrece una plataforma de aprendizaje integral diseñada para estudiantes de todas las edades y niveles educativos. Nuestra plataforma proporciona apoyo en el aprendizaje para una amplia gama de asignaturas, incluidas las STEM, Ciencias Sociales e Idiomas, y también ayuda a los estudiantes a dominar con éxito diversos exámenes y pruebas en todo el mundo, como GCSE, A Level, SAT, ACT, Abitur y más. Ofrecemos una extensa biblioteca de materiales de aprendizaje, incluidas tarjetas didácticas interactivas, soluciones completas de libros de texto y explicaciones detalladas. La tecnología avanzada y las herramientas que proporcionamos ayudan a los estudiantes a crear sus propios materiales de aprendizaje. El contenido de StudySmarter no solo es verificado por expertos, sino que también se actualiza regularmente para garantizar su precisión y relevancia.
Aprende más