Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Mendehall
Conceptos Mendehall
VARIABLES Y DATOS
1.1
En los capítulos 1 y 2 presentaremos algunas técnicas básicas de estadística descriptiva,
que es la rama de la estadística que se ocupa de describir conjuntos de mediciones, tanto
muestras como poblaciones. Una vez que el lector haya recolectado un conjunto de
mediciones, ¿cómo puede mostrar este conjunto en una forma clara, entendible y fácil
de leer? Primero, debe tener aptitud para definir lo que se entiende por medición o “datos”
y clasificar los tipos de datos que probablemente se encuentre en la vida real. Empeza-
mos por introducir algunas definiciones, términos nuevos en el lenguaje de la estadística
que es necesario saber.
Definición Una variable es una característica que cambia o varía con el tiempo y/o
para diferentes personas u objetos bajo consideración.
Por ejemplo, la temperatura corporal es una variable que cambia con el tiempo en una
sola persona; también varía de una persona a otra. La afiliación religiosa, el origen
étnico, el ingreso, la estatura, edad y número de hijos son todas ellas variables, es decir,
características que varían según la persona seleccionada.
En la Introducción definimos una unidad experimental o un elemento de la muestra
como el objeto en el que se toma una medición. Del mismo modo, podríamos definir una
unidad experimental como el objeto en el que se mide una variable. Cuando una variable
se mide en realidad en un conjunto de unidades experimentales, resulta un conjunto de
mediciones o de datos.
Si se genera una medición para toda unidad experimental en toda la colección, el con-
junto de datos resultante constituye la población de interés. Cualquier conjunto más
pequeño de mediciones es una muestra.
EJEMPL O 1.1 De entre todos los alumnos de una gran universidad se selecciona un conjunto de cinco
estudiantes y las mediciones se introducen en una hoja de cálculo, como la que se mues-
tra en la figura 1.1. Identifique los diversos elementos comprendidos en la generación de
este conjunto de mediciones.
Solución Hay diversas variables en este ejemplo. La unidad experimental en la que
se miden las variables es un alumno del plantel en particular, identificado en la columna
C1. Se miden cinco variables para cada estudiante: promedio de calificaciones (GPA),
género, año en la universidad, curso de maestría y número actual de unidades en las
que está inscrito. Cada una de estas características varía de un estudiante a otro. Si con-
sideramos las GPA de todos los estudiantes de esta universidad como la población de
interés, las cinco GPA de la columna C2 representan una muestra de esta población.
Si se hubiera medido el GPA de cada estudiante de la universidad, hubiéramos generado
toda la población de mediciones para esta variable.
www.FreeLibros.me
F I G U R A 1.1
●
Mediciones de cinco
estudiantes
Se puede ver que hay una diferencia entre una sola variable medida en una sola uni-
dad experimental y múltiples variables medidas en una unidad experimental como en el
ejemplo 1.1.
Definición Resultan datos univariados cuando se mide una sola variable en una
sola unidad experimental.
Definición Resultan datos bivariados cuando se miden dos variables en una sola
unidad experimental. Resultan datos multivariados cuando se miden más de dos varia-
bles.
Si se miden las temperaturas corporales de 148 personas, los datos resultantes son univa-
riados. En el ejemplo 1.1, cinco variables se midieron en cada estudiante, lo que resultó
en datos multivariados.
www.FreeLibros.me
TIPOS DE VARIABLES
1.2
Se pueden clasificar variables en una de dos categorías: cualitativas y cuantitativas.
Las variables cualitativas producen datos que se pueden clasificar de acuerdo a simi-
litudes o diferencias en clase; por lo tanto, con frecuencia se denominan datos categó-
ricos. Las variables como género, año y especialidad en el ejemplo 1.1 son variables
MI CONSEJO
cualitativas que producen datos categóricos. He aquí algunos otros ejemplos:
Cualitativo ⇔ “calidad”
o característica • Afiliación política: republicano, demócrata, independiente
Cuantitativo ⇔ “cantidad” • Clasificación de gusto: excelente, bueno, regular, malo
o número
• Color de un dulce M&M’S®: café, amarillo, rojo, anaranjado, verde, azul
Observe que hay una diferencia en los tipos de valores numéricos que pueden tomar
estas variables cuantitativas. El número de pasajeros, por ejemplo, puede tomar sólo los
valores x 0, 1, 2, …, mientras que el peso de un paquete puede tomar cualquier valor
mayor a cero, o sea 0 x . Para describir esta diferencia, definimos dos tipos de
variables cuantitativas: discretas y continuas.
Definición Una variable discreta puede tomar sólo un número finito o contable de
valores. Una variable continua puede tomar infinitamente muchos valores correspon-
dientes a los puntos en un intervalo de recta.
El nombre de discreta se refiere a las brechas discretas entre los posibles valores
MI CONSEJO
que la variable puede tomar. Variables como el número de miembros de una familia,
Discreta ⇔ “factible de el número de ventas de autos nuevos y el número de llantas defectuosas devueltas para
poner en lista”
cambio son todos ellos ejemplos de variables discretas. Por el contrario, variables como
Continua ⇔ “no factible de
poner en lista”
la estatura, peso, tiempo, distancia y volumen son continuas porque pueden tomar valo-
res en cualquier punto a lo largo de un intervalo de recta. Para cualesquier dos valores
que se escojan, un tercer valor siempre puede hallarse entre ellos.
EJEMPL O 1.2 Identifique cada una de las siguientes variables como cualitativas o cuantitativas:
1. El uso más frecuente de su horno de microondas (recalentar, descongelar, calen-
tar, otros)
2. El número de consumidores que se niegan a contestar una encuesta por teléfono
3. La puerta escogida por un ratón en un experimento de laberinto (A, B o C)
4. El tiempo ganador para un caballo que corre en el Derby de Kentucky
5. El número de niños en un grupo de quinto grado que leen al nivel de ese grado o
mejor
www.FreeLibros.me
Solución Las variables 1 y 3 son cualitativas porque sólo una cualidad o caracte-
rística se mide para cada individuo. Las categorías para estas dos variables se muestran
entre paréntesis. Las otras tres variables son cuantitativas. La variable 2, el número de
MI CONSEJO
consumidores, es una variable discreta que puede tomar cualquiera de los valores x
Es frecuente que las variables 0, 1, 2, …, con un valor máximo que depende del número de consumidores llamados.
discretas comprendan el
“número” de artículos de un
Del mismo modo, la variable 5, el número de niños que leen al nivel de ese grado, o
conjunto. mejor, pueden tomar cualquiera de los valores x 0, 1, 2, …, con un valor máximo que
depende del número de niños que haya en el grupo. La variable 4, el tiempo ganador para
un caballo del Derby de Kentucky, es la única variable continua de la lista. El tiempo
ganador, si pudiera medirse con suficiente precisión, podría ser 121 segundos, 121.5
segundos, 121.25 segundos o cualesquier valores entre dos tiempos cualesquiera que
hemos puesto en lista.
La figura 1.2 describe los tipos de datos que hemos definido. ¿Por qué debe el lector
preocuparse por diferentes clases de variables y los datos que generan? La razón es que
los métodos empleados para describir conjuntos de datos dependen del tipo de datos
que haya recolectado. Para cada uno de los conjuntos de datos recolectados, la clave
será determinar qué tipo de datos tiene y ¡cómo puede presentarlos en forma más clara
y entendible a su audiencia!
F I G U R A 1.2
●
Tipos de datos Datos
Cualitativos Cuantitativos
Discretos Continuos
Para este fin, se puede construir una tabla estadística que se puede usar para mostrar
los datos gráficamente como una distribución de datos. El tipo de gráfica que se escoja
depende del tipo de variable que se haya medido.
Cuando la variable de interés es cualitativa, la tabla estadística es una lista de las cate-
gorías siendo consideradas junto con una medida de la frecuencia con que se presenta
cada valor. Se puede medir “la frecuencia” en tres formas diferentes:
• La frecuencia o número de mediciones en cada categoría
• La frecuencia relativa o proporción de mediciones en cada categoría
• El porcentaje de mediciones en cada categoría
www.FreeLibros.me
Por ejemplo, si se pueden clasificar productos cárnicos de acuerdo con el tipo de carne
MI CONSEJO
utilizada, se pueden usar estas categorías: carne de res, pollo, marisco, carne de puerco,
Tres pasos para una pavo, otra. Para clasificar rangos de la facultad de una escuela, se pueden usar estas
distribución de datos:
categorías: profesor, profesor adjunto, profesor auxiliar, instructor, conferenciante, otro.
(1) datos sin elaborar ⇒
(2) tabla estadística ⇒ La categoría “otro” está incluida en ambos casos para tomar en cuenta la posibilidad de
(3) gráfica que una medición no se pueda asignar a una de las categorías anteriores.
Una vez que a las mediciones se les hayan dado categorías y se resumieron en una
tabla estadística, se puede usar ya sea una gráfica de pastel o una gráfica de barras para
mostrar la distribución de los datos. Una gráfica de pastel es la conocida gráfica circu-
lar que muestra la forma en que están distribuidas las medidas entre las categorías. Una
gráfica de barras muestra la misma distribución de medidas en categorías, con la altura
de la barra midiendo la frecuencia con la que se observa una categoría en particular.
EJEMPL O 1.3 En una encuesta respecto a la educación pública, a 400 administradores de escuelas se
les pidió calificaran la calidad de la educación en Estados Unidos. Sus respuestas están
resumidas en la tabla 1.1. Construya una gráfica de pastel y una de barras a partir de este
conjunto de datos.
Solución Para construir una gráfica de pastel, asigne un sector de círculo a cada
categoría. El ángulo de cada sector debe ser proporcional a la magnitud de las medicio-
nes (o frecuencia relativa) en esa categoría. Como un círculo contiene 360°, se puede
usar esta ecuación para hallar el ángulo:
Ángulo Frecuencia relativa 360°
Calificación de la educación en Estados Unidos
T A B L A 1 .1 hecha por 400 educadores
●
Calificación Frecuencia
A 35
B 260
C 93
D 12
Total 400
La tabla 1.2 muestra las calificaciones junto con las frecuencias, frecuencias relativas,
porcentajes y ángulos de sector necesarios para construir la gráfica de pastel. La figura
MI CONSEJO 1.3 muestra la gráfica de pastel construida a partir de los valores de la tabla. Mientras
Las proporciones suman 1;
que las gráficas de pastel usan porcentajes para determinar los tamaños relativos de
los porcentajes, 100; los las “rebanadas de pastel”, las de barras por lo general grafican frecuencia contra las cate-
ángulos de sector, 360°. gorías. Una gráfica de barras para estos datos se muestra en la figura 1.4.
www.FreeLibros.me
El impacto visual de estas dos gráficas es un poco diferente. La gráfica de pastel se usa
para mostrar las relaciones de las partes con respecto al todo; la gráfica de barras se
usa para destacar la cantidad real o frecuencia para cada categoría. Como las categorías
en este ejemplo son “calificaciones” ordenadas (A, B, C, D), no desearíamos reacomo-
dar las barras de la gráfica para cambiar su forma. En una gráfica de pastel, el orden de
presentación es irrelevante.
F I G U R A 1.3
●
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%
C
23.3%
B
65.0%
F I G U R A 1.4
●
Gráfica de barras para el
ejemplo 1.3 250
200
Frecuencia
150
100
50
0
A B C D
Calificación
EJEMP LO 1.4 Una bolsa de tamaño botana de dulces de cacahuate M&M’S contiene 21 dulces con los
colores que se indican en la tabla 1.3. La variable “color” es cualitativa, por lo que la
tabla 1.4 pone en lista las seis categorías junto con un total del número de dulces de cada
color. Las últimas tres columnas de la tabla 1.4 dan las tres diferentes medidas de con
qué frecuencia se presenta cada categoría. Como las categorías son colores y no tienen
un orden particular, se pueden construir gráficas de barras con muchas formas diferen-
tes con sólo reordenar las barras. Para enfatizar que el café es el color más frecuente,
seguido por el azul, verde y anaranjado, ordenamos las barras de mayor a menor y gene-
ramos la gráfica de barras usando el MINITAB en la figura 1.5. Una gráfica de barras en la
que las barras están ordenadas de mayor a menor se denomina gráfica de Pareto.
www.FreeLibros.me
FIGURA 1.5
●
Gráfica de barras MINITAB
6
para el ejemplo 1.4
5
4
Frecuencia
0
Café Azul Verde Anaranjado Amarillo Rojo
Color
1.3 EJERCICIOS
PARA ENTENDER LOS CONCEPTOS 1.2 ¿Cualitativa o cuantitativa? Identifique cada una
1.1 Unidades experimentales Identifique de las variables como cuantitativa o cualitativa:
las unidades experimentales en los que se miden las a. Tiempo para ensamblar un rompecabezas sencillo
variables siguientes: b. Número de estudiantes en un salón de clases de primer
a. Género de un estudiante año
b. Número de errores en un examen de medio semestre c. Calificación de un político recién electo (excelente,
c. Edad de un paciente con cáncer bueno, regular, malo)
d. Número de flores en una planta de azalea d. Estado en que vive una persona
e. Color de un auto que entra a un estacionamiento
www.FreeLibros.me
1.3 ¿Discreta o continua? Identifique las siguientes 1.8 Tiempos de supervivencia al cáncer Un
variables cuantitativas como discretas o continuas: investigador médico desea estimar el tiempo de
a. Población en una región particular de un país supervivencia de un paciente, después del inicio
b. Peso de periódicos recuperados para reciclar en un de un tipo particular de cáncer y después de un régimen
solo día particular de radioterapia.
c. Tiempo para completar un examen de sociología a. ¿Cuál es la variable de interés para el investigador
médico?
d. Número de consumidores en una encuesta de 1000
que consideran importante aplicar leyenda nutrimental b. ¿La variable del inciso a) es cualitativa, cuantitativa,
en productos alimenticios discreta o cuantitativa continua?
c. Identifique la población de interés para el investigador
1.4 ¿Discreta o continua? Identifique cada una de las
médico.
variables cuantitativas como discretas o continuas.
d. Describa la forma en que el investigador podría
a. Número de accidentes en botes en un tramo de 50
seleccionar una muestra de entre la población.
millas del río Colorado
e. ¿Qué problemas podrían surgir al muestrear desde esta
b. Tiempo para completar un cuestionario
población?
c. Costo de una lechuga
1.9 Nuevos métodos de enseñanza Un investigador
d. Número de hermanos y hermanas que tenga el lector
educacional desea evaluar la efectividad de un nuevo
e. Rendimiento en kilogramos de trigo para un terreno de método de enseñanza de lectura a estudiantes sordos. El
1 hectárea de un trigal logro al final de un periodo de enseñanza es medido por
1.5 Estacionamiento en un plantel Se seleccionan la calificación de un estudiante en un examen de lectura.
seis vehículos, de entre los que tienen permiso para a. ¿Cuál es la variable a medir? ¿Qué tipo de variable es?
estacionarse, y se registran los datos siguientes:
b. ¿Cuál es la unidad experimental?
Distancia de c. Identifique la población de interés para el
viaje en una Antigüedad
dirección del vehículo experimentador.
Vehículo Tipo Marca ¿Colectivo? (millas) (años)
1 Auto Honda No 23.6 6 TÉCNICAS BÁSICAS
2 Auto Toyota No 17.2 3 1.10 Cincuenta personas se agrupan en cuatro categorías,
3 Camión Toyota No 10.1 4
4 Van Dodge Sí 31.7 2 A, B, C y D, y el número de personas que caen en cada
5 Moto- Harley- No 25.5 1 categoría se muestra en la tabla:
cicleta Davidson
6 Auto Chevrolet No 5.4 9 Categoría Frecuencia
A 11
a. ¿Cuáles son las unidades experimentales? B 14
b. ¿Cuáles son las variables que se miden? ¿Qué tipos de C 20
variables son? D 5
c. ¿Estos datos son univariados, bivariados o multivariados? a. ¿Cuál es la unidad experimental?
1.6 Presidentes de Estados Unidos Un conjunto b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
de datos contiene las edades al fallecimiento de cada cuantitativa?
uno de los anteriores 38 presidentes de Estados Unidos c. Construya una gráfica de pastel para describir los
ahora desaparecidos. datos.
a. ¿Este conjunto de mediciones es una población o una d. Construya una gráfica de barras para describir los
muestra? datos.
b. ¿Cuál es la variable que se mide? e. ¿La forma de la gráfica de barras del inciso d)
c. ¿La variable del inciso b) es cuantitativa o cualitativa? cambia, dependiendo del orden de presentación
1.7 Actitudes del electorado Usted es candidato a la de las cuatro categorías? ¿Es importante el
legislatura de su estado y desea hacer una encuesta de las orden de presentación?
actitudes del electorado, respecto a las probabilidades que f. ¿Qué proporción de las personas está en la categoría
tenga usted para ganar. Identifique la población que es de B, C o D?
interés para usted y de la que le gustaría seleccionar una g. ¿Qué porcentaje de las personas no está en la
muestra. ¿En qué forma esta población depende del tiempo? categoría B?
www.FreeLibros.me
1.11 Jeans Un fabricante de jeans (pantalones Los resultados estuvieron basados en una muestra tomada
vaqueros) tiene plantas en California, Arizona y Texas. en los días 16, 17 y 18 de mayo de 2006, de 900 votantes
Un grupo de 25 pares de jeans se selecciona al azar de registrados en todo el país.
entre la base de datos computarizada, registrándose el a. Si los entrevistadores estuvieran planeando usar estos
estado en el que se produce: resultados para pronosticar el resultado de la elección
CA AZ AZ TX CA presidencial de 2008, describa la población de interés
CA CA TX TX TX para ellos.
AZ AZ CA AZ TX
CA AZ TX TX TX b. Describa la población real de la cual se sacó la
CA AZ AZ CA CA muestra.
c. Algunos entrevistadores prefieren seleccionar
a. ¿Cuál es la unidad experimental?
una muestra de “probables” votantes. ¿Cuál es la
b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
diferencia entre “votantes registrados” y “probables
cuantitativa?
votantes”? ¿Por qué es esto importante?
c. Construya una gráfica de pastel para describir los
d. La muestra seleccionada por los entrevistadores, ¿es
datos.
representativa de la población descrita en el inciso a)?
d. Construya una gráfica de barras para describir los Explique.
datos.
1.13 ¿Desea ser presidente? ¿Le gustaría ser
e. ¿Qué proporción de los jeans se hace en Texas?
presidente de Estados Unidos? Aun cuando muchos
f. ¿Cuál estado produjo más jeans del grupo? adolescentes piensan que podrían llegar a ser presidente,
g. Si se desea averiguar si las tres plantas produjeron muchos no desean el trabajo. En una encuesta de opinión
iguales números de jeans, o si una produjo más jeans realizada por ABC News, casi 80% de los adolescentes
que las otras, ¿cómo se pueden usar las gráficas de las 2
no estaban interesados en el trabajo. Cuando se les
partes c y d para ayudar? ¿Qué conclusiones puede el preguntaba: “¿Cuál es la principal razón por la que no
lector sacar de estos datos? querría ser presidente?” dieron estas respuestas:
www.FreeLibros.me
Ajuste de vacaciones
Un
día
Unos
cuantos
días
Ningún
tiempo
www.FreeLibros.me