Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva para Psicólogos Psicologia
Estadística Descriptiva para Psicólogos Psicologia
ESCUELA DE ESTADÍSTICA
GUÍA DIDÁCTICA
ESTADÍSTICA PARA PSICÓLOGO
_______________________________________________________________________________________
Autor:
Leonido Rosario Peña, MA
ii
PRÓLOGO
Este material didáctico se ha escrito para satisfacer la necesidad de tener una guía que sirva no
solo para tener las ideas principales de la estadística, sino además que facilite el trabajo al
estudiante en el sentido que pueda trabajar directamente, sin tener que perder tiempo copiando
ejercicios. Esta guía no pretende sustituir ningún libro de texto formal, sino más bien es la
compilación de ejercicios y ejemplos de diferentes libros.
En este material se puede trabajar los ejemplos y ejercicios directamente, además las gráficas
tienen los espacios correspondientes para realizarlas en el mismo. Esta guía tiene seis capítulos
desarrolladas conforme a las unidades del programa de la asignatura Estadística para Psicólogo.
Cada dos unidades se encuentran dos prácticas que ayudaran al estudiante a afianzar los
conocimientos adquiridos, tantos conceptuales como procedimentales y actitudinales.
Los contenidos desarrollados en esta guía pueden ser trabajados con el programa Excel y su
complemento MegaStat, además se usarán calculadoras científicas como herramientas para el
manejo de cálculo numérico, pero se hará énfasis en el análisis estadístico.
iii
ÍNDICE GENERAL
PRÓLOGO ii
✓ Comunica
Se expresa utilizando los
Fuente: Ministerio de Educación conceptos básicos estadísticos.
En el mundo en que vivimos, donde las personas somos diferentes,
✓ Modela y Representa
pensamos diferentes y nos comportamos de manera distinta, son
Modela e interpreta situaciones de
diversas las variables que confluyen, estando muchas de ellas la vida diaria a través de la
relacionadas entre sí. estadística.
Investigación asignada 1
a) ¿Cómo surge la estadística?
Divisiones de la Estadística
Para un mejor estudio de esta ciencia, la estadística se ha dividido en dos ramas las cuales son:
Estadística Descriptiva y Estadística Inferencial.
La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo dichas
deducciones, tales como:
a) Pruebas de estimación puntual o de intervalos de confianza.
b) Pruebas de hipótesis.
c) Pruebas paramétricas y no paramétricas.
d) Análisis de correlación y de regresión.
e) Series cronológicas.
f) Análisis de varianza.
g) Otros.
4 Estadística Descriptiva Para Psicólogo
Ejemplos Estadística Inferencial
• Encuestas políticas.
Verificando lo aprendido 2
La empresa de publicidad PUBLICART, con sede en Santiago, solicitó a una muestra de 1,960
consumidores que probaran un platillo con pollo recién elaborado por GOODCHICKEN. De
las 1,960 personas de la muestra, 1,176 dijeron que comprarían el alimento si se comercializaba.
Muestra:
Es un subconjunto de la población. Si la muestra es
aleatoria y lo suficientemente grande, se puede
utilizar la información obtenida de la muestra para
hacer inferencias sobre la población.
Verificando lo aprendido 3
El CURSA ha entrevistado 100 estudiantes de informática para averiguar el tiempo semanal
medio que dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
6 Estadística Descriptiva Para Psicólogo
❖ Parámetro
En Estadística, un parámetro es un modelo de la realidad, con el que se comparan los datos
reales obtenidos, resumiendo la información obtenida y permitiendo predecir.
Ejemplo de parámetro
En el caso de la presión arterial, se considera normal si es de 120/80. Si mide 140/90 o más se
considera que el paciente sufre hipertensión arterial.
b) ¿Cuál es el parámetro?
❖ Estadístico
En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir características de una población o
modelo estadístico, que sirve para estimar determinado parámetro de la distribución de la que
procede la muestra.
Ejemplo de estadístico
En el caso de la presión arterial, se considera normal si es de 120/80. Si una persona llega a un
hospital y la presión arterial mide 140/90 o más, ¿cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 7
❖ Datos Estadísticos
Los datos estadísticos, son los valores que se obtienen al llevar a cabo un estudio. Se trata del
producto de la observación del fenómeno que se pretende analizar. Son el conjunto de
información recolectada.
derrota – derrota – derrota – victoria – derrota – victoria – victoria – derrota – derrota – derrota
– derrota- derrota – victoria – derrota – victoria.
Ejemplos
-La estatura -El peso -Estado civil
❖ Variable independiente
Es aquella que es controlada en forma sistemática por el investigador.
❖ Variable dependiente
La variable dependiente en un experimento es la que el investigador mide para determinar el
efecto de la variable independiente.
Verificando lo aprendido 5
Analice el siguiente experimento, y luego responda las 5 preguntas.
Un psicólogo de la salud está interesado en saber si la motivación del temor es eficaz para
reducir la incidencia del hábito de fumar. Cuarenta adultos fumadores son seleccionados de
entre los individuos residentes en la ciudad en donde trabaja el psicólogo. A 20 de ellos se les
pide fumar un cigarrillo, después ven una atemorizante película acerca de cómo el hábito de
fumar provoca cáncer; vívidas imágenes de los pulmones y otros órganos internos enfermos de
fumadores fallecidos se muestran en un esfuerzo de generar temor a fumar en estos sujetos. El
otro grupo recibe el mismo tratamiento, excepto que ellos ven una película neutra que no está
relacionada con el tabaquismo. Durante dos meses posteriores a la proyección de la película, el
experimentador mantiene registros de número de cigarrillos que los participantes fuman a
diario. Después calcula el promedio de cigarrillos fumados a diario de cada grupo después de
la exhibición de la película, y compara una media con la otra para determinar si la película
atemorizante surtió efectos sobre el hábito de fumar.
Preguntas
1. ¿Cuál es la variable independiente?
3. ¿Cuál es la población?
4. ¿Cuál es la muestra?
5. ¿Cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 9
❖ Variables categóricas o cualitativas
Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de una persona, animal u objeto. De esta manera, las variables
cualitativas permiten expresar un atributo, cualidad o categoría no numérica.
Las variables cualitativas se clasificar por dos niveles de medición: Nominal y Ordinal, mientras que las
variables cuantitativas pueden tener medición de intervalo y de razón.
Ejemplos
a) La filiación política de los participantes en una encuesta.
b) Nacionalidad
c) Religión
Ejemplos
a) La clasificación de hoteles por estrellas.
b) Posición en una carrera deportiva.
c) Satisfacción con un servicio al cliente.
Ejemplos
a) Distancias
b) Precios
c) Peso
12 Estadística Descriptiva Para Psicólogo
Resumen de los niveles de medición de las variables
Nominal Ordinal Intervalo Razón
Los datos sólo se Los datos se ordenan Diferencias Punto 0 y razón entre
clasifican significativas entre valores significativas
valores
Ejemplo Ejemplo Ejemplo Ejemplo
• Números de • El número de lista • Temperatura • Número de pacientes
camisetas de en las clases de atendidos.
los jugadores. bachillerato.
Verificando lo aprendido 7
Esta etapa consiste en determinar los métodos de recolección adecuado, preparar los instrumentos de
recolección, prueba del método y de los instrumentos de recolección seleccionados y realizar la
recolección de los datos.
1.4 Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una
constante.
a) El número de letras del alfabeto. ____________________
e) Su peso____________________
Práctica 1. Conceptos Fundamentales de la Estadística 17
1.5 Analice si las siguientes variables son discretas o continuas.
a) Número de materias que usted ha cursado en su carrera. ________________
b) Peso del contenido de las cajas de cereal. __________________
c) Número de libros que usted leyó el año pasado (ojalá que hayan sido muchos).
_______________
d) Número de jonrones conectados por Samy Sosa en 1999. ____________________
e) Velocidad de un automóvil en km h .________________________
b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima
calificación en un examen reciente. _________________
d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población.
_____________________
e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de
la población están relacionados. ____________________
1.7 Roger Amster enseña un curso de inglés para 40 estudiantes. En la clase de ayer, preguntó a los
cinco jóvenes que siempre se sientan en la parte posterior del aula si les gustaría que “A Tale of
Two Cities” fuera la tarea de lectura para la clase siguiente. Tres de los cincos dijeron que “si”.
a) Identifique la población y la muestra en este caso.
b) ¿Es probable que sea una muestra representativa? De no ser así, ¿Por qué no?
18 Estadística Descriptiva Para Psicólogo
1.8 Utilice el sentido común para determinar si el acontecimiento descrito es: imposible;
posible, pero muy improbable; posible y probable.
a) Multa por exceso de velocidad. Mientras conducía a su casa en Connecticut, David fue multado
por conducir a 250 millas por hora en una ruta con un límite de velocidad de 55 millas por
hora._____________________
b) Semáforos. Mientras conducía por la ciudad, Mario se encontró con tres semáforos consecutivos
y todos estaban en verde.__________________
c) Día de Acción de Gracias. El año próximo, el Día de Acción de Gracias caerá
lunes._____________________
d) Suprema Corte. Todos los magistrados de la Suprema Corte de Estados Unidos tienen la misma
fecha de cumpleaños. ______________________
e) Calculadoras. Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus, todas
funcionan adecuadamente. _________________
f) Dados de la suerte. Steve Wynn lanzó un par de dados y obtuvo un total de 14
puntos._________________________
g) Máquina tragamonedas. Wayne Newton obtuvo el premio mayor en la máquina tragamonedas en
10 intentos.____________________
1.9 La directora de producción para la planta de Ford Motor Company, debe informar a su
superior sobre el número de días promedio que los empleados de la planta se ausentan del
trabajo. Sin embargo, la planta emplea más de dos mil trabajadores, y la directora de
producción no tiene tiempo de revisar los registros personales de cada empleado. Como
asistente usted debe decidir cómo puede ella obtener la información necesaria.
a) ¿Qué consejo podría darle?
1.10 ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos:
a) Un sistema para evaluar a los empleados con base en el número de días que faltan al
trabajo.
c) Un sistema para registrar la población de las ciudades en las cuales viven los clientes.
Práctica 1. Conceptos Fundamentales de la Estadística 19
1.11 ¿En cuál escala de medida puede expresarse cada una de estas variables?
a) Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No
tan malo”, “Bueno”, “Maravillosos”, y “dios griego”
b) Los estudiantes en una universidad están clasificados por profesión, tales como marketing,
administración y contaduría.
e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados.
1.13 ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los periódicos?
a) El número de periódicos vendidos todos los domingos durante 2011.
b) ¿Cuál es la población?
d) ¿Sería conveniente usar promedios o porcentajes para resumir los datos de estas preguntas?
e) De las personas que respondieron, 29% dijo que su salud era excelente. ¿Cuántos fueron los individuos
que dieron esta respuesta?
1.15 El Departamento de Comercio informa haber recibido las siguientes solicitudes para
concursar por el Malcolm Baldrige Nacional Quality Award: 23 de empresas fabricantes
grandes, 18 de empresas grandes de servicios y 30 de negocios pequeños.
a) ¿Es el tipo de empresa una variable cualitativa o cuantitativa?
1.16 En un estudio sobre los suscriptores de Business Week de Estados Unidos se recogen
datos de una muestra de 2861 suscriptores. Cincuenta y nueve por ciento de los
encuestados señalaron tener un ingreso de $75 000 o más y 50% indicaron poseer una
tarjeta de crédito de American Express.
a) ¿Cuál es la población de interés en este estudio?
c) ¿Es la posesión de una tarjeta de crédito de American Express una variable cualitativa
o cuantitativa?
d) Describa cualquier inferencia estadística posible para Business Week con base en esta
encuesta.
Práctica 1. Conceptos Fundamentales de la Estadística 21
1.17 En otoño de 2003, Arnold Schwarzeneger disputó al gobernador Gray Davis la
gobernación de California. En una encuesta realizada entre los votantes registrados se
encontró que Arnold Schwarzeneger iba a la cabeza con un porcentaje estimado de 54%
(Newsweek, 8 de septiembre de 2003).
a) ¿Cuál fue la población en este estudio?
1.18 La UASD ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que
dedican a navegar por internet.
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es la muestra?
c) ¿Cuál es el estadístico?
b) ¿Cuál es el 5% de 5020?
a) ¿Cuál es el número real de usuarios de Internet que afirmaron que compran en línea de
manera frecuente u ocasional?
b) De los 734 usuarios de internet encuestados por Gallup, 323 dijeron que de manera
frecuente u ocasional realizan planes de viaje consultando información en línea. ¿Cuál
es el porcentaje de personas que afirmaron que de manera frecuente u ocasional realizan
planes de viaje consultando información en línea?
1.23 En una encuesta que realizó Gallup con 976 adultos, 68 dijeron que consumen una
bebida alcohólica al día.
b) De los 976 adultos encuestados, el 32% dijo que nunca bebe. ¿Cuál es el número real
de adultos encuestados que dijeron que nunca beben?
CAPÍTULO 2
Organización de los Datos
Distribuciones de Frecuencias y su Representación Gráfica
Competencias
Específicas
➢ Razona y argumenta.
Construye e interpreta
distribuciones de frecuencias
cualitativas y cuantitativas.
Organiza e interpreta datos
cualitativos o cuantitativos en una
gráfica apropiada.
➢ Comunica
Presenta cada paso para la
construcción de una distribución de
Fuente: Ministerio de Educación
frecuencias cualitativa o
Una vez que definimos con cuidado un problema, necesitamos cuantitativa.
recoger datos. A menudo el número de observaciones Presenta cada paso para la
recogidas es tan grande que los resultados efectivos del estudio construcción de una gráfica de
no están claros. Queremos reducir lo más posible una masa de acuerdo a la naturaleza de los datos
y al tipo de representación que se
datos, evitando al mismo tiempo la posibilidad de ocultar
desee.
características importantes por reducirlos excesivamente.
Para lograr el punto de equilibrio desafortunadamente no ➢ Modela y Representa
existe un método único, sin embargo, la línea de ataque Modela e interpreta situaciones de
la vida diaria a través de las
adecuada normalmente es específica de cada problema y distribuciones de frecuencias y sus
depende de dos factores: el tipo de datos y el fin del estudio. gráficas.
Se ha dicho que una imagen vale más que mil palabras. ➢ Conecta
Asimismo, un gráfico vale más que mil cifras. Utiliza las distribuciones y las
gráficas para resumir un conjunto
Una vez los datos han sido recolectados, siempre debemos de datos y explicarlo de una manera
sencilla.
preguntarnos: ¿cómo se pueden organizar? ¿Cómo se pueden
graficar? ¿Qué nos sugiere la gráfica? ➢ Resuelve problemas
Resuelve problemas del contexto
En esta unidad, se introducen tablas y gráficas adecuadas, educativo que impliquen
como distribuciones de frecuencia, gráficos de barras, gráficos construcciones de distribuciones y
de gráficas.
de tarta, diagramas de pareto, gráficos de series temporales,
histogramas, diagramas de tallo y hoja, ojivas y otras. Nuestro ➢ Utiliza herramientas
objetivo es resumir los datos de manera que tengamos una tecnológicas
imagen clara y precisa. Usa Excel, con el complemento
MegaStat y otras herramientas
Paul Newbold tecnológicas para construir
distribuciones de frecuencias y
gráficas.
Estadística Descriptiva Para Psicólogo 25
Introducción
Cuando la cantidad de información recolectada es relativamente grande, para responder a
cuestionantes que impliquen generalizaciones de los datos originales, es necesario tomar en
cuenta las distribuciones de frecuencias y las gráficas, que son dos formas de resumir de
manera genérica los datos originales.
frecuencia de la clase
frecuencia relativa = 100%
Total de datos
Estadística Descriptiva Para Psicólogo 26
2.1 La siguiente tabla muestra las respuestas (ficticias) de 60 pacientes postoperados, a quienes se solicitó
calificar su percepción del dolor en una escala ordinal de cuatro puntos, como parte de un estudio de
manejo del dolor. a) ¿Algunos niveles de dolor dominaron? b) ¿Era común el dolor severo? c) ¿Qué
proporción de pacientes tenía dolor muy severo? d) ¿Qué proporción sufría de dolor leve o de menor
intensidad?
Mediciones de dolor percibido de 60 pacientes.
01 Moderado 31 Muy Severo
02 Muy Severo 32 Muy Severo
03 Leve 33 Moderado
04 Leve 34 Muy Severo
05 Leve 35 Moderado
06 Muy Severo 36 Moderado
07 Moderado 37 Muy Severo
08 Muy Severo 38 Muy Severo
09 Leve 39 Leve
10 Leve 40 Muy Severo
11 Moderado 41 Leve
12 Muy Severo 42 Muy Severo
13 Severo 43 Leve
14 Muy Severo 44 Muy Severo
15 Moderado 45 Leve
16 Severo 46 Leve
17 Muy Severo 47 Leve
18 Muy Severo 48 Muy Severo
19 Muy Severo 49 Leve
20 Muy Severo 50 Muy Severo
21 Muy Severo 51 Muy Severo
22 Muy Severo 52 Muy Severo
23 Muy Severo 53 Muy Severo
24 Moderado 54 Muy Severo
25 Muy Severo 55 Muy Severo
26 Leve 56 Leve
27 Muy Severo 57 Leve
28 Leve 58 Leve
29 Muy Severo 59 Leve
30 Muy Severo 60 Leve
➢ Construye una distribución de frecuencia y responde las preguntas que se realizaron anteriormente:
Construcción de la distribución
2.2 Usa la distribución anterior y agrega una columna de frecuencia acumulada y otra de frecuencia
acumulada relativa.
Construcción de la distribución
Ejemplo 2.4
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 23
Aves 35
Reptiles 10
Anfibios 26
Peces 56
Total 150
Ejercicio 2.1
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 69
Aves 77
Reptiles 14
Anfibios 9
Peces 71
Total 240
Estadística Descriptiva Para Psicólogo 28
➢ Distribuciones de frecuencias cuantitativas.
Es una agrupación de datos cuantitativos en clases mutuamente excluyentes que muestra el número
de observaciones en cada clase.
Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra aleatoria simple
de 20 mujeres y de otra muestra aleatoria simple de 30 hombres, con los resultados que se presentan
a continuación:
Pulsos (latidos por minutos) de hombres y mujeres
Mujeres
60 72 68 64 80 64 68 68 80 76
76 76 80 104 88 60 76 72 72 88
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
El pulso es sumamente importante, ¡ya que es muy difícil sobrevivir sin él! Los médicos utilizan el
pulso para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado elevada
o baja, esto podría indicar que existe algún problema médico; por ejemplo, un pulso muy alto podría
indicar que el paciente tiene una infección o que está deshidratado.
Un problema surge cuando trabajamos con grandes conjuntos de datos, para poder interpretar los
datos necesitamos a menudo organizarlos y resumirlos elaborando una tabla llamada distribución
de frecuencias.
Antes de seguir trabajando con la distribución de frecuencias cuantitativas es necesario dominar algunos
conceptos:
Clase. Cada categoría de la distribución de frecuencias. (La tabla #1 tiene 5 clases)
Frecuencia. La cantidad de datos que caen en cada clase. (En la tabla #1 los números 7, 7,…, son las
frecuencias)
Límites de clase. Son los valores extremos de cada clase. (Los números 60 y 69 son los límites de la primera
clase)
Rango. Es la diferencia entre el dato máximo y el mínimo. ( R = xmax − xmin ) Rv = 104 − 60 = 44
Anchura de clase. Es la diferencia entre el límite inferior de una clase y el límite inferior de la siguiente
clase. ( A = li 2 − li1 ) (10 es la amplitud, ya que 70-60 =10). Para calcular la amplitud también usaremos la
fórmula R
A=
C
Tabla #1
Latidos por minutos de las mujeres
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Capítulo 2. Organización de los datos 29
➢ Características de una tabla de distribución de frecuencias
Al construir una tabla de distribución de frecuencias para un conjunto de datos específicos, se
deben observar las características siguientes:
1. Las clases deben ser mutuamente excluyentes, es decir, cada dato sólo puede caer en una
clase. No debe haber traslape entre las clases: (15 y menos de 20, y 19 y menos de 25), en
estas dos clases hay traslape, ¿por qué?
2. El conjunto de clases debe ser exhaustivo, es decir, debe incluir todos los datos
considerados.
3. Si es posible las clases deben tener la misma amplitud.
4. La elección de la cantidad de clases a utilizar es un proceso subjetivo, esta debe ser
proporcional a la cantidad de datos. En general es conveniente elegir entre 5 y 20 clases.
En muchos de los casos usaremos la fórmula: C = 1 + 3.33log n , para aproximar la cantidad
de clases a utilizar.
5. Cuando sea posible las amplitudes de clases deben ser números redondos, es decir, 5,
10,15,…, 100.
Ahora veamos cómo se construye una distribución de frecuencia utilizando los pulsos de los
latidos por minutos de las 40 mujeres.
1. Rango.
R = xmax − xmin
Total
Capítulo 2. Organización de los datos 31
Formas equivalentes y similar de representar una distribución, veamos:
Formato anterior
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Forma similar
Pulso Frecuencia
60 – 69 7
70 – 79 7
80 – 89 5
90 – 99 0
100 – 109 1
Total 20
Estadística Descriptiva Para Psicólogo 32
Ejercicio 2.2
Construye una distribución de frecuencias para los datos dados a continuación:
Pulsos (latidos por minutos) de hombres
Hombres
68 64 80 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
Ordene los datos de menor a mayor
PASOS:
1. Busco el rango.
R = xmax − xmin
PASOS:
1. Busco el rango.
R = xmax − xmin
30
Capítulo 2. Organización de los datos 35
Interpretación de una distribución de frecuencias.
Si tomamos la distribución del peso de los 30 hombres, se pueden extraer informaciones
interesantes.
Pesos f f r (%) F Fr (%)
110 y menos de 125 4 13.3 4 13.3
125 y menos de 140 6 20 10 33.3
140 y menos de 155 9 30 19 63.3
155 y menos de 170 5 16.7 24 80
170 y menos de 185 4 13.3 28 93.3
185 y menos de 200 0 0 28 93.3
200 y menos de 215 2 6.7 30 100
30
a) ¿Cuántos hombres tienen un peso entre 155 y menos de 170 libras?
Existen tres formas diferentes de presentar los datos estadísticos, que son: Presentación
escrita, presentación tabular y presentación gráfica.
Los elementos básicos de todo cuadro son: Título, encabezados, cuerpo del cuadro, columna
matriz y Fuente.
1. Título: 2. Encabezados:
Sirve para describir el contenido del cuadro. Son los distintos subtítulos que se colocan en
Se debe indicar que el título debe responder las la parte superior de cada columna.
inquietudes: ¿qué son los datos?, ¿dónde?,
¿cuándo? y ¿cómo se recogieron?
(Gómez, 2008)
5. Fuente:
Indica la procedencia de los datos. Cuando se usa una tabla con informaciones que ya han sido
elaboradas por otros, es un deber señalar la institución que las recopiló y presentó, Sin
embargo, si las informaciones fueron recopiladas y presentadas por la misma persona no es
necesario señalar la fuente.
De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las
siguientes:
a. Gráfica de barras
b. Gráfica de pastel
c. Histograma
d. Polígono de frecuencias
e. Ojivas
f. Gráfica lineal
g. Tallo y hojas
Estadística Descriptiva Para Psicólogo 38
a. La gráfica de barras.
Representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos.
Los rectángulos adyacentes tienen una separación entre ellos. Este tipo de gráfico se usa para
representar datos cualitativos.
Ejemplo 2.8
Represente por medio de un gráfico de barras las ventas de Grupo Motors por locación
manualmente y luego utilizando Excel.
Locación Números de autos
Toyota 52
Ford 40
Honda 45
Peugeot 43
Total 180
1. Copie estos datos a
Excel.
2. Seleccionamos las
celdas que
queremos graficar.
Capítulo 2. Organización de los datos 39
3. Insertamos el gráfico
Ejemplo 2.9
Construye una gráfica de pastel con Excel usando la información de la tabla siguiente.
Gastos de la lotería del estado de Ohio en 2009
Uso del dinero de las ventas Cantidad ( en millones de dólares)
Premios 1460.0
Educación 702.3
Bonos 150
Gastos 124.3
Total 2436.6
Siguiendo los pasos para
graficar en vez de las barras Gastos de la lotería de Ohio en 2009
usamos el circular y
tendríamos.
6% 5%
Análisis gráfico
Dado que cada rebanada del
pastel representa la porción
relativa de cada componente, es
posible compararlas con
facilidad: Premios Educación Bonos Gastos
✓ El gasto más cuantioso de la
lotería se canaliza hacia los
premios (60%) Nota:
✓ Cerca de la tercera parte En la mayoría de los casos, las gráficas de pastel son las más
(29%) de los fondos informativas cuando se trata de comparar la diferencia relativa
recaudados se transfieren a en el porcentaje de observaciones de cada una de las variables
educación. de la escala nominal.
✓ Los gastos de operación
apenas significan 5% de los
fondos recaudados.
Capítulo 2. Organización de los datos 41
Ejercicio 2.6
DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor
adicional, Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en
la preferencia de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una
bebida de Lima-limón. Se pidió a 270 consumidores seleccionados de forma aleatoria que
degustaran una prueba y eligieran la bebida que más les gustaba. Los resultados aparecen en
la siguiente tabla:
Bebida Número
Cola-Plus 60
Coca-Cola 90
Pepsi 90
Lima-limón 30
Total 270
a) ¿Son los datos de naturaleza cuantitativa o cualitativa?
Gráfica de pastel
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 42
c. Histograma
Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cuya
base es proporcional a la anchura de cada clase (Valor del intervalo) y cuya altura es
proporcional a la frecuencia. En este tipo de gráfico se representan datos cuantitativos.
Ejemplo 2.10
Representa por medio de un histograma la siguiente distribución de frecuencias, usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Después de buscar las marcas de clases se grafican estas en el eje x y las frecuencias en el
eje y. El gráfico debe quedar así:
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 43
Ejercicio 2.7
Representa por medio de un histograma la distribución de los pesos de 100 estudiantes del
CURSA que se muestra a continuación (usando Excel).
Peso (en libras) Cantidad de estudiantes
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 44
d. Polígono de frecuencias
Estrechamente relacionado con el histograma, este consiste en segmentos de líneas que
conectan los puntos formados por las intersecciones de las marcas de clases y las frecuencias
de clase.
Luego de graficar los puntos, se agregan dos clases, una en cada extremo de la escala de
valores observados. Éstas contienen cero observaciones, pero permiten que el polígono llegue
al eje horizontal en ambos extremos de la distribución.
Ejemplo 2.11
Representa por medio de un polígono de frecuencias la siguiente distribución de frecuencias,
manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores Marcas de clases (x)
30- menos de 40 2 30 + 40 70
x= = = 35
2 2
40- menos de 50 9 45
50- menos de 60 15 55
60- menos de 70 28 65
70- menos de 80 12 75
80- menos de 90 6 85
90-menos de 100 3 95
Usando Excel
➢ Análisis gráfico
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Velocidad (MPH) -------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Capítulo 2. Organización de los datos 45
Ejercicio 2.8
Representa por medio de un polígono de frecuencia la distribución de los pesos de 100
estudiantes del CURSA que se muestra a continuación (manualmente y usando Excel).
Peso (en libras) Cantidad de estudiantes x
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2
➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 46
e. Ojiva
Recordemos que una distribución de frecuencias acumuladas nos permite ver cuántas observaciones
están por encima de ciertos valores. La gráfica de una distribución de frecuencias acumuladas se
conoce como ojiva. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza
fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje
vertical.
Ejemplo 2.12
Represente en una ojiva “menor que” la siguiente distribución, manualmente y usando Excel.
Salarios por hora (Dólares) Número de empleados
8 – 10 3
10 – 12 7
12 – 14 4
14 – 16 1
Solución:
Para lograr esto, es necesario transformar la distribución tomando en cuenta los límites
inferiores de cada clase y al final añadiremos una clase para que no queden observaciones
fuera.
Clases Frecuencias acumuladas
Menor que 8 0 ¿Por qué?
Menor que 10 3
Menor que 12 10
Menor que 14 14
Menor que 16 15
Usando Excel: Responda las siguientes
preguntas de acuerdo con
el gráfico.
a) ¿Cuántos empleados
ganan menos de 10
dólares por hora?
b) ¿Cuántos empleados
ganan menos de 12
dólares por hora?
c) ¿Cuántos empleados
ganan menos de 14
dólares por hora?
d) ¿A cuántos empleados
Salario por hora
se les investigó el
salario?
Capítulo 2. Organización de los datos 47
Ejercicio 2.9
Representa en una ojiva menor la siguiente distribución, manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad (MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Clases (menor que) Frecuencias acumuladas
300
250
200
150
100
50
0
Marzo Abril Mayo Junio Julio Agosto Septiembre
➢ Análisis gráfico
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 49
Ejercicio 2.10
La siguiente distribución muestra los quintales de arroz vendidos por una factoría los primeros
6 meses del año 2000. Represente la información en una gráfica de línea:
Año Produción Gráfica de líneas
Enero 40
Febrero 46
Marzo 56
Abril 63
Mayo 73
Junio 78
Julio 60
Agosto 67
➢ Análisis gráfico:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 50
g. Gráfica de tallo y hojas
Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes:
el tallo (el dígito ubicado en el extremo izquierdo y la hoja (el dígito del extremo derecho).
Ejemplo 2.14
Representa el pulso de las mujeres en un diagrama de tallo y hoja
76 72 88 60 72 68 64 80 64 68 120 80 76 68 72 96 52 68 72 80
Tallo (Decenas) Hoja (Unidades)
Ejercicio 2.11
Representa el pulso de los hombres en un diagrama de tallo y hoja
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 72 84 88 56 64 56 56 64
Tallo (Decenas) Hoja (Unidades)
Capítulo 2. Organización de los datos 51
2.4 Tablas y gráficos para describir relaciones entre variables
En los ejemplos anteriores hemos desarrollado gráficos para describir una única variable. Estas
“imágenes” nos han ayudado a analizar mejor la información que contenía un gran conjunto de
datos. Ahora, ampliamos las medidas gráficas para describir las relaciones entre dos o más variables.
En primer lugar, presentamos un diagrama de puntos dispersos para estudiar las posibles relaciones
entre dos variables cuantitativas. A continuación, analizamos tablas cruzadas de dos variables para
examinar posibles relaciones entre variables cualitativas.
➢ Diagramas de puntos dispersos
Un diagrama de dispersión es una gráfica de datos apareados (𝑥, 𝑦). El diagrama de puntos dispersos
es una representación de los datos, que se usa para verificar la relación entre dos variables
cuantitativas.
Muchos docentes quieren hacer creer que son excelentes maestros por las “notas que sacan sus
alumnos”, pero esas calificaciones, en múltiples ocasiones suelen ser un mal indicador. Es por esta
razón que el Minerd estudia la relación existente entre “la nota de presentación de cada asignatura
y la nota obtenida en cada prueba nacional”. Veamos los siguientes ejemplos.
Ejemplo 2.15
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Represente esos datos en un diagrama de dispersión:
Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de matemática
N P 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69
NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30
Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:
Análisis gráfico:
Relación entre la nota de presentación y la
Una interesante pauta es la tendencia
nota de prueba nacional de matemática
ascendente positiva: la nota de la
32 prueba nacional tiende a aumentar
30
directamente con la nota de
30% (Prueba nacional Mat)
28
26 presentación. Obsérvese también que la
24 relación no suministra una predicción
22 exacta. Algunos estudiantes que
20 obtienen una alta nota de presentación
18
de matemática tienen una calificación
16
14
baja en la prueba nacional. Vemos que
12 la pauta básica indica que las notas más
10 altas obtenidas en la nota de
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 presentación predicen mayores
70% (Nota de presentación Mat) calificaciones en las pruebas, pero los
resultados no son perfectos.
Estadística Descriptiva Para Psicólogo 52
Ejemplo 2.16
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Representa los datos en un diagrama de dispersión:
Minerd, nota de presentación y la de prueba nacional de matemática de los estudiantes del
aérea de mecatrónica de un politécnico de la regional 08, 1ra convocatoria, 2015.
NP 53 57 50 56 53 53 56 53 55 60 50 51 68 57 60 51 62
NPN 18 15 18 17 18 21 17 21 21 20 19 16 17 20 16 16 17
Representa los datos en un diagrama de dispersión:
Análisis gráfico:
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 53
2.4.1 Tablas cruzadas
Una tabla cruzada, llamada a veces tabla de contingencia, enumera el número de observaciones
correspondiente a cada combinación de valores de dos variables categóricas u ordinales. La combinación de
todos los intervalos posibles de las dos variables define las casillas en una tabla. Una tabla cruzada de r filas
y c columnas se denomina tabla cruzada de dimensión r×c.
En cada zona residencial, se contactó con 250 hogares por teléfono y se les pidió que indicaran cuál de tres
categorías de productos habían comprado la última vez que habían ido a una tienda de materiales de
construcción.
La encuesta se realizó para determinar la demanda de herramientas, madera y pintura. Las tres zonas
residenciales contienen el mismo número de hogares y, por lo tanto, la muestra aleatoria de 750 representa
la población de hogares de toda la ciudad.
Ejemplo 2.17
Tabla cruzada de la demanda de productos por parte de los hogares por zonas residenciales
Zona Herramientas Madera Pintura Ninguna Total
Este 100 50 50 50 250
Norte 50 95 45 60 250
Oeste 65 70 75 40 250
Total 215 215 170 150 750
Gráfica Análisis gráfico:
-----------------------------------------------------------
Demanda de productos por parte de los
-----------------------------------------------------------
hogares por zona de residencia -----------------------------------------------------------
-----------------------------------------------------------
100
Número de hogares
-----------------------------------------------------------
80
-----------------------------------------------------------
60 -----------------------------------------------------------
40 -----------------------------------------------------------
-----------------------------------------------------------
20
-----------------------------------------------------------
0
Este Norte Oeste -----------------------------------------------------------
-----------------------------------------------------------
Herramientas Madera Pintura Ninguna
-----------------------------------------------------------
-----------------------------------------------------------
Estadística Descriptiva Para Psicólogo 54
2.4.2 Gráfica de barras múltiples o compuestas
Ésta contiene dos o más conjuntos de barras, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.18
Construya una gráfica de barras múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
Gráfica de barras múltiples
Anáilisis gráfico:
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
Ejercicio 2.12
Un estudiante universitario en su primer ciclo tomó las siguientes asignaturas, sacando las
calificaciones que se muestran a continuación, en tres parciales de 20 puntos.
Asignaturas 1er parcial 2do parcial 3er parcial
Matemática 16 18 20
Español 12 20 20
Biología 14 14 18
Geografía 16 15 14
Inglés 15 14 18
Gráfica de barras múltiples
➢ Análisis gráfico
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
Capítulo 2. Organización de los datos 55
2.4.3 Gráfica de barras por componentes o superpuestas.
En esta gráfica se representan todas las variables en una barra.
Ejemplo 2.19
La siguiente distribución muestra los volúmenes de ventas de los productos A, B y C en los
primeros 4 meses del año 2012 de una compañía. Construye una gráfica de barras
componentes o superpuestas.
Meses A B C Total
Enero 25 35 40
Febrero 35 45 20
Marzo 40 20 10
Abril 50 15 5
Gráfica de componentes o superpuestas
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Ejercicio 2.13
Representa la siguiente distribución de las ventas de vehículos en una gráfica de barras
componentes o superpuestas.
Meses Toyota Ford Honda Peugeot Total
Enero 52 40 45 43
Febrero 60 43 53 30
Marzo 59 41 56 31
Abril 65 45 64 25
Gráfica de barras componentes
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 56
2.4.4 Gráfica de líneas múltiples.
Ésta contiene dos o más conjuntos de líneas, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.20
Construya una gráfica de líneas múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
➢ Análisis gráfico:
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
Ejercicio 2.14
Construya una gráfica de líneas múltiples para la distribución de los autos vendidos de una
agencia de vehículos al inicio del año 2010.
Condición Toyota Honda Peugeot Kia
Nuevos 30 20 5 25
Usados 60 55 10 70
Chocados y reparados 45 30 2 50
Gráfica de líneas múltiples
➢ Análisis gráfico:
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
57 Estadística Descriptiva Para Psicólogo
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #2
Organización de los Datos
2.1 Responde:
a) ¿Cuál es la diferencia entre los datos originales (sueltos) y una distribución de frecuencia?
b) ¿Por qué es útil convertir los datos originales (sueltos) en una distribución de frecuencia?
2.2 Grupos sanguíneos. A continuación, se presenta una lista de los grupos sanguíneos O, A, B, y AB de
donadores de sangre elegidos al azar. Construya una tabla donde resuma la distribución de frecuencias
de esos grupos sanguíneos.
2.5 Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto
129. Los datos se van a organizar en una distribución de frecuencias.
PASOS:
a) Busco el rango. R = xmax − xmin
d) Construye la tabla.
60 Estadística Descriptiva Para Psicólogo
2.7 Quick Change Oíl Company cuenta con varios talleres en el área metropolitana de Seattle.
Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street
los pasados veinte días son las siguientes:
65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
Gráfica de barras
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 63
2.12 La compañía Northwind Traders Tea recibe un informe acerca de las ventas de las cajas
de los productos que 6 empleados han podido poner en el mercado en el primer trimestre
del año 2000. Construye una gráfica de barras múltiples.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
64 Estadística Descriptiva Para Psicólogo
2.13 Representa la distribución de las ventas anterior en una gráfica de barras superpuestas
o por componentes.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Gráfica de barras superpuestas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 65
2.14 Construye una gráfica circular a partir del número de medallas obtenidas por cada país
en las Olimpiadas de Invierno del 1998.
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
66 Estadística Descriptiva Para Psicólogo
2.15 Las notas obtenidas de 50 estudiantes del CURSA en estadística básica se muestran en
la siguiente distribución. Construye un histograma.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Gráfica histograma
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 67
2.16 Construye un polígono de frecuencia con la distribución de frecuencia de las notas de
los estudiantes del punto anterior.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
68 Estadística Descriptiva Para Psicólogo
2.17 Representa en una ojiva menor la distribución de los pesos de 35 estudiantes del CURSA
que se muestra a continuación.
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 69
2.18 Representa con un gráfico de líneas la cantidad anual de niños vacunados en una
población.
Años Niños vacunados
1980 805
1985 1250
1990 3500
1995 6550
2000 7200
Gráfica de líneas
Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
70 Estadística Descriptiva Para Psicólogo
2.19 Una compañía estudia el uso de cajeros automáticos en una ciudad. Una muestra de 30
cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer.
Elabore un diagrama de tallo y hojas.
83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Diagrama de tallo y hojas
Tallo Hojas
2.20 Molly’s Candle Shop tiene diversas tiendas de venta de menudeo en las áreas costeras
de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Molly´s han
solicitado que les envíe sus compras. La siguiente gráfica muestra el número de paquetes
enviados por día durante los pasados 100 días.
2.22 La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores
en la zona de Atlanta, Georgia. (Ojiva menor que)
c) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad? ¿Qué cantidad
es ésta?
Imagine que el maestro de estadística dio un examen con un valor de 20 puntos a un grupo de
20 participantes y los resultados fueron los siguientes:
20 13 7 12 18 16 17 9 11 10
12 18 14 17 3 5 6 3 1 15
Un participante le pregunta al facilitador, ¿cómo nos fue profe?, si usted fuera el facilitador,
¿qué le responde?
Una pregunta cómo esta podríamos responderla con un número que represente el equilibrio
de los datos. A las medidas que se sitúan en el centro de un conjunto de datos se le conoce
como medidas de tendencia central.
Antes de continuar con el estudio de las medidas de tendencia central, necesitamos revisar el
concepto de sumatoria por su aplicación en este tema.
En lugar de escribir todos esos términos, introducimos una manera más concisa de expresar
dicha suma, llamada notación de sumatoria. Utilizando dicha notación, podemos escribir la
suma como:
n
X
i =1
i = X 1 + X 2 + X 3 + ... + X n ; donde i, n N
SÍMBOLO SIGNIFICADO
Letra griega mayúscula sigma, que indica sumatoria.
Estos naturales indican dónde inicia y dónde termina la suma,
respectivamente.
Variable
NOTA:
Cuando la sumatoria se realiza con todos los datos (de 1 a n) se abreviará de la siguiente manera:
74 Estadística Descriptiva Para Psicólogo
Ejemplos 3.1
Para los siguientes datos, determine la sumatoria correspondiente.
a.
X 6 8 9 10 X i =
3
b.
Y 4 -10 25 5 Y =
i =1
i
3
c.
Y 4 -10 25 5 Y
i =2
i
2
=
Z +3 =
d.
Z 2 -12 14 16 i
e.
Z 2 -12 14 16 (Z i + 3) =
f.
X 6 8 9 10 X i
2
=
g.
( X )
2
X 6 8 9 10
i =
PROPIEDADES DE LA SUMATORIA
No PROPIEDAD SIGNIFICADO
1 La sumatoria de una constante es igual a n veces la constante.
e) Si usted fuera el docente, ¿qué harías después de entregar las calificaciones del primer periodo para
motivar el incremento de la nota del alumno A?
f) Si usted fuera el docente, ¿qué harías después del segundo periodo para evitar que el descenso de las
calificaciones del estudiante B siga su curso?
76 Estadística Descriptiva Para Psicólogo
➢ Ventajas y desventajas de la media aritmética
Ejercicio 3.1
Complete la tabla y deduzca qué sucede.
Datos Media
1, 2, 5, 9, 10
1, 2, 5, 9, 100
1, 2, 5, 9, 1000
1, 2, 5, 9, 10000
➢ ¿Qué ventajas posee la media? ➢ ¿Qué desventajas tiene la media?
Ejercicio 3.3
Complete la tabla y deduzca qué sucede.
Datos Promedio x−x
2 2 + 5 +1+ 4
x=
5 4
1 12
x= x=3
4 4
( x − x) =
n=4
Ventaja
Una ventaja de la media es que resulta relativamente confiable, de manera que cuando se seleccionan
muestras de la misma población, las medias muéstrales tienden a ser más consistentes que otras
medidas de tendencia central.
3.3 Características de la media aritmética
1. Todo conjunto de datos cuantitativos posee una media y esta es única.
2. Todos los valores se encuentran incluidos en el cálculo de la media.
3. La media es muy sensible a los datos extremos. Un valor extremo perturba
considerablemente el equilibrio de los datos.
4. La suma de las desviaciones de cada valor con respecto a la media es cero. ( X − ) = 0
Capítulo 3. Medidas de Tendencias Céntricas 77
Desventaja de la media
Una desventaja de la media es su sensibilidad a los valores extremos, la mediana resuelve en
gran medida, esa desventaja. La mediana es el valor intermedio, ya que la mitad de los datos
están por debajo de la mediana y la otra mitad por encima de ella.
Ejemplo 3.3
Calcule la mediana de los siguientes datos:
Datos Ordene los datos Mediana
a) 8, 10, 4, 3, 1, 15
b) 2.5, 1.8, 1.2, 2.48, 2.0
c) 2, 3, 5, 7, 10
d) 2, 3, 5, 7, 100
e) 2, 3, 5, 7, 1000
➢ ¿Qué observa en los ejemplos c, d, y e? ¿A qué conclusión llegas?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Moda
Se define como el dato con mayor frecuencia.
Ejemplo 3.4
Complete la tabla.
Datos Moda
a) 1, 2, 4, 2, 3
b) 1, 2, 5, 9, 4, 999
c) 1, 2, 1, 2
d) 1, 2, 1, 2, 5
e) 1, 2, 5, 9, 5, 555
2. Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si la cola se
extiende más a la derecha del pico que a la izquierda. En este tipo de distribución la
𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎. En distribuciones sesgadas la mediana suele ser la mejor
opción. Observa la figura 2.
Hoy en día el uso de las medidas de tendencias céntricas para datos agrupados resulta poco
útil por el avance de las Tics, es por esta razón que sólo nos limitaremos a mencionar las
fórmulas sin ninguna aplicación o resolución de ejercicios.
Para calcular la media, mediana y moda si los datos están en una distribución de frecuencia
se debe usar las fórmulas descritas a continuación.
( f x)
x=
n
Esta misma fórmula se usará cuando los datos aparezcan ordenados en una distribución de
li + ls
frecuencia con la salvedad de que x = es el punto medio de cada clase.
2
n Es la mitad del número de datos (recuerde que la mediana se sitúa en la mitad de los datos)
2
Fi−1 Es la sumatoria de las frecuencias que están por debajo de la clase que contiene a la mediana.
c c = li2 − li1
Es el tamaño de la clase, se determina así:
Capítulo 3. Medidas de Tendencias Céntricas 81
3.10 Moda de una muestra de datos agrupados
Si los datos aparecen agrupados para determinar la moda se usará la fórmula:
d c
mod = li + 1
d1 + d 2
Nota:
li Es el límite inferior de la clase que tiene la mayor frecuencia.
d1 = f m − f m −1
d 2 = f m − f m +1
c = li2 − li1
Es el tamaño de la clase.
82 Estadística Descriptiva Para Psicólogo
3.11 Media Ponderada
Situación introductoria
Una estudiante obtuvo calificaciones de 90 puntos en el examen parcial, 70 puntos en el examen final y 83
puntos en un proyecto semestral. Si estas tres notas se importantizan en 20%, 70% y 10% respectivamente,
¿Cuál es la media de las calificaciones?
Solución:
90 + 70 + 83
x= = 81
3
➢ ¿Será 81 realmente la media que representa estos datos? ¿Qué debilidad tiene esta media?
Definición
Media ponderada. Esta media nos permite calcular un promedio que tome en cuenta la importancia de cada
valor con respecto al total. La fórmula es:
Ejemplo 3.9
Rafaela, estudia Educación Inicial en la UASD. En el semestre pasado ella obtuvo las calificaciones que se
muestran en la tabla. Ayúdala a determinar su índice académico de dicho semestre.
Asignatura Calificación Créditos xw
Educación Física 100 1
Didáctica General 92 4
Leng Esp Y Tecn De Exp II 98 3
Introducción A La Informática 80 4
Matemática Básica 75 4
Total 16
Calcule la calificación cuatrimestral media del estudiante.
Solución:
( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 83
Ejercicio 3.4
Imagine que en el ejemplo anterior Rafaela confundió las calificaciones de las asignaturas de Educación Física
y Matemática básica, es decir que las notas de estas dos materias iban intercambiadas, como se muestra en la
tabla. a) ¿Su índice académico aumenta o disminuye? b) ¿Cuál sería su nuevo índice académico?
Asignatura Calificación Créditos xw
Educación Física 75 1
Didáctica General 92 4
Leng Esp Y Tecn De Exp II 98 3
Introducción A La Informática 80 4
Matemática Básica 100 4
Total 16
Calcule la calificación cuatrimestral media del estudiante.
Solución:
( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 3.5
Un estudiante realizó 17 créditos en una universidad durante el primer cuatrimestre. Suponga que se le asigna
un valor de 4 a A, 3 a B, 2 a C, 1 a D y 0 a F.
Asignatura Calificación Valor Créditos V*C
Inglés C 4
Matemáticas B 5
Biología B 3
Español C 5
Total 17
Calcule la calificación cuatrimestral media del estudiante.
Solución:
( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
84 Estadística Descriptiva Para Psicólogo
3.12 Media geométrica
Imagina que tenemos tres elementos consecutivos a, m y b de una
progresión geométrica como se muestra en la figura que está a la derecha.
m b
Esto significa, que r = = , lo que implica que m = ab m = ab , a esta
2
a m
expresión se le conoce como la media geométrica para dos valores, pero si
son varios valores, entonces, la media geométrica es:
xg = n x1 x2 x3 xn
Ejemplos 3.10
Calcula la media geométrica de:
Datos Media geométrica
a) 2, 18
b) 9, 3, 3
c)1, 3, 9, 2
d)2, 3, 5, 6, 1
Nota:
La media geométrica suele utilizarse para promediar por ciento (tasa de interés). Cuando
trabajamos con cantidades que cambian cada cierto tiempo y se requiere conocer una tasa
promedio de cambio utilizamos la media geométrica.
Respuesta:
Ejercicio 3.6
La siguiente distribución presenta el gasto (millones de pesos dominicanos) del gobierno
central durante el periodo 1992-1996. Calcule el aumento porcentual promedio del
crecimiento en cada año.
Año Gasto Factor de crecimiento
1992 16,056
1993 20,727.5
1994 23,135.3
1995 24,107.4
1996 27,691.1
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
86 Estadística Descriptiva Para Psicólogo
Otro modelo de aplicación de la media geométrica se relaciona con la determinación de un
cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en el
año 2000 y $50 000 en el 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta
es de 5.24%. La tasa de incremento porcentual promedio se deduce a partir de la fórmula del
interés compuesto:
s = c (1 + i ) c (1 + i ) = s
n n
s s
(1 + i ) (1 + i )
n n
= n
= n
c c
s s
1+ i = n i= n −1
c c
Ejemplo 3.13
Una persona toma prestado de 827,000 pesos en el año 2015 y debe de pagar un total de
1, 665,000 en 2020. Durante este periodo:
a) ¿Cuánto pagó de intereses?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 87
3.14 Características y aplicaciones de la media geométrica.
1. Toma en cuenta todos los valores de la variable. Si uno de los valores es cero, la media
geométrica dará cero.
2. La media geométrica es afectada por datos extremos, aunque en menor medida que la
media aritmética.
3. Es mayormente usada para promediar tasas de cambio, razones y valores que muestren una
progresión geométrica.
xa = 4.25
Respuestas:
La media armónica de la muestra de datos es 4.25
3.15 Características y aplicación de la media armónica:
1. Se toman en cuenta todos los valores de la variable para su cálculo.
2. Es menos afectada por los datos extremos.
3. El uso de la media armónica no es común, sin embargo, es de gran utilidad cuando se trata
de algunas magnitudes físicas y otros campos relacionados.
88 Estadística Descriptiva Para Psicólogo
3.16 Media cuadrática
La media cuadrática se define como la raíz cuadrada de la media aritmética de los cuadrados
de los valores de la variable. La fórmula es:
xc =
x 2
N
Esta medida es útil en muchos cálculos de ciencias.
Ejemplo 3.15
Calcule la media cuadrática de los datos: 1, 3, 4, 5, 7
Solución
12 + 32 + 42 + 52 + 72
xc =
5
1 + 9 + 16 + 25 + 49
xc =
5
100
xc = = 20 = 4.47
5
xc = 4.47
Respuestas:
La media cuadrática de la muestra de datos es 4.47
Ejercicio 3.9
Encuentre la media cuadrática para los siguientes datos muestrales: 10, 12, 24, 13,15, 22
Solución:
Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.17 Características y aplicación de la media cuadrática:
1. En el cálculo de media cuadrática se emplean todos los datos de la variable.
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 88 puntos?
a) 2, 4, 5, 7
b) 2.1, 3.2, 3.6, 5.0, 7.2
c) 11, 14, 18, 22, 25, 28, 30
d) 110, 112, 115, 120, 133
3.2 Represente cada una de las siguientes expresiones por medio de la notación de sumatoria:
a ) x1 + x2 + + x10 =
b) x1 + x2 + x3 =
Explicación:
3.5 Estudio de casos. En un estudio que se realizó en un asilo de ancianos, se tomó las edades
de los envejecientes que pueden caminar sin dificultades. Busque la media, mediana y
moda de los siguientes datos: 69 73 65 70 71 74 65 69 60 62
3.6 Ciencias. Un científico social para una organización defensora de la niñez seleccionó de
manera aleatoria 10 programas de caricaturas por televisión del sábado en la mañana y
efectuó un análisis del contenido, donde cuenta la cantidad de incidentes de violencia física
o verbal en cada uno. Para las 10 caricaturas examinadas, estas fueron las cuentas: 27, 12,
16, 22, 15, 30, 14, 30, 11 y 21. Determine la media, la moda y la mediana para estos datos.
92 Estadística Descriptiva Para Psicólogo
3.5 El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe
el departamento de atención al cliente sobre la calidad de los aparatos eléctricos que
venden los almacenes. Los registros de un periodo de 5 semanas muestran el siguiente
número de reclamaciones semanales:
13 15 8 16 8
c) Halle la moda.
c) ¿Cuál es la moda?
a) Describa la media.
b) Determina la mediana.
c) Determina la moda.
Práctica 3. Medidas de Tendencia Céntricas 93
3.11 Durante un período de una hora en una tarde calurosa de un sábado, el cantinero Julio
sirvió cuatro bebidas. Calcule la media ponderada de los precios de las bebidas
(Precio ($), cantidad vendida).
Bebidas Precio Cantidad PC Proceso
B1 50 5
B2 75 15
B3 90 15
B4 110 15
Total
3.12 Suponga que el Hospital Regional Universitario José María Cabral y Báez tiene 200
empleados en su personal de enfermería. 50 son auxiliares de enfermería; 50 enfermeras
practicantes, y 100 son enfermeras tituladas. Las auxiliares de enfermería ganan 200 pesos
la hora; las enfermeras practicantes 300 pesos y los titulados 400 pesos la hora. ¿Cuál es
el salario promedio ponderado por hora?
94 Estadística Descriptiva Para Psicólogo
3.13 A continuación, se mencionan las materias que Luís Pérez llevó en el primer semestre
de Ingeniería Química, el número de créditos y la calificación obtenida, determine la
calificación promedio que obtuvo Luís Pérez en su primer semestre. Utilice la media
ponderada.
Materia Número de Calificación Producto Proceso
créditos (1) (2)
Metodología de la Inv. 3 90
Matemática 1 4 100
Programación 8 81
Química 10 78
Dibujo 6 100
Economía 4 84
Total
3.14 El crecimiento en el gasto por deudores morosos de una compañía financiera durante
los últimos años es el que se muestra a continuación. Calcule el incremento promedio
porcentual del gasto por deudores morosos durante ese periodo.
Año Tasa de Factor de Proceso
interés crecimiento
2008 0.110
2009 0.090
2010 0.075
2011 0.080
2012 0.095
2013 0.108
2014 0.120
Práctica 3. Medidas de Tendencia Céntricas 95
3.15 En 1985 había 340,213 suscriptores a la telefonía celular en Estados Unidos. En 2008,
el número de suscriptores aumentó a 262,700,000.
a) En número de suscriptores, ¿de cuánto fue el incremento para este periodo?
Mediana
Moda
3.18 Calcule la media cuadrática y la media armónica de los siguientes datos muestrales:
2, 3, 1, 5, 5
Media cuadrática Media armónica
Práctica 3. Medidas de Tendencia Céntricas 97
3.19 Enuncie las características de siguientes medidas de tendencia centrales.
Media aritmética Mediana Moda
98 Estadística Descriptiva Para Psicólogo
3.20 A continuación, se dan las evaluaciones de la asignatura de matemática de 6to A del
Área de Informática del Politécnico Dios es Amor. Complete el cuadro evaluativo
manualmente y usando Excel, luego responda las preguntas dadas a continuación.
Prof. José
no P1 P2 P3 P4 NF 50% Ex C 50% NCFC 30% Ex Ext 70% NCFE
NF Ex C NF Ex Ext
01 87 90 88 80
02 50 65 70 70 87
03 87 88 85 89
04 60 64 60 60 80
05 90 78 85 99
06 89 80 87 90
07 72 75 86 80
08 90 90 92 97
09 99 100 95 99
10 65 60 52 60 88
11 87 90 97 99
12 56 60 60 60 90
13 70 80 85 90
14 82 87 89 90
15 86 80 86 88
16 88 85 88 88
17 54 60 65 66 60 90
18 80 93 94 98
19 87 95 90 98
20 90 98 94 98
a) ¿Cuál es el por ciento promovido de la materia al final de año? NF
c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 85 puntos?
✓ Comunica
Explica cómo se obtiene los
cuartiles, deciles y
percentiles para datos
sueltos y agrupados.
Los percentiles se representan con la letra P y la localización del percentil estará dada por la
fórmula:
k ( n + 1)
Lk =
100
Ejemplo 4.1
En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19
corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas
a lo largo de Estados Unidos.
2038 1721 1721 1637 2097 2047 2205 2287 1741 1932
1940 2311 2054 2046 1471 1460 1787 1900 1800 ------
𝑎)𝑃20 =
Posición Resultado Respuesta
𝑏)𝑃24 =
Posición Resultado Respuesta
𝑐)𝑃80 =
Posición Resultado Respuesta
102 Estadística Descriptiva Para Psicólogo
4.3 Deciles
Los deciles dividen un conjunto ordenado de datos en 10 partes iguales. Los deciles dan los
valores correspondientes al 10%, al 20%, al 30%,..., y al 90% de los datos.
Ejemplo 4.2
Para los datos del ejemplo 1, calcule los siguientes deciles: 𝐷1 𝑦 𝐷6
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que D1 = P10, tenemos:
Posición Resultado Respuesta
Ejemplo 4.3
Para los datos del ejemplo 1, calcule los siguientes cuartiles: 𝐶1 𝑦 𝐶2
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que C1 = P25, tenemos:
Solución Resultado Respuesta
Ejercicio 4.4
A continuación, se presentan la edad de un grupo de 12 estudiantes de un colegio de Santiago.
Determine lo siguiente (Use Excel): a) P40, b) P81 y c) P26
13 35 82 41 41 13 20 10 25 45 34 34
a) P40 =
b) P81 =
c) P26 =
Capítulo 4. Medidas de posición 107
4.5 Percentiles, deciles y cuartiles para datos agrupados
El procedimiento para calcular estas medidas para datos agrupados en una distribución de
frecuencias es similar al usado en el cálculo de la mediana.
Como se puede reescribir los deciles y los cuartiles en función de los percentiles, entonces
solamente usaremos la fórmula para calcular los percentiles de una distribución, que será:
P = Li +
( kn
100
− F )c
i −1
k
fi
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo,
así que evitaremos trabajar con ellas.
Estadística Descriptiva Para Psicólogo 108
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #4
MEDIDAS DE POSICIÓN
𝑎)𝑃20 =
Solución Resultado Respuesta
𝑏)𝑃60 =
Solución Resultado Respuesta
Estadística Descriptiva Para Psicólogo 119
4.2 Rafael es gerente de una compañía que se dedica a vender libros de texto. Ha contratado
39 personas, las cuales hacen visitas a profesores universitarios para recopilar
información que le servirá como insumo para la toma de decisiones. Cada sábado en la
mañana solicita a su personal que le envié un informe, que debe incluir entre otras cosas,
la cantidad de profesores que visitaron la semana anterior. En la lista de abajo, aparece la
cantidad de visitas de la semana pasada. Recuerde interpretar cada resultado.
38 40 41 45 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 48
59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79 …
a) Determine el primer cuartil.
b) Calcule el 6to decil.
Organice los datos de menor a mayor
𝑎)𝐶1 =
Solución Resultado Respuesta
𝑏)𝐷6 =
Solución Resultado Respuesta
CAPÍTULO 5
Medidas de Dispersión
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e interpreta
la varianza y la desviación
estándar de una muestra y/o
una población de datos
sueltos y agrupados.
✓ Comunica
Explica cómo se obtiene la
varianza y la desviación
Fuente: Ministerio de Educación estándar de una muestra y/o
una población para datos
El Programa de Reconocimiento al Mérito Estudiantil se sueltos y agrupados.
institucionaliza en el sector oficial con la finalidad de contribuir a
elevar el nivel académico del estudiantado dominicano, mejorar la ✓ Modela y Representa
calidad de la educación y fortalecer el sistema educativo en sentido Modela situaciones, donde se
general. pueda calcular las medidas
principales de dispersión.
Mediante la Orden Departamental No. 17´96, de fecha 12 de octubre
del año 1996, del Minerd, se estableció y reglamentó el Programa ✓ Conecta
de Reconocimiento al Mérito Estudiantil, en un primer momento, Utiliza conexiones entre las
dirigido a los estudiantes de los centros educativos del sector oficial, medidas principales de
extendiéndose posteriormente a los colegios privados, con el dispersión y las situaciones de
propósito de estimular la formación integral, la excelencia la comunidad educativa.
académica y el desarrollo de talentos en las diversas áreas del
conocimiento. ✓ Resuelve problemas
Resuelve problemas del
Un padre de familia tiene dos hijos en un politécnico, ambos en el contexto educativo que
mismo grado, pero María estudia Enfermería, mientras que Ramón impliquen calcular la
estudia contabilidad. María le dice a su padre que sacó 90 puntos desviación estándar.
como promedio final en la asignatura Enfermería, mientras que ✓ Utiliza herramientas
Ramón obtuvo 80 puntos en Contabilidad. El Padre da más crédito a tecnológicas
María, ya que obtuvo mejor calificación. ¿Es válido el argumento Usa Excel (con el
del padre para gratificar más a María? complemento MegaStat) y
otras herramientas
En esta unidad, se introducen las medidas de dispersión, tales como: tecnológicas para calcular la
el rango, el rango intercuartil, el rango semi-intercuartil la varianza y la desviación
desviación media absoluta, la varianza y la desviación estándar. estándar de una muestra y/o
Nuestro objetivo es resumir un conjunto de datos a través de una población para datos
medidas de tendencias céntricas y las medidas de dispersión, con el sueltos y agrupados.
fin de comprender e interpretar correctamente el lenguaje de los
datos.
Capítulo 5. Medidas de Dispersión 121
5.1 Introducción
Se entregará una laptop, una Tablet, una calculadora gráfica y una mochila a los estudiantes con
los mejores promedios en una clase. Al final del curso el profesor observa que 4 alumnos están
empatados con el mismo promedio (95 puntos). Dado que tienen el mismo promedio debe
buscarse alguna manera no aleatoria para asignar los premios. El maestro evalúa la consistencia
en las calificaciones, y de esta manera entregar los premios de tal modo que el primer lugar lo
obtenga el alumno con menor variabilidad en sus calificaciones. ¿Cómo debe el maestro
distribuir los premios?
Estudiantes Periodo 1 Periodo 2 Periodo 3 Periodo 4 Promedio
A 100 90 94 96 95
B 95 95 90 100 95
C 100 90 100 90 95
D 94 96 95 95 95
➢ ¿Cuál de los estudiantes parece tener menor variación en sus calificaciones con relación a la
media?
➢ ¿Cuál de los estudiantes parece tener mayor variación en sus calificaciones con relación a la
media?
122 Estadística Descriptiva Para Psicólogo
Importancia de las medidas de dispersión.
Las medidas de dispersión nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos,
la posición central es menos representativa de los datos, como un todo, que cuando éstos se
agrupan más cerca alrededor de la media.
= x−x
N s=
n −1
5.3 Varianza
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística. También se puede definir como el cuadrado de la desviación estándar.
Varianza de una población Varianza de una muestra
(x − ) ( )
2 2
=
2 x−x
N s2 =
n −1
Capítulo 5. Medidas de Dispersión 123
Los datos del primer ejemplo componen una población. Busque la desviación estándar de cada uno y responda
la inquietud inicial, es decir ¿cómo se deben distribuir los premios?
Notas del alumno A
100 90 94 96
1. Buscamos la media
=
N
124 Estadística Descriptiva Para Psicólogo
Notas del alumno C
100 90 100 90
1. Buscamos la media
= x
N
=
N
=
N
Capítulo 5. Medidas de Dispersión 125
Distribución de los premios en forma descendente
Estudiantes Media Desviación estándar Premio
1er
2do
3er
4to
Ejercicio 5.1
Para el siguiente conjunto de datos muestrales, calcule la desviación estándar.
Datos muestrales: 6, 2, 8, 5, 5, 4
1. Busque la media
x=
x
n
( x − x)
2
s=
n −1
126 Estadística Descriptiva Para Psicólogo
5.4 Uso de la calculadora científica (CASIO fx-82ms) para calcular la media y la
desviación estándar de una población o una muestra de datos.
Ejemplo 5.4
El siguiente conjunto de datos corresponde a una población, calcule la media y la desviación
estándar usando la calculadora. Datos poblacionales: 8, 3, 7, 3 y 4.
1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE
luego el número 2 (SD).
2. Introduzca los datos: 8, 3, 7, 3, 4. Para hacer esto, presiona 8 y luego la tecla de data (M+)
en la pantalla debe aparecer n = 1, indicando que el primer dato ya se introdujo. Con ese
mismo proceso introduzca los demás datos.
𝑥̅ 𝜎𝑥 𝑠𝑥
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
1 2 3
Presionamos el 1 para buscar la media y nos da: 𝜇 = 5, hacemos el mismo proceso y
presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 2.10 (si el caso fuera
una muestra se trabaja con el 3)
Resultados
Media Desviación estándar
𝜇=5 𝜎𝑥 ≈ 2.10
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos sueltos
usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.
Ejercicio 5.4
Para el siguiente conjunto de datos muestrales, calcule la media y la desviación estándar,
usando la calculadora. Datos muestrales: 6, 2, 8, 5
Resultados
Media Desviación estándar
Capítulo 5. Medidas de Dispersión 127
➢ VIDEO TUTORIAL
Compruebe usando Excel que la media y la desviación estándar de las calificaciones de los 4 alumnos son las
que se muestran a continuación. Para hacer esto les invito a ver el video titulado “Desviación estándar usando
Excel” en mi canal de YouTube llamado “Rosario Institud”
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 91 79 75 88
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 96 95 97
20 Sonia Amarante 83 76 99 75
Respuesta
Capítulo 5. Medidas de Dispersión 129
Si los datos aparecen en una distribución de frecuencias, entonces las fórmulas para la
varianza y la desviación estándar serán:
5.9 Varianza para datos agrupados
Para una población Para una muestra
f (x − ) ( )
2 2
f x−x
2
= s2 =
N n −1
5.10 Desviación estándar para datos agrupados
Para una población Para una muestra
f (x − ) f ( x − x)
2 2
= s=
N n −1
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo, así que
evitaremos trabajar con ellas.
130 Estadística Descriptiva Para Psicólogo
5.12 Importancia de la desviación estándar
Hemos visto como dos o más conjuntos pueden tener la misma media, pero uno con mayor
dispersión que el otro. Esto sucede también con las tres distribuciones que se presentan en la
figura siguiente. La media de las tres curvas es la misma, pero la curva A tiene menor
separación (o variabilidad) que la curva B, y ésta tiene menor variabilidad que la C. Si
medimos sólo la media de estas tres distribuciones, estaremos pasando por alto una diferencia
importante que existe entre las tres curvas. Al igual que sucede con cualquier conjunto de
datos, la media, la mediana y la moda sólo nos revelan una parte de la información que
debemos conocer acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión, separación o
variabilidad.
Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas —que van desde extremadamente altas a
extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor
para los accionistas y para los acreedores que las ganancias que permanecen relativamente
estables. De manera similar, los expertos en el control de la calidad analizan la dispersión de
los niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.
Capítulo 5. Medidas de Dispersión 131
5.13 Coeficientes de variación (CV):
Cuando se compara la variación de dos conjuntos diferentes de datos, se debe tomar en cuenta
que las desviaciones estándares han de ser aproximadamente iguales o iguales, además los
datos deben tener la misma escala y las mismas unidades. Si las medias son muy diferentes o
si los conjuntos utilizan diferentes escalas o unidades de medición, podemos utilizar el
coeficiente de variación.
El coeficiente de variación es un coeficiente expresado como porcentaje que describe la
desviación estándar en relación con la media. El coeficiente de variación está dado de la
siguiente forma:
Muestra Población
s
CV = 100% CV = 100%
x
Ejemplo 5.6
Un director de escuela tiene dos maestras de primero del nivel inicial. La maestra Juana usa
el método 1 para alfabetizar a sus alumnos de primero A y la maestra Xiomara usa
el método 2 para el mismo fin, con los estudiantes de primero B, al término del curso se miden
las palabras por minutos de ambos grupos, resultando los siguientes datos:
Primero A Primero B
= 40 = 55
=9 = 10
➢ Podemos observar que las medias son distintas, por tanto, no podemos comparar las
desviaciones estándares absolutas, necesitamos calcular el coeficiente de variación para
ambos grupos.
Solución
Coeficiente de variación de primero A Coeficiente de variación de primero B
CV = 100% CV = 100%
9 10
CV = 100% = 22.5% CV = 100% = 18.18%
40 55
CV = 22.5% CV = 18.18%
Conclusión
El método A tubo mayor variación relativa en la lectura de palabras por minutos por parte de
los estudiantes.
132 Estadística Descriptiva Para Psicólogo
Ejemplo 5.7
Compare la variación de las estaturas de hombres con la variación de sus pesos utilizando los
siguientes resultados: Para los hombres, las estaturas producen x = 68.34 pu lg y s = 3.02 pu lg ;
los pesos producen x = 172.55lb y s = 26.33lb .
Solución
Coeficiente de variación de la estatura Coeficiente de variación del peso
CV = 100% CV = 100%
Conclusión
131 Práctica 5. Medidas de Dispersión
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #5
MEDIDAS DE DISPERSIÓN
Profesor: Leonido Rosario, MA
Participante
Matrícula
Fecha
Sección
5.1 ¿Cuáles datos cree usted que tengan mayor variación: ¿los ingresos de una muestra aleatoria
simple de 1000 adultos elegidos de la población en general, o los ingresos de una muestra aleatoria
simple de 1000 profesores de estadística? ¿Por qué?
5.2 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un
todo? ¿Por qué?
5.3 Para medir el éxito escolar, los educadores necesitan probar los niveles de conocimientos y habilidades
de los estudiantes. Tomar en cuenta las diferencias individuales de cada uno de ellos, permite a los
profesores planear mejor el programa académico. Las curvas que se muestran a continuación representan
las distribuciones basadas en resultados anteriores de dos pruebas distintas. ¿Cuál de ellas seleccionaría
usted como mejor opción para los propósitos de los profesores?
132 Estadística Descriptiva Para Psicólogo
5.4 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró
las siguientes distribuciones del tiempo de entrega para los dos métodos, según los
registros históricos. Con la evidencia disponible, ¿qué método de envío recomendaría?
¿por qué?
5.6.1 Sume a cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos
valores. ¿Qué efecto produce sobre la desviación estándar el hecho de sumar una
constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
5.6.2 Multiplique cada dato una constante igual a 2. Calcule la desviación estándar para los
nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de
multiplicar una constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
134 Estadística Descriptiva Para Psicólogo
5.7 Calcule la desviación estándar de los siguientes datos muéstrales.
a) 6, 8, 7, 6, 5, 4
b) 6, 8, 7, 3, 6, 34
c) ¿Por qué la desviación estándar es tan grande en la parte b, en comparación con la parte a?
Práctica 5. Medidas de Dispersión 135
NOTA:
➢ Para los ejercicios 5.8 hasta 5.12 encuentre la desviación estándar.
5.8 Años para obtener el título de licenciatura. A continuación, se presenta el tiempo (en
años) que le tomó a una muestra aleatoria de estudiantes universitarios obtener su título de
licenciatura. Con base en los resultados, ¿Es inusual que un estudiante obtenga el título de
licenciatura en 12 años?
4 4 4.5 4.5 6 6 8 9 13 15
5.11 Mediciones de la presión sanguínea. Siete estudiantes del segundo año de medicina de Bellevue
Hospital midieron la presión sanguínea de la misma persona. A continuación, se listan las lecturas
sistólicas (en mmHg). Si la presión sanguínea del sujeto permanece constante y los estudiantes de
medicina aplican correctamente la misma técnica de medición, ¿cuál debería ser el valor de la desviación
estándar? Obtenga la desviación estándar.
138 130 135 140 140 130 150
Práctica 5. Medidas de Dispersión 137
5.12 IMC y género. Es bien sabido que los hombres tienden a pesar más y a ser más altos
que las mujeres. El índice de masa corporal (IMC) es una medida que se basa en el peso y
en la estatura. A continuación, se muestran los valores de IMC de hombres y mujeres
elegidos de manera aleatoria. ¿Parece existir una diferencia en la variación entre los dos
conjuntos de datos? Calcule la desviación estándar. (Puedes usar Excel)
Hombres: 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres: 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7
138 Estadística Descriptiva Para Psicólogo
5.13 Responde las siguientes preguntas.
a) ¿Por qué el rango no es una medida de dispersión tan útil como la desviación estándar?
c) ¿Es posible que el valor del rango, la desviación estándar o la varianza de un conjunto de
datos sea negativo? Explique
Práctica 5. Medidas de Dispersión 139
5.14 A raíz de que los jóvenes en su mayoría están activos sexualmente en nuestras escuelas,
y que las enfermedades de transmisión sexual son de alto riesgo, el psicólogo decide
investigar cómo anda la fidelidad de los estudiantes en el noviazgo en el politécnico Dios
es amor. Para esto, estudia una muestra de 20 alumnos (10 hembras y 10 varones) y
encuentra los siguientes datos. (Puedes usar Excel)
Sexo Número de parejas simultaneas de los 20 estudiantes.
Masculino 1, 1, 3, 2, 4,1, 2, 3, 4, 5
Femenino 1, 1, 1, 1, 2, 3, 2, 1, 1, 1
Calcule lo siguiente:
Medidas Sexo
Masculino Femenino
a) La moda
b) La mediana
c) La media
d) El rango
e) Varianza
f) Desviación estándar
g) Coeficiente de variación
1. ¿Cuál de los dos grupos tiene mayor capacidad de mantenerse con una pareja?
2. Según su criterio, ¿cuáles son las razones que explican la respuesta a la primera pregunta?
10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99
12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 90 96 95 97
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 93 82 75
20 Sonia Amarante 83 76 99 75
Respuesta
UNIDAD 6
Regresión y Correlación simple
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e
interpreta modelos de
regresión simple para
predecir el
comportamiento de una
variable.
✓ Comunica
Explica cómo se obtiene la
Fuente Externa correlación y la regresión
La desnutrición afecta radicalmente el rendimiento escolar de los simple.
niños. El haber nacido con bajo peso, haber padecido anemia por ✓ Modela y Representa
deficiencia de hierro o deficiencia de zinc, pueden significar un Modela situaciones, donde
costo de hasta 15 puntos en el Coeficiente Intelectual (CI) teórico se puede representar por
y varios centímetros menos de estatura. Esta conjunción de medio de la regresión
factores negativos conspira contra el desempeño escolar de los simple.
niños. Los estudios científicos demostraron que casi un cuarto de
los niños al ingresar al primer grado de la escuela tiene un CI ✓ Conecta
inferior a lo esperable. Además, uno de los factores responsables Utiliza conexiones entre la
de este bajo desempeño es la inadecuada estimulación temprana regresión simple y las
por parte de progenitores que ignoraban cómo hacerlo. situaciones de la
comunidad educativa.
Hoy no quedan dudas de que la desnutrición afecta el desarrollo ✓ Resuelve problemas
intelectual y sin necesidad de que sea extrema como en los casos Resuelve problemas del
que estamos viendo en la prensa estos días. Para los cientos de contexto educativo que
miles de niños que están en una situación de subalimentación y impliquen predecir el
mala nutrición, el riesgo de fracaso escolar es muy alto. comportamiento de una
variable por medio de un
Los escolares de familias de bajos ingresos están a menudo mal modelo de regresión
alimentados y presentan signos de malnutrición, incluyendo simple.
índices antropométricos por debajo de los promedios nacionales,
con baja talla o insuficiencia ponderal para la estatura y poca grasa ✓ Utiliza herramientas
subcutánea, aunque sin síntomas suficientes para justificar su tecnológicas
asistencia a un servicio de salud. Usa Excel (con el
complemento MegaStat) y
Kerlinger (1985) llegó afirmar que la ciencia es el estudio de las otras herramientas
relaciones entre variables, de ahí la importancia de este tema. En tecnológicas para formar
esta unidad tenemos como objetivo general estimar una variable un modelo de regresión
dependiente a través de modelo de regresión simple. dadas dos variables.
142 Estadística Descriptiva Para Psicólogo
4.1 Introducción
En esencia la ciencia es el estudio de las relaciones entre variables. Cuando conocemos la
relación entre variables se pueden llegar a formular predicciones de una a partir de otra. El
primer coeficiente de correlación publicado fue producto del trabajo de sir Francis Galton,
en 1888, midió la estatura y la longitud del antebrazo, respectivamente, de 348 hombres
adultos. Si se denota la estatura del i-ésimo hombre mediante xi , y la longitud de su antebrazo
como yi , entonces los datos de Galton consistían en 348 pares ordenados ( xi , yi ) . La figura
siguiente presenta una recreación simulada de estos datos, con base en una tabla que
construyó Galton.
Los puntos tienden a inclinarse hacia arriba y a la derecha, lo que indica que los hombres más
altos tienden a tener antebrazos más largos. Se dice que hay una asociación positiva entre la
estatura y la longitud del antebrazo. La pendiente es casi constante en toda la gráfica, esto
indica que los puntos están agrupados alrededor de una línea recta. La línea sobrepuesta sobre
la gráfica representa una recta especial conocida como recta de mínimos cuadrados. Ésta
recta la veremos más adelante.
Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:
Una interesante implicación es que la “nota de la prueba nacional” se relaciona con la “nota
de presentación”. Conforme aumenta la nota de presentación, la nota de prueba nacional
también lo hace (esta predicción no es perfecta, ya que algunos estudiantes que obtienen una
alta nota de presentación de matemática tienen una calificación baja en la prueba nacional).
La variable “nota de la prueba nacional” se considera la variable dependiente y la variable
“nota de presentación” es la variable independiente.
144 Estadística Descriptiva Para Psicólogo
La variable independiente proporciona la base para la estimación. Es la variable predictora.
Por ejemplo, digamos que se desea predecir la nota esperada en prueba nacional de un
estudiante que tenga 65 puntos de 70 como nota de presentación. Observe que elegimos este
valor. La variable independiente no es un número aleatorio.
La variable dependiente es la variable que se desea predecir o estimar. También puede ser
descrita como el resultado de un valor conocido de la variable independiente. La variable
dependiente es aleatoria, esto es, por cada valor dado a la variable independiente, existen
muchos posibles resultados para la variable dependiente.
El diagrama de dispersión anterior muestra en forma gráfica que la nota de la prueba nacional
tiende a aumentar directamente con la nota de presentación, sin embargo, algunos estudiantes
que obtienen una alta nota de presentación de matemática tienen una calificación baja en la
prueba nacional. Es razonable entonces que el director del politécnico incentive a los
estudiantes a ganarse buenas calificaciones para obtener mejores resultados en las pruebas
nacionales. Obsérvese que, aunque parece haber una relación positiva entre las dos variables,
no todos los puntos se encuentran en una recta. Por tal motivo ahora estudiaremos el grado
de asociación entre dos variables.
1 n xi − x yi − y
r=
n − 1 i =1 sx s y
Esta fórmula se puede usar para conseguir el valor de r, pero se hace un poco difícil encontrar
el valor de r manualmente, por lo que se prefiere reescribir la fórmula sustituyendo los valores
de las desviaciones estándares.
( ) ( y − y)
n 2 n 2
xi − x i
Sabemos que: sx = i =1
, sy = i =1
, si sustituimos estos valores en la ecuación
n −1 n −1
anterior tenemos:
( x − x )( y )
n
i i −y
r= i =1
( x − x) ( y )
n 2 n 2
i i −y
i =1 i =1
148 Estadística Descriptiva Para Psicólogo
Hemos llegado a una fórmula bastante cómoda para hacer el cálculo manual del coeficiente
de variación, sin embargo, con un poco de álgebra podemos conseguir una expresión más
adecuada todavía. Se puede demostrar que:
2
( ) = x
n n
a) xi − x
2
2
i − nx
i =1 i =1
2
( )
n n
b) yi − y = yi2 − n y
2
i =1 i =1
( )( )
n n
c) xi − x yi − y = xi yi − nx y
i =1 i =1
Tomando en cuenta estos resultados, haciendo las sustituciones y con un poco de álgebra
llegamos a la siguiente fórmula del coeficiente de correlación de Pearson.
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
Variable dependiente:
d) Interpretación
150 Estadística Descriptiva Para Psicólogo
Ejercicio 6.1
Un ebanista desea estudiar la relación entre el número de trabajadores, x, y el número de
mesas, y, producidas en su taller. Ha tomado una muestra aleatoria de 7 horas de producción.
Se han obtenido las siguientes combinaciones (x, y) de puntos:
x y
12 20
18 30
14 12
15 20
18 25
19 32
24 50
a) Diagrama de dispersión
Regresión y Correlación 151
b) Coeficiente de correlación
x y
12 20
18 30
14 12
15 20
18 25
19 32
24 50
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
152 Estadística Descriptiva Para Psicólogo
Ejercicio 6.2
A continuación, se presenta una muestra aleatoria de cinco pares (x, y) de puntos de datos:
x y
12 200
14 210
15 270
24 500
30 600
a) Diagrama de dispersión
Regresión y Correlación 153
b) Coeficiente de correlación
x y
12 200
14 210
15 270
24 500
30 600
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
154 Estadística Descriptiva Para Psicólogo
4.6 Pendiente de una recta
La pendiente de una recta es un coeficiente que mide el grado de inclinación de la recta.
Observa las siguientes gráficas con sus respectivas pendientes.
La figura siguiente muestra varias rectas marcadas con sus pendientes. Observe que las rectas
con pendiente positiva se inclinan hacia arriba a la derecha, mientras que las rectas con
pendiente negativa se inclinan hacia abajo a la derecha. Las rectas más inclinadas son
aquellas para las que el valor absoluto de la pendiente es muy grande; una recta horizontal
tiene pendiente cero.
Regresión y Correlación 155
Ejemplo 6.4
Encuentre la pendiente de la recta que pasa por los puntos: A ( 2,1) B ( 3, 7 ) y luego grafica
la recta.
y2 − y1
b=
x2 − x1
7 −1 6
b= = =6
3− 2 1
Gráfica
156 Estadística Descriptiva Para Psicólogo
4.7 Ecuación de la recta punto – pendiente
Una ecuación de la recta que pasa por el punto ( x1 , y1 ) y tiene pendiente b
y − y1 = b ( x − x1 )
Ejemplo 6.5
Encuentre la ecuación de la recta que pasa por el punto A ( −2,1) con pendiente b = −3 , y luego
construye la gráfica.
Solución 2. Otro punto
1. Se busca la ecuación: Si x = −4
y − y1 = b ( x − x1 ) y = −3 ( −4 ) − 5
y − 1 = −3 ( x + 2 ) y = 12 − 5 = 7
B ( −4, 7 )
y = −3 ( x + 2 ) + 1
y = −3 x − 6 + 1
y = −3 x − 5
3. Gráfica
Regresión y Correlación 157
4.8 Análisis de Regresión
El coeficiente de correlación es una medida que expresa la fuerza y la dirección de la relación
lineal entre dos variables. Ahora se desea crear una ecuación para expresar la relación lineal
entre dos variables. Además, se pretende estimar el valor de la variable dependiente Y con
base en un valor seleccionado de la variable independiente X. La técnica para desarrollar la
ecuación y proporcionar las estimaciones se denomina análisis de regresión.
Observemos el siguiente diagrama de dispersión y las rectas que más se ajustan. ¿Cuál de las
cuatro rectas piensa que se ajusta más a los puntos originales?
Sin embargo, es preferible utilizar un método que resulte en una sola y mejor línea de
regresión. Este método, que se denomina principio de los mínimos cuadrados, proporciona
lo que comúnmente se conoce como recta del “mejor ajuste”.
158 Estadística Descriptiva Para Psicólogo
4.9 Principios de los mínimos cuadrados
Determina una ecuación de regresión al minimizar la suma de los cuadrados de las distintas
distancias verticales entre los valores reales de y y los valores pronosticados de y .
Ilustración conceptual
Un negocio familiar que vende a clientes minoristas en la ciudad de Santiago. Tanto en radio
como en televisión e internet, la compañía destaca sus precios bajos y fáciles términos de
crédito. El propietario desea de analizar la relación entre las ventas y la suma de dinero que
gastó en publicidad, además se desea construir una ecuación de regresión que le ayude a
pronosticar la cantidad de dinero Y que recibiría la familia si se invierte una X cantidad de
dinero publicidad. A continuación, se presenta la información de las ventas y de los gastos
publicitarios durante los últimos cuatro meses.
Mes Gastos publicitarios Ingresos por ventas
(En millones de pesos) (En millones de pesos)
Octubre 3 8
Noviembre 4 18
Diciembre 5 16
Veamos ahora la ventaja del método de mínimos cuadrados. La gráfica 1 representa la recta
de la ecuación de regresión lineal, mientras las gráficas 2 y 3 son rectas construidas con regla.
La recta de regresión de la gráfica 1, es la recta de mejor ajuste porque la suma de los
cuadrados de las desviaciones verticales respecto de sí misma es mínima, para ilustrar este
punto veamos analicemos las tres rectas dadas a continuación.
Observemos la suma de las desviaciones al cuadrado de los tres puntos y la recta de mejor
ajuste:
( )
3 2
yi − yi = ( 8 − 10 ) + (18 − 14 ) + (16 − 18 )
2 2 2
i =1
( )
3 2
yi − yi = 4 + 16 + 4 = 24
i =1
Regresión y Correlación 159
Ahora observemos la suma de las desviaciones al cuadrado de los tres puntos y la segunda
recta:
( )
3 2
yi − yi = ( 8 − 6 ) + (18 − 12 ) + (17 − 19 )
2 2 2
i =1
( y − y )
3 2
i i = 4 + 36 + 4 = 44
i =1
( )
3 2
yi − yi = ( 8 − 16 ) + (18 − 20 ) + (17 − 25 )
2 2 2
i =1
.
( y )
3 2
i − yi = 64 + 16 + 64 = 144
i =1
160 Estadística Descriptiva Para Psicólogo
Como se puede apreciar la recta de mejor ajuste es la que minimiza la suma de los cuadrados
de las distancias verticales entre los valores reales de y y los valores pronosticados de y . A
esto le llamamos el Principio De Los Mínimos Cuadrados.
y = mx + b
Suponemos que los valores de x son precisos, que toda la incertidumbre está contenida en los
valores de y. Deseamos minimizar la suma de los cuadrados de las diferencias siguientes:
dyi = yi − yi
dyi = yi − ( mxi + b )
( dyi ) = yi − ( mxi + b )
2 2
( dyi )
2
= yi2 + m 2 xi2 + b 2 + 2mxi b − 2mxi yi − 2 yi b
La condición para la mejor elección de m y b es que ( dyi )2 sea un mínimo. Por tanto,
debemos buscar las derivadas parciales e igualarlas a cero:
dM
= 2m xi2 + 2b xi − 2 ( xi yi ) = 0
dm
dM
= 2nb + 2m xi − 2 yi = 0
db
Regresión y Correlación 161
Y resolviendo el sistema de ecuaciones simultaneas para m y b tenemos:
n ( xi yi ) − xi yi
m=
n xi2 − ( xi )
2
b=
x y − x ( x y )
2
i i i i i
n x − ( x )
2 2
i i
Ahora podemos determinar la recta de mejor ajuste usando el principio de los mínimos
cuadrados, interpretar los coeficientes y hacer una regresión. Veamos:
Mes Gastos publicitarios Ingresos por ventas
(En millones de pesos) (En millones de pesos)
Octubre 3 8
Noviembre 4 18
Diciembre 5 16
x y xy x2
n ( xi yi ) − xi yi
m=
n xi2 − ( xi )
2
b=
x y − x (x y )
2
i i i i i
n x − ( x )2 2
i i
162 Estadística Descriptiva Para Psicólogo
a) Ecuación de regresión
x y
12 20
18 30
14 21
15 27
18 30
19 32
24 50
x y
4 4
5 6
3 5
6 7
10 7
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
b) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Regresión y Correlación 167
6.2 Las siguientes observaciones muéstrales se seleccionaron de manera aleatoria.
a) Diagrama de dispersión
168 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación
x y
4 4
5 6
3 5
6 7
10 7
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 169
6.3 Una empresa tiene tiendas en varias áreas metropolitanas de Nueva Inglaterra. El gerente
general de ventas planea transmitir un comercial de una cámara digital en estaciones de
televisión locales antes del periodo de ventas que empezará el sábado y terminará el
domingo. Planea obtener la información de las ventas de la cámara digital durante el
sábado y el domingo en las diversas tiendas y compararlas con el número de veces que se
transmitió el anuncio en las estaciones de televisión. El propósito es determinar si hay
alguna relación entre el número de veces que se transmitió el anuncio y las ventas de
cámaras digitales. Los pares son:
a) Diagrama de dispersión
170 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación
Coeficiente de Pearson
x y
4 15
2 8
5 21
6 24
3 17
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 171
6.4 El departamento de producción de Celltronics International desea explorar la relación
entre el número de empleados que trabajan en una línea de ensamblado parcial y la
cantidad de unidades producida. Como experimento, se asignó a dos empleados al
ensamblado parcial. Su desempeño fue de 15 productos durante un periodo de una hora.
Después, cuatro empleados hicieron los ensamblados y su número fue de 25 durante un
periodo de una hora. El conjunto completo de observaciones pareadas se muestra a
continuación.
a) Trace un diagrama de dispersión.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
Número de Producción en una
ensambladores hora (unidades)
2 15
4 25
1 10
5 40
3 30
a) Diagrama de dispersión
172 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación
x y
2 15
4 25
1 10
5 40
3 30
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 173
6.5 El consejo de la ciudad de Pine Bluffs considera aumentar el número de policías en un
esfuerzo para reducir los delitos. Antes de tomar una decisión final, el ayuntamiento pide
al jefe de policía realizar una encuesta en otras ciudades de tamaño similar para determinar
la relación entre el número de policías y el número de delitos reportados. El jefe de policía
reunió la siguiente información muestral.
a) Trace un diagrama de dispersión.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
Ciudad Policías Número de delitos
Oxford 15 17
Starksville 17 13
Danville 25 5
Athens 27 7
Holgate 17 7
Carey 12 21
Whistler 11 19
Woodville 22 6
a) Diagrama de dispersión
174 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación
x y
15 17
17 13
25 5
27 7
17 7
12 21
11 19
22 6
n xy − x y
rxy =
n x 2 − ( x ) n y 2 − ( y )
2 2
c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 175
6.6Las siguientes observaciones muéstrales se seleccionaron al azar.
x y
4 4
5 6
3 5
6 7
10 7
n ( xi yi ) − xi yi
m=
n xi2 − ( xi )
2
b=
x y − x ( x y )
2
i i i i i
n x − ( x )
2 2
i i
Gráfica
b=
x y − x ( x y )
2
i i i i i
n x − ( x )
2 2
i i
Gráfica
b=
x y − x ( x y )
2
i i i i i
n x − ( x )
2 2
i i
Gráfica