Está en la página 1de 176

UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO

FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES

ESCUELA DE ESTADÍSTICA

GUÍA DIDÁCTICA
ESTADÍSTICA PARA PSICÓLOGO

Fuente: Película Intensamente.

NOMBRE DEL/LA ESTUDIANTE

_______________________________________________________________________________________

NÚMERO EN LA LISTA_________ SECCIÓN________ CARRERA___________________________

Autor:
Leonido Rosario Peña, MA
ii
PRÓLOGO
Este material didáctico se ha escrito para satisfacer la necesidad de tener una guía que sirva no
solo para tener las ideas principales de la estadística, sino además que facilite el trabajo al
estudiante en el sentido que pueda trabajar directamente, sin tener que perder tiempo copiando
ejercicios. Esta guía no pretende sustituir ningún libro de texto formal, sino más bien es la
compilación de ejercicios y ejemplos de diferentes libros.

En este material se puede trabajar los ejemplos y ejercicios directamente, además las gráficas
tienen los espacios correspondientes para realizarlas en el mismo. Esta guía tiene seis capítulos
desarrolladas conforme a las unidades del programa de la asignatura Estadística para Psicólogo.
Cada dos unidades se encuentran dos prácticas que ayudaran al estudiante a afianzar los
conocimientos adquiridos, tantos conceptuales como procedimentales y actitudinales.

Los contenidos desarrollados en esta guía pueden ser trabajados con el programa Excel y su
complemento MegaStat, además se usarán calculadoras científicas como herramientas para el
manejo de cálculo numérico, pero se hará énfasis en el análisis estadístico.
iii
ÍNDICE GENERAL
PRÓLOGO ii

CAPÍTULO 1. Conceptos fundamentales de la Estadística 1


1.1 Introducción 2
1.2 Estadística y sus divisiones 3
1.3 Conceptos básicos 3
1.4 Variables y sus clasificaciones 4
1.5 Niveles de medición de las variables 7
1.6 Tipos de fuentes 8
1.7 Pasos del método estadístico 9

PRÁCTICA 1. Conceptos fundamentales de la Estadística 10

CAPÍTULO 2. Organización de los Datos


2.1 Introducción 18
2.2 Organización de los datos 19
2.3 Presentación de los datos 29
2.4 Tablas y gráficos para describir relaciones entre variables 44

PRÁCTICA 2. Organización de los Datos 50

CAPÍTULO 3. Medidas de Tendencias Céntricas 74


3.1 Introducción 75
3.2 Notación sumatoria 75
3.3 Media aritmética para datos sueltos 77
3.4 Media aritmética para datos agrupados 78
3.5 Características de la media aritmética 80
3.6 Mediana para datos sueltos 81
3.7 Mediana para datos agrupados 81
3.8 Características de la mediana 83
3.9 Moda para datos sueltos 84
3.10 Moda para datos agrupados 84
3.11 Características de la moda 86
3.12 Media ponderada 86
3.13 Media geométrica 88
3.14 Tasa de incremento porcentual promedio durante el tiempo 90
3.15 Características y aplicaciones de la media geométrica 91
3.16 Media armónica 91
3.17 Características y aplicaciones de la media armónica 92
3.18 Media cuadrática 93
3.19 Características y aplicaciones de la media cuadrática 93
iv
PRÁCTICA 3. Medidas de Tendencias Céntricas 94
CAPÍTULO 4. Medidas de Posición 107
4.1 Introducción 108
4.2 Percentiles 108
4.3 Deciles 110
4.4 Cuartiles 112
4.5 Percentiles, deciles y cuartiles para datos agrupados 114

PRÁCTICA 4. Medidas de Posición 116


CAPÍTULO 5. Medidas de Dispersión 119
5.1 Introducción 120
5.2 Desviación estándar 121
5.3 Varianza 121
5.4 Uso de la calculadora científica para calcular x /  ó s /  para datos sueltos 125
5.5 Varianza para datos agrupados 128
5.10 Desviación estándar para datos agrupados 128
5.11 Uso de la calculadora científica para calcular x /  ó s /  para datos agrupados 130
5.12Importancia de la desviación estándar 132
5.12 Coeficientes de variación 133

PRÁCTICA 5. Medidas de Dispersión 134

CAPÍTULO 6. Regresión y correlación simple 144


6.1 Introducción 145
6.2 Análisis de correlación 145
6.3 Análisis de correlación 146
6.4 Coeficiente de correlación de Pearson 146
6.5 Fórmula para determinar el coeficiente de correlación de Pearson 149
6.6 Uso de la calculadora para determinar el coeficiente de correlación de Pearson 155
6.7 Función Lineal 156
6.7 Pendiente de una recta 158
6.8 Ecuación de la recta punto – pendiente 161
6.9 Análisis de regresión 163
6.10Ecuación de regresión 163
6.11 Principio de los mínimos cuadrado 163
6.12 Ecuación de la recta usando el principio de los mínimos cuadrados 164

PRÁCTICA 6. Regresión y correlación simple 169


CAPÍTULO 1
Conceptos Fundamentales de la Estadística
Competencias Específicas
✓ Razona y argumenta.
Reconoce el origen, concepto y
uso de la estadística.

Establece diferencia y similitud


entre conceptos básicos
estadísticos.

Identifica el nivel de medición de


una variable.

Reconoce los pasos del método


estadístico para la investigación
científica.

✓ Comunica
Se expresa utilizando los
Fuente: Ministerio de Educación conceptos básicos estadísticos.
En el mundo en que vivimos, donde las personas somos diferentes,
✓ Modela y Representa
pensamos diferentes y nos comportamos de manera distinta, son
Modela e interpreta situaciones de
diversas las variables que confluyen, estando muchas de ellas la vida diaria a través de la
relacionadas entre sí. estadística.

El universo como tal es sumamente cambiante y son diversas las ✓ Conecta


variables que podemos observar y medir. El calentamiento global y Utiliza los conceptos básicos de
los fenómenos naturales, la velocidad y el tiempo, densidad y el estadística y lo relaciona con la
volumen de un cuerpo, la privación del sueño y el comportamiento ciencia de la educación.
agresivo, entre otras muchas interactúan, de manera simple o ✓ Resuelve problemas
compleja. Usa la estadística como una
herramienta poderosa para la
Las ciencias estudian las relaciones entre distintas variables, para investigación científica.
hacer esto, luego de recoger datos, necesita clasificarlos y
organizarlos. Una vez los datos han sido recolectados, ¿cómo se ✓ Utiliza herramientas
pueden clasificar? tecnológicas
Usa las Tics para solucionar
problemas estadísticos.
Esta unidad muestra los tipos de datos con que se cuenta en un
análisis estadístico, además se da una panorámica de los conceptos
básicos que nos servirán como zapata para la construcción del
edificio llamado conocimiento científico.
2 Estadística Descriptiva Para Psicólogo
1.1 Introducción
Estadística, significa ciencia del Estado, y proviene del término alemán Statistik. El origen de la estadística se
utilizaba exclusivamente con fines estatales, en el sentido de que los gobiernos de las distintas naciones tenían
(y tienen) la necesidad, por razones de organización, de conocer las características de su población para
gestionar el pago de impuestos, el reclutamiento de soldados, el reparto de tierras o bienes, la prestación de
servicios públicos etc.

Reseña histórica de la estadística


Prehistoria Censo Bíblico en el AT Rey Enrrique VII

Investigación asignada 1
a) ¿Cómo surge la estadística?

b) Da 5 ejemplos de como se usa la estadística en su área de formación.


Capítulo 1. Conceptos Fundamentales de la Estadística 3
1.2 Estadística
Es una disciplina científica que se dedica al desarrollo y aplicación de las técnicas y métodos
apropiados para la recolección, organización, clasificación y análisis de datos para la toma de decisión.

Divisiones de la Estadística
Para un mejor estudio de esta ciencia, la estadística se ha dividido en dos ramas las cuales son:
Estadística Descriptiva y Estadística Inferencial.

1.2.1 Estadística Descriptiva


Consiste en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier
actividad para resumir o describir los mismos factores pertinentes adicionales, esto se refiere a
no intentar nada que vaya más allá de los datos.
Ejemplo de Estadística Descriptiva

1.2.2 Estadística Inferencial


Es la encargada de inferir propiedades, conclusiones y tendencias, a partir de una muestra del
conjunto. Su papel es interpretar, hacer proyecciones y comparaciones.

La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo dichas
deducciones, tales como:
a) Pruebas de estimación puntual o de intervalos de confianza.
b) Pruebas de hipótesis.
c) Pruebas paramétricas y no paramétricas.
d) Análisis de correlación y de regresión.
e) Series cronológicas.
f) Análisis de varianza.
g) Otros.
4 Estadística Descriptiva Para Psicólogo
Ejemplos Estadística Inferencial
• Encuestas políticas.

• Estudio de correlación sobre una muestra para determinar si el nivel educativo y el


ingreso de la población están relacionados.
Verificando lo aprendido 1
Identifica el tipo de Estadística a aplicar en cada caso
Casos de estudio Tipo de Estadística para aplicar
1. Un informe anual para accionistas que detalla los
bienes de la corporación.

2. Estimar el efecto de la inversión en publicidad de


compañía en el volumen de ventas de sus productos en
un determinado periodo.

3. El uso de los datos de una muestra en una encuesta para


estimar la opinión de la población.

4. Un profesor de historia que anuncia a su grupo el


número de estudiantes que obtuvieron la máxima
calificación en examen reciente.

Verificando lo aprendido 2
La empresa de publicidad PUBLICART, con sede en Santiago, solicitó a una muestra de 1,960
consumidores que probaran un platillo con pollo recién elaborado por GOODCHICKEN. De
las 1,960 personas de la muestra, 1,176 dijeron que comprarían el alimento si se comercializaba.

1. ¿Qué podría informar PUBLICART a GOODCHICKEN respecto de la aceptación en


la población del platillo de pollo?

2. ¿Es un ejemplo de estadística descriptiva o estadística inferencial? Explique su respuesta.


Capítulo 1. Conceptos Fundamentales de la Estadística 5
Población vs Muestra
Población:
Es un conjunto de elementos (personas, productos,
hogares, animales, objetos, etc.) con una o más
características en común susceptible de estudio.

Muestra:
Es un subconjunto de la población. Si la muestra es
aleatoria y lo suficientemente grande, se puede
utilizar la información obtenida de la muestra para
hacer inferencias sobre la población.

¿Por qué los investigadores estudian la muestra si el interés es la población?


Algunas razones para muestrear:
1. Establecer contacto con toda la población requeriría mucho tiempo.

2. El costo de estudiar todos los elementos de una población resultaría prohibitivo.

3. Es imposible verificar de manera física todos los elementos de algunas poblaciones.

4. Algunas pruebas son de naturaleza destructiva.

5. Los resultados de la muestra son adecuados.

Verificando lo aprendido 3
El CURSA ha entrevistado 100 estudiantes de informática para averiguar el tiempo semanal
medio que dedican a navegar por internet.
a) ¿Cuál es la población?

b) ¿Cuál es la muestra?
6 Estadística Descriptiva Para Psicólogo
❖ Parámetro
En Estadística, un parámetro es un modelo de la realidad, con el que se comparan los datos
reales obtenidos, resumiendo la información obtenida y permitiendo predecir.

Ejemplo de parámetro
En el caso de la presión arterial, se considera normal si es de 120/80. Si mide 140/90 o más se
considera que el paciente sufre hipertensión arterial.

a) ¿Qué podría significar esta lectura?

b) ¿Cuál es el parámetro?

❖ Estadístico
En estadística un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir características de una población o
modelo estadístico, que sirve para estimar determinado parámetro de la distribución de la que
procede la muestra.

Ejemplo de estadístico
En el caso de la presión arterial, se considera normal si es de 120/80. Si una persona llega a un
hospital y la presión arterial mide 140/90 o más, ¿cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 7
❖ Datos Estadísticos
Los datos estadísticos, son los valores que se obtienen al llevar a cabo un estudio. Se trata del
producto de la observación del fenómeno que se pretende analizar. Son el conjunto de
información recolectada.

Ejemplo de datos estadísticos


Supongamos que un periodista deportivo desea estudiar el rendimiento de un tenista a partir de
los resultados que logró en el último año. En dicho plazo, el jugador disputó 15 encuentros, de
los cuales ganó 5 y perdió 10. Los datos estadísticos obtenidos de la observación de los partidos
son los siguientes:

derrota – derrota – derrota – victoria – derrota – victoria – victoria – derrota – derrota – derrota
– derrota- derrota – victoria – derrota – victoria.

1.4 Variables y sus clasificaciones


❖ Variable
Una variable estadística es una característica de una muestra o población de datos que puede
adoptar diferentes valores.

Ejemplos
-La estatura -El peso -Estado civil

-Genero -Color -Size

❖ Variable independiente
Es aquella que es controlada en forma sistemática por el investigador.

Ejemplo variable independiente


Se estudia “el efecto de la privación del sueño con respecto al comportamiento agresivo”.
a) ¿Cuál es la variable independiente?

❖ Variable dependiente
La variable dependiente en un experimento es la que el investigador mide para determinar el
efecto de la variable independiente.

Ejemplo variable dependiente


En el estudio del “efecto de la privación del sueño con respecto al comportamiento agresivo”.
¿Cuál es la variable dependiente?
8 Estadística Descriptiva Para Psicólogo
Revisando lo aprendido 4
De León Pizza tiene los siguientes precios para sus tres tipos de pizzas.
TIPO DE PIZZA PRECIO
Pequeña RD$350.00
Mediana RD$630.00
Familiar RD$890.00
Responde las preguntas
❑ ¿Cuál es la variable dependiente?

❑ ¿Cuál es la variable independiente?

Verificando lo aprendido 5
Analice el siguiente experimento, y luego responda las 5 preguntas.
Un psicólogo de la salud está interesado en saber si la motivación del temor es eficaz para
reducir la incidencia del hábito de fumar. Cuarenta adultos fumadores son seleccionados de
entre los individuos residentes en la ciudad en donde trabaja el psicólogo. A 20 de ellos se les
pide fumar un cigarrillo, después ven una atemorizante película acerca de cómo el hábito de
fumar provoca cáncer; vívidas imágenes de los pulmones y otros órganos internos enfermos de
fumadores fallecidos se muestran en un esfuerzo de generar temor a fumar en estos sujetos. El
otro grupo recibe el mismo tratamiento, excepto que ellos ven una película neutra que no está
relacionada con el tabaquismo. Durante dos meses posteriores a la proyección de la película, el
experimentador mantiene registros de número de cigarrillos que los participantes fuman a
diario. Después calcula el promedio de cigarrillos fumados a diario de cada grupo después de
la exhibición de la película, y compara una media con la otra para determinar si la película
atemorizante surtió efectos sobre el hábito de fumar.
Preguntas
1. ¿Cuál es la variable independiente?

2. ¿Cuál es la variable dependiente?

3. ¿Cuál es la población?

4. ¿Cuál es la muestra?

5. ¿Cuál es el estadístico?
Capítulo 1. Conceptos Fundamentales de la Estadística 9
❖ Variables categóricas o cualitativas
Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de una persona, animal u objeto. De esta manera, las variables
cualitativas permiten expresar un atributo, cualidad o categoría no numérica.

Ejemplos de variables cualitativas


a) Estado civil
b) Religión
c) Nivel de satisfacción de un cliente frente a un servicio ofrecido.

❖ Variables cuantitativas o numéricas


Las variables cuantitativas son aquellas variables estadísticas que otorgan, como resultado, un
valor numérico.
Ejemplo de variables cuantitativas
a) El peso de las vacas de una granja.
b) Estatura de los habitantes de una ciudad.
c) Número de clientes atendidos en una tienda.

Las variables cuantitativas pueden ser continuas o discretas


❖ Variables cuantitativas discretas
Son aquellas que sólo pueden adoptar ciertos valores a lo largo de un intervalo, dejando un
espacio entre los valores posibles.

Ejemplos de variables cuantitativas discretas


a) Cantidad de personas que trabajan en zona franca.
b) El número de hijos de una familia.
c) El número de faltas en un partido de fútbol.

❖ Variables cuantitativas continuas


Son aquellas que pueden adoptar un valor en cualquier punto a lo largo de un intervalo.
Ejemplos variables cuantitativas continuas
a) Peso en libras de una persona.
b) La estatura de tu mejor amigo.
c) Volumen de agua en una piscina.
10 Estadística Descriptiva Para Psicólogo
Verificando lo aprendido 6
Clasifica las siguientes variables en cualitativas, cuantitativas discretas o cuantitativas
continuas.
Variable Tipo de variable
1. La nacionalidad de una persona.

2. Número de litros de agua contenidos en un


depósito.
3. Número de libro en un estante de librería.

4. Suma de puntos obtenidos en el lanzamiento


de un par de dados.
5. La profesión de una persona.

6. El área de las distintas baldosas de un edificio.


Capítulo 1. Conceptos Fundamentales de la Estadística 11
1.5 Niveles de medición de las variables
Las variables se pueden clasificar también por niveles de medición. Existen cuatro niveles de medición:
nominal, ordinal, de intervalo y de razón. La escala a la que pertenecen las mediciones es importante, ya que
puedes determinar los métodos adecuados para describir y analizar datos.

Las variables cualitativas se clasificar por dos niveles de medición: Nominal y Ordinal, mientras que las
variables cuantitativas pueden tener medición de intervalo y de razón.

❖ Nivel de medición nominal


Cuando una variable cualitativa consiste en nombres, etiquetas o categorías, diremos que su nivel de medición
es nominal, ya que los datos no siguen un orden.

Ejemplos
a) La filiación política de los participantes en una encuesta.
b) Nacionalidad
c) Religión

❖ Nivel de medición ordinal


Los datos siguen un orden jerárquico, aunque las diferencias entre los valores de los datos carecen de
significado.

Ejemplos
a) La clasificación de hoteles por estrellas.
b) Posición en una carrera deportiva.
c) Satisfacción con un servicio al cliente.

❖ Nivel de medición de intervalo


Incluye las propiedades del nivel ordinal, pero además la diferencia entre dos valores de datos cualesquiera
tiene un significado. En este nivel el cero es relativo (el cero no corresponde a la ausencia del dato) y las razones
entre valores no tienen significado.
Ejemplos
a) Temperatura
b) Talla
El tiempo (Etapa de la historia)

❖ Nivel de medición de razón


Incluye las propiedades del nivel de intervalo, pero además tiene un cero absoluto. En este nivel, la razón entre
valores es significativa.

Ejemplos
a) Distancias
b) Precios
c) Peso
12 Estadística Descriptiva Para Psicólogo
Resumen de los niveles de medición de las variables
Nominal Ordinal Intervalo Razón
Los datos sólo se Los datos se ordenan Diferencias Punto 0 y razón entre
clasifican significativas entre valores significativas
valores
Ejemplo Ejemplo Ejemplo Ejemplo
• Números de • El número de lista • Temperatura • Número de pacientes
camisetas de en las clases de atendidos.
los jugadores. bachillerato.
Verificando lo aprendido 7

¿Cuál es el nivel de medición de cada una de las siguientes variables?

Variable Nivel de medición


1. Los números en las camisetas de los corredores de
maratones.

2. La distancia que viajan los estudiantes para llegar a clases.

3. Los sizes de los uniformes de un equipo universitario


femenino de fútbol.

4. Una clasificación de personas de acuerdo con su afiliación


política.

5. Una clasificación de estudiantes que cursan primero,


segundo, tercero o último grados.

6. Número de horas que los alumnos estudian a la semana.

7. Calificaciones de las películas de una estrella, dos estrellas,


tres estrellas y cuatro estrellas.

8. Las temperaturas actuales en las capitales de las 50


entidades de Estados Unidos.
Capítulo 1. Conceptos Fundamentales de la Estadística 13
1.6 Tipos de fuente
Fuente de información
A medida que se lleva a cabo la investigación para escribir un trabajo, se encuentran distintas
fuentes de información. Estas diferentes fuentes generalmente se clasifican en primarias,
secundarias y terciarias. Su profesor podría requerir que se incluyan los tres tipos de fuentes
como base para su trabajo. Aquí se incluye una descripción de cada tipo de fuente de
información. Se proporcionan ejemplos para cada una.

❖ Fuentes de información primarias


Una fuente primaria de información proporciona información directa y de primera mano
sobre un evento, persona, objeto u obra de arte. Las fuentes primarias son contemporáneas
con lo que se describen. Son material original que no ha sido interpretado, condensado o
evaluado por otra persona.

• Ejemplos de fuentes primarias


a) Diarios
b) Poemas
c) Entrevistas

❖ Fuentes de información secundarias


Una fuente de información secundaria analiza, interpreta o debate la información sobre una
fuente primaria. Las fuentes secundarias son posteriores a lo que se describe dado que se
producirán algún tiempo después de que apareció la fuente de información primaria. Los
trabajos escritos por estudiantes contienen mayoritariamente fuentes secundarias.

Ejemplos de fuentes secundarias


a) Libros de texto
b) Artículos de revistas
c) Historia
14 Estadística Descriptiva Para Psicólogo
Capítulo 1. Conceptos Fundamentales de la Estadística 15
Pasos Del Método Estadístico De La Investigación Científica
❖ Método Estadístico
La investigación científica se basa en dos tipos de razonamientos: el deductivo y el inductivo,
mientras que la investigación estadística se desarrolla utilizando el ciclo deductivo-inductivo
en cuatro etapas:
1. Planteamiento del problema.
2. Recolección de la información.
3. Organización de la información.
4. Análisis e interpretación de los resultados.
1. Planteamiento Del Problema
El primer paso de la investigación es definir claramente los objetivos del estudio y relacionar este objetivo
con los valore numéricos de las variables observables. La investigación científica es una actividad con
propósito (finalidad, meta) y como tal para quedar enteramente caracterizado debe dar respuesta a las
siguientes interrogantes fundamentales:
a) ¿En qué consiste el problema objeto de investigación?
b) ¿Qué se quiere conocer?
c) ¿Por qué o para que se plantea su investigación?
d) ¿Sobre quién recae la investigación?
e) ¿Dónde se va realizar?
f) ¿Cuándo se va a realizar?
2. Recolección de la Información
La recolección correcta de los datos es de extrema importancia para el investigador, que tiene que ser
realizada o vigilada por este. Para remarcarlo los investigadores han establecido la ecuación entrada de
“datos basura” es igual salida de análisis “basura”.

Esta etapa consiste en determinar los métodos de recolección adecuado, preparar los instrumentos de
recolección, prueba del método y de los instrumentos de recolección seleccionados y realizar la
recolección de los datos.

3. Organización y Clasificación de los Datos


Aquí se debe hacer un análisis de consistencia y ajuste de los datos. Se trata de asegurar la validez y
confiabilidad de los datos recopilados. Luego se debe clasificar y tabular los datos y finalmente
presentarlos en cuadros estadísticos y gráficas.

4. Análisis e Interpretación de los Resultados


En esta etapa se calculan indicadores y medidas resumen que describen al conjunto de datos. También se
establece relaciones entre variables de modelos estadísticos que nos permitirán aceptar o rechazar los
modelos.
16 Estadística Descriptiva Para Psicólogo
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #1
Conceptos Fundamentales de la Estadística

Profesor: Leonido Rosario, MA


Participante
Matrícula
Fecha
Sección

1.1 ¿Qué es la estadística?

1.2 Muestra un ejemplo específico donde se vea la utilidad de la estadística en el área de tu


profesión (Sea lo más preciso posible)

1.3 Establezca la diferencia entre la estadística descriptiva y la inferencial.

1.4 Indique cuáles de las siguientes afirmaciones representan una variable y cuáles una
constante.
a) El número de letras del alfabeto. ____________________

b) El número de horas que tiene 1 día. _________________

c) La hora en que usted come_____________________

d) El número de centímetros en un metro__________________

e) Su peso____________________
Práctica 1. Conceptos Fundamentales de la Estadística 17
1.5 Analice si las siguientes variables son discretas o continuas.
a) Número de materias que usted ha cursado en su carrera. ________________
b) Peso del contenido de las cajas de cereal. __________________
c) Número de libros que usted leyó el año pasado (ojalá que hayan sido muchos).
_______________
d) Número de jonrones conectados por Samy Sosa en 1999. ____________________
e) Velocidad de un automóvil en km h .________________________

1.6 Indique cuáles de las siguientes situaciones corresponden a la estadística descriptiva y


cuáles a la estadística inferencial.
a) Un informe anual para accionistas que detalla los bienes de la corporación. _________________

b) Un profesor de historia que anuncia a su grupo el número de estudiantes que obtuvieron la máxima
calificación en un examen reciente. _________________

c) El cálculo de la media de un conjunto de datos de una muestra para caracterizarla. ___________________

d) El uso de los datos de una muestra en una encuesta para estimar la opinión de la población.
_____________________

e) Realizar un estudio de correlación sobre una muestra para determinar si el nivel educativo y el ingreso de
la población están relacionados. ____________________

1.7 Roger Amster enseña un curso de inglés para 40 estudiantes. En la clase de ayer, preguntó a los
cinco jóvenes que siempre se sientan en la parte posterior del aula si les gustaría que “A Tale of
Two Cities” fuera la tarea de lectura para la clase siguiente. Tres de los cincos dijeron que “si”.
a) Identifique la población y la muestra en este caso.

b) ¿Es probable que sea una muestra representativa? De no ser así, ¿Por qué no?
18 Estadística Descriptiva Para Psicólogo
1.8 Utilice el sentido común para determinar si el acontecimiento descrito es: imposible;
posible, pero muy improbable; posible y probable.
a) Multa por exceso de velocidad. Mientras conducía a su casa en Connecticut, David fue multado
por conducir a 250 millas por hora en una ruta con un límite de velocidad de 55 millas por
hora._____________________
b) Semáforos. Mientras conducía por la ciudad, Mario se encontró con tres semáforos consecutivos
y todos estaban en verde.__________________
c) Día de Acción de Gracias. El año próximo, el Día de Acción de Gracias caerá
lunes._____________________
d) Suprema Corte. Todos los magistrados de la Suprema Corte de Estados Unidos tienen la misma
fecha de cumpleaños. ______________________
e) Calculadoras. Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus, todas
funcionan adecuadamente. _________________
f) Dados de la suerte. Steve Wynn lanzó un par de dados y obtuvo un total de 14
puntos._________________________
g) Máquina tragamonedas. Wayne Newton obtuvo el premio mayor en la máquina tragamonedas en
10 intentos.____________________

1.9 La directora de producción para la planta de Ford Motor Company, debe informar a su
superior sobre el número de días promedio que los empleados de la planta se ausentan del
trabajo. Sin embargo, la planta emplea más de dos mil trabajadores, y la directora de
producción no tiene tiempo de revisar los registros personales de cada empleado. Como
asistente usted debe decidir cómo puede ella obtener la información necesaria.
a) ¿Qué consejo podría darle?

1.10 ¿Qué nivel de medición utilizaría usted en cada uno de los siguientes casos:
a) Un sistema para evaluar a los empleados con base en el número de días que faltan al
trabajo.

b) Un sistema para identificar las ciudades de nacimiento de los clientes.

c) Un sistema para registrar la población de las ciudades en las cuales viven los clientes.
Práctica 1. Conceptos Fundamentales de la Estadística 19
1.11 ¿En cuál escala de medida puede expresarse cada una de estas variables?
a) Los estudiantes clasifican a su profesor de estadística sobre una escala de “Terrible”, “No
tan malo”, “Bueno”, “Maravillosos”, y “dios griego”

b) Los estudiantes en una universidad están clasificados por profesión, tales como marketing,
administración y contaduría.

c) Los estudiantes están clasificados por cursos utilizando los valores 1, 2, 3, 4 y 5.

d) Edades de los clientes.

1.12 ¿Cuál es el nivel de medición de cada una de las siguientes variables?


a) Coeficientes intelectuales de los estudiantes.

b) La distancia que viajan los estudiantes para llegar a clases.

c) Los números en los jerseys de un equipo universitario femenino de fútbol.

d) Una clasificación de estudiantes por fecha de nacimiento.

e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados.

f) Número de horas que los alumnos estudian a la semana.

1.13 ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los periódicos?
a) El número de periódicos vendidos todos los domingos durante 2011.

b) Los diferentes departamentos, como edición, publicidad, deportes, etcétera.

c) Un resumen del número de periódicos vendidos por condado.

d) Cantidad de años que cada empleado ha laborado en el periódico.


20 Estadística Descriptiva Para Psicólogo
1.14 La empresa Gallup realizó una encuesta telefónica empleando una muestra aleatoria nacional
compuesta de 1005 adultos de 18 años o más. En la encuesta se les preguntó a los participantes “Cómo
considera que es su salud física en este momento” (www.gallup.com, 7 de febrero de 2002)”. Las
respuestas podían ser Excelente, Buena, Regular o Ninguna opinión.
a) ¿Cuál es el tamaño de la muestra de esta investigación?

b) ¿Cuál es la población?

c) ¿Son estos datos cualitativos o cuantitativos?

d) ¿Sería conveniente usar promedios o porcentajes para resumir los datos de estas preguntas?

e) De las personas que respondieron, 29% dijo que su salud era excelente. ¿Cuántos fueron los individuos
que dieron esta respuesta?

1.15 El Departamento de Comercio informa haber recibido las siguientes solicitudes para
concursar por el Malcolm Baldrige Nacional Quality Award: 23 de empresas fabricantes
grandes, 18 de empresas grandes de servicios y 30 de negocios pequeños.
a) ¿Es el tipo de empresa una variable cualitativa o cuantitativa?

b) ¿Qué porcentaje de las solicitudes venían de negocios pequeños?

1.16 En un estudio sobre los suscriptores de Business Week de Estados Unidos se recogen
datos de una muestra de 2861 suscriptores. Cincuenta y nueve por ciento de los
encuestados señalaron tener un ingreso de $75 000 o más y 50% indicaron poseer una
tarjeta de crédito de American Express.
a) ¿Cuál es la población de interés en este estudio?

b) ¿Es el ingreso anual un dato cualitativo o cuantitativo?

c) ¿Es la posesión de una tarjeta de crédito de American Express una variable cualitativa
o cuantitativa?

d) Describa cualquier inferencia estadística posible para Business Week con base en esta
encuesta.
Práctica 1. Conceptos Fundamentales de la Estadística 21
1.17 En otoño de 2003, Arnold Schwarzeneger disputó al gobernador Gray Davis la
gobernación de California. En una encuesta realizada entre los votantes registrados se
encontró que Arnold Schwarzeneger iba a la cabeza con un porcentaje estimado de 54%
(Newsweek, 8 de septiembre de 2003).
a) ¿Cuál fue la población en este estudio?

b) ¿Cuál fue la muestra en este estudio?

c) ¿Por qué se empleó una muestra en esta situación? Explique.

1.18 La UASD ha encuestado a sus estudiantes para averiguar el tiempo semanal medio que
dedican a navegar por internet.
a) ¿Cuál es la población?

b) ¿Cuál es la muestra?

c) ¿Cuál es el estadístico?

d) ¿Es el valor de 6.1 horas un parámetro o un estadístico?


22 Estadística Descriptiva Para Psicólogo
1.19 Una compañía aérae sostiene que menos de un 1% de los vuelos programados que
despegan del aeropuerto de Nueva York sale tarde. Se ha observado que el 1.5% de una
muestra aleatoria de 200 vuelos salió más tarde de la hora prevista.
a) ¿Cuál es la población?

b) ¿Cuál es la muestra?

c) ¿Cuál es el estadístico?

d) ¿El 1.5% es un parámetro o un estadístico?

1.20 Completa el siguiente cuadro guiándote del primer ejemplo:

Fracción Decimal Por cientos


2 0.2857 28.57%
7
3
4
0.5
35.12%
0.05

1.21 Responde las siguientes preguntas:


a) ¿Cuál es 37% de 500?

b) ¿Cuál es el 5% de 5020?

c) ¿Qué por ciento representa 56 de 803?

d) ¿Cuál es número cuyo 32% es 5492?


Práctica 1. Conceptos Fundamentales de la Estadística 23
1.22 Porcentajes en una encuesta Gallup. En una encuesta Gallup, aplicada a 734 usuarios
de internet, el 49% reveló que de manera frecuente u ocasional realiza compras en línea.

a) ¿Cuál es el número real de usuarios de Internet que afirmaron que compran en línea de
manera frecuente u ocasional?

b) De los 734 usuarios de internet encuestados por Gallup, 323 dijeron que de manera
frecuente u ocasional realizan planes de viaje consultando información en línea. ¿Cuál
es el porcentaje de personas que afirmaron que de manera frecuente u ocasional realizan
planes de viaje consultando información en línea?

1.23 En una encuesta que realizó Gallup con 976 adultos, 68 dijeron que consumen una
bebida alcohólica al día.

a) ¿Qué porcentaje de individuos encuestados dijeron que consumen la bebida alcohólica


al día?

b) De los 976 adultos encuestados, el 32% dijo que nunca bebe. ¿Cuál es el número real
de adultos encuestados que dijeron que nunca beben?
CAPÍTULO 2
Organización de los Datos
Distribuciones de Frecuencias y su Representación Gráfica
Competencias
Específicas
➢ Razona y argumenta.
Construye e interpreta
distribuciones de frecuencias
cualitativas y cuantitativas.
Organiza e interpreta datos
cualitativos o cuantitativos en una
gráfica apropiada.

➢ Comunica
Presenta cada paso para la
construcción de una distribución de
Fuente: Ministerio de Educación
frecuencias cualitativa o
Una vez que definimos con cuidado un problema, necesitamos cuantitativa.
recoger datos. A menudo el número de observaciones Presenta cada paso para la
recogidas es tan grande que los resultados efectivos del estudio construcción de una gráfica de
no están claros. Queremos reducir lo más posible una masa de acuerdo a la naturaleza de los datos
y al tipo de representación que se
datos, evitando al mismo tiempo la posibilidad de ocultar
desee.
características importantes por reducirlos excesivamente.
Para lograr el punto de equilibrio desafortunadamente no ➢ Modela y Representa
existe un método único, sin embargo, la línea de ataque Modela e interpreta situaciones de
la vida diaria a través de las
adecuada normalmente es específica de cada problema y distribuciones de frecuencias y sus
depende de dos factores: el tipo de datos y el fin del estudio. gráficas.

Se ha dicho que una imagen vale más que mil palabras. ➢ Conecta
Asimismo, un gráfico vale más que mil cifras. Utiliza las distribuciones y las
gráficas para resumir un conjunto
Una vez los datos han sido recolectados, siempre debemos de datos y explicarlo de una manera
sencilla.
preguntarnos: ¿cómo se pueden organizar? ¿Cómo se pueden
graficar? ¿Qué nos sugiere la gráfica? ➢ Resuelve problemas
Resuelve problemas del contexto
En esta unidad, se introducen tablas y gráficas adecuadas, educativo que impliquen
como distribuciones de frecuencia, gráficos de barras, gráficos construcciones de distribuciones y
de gráficas.
de tarta, diagramas de pareto, gráficos de series temporales,
histogramas, diagramas de tallo y hoja, ojivas y otras. Nuestro ➢ Utiliza herramientas
objetivo es resumir los datos de manera que tengamos una tecnológicas
imagen clara y precisa. Usa Excel, con el complemento
MegaStat y otras herramientas
Paul Newbold tecnológicas para construir
distribuciones de frecuencias y
gráficas.
Estadística Descriptiva Para Psicólogo 25
Introducción
Cuando la cantidad de información recolectada es relativamente grande, para responder a
cuestionantes que impliquen generalizaciones de los datos originales, es necesario tomar en
cuenta las distribuciones de frecuencias y las gráficas, que son dos formas de resumir de
manera genérica los datos originales.

Organización de los datos.


Una distribución de frecuencias es una tabla en la que organizamos los datos en clases, es
decir, en grupos de valores que describen una característica de los datos.

Modelo de tabla de frecuencia


Vehículos que vendió Grupo Motors por locación en seis meses.
Locación Números de autos vendidos
Toyota 52
Ford 40
Honda 45
Peugeot 43
Total 180

Razones de porqué las distribuciones de frecuencias son importantes


a) Es posible resumir conjuntos grandes de datos.

b) Se logra cierta comprensión sobre la naturaleza de los datos.

c) Se tiene una base para construir gráficas.

Distribución de frecuencia cualitativa


Es una agrupación de datos cualitativos en clases mutuamente excluyentes que muestra el
número de observaciones en cada clase. El ejemplo anterior es un modelo de distribución
cualitativa, ya que la variable “Locación” que está en la columna principal.

Distribución de frecuencia cualitativa relativa


Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias relativas,
que describe la proporción o el porcentaje de los datos que caen dentro de cada categoría.

frecuencia de la clase
frecuencia relativa =  100%
Total de datos
Estadística Descriptiva Para Psicólogo 26
2.1 La siguiente tabla muestra las respuestas (ficticias) de 60 pacientes postoperados, a quienes se solicitó
calificar su percepción del dolor en una escala ordinal de cuatro puntos, como parte de un estudio de
manejo del dolor. a) ¿Algunos niveles de dolor dominaron? b) ¿Era común el dolor severo? c) ¿Qué
proporción de pacientes tenía dolor muy severo? d) ¿Qué proporción sufría de dolor leve o de menor
intensidad?
Mediciones de dolor percibido de 60 pacientes.
01 Moderado 31 Muy Severo
02 Muy Severo 32 Muy Severo
03 Leve 33 Moderado
04 Leve 34 Muy Severo
05 Leve 35 Moderado
06 Muy Severo 36 Moderado
07 Moderado 37 Muy Severo
08 Muy Severo 38 Muy Severo
09 Leve 39 Leve
10 Leve 40 Muy Severo
11 Moderado 41 Leve
12 Muy Severo 42 Muy Severo
13 Severo 43 Leve
14 Muy Severo 44 Muy Severo
15 Moderado 45 Leve
16 Severo 46 Leve
17 Muy Severo 47 Leve
18 Muy Severo 48 Muy Severo
19 Muy Severo 49 Leve
20 Muy Severo 50 Muy Severo
21 Muy Severo 51 Muy Severo
22 Muy Severo 52 Muy Severo
23 Muy Severo 53 Muy Severo
24 Moderado 54 Muy Severo
25 Muy Severo 55 Muy Severo
26 Leve 56 Leve
27 Muy Severo 57 Leve
28 Leve 58 Leve
29 Muy Severo 59 Leve
30 Muy Severo 60 Leve
➢ Construye una distribución de frecuencia y responde las preguntas que se realizaron anteriormente:
Construcción de la distribución

a) ¿Algunos niveles de dolor dominaron?

b) ¿Era común el dolor severo?

c) ¿Qué proporción de pacientes tenía dolor muy severo?

d) ¿Qué proporción sufría de dolor leve o de menor intensidad?


Capítulo 2. Organización de los datos 27
➢ Distribución de frecuencia cualitativa acumulada
Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas, que presenta
la cantidad de observaciones que están dentro o por debajo de cada una de las clases. Cuando las
frecuencias acumuladas se dividen entre el número total de observaciones, el resultado es una tabla de
distribución de frecuencias relativas acumuladas.

2.2 Usa la distribución anterior y agrega una columna de frecuencia acumulada y otra de frecuencia
acumulada relativa.
Construcción de la distribución

Ejemplo 2.4
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 23
Aves 35
Reptiles 10
Anfibios 26
Peces 56
Total 150

Ejercicio 2.1
Complete la siguiente tabla de frecuencia.
Especie en peligro de f fr F Fr
extinción en USA
Mamíferos 69
Aves 77
Reptiles 14
Anfibios 9
Peces 71
Total 240
Estadística Descriptiva Para Psicólogo 28
➢ Distribuciones de frecuencias cuantitativas.
Es una agrupación de datos cuantitativos en clases mutuamente excluyentes que muestra el número
de observaciones en cada clase.
Considere las medidas del pulso (en latidos por minuto) obtenidas de una muestra aleatoria simple
de 20 mujeres y de otra muestra aleatoria simple de 30 hombres, con los resultados que se presentan
a continuación:
Pulsos (latidos por minutos) de hombres y mujeres
Mujeres
60 72 68 64 80 64 68 68 80 76
76 76 80 104 88 60 76 72 72 88
Hombres
68 64 8 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86

El pulso es sumamente importante, ¡ya que es muy difícil sobrevivir sin él! Los médicos utilizan el
pulso para evaluar la salud de los pacientes. Cuando el pulso tiene una frecuencia demasiado elevada
o baja, esto podría indicar que existe algún problema médico; por ejemplo, un pulso muy alto podría
indicar que el paciente tiene una infección o que está deshidratado.
Un problema surge cuando trabajamos con grandes conjuntos de datos, para poder interpretar los
datos necesitamos a menudo organizarlos y resumirlos elaborando una tabla llamada distribución
de frecuencias.

Antes de seguir trabajando con la distribución de frecuencias cuantitativas es necesario dominar algunos
conceptos:
Clase. Cada categoría de la distribución de frecuencias. (La tabla #1 tiene 5 clases)

Frecuencia. La cantidad de datos que caen en cada clase. (En la tabla #1 los números 7, 7,…, son las
frecuencias)

Límites de clase. Son los valores extremos de cada clase. (Los números 60 y 69 son los límites de la primera
clase)
Rango. Es la diferencia entre el dato máximo y el mínimo. ( R = xmax − xmin )  Rv = 104 − 60 = 44

Anchura de clase. Es la diferencia entre el límite inferior de una clase y el límite inferior de la siguiente
clase. ( A = li 2 − li1 ) (10 es la amplitud, ya que 70-60 =10). Para calcular la amplitud también usaremos la
fórmula  R
A= 
 C

Tabla #1
Latidos por minutos de las mujeres
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20
Capítulo 2. Organización de los datos 29
➢ Características de una tabla de distribución de frecuencias
Al construir una tabla de distribución de frecuencias para un conjunto de datos específicos, se
deben observar las características siguientes:
1. Las clases deben ser mutuamente excluyentes, es decir, cada dato sólo puede caer en una
clase. No debe haber traslape entre las clases: (15 y menos de 20, y 19 y menos de 25), en
estas dos clases hay traslape, ¿por qué?
2. El conjunto de clases debe ser exhaustivo, es decir, debe incluir todos los datos
considerados.
3. Si es posible las clases deben tener la misma amplitud.
4. La elección de la cantidad de clases a utilizar es un proceso subjetivo, esta debe ser
proporcional a la cantidad de datos. En general es conveniente elegir entre 5 y 20 clases.
En muchos de los casos usaremos la fórmula: C = 1 + 3.33log n , para aproximar la cantidad
de clases a utilizar.
5. Cuando sea posible las amplitudes de clases deben ser números redondos, es decir, 5,
10,15,…, 100.

➢ Procedimiento para construir una distribución de frecuencias


Para construir la tabla #1, que aparece arriba, se dan los siguientes pasos
Ejemplo 2.4
Construye una distribución de frecuencia a partir de los datos “pulsos
(latidos por minutos) de mujeres ordenados de menor a mayor”
Mujeres
60 60 64 64 68 68 68 72 72 72
76 76 76 76 80 80 80 88 88 104

Ahora veamos cómo se construye una distribución de frecuencia utilizando los pulsos de los
latidos por minutos de las 40 mujeres.
1. Rango.
R = xmax − xmin

2. Determine el número de clases.


C = 1 + 3.33log n .

3. Calcule la anchura de la clase.


R
A=
Nc
Estadística Descriptiva Para Psicólogo 30
4. Busque el límite inferior de la primera clase. Elija el valor más bajo o puede ser otro
número más pequeño.

5. Calcule los límites inferiores y superiores de cada clase.


Latidos por minutos
Pulso
Li Ls

6. Determine la frecuencia absoluta.


Se cuenta el número de datos que cae dentro de cada clase para construir la tabla de
distribución de frecuencias absolutas como en la tabla. Como se observa en la tabla.
Latidos por minutos de las 20 mujeres
Pulso Frecuencia

Total
Capítulo 2. Organización de los datos 31
Formas equivalentes y similar de representar una distribución, veamos:

Formato anterior
Pulso Frecuencia
60 y menos de 70 7
70 y menos de 80 7
80 y menos de 90 5
90 y menos de 100 0
100 y menos de 110 1
Total 20

Primera forma equivalente


Pulso Frecuencia
60, 70 ) 7
70, 80 ) 7
80, 90 ) 5
90, 100 ) 0
100, 110 ) 1
Total 20

Segunda forma equivalente


Pulso Frecuencia
60 – 70 7
70 – 80 7
80 – 90 5
90 – 100 0
100 – 110 1
Total 20

Forma similar
Pulso Frecuencia
60 – 69 7
70 – 79 7
80 – 89 5
90 – 99 0
100 – 109 1
Total 20
Estadística Descriptiva Para Psicólogo 32
Ejercicio 2.2
Construye una distribución de frecuencias para los datos dados a continuación:
Pulsos (latidos por minutos) de hombres
Hombres
68 64 80 72 64 72 60 86 76 60 84 72 56 64 60
72 56 68 64 60 68 60 60 56 84 72 84 72 84 86
Ordene los datos de menor a mayor

PASOS:
1. Busco el rango.
R = xmax − xmin

2. Determine el número de clases.


C = 1 + 3.33log n

3. Calcule la anchura de la clase.


 R
A= 
 C 

4. 4. Determine los límites de cada clase y complete la tabla.

Pulso de hombres por minutos de los 30 hombres


Pulso Frecuencia
Li Ls
Capítulo 2. Organización de los datos 33
Ejercicio 2.3
Construye una distribución de frecuencias con los datos dados a continuación.
Calificaciones de 20 estudiantes en un examen de 100 puntos
61 93 91 86 55 63 86 82 76 57
94 89 67 62 72 87 68 65 75 84
Ordene los datos de menor a mayor

PASOS:
1. Busco el rango.
R = xmax − xmin

2. Determine el número de clases.


C = 1 + 3.33log n

3. Calcule la anchura de la clase.


 R
A= 
 C

4. Determine los límites de cada clase y complete la tabla.

Calificaciones de los 20 estudiantes


Notas Frecuencia
Li Ls
Estadística Descriptiva Para Psicólogo 34
➢ Distribución de frecuencia acumulada para variable cuantitativa
Otro enfoque útil para expresar los datos es la tabla de distribución de frecuencias acumuladas,
que presenta la cantidad de observaciones que están dentro o por debajo de cada una de las
clases. Cuando las frecuencias acumuladas se dividen entre el número total de observaciones,
el resultado es una tabla de distribución de frecuencias relativas acumuladas.
Ejemplo 2.6
Una enfermera registró el peso de 30 hombres cuya edad estaba comprendida entre 20 y 25
años. Construya una distribución de frecuencias completa.
Peso de las 30 personas
160 120 134 130 112 154 170 200 200 175
150 136 145 154 180 148 159 154 119 115
155 133 154 130 170 155 161 153 154 126
Organizamos los datos
112 115 119 120 126 130 130 133 134 136
145 148 150 153 154 154 154 154 154 155
155 159 160 161 170 170 175 180 200 200
PASOS:
1. Busco el rango.
R = xmax − xmin

2. Determine el número de clases.


C = 1 + 3.33log n

3. Calcule la anchura de la clase.


R
A=
C

4. Distribución de frecuencias del peso de los 30 hombres


Pesos f f r (%) F Fr (%)

30
Capítulo 2. Organización de los datos 35
Interpretación de una distribución de frecuencias.
Si tomamos la distribución del peso de los 30 hombres, se pueden extraer informaciones
interesantes.
Pesos f f r (%) F Fr (%)
110 y menos de 125 4 13.3 4 13.3
125 y menos de 140 6 20 10 33.3
140 y menos de 155 9 30 19 63.3
155 y menos de 170 5 16.7 24 80
170 y menos de 185 4 13.3 28 93.3
185 y menos de 200 0 0 28 93.3
200 y menos de 215 2 6.7 30 100
30
a) ¿Cuántos hombres tienen un peso entre 155 y menos de 170 libras?

b) ¿Cuántos hombres pesan menos de 185 libras?

c) ¿Qué porciento de hombres pesa entre140 y menos de 155 libras?

d) ¿Qué porciento de hombres pesa menos de 155 libras?

e) Interprete la frecuencia simple de la clase #3

f) Interprete la frecuencia relativa de la clase #5

g) Interprete la frecuencia acumulada de la clase #4

h) Interprete la frecuencia relativa acumulada de la clase #6


Estadística Descriptiva Para Psicólogo 36
2.3 Presentación de los datos
La presentación de datos estadísticos constituye en sus diferentes modalidades uno de los
aspectos de más uso en la estadística descriptiva. A diario podemos visualizar a través de los
diferentes medios escritos y televisivos de comunicación masiva la presentación de los datos
estadísticos sobre el comportamiento de las principales variables económicas y sociales,
nacionales e internacionales.

Existen tres formas diferentes de presentar los datos estadísticos, que son: Presentación
escrita, presentación tabular y presentación gráfica.

2.3.1 Presentación escrita:


Esta forma de presentación de informaciones se usa cuando una serie de datos incluye pocos
valores, por lo cual resulta más apropiada la palabra escrita como forma de describir el
comportamiento de los datos.

2.3.2 Presentación tabular:


Cuando los datos estadísticos se presentan a través de un conjunto de filas y de columnas que
responden a un ordenamiento lógico, a este resultado le llamamos forma de presentación
tabular o simplemente tabla o cuadro estadístico.

Los elementos básicos de todo cuadro son: Título, encabezados, cuerpo del cuadro, columna
matriz y Fuente.
1. Título: 2. Encabezados:
Sirve para describir el contenido del cuadro. Son los distintos subtítulos que se colocan en
Se debe indicar que el título debe responder las la parte superior de cada columna.
inquietudes: ¿qué son los datos?, ¿dónde?,
¿cuándo? y ¿cómo se recogieron?
(Gómez, 2008)

3. Cuerpo: 4. Columna matriz:


El cuerpo contiene todas las informaciones Es la columna principal del cuadro.
numéricas que aparecen en la tabla.

5. Fuente:
Indica la procedencia de los datos. Cuando se usa una tabla con informaciones que ya han sido
elaboradas por otros, es un deber señalar la institución que las recopiló y presentó, Sin
embargo, si las informaciones fueron recopiladas y presentadas por la misma persona no es
necesario señalar la fuente.

Blanca Marvella García. Monografia.com


Capítulo 2. Organización de los datos 37
Ejemplo 2.7
Distribución de la muestra de estudiantes de 8vo grado elegidos de los centros con Jornada
Escolar Extendida, regional 08, distrito 02, año escolar 2014-2015.
No Centros con jornada extendida Cantidad Frecuencia relativa Muestra
1 Arturo Grullón 52 0.3355 39
2 Bao 9 0.0581 7
3 Luis María Pieter - La Barranca 15 0.0968 11
4 Generosa Ferreira - Sabana Iglesia 38 0.2452 28
5 Los Ranchos de Babosico Arriba 21 0.1355 15
6 La Zanja 20 0.1290 15
TOTAL 155 1 115
Fuente: Informaciones suministradas por el ministerio de educación, cuadro elaborado por
Leonido Rosario y Tomás Hernández, octubre 2015.

2.3.3 Representación gráfica de los datos.


Las gráficas proporcionan datos en un diagrama de dos dimensiones. En el eje horizontal
podemos mostrar los valores de la variable. En el eje vertical señalamos las frecuencias de las
clases mostradas en el eje horizontal. Las gráficas de distribuciones de frecuencias son útiles
debido a que resaltan y aclaran los patrones que no se pueden distinguir fácilmente en las
tablas. Atraen la atención del que las observa hacia los patrones existentes de frecuencias; nos
permiten estimar algunos valores con sólo una mirada y proporcionan una verificación visual
sobre la precisión de nuestras soluciones.

De acuerdo al tipo de variable que vamos a representar, las principales gráficas son las
siguientes:
a. Gráfica de barras
b. Gráfica de pastel
c. Histograma
d. Polígono de frecuencias
e. Ojivas
f. Gráfica lineal
g. Tallo y hojas
Estadística Descriptiva Para Psicólogo 38
a. La gráfica de barras.
Representa las frecuencias de acuerdo con las alturas relativas de un conjunto de rectángulos.
Los rectángulos adyacentes tienen una separación entre ellos. Este tipo de gráfico se usa para
representar datos cualitativos.
Ejemplo 2.8
Represente por medio de un gráfico de barras las ventas de Grupo Motors por locación
manualmente y luego utilizando Excel.
Locación Números de autos
Toyota 52
Ford 40
Honda 45
Peugeot 43
Total 180
1. Copie estos datos a
Excel.

2. Seleccionamos las
celdas que
queremos graficar.
Capítulo 2. Organización de los datos 39
3. Insertamos el gráfico

➢ Agrega un comentario, explicando la gráfica


-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Ejercicio 2.5
Representa la siguiente distribución de frecuencias usando un gráfico de barras.
Marcas de tenis que posee una tienda. Número de unidades vendidas durante los primeros 6 meses.
Puma 342
Nike 300
Jordán 243
Adidas 400
Gráfica de barras
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 40
b. Gráfica de pastel.
Gráfica que muestra la parte o porcentaje que representa cada clase del total de números de
frecuencia.

Ejemplo 2.9
Construye una gráfica de pastel con Excel usando la información de la tabla siguiente.
Gastos de la lotería del estado de Ohio en 2009
Uso del dinero de las ventas Cantidad ( en millones de dólares)
Premios 1460.0
Educación 702.3
Bonos 150
Gastos 124.3
Total 2436.6
Siguiendo los pasos para
graficar en vez de las barras Gastos de la lotería de Ohio en 2009
usamos el circular y
tendríamos.
6% 5%

Le damos formato para que nos


salgan los porcientos. 29%
60%

Análisis gráfico
Dado que cada rebanada del
pastel representa la porción
relativa de cada componente, es
posible compararlas con
facilidad: Premios Educación Bonos Gastos
✓ El gasto más cuantioso de la
lotería se canaliza hacia los
premios (60%) Nota:
✓ Cerca de la tercera parte En la mayoría de los casos, las gráficas de pastel son las más
(29%) de los fondos informativas cuando se trata de comparar la diferencia relativa
recaudados se transfieren a en el porcentaje de observaciones de cada una de las variables
educación. de la escala nominal.
✓ Los gastos de operación
apenas significan 5% de los
fondos recaudados.
Capítulo 2. Organización de los datos 41
Ejercicio 2.6
DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor
adicional, Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en
la preferencia de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una
bebida de Lima-limón. Se pidió a 270 consumidores seleccionados de forma aleatoria que
degustaran una prueba y eligieran la bebida que más les gustaba. Los resultados aparecen en
la siguiente tabla:
Bebida Número
Cola-Plus 60
Coca-Cola 90
Pepsi 90
Lima-limón 30
Total 270
a) ¿Son los datos de naturaleza cuantitativa o cualitativa?

b) Construya una gráfica de pastel utilizando las frecuencias relativas.

Gráfica de pastel

➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 42
c. Histograma
Describe una distribución de frecuencias mediante una serie de rectángulos adyacentes, cuya
base es proporcional a la anchura de cada clase (Valor del intervalo) y cuya altura es
proporcional a la frecuencia. En este tipo de gráfico se representan datos cuantitativos.

Ejemplo 2.10
Representa por medio de un histograma la siguiente distribución de frecuencias, usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Después de buscar las marcas de clases se grafican estas en el eje x y las frecuencias en el
eje y. El gráfico debe quedar así:

➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 43
Ejercicio 2.7
Representa por medio de un histograma la distribución de los pesos de 100 estudiantes del
CURSA que se muestra a continuación (usando Excel).
Peso (en libras) Cantidad de estudiantes
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2

➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 44
d. Polígono de frecuencias
Estrechamente relacionado con el histograma, este consiste en segmentos de líneas que
conectan los puntos formados por las intersecciones de las marcas de clases y las frecuencias
de clase.
Luego de graficar los puntos, se agregan dos clases, una en cada extremo de la escala de
valores observados. Éstas contienen cero observaciones, pero permiten que el polígono llegue
al eje horizontal en ambos extremos de la distribución.

Ejemplo 2.11
Representa por medio de un polígono de frecuencias la siguiente distribución de frecuencias,
manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad(MPH) Cantidad de conductores Marcas de clases (x)
30- menos de 40 2 30 + 40 70
x= = = 35
2 2
40- menos de 50 9 45
50- menos de 60 15 55
60- menos de 70 28 65
70- menos de 80 12 75
80- menos de 90 6 85
90-menos de 100 3 95
Usando Excel
➢ Análisis gráfico
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Velocidad (MPH) -------------------------------------------------------
-------------------------------------------------------
-------------------------------------------------------
Capítulo 2. Organización de los datos 45
Ejercicio 2.8
Representa por medio de un polígono de frecuencia la distribución de los pesos de 100
estudiantes del CURSA que se muestra a continuación (manualmente y usando Excel).
Peso (en libras) Cantidad de estudiantes x
120 – menos de 130 6
130 – menos de 140 20
140 – menos de 150 30
150 – menos de 160 27
160 – menos de 170 10
170 – menos de 180 5
180 – menos de 190 2

➢ Análisis gráfico
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 46
e. Ojiva
Recordemos que una distribución de frecuencias acumuladas nos permite ver cuántas observaciones
están por encima de ciertos valores. La gráfica de una distribución de frecuencias acumuladas se
conoce como ojiva. Una ojiva es una gráfica lineal que describe frecuencias acumuladas y utiliza
fronteras de clase a lo largo de la escala horizontal, y frecuencias acumuladas a lo largo del eje
vertical.

Ejemplo 2.12
Represente en una ojiva “menor que” la siguiente distribución, manualmente y usando Excel.
Salarios por hora (Dólares) Número de empleados
8 – 10 3
10 – 12 7
12 – 14 4
14 – 16 1
Solución:
Para lograr esto, es necesario transformar la distribución tomando en cuenta los límites
inferiores de cada clase y al final añadiremos una clase para que no queden observaciones
fuera.
Clases Frecuencias acumuladas
Menor que 8 0 ¿Por qué?
Menor que 10 3
Menor que 12 10
Menor que 14 14
Menor que 16 15
Usando Excel: Responda las siguientes
preguntas de acuerdo con
el gráfico.
a) ¿Cuántos empleados
ganan menos de 10
dólares por hora?

b) ¿Cuántos empleados
ganan menos de 12
dólares por hora?

c) ¿Cuántos empleados
ganan menos de 14
dólares por hora?

d) ¿A cuántos empleados
Salario por hora
se les investigó el
salario?
Capítulo 2. Organización de los datos 47
Ejercicio 2.9
Representa en una ojiva menor la siguiente distribución, manualmente y usando Excel.
Cantidad de conductores en cada categoría de velocidad en un tramo de una carretera
Velocidad (MPH) Cantidad de conductores
30- menos de 40 2
40- menos de 50 9
50- menos de 60 15
60- menos de 70 28
70- menos de 80 12
80- menos de 90 6
90-menos de 100 3
Clases (menor que) Frecuencias acumuladas

Gráfica ➢ Análisis gráfico


-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
-----------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 48
f. Gráfica de líneas
La gráfica de líneas se construye para mostrar la dependencia entre dos variables cuantitativas.
Ésta consiste en segmentos de recta que conectan los puntos observados para ambas variables.
Cuando x representa el tiempo, el resultado es la gráfica de la serie de tiempo de la variable y.
Ejemplo 2.13
La gerencia de una tienda de ropa para mujeres observa que las ventas registradas de bikinis
en los meses de marzo hasta septiembre del año 2000, tienen la siguiente distribución.
Construye una gráfica de líneas.
Meses Cantidad de bikinis vendidos
Marzo 80
Abril 80
Mayo 200
Junio 300
Julio 200
Agosto 170
Septiembre 100
Gráfica generada con excel
Ventas de bikinis
350

300

250

200

150

100

50

0
Marzo Abril Mayo Junio Julio Agosto Septiembre

➢ Análisis gráfico
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 49
Ejercicio 2.10
La siguiente distribución muestra los quintales de arroz vendidos por una factoría los primeros
6 meses del año 2000. Represente la información en una gráfica de línea:
Año Produción Gráfica de líneas

Enero 40

Febrero 46

Marzo 56

Abril 63

Mayo 73

Junio 78

Julio 60

Agosto 67

➢ Análisis gráfico:
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 50
g. Gráfica de tallo y hojas
Una gráfica de tallo y hojas representa datos cuantitativos separando cada valor en dos partes:
el tallo (el dígito ubicado en el extremo izquierdo y la hoja (el dígito del extremo derecho).

Ejemplo 2.14
Representa el pulso de las mujeres en un diagrama de tallo y hoja
76 72 88 60 72 68 64 80 64 68 120 80 76 68 72 96 52 68 72 80
Tallo (Decenas) Hoja (Unidades)

Ejercicio 2.11
Representa el pulso de los hombres en un diagrama de tallo y hoja
68 64 88 72 64 72 60 88 76 60 96 72 56 64 60 64 84 76 84 88
72 56 68 64 60 68 60 60 56 84 72 84 72 84 88 56 64 56 56 64
Tallo (Decenas) Hoja (Unidades)
Capítulo 2. Organización de los datos 51
2.4 Tablas y gráficos para describir relaciones entre variables
En los ejemplos anteriores hemos desarrollado gráficos para describir una única variable. Estas
“imágenes” nos han ayudado a analizar mejor la información que contenía un gran conjunto de
datos. Ahora, ampliamos las medidas gráficas para describir las relaciones entre dos o más variables.
En primer lugar, presentamos un diagrama de puntos dispersos para estudiar las posibles relaciones
entre dos variables cuantitativas. A continuación, analizamos tablas cruzadas de dos variables para
examinar posibles relaciones entre variables cualitativas.
➢ Diagramas de puntos dispersos
Un diagrama de dispersión es una gráfica de datos apareados (𝑥, 𝑦). El diagrama de puntos dispersos
es una representación de los datos, que se usa para verificar la relación entre dos variables
cuantitativas.
Muchos docentes quieren hacer creer que son excelentes maestros por las “notas que sacan sus
alumnos”, pero esas calificaciones, en múltiples ocasiones suelen ser un mal indicador. Es por esta
razón que el Minerd estudia la relación existente entre “la nota de presentación de cada asignatura
y la nota obtenida en cada prueba nacional”. Veamos los siguientes ejemplos.
Ejemplo 2.15
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Represente esos datos en un diagrama de dispersión:
Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de matemática
N P 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69
NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30

Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:
Análisis gráfico:
Relación entre la nota de presentación y la
Una interesante pauta es la tendencia
nota de prueba nacional de matemática
ascendente positiva: la nota de la
32 prueba nacional tiende a aumentar
30
directamente con la nota de
30% (Prueba nacional Mat)

28
26 presentación. Obsérvese también que la
24 relación no suministra una predicción
22 exacta. Algunos estudiantes que
20 obtienen una alta nota de presentación
18
de matemática tienen una calificación
16
14
baja en la prueba nacional. Vemos que
12 la pauta básica indica que las notas más
10 altas obtenidas en la nota de
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 presentación predicen mayores
70% (Nota de presentación Mat) calificaciones en las pruebas, pero los
resultados no son perfectos.
Estadística Descriptiva Para Psicólogo 52
Ejemplo 2.16
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Representa los datos en un diagrama de dispersión:
Minerd, nota de presentación y la de prueba nacional de matemática de los estudiantes del
aérea de mecatrónica de un politécnico de la regional 08, 1ra convocatoria, 2015.
NP 53 57 50 56 53 53 56 53 55 60 50 51 68 57 60 51 62
NPN 18 15 18 17 18 21 17 21 21 20 19 16 17 20 16 16 17
Representa los datos en un diagrama de dispersión:

Análisis gráfico:
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 2. Organización de los datos 53
2.4.1 Tablas cruzadas
Una tabla cruzada, llamada a veces tabla de contingencia, enumera el número de observaciones
correspondiente a cada combinación de valores de dos variables categóricas u ordinales. La combinación de
todos los intervalos posibles de las dos variables define las casillas en una tabla. Una tabla cruzada de r filas
y c columnas se denomina tabla cruzada de dimensión r×c.

La demanda de un producto por zonas residenciales


Un minorista de materiales de construcción ha estado estudiando un plan para abrir tiendas en nuevos lugares
dentro de su programa de expansión regional. En una ciudad propuesta para la expansión hay tres lugares
posibles: norte, este y oeste. El minorista sabe por experiencia que los tres mayores centros de beneficios de
sus tiendas son los de herramientas, madera y pintura. Para seleccionar un lugar, son importantes las pautas
de demanda de las diferentes partes de la ciudad. Ha pedido, pues, ayuda al departamento de estudios de
mercado para obtener y analizar los datos relevantes. Este minorista cree que tiene una ventaja comparativa
en la venta de herramientas.

En cada zona residencial, se contactó con 250 hogares por teléfono y se les pidió que indicaran cuál de tres
categorías de productos habían comprado la última vez que habían ido a una tienda de materiales de
construcción.

La encuesta se realizó para determinar la demanda de herramientas, madera y pintura. Las tres zonas
residenciales contienen el mismo número de hogares y, por lo tanto, la muestra aleatoria de 750 representa
la población de hogares de toda la ciudad.

Ejemplo 2.17
Tabla cruzada de la demanda de productos por parte de los hogares por zonas residenciales
Zona Herramientas Madera Pintura Ninguna Total
Este 100 50 50 50 250
Norte 50 95 45 60 250
Oeste 65 70 75 40 250
Total 215 215 170 150 750
Gráfica Análisis gráfico:
-----------------------------------------------------------
Demanda de productos por parte de los
-----------------------------------------------------------
hogares por zona de residencia -----------------------------------------------------------
-----------------------------------------------------------
100
Número de hogares

-----------------------------------------------------------
80
-----------------------------------------------------------
60 -----------------------------------------------------------
40 -----------------------------------------------------------
-----------------------------------------------------------
20
-----------------------------------------------------------
0
Este Norte Oeste -----------------------------------------------------------
-----------------------------------------------------------
Herramientas Madera Pintura Ninguna
-----------------------------------------------------------
-----------------------------------------------------------
Estadística Descriptiva Para Psicólogo 54
2.4.2 Gráfica de barras múltiples o compuestas
Ésta contiene dos o más conjuntos de barras, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.18
Construya una gráfica de barras múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
Gráfica de barras múltiples
Anáilisis gráfico:
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------
-------------------------------------------------------------------------------

Ejercicio 2.12
Un estudiante universitario en su primer ciclo tomó las siguientes asignaturas, sacando las
calificaciones que se muestran a continuación, en tres parciales de 20 puntos.
Asignaturas 1er parcial 2do parcial 3er parcial
Matemática 16 18 20
Español 12 20 20
Biología 14 14 18
Geografía 16 15 14
Inglés 15 14 18
Gráfica de barras múltiples
➢ Análisis gráfico
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
------------------------------------------------------------
Capítulo 2. Organización de los datos 55
2.4.3 Gráfica de barras por componentes o superpuestas.
En esta gráfica se representan todas las variables en una barra.

Ejemplo 2.19
La siguiente distribución muestra los volúmenes de ventas de los productos A, B y C en los
primeros 4 meses del año 2012 de una compañía. Construye una gráfica de barras
componentes o superpuestas.
Meses A B C Total
Enero 25 35 40
Febrero 35 45 20
Marzo 40 20 10
Abril 50 15 5
Gráfica de componentes o superpuestas
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Ejercicio 2.13
Representa la siguiente distribución de las ventas de vehículos en una gráfica de barras
componentes o superpuestas.
Meses Toyota Ford Honda Peugeot Total
Enero 52 40 45 43
Febrero 60 43 53 30
Marzo 59 41 56 31
Abril 65 45 64 25
Gráfica de barras componentes
➢ Análisis gráfico
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------
Estadística Descriptiva Para Psicólogo 56
2.4.4 Gráfica de líneas múltiples.
Ésta contiene dos o más conjuntos de líneas, y se utiliza para comparar dos o más conjuntos
de datos.
Ejemplo 2.20
Construya una gráfica de líneas múltiples de los datos, y luego describa cualquier tendencia
de la siguiente tabla que incluye el número (en miles) de hombres y mujeres estudiantes de
educación superior en diferentes años en Estados Unidos.
Año 2004 2005 2006 2007 2008 2009 2010
Hombres 7268 7356 7568 7568 7695 7802 7872
Mujeres 9826 9995 10,203 10,407 10,665 10,838 10,944
Fuente: National Center for Education Statistics
➢ Análisis gráfico:
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------
Ejercicio 2.14
Construya una gráfica de líneas múltiples para la distribución de los autos vendidos de una
agencia de vehículos al inicio del año 2010.
Condición Toyota Honda Peugeot Kia
Nuevos 30 20 5 25
Usados 60 55 10 70
Chocados y reparados 45 30 2 50
Gráfica de líneas múltiples
➢ Análisis gráfico:
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
-----------------------------------------------------------------------------------
57 Estadística Descriptiva Para Psicólogo
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #2
Organización de los Datos

Profesor: Leonido Rosario, MA


Participante
Matrícula
Fecha
Sección

2.1 Responde:

a) ¿Cuál es la diferencia entre los datos originales (sueltos) y una distribución de frecuencia?

b) ¿Por qué es útil convertir los datos originales (sueltos) en una distribución de frecuencia?

2.2 Grupos sanguíneos. A continuación, se presenta una lista de los grupos sanguíneos O, A, B, y AB de
donadores de sangre elegidos al azar. Construya una tabla donde resuma la distribución de frecuencias
de esos grupos sanguíneos.

O A B O O O O O AB O Grupo Sanguíneo Frecuencia


O O O B O B O A A A
O A A B AB A A A A O
A O O A A O O A O O
O O A A A A A A AB A

2.3 Un conjunto de datos consta de 38 observaciones. ¿Cuántas clases recomendaría para la


distribución de frecuencias?
58 Estadística Descriptiva Para Psicólogo
2.4 Un conjunto de datos consta de 230 observaciones entre $235 y $567. ¿Qué intervalo de
clase recomendaría?

2.5 Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto
129. Los datos se van a organizar en una distribución de frecuencias.

a) ¿Cuántas clases sugeriría?

b) ¿Qué cantidad sugeriría como límite inferior de la primera clase?


Práctica 2. Organización de los datos 59
2.6 A continuación se muestran las notas obtenidas en estadística de 30 estudiantes de 7mo
de un colegio. Construye una distribución de frecuencia.
80 90 92 85 75 86 87 88 89 70
74 72 71 82 98 90 76 60 63 73
78 81 84 85 65 93 86 88 82 89
Ordene los datos de menor a mayor

PASOS:
a) Busco el rango. R = xmax − xmin

b) Determine el número de clases. C = 1 + 3.33log n

c) Calcule la anchura de la clase.  A = R 


 C 

d) Construye la tabla.
60 Estadística Descriptiva Para Psicólogo
2.7 Quick Change Oíl Company cuenta con varios talleres en el área metropolitana de Seattle.
Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street
los pasados veinte días son las siguientes:
65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85

Los datos se organizarán en una distribución de frecuencias.


a) ¿Cuál es el rango?

b) ¿Cuántas clases recomendaría usted?

c) ¿Qué intervalo de clase sugeriría?

d) ¿Qué límite inferior recomendaría para la primera clase?

e) Organice el número de cambios de aceite como distribución de frecuencias.


Práctica 2. Organización de los datos 61
2.8 El gerente de Bilo Supermarket, en Mt. Pleasant, Rhode Island, reunió la siguiente
información sobre la cantidad de veces que un cliente visita la tienda durante un mes. Las
respuestas de 50 clientes fueron las siguientes:
5 1 7 2 4 3 4 4 6 7
1 3 8 5 4 5 6 6 6 5
8 10 1 4 9 6 12 5 4 15
1 4 2 4 12 11 2 7 5 1
3 14 6 9 5 4 3 6 5 1

➢ Comience a partir de 0 como límite inferior de la primera clase, utilice un


intervalo de clase de 3 y organice los datos en una distribución de frecuencias,
y agregue una columna de frecuencia relativa.
62 Estadística Descriptiva Para Psicólogo
2.11 Se le pidió a un grupo de personas que marque la imagen de su bebida gaseosa preferida.
Con la tabla de frecuencias obtenida elabora una gráfica de barras.
Bebidas gaseosas Frecuencia Absolutas
Sprite 10
Pepsi 25
Coca cola 30
7 up 15
Fanta 20

Gráfica de barras

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 63
2.12 La compañía Northwind Traders Tea recibe un informe acerca de las ventas de las cajas
de los productos que 6 empleados han podido poner en el mercado en el primer trimestre
del año 2000. Construye una gráfica de barras múltiples.
Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86

Gráfica de barras múltiples

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
64 Estadística Descriptiva Para Psicólogo
2.13 Representa la distribución de las ventas anterior en una gráfica de barras superpuestas
o por componentes.

Informe de ventas
Empleados Enero Febrero Marzo
Tomás Navarro 55 85 66
María Gonzáles 68 78 94
Antonio Bermejo 77 75 80
Fabricio Noriega 71 65 78
Arturo López 75 78 85
Enrique Gil 68 85 86
Gráfica de barras superpuestas

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 65
2.14 Construye una gráfica circular a partir del número de medallas obtenidas por cada país
en las Olimpiadas de Invierno del 1998.

País Número Medallas


Alemania 29
Noruega 25
Rusia 18
Estados Unidos 13
Japón 10
Corea del sur 6

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
66 Estadística Descriptiva Para Psicólogo
2.15 Las notas obtenidas de 50 estudiantes del CURSA en estadística básica se muestran en
la siguiente distribución. Construye un histograma.

Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1

Gráfica histograma

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 67
2.16 Construye un polígono de frecuencia con la distribución de frecuencia de las notas de
los estudiantes del punto anterior.
Notas Frecuencia
55 y menos de 60 5
60 y menos de 65 6
65 y menos de 70 8
70 y menos de 75 20
75 y menos de 80 7
80 y menos de 85 4
85 y menos de 90 2
90 y menos de 95 1

Gráfica: Polígono de frecuencia

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
68 Estadística Descriptiva Para Psicólogo
2.17 Representa en una ojiva menor la distribución de los pesos de 35 estudiantes del CURSA
que se muestra a continuación.

Peso Cantidad de estudiantes


120 y menos de 130 3
130 y menos de 140 8
140 y menos de 150 15
150 y menos de 160 12
160 y menos de 170 5
170 y menos de 180 4
180 y menos de 190 2

Gráfica ojiva (menor que)

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Práctica 2. Organización de los datos 69
2.18 Representa con un gráfico de líneas la cantidad anual de niños vacunados en una
población.
Años Niños vacunados
1980 805
1985 1250
1990 3500
1995 6550
2000 7200

Gráfica de líneas

Análisis gráfico
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
70 Estadística Descriptiva Para Psicólogo
2.19 Una compañía estudia el uso de cajeros automáticos en una ciudad. Una muestra de 30
cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer.
Elabore un diagrama de tallo y hojas.

83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Diagrama de tallo y hojas
Tallo Hojas

2.20 Molly’s Candle Shop tiene diversas tiendas de venta de menudeo en las áreas costeras
de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Molly´s han
solicitado que les envíe sus compras. La siguiente gráfica muestra el número de paquetes
enviados por día durante los pasados 100 días.

a) ¿Cuál es el número total de frecuencia?

b) ¿Cuál es la frecuencia de la clase 10 a 15?

c) ¿Cuál es la frecuencia relativa de la clase 20 a 25?

d) ¿Cuál es el punto medio de la clase 15 a 20?

e) ¿En cuántos días se enviaron 25 o más paquetes?


Práctica 2. Organización de los datos 71
2.21 La siguiente gráfica muestra el número de pacientes que admite diariamente el
Memorial Hospital por la sala de urgencias.

a) ¿Cuál es el punto medio de la clase que va de 2 a 4?

b) ¿Con qué frecuencia van de 4 a 6 pacientes por la sala de emergencia?

2.22 La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores
en la zona de Atlanta, Georgia. (Ojiva menor que)

a) ¿A cuántos soldadores se estudió?

b) ¿Aproximadamente cuántos soldadores ganan menos de $10.00 la hora?

c) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad? ¿Qué cantidad
es ésta?

d) ¿Qué porcentaje de soldadores gana menos de $20.00 la hora?


CAPÍTULO 3
Medidas de Tendencias Céntricas
Medidas Numéricas que Resumen un Conjunto de Datos
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e
interpreta la media (todas
las versiones), la mediana y
la moda de datos sueltos y
agrupados.
✓ Comunica
Explica cómo se obtiene la
media (todas las versiones),
la mediana y la moda de un
conjunto de datos sueltos y
agrupados.
✓ Modela y Representa
Modela situaciones, donde
se pueda calcular las
medidas de tendencias
céntricas.
✓ Conecta
Utiliza conexiones entre las
Fuente: Equipo de estadística. Dirección de evaluación de la calidad medidas de tendencias
La República Dominicana apuesta por la calidad de la educación. céntricas y las situaciones
Una de las tareas de la educación es la evaluación, ya que a través de la comunidad educativa.
de ella podemos tomar los correctivos de lugar, para la mejora de ✓ Resuelve problemas
las políticas que deben impactar las prácticas docentes. Resuelve problemas del
contexto educativo que
Para tomar decisiones correctas o las más idónea, es necesario impliquen calcular medidas
tener las informaciones correctas que emanan de los datos que de tendencias céntricas.
hemos recolectados en una investigación. ¿Cómo se podría hacer
generalizaciones de los datos originales sin las gráficas o tablas ✓ Utiliza herramientas
de frecuencias? tecnológicas
Usa Excel (con el
En esta unidad, se introducen las medidas de tendencia céntricas, complemento MegaStat) y
tales como: la media (en todas sus versiones), la mediana, y la otras herramientas
tecnológicas para calcular
moda. Nuestro objetivo es resumir un conjunto de datos a través
medidas de tendencias
de medidas de tendencias céntricas, con el fin de comprender e céntricas de datos sueltos y
interpretar el lenguaje de los datos. agrupados.
Capítulo 3. Medidas de Tendencias Céntricas 73
3.1 Introducción
Otra manera de visualizar la información que un conjunto de datos nos muestra aparte de las
distribuciones de frecuencias y las gráficas son las medidas de resumen, también conocidas
como medidas de tendencias céntricas.

Imagine que el maestro de estadística dio un examen con un valor de 20 puntos a un grupo de
20 participantes y los resultados fueron los siguientes:
20 13 7 12 18 16 17 9 11 10
12 18 14 17 3 5 6 3 1 15

Un participante le pregunta al facilitador, ¿cómo nos fue profe?, si usted fuera el facilitador,
¿qué le responde?

Una pregunta cómo esta podríamos responderla con un número que represente el equilibrio
de los datos. A las medidas que se sitúan en el centro de un conjunto de datos se le conoce
como medidas de tendencia central.

Antes de continuar con el estudio de las medidas de tendencia central, necesitamos revisar el
concepto de sumatoria por su aplicación en este tema.

3.2 Notación Sumatoria


Con frecuencia en estadística resulta importante poder encontrar la suma de todos los
términos de una distribución, es decir: X 1 + X 2 + X 3 + ... + X n

En lugar de escribir todos esos términos, introducimos una manera más concisa de expresar
dicha suma, llamada notación de sumatoria. Utilizando dicha notación, podemos escribir la
suma como:
n

X
i =1
i = X 1 + X 2 + X 3 + ... + X n ; donde i, n N

SÍMBOLO SIGNIFICADO
Letra griega mayúscula sigma, que indica sumatoria.
Estos naturales indican dónde inicia y dónde termina la suma,
respectivamente.
Variable
NOTA:
Cuando la sumatoria se realiza con todos los datos (de 1 a n) se abreviará de la siguiente manera:
74 Estadística Descriptiva Para Psicólogo
Ejemplos 3.1
Para los siguientes datos, determine la sumatoria correspondiente.

a.
X 6 8 9 10 X i =
3
b.
Y 4 -10 25 5 Y =
i =1
i

3
c.
Y 4 -10 25 5 Y
i =2
i
2
=

Z +3 =
d.
Z 2 -12 14 16 i

e.
Z 2 -12 14 16 (Z i + 3) =

f.
X 6 8 9 10 X i
2
=

g.
( X )
2
X 6 8 9 10
i =
PROPIEDADES DE LA SUMATORIA
No PROPIEDAD SIGNIFICADO
1 La sumatoria de una constante es igual a n veces la constante.

2 La sumatoria de una suma algebraica de dos o más variables


es igual a la suma algebraica de las sumatorias de las variables.
3 La sumatoria de una diferencia algebraica de dos o más
variables es igual a la diferencia algebraica de las sumatorias
de las variables.

4 La sumatoria del producto de una constante por una variable


es igual al producto de la constante por la sumatoria de la
variable.
Capítulo 3. Medidas de Tendencias Céntricas 75
➢ Medidas de tendencia céntricas
Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de
un conjunto de datos.
Las medidas de tendencias central más usadas son:
➢ La media ➢ Media ponderada
➢ La mediana ➢ Media geométrica
➢ La moda
3.2 Media Aritmética para datos sueltos
La media aritmética es la medida numérica más importante que se utiliza para describir datos; comúnmente
se le conoce como promedio.
La media aritmética de un conjunto de valores es la medida de tendencia central que se calcula al sumar los
valores y dividir el total entre el número de valores.
Fórmula para la media de una muestra Fórmula para la media de una población
x x
x= =
n N
Ejemplo 3.2
Las notas de dos estudiantes del Liceo Nocturno “Aguas de Amor” en el año escolar fueron las siguientes.
Alumnos P1 P2 P3 P4
A 85 90 98 95
B 94 85 80 75
a) ¿Cuál es la nota promedio de los periodos del alumno A?

b) ¿Cuál es la nota promedio de los periodos del alumno B?

c) ¿Qué se observa en el comportamiento de las notas del alumno A en el año escolar?

d) ¿Qué se observa en el comportamiento de las notas del alumno B en el año escolar?

e) Si usted fuera el docente, ¿qué harías después de entregar las calificaciones del primer periodo para
motivar el incremento de la nota del alumno A?

f) Si usted fuera el docente, ¿qué harías después del segundo periodo para evitar que el descenso de las
calificaciones del estudiante B siga su curso?
76 Estadística Descriptiva Para Psicólogo
➢ Ventajas y desventajas de la media aritmética
Ejercicio 3.1
Complete la tabla y deduzca qué sucede.
Datos Media
1, 2, 5, 9, 10
1, 2, 5, 9, 100
1, 2, 5, 9, 1000
1, 2, 5, 9, 10000
➢ ¿Qué ventajas posee la media? ➢ ¿Qué desventajas tiene la media?

Ejercicio 3.3
Complete la tabla y deduzca qué sucede.
Datos Promedio x−x
2 2 + 5 +1+ 4
x=
5 4
1 12
x=  x=3
4 4
( x − x) =
n=4

¿Cuál fue el resultado de la sumatoria de las desviaciones con respecto a la media?

Ventaja
Una ventaja de la media es que resulta relativamente confiable, de manera que cuando se seleccionan
muestras de la misma población, las medias muéstrales tienden a ser más consistentes que otras
medidas de tendencia central.
3.3 Características de la media aritmética
1. Todo conjunto de datos cuantitativos posee una media y esta es única.
2. Todos los valores se encuentran incluidos en el cálculo de la media.
3. La media es muy sensible a los datos extremos. Un valor extremo perturba
considerablemente el equilibrio de los datos.
4. La suma de las desviaciones de cada valor con respecto a la media es cero.  ( X −  ) = 0
Capítulo 3. Medidas de Tendencias Céntricas 77
Desventaja de la media
Una desventaja de la media es su sensibilidad a los valores extremos, la mediana resuelve en
gran medida, esa desventaja. La mediana es el valor intermedio, ya que la mitad de los datos
están por debajo de la mediana y la otra mitad por encima de ella.

3.4 Mediana para datos sueltos


La mediana es el dato que está ubicado en el centro de un conjunto de datos ordenados cuando el
número de datos es impar. Si el número de datos es par, entonces, la mediana será el promedio de los
dos valores céntricos. La mediana suele denotarse con x . La posición de la mediana viene dada
n +1
por: x =
2

Ejemplo 3.3
Calcule la mediana de los siguientes datos:
Datos Ordene los datos Mediana
a) 8, 10, 4, 3, 1, 15
b) 2.5, 1.8, 1.2, 2.48, 2.0
c) 2, 3, 5, 7, 10
d) 2, 3, 5, 7, 100
e) 2, 3, 5, 7, 1000
➢ ¿Qué observa en los ejemplos c, d, y e? ¿A qué conclusión llegas?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

3.5 Características de la mediana


1. En su cálculo no se incluyen todos los valores de la variable.
2. La mediana no es afectada por los valores extremos.
78 Estadística Descriptiva Para Psicólogo
3.6 Moda para datos sueltos
La moda es otra medida de tendencia central de importancia en la descripción y resumen de
una distribución de frecuencias.
Es utilizado en el lenguaje común, por ejemplo, ¿cuándo las damas dicen que una cartera está
de moda? En estadística se tiene una idea similar de la moda de un conjunto de datos.

Moda
Se define como el dato con mayor frecuencia.

Ejemplo 3.4
Complete la tabla.

Datos Moda
a) 1, 2, 4, 2, 3
b) 1, 2, 5, 9, 4, 999
c) 1, 2, 1, 2
d) 1, 2, 1, 2, 5
e) 1, 2, 5, 9, 5, 555

3.7 Características de la moda


1. En su cálculo no se incluyen todos los valores de la variable.
2. No es afectada por los valores extremos.
3. El valor de la moda puede afectarse de acuerdo con el método de designación de los
intervalos.
Capítulo 3. Medidas de Tendencias Céntricas 79
Comparación entre la media, mediana y moda.
Al decidir si vamos a utilizar la media aritmética, mediana o moda en una distribución
unimodal, se debe tomar en cuenta la forma la distribución de los datos, que puede ser de tres
maneras: simétrica, con sesgo positivo o con sesgo negativo.
1. Una distribución es simétrica cuando la curva que la representa es exactamente igual a ambos
lados de un punto de referencia. Si una distribución es simétrica decimos que es insesgada. En
este tipo de distribución la media, mediana y la moda son iguales. Por tanto, cuando la
distribución es simétrica no importa la medida que se use, pues son iguales. Observa la figura 1.

2. Una distribución de datos tiene asimetría positiva o está sesgada a la derecha si la cola se
extiende más a la derecha del pico que a la izquierda. En este tipo de distribución la
𝑀𝑜𝑑𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑒𝑑𝑖𝑎. En distribuciones sesgadas la mediana suele ser la mejor
opción. Observa la figura 2.

3. Una distribución de datos tiene asimetría negativa o está sesgada a la izquierda si la


cola se extiende más a la izquierda del pico que a la derecha. En este tipo de distribución
la 𝑀𝑒𝑑𝑖𝑎 < 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑀𝑜𝑑𝑎. En distribuciones sesgadas la mediana suele la mejor opción.
Observa la figura 3.
80 Estadística Descriptiva Para Psicólogo
3.8 Media, mediana y moda para datos agrupados
Es preciso indicar que cuando tenemos una tabla de frecuencia no es posible buscar la media,
mediana o la moda real, ya que no tenemos los datos puntuales, por tanto, lo que buscamos es
una aproximación de éstas.

Hoy en día el uso de las medidas de tendencias céntricas para datos agrupados resulta poco
útil por el avance de las Tics, es por esta razón que sólo nos limitaremos a mencionar las
fórmulas sin ninguna aplicación o resolución de ejercicios.

Para calcular la media, mediana y moda si los datos están en una distribución de frecuencia
se debe usar las fórmulas descritas a continuación.

Media para datos agrupados


Cuando los datos aparecen con sus respectiva con sus respectivas frecuencias, para determinar
la media de ellos, se usa la expresión:
 ( f  x)  ( f  x)
x= =
f n

 ( f  x)
x=
n

Esta misma fórmula se usará cuando los datos aparezcan ordenados en una distribución de
li + ls
frecuencia con la salvedad de que x = es el punto medio de cada clase.
2

Mediana para una muestra de datos agrupados


Si los datos aparecen agrupados para determinar la mediana se usará la fórmula:
 n − Fi −1 
x = li +  2 c
 fi 
 
Símbolo Significado

li Es el límite inferior de la clase que tiene la mediana.

n Es la mitad del número de datos (recuerde que la mediana se sitúa en la mitad de los datos)
2
Fi−1 Es la sumatoria de las frecuencias que están por debajo de la clase que contiene a la mediana.

fi Es la frecuencia de la clase mediana

c c = li2 − li1
Es el tamaño de la clase, se determina así:
Capítulo 3. Medidas de Tendencias Céntricas 81
3.10 Moda de una muestra de datos agrupados
Si los datos aparecen agrupados para determinar la moda se usará la fórmula:
 d c 
mod = li +  1 
 d1 + d 2 

Nota:
li Es el límite inferior de la clase que tiene la mayor frecuencia.

d1 = f m − f m −1

d 2 = f m − f m +1

c = li2 − li1
Es el tamaño de la clase.
82 Estadística Descriptiva Para Psicólogo
3.11 Media Ponderada
Situación introductoria
Una estudiante obtuvo calificaciones de 90 puntos en el examen parcial, 70 puntos en el examen final y 83
puntos en un proyecto semestral. Si estas tres notas se importantizan en 20%, 70% y 10% respectivamente,
¿Cuál es la media de las calificaciones?

Solución:
90 + 70 + 83
x= = 81
3
➢ ¿Será 81 realmente la media que representa estos datos? ¿Qué debilidad tiene esta media?

Definición
Media ponderada. Esta media nos permite calcular un promedio que tome en cuenta la importancia de cada
valor con respecto al total. La fórmula es:

 ( w x) Donde w es el peso de los datos y x son las


x= observaciones o datos.
w
Si en el ejemplo anterior se hace los cálculos, se tiene que:
0.20  90 + 0.70  70 + 0.10  83
x=
0.20 + 0.70 + 0.10
75.3
x=
1
 x = 75.3
De manera que el estudiante obtuvo realmente una calificación de 75.3 puntos y no de 81 puntos. Si el
estudiante quería que le fuera mejor, ¿en cuál de las tres evaluaciones debió esforzarse más?

Ejemplo 3.9
Rafaela, estudia Educación Inicial en la UASD. En el semestre pasado ella obtuvo las calificaciones que se
muestran en la tabla. Ayúdala a determinar su índice académico de dicho semestre.
Asignatura Calificación Créditos xw
Educación Física 100 1
Didáctica General 92 4
Leng Esp Y Tecn De Exp II 98 3
Introducción A La Informática 80 4
Matemática Básica 75 4
Total 16
Calcule la calificación cuatrimestral media del estudiante.
Solución:
 ( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 83
Ejercicio 3.4
Imagine que en el ejemplo anterior Rafaela confundió las calificaciones de las asignaturas de Educación Física
y Matemática básica, es decir que las notas de estas dos materias iban intercambiadas, como se muestra en la
tabla. a) ¿Su índice académico aumenta o disminuye? b) ¿Cuál sería su nuevo índice académico?
Asignatura Calificación Créditos xw
Educación Física 75 1
Didáctica General 92 4
Leng Esp Y Tecn De Exp II 98 3
Introducción A La Informática 80 4
Matemática Básica 100 4
Total 16
Calcule la calificación cuatrimestral media del estudiante.
Solución:
 ( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Ejercicio 3.5
Un estudiante realizó 17 créditos en una universidad durante el primer cuatrimestre. Suponga que se le asigna
un valor de 4 a A, 3 a B, 2 a C, 1 a D y 0 a F.
Asignatura Calificación Valor Créditos V*C
Inglés C 4
Matemáticas B 5
Biología B 3
Español C 5
Total 17
Calcule la calificación cuatrimestral media del estudiante.
Solución:
 ( w x)
x=
w
Respuesta
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
84 Estadística Descriptiva Para Psicólogo
3.12 Media geométrica
Imagina que tenemos tres elementos consecutivos a, m y b de una
progresión geométrica como se muestra en la figura que está a la derecha.
m b
Esto significa, que r = = , lo que implica que m = ab  m = ab , a esta
2
a m
expresión se le conoce como la media geométrica para dos valores, pero si
son varios valores, entonces, la media geométrica es:
xg = n x1  x2  x3  xn
Ejemplos 3.10
Calcula la media geométrica de:
Datos Media geométrica

a) 2, 18

b) 9, 3, 3

c)1, 3, 9, 2

d)2, 3, 5, 6, 1

Nota:
La media geométrica suele utilizarse para promediar por ciento (tasa de interés). Cuando
trabajamos con cantidades que cambian cada cierto tiempo y se requiere conocer una tasa
promedio de cambio utilizamos la media geométrica.

El factor de crecimiento se define así: f .c. = 1 + tasa


Precio del arroz Factor de crecimiento
Capítulo 3. Medidas de Tendencias Céntricas 85
Ejemplo 3.12
La compañía Birch, fabricante de tableros de circuitos eléctricos, ha producido el siguiente
número de unidades en los últimos cinco años. Calcule el aumento porcentual promedio de
unidades producidas en cada año.
Años Producción Factor de crecimiento
2004 12,500
2005 13,250
2006 14,310
2007 15,741
2008 17,630

Respuesta:

Ejercicio 3.6
La siguiente distribución presenta el gasto (millones de pesos dominicanos) del gobierno
central durante el periodo 1992-1996. Calcule el aumento porcentual promedio del
crecimiento en cada año.
Año Gasto Factor de crecimiento
1992 16,056
1993 20,727.5
1994 23,135.3
1995 24,107.4
1996 27,691.1
Solución:

Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
86 Estadística Descriptiva Para Psicólogo
Otro modelo de aplicación de la media geométrica se relaciona con la determinación de un
cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en el
año 2000 y $50 000 en el 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta
es de 5.24%. La tasa de incremento porcentual promedio se deduce a partir de la fórmula del
interés compuesto:

s = c (1 + i )  c (1 + i ) = s
n n

s s
(1 + i ) (1 + i )
n n
=  n
= n
c c
s s
1+ i = n  i= n −1
c c

3.13 Tasa de incremento porcentual promedio durante el tiempo.

Valor al final del periodo


tg = n −1
Valor al inicio del periodo

Ejemplo 3.13
Una persona toma prestado de 827,000 pesos en el año 2015 y debe de pagar un total de
1, 665,000 en 2020. Durante este periodo:
a) ¿Cuánto pagó de intereses?
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

b) ¿Cuál fue la tasa de incremento porcentual promedio durante el tiempo?


-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Capítulo 3. Medidas de Tendencias Céntricas 87
3.14 Características y aplicaciones de la media geométrica.
1. Toma en cuenta todos los valores de la variable. Si uno de los valores es cero, la media
geométrica dará cero.

2. La media geométrica es afectada por datos extremos, aunque en menor medida que la
media aritmética.

3. Es mayormente usada para promediar tasas de cambio, razones y valores que muestren una
progresión geométrica.

3.15 Media armónica


Esta medida céntrica se define como la inversa de la media aritmética del recíproco de los
valores de la variable. Esta medida es útil cuando en el problema estudiado intervienen
unidades de medidas compuestas por un cociente o por una relación inversa.

La fórmula para calcular la media armónica de datos sueltos es:


n
xa =
 (1 x )
Ejemplo 3.14
Calcular la media armónica para los siguientes valores: 5, 4, 8, 10, 2
Solución:
5
xa = = 4.25
(1 5 + 1 4 + 1 8 + 1 10 + 1 2 )

 xa = 4.25

Respuestas:
La media armónica de la muestra de datos es 4.25
3.15 Características y aplicación de la media armónica:
1. Se toman en cuenta todos los valores de la variable para su cálculo.
2. Es menos afectada por los datos extremos.
3. El uso de la media armónica no es común, sin embargo, es de gran utilidad cuando se trata
de algunas magnitudes físicas y otros campos relacionados.
88 Estadística Descriptiva Para Psicólogo
3.16 Media cuadrática
La media cuadrática se define como la raíz cuadrada de la media aritmética de los cuadrados
de los valores de la variable. La fórmula es:
xc =
x 2

N
Esta medida es útil en muchos cálculos de ciencias.
Ejemplo 3.15
Calcule la media cuadrática de los datos: 1, 3, 4, 5, 7
Solución
12 + 32 + 42 + 52 + 72
xc =
5
1 + 9 + 16 + 25 + 49
xc =
5
100
xc = = 20 = 4.47
5
 xc = 4.47
Respuestas:
La media cuadrática de la muestra de datos es 4.47
Ejercicio 3.9
Encuentre la media cuadrática para los siguientes datos muestrales: 10, 12, 24, 13,15, 22
Solución:

Respuesta:
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------
3.17 Características y aplicación de la media cuadrática:
1. En el cálculo de media cuadrática se emplean todos los datos de la variable.

2. Una aplicación clásica de la media cuadrática es la determinación del valor eficaz de un


parámetro sinusoidal en electricidad, en corriente alterna (tensión en voltios o intensidad
en amperios).
Capítulo 3. Medidas de Tendencias Céntricas 89
3.9 A continuación, se dan las evaluaciones de la asignatura de matemática de 6to A del Área
de Informática del Politécnico Dios es Amor. Complete el cuadro evaluativo
manualmente y usando Excel, luego responda las preguntas dadas a continuación.
Prof. Juana
no P1 P2 P3 P4 NF 50% Ex C 50% NCFC 30% Ex Ext 70% NCFE
NF Ex C NF Ex Ext
01 87 86 94 80
02 75 75 70 70
03 79 72 85 78
04 60 64 60 60 80
05 90 78 85 99
06 89 80 87 90
07 50 65 60 60 50 90
08 80 80 82 87
09 99 100 95 99
10 85 80 95 93
a) ¿Cuál es el por ciento promovido de la materia al final de año? NF

b) ¿Cuál es el promedio de la nota final del año escolar de los 20 alumnos?

c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 88 puntos?

d) ¿Cuál fue el por ciento de reprobados?


90 Estadística Descriptiva Para Psicólogo
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #3
MEDIDAS DE TENDENCIAS CENTRÍCAS

Profesor: Leonido Rosario, MA


Participante
Matrícula
Fecha
Sección

3.1 Para cada uno de los siguientes conjuntos de datos, determine,


n
Variable x
x
i =1
i

a) 2, 4, 5, 7
b) 2.1, 3.2, 3.6, 5.0, 7.2
c) 11, 14, 18, 22, 25, 28, 30
d) 110, 112, 115, 120, 133

3.2 Represente cada una de las siguientes expresiones por medio de la notación de sumatoria:
a ) x1 + x2 +  + x10 =

b) x1 + x2 + x3 =

c ) x12 + x22 + x32 + x42 + x52 =

3.3 Calcule la media, la mediana y la moda de los siguientes datos:


Datos Media Mediana Moda
5, 2, 8, 2, 3, 2, 4, 0, 6

1.5, 4.5, 3.2, 1.8, 5.0, 2.2


Práctica 3. Medidas de Tendencia Céntricas 91
3.4 Para el siguiente conjunto de datos, indique si utilizaría la media o la mediana para
representar la tendencia central de la distribución y explique las razones de su decisión.
Datos:
1.2, 0.8, 1.1, 0.6, 25

Explicación:

3.5 Estudio de casos. En un estudio que se realizó en un asilo de ancianos, se tomó las edades
de los envejecientes que pueden caminar sin dificultades. Busque la media, mediana y
moda de los siguientes datos: 69 73 65 70 71 74 65 69 60 62

3.6 Ciencias. Un científico social para una organización defensora de la niñez seleccionó de
manera aleatoria 10 programas de caricaturas por televisión del sábado en la mañana y
efectuó un análisis del contenido, donde cuenta la cantidad de incidentes de violencia física
o verbal en cada uno. Para las 10 caricaturas examinadas, estas fueron las cuentas: 27, 12,
16, 22, 15, 30, 14, 30, 11 y 21. Determine la media, la moda y la mediana para estos datos.
92 Estadística Descriptiva Para Psicólogo
3.5 El director de unos grandes almacenes tiene interés en saber cuántas reclamaciones recibe
el departamento de atención al cliente sobre la calidad de los aparatos eléctricos que
venden los almacenes. Los registros de un periodo de 5 semanas muestran el siguiente
número de reclamaciones semanales:

13 15 8 16 8

a) Calcule el número medio de reclamaciones semanales.

b) Calcule el número mediano de reclamaciones semanales.

c) Halle la moda.

3.6 Diez economistas recibieron el encargo de predecir el crecimiento porcentual que


experimentará el índice de precios de consumo el próximo año. Sus predicciones fueron:
3.6 3.1 3.9 3.7 3.5
3.7 3.4 3.0 3.7 3.4

a) Calcule la media muestral.

b) Calcule la mediana muestral.

c) ¿Cuál es la moda?

3.7 La demanda de agua embotellada aumenta durante la temporada de huracanes en Florida.


En una muestra aleatoria de 7 horas, se observó que en una tienda se vendió el siguiente
número de botellas de 1 galón:
40 55 62 43 50 60 65

a) Describa la media.

b) Determina la mediana.

c) Determina la moda.
Práctica 3. Medidas de Tendencia Céntricas 93
3.11 Durante un período de una hora en una tarde calurosa de un sábado, el cantinero Julio
sirvió cuatro bebidas. Calcule la media ponderada de los precios de las bebidas
(Precio ($), cantidad vendida).
Bebidas Precio Cantidad PC Proceso
B1 50 5
B2 75 15
B3 90 15
B4 110 15
Total

3.12 Suponga que el Hospital Regional Universitario José María Cabral y Báez tiene 200
empleados en su personal de enfermería. 50 son auxiliares de enfermería; 50 enfermeras
practicantes, y 100 son enfermeras tituladas. Las auxiliares de enfermería ganan 200 pesos
la hora; las enfermeras practicantes 300 pesos y los titulados 400 pesos la hora. ¿Cuál es
el salario promedio ponderado por hora?
94 Estadística Descriptiva Para Psicólogo
3.13 A continuación, se mencionan las materias que Luís Pérez llevó en el primer semestre
de Ingeniería Química, el número de créditos y la calificación obtenida, determine la
calificación promedio que obtuvo Luís Pérez en su primer semestre. Utilice la media
ponderada.
Materia Número de Calificación Producto Proceso
créditos (1) (2)
Metodología de la Inv. 3 90

Matemática 1 4 100

Programación 8 81

Química 10 78

Dibujo 6 100

Economía 4 84

Total

3.14 El crecimiento en el gasto por deudores morosos de una compañía financiera durante
los últimos años es el que se muestra a continuación. Calcule el incremento promedio
porcentual del gasto por deudores morosos durante ese periodo.
Año Tasa de Factor de Proceso
interés crecimiento
2008 0.110

2009 0.090

2010 0.075

2011 0.080

2012 0.095

2013 0.108

2014 0.120
Práctica 3. Medidas de Tendencia Céntricas 95
3.15 En 1985 había 340,213 suscriptores a la telefonía celular en Estados Unidos. En 2008,
el número de suscriptores aumentó a 262,700,000.
a) En número de suscriptores, ¿de cuánto fue el incremento para este periodo?

b) ¿De cuánto es el ritmo de cambio promedio anual de suscriptores?

c) ¿Cuál es la media geométrica del incremento anual del periodo?

3.16 La compañía de Juan, fabrica computadora, y ha producido el siguiente número de


unidades en los últimos cinco años:
2000 2001 2002 2003 2004
12,200 13,550 16,000 18,600 23,123
Calcule el aumento porcentual promedio de unidades producidas en este periodo
96 Estadística Descriptiva Para Psicólogo
3.17 Define los siguientes conceptos:
Conceptos Significado
Media

Mediana

Moda

3.18 Calcule la media cuadrática y la media armónica de los siguientes datos muestrales:
2, 3, 1, 5, 5
Media cuadrática Media armónica
Práctica 3. Medidas de Tendencia Céntricas 97
3.19 Enuncie las características de siguientes medidas de tendencia centrales.
Media aritmética Mediana Moda
98 Estadística Descriptiva Para Psicólogo
3.20 A continuación, se dan las evaluaciones de la asignatura de matemática de 6to A del
Área de Informática del Politécnico Dios es Amor. Complete el cuadro evaluativo
manualmente y usando Excel, luego responda las preguntas dadas a continuación.
Prof. José
no P1 P2 P3 P4 NF 50% Ex C 50% NCFC 30% Ex Ext 70% NCFE
NF Ex C NF Ex Ext
01 87 90 88 80
02 50 65 70 70 87
03 87 88 85 89
04 60 64 60 60 80
05 90 78 85 99
06 89 80 87 90
07 72 75 86 80
08 90 90 92 97
09 99 100 95 99
10 65 60 52 60 88
11 87 90 97 99
12 56 60 60 60 90
13 70 80 85 90
14 82 87 89 90
15 86 80 86 88
16 88 85 88 88
17 54 60 65 66 60 90
18 80 93 94 98
19 87 95 90 98
20 90 98 94 98
a) ¿Cuál es el por ciento promovido de la materia al final de año? NF

b) ¿Cuál es el porciento promovido en completivo?

c) ¿Cuál es el por ciento de estudiante que obtuvo una nota igual o superior a 85 puntos?

d) ¿Cuál fue el por ciento de reprobados?


CAPÍTULO 4
Medidas de Posición
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e
interpreta los cuartiles,
deciles y percentiles para
datos sueltos y agrupados.

✓ Comunica
Explica cómo se obtiene los
cuartiles, deciles y
percentiles para datos
sueltos y agrupados.

La nutrición es la ingesta de alimentos en relación con las necesidades ✓ Modela y Representa


dietéticas del organismo. Una buena nutrición (una dieta suficiente y Modela situaciones, donde
equilibrada combinada con el ejercicio físico regular) es un elemento se pueda calcular las
fundamental de la buena salud. medidas de posiciones.

Una mala nutrición puede reducir la inmunidad, aumentar la ✓ Conecta


vulnerabilidad a las enfermedades, alterar el desarrollo físico y mental, Utiliza conexiones entre las
y reducir la productividad.
medidas de posiciones y las
situaciones de la
La OMS (Organización Mundial de la Salud) ha establecido las
siguientes proporciones para una dieta balanceada:
comunidad educativa.
➢ Los hidratos de carbono deben aportar al menos un 55% hasta ✓ Resuelve problemas
un 60% del aporte calórico total.
Resuelve problemas del
➢ Las grasas no deben superar el 30% de las calorías totales
contexto educativo que
ingeridas. impliquen calcular medidas
de posiciones.
➢ Las proteínas deben de alcanzar el 15% restante en la dieta.
✓ Utiliza herramientas
¿Cómo usted dividiría un conjunto de datos para una mejor tecnológicas
interpretación de estos, de acuerdo con los propósitos de un estudio en Usa Excel (con el
específicos? complemento MegaStat) y
otras herramientas
En esta unidad, se introducen las medidas de posiciones, tales como: tecnológicas para calcular
cuartiles, deciles, y los percentiles. Nuestro objetivo es dividir un cuartiles, deciles y
conjunto de datos a través de medidas de estas posiciones con el fin de
percentiles de datos sueltos
comprender e interpretar mejor el lenguaje de los datos.
y agrupados.
100 Estadística Descriptiva Para Psicólogo
4.1 Introducción
Usted recordará que la mediana divide una distribución en dos partes iguales, es decir, el 50% de los datos
estará por encima de la mediana y el otro 50% estará por debajo de ésta. Existen otras medidas que pueden
dividir la distribución en 100 partes iguales, en 10 partes iguales o en 4 partes iguales.
4.2 Percentiles
Los percentiles dividen un conjunto ordenado de datos en 100 partes iguales. Los percentiles
dan los valores correspondientes al 1%, al 2%, al 3%, … y al 99% de los datos.

Los percentiles se representan con la letra P y la localización del percentil estará dada por la
fórmula:
k ( n + 1)
Lk =
100

Ejemplo 4.1
En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra de 19
corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de inversiones tiene oficinas
a lo largo de Estados Unidos.
2038 1721 1721 1637 2097 2047 2205 2287 1741 1932
1940 2311 2054 2046 1471 1460 1787 1900 1800 ------

Encuentre los siguientes percentiles: P30 y P70


Organicemos los datos
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Buscamos la posición del P30
Posición Resultado Respuesta

b) Buscamos la posición del P70


Posición Resultado Respuesta
Capítulo 4. Medidas de posición 101
Ejercicio 4.1
Una financiera registra el tiempo en días que emplean los clientes para pagar sus facturas. En
la siguiente lista aparece una muestra de 24 clientes y el tiempo que tomaron para pagar.
13 35 82 41 41 13 20 10 25 45 34 34
41 35 56 41 51 13 27 67 53 38 47 31
Encuentre los siguientes percentiles:

𝑎)𝑃20 = 𝑏)𝑃24 = 𝑐)𝑃80 =


Organice los datos de menor a mayor

𝑎)𝑃20 =
Posición Resultado Respuesta

𝑏)𝑃24 =
Posición Resultado Respuesta

𝑐)𝑃80 =
Posición Resultado Respuesta
102 Estadística Descriptiva Para Psicólogo
4.3 Deciles
Los deciles dividen un conjunto ordenado de datos en 10 partes iguales. Los deciles dan los
valores correspondientes al 10%, al 20%, al 30%,..., y al 90% de los datos.

Ejemplo 4.2
Para los datos del ejemplo 1, calcule los siguientes deciles: 𝐷1 𝑦 𝐷6
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que D1 = P10, tenemos:
Posición Resultado Respuesta

b) Dado que D6 = P60, tenemos:


Posición Resultado Respuesta
Capítulo 4. Medidas de posición 103
Ejercicio 4.2
Una financiera registra el tiempo en días que emplean los clientes para pagar sus facturas. En
la siguiente lista aparece una muestra de 24 clientes y el tiempo que tomaron para pagar.
13 35 82 41 41 13 20 10 25 45 34 34
41 35 56 41 51 13 27 67 53 38 47 31
Encuentre los siguientes deciles: 𝐷4 𝑦 𝐷6
Organice los datos de menor a mayor

a) Dado que D4 = P40:


Solución Resultado Respuesta

b) Dado que D6 = P60:


Solución Resultado Respuesta
104 Estadística Descriptiva Para Psicólogo
4.4 Cuartiles
Los cuartiles dividen un conjunto ordenado de datos en 4 partes iguales. Los cuartiles dan los
valores correspondientes al 25%, al 50% y al 75% de los datos.

Ejemplo 4.3
Para los datos del ejemplo 1, calcule los siguientes cuartiles: 𝐶1 𝑦 𝐶2
Recordemos que los datos ordenados de menor a mayor son:
1460 1471 1637 1721 1721 1741 1787 1800 1900 1932
1940 2038 2046 2047 2054 2097 2205 2287 2311 ------
a) Dado que C1 = P25, tenemos:
Solución Resultado Respuesta

b) Dado que C2 = P50, tenemos:


Solución Resultado Respuesta
Capítulo 4. Medidas de posición 105
Ejercicio 4.3
Las notas obtenidas de 11 estudiantes en la asignatura de matemática de un colegio de
Santiago fueron las siguientes
67 72 73 90 72 70
68 97 85 78 98 --
Encuentre los siguientes cuartiles: 𝐶1 𝑦 𝐶3
Organice los datos de menor a mayor

a) Dado que C1 = P25, tenemos:


Solución Resultado Respuesta

b) Dado que C3 = P75, tenemos:


Solución Resultado Respuesta
106 Estadística Descriptiva Para Psicólogo
Uso de Excel para encontrar percentiles
En la siguiente tabla aparecen las comisiones (en dólares) que ganó el último mes una muestra
de 19 corredores de bolsa de la oficina de Salomón Smith, California. Esta compañía de
inversiones tiene oficinas a lo largo de Estados Unidos.
2038 1721 1721 1637 2097 2047 2205 2287 1741 1932
1940 2311 2054 2046 1471 1460 1787 1900 1800 ------

Pruebe usando Excel que P30 = 1,741 y P70 =2,047

Ejercicio 4.4
A continuación, se presentan la edad de un grupo de 12 estudiantes de un colegio de Santiago.
Determine lo siguiente (Use Excel): a) P40, b) P81 y c) P26
13 35 82 41 41 13 20 10 25 45 34 34

a) P40 =

b) P81 =

c) P26 =
Capítulo 4. Medidas de posición 107
4.5 Percentiles, deciles y cuartiles para datos agrupados
El procedimiento para calcular estas medidas para datos agrupados en una distribución de
frecuencias es similar al usado en el cálculo de la mediana.

Como se puede reescribir los deciles y los cuartiles en función de los percentiles, entonces
solamente usaremos la fórmula para calcular los percentiles de una distribución, que será:

P = Li +
( kn
100
− F )c
i −1
k
fi

Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo,
así que evitaremos trabajar con ellas.
Estadística Descriptiva Para Psicólogo 108
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #4
MEDIDAS DE POSICIÓN

Profesor: Leonido Rosario, MA


Participante
Matrícula
Fecha
Sección

4.1 A continuación, se muestran las notas obtenidas por 24 estudiantes en un examen de 30


puntos.
20 13 11 18 22 23 0 27 19 21 28 20
18 19 2 5 10 1 29 25 30 2 12 15
Encuentre los siguientes percentiles:
𝑎)𝑃20 = 𝑏)𝑃60 =
Organice los datos de menor a mayor

𝑎)𝑃20 =
Solución Resultado Respuesta

𝑏)𝑃60 =
Solución Resultado Respuesta
Estadística Descriptiva Para Psicólogo 119
4.2 Rafael es gerente de una compañía que se dedica a vender libros de texto. Ha contratado
39 personas, las cuales hacen visitas a profesores universitarios para recopilar
información que le servirá como insumo para la toma de decisiones. Cada sábado en la
mañana solicita a su personal que le envié un informe, que debe incluir entre otras cosas,
la cantidad de profesores que visitaron la semana anterior. En la lista de abajo, aparece la
cantidad de visitas de la semana pasada. Recuerde interpretar cada resultado.
38 40 41 45 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 48
59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79 …
a) Determine el primer cuartil.
b) Calcule el 6to decil.
Organice los datos de menor a mayor

𝑎)𝐶1 =
Solución Resultado Respuesta

𝑏)𝐷6 =
Solución Resultado Respuesta
CAPÍTULO 5
Medidas de Dispersión
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e interpreta
la varianza y la desviación
estándar de una muestra y/o
una población de datos
sueltos y agrupados.

✓ Comunica
Explica cómo se obtiene la
varianza y la desviación
Fuente: Ministerio de Educación estándar de una muestra y/o
una población para datos
El Programa de Reconocimiento al Mérito Estudiantil se sueltos y agrupados.
institucionaliza en el sector oficial con la finalidad de contribuir a
elevar el nivel académico del estudiantado dominicano, mejorar la ✓ Modela y Representa
calidad de la educación y fortalecer el sistema educativo en sentido Modela situaciones, donde se
general. pueda calcular las medidas
principales de dispersión.
Mediante la Orden Departamental No. 17´96, de fecha 12 de octubre
del año 1996, del Minerd, se estableció y reglamentó el Programa ✓ Conecta
de Reconocimiento al Mérito Estudiantil, en un primer momento, Utiliza conexiones entre las
dirigido a los estudiantes de los centros educativos del sector oficial, medidas principales de
extendiéndose posteriormente a los colegios privados, con el dispersión y las situaciones de
propósito de estimular la formación integral, la excelencia la comunidad educativa.
académica y el desarrollo de talentos en las diversas áreas del
conocimiento. ✓ Resuelve problemas
Resuelve problemas del
Un padre de familia tiene dos hijos en un politécnico, ambos en el contexto educativo que
mismo grado, pero María estudia Enfermería, mientras que Ramón impliquen calcular la
estudia contabilidad. María le dice a su padre que sacó 90 puntos desviación estándar.
como promedio final en la asignatura Enfermería, mientras que ✓ Utiliza herramientas
Ramón obtuvo 80 puntos en Contabilidad. El Padre da más crédito a tecnológicas
María, ya que obtuvo mejor calificación. ¿Es válido el argumento Usa Excel (con el
del padre para gratificar más a María? complemento MegaStat) y
otras herramientas
En esta unidad, se introducen las medidas de dispersión, tales como: tecnológicas para calcular la
el rango, el rango intercuartil, el rango semi-intercuartil la varianza y la desviación
desviación media absoluta, la varianza y la desviación estándar. estándar de una muestra y/o
Nuestro objetivo es resumir un conjunto de datos a través de una población para datos
medidas de tendencias céntricas y las medidas de dispersión, con el sueltos y agrupados.
fin de comprender e interpretar correctamente el lenguaje de los
datos.
Capítulo 5. Medidas de Dispersión 121
5.1 Introducción
Se entregará una laptop, una Tablet, una calculadora gráfica y una mochila a los estudiantes con
los mejores promedios en una clase. Al final del curso el profesor observa que 4 alumnos están
empatados con el mismo promedio (95 puntos). Dado que tienen el mismo promedio debe
buscarse alguna manera no aleatoria para asignar los premios. El maestro evalúa la consistencia
en las calificaciones, y de esta manera entregar los premios de tal modo que el primer lugar lo
obtenga el alumno con menor variabilidad en sus calificaciones. ¿Cómo debe el maestro
distribuir los premios?
Estudiantes Periodo 1 Periodo 2 Periodo 3 Periodo 4 Promedio
A 100 90 94 96 95
B 95 95 90 100 95
C 100 90 100 90 95
D 94 96 95 95 95

Si solamente consideramos la media, no podemos reconocer ninguna diferencia entre el


desempeño de los alumnos. Para poder comparar el rendimiento, no es suficiente conocer la
media, es conveniente conocer algunas medidas que miden la variabilidad de los datos con
relación a la media. Cuando hablamos de variabilidad nos referimos a qué tan lejos de la media
están los datos.
Si representemos los datos en un diagrama de puntos tendremos una visión más clara de la
variación de las calificaciones de los alumnos.
Diagrama de puntos para las calificaciones de los estudiantes
Estudiante Gráfica de puntos
A

➢ ¿Cuál de los estudiantes parece tener menor variación en sus calificaciones con relación a la
media?

➢ ¿Cuál de los estudiantes parece tener mayor variación en sus calificaciones con relación a la
media?
122 Estadística Descriptiva Para Psicólogo
Importancia de las medidas de dispersión.
Las medidas de dispersión nos proporcionan información adicional que nos permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy dispersos,
la posición central es menos representativa de los datos, como un todo, que cuando éstos se
agrupan más cerca alrededor de la media.

Las principales medidas de dispersión absolutas son:


a. Rango
b. Rango intercuartil
c. Rango semi-intercuartil o desviación intercuartílica
d. Desviación media
e. Varianza
f. Desviación estándar
Aunque el rango, el rango intercuartil y el rango semi-intercuartil miden la dispersión de los
datos, sólo tienen en cuenta dos de los valores de los datos. Necesitamos una medida que
considere cada uno de los valores de los datos. Esa medida promediaría la distancia total entre
cada observación y la media. La desviación media es prometedora si los valores de la diferencia
se colocan en valores absolutos, pero tiene una debilidad que la hace poco útil al momento de
trabajar con ella y es que la operación de valor absoluto no es una operación algebraica y eso
tiene consecuencia a la hora de hacer inferencia, pero nos quedan las dos más importantes que
son la varianza y la desviación estándar. La segunda depende de la primera, pero la de mayor
uso es la desviación estándar. Veamos ahora la definición de estas medidas.

5.2 Desviación estándar


Es un promedio de las desviaciones individuales de cada observación con respecto a la media de una
distribución. También se puede definir como la raíz cuadrada de la varianza. La desviación estándar
es la medida de variación más importante y útil.

Desviación estándar de una población Desviación estándar de una muestra


( x −  ) ( )
2 2

=  x−x
N s=
n −1

5.3 Varianza
Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución
estadística. También se puede definir como el cuadrado de la desviación estándar.
Varianza de una población Varianza de una muestra
(x − ) ( )
2 2

 =
2  x−x
N s2 =
n −1
Capítulo 5. Medidas de Dispersión 123
Los datos del primer ejemplo componen una población. Busque la desviación estándar de cada uno y responda
la inquietud inicial, es decir ¿cómo se deben distribuir los premios?
Notas del alumno A
100 90 94 96
1. Buscamos la media

2. Buscamos la desviación estándar

Notas del alumno B


95 95 90 100
1. Buscamos la media
= x
N

2. Buscamos la desviación estándar


( x −  )
2

=
N
124 Estadística Descriptiva Para Psicólogo
Notas del alumno C
100 90 100 90
1. Buscamos la media
= x
N

2. Buscamos la desviación estándar


( x −  )
2

=
N

Notas del alumno D


94 96 95 95
1. Buscamos la media
= x
N

2. Buscamos la desviación estándar


( x −  )
2

=
N
Capítulo 5. Medidas de Dispersión 125
Distribución de los premios en forma descendente
Estudiantes Media Desviación estándar Premio
1er

2do

3er

4to

Ejercicio 5.1
Para el siguiente conjunto de datos muestrales, calcule la desviación estándar.
Datos muestrales: 6, 2, 8, 5, 5, 4
1. Busque la media

x=
x
n

2. Busque la desviación estándar

( x − x)
2

s=
n −1
126 Estadística Descriptiva Para Psicólogo
5.4 Uso de la calculadora científica (CASIO fx-82ms) para calcular la media y la
desviación estándar de una población o una muestra de datos.
Ejemplo 5.4
El siguiente conjunto de datos corresponde a una población, calcule la media y la desviación
estándar usando la calculadora. Datos poblacionales: 8, 3, 7, 3 y 4.

1. Programe la calculadora en el modo estadístico. Para hacer esto, presione la tecla MODE
luego el número 2 (SD).

2. Introduzca los datos: 8, 3, 7, 3, 4. Para hacer esto, presiona 8 y luego la tecla de data (M+)
en la pantalla debe aparecer n = 1, indicando que el primer dato ya se introdujo. Con ese
mismo proceso introduzca los demás datos.

𝑥̅ 𝜎𝑥 𝑠𝑥
3. Presionamos segunda función (shift) y luego el 2, en la pantalla debe aparecer
1 2 3
Presionamos el 1 para buscar la media y nos da: 𝜇 = 5, hacemos el mismo proceso y
presionamos el 2 para calcular la desviación estándar, la cual da 𝜎𝑥 ≈ 2.10 (si el caso fuera
una muestra se trabaja con el 3)

Resultados
Media Desviación estándar
𝜇=5 𝜎𝑥 ≈ 2.10
➢ VIDEO TUTORIAL
Si tiene alguna duda les invito a ver el video titulado “Desviación estándar para datos sueltos
usando calculadora” a través del canal de YouTube llamado “Rosario Institud”.

Ejercicio 5.4
Para el siguiente conjunto de datos muestrales, calcule la media y la desviación estándar,
usando la calculadora. Datos muestrales: 6, 2, 8, 5
Resultados
Media Desviación estándar
Capítulo 5. Medidas de Dispersión 127
➢ VIDEO TUTORIAL
Compruebe usando Excel que la media y la desviación estándar de las calificaciones de los 4 alumnos son las
que se muestran a continuación. Para hacer esto les invito a ver el video titulado “Desviación estándar usando
Excel” en mi canal de YouTube llamado “Rosario Institud”

Resumen de los resultados del primer ejemplo


(Los datos provienen de una población)
Estudiante Periodo 1 Periodo 2 Periodo 3 Periodo 4 Promedio Desviación estándar
A 100 90 94 96 95 3.61
B 95 95 90 100 95 3.54
C 100 90 100 90 95 5
D 94 96 95 95 95 0.71
128 Estadística Descriptiva Para Psicólogo
3.9 Una universidad nacional tiene un programa de becas para estudiar educación en el área
de matemática. Para este propósito se elige un/a alumno/a del nivel secundario de cada
centro educativo del perteneciente al distrito escolar 08-04. El beneficiario debe tener el
mayor índice académico en la asignatura de matemática. A continuación, se dan las
evaluaciones de los 20 estudiantes de 6to A en dicha materia, del Liceo Mauricio Rubio.
Usando la herramienta de Excel complete el cuadro. ¿Cuál estudiante usted elegiría para
darle la beca? (Suponga que no se tiene ninguna otra información que la se le suministra
en este cuadro evaluativo)
no Nombre P1 P2 P3 P4 Promedio Desviación
Estándar
01 Amelia Alcántara 87 86 94 80
02 Analía Jiménez 75 75 70 70
03 Caridad Aracena 79 72 85 78
04 Diana Espinal 60 64 60 60
05 Esmailin Almonte 90 78 85 99
06 José Espinal 89 80 87 90
07 Josefina Caraballo 50 65 60 60
08 Laura Díaz 80 80 82 87
09 Leonido Rodríguez 99 100 90 90

10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99

12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 91 79 75 88
14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 96 95 97

20 Sonia Amarante 83 76 99 75

Respuesta
Capítulo 5. Medidas de Dispersión 129
Si los datos aparecen en una distribución de frecuencias, entonces las fórmulas para la
varianza y la desviación estándar serán:
5.9 Varianza para datos agrupados
Para una población Para una muestra
 f (x − )  ( )
2 2
f x−x
 2
= s2 =
N n −1
5.10 Desviación estándar para datos agrupados
Para una población Para una muestra
 f (x − )  f ( x − x)
2 2

= s=
N n −1
Ya hemos dicho que las medidas para datos agrupados resultan poco útiles en nuestro tiempo, así que
evitaremos trabajar con ellas.
130 Estadística Descriptiva Para Psicólogo
5.12 Importancia de la desviación estándar
Hemos visto como dos o más conjuntos pueden tener la misma media, pero uno con mayor
dispersión que el otro. Esto sucede también con las tres distribuciones que se presentan en la
figura siguiente. La media de las tres curvas es la misma, pero la curva A tiene menor
separación (o variabilidad) que la curva B, y ésta tiene menor variabilidad que la C. Si
medimos sólo la media de estas tres distribuciones, estaremos pasando por alto una diferencia
importante que existe entre las tres curvas. Al igual que sucede con cualquier conjunto de
datos, la media, la mediana y la moda sólo nos revelan una parte de la información que
debemos conocer acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión, separación o
variabilidad.

➢ ¿Por qué es tan importante entender y medir la dispersión de la distribución?

1. Primero, nos proporciona información adicional que nos permite juzgar la


confiabilidad de nuestra medida de tendencia central. Si los datos se encuentran muy
dispersos, como los que representa la curva C de la figura, la posición central es menos
representativa de los datos, como un todo, que cuando éstos se agrupan más cerca
alrededor de la media, como en la curva A de la misma figura.

2. Quizás se desee comparar las dispersiones de diferentes muestras. Si no se desea tener


una amplia dispersión de valores con respecto del centro de distribución, o esto
presenta riesgos inaceptables, necesitamos poder reconocerla y evitar elegir
distribuciones que tengan las dispersiones más grandes.

Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas —que van desde extremadamente altas a
extremadamente bajas e incluso a niveles negativos— son indicativas de un riesgo mayor
para los accionistas y para los acreedores que las ganancias que permanecen relativamente
estables. De manera similar, los expertos en el control de la calidad analizan la dispersión de
los niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.
Capítulo 5. Medidas de Dispersión 131
5.13 Coeficientes de variación (CV):
Cuando se compara la variación de dos conjuntos diferentes de datos, se debe tomar en cuenta
que las desviaciones estándares han de ser aproximadamente iguales o iguales, además los
datos deben tener la misma escala y las mismas unidades. Si las medias son muy diferentes o
si los conjuntos utilizan diferentes escalas o unidades de medición, podemos utilizar el
coeficiente de variación.
El coeficiente de variación es un coeficiente expresado como porcentaje que describe la
desviación estándar en relación con la media. El coeficiente de variación está dado de la
siguiente forma:
Muestra Población
s 
CV =  100% CV =  100%
x 
Ejemplo 5.6
Un director de escuela tiene dos maestras de primero del nivel inicial. La maestra Juana usa
el método 1 para alfabetizar a sus alumnos de primero A y la maestra Xiomara usa
el método 2 para el mismo fin, con los estudiantes de primero B, al término del curso se miden
las palabras por minutos de ambos grupos, resultando los siguientes datos:
Primero A Primero B
 = 40  = 55
 =9  = 10

¿Qué método resultó tener la menor variabilidad relativa en el desempeño de la lectura?

➢ Podemos observar que las medias son distintas, por tanto, no podemos comparar las
desviaciones estándares absolutas, necesitamos calcular el coeficiente de variación para
ambos grupos.

Solución
Coeficiente de variación de primero A Coeficiente de variación de primero B
 
CV =  100% CV =  100%
 
9 10
CV =  100% = 22.5% CV =  100% = 18.18%
40 55

 CV = 22.5%  CV = 18.18%

Conclusión
El método A tubo mayor variación relativa en la lectura de palabras por minutos por parte de
los estudiantes.
132 Estadística Descriptiva Para Psicólogo
Ejemplo 5.7
Compare la variación de las estaturas de hombres con la variación de sus pesos utilizando los
siguientes resultados: Para los hombres, las estaturas producen x = 68.34 pu lg y s = 3.02 pu lg ;
los pesos producen x = 172.55lb y s = 26.33lb .
Solución
Coeficiente de variación de la estatura Coeficiente de variación del peso
 
CV =  100% CV =  100%
 

Conclusión
131 Práctica 5. Medidas de Dispersión
UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO
Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #5
MEDIDAS DE DISPERSIÓN
Profesor: Leonido Rosario, MA

Participante
Matrícula
Fecha
Sección

5.1 ¿Cuáles datos cree usted que tengan mayor variación: ¿los ingresos de una muestra aleatoria
simple de 1000 adultos elegidos de la población en general, o los ingresos de una muestra aleatoria
simple de 1000 profesores de estadística? ¿Por qué?

5.2 ¿Para cuál de las siguientes distribuciones la media es más representativa de los datos como un
todo? ¿Por qué?

5.3 Para medir el éxito escolar, los educadores necesitan probar los niveles de conocimientos y habilidades
de los estudiantes. Tomar en cuenta las diferencias individuales de cada uno de ellos, permite a los
profesores planear mejor el programa académico. Las curvas que se muestran a continuación representan
las distribuciones basadas en resultados anteriores de dos pruebas distintas. ¿Cuál de ellas seleccionaría
usted como mejor opción para los propósitos de los profesores?
132 Estadística Descriptiva Para Psicólogo
5.4 Una empresa que usa dos métodos diferentes para enviar pedidos a sus clientes encontró
las siguientes distribuciones del tiempo de entrega para los dos métodos, según los
registros históricos. Con la evidencia disponible, ¿qué método de envío recomendaría?
¿por qué?

5.5 Encuentre la desviación estándar de los siguientes datos muestrales.


a) 5, 2, 8, 2, 3
Práctica 5. Medidas de Dispersión 133
5.6 Calcule la desviación estándar del siguiente conjunto de datos muéstrales: 1, 3, 4, 6, 6.
Desviación estándar de: 1, 3, 4, 6, 6.

5.6.1 Sume a cada dato una constante igual a 2. Calcule la desviación estándar para los nuevos
valores. ¿Qué efecto produce sobre la desviación estándar el hecho de sumar una
constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____

5.6.2 Multiplique cada dato una constante igual a 2. Calcule la desviación estándar para los
nuevos valores. ¿Qué efecto produce sobre la desviación estándar el hecho de
multiplicar una constante a cada dato?
Desviación estándar de: ____, ____, ____, ____, ____
134 Estadística Descriptiva Para Psicólogo
5.7 Calcule la desviación estándar de los siguientes datos muéstrales.
a) 6, 8, 7, 6, 5, 4

b) 6, 8, 7, 3, 6, 34

c) ¿Por qué la desviación estándar es tan grande en la parte b, en comparación con la parte a?
Práctica 5. Medidas de Dispersión 135
NOTA:
➢ Para los ejercicios 5.8 hasta 5.12 encuentre la desviación estándar.
5.8 Años para obtener el título de licenciatura. A continuación, se presenta el tiempo (en
años) que le tomó a una muestra aleatoria de estudiantes universitarios obtener su título de
licenciatura. Con base en los resultados, ¿Es inusual que un estudiante obtenga el título de
licenciatura en 12 años?
4 4 4.5 4.5 6 6 8 9 13 15

5.9 Emisiones de automóviles. Científicos ambientales midieron las emisiones de gases de


invernadero de una muestra de automóviles. Las cantidades que se listan a continuación
están en toneladas (por año), expresadas como equivalentes de CO2 . El valor de
9.3 toneladas es inusual?

7.2 7.1 7.4 7.9 8.2 9.3


136 Estadística Descriptiva Para Psicólogo
5.10 Bancarrotas. A continuación, se lista el número de declaraciones de bancarrotas en un
condado de Nueva York. Los números se presentan en orden mensual de un año reciente.
Identifique cualquier valor que sea inusual.
59 85 95 143 371 14 15

5.11 Mediciones de la presión sanguínea. Siete estudiantes del segundo año de medicina de Bellevue
Hospital midieron la presión sanguínea de la misma persona. A continuación, se listan las lecturas
sistólicas (en mmHg). Si la presión sanguínea del sujeto permanece constante y los estudiantes de
medicina aplican correctamente la misma técnica de medición, ¿cuál debería ser el valor de la desviación
estándar? Obtenga la desviación estándar.
138 130 135 140 140 130 150
Práctica 5. Medidas de Dispersión 137
5.12 IMC y género. Es bien sabido que los hombres tienden a pesar más y a ser más altos
que las mujeres. El índice de masa corporal (IMC) es una medida que se basa en el peso y
en la estatura. A continuación, se muestran los valores de IMC de hombres y mujeres
elegidos de manera aleatoria. ¿Parece existir una diferencia en la variación entre los dos
conjuntos de datos? Calcule la desviación estándar. (Puedes usar Excel)
Hombres: 23.8 23.2 24.6 26.2 23.5 24.5 21.5 31.4 26.4 22.7 27.8 28.1
Mujeres: 19.6 23.8 19.6 29.1 25.2 21.4 22.0 27.5 33.5 20.6 29.9 17.7
138 Estadística Descriptiva Para Psicólogo
5.13 Responde las siguientes preguntas.
a) ¿Por qué el rango no es una medida de dispersión tan útil como la desviación estándar?

b) Si s = 0 , ¿Qué debe ser verdad acerca de los datos de la distribución?

c) ¿Es posible que el valor del rango, la desviación estándar o la varianza de un conjunto de
datos sea negativo? Explique
Práctica 5. Medidas de Dispersión 139
5.14 A raíz de que los jóvenes en su mayoría están activos sexualmente en nuestras escuelas,
y que las enfermedades de transmisión sexual son de alto riesgo, el psicólogo decide
investigar cómo anda la fidelidad de los estudiantes en el noviazgo en el politécnico Dios
es amor. Para esto, estudia una muestra de 20 alumnos (10 hembras y 10 varones) y
encuentra los siguientes datos. (Puedes usar Excel)
Sexo Número de parejas simultaneas de los 20 estudiantes.
Masculino 1, 1, 3, 2, 4,1, 2, 3, 4, 5
Femenino 1, 1, 1, 1, 2, 3, 2, 1, 1, 1

Calcule lo siguiente:
Medidas Sexo
Masculino Femenino
a) La moda
b) La mediana
c) La media
d) El rango
e) Varianza
f) Desviación estándar
g) Coeficiente de variación
1. ¿Cuál de los dos grupos tiene mayor capacidad de mantenerse con una pareja?

2. Según su criterio, ¿cuáles son las razones que explican la respuesta a la primera pregunta?

3. ¿Cuál grupo se debe trabajar primero o con mayor ahínco?

4. ¿Qué medida debe implementar el psicólogo con la finalidad de hacer conciencia de la


importancia de la fidelidad en una relación amorosa?
140 Estadística Descriptiva Para Psicólogo
3.9 Una universidad nacional tiene un programa de becas para estudiar educación en el área de
matemática. Para este propósito se elige un/a alumno/a del nivel secundario de cada centro
educativo del perteneciente al distrito escolar 08-04. El beneficiario debe tener el mayor índice
académico en la asignatura de matemática. A continuación, se dan las evaluaciones de los 20
estudiantes de 6to A en dicha materia, del Liceo Mauricio Rubio. Usando la herramienta de Excel
complete el cuadro. ¿Cuál estudiante usted elegiría para darle la beca? (Suponga que no se tiene
ninguna otra información que la se le suministra en este cuadro evaluativo)
no Nombre P1 P2 P3 P4 Promedio Desviación
Estándar
01 Amelia Alcántara 87 86 94 80
02 Analía Jiménez 85 98 100 100
03 Caridad Aracena 79 72 85 78
04 Diana Espinal 99 100 99 99
05 Esmailin Almonte 90 78 85 99
06 José Espinal 89 80 87 90
07 Josefina Caraballo 50 65 60 60
08 Laura Díaz 80 80 82 87
09 Leonido Rodríguez 99 100 90 80

10 Leopoldo Cruz 68 65 64 60
11 Luisa Jaquez 80 100 99 99

12 Marcos Ferreira 80 89 87 95
13 Mercedes Martínez 90 96 95 97

14 Pedro Hernández 99 73 96 81
15 Randy Vegas 85 92 82 86
16 Rudy Morel 71 93 76 77
17 Sabrina García 94 72 78 83
18 Santiago Sánchez 90 74 100 83
19 Solange Cruz 90 93 82 75

20 Sonia Amarante 83 76 99 75

Respuesta
UNIDAD 6
Regresión y Correlación simple
Competencias
Específicas
✓ Razona y argumenta.
Reconoce, calcula e
interpreta modelos de
regresión simple para
predecir el
comportamiento de una
variable.
✓ Comunica
Explica cómo se obtiene la
Fuente Externa correlación y la regresión
La desnutrición afecta radicalmente el rendimiento escolar de los simple.
niños. El haber nacido con bajo peso, haber padecido anemia por ✓ Modela y Representa
deficiencia de hierro o deficiencia de zinc, pueden significar un Modela situaciones, donde
costo de hasta 15 puntos en el Coeficiente Intelectual (CI) teórico se puede representar por
y varios centímetros menos de estatura. Esta conjunción de medio de la regresión
factores negativos conspira contra el desempeño escolar de los simple.
niños. Los estudios científicos demostraron que casi un cuarto de
los niños al ingresar al primer grado de la escuela tiene un CI ✓ Conecta
inferior a lo esperable. Además, uno de los factores responsables Utiliza conexiones entre la
de este bajo desempeño es la inadecuada estimulación temprana regresión simple y las
por parte de progenitores que ignoraban cómo hacerlo. situaciones de la
comunidad educativa.
Hoy no quedan dudas de que la desnutrición afecta el desarrollo ✓ Resuelve problemas
intelectual y sin necesidad de que sea extrema como en los casos Resuelve problemas del
que estamos viendo en la prensa estos días. Para los cientos de contexto educativo que
miles de niños que están en una situación de subalimentación y impliquen predecir el
mala nutrición, el riesgo de fracaso escolar es muy alto. comportamiento de una
variable por medio de un
Los escolares de familias de bajos ingresos están a menudo mal modelo de regresión
alimentados y presentan signos de malnutrición, incluyendo simple.
índices antropométricos por debajo de los promedios nacionales,
con baja talla o insuficiencia ponderal para la estatura y poca grasa ✓ Utiliza herramientas
subcutánea, aunque sin síntomas suficientes para justificar su tecnológicas
asistencia a un servicio de salud. Usa Excel (con el
complemento MegaStat) y
Kerlinger (1985) llegó afirmar que la ciencia es el estudio de las otras herramientas
relaciones entre variables, de ahí la importancia de este tema. En tecnológicas para formar
esta unidad tenemos como objetivo general estimar una variable un modelo de regresión
dependiente a través de modelo de regresión simple. dadas dos variables.
142 Estadística Descriptiva Para Psicólogo
4.1 Introducción
En esencia la ciencia es el estudio de las relaciones entre variables. Cuando conocemos la
relación entre variables se pueden llegar a formular predicciones de una a partir de otra. El
primer coeficiente de correlación publicado fue producto del trabajo de sir Francis Galton,
en 1888, midió la estatura y la longitud del antebrazo, respectivamente, de 348 hombres
adultos. Si se denota la estatura del i-ésimo hombre mediante xi , y la longitud de su antebrazo
como yi , entonces los datos de Galton consistían en 348 pares ordenados ( xi , yi ) . La figura
siguiente presenta una recreación simulada de estos datos, con base en una tabla que
construyó Galton.

Los puntos tienden a inclinarse hacia arriba y a la derecha, lo que indica que los hombres más
altos tienden a tener antebrazos más largos. Se dice que hay una asociación positiva entre la
estatura y la longitud del antebrazo. La pendiente es casi constante en toda la gráfica, esto
indica que los puntos están agrupados alrededor de una línea recta. La línea sobrepuesta sobre
la gráfica representa una recta especial conocida como recta de mínimos cuadrados. Ésta
recta la veremos más adelante.

Investigación en el área educativa.


En los procesos de investigación en educación, en muchas ocasiones nos interesa conocer la
posible relación que se puede manifestar entre dos o más variables. Para avanzar en el estudio
de los hechos y fenómenos educativos buscamos la posible influencia que se puede dar entre
aquellas variables que se pueden intervenir en los resultados del aprendizaje y en otros
ámbitos de la actividad educativa.
Regresión y Correlación 143
Podemos estar interesados en conocer qué variables pueden influir sobre el rendimiento
académico y cuál es su peso relativo en la predicción, como pueden ser: el tiempo de estudio,
las técnicas de trabajo, los recursos materiales disponibles, la motivación, etc. En estos casos
interesa establecer el grado de relación entre esas variables y el rendimiento académico, o
cualquier otra variable de naturaleza pedagógica sobre la que se desea intervenir. Por tanto,
es muy útil y necesario realizar este tipo de estudios en el campo educativo.

4.2 Análisis de correlación


Grupo de técnicas para medir la asociación entre dos variables. La idea básica del análisis
de correlación es reportar la asociación entre dos variables. Por lo general, el primer paso es
trazar los datos en un diagrama de dispersión. Un ejemplo ilustrará cómo se emplea un
diagrama de dispersión.
Ejemplo 6.1
Las siguientes calificaciones corresponden a la nota de presentación de 17 estudiantes con su
respectiva nota de la prueba nacional de matemática, en un politécnico de la ciudad de
Santiago. Represente esos datos en un diagrama de dispersión:
Datos hipotéticos de la nota de presentación de un politécnico y el resultado de la prueba de
matemática
NP 55 56 60 62 63 63 64 64 65 67 67 68 68 69 69 69 69
NPN 23 24 25 26 26 27 15 26 27 28 28 29 29 28 17 30 30

Para hacer el gráfico manualmente solo marcamos un punto en cada par ordenado. Si
deseamos hacerlo en Excel seleccionamos los datos e insertamos un gráfico de dispersión,
resultando una imagen como la siguiente:

Una interesante implicación es que la “nota de la prueba nacional” se relaciona con la “nota
de presentación”. Conforme aumenta la nota de presentación, la nota de prueba nacional
también lo hace (esta predicción no es perfecta, ya que algunos estudiantes que obtienen una
alta nota de presentación de matemática tienen una calificación baja en la prueba nacional).
La variable “nota de la prueba nacional” se considera la variable dependiente y la variable
“nota de presentación” es la variable independiente.
144 Estadística Descriptiva Para Psicólogo
La variable independiente proporciona la base para la estimación. Es la variable predictora.
Por ejemplo, digamos que se desea predecir la nota esperada en prueba nacional de un
estudiante que tenga 65 puntos de 70 como nota de presentación. Observe que elegimos este
valor. La variable independiente no es un número aleatorio.

La variable dependiente es la variable que se desea predecir o estimar. También puede ser
descrita como el resultado de un valor conocido de la variable independiente. La variable
dependiente es aleatoria, esto es, por cada valor dado a la variable independiente, existen
muchos posibles resultados para la variable dependiente.

El diagrama de dispersión anterior muestra en forma gráfica que la nota de la prueba nacional
tiende a aumentar directamente con la nota de presentación, sin embargo, algunos estudiantes
que obtienen una alta nota de presentación de matemática tienen una calificación baja en la
prueba nacional. Es razonable entonces que el director del politécnico incentive a los
estudiantes a ganarse buenas calificaciones para obtener mejores resultados en las pruebas
nacionales. Obsérvese que, aunque parece haber una relación positiva entre las dos variables,
no todos los puntos se encuentran en una recta. Por tal motivo ahora estudiaremos el grado
de asociación entre dos variables.

4.3 Coeficiente de correlación de Pearson


El coeficiente de correlación de Pearson describe la fuerza de la relación entre dos variables
en escala de intervalo o de razón. Se designa con la letra r. Puede adoptar cualquier valor de
-1.00 a +1.00, inclusive. En el análisis de la correlación entre dos variables, teniendo en
cuenta la intensidad y el sentido de la relación, se presentan diferentes posibilidades que se
expresan mediante un diagrama de dispersión. Veamos algunas de ellas:

a) Relación perfecta positiva


Se manifiesta en aquellos supuestos en que al aumentar los valores de una de las
variables los valores de la otra lo hacen siempre en la misma proporción, la gráfica
puede ser similar a la que se muestra:
Regresión y Correlación 145
b) Relación imperfecta positiva
Se manifiesta en aquellos supuestos en que al aumentar los valores de una de las
variables los valores de la otra lo hacen, pero no en la misma proporción como es el
caso del aparatado a.

c) Relación perfecta negativa


En este caso se manifiesta una relación inversa entre las variables, de tal forma que al
aumentar los valores en una de ella, los de la otra disminuyen y lo hacen en la misma
proporción.

d) Relación imperfecta negativa


La identificamos cuando hay una relación inversa entre variables, lo que supone que
las puntuaciones altas en una variable se corresponden con las bajas en la otra, esta
relación no es inversamente proporcional.
146 Estadística Descriptiva Para Psicólogo
e) Relación nula o ausencia de relación
Esta ausencia de relación se da cuando dos variables son independientes una de la otra
(ellos implican que no existe una tendencia definida en los valores alcanzados por los
sujetos), se puede decir que las puntuaciones en las dos variables se deben a factores
aleatorios.

En el siguiente diagrama se resumen la fuerza y la dirección del coeficiente de correlación.


Regresión y Correlación 147
4.4 Fórmula para determinar el coeficiente de correlación de Pearson:
Como hemos visto el grado en que los puntos en un diagrama de dispersión tienden a
agruparse alrededor de una recta refleja la fuerza de la relación lineal entre x y y . La
impresión visual de una gráfica de puntos puede ser engañosa respecto de lo anterior, debido
al cambio de escala de los ejes, lo que puede hacer que el agrupamiento parezca más junto o
más disperso. Para evitar que la gráfica nos lleva a una mala interpretación, se define el
coeficiente de correlación como una medida numérica de la fuerza de la relación lineal entre
dos variables.

Coeficiente de correlación de Pearson


Sean ( x1 , y1 ) ,..., ( xn , yn ) los n puntos del diagrama de dispersión proveniente de una muestra
aleatoria. Para calcular la correlación, primero se deducen las medias y las desviaciones
estándar de las x y de las y , que se representan mediante x, y, sx y s y . Después se convierte
cada x y cada y a las unidades estándar; en otras palabras, se calculan los puntajes
z : ( xi − x ) / sx ; ( yi − y ) / s y . El coeficiente de correlación representa el promedio de los
productos de los puntajes z, excepto que se divide entre n − 1 en lugar de n :

1 n  xi − x   yi − y 
r=   
n − 1 i =1  sx   s y 

Esta fórmula se puede usar para conseguir el valor de r, pero se hace un poco difícil encontrar
el valor de r manualmente, por lo que se prefiere reescribir la fórmula sustituyendo los valores
de las desviaciones estándares.

( ) ( y − y)
n 2 n 2
xi − x i
Sabemos que: sx = i =1
, sy = i =1
, si sustituimos estos valores en la ecuación
n −1 n −1
anterior tenemos:

 ( x − x )( y )
n

i i −y
r= i =1

( x − x) ( y )
n 2 n 2
i i −y
i =1 i =1
148 Estadística Descriptiva Para Psicólogo
Hemos llegado a una fórmula bastante cómoda para hacer el cálculo manual del coeficiente
de variación, sin embargo, con un poco de álgebra podemos conseguir una expresión más
adecuada todavía. Se puede demostrar que:
2

( ) = x
n n
a) xi − x
2
2
i − nx
i =1 i =1
2

( )
n n
b) yi − y =  yi2 − n y
2

i =1 i =1

( )( )
n n
c) xi − x yi − y =  xi yi − nx y
i =1 i =1

Tomando en cuenta estos resultados, haciendo las sustituciones y con un poco de álgebra
llegamos a la siguiente fórmula del coeficiente de correlación de Pearson.

Coeficiente de correlación poblacional

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

Veamos ahora el siguiente ejemplo


Ejemplo 6.2
Un negocio familiar que vende a clientes minoristas en la ciudad de Santiago. Tanto en radio
como en televisión e internet, la compañía destaca sus precios bajos y fáciles términos de
crédito. El propietario desea analizar la relación entre las ventas y la suma de dinero que
gastó en publicidad. A continuación, se presenta la información de las ventas y de los gastos
publicitarios durante los últimos cuatro meses.
Mes Gastos publicitarios Ingresos por ventas
(En millones de pesos) (En millones de pesos)
Julio 2 7
Agosto 1 3
Septiembre 3 8
Octubre 4 10
a) El propietario desea pronosticar las ventas con base en los gastos publicitarios. ¿Cuál es
la variable dependiente? ¿Cuál es la variable independiente?

b)Trace un diagrama de dispersión.

c) Determine el coeficiente de correlación.

d)Interprete la fuerza del coeficiente de correlación.


Regresión y Correlación 149
Solución
a) Variable independiente y dependiente: b) Diagrama de dispersión
Variable independiente: Se puede verificar que las dos variables
tienen una relación fuerte, ya que los
puntos están prácticamente alineados.

Variable dependiente:

c) Determine el coeficiente de correlación.

Gastos P. Ingresos por V. x2 y2 x y


x y
2 7
1 3
3 8
4 10

Al sustituir en la fórmula tenemos:


n xy −  x  y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

d) Interpretación
150 Estadística Descriptiva Para Psicólogo
Ejercicio 6.1
Un ebanista desea estudiar la relación entre el número de trabajadores, x, y el número de
mesas, y, producidas en su taller. Ha tomado una muestra aleatoria de 7 horas de producción.
Se han obtenido las siguientes combinaciones (x, y) de puntos:
x y
12 20
18 30
14 12
15 20
18 25
19 32
24 50

a) Trace un diagrama de dispersión.

b) Determine el coeficiente de correlación.

c) Interprete la fuerza del coeficiente de correlación.

a) Diagrama de dispersión
Regresión y Correlación 151
b) Coeficiente de correlación

x y

12 20

18 30

14 12

15 20

18 25

19 32

24 50

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
152 Estadística Descriptiva Para Psicólogo
Ejercicio 6.2
A continuación, se presenta una muestra aleatoria de cinco pares (x, y) de puntos de datos:
x y
12 200
14 210
15 270
24 500
30 600

a) Trace un diagrama de dispersión.

b) Determine el coeficiente de correlación.

c) Interprete la fuerza del coeficiente de correlación.

a) Diagrama de dispersión
Regresión y Correlación 153
b) Coeficiente de correlación

x y

12 200

14 210

15 270

24 500

30 600

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
154 Estadística Descriptiva Para Psicólogo
4.6 Pendiente de una recta
La pendiente de una recta es un coeficiente que mide el grado de inclinación de la recta.
Observa las siguientes gráficas con sus respectivas pendientes.

La pendiente de la recta no vertical que pasa por los puntos: A ( x1 , y1 )  B ( x2 , y2 ) se consigue


y2 − y1
mediante la fórmula: b = , donde x2 − x1  0 .
x2 − x1

La pendiente es independiente de cuales dos puntos se escojan sobre la recta. Podemos


ver que esto es verdadero en los triángulos semejantes de la figura siguiente:

La figura siguiente muestra varias rectas marcadas con sus pendientes. Observe que las rectas
con pendiente positiva se inclinan hacia arriba a la derecha, mientras que las rectas con
pendiente negativa se inclinan hacia abajo a la derecha. Las rectas más inclinadas son
aquellas para las que el valor absoluto de la pendiente es muy grande; una recta horizontal
tiene pendiente cero.
Regresión y Correlación 155
Ejemplo 6.4
Encuentre la pendiente de la recta que pasa por los puntos: A ( 2,1)  B ( 3, 7 ) y luego grafica
la recta.
y2 − y1
b=
x2 − x1

7 −1 6
b= = =6
3− 2 1

Gráfica
156 Estadística Descriptiva Para Psicólogo
4.7 Ecuación de la recta punto – pendiente
Una ecuación de la recta que pasa por el punto ( x1 , y1 ) y tiene pendiente b
y − y1 = b ( x − x1 )

Ejemplo 6.5
Encuentre la ecuación de la recta que pasa por el punto A ( −2,1) con pendiente b = −3 , y luego
construye la gráfica.
Solución 2. Otro punto
1. Se busca la ecuación: Si x = −4
y − y1 = b ( x − x1 )  y = −3 ( −4 ) − 5

y − 1 = −3 ( x + 2 )  y = 12 − 5 = 7

B ( −4, 7 )
y = −3 ( x + 2 ) + 1

y = −3 x − 6 + 1

 y = −3 x − 5

3. Gráfica
Regresión y Correlación 157
4.8 Análisis de Regresión
El coeficiente de correlación es una medida que expresa la fuerza y la dirección de la relación
lineal entre dos variables. Ahora se desea crear una ecuación para expresar la relación lineal
entre dos variables. Además, se pretende estimar el valor de la variable dependiente Y con
base en un valor seleccionado de la variable independiente X. La técnica para desarrollar la
ecuación y proporcionar las estimaciones se denomina análisis de regresión.

4.8.1 Ecuación de regresión


Ecuación que expresa la relación lineal entre dos variables.

4.8.2 Principio de los mínimos cuadrados


En el análisis de regresión, el objetivo es utilizar los datos para trazar una línea que represente
mejor la relación entre las dos variables. Nuestro primer enfoque es utilizar un diagrama de
dispersión para visualizar la posición de la línea.

Observemos el siguiente diagrama de dispersión y las rectas que más se ajustan. ¿Cuál de las
cuatro rectas piensa que se ajusta más a los puntos originales?

Sin embargo, es preferible utilizar un método que resulte en una sola y mejor línea de
regresión. Este método, que se denomina principio de los mínimos cuadrados, proporciona
lo que comúnmente se conoce como recta del “mejor ajuste”.
158 Estadística Descriptiva Para Psicólogo
4.9 Principios de los mínimos cuadrados
Determina una ecuación de regresión al minimizar la suma de los cuadrados de las distintas
distancias verticales entre los valores reales de y y los valores pronosticados de y .

Ilustración conceptual
Un negocio familiar que vende a clientes minoristas en la ciudad de Santiago. Tanto en radio
como en televisión e internet, la compañía destaca sus precios bajos y fáciles términos de
crédito. El propietario desea de analizar la relación entre las ventas y la suma de dinero que
gastó en publicidad, además se desea construir una ecuación de regresión que le ayude a
pronosticar la cantidad de dinero Y que recibiría la familia si se invierte una X cantidad de
dinero publicidad. A continuación, se presenta la información de las ventas y de los gastos
publicitarios durante los últimos cuatro meses.
Mes Gastos publicitarios Ingresos por ventas
(En millones de pesos) (En millones de pesos)
Octubre 3 8
Noviembre 4 18
Diciembre 5 16
Veamos ahora la ventaja del método de mínimos cuadrados. La gráfica 1 representa la recta
de la ecuación de regresión lineal, mientras las gráficas 2 y 3 son rectas construidas con regla.
La recta de regresión de la gráfica 1, es la recta de mejor ajuste porque la suma de los
cuadrados de las desviaciones verticales respecto de sí misma es mínima, para ilustrar este
punto veamos analicemos las tres rectas dadas a continuación.
Observemos la suma de las desviaciones al cuadrado de los tres puntos y la recta de mejor
ajuste:

( )
3 2
yi − yi = ( 8 − 10 ) + (18 − 14 ) + (16 − 18 )
2 2 2

i =1

( )
3 2
yi − yi = 4 + 16 + 4 = 24
i =1
Regresión y Correlación 159
Ahora observemos la suma de las desviaciones al cuadrado de los tres puntos y la segunda
recta:

( )
3 2
yi − yi = ( 8 − 6 ) + (18 − 12 ) + (17 − 19 )
2 2 2

i =1

( y − y )
3 2
i i = 4 + 36 + 4 = 44
i =1

Mientras que para la tercera recta tendremos:

( )
3 2
yi − yi = ( 8 − 16 ) + (18 − 20 ) + (17 − 25 )
2 2 2

i =1
.
( y )
3 2
i − yi = 64 + 16 + 64 = 144
i =1
160 Estadística Descriptiva Para Psicólogo
Como se puede apreciar la recta de mejor ajuste es la que minimiza la suma de los cuadrados
de las distancias verticales entre los valores reales de y y los valores pronosticados de y . A
esto le llamamos el Principio De Los Mínimos Cuadrados.

Ajuste De Mínimos Cuadrados A la Recta de Mejor Ajuste


Consideremos un conjunto de observaciones ( xi , yi ) al cual se desea ajustar una relación
lineal usando el principio de los mínimos cuadrados:

y = mx + b

Suponemos que los valores de x son precisos, que toda la incertidumbre está contenida en los
valores de y. Deseamos minimizar la suma de los cuadrados de las diferencias siguientes:

dyi = yi − yi
dyi = yi − ( mxi + b )

( dyi ) =  yi − ( mxi + b ) 
2 2

( dyi )
2
= yi2 + m 2 xi2 + b 2 + 2mxi b − 2mxi yi − 2 yi b

Por tanto, si hay n observaciones, la suma es:

M =  ( dyi ) =  yi2 +  m 2 xi2 +  b 2 +  2mxi b −  2mxi yi −  2 yi b


2

M =  ( dyi ) =  yi2 + m 2  xi2 + nb 2 + 2mb xi − 2m xi yi − 2b yi


2

La condición para la mejor elección de m y b es que  ( dyi )2 sea un mínimo. Por tanto,
debemos buscar las derivadas parciales e igualarlas a cero:

dM
= 2m xi2 + 2b xi − 2 ( xi yi ) = 0
dm

dM
= 2nb + 2m xi − 2 yi = 0
db
Regresión y Correlación 161
Y resolviendo el sistema de ecuaciones simultaneas para m y b tenemos:
n ( xi yi ) −  xi  yi
m=
n xi2 − (  xi )
2

b=
 x  y −  x ( x y )
2
i i i i i

n x − (  x )
2 2
i i

Ahora podemos determinar la recta de mejor ajuste usando el principio de los mínimos
cuadrados, interpretar los coeficientes y hacer una regresión. Veamos:
Mes Gastos publicitarios Ingresos por ventas
(En millones de pesos) (En millones de pesos)
Octubre 3 8
Noviembre 4 18
Diciembre 5 16

x y xy x2

n ( xi yi ) −  xi  yi
m=
n xi2 − (  xi )
2

b=
 x  y −  x (x y )
2
i i i i i

n x − (  x )2 2
i i
162 Estadística Descriptiva Para Psicólogo
a) Ecuación de regresión

b) Interpretación de los coeficientes


Intercepto a Pendiente b

c) ¿Cuánto se esperaría que ingrese si se invierte 6 millones en publicidad?


Regresión y Correlación 163
Ejercicio
Un ebanista desea estudiar la relación entre el número de trabajadores, x, y el número de
mesas, y, producidas en su taller. Ha tomado una muestra aleatoria de 7 horas de producción.
Se han obtenido las siguientes combinaciones (x, y) de puntos:

x y
12 20
18 30
14 21
15 27
18 30
19 32
24 50

a) Determine la ecuación de regresión.


b) Interprete los valores de a y b.
c) Construya la gráfica de dispersión con la recta de regresión.
d) Estime la cantidad de mesas producidas cuando se contratan 30 trabajadores.
Solución
164 Estadística Descriptiva Para Psicólogo
Gráfica
Regresión y Correlación 165

UNIVERSIDAD AUTÓNOMA DE SANTO DOMINGO


Facultad de Ciencias Económicas y Sociales
Escuela de Estadística
Práctica #6
REGRESIÓN Y CORRELACIÓN LINEAL

Profesor: Leonido Rosario, MA


Participante
Matrícula
Fecha
Sección

6.1 Las siguientes observaciones muéstrales se seleccionaron de manera aleatoria.


a) Trace un diagrama de dispersión.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
Diagrama de puntos
x y
4 4
5 6
3 5
6 7
10 7
166 Estadística Descriptiva Para Psicólogo
a) Coeficiente de correlación

x y
4 4
5 6
3 5
6 7
10 7

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

b) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
Regresión y Correlación 167
6.2 Las siguientes observaciones muéstrales se seleccionaron de manera aleatoria.

a) Trace un diagrama de dispersión.


b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
x y
5 13
3 15
6 7
3 12
4 13
4 11
6 9
8 5

a) Diagrama de dispersión
168 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación

x y
4 4
5 6
3 5
6 7
10 7

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 169
6.3 Una empresa tiene tiendas en varias áreas metropolitanas de Nueva Inglaterra. El gerente
general de ventas planea transmitir un comercial de una cámara digital en estaciones de
televisión locales antes del periodo de ventas que empezará el sábado y terminará el
domingo. Planea obtener la información de las ventas de la cámara digital durante el
sábado y el domingo en las diversas tiendas y compararlas con el número de veces que se
transmitió el anuncio en las estaciones de televisión. El propósito es determinar si hay
alguna relación entre el número de veces que se transmitió el anuncio y las ventas de
cámaras digitales. Los pares son:

a) Trace un diagrama de dispersión.


b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.

Ubicación de la Número de Ventas de sábado a domingo (miles de


estación de TV transmisiones dólares)
Providence 4 15
Springfield 2 8
New Haven 5 21
Boston 6 24
Hartford 3 17

a) Diagrama de dispersión
170 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación
Coeficiente de Pearson
x y
4 15
2 8
5 21
6 24
3 17

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 171
6.4 El departamento de producción de Celltronics International desea explorar la relación
entre el número de empleados que trabajan en una línea de ensamblado parcial y la
cantidad de unidades producida. Como experimento, se asignó a dos empleados al
ensamblado parcial. Su desempeño fue de 15 productos durante un periodo de una hora.
Después, cuatro empleados hicieron los ensamblados y su número fue de 25 durante un
periodo de una hora. El conjunto completo de observaciones pareadas se muestra a
continuación.
a) Trace un diagrama de dispersión.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
Número de Producción en una
ensambladores hora (unidades)
2 15
4 25
1 10
5 40
3 30

a) Diagrama de dispersión
172 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación

x y
2 15
4 25
1 10
5 40
3 30

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 173
6.5 El consejo de la ciudad de Pine Bluffs considera aumentar el número de policías en un
esfuerzo para reducir los delitos. Antes de tomar una decisión final, el ayuntamiento pide
al jefe de policía realizar una encuesta en otras ciudades de tamaño similar para determinar
la relación entre el número de policías y el número de delitos reportados. El jefe de policía
reunió la siguiente información muestral.
a) Trace un diagrama de dispersión.
b) Determine el coeficiente de correlación.
c) Interprete la fuerza del coeficiente de correlación.
Ciudad Policías Número de delitos
Oxford 15 17
Starksville 17 13
Danville 25 5
Athens 27 7
Holgate 17 7
Carey 12 21
Whistler 11 19
Woodville 22 6
a) Diagrama de dispersión
174 Estadística Descriptiva Para Psicólogo
b) Coeficiente de correlación

x y
15 17
17 13
25 5
27 7
17 7
12 21
11 19
22 6

n xy −  x y
rxy =
n x 2 − (  x ) n y 2 − (  y )
2 2

c) Interpretación
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
_________________________________________________________________________
________________________________________________________________________
Regresión y Correlación 175
6.6Las siguientes observaciones muéstrales se seleccionaron al azar.
x y
4 4
5 6
3 5
6 7
10 7

a) Determine la ecuación de regresión.


b) Interprete los valores de a y b.
c) Construya la gráfica de dispersión con la recta de regresión.
d) Estime el valor de y cuando x = 25.
Solución
Datos Pendiente b e Intercepto de y.

n ( xi yi ) −  xi  yi
m=
n xi2 − (  xi )
2

b=
 x  y −  x ( x y )
2
i i i i i

n x − (  x )
2 2
i i

a) Ecuación de regresión b) Interpretación de los coeficientes


176 Estadística Descriptiva Para Psicólogo
c) Construcción de la gráfica de dispersión y la recta de regresión.
Para hacer la recta de regresión es necesario obtener al menos dos puntos colineales.
x y

Gráfica

d) Estime el valor de y cuando x = 25.


Regresión y Correlación 177
6.7 Una compañía de electricidad estudia la relación entre kilowatts-hora (miles) consumidos
y el número de habitaciones de una residencia privada familiar. Una muestra aleatoria de
10 casas reveló lo siguiente.
Número de habitaciones Kilowatts-hora (miles)
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7

a) Determine la ecuación de regresión.


b) Interprete los valores de a y b.
c) Construya la gráfica de dispersión con la recta de regresión.
d) Encuentre el número de kilowatts-hora, en miles, de una casa de seis habitaciones.
Solución
Datos Pendiente b e Intercepto de y.
n ( xi yi ) −  xi  yi
m=
n xi2 − (  xi )
2

b=
 x  y −  x ( x y )
2
i i i i i

n x − (  x )
2 2
i i

a) Ecuación de regresión b) Interpretación de los coeficientes


178 Estadística Descriptiva Para Psicólogo
c) Construcción de la gráfica de dispersión y la recta de regresión.
Para hacer la recta de regresión es necesario obtener al menos dos puntos colineales.
x y

Gráfica

d) Encuentre el número de kilowatts-hora, en miles, de una casa de seis habitaciones.


Regresión y Correlación 179
6.8 El gerente de una entidad de servicios financieros considera que hay una relación entre el
número de contactos con sus clientes y la cantidad de ventas. Para probar esta afirmación,
el gerente reunió la siguiente información muestral. La columna x indica el número de
contactos con sus clientes el mes anterior, mientras que la columna y indica el valor de las
ventas (miles de dólares) el mismo mes por cada cliente muestreado.
Número de contactos, x Ventas (miles de dólares)
14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110

a) Determine la ecuación de regresión.


b) Interprete los valores de a y b.
c) Construya la gráfica de dispersión con la recta de regresión.
d) Encuentre las ventas estimadas si se hicieron 40 contactos.
Solución
Datos Pendiente b e Intercepto de y.
n ( xi yi ) −  xi  yi
m=
n xi2 − (  xi )
2

b=
 x  y −  x ( x y )
2
i i i i i

n x − (  x )
2 2
i i

a) Ecuación de regresión b) Interpretación de los coeficientes


180 Estadística Descriptiva Para Psicólogo
c) Construcción de la gráfica de dispersión y la recta de regresión.
Para hacer la recta de regresión es necesario obtener al menos dos puntos colineales.
x y

Gráfica

d) Encuentre las ventas estimadas si se hicieron 40 contactos.

También podría gustarte