Está en la página 1de 15

Taller 1 - Estadística Descriptiva

Deisy Viviana Pinillos Santamaría

Tutor: Dr. Jorge Aristizabal Escobar

Universidad Piloto de Colombia Facultad de Ciencias Económicas y


Administrativas

Estadística y Probabilidad

18 de abril del 2021


INTRODUCCIÓN

La estadística descriptiva es un conjunto de técnicas numéricas y gráficas para describir y


analizar un grupo de datos, sin extraer conclusiones (inferencias) sobre la población a la
que pertenecen. En este tema se introducirán algunas técnicas descriptivas básicas,
como la construcción de tablas de frecuencias, la elaboración de gráficas y las principales
medidas descriptivas de centralización, dispersión y forma que permitirán realizar la
descripción de datos.

El presente taller tiene como objetivo realizar una introducción a los diferentes métodos
estadísticos que son utilizados para resumir y presentar un conjunto de datos, así como
también analizar críticamente la interpretación de los datos que se presentan a partir de la
estadística descriptiva.

OBJETIVOS

 Aplicar los conceptos vistos en las tutorías sobre estadística descriptiva a los
puntos propuestos por el docente.
 Interpretar los resultados obtenidos mediante la aplicación de las fórmulas que
aplican para cada uno de los casos propuestos en el taller.
TALLER

1. Determinar si el valor dado es un estadístico o un parámetro:

El senado de la república está conformado por 61 hombres y 41 Parámetro


mujeres
Se selecciona una muestra de estudiantes y el número promedios Estadístico
de texto comprados para el semestre es de 4,2
Se toma una muestra de clientes en un banco y el promedio de Estadístico
tiempo de espera en la fila es de 0,65H
En un estudio de 2223 pasajeros del Titanic, se encontró que 706 Parámetro
sobrevivieron

2. Determinar si los valores dados provienen de un conjunto de datos discreto o continuo

El salario presidencial de George Washington era de 25000 dólares Continuo


anuales y el salario presidencial actual es de 400.000 anuales.
Un estudiante de estadística obtiene datos muestrales y encuentran Continuo
que la media del peso de automóviles en la muestra es 3126 lb.
En una encuesta de 1059 adultos, se encontró que el 39% de ellos Discreto
tiene pistolas en su casa
Cuando se probaron 19,218 máscaras antigás de la milicia, se Discreto
encontró que 10,322 estaban defectuosas

3. Determinar cuál de los cuatro niveles de medición es el más apropiado

Las estaturas de las mujeres que juegan básquetbol en la liga RAZÓN


Las calificaciones de fantástico, bueno, promedio, pobre o ORDINAL
inaceptable en citas a ciegas
Las temperaturas actuales en los salones de clase de la universidad INTERVALO
Los números del seguro social NOMINAL

4. En esta época de elecciones un encuestador aplica una encuesta a 200 personas y les
pregunta por el partido político de su preferencia: él codifica las respuestas como 0
(para liberales) 1 (centro democrático) 2 (conservadores) y 3 (para otras respuestas),
entonces calcula el promedio de los números y obtiene 0,95 ¿Cómo se interpreta ese
valor?

Dado que la variable que se está analizando es cualitativa nominal no tiene sentido
hacer operaciones aritméticas con ellas. Por lo tanto, el valor 0,95 no es un dato
estadístico que brinde algún análisis sobre los resultados. Creo que es una forma
errónea de interpretar los resultados. Por el contrario, el encuestador debió realizar una
distribución de frecuencias para conocer la frecuencia absoluta por cada uno de los
partidos, completando la tabla de frecuencias podrá conocer el número de personas
por cada partido político.
5. Un profesor está interesado en estudiar los hábitos de sueño de los estudiantes en sus
clases, Para ello registra el tiempo (en minutos) que demoran en quedarse dormidos
sus alumnos desde que empieza la clase. Los datos del Profesor son los siguientes:
10,5 11,3 11,9 12 12,3 12,3 12,5 12,7 13,4 13,7
13,8 14,2 14,8 15,1 15,3 16,7 16,8 18,8 20,8 20,9

a) Construya una distribución de frecuencias

Cálculo del Número de Intervalos:


No = (3,32 Log N) + 1
No = (3,32 Log 20) + 1 = 5,31
Se tomarán 6 Intervalos.

Cálculo del Tamaño del Intervalo:


Rango = 20,9 – 10,5 = 10,4
Tamaño = C = 10,4 / 6 = 1,7333
Se Aproxima a 1,8

Nuevo Rango = 1,8 * 6 = 10,8


Diferencia de Rangos = 10,8 – 10,4 = 0,4
Esta diferencia se distribuirá entre los valores extremos.

Fi Hi
Intervalos Xi
fi Frecuencia hi Frecuencia %
Marca
Frecuenci Absoluta Frecuenci Relativa % Acumulad
de
De A a Absoluta Acumulad a Relativa Acumulad o
Clase
a a
10,3 11,9 11,15 4 4 0,2 0,2 20 20
12 13,7 12,95 7 11 0,35 0,55 35 55
13,8 15,5 14,75 4 15 0,2 0,75 20 75
15,6 17,3 16,55 2 17 0,1 0,85 10 85
17,4 19,1 18,35 1 18 0,05 0,9 5 90
19,2 21,1 20,20 2 20 0,1 1 10 100
10
20 0
b) Realice un histograma

c) Calcule las medidas de tendencia central: Media, mediana, moda, mitad de rango.
Para evaluar estas medidas, considerando que el número de datos es menor a
30, se aplican las siguientes fórmulas:

Media:

µ = 14,49

Mediana: La misma cantidad de valores se encuentra por arriba de la


mediana que por debajo de ella = 13,75

Moda: Dato que se presenta con mayor frecuencia = 12,3

Mitad de Rango = Suma del menor y el mayor de los datos y dividiéndola


entre dos = 15,7.

d) Conclusiones

Se evidencia que la mayoría de las estudiantes se duermen entre 12 y 13,7


minutos de clase.

Solo un estudiante es el que más duerme en el salón, la duración de sueño


esta entre 17,4 y 19,1.

Se evidencia que el 50% de los estudiantes duerme menos de 14,49


minutos en clase.
Se evidencia que el 50% de los estudiantes duerme más de 14,49 minutos
en clase.

6. Las edades de 50 jóvenes corresponden a:

1 4 9 24 9 13 20 1 14 21
11 12 12 15 9 15 6 18 20 25
20 5 13 7 5 7 12 20 11 20
15 20 14 8 2 11 4 11 13 22
10 23 15 12 20 22 7 10 15 10

Realice un análisis completo de estos datos.

a) Construya una distribución de frecuencias

Cálculo del Número de Intervalos:


No = (3,32 Log N) + 1
No = (3,32 Log 50) + 1 = 6,64
Se tomarán 7 Intervalos.

Cálculo del Tamaño del Intervalo:


Rango = 25 – 1 = 24
Tamaño = C = 24 / 7 = 3,43
Se Aproxima a 4

Nuevo Rango = 4 * 7 = 28
Diferencia de Rangos = 28 – 24 = 4
Esta diferencia se distribuirá entre los valores extremos

INTERVALOS
Ni Hi
Xi
ni Frecuencia hi Frecuencia %
Marc
Frecuenci Absoluta Frecuenci Relativa % Acumulad
DE A a de
a Absoluta Acumulad a Relativa Acumulad o
Clase
a a
1
1 4 2,5 5 5 0,1 0,1 10
0
1
5 8 6,5 7 12 0,14 0,24 24
4
2
9 12 10,5 14 26 0,28 0,52 52
8
2
13 16 14,5 10 36 0,2 0,72 72
0
1
17 20 18,5 8 44 0,16 0,88 88
6
1
21 24 22,5 5 49 0,1 0,98 98
0
25 28 26,5 1 50 0,02 1 2 100
50
b) Realice un histograma

c) Calcule las medidas de tendencia central: Media, mediana, moda, mitad de rango.
Como el número de datos es mayor a 30, se aplicarán las fórmulas establecidas
para datos aplicados.

Media:

   xi hi

INTERVALOS
Ni Hi
Xi
ni Frecuencia hi Frecuencia % µ
Marc
Frecuenci Absoluta Frecuenci Relativa % Acumulad Medi
DE A a de
a Absoluta Acumulad a Relativa Acumulad o a
Clase
a a

1
1 4 2,5 5 5 0,1 0,1 10 0,25
0
1
5 8 6,5 7 12 0,14 0,24 24 0,91
4
2
9 12 10,5 14 26 0,28 0,52 52 2,94
8
2
13 16 14,5 10 36 0,2 0,72 72 2,9
0
1
17 20 18,5 8 44 0,16 0,88 88 2,96
6
1
21 24 22,5 5 49 0,1 0,98 98 2,25
0
25 28 26,5 1 50 0,02 1 2 100 0,53
50 12,74

Media = 12,74.

Mediana:

Ubicación
n  1 50  1
  25,5
2 2
La ubicación se señala en la siguiente tabla:

INTERVALOS
Ni Hi
Xi
ni Frecuencia hi Frecuencia %
Marc
Frecuenci Absoluta Frecuenci Relativa % Acumulad
DE A a de
a Absoluta Acumulad a Relativa Acumulad o
Clase
a a
1
1 4 2,5 5 5 0,1 0,1 10
0
1
5 8 6,5 7 12 0,14 0,24 24
4
2
9 12 10,5 14 26 0,28 0,52 52
8
2
13 16 14,5 10 36 0,2 0,72 72
0
1
17 20 18,5 8 44 0,16 0,88 88
6
1
21 24 22,5 5 49 0,1 0,98 98
0
25 28 26,5 1 50 0,02 1 2 100
50
Estimación
j
Me  Linf  c
f

25,5  7
Me  9  4  14,29
14

Moda:

Ubicación: Se encuentra en la clase donde está la mayor frecuencia absoluta.

La ubicación se señala en la siguiente tabla:


INTERVALOS
Ni Hi
Xi
ni Frecuencia hi Frecuencia %
Marc
Frecuenci Absoluta Frecuenci Relativa % Acumulad
DE A a de a Absoluta Acumulad a Relativa Acumulad o
Clase
a a
1
1 4 2,5 5 5 0,1 0,1 10
0
1
5 8 6,5 7 12 0,14 0,24 24
4
1 2
9 10,5 14 26 0,28 0,52 52
2 8
1 2
13 14,5 10 36 0,2 0,72 72
6 0
2 1
17 18,5 8 44 0,16 0,88 88
0 6
2 1
21 22,5 5 49 0,1 0,98 98
4 0
2
25 26,5 1 50 0,02 1 2 100
8
50

Estimación:
1
Mo  Linf  c
1   2

1  Diferencia • de la frecuencia absoluta con la anterior  14 - 7  7

 2  Diferencia • de la frecuencia absoluta con la anterior  14 - 10  4

7
Mo  9  4  10,65
74

d) Conclusiones

Se evidencia que la mayoría de los jóvenes tienen entre 9 y 12 años.

Se evidencia que el 50% de los estudiantes son mayores a 13 años.

Se evidencia que el 50% de los estudiantes son menores a 13 años.

7. Se midieron en minutos, los tiempos de espera en filas de dos bancos obteniendo los
siguientes resultados:

 Banco 1: 4, 7, 7
 Banco 2: 1, 3, 14
Determina la desviación estándar y varianza de los datos en cada caso y realice
inferencias de los resultados. ¿Cuál es el coeficiente de variación en cada caso?

Banco 1:

Primero Calculamos la Media, usando la siguiente fórmula:

µ=2

Para el cálculo de la desviación estándar, usamos la siguiente fórmula:

( X   ) 2
 
n 1

δ: 1,732

Varianza:

( X i   ) 2
V= =3
n 1

Coeficiente de Variación:

 2,3
CV    0,1074
M 0,866
21,4= 86,6%
Banco 2:

Primero Calculamos la Media, usando la siguiente fórmula:

µ=6

Para el cálculo de la desviación estándar, usamos la siguiente fórmula:

( X   ) 2
  = 7
n 1
Varianza:

( X i   ) 2
V= = 49
n 1
Coeficiente de Variación:
 2,3
CV    0,1074
M 1,167
21,4= 116,7%
Conclusiones:

Se evidencia que, aunque existen el mismo número de personas en filas de los dos
bancos los resultados de coeficiente de variación son diferentes, para el primer banco es
de 86,6% y para el segundo es de 116,7% a causa de que los tiempos de atención del
banco dos son muy dispersos.

8. Un curso de estadística se divide para resolver un examen, obteniendo los siguientes


grupos de calificaciones:

G1 9 7 5 8 4 7 3 9 10 5 7
G2 7 9 6 7 8 4 5 9 8 8 6

Determine las medidas de variación y posición relativa para estos dos grupos y realice las
inferencias que los datos le permitan.

Para este ejercicio se emplearon las siguientes fórmulas:

Media:

Varianza:

 x i  
2

V= n

Desviación Estándar:

( X  M ) 2
 V 
n

Coeficiente de Variación:

 2,3
CV    0,1074
M 21,4
Empleando estas fórmulas se obtuvieron las Medidas de Variación descritas a
continuación.
PARA EL GRUPO 1

Medidas de Variación:

Media: 6,73
Desviación Estándar: 2,14
Varianza: 4,56
Coeficiente de Variación: 0,3175 = 31,75%

Medidas de Posición:

Cuartiles:

Datos Posición
3  
4  
5 Primer Cuartil
5  
7  
7 Segundo Cuartil
7  
8  
9 Tercer Cuartil
9  
10  

Primer Cuartil: 5
Segundo Cuartil: 7
Tercer Cuartil: 9

Deciles:

Para el cálculo de la posición de los deciles se emplea la siguiente fórmula:


k
Dk  ( n  1)
10

Resultado
  K N de Decil
Posición
Decil Uno: 1 12 1,2 3

Decil Dos: 2 12 2,4 4


Decil Cinco: 5 12 6 7

Decil Nueve: 9 12 10,8 10

Decil Uno: 3
Decil Dos: 5
Decil Cinco: 7
Decil Nueve: 10

Percentiles:

Para el cálculo de la posición de los percentiles se emplea la siguiente fórmula:


k
Pk  (n  1)
100

Resultado
K N de Percentil
Posición
Percentil 23 23 12 2,76 5

Percentil 50 50 12 6 7

Percentil 97 97 12 11,64 10

Percentil Veintitrés: 5
Percentil Cincuenta: 7
Pecentil Noventa y Siete: 10

Conclusiones:

Las calificaciones obtenidas por el Grupo 1 tienen un coeficiente de variación del 31,75%,
lo que indica que tienen un grado de dispersión considerable.

El 25% de los estudiantes sacaron notas menores que 5.

El 50% de los estudiantes sacaron notas menores que 7.

El 75% de los estudiantes sacaron notas menores que 9.

PARA EL GRUPO 2

Medidas de Variación:
Media: 7
Desviación Estándar: 1,537
Varianza: 2,364
Coeficiente de Variación: 0,2196 = 21,96%

Medidas de Posición:

Cuartiles:

Datos Posición
4  
5  
6 Primer Cuartil
6  
7  
7 Segundo Cuartil
8  
8  
8 Tercer Cuartil
9  
9  

Primer Cuartil: 6
Segundo Cuartil: 7
Tercer Cuartil: 8

Deciles:

Para el cálculo de la posición de los deciles se emplea la siguiente fórmula:


k
Dk  ( n  1)
10
Resultado
K N de Decil
  Posición
Decil Uno: 1 12 1,2 4

Decil Dos: 2 12 2,4 5


Decil
5 12 6 7
Cinco:
Decil
9 12 10,8 9
Nueve:

Decil Uno: 4
Decil Dos: 5
Decil Cinco: 7
Decil Nueve: 9
Percentiles:

Para el cálculo de la posición de los percentiles se emplea la siguiente fórmula:


k
Pk  (n  1)
100

Resultado
  K N de Percentil
Posición
Percentil
23 12 2,76 6
23
Percentil
50 12 6 7
50
Percentil
97 12 11,64 9
97

Percentil Veintitrés: 6
Percentil Cincuenta: 7
Pecentil Noventa y Siete: 9

Conclusiones:

Las calificaciones obtenidas por el Grupo 1 tienen un coeficiente de variación del 21,96%,
lo que indica que tienen un grado de dispersión aceptable, es decir que tuvieron notas
similares.

El 25% de los estudiantes sacaron notas menores que 6.

El 50% de los estudiantes sacaron notas menores que 7.

El 75% de los estudiantes sacaron notas menores que 9.

También podría gustarte