Está en la página 1de 72

Unidad I de Aprendizaje

Estadística Descriptiva

Manuel Treco Hernández

2020
1. 1 Generalidades.
Población: Conjunto de elementos a los que se les estudia una
característica. Una población puede ser:
Finita: es aquella que incluye una cantidad limitada contable de
observaciones, individuos o medidas. Siempre que sea posible alcanzar
(contar) el número total de todas las posibles mediciones, se considera
como finita la población.
Infinita: es aquella que incluye un gran conjunto de observaciones o
mediciones que no pueden alcanzarse por conteo. Al menos,
hipotéticamente, no existe límite en cuanto al número de observaciones que
el experimento puede generar.
Muestra: Subconjunto o parte de la población.
En Estadística en la mayoría de los casos se requieren Muestras Aleatorias
que corresponden aquellas cuyas observación, medición o individuo de la
población tenga la misma condición, chance o certeza de ser seleccionado.
1. 1 Generalidades.
Variable estadística: son características de los elementos
poblacionales que se pueden describir o medir.
Ejemplo: sexo, edad, peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presión, grosor, diámetro.
Datos: son realizaciones o valores que toma la variable en cada caso.
Clasificación de las variables estadísticas.
• Cualitativas o Atributos : Las características de los elementos
poblacionales se describen.
Ejemplo: Sexo, hábito de fumar, color de ojos, estrato ,religión, estado
civil, raza.
• Cuantitativas : Las características de los elementos poblacionales se
miden.
Ejemplo: Peso, edad, estatura, presión, humedad, intensidad de un sismo,
número de hermanos, cantidad de errores ortográficos por página.
1. 1 Generalidades.
Clasificación de las variables estadísticas.
• Discretas: son aquellas que toman valores enteros.
Ejemplo: número de hijos, número de empleados de una empresa, número
de asignaturas aprobadas en un semestre.
• Continuas: son aquellas que toman cualquier valor dentro de un intervalo
real.
Ejemplo: temperatura, peso, estatura, presión, fuerza, velocidad, humedad,
intensidad de un sismo.
Escalas de medida.
Son sucesiones de medidas que permiten ordenar los datos jerárquicamente.
• Nominal: es aquella que identifica o etiqueta las categorías de la variable
para establece diferencia entre ellas.
Ejemplo: genero, grupos sanguíneos, colores, profesión, nomenclatura
urbana, códigos de barra.
1. 1 Generalidades.
• Ordinal: es aquella que identifica o etiqueta y ordena las categorías de
la variable.
Ejemplo: estrato, nivel de escolaridad, mejoría a un tratamiento, grado de
satisfacción, intensidad del dolor, grados militares, jerarquía en una
empresa.
• Intervalo: es aquella que identifica, ordena, compara valores de la
variable y el cero(0) como medida es relativo (arbitrario).
Ejemplo: temperatura (°C), el peso, la velocidad, altura, la distancia, el
tiempo.
• Razón: es aquella que identifica, ordena, compara valores de la variable y
el cero(0) como medida es absoluto (fijo).
Ejemplo: Ingreso, volumen, masa, densidad, longitud, número de hijos por
familia, cantidad de errores ortográficos por pagina.
1. 1 Generalidades.
Concepto de Estadística.
La Estadística es la disciplina que estudia los datos. También la
podemos conceptualizar como la disciplina de estudio de la
incertidumbre.
División de la Estadística.
• Estadística Descriptiva (Deductiva): se encarga de hacer un análisis
exploratorio de los datos provenientes de una población o una
muestra.
• Estadística Inferencial o Inferencia Estadística: Conjunto de
técnicas, mediante las cuales se hacen generalizaciones o se toman
decisiones en base a información parcial obtenida mediante técnicas
descriptivas.
Ejemplo 1:
1. Un técnico de control de calidad selecciona piezas ensambladas de una
línea de montaje y registra la siguiente información sobre cada pieza:
A: defectuosa o no defectuosa
B: el número de identificación del trabajador que ensambló la pieza.
C: el peso de la pieza.
a) ¿cuál es la población?
b) La población ¿es finita o infinita?
c) ¿cuál es la muestra?
d) Clasifique las respuestas para cada una de las tres variables como datos
de atributo o cuantitativos.
Ejemplo 2:
Identifique las siguientes expresiones como variables de cualitativas o
variables cuantitativas y ubíquela en su respectiva escala de medición.
a) La resistencia a la rotura de un tipo de cuerda dado.
b) El color de cabello de los niños que se presentan a una audición de
música.
c) El número de señales de alto que hay en poblaciones con menos de
5,000 habitantes.
d) Si un grifo es o no defectuoso.
e) El número de preguntas contestadas correctamente en una prueba saber
pro.
f) El tiempo necesario para contestar una llamada telefónica en cierta
oficina de bienes raíces
1.2 Organización de datos unidimensionales.
1.2 Organización de datos unidimensionales.
1.2 Organización de datos unidimensionales.
Frecuencias Frecuencias acumuladas
Variable
Absoluta Relativa Absoluta Relativa

Total 1
1.2 Organización de datos unidimensionales.
1.2 Organización de datos unidimensionales.
1.2 Organización de datos unidimensionales.
Marca Frecuencias Frecuencias acumuladas
Clases de
Absoluta Relativa Absoluta Relativa
clases

Total 1
Ejemplo 3:
Una empresa que tiene 50 trabajadores se propone reestructurar las
remuneraciones, se estudia los años de servicio de los trabajadores
determinándose los siguientes resultados:

a) Organice la información en una tabla de frecuencias.


b) ¿ Qué cantidad de trabajadores tienen 8 años de servicio?
c) ¿ Qué porcentaje de trabajadores tienen 6 años de servicio?
d) Si aquellos trabajadores que tengan a lo menos seis años de servicio
reciben un aumento del 8% .¿Qué porcentaje de los trabajadores recibió
dicho aumento?
e) Si todos los trabajadores que tengan a lo más cinco años de servicio
reciben una bonificación de $20,000. ¿ Qué cantidad de trabajadores recibió
dicha bonificación?
Solución:
a) Distribución de frecuencias.
Años Trabajadores %trabajadores Trab. Acum %Trab. Acum
4 9 18% 9 18%
5 8 16% 17 34%
6 9 18% 26 52%
7 10 20% 36 72%
8 8 16% 44 88%
9 6 12% 50 100%
Total 50 100%

b) Hay 8 trabajadores con ocho años de servicio.


c) El 18% de los trabajadores tienen seis años de servicio.
d) El 18%+20%+16%+12%= 66% de los trabajadores recibió un 8% de
aumento.
e) Hay 9+8=17 trabajadores que recibieron una bonificación de $20,000.
Ejemplo 4
Los siguientes datos corresponden a las notas (escala de 0 a 100), obtenidas
por 100 alumnos en un curso de Estadística:

a) Construya la correspondiente distribución de frecuencias de los datos.


b) ¿En qué clase se concentra el mayor número de notas?
c) ¿Cuál es la frecuencia absoluta del cuarto intervalo?
d) Interprete la frecuencia acumulada del sexto intervalo.
e) Interprete la frecuencia relativa acumulada del quinto intervalo.
Li Ls Nota media Alumnos % Alumnos Al. Acum. %Al. Acum.
17 27 22 4 4% 4 4%
27 37 32 7 7% 11 11%
37 47 42 11 11% 22 22%
47 57 52 15 15% 37 37%
57 67 62 20 20% 57 57%
67 77 72 14 14% 71 71%
77 87 82 14 14% 85 85%
87 97 92 8 8% 93 93%
97 107 102 7 7% 100 100%
Total 100 100%
1.3 Distribución gráficas de datos.
Para el estudio geométrico de los datos usamos los gráficos estadísticos.
El comportamiento visual de los datos, nos permite resumir información
usando los siguientes elementos.
• Tendencia: los datos se ajustan a un modelo matemático conocido.
• Centralidad: representa la concentración de los datos.
• Dispersión: distribución de los datos respecto a la concentración.
• Asimetría: la extensión de los datos formando colas.
• Conglomerados: son subconjuntos de datos formando distribuciones.
• Datos atípicos: Son valores que se salen del rango normal de datos.
1.3.1 Gráficos de datos no agrupados.
• Diagrama de Barras: es un conjunto de barras o alturas en el plano,
correspondientes a cada categoría o valor de la variable.
1.3.2 Gráficos de datos agrupados.
Cuando los datos se le hace un tratamiento como el agrupamiento en clases,
los gráficos asociados son:
• Histograma: es una secuencia finita de rectángulos de base las clases y
altura la frecuencia (absoluta o relativa), correspondiente.
• Polígono de frecuencias: es una curva que se genera al unir los puntos
de frecuencias (absolutas o relativas) de las correspondientes marcas de
clase. El polígono cierra en la marca de clase antes de primera y la marca
de clase posterior a la última.
• Ojiva: es una curva creciente, que se genera al unir los puntos de
frecuencias acumuladas (absolutas o relativas), asociadas a los limites
superiores de clase. La ojiva inicia en el límite inferior de la primera
clase.
Ejemplo 5:
Para el ejemplo 3, realice un diagrama circular y un diagrama de barras.
Solución:
• Diagrama Circular:
• Diagrama de barras:
Ejemplo 6:
Con relación al ejemplo 4, realice un histograma, un polígono de frecuencias
y una ojiva.
Solución:
• Histograma:
• Polígono de frecuencias:
• Ojiva:
Medidas Resumen.

x i
X = i =1
n k
k  ni x i
x =  fi x i = i =1
i =1
n
Ejemplo 7:

1 0 4 5 3 1
2 2 1 3 2 3
0 3 3 2 0 2
1 3 2 2 2 1
0 3 2 2 4 1
Ejemplo 8:
En la tabla se presenta la distribución de estatura en centímetros de 210
personas. Determine la media aritmética de la estatura.

k
 ni x i
Media : x = i =1
33900
= = 161.42
n 210
Ejemplo 9:
Ejemplo 10:
Ejemplo 11:

En la tabla se observa que la


distribución de hijos por familia,
tiene moda 1 hijo.
Ejemplo 12:
Relación entre la media, la mediana y la moda

Cuando los datos son sesgados (asimétricos), lo mejor


es usar la mediana.
Ejemplo 12:
Ejemplo 13:
Ejemplo 14:
Se define en minutos el tiempo que le lleva arreglarse, desde que se levanta
hasta que sale de casa. A lo largo de 60 días consecutivos. Usted recoge los
tiempos (redondeados a minutos) que se muestras a continuación

61 40 39 50 27 37 44 24 62 20 42 61
31 25 42 21 20 22 29 23 36 56 40 43
63 28 69 53 50 27 40 30 29 35 39 48
64 34 51 59 42 68 45 45 23 20 69 48
61 42 65 48 43 37 29 25 60 20 62 48

Determine los cuartiles, los percentiles 50 y 65 (Ejercicio en Excel).


Ejemplo 15:
Los datos siguientes representan la cantidad de trabajadores accidentados
en la unidad de trituración de la empresa minera El Hoyo, por día, durante
52 días de trabajo en el año 2007:
0 2 0 1 3 4 0 2 1 3 0 2 2 1 0 5 2 6 1 2 1 4 1 1 0 1
1 1 2 0 5 2 0 4 3 2 4 3 2 1 6 2 3 3 5 1 3 6 1 3 4 5
Obtenga la varianza y desviación estándar de los datos.
Solución: La tabla de frecuencia de los datos es:

0 8 0 5,0625 40,5
1 13 13 1,5625 20,3125
2 11 22 0,0625 0,6875
3 8 24 0,5625 4,5
4 5 20 3,0625 15,3125
5 4 20 7,5625 30,25
6 3 18 14,0625 42,1875
Total 52 117 153,75
Ejemplo 16:
la tabla representa la distribución de la talla en cm, 100 de personas.
Obtenga la varianza y desviación típica.

Solución:
Ajustando la tabla a las condiciones del problema.
140 150 145 15 2175 5133,75
150 160 155 30 4650 2167,5
160 170 165 25 4125 56,25
170 180 175 20 3500 2645
180 200 190 10 1900 7022,5
Total 100 16350 17025
Ejemplo 17:
Ejemplo 18:
Medidas de Forma.
Son indicadores estadísticos que permiten identificar si una distribución
presenta uniformidad o nivel de concentración de datos entorno a la región
central de los datos.

• Asimetría : Es aquella que nos permite identificar si los datos se distribuyen


de forma uniforme alrededor de la media aritmética.

La asimetría presenta tres estados:

Asimetría positiva: cuando la mayoría de los datos se encuentran por encima


del valor de la media aritmética,

Simetría: cuando los datos se distribuyen aproximadamente la misma cantidad


en ambos lados de la media aritmética.
Asimetría negativa: cuando la mayor cantidad de datos se aglomeran en los
valores menores que la media aritmética.
Ejemplo19:

13 14 15 16 17 18 19 20 21 22

Días 1 1 2 3 6 8 4 3 2 1
13 1 13 22,792924 -108,8178309 1
14 1 14 14,2445369 -53,76163942 2
15 2 30 15,3922997 -42,70121849 4
16 3 48 9,44328824 -16,75422107 7
17 6 102 3,5962539 -2,784196569 13
18 8 144 0,40790843 0,092108355 21
19 4 76 6,01040583 7,36759424 25
20 3 60 14,8626431 33,08136686 28
21 2 42 20,8116545 67,13436944 30
22 1 22 17,8574402 75,46208586 31
TOTAL 31 551 125,419355 -41,68158169
• Curtosis : Esta medida determina el grado de concentración que presentan
los valores en la región central de la distribución.
La Curtosis presenta 3 grados:

Platicúrtica: cuando hay una baja concentración de datos entorno a la


región central.

Mesocúrtica: cuando hay una moderada o normal concentración de datos en


la región central.

Leprocúrtica: cuando hay una alta concentración de datos en la región


central.
Ejemplo 20:

4 5 5 1 7 4 4 3 6 5
3 2 4 4 3 6 6 4 5 5
6 4 3 3 4 5 4 3 2 4
5 2 4 7 3 6 2 2 4 1
2 1 3 7 3 1 5 1 7 2
4 4 2 4 5 3 6 3 5 3

También podría gustarte