Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. ESTADÍSTICA DESCRIPTIVA
Definición 2.- Es el conjunto de métodos que implican la recolección, presentación y
caracterización de un conjunto de datos a fin de describir en forma apropiada las
diversas características de estas.
2. ESTADÍSTICA INFERENCIAL
Definición 3.- Es el conjunto de métodos o técnicas que posibilitan la generalización o
toma de las decisiones en base a una información parcial obtenida mediante técnicas
descriptivas.
Ejemplo 1: Un gerente de personal desea conocer las aptitudes de cinco secretarias que
trabajan en una dependencia particular de una compañía. Se aplica una prueba de
aptitudes a las cinco secretarias y las calificaciones son 85, 90, 93, 82 y 95 puntos.
Supongamos que la medida estadística que emplea el gerente de personal es la aptitud
promedio o media aritmética.
85 + 90 + 93 + 82 + 95 435
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 = = = 89 𝑝𝑢𝑛𝑡𝑜𝑠
5 5
Estadística descriptiva: el promedio de calificación de las 5 secretarias es 89 puntos.
Estadística inferencial: el promedio general de todas las secretarias de la compañía tiene
87 puntos.
Ejemplo 2: Cuatro bombillas de marca A dejaron de funcionar después de 1100, 980,
900, 1020 horas de uso continuo. Cinco bombillas de marca B dejaron de funcionar
después de 960, 1050, 1065, 845 y 980 horas de uso continúo. Se llega a las siguientes
conclusiones:
a) La duración promedio de las cuatro bombillas marca A es de 1000 hrs., mientras
que la duración promedio de las cinco bombillas marca B es de 980 hrs.
La duración promedio de las bombillas marca A es:
1100 + 980 + 900 + 1020 4000
𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑀𝑎𝑟𝑐𝑎 𝐴 = = = 1000 ℎ𝑟𝑠.
4 4
La duración promedio de las bombillas marca B es:
960 + 1050 + 1065 + 845 + 980 4900
𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑀𝑎𝑟𝑐𝑎 𝐴 = = = 980 ℎ𝑟𝑠.
5 5
ESTE ENUNCIADO CORRESPONDE A UNA ESTADÍSTICA DESCRIPTIVA YA QUE NO DA
CONCLUSION, SINO SOLO DESCRIBE UN PARAMETRO.
b) La duración promedio de todas las bombillas marca A es mayor que la de todas
las bombillas marca B.
PUESTO QUE SE ESTA GENERALIZANDO, QUE LA DURACIÓN PROMEDIO DE TODAS LAS
BOMBILLAS MARCA ES MAYOR QUE TODAS LAS BOMBILLAS MARCA B, LA CONCLUSIÓN
PROVIENE DE UNA ESTADÍSTICA INFERENCIAL.
c) La diferencia entre los dos promedios es de 20 hrs.
Diferencia = Promedio marca A – Promedio marca B = 1000 hrs. – 980 hrs. = 20 hrs.
EL ENUNCIADO CORRESPONDE A UNA ESTADÍSTICA DESCRIPTIVA.
d) La diferencia entre los dos promedios es demasiado pequeño para llegar a la
conclusión de que las bombillas marca A son mejores que las bombillas marca B.
SE ESTA USANDO LOS PROMEDIOS DE LOS DATOS OBSERVADOS PARA INFERIR SOBRE
LA DIFERENCIA DE TODAS LAS BOMBILLAS. POR TANTO, EL ENUNCIADO CORRESPONDE
A UNA ESTADÍSTICA INFERENCIAL.
e) Si se selecciona o prueba otra bombilla marca A, probablemente durara más que
el promedio de las bombillas marca B.
SE HACE UNA GENERALIZACIÓN QUE CUALQUIER BOMBILLA MARCA DURARÁ MÁS QUE
EL PROMEDIO DE LAS BOMBILLAS MARCA B, PROVIENE DE LA INFERENCIA ESTADÍSTICA.
f) Usted decide comprar bombillas marca A en vez de bombillas marca B.
USTEDES ESTAN GENERALIZANDO QUE LAS BOMBILLAS MARCA A DURARAN MAS QUE
LAS BOMBILLAS MARCA B. POR LO TANTO, ES UNA INFERENCIA ESTADÍSTICA.
¿Cuáles de las conclusiones provienen de la Estadística Descriptiva y cuáles de la
Inferencia Estadística?
POBLACIÓN Y MUESTRA
Definición 4.- Población es la colección de todos los individuos, objetos u observaciones
que poseen al menos una característica común.
Ejemplos
1. Las edades de los estudiantes del Perú.
2. Las edades de los trabajadores del área de salud.
3. Las edades de los profesores activos.
4. Los pesos de los melones de una cosecha de la granja “ABC”.
5. Las razas de los perros de la ciudad de Cochabamba.
Población finita.- Una población finita es aquella que tiene un número limitado de
elementos.
Notación: El tamaño de la población finita lo denotaremos por “N”.
Ejemplo: Las estaturas de todos los estudiantes que actualmente estudian en la
Universidad Mayor de San Simón.
Población infinita.- Una población infinita es aquella que no tiene un límite o cotas, es
decir, tiene un número infinito de elementos.
H3 = 0.75, es la proporción de las familias bajo estudio con a lo más dos hijos.
H4 = 0.9375, es la proporción de las familias bajo estudio con a lo más tres hijos.
H5 = 1, es la proporción de las familias bajo estudio con a lo más cuatro hijos.
Definición 2.7.- Se llama frecuencia relativa acumulada “MAYOR QUE” del valor y i a la
frecuencia relativa total de las observaciones mayores o iguales a y i.
Si denotamos por “Hi*”.
𝐻𝑖 ∗ = ℎ𝑖 + ℎ𝑖+1 + ⋯ + ℎ𝑚
Valores Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
diferentes Absoluta Absoluta Absoluta Relativa Relativa Relativa Relativa
observados ni Acumulada Acumulada hi Porcentual Acumulada Acumulada
yi “Menor “Mayor 100hi% “Menor “Mayor Que”
Que” Ni Que” Ni* Que” Hi Hi*
y1 = 0 n1 = 1 N1 = 1 N1* = 16 h1 = 0.0625 6.25 H1 = 0.0625 H1* = 1
y2 = 1 n2 = 6 N2 = 7 N2* = 15 h2 = 0.375 37.5 H2 = 0.4375 H2* = 0.9375
y3 = 2 n3 = 5 N3 = 12 N3* = 9 h3 = 0.3125 31.25 H3 = 0.75 H3* = 0.5625
y4 = 3 n4 = 3 N4 = 15 N4* = 4 h4 = 0.1875 18.75 H4 = 0.9375 H4* = 0.25
y5 = 4 n5 = 1 N5 = 16 N5* = 1 h5 = 0.0625 6.25 H5 = 1 H5* = 0.0625
Total n = 16 h=1 100
H1* = h1 + h2 + h3 + h4 + h5 = 0.0625 + 0.375 + 0.3125 + 0.1875 + 0.0625 = 1
H2* = h2 + h3 + h4 + h5 = 0.375 + 0.3125 + 0.1875 + 0.0625 = 0.9375
H3* = h3 + h4 + h5 = 0.3125 + 0.1875 + 0.0625 = 0.5625
H4* = h4 + h5 = 0.1875 + 0.0625 = 0.25
H5* = h5 = 0.0625
Interpretación:
H1* = 1, es la proporción de familias en la muestra con por lo menos 4 hijos.
H2* = 0.9375, es la proporción de familias en la muestra con por lo menos 1 hijo.
H3* = 0.5625, es la proporción de familias en la muestra con por lo menos 2 hijos.
H4* = 0.25, es la proporción de familias en la muestra con por lo menos 3 hijos.
H5* = 0.0625, es la proporción de familias en la muestra con 4 hijos.
EJERCICIO 1: Un ingeniero agrónomo visita 25 cooperativas agrarias de naranjas en el
valle de Huaral y en cada una anotó el número de plantas atacadas por cierto hongo, de
lo cual resultaron los siguientes datos:
15 20 25 15 18 16 17 18 20 18 18 18
19 16 17 19 16 17 17 17 19 18 19 18
15
a. Diga qué tipo de datos son estos.
b. Construya una tabla de distribución de frecuencias adecuada a este conjunto de
valores.
c. ¿Cuántas cooperativas agrarias tienen a lo más 20 plantas atacadas por hongos?
d. ¿Cuántas cooperativas agrarias tienen por lo menos 17 plantas atacadas por
hongos?
e. ¿Qué proporción de cooperativas bajo estudio tienen 18 plantas atacadas por
hongos?
f. ¿Qué proporción de cooperativas tienen 18 o menos plantas atacadas por
hongos?
g. ¿Qué porcentaje de cooperativas tienen 18 o menos plantas atacadas por
hongos?
Fumadores severos
Clasificar un grupo de individuos por su grado de instrucción:
Analfabetos
Primaria
Secundaria
Superior
Variables cuantitativas.- se llaman así, cuando la variable está asociada a una
característica cuantitativa.
Ejemplo: Ingreso de una familia, número de accidentes de tránsito, longitud, tiempo,
etc.
Variables cuantitativas discretas.- son aquellas que surgen por el procedimiento de
conteo.
Ejemplo: el número de hijos por familia, el número de estudiantes por colegio, el
número de habitantes por ciudad, etc.
Variable cuantitativa continua.- son aquellas que surgen cuando se mide alguna
característica.
Ejemplo: la estatura, el peso, ingresos, etc.
Ejercicio:
a) Tiempo de servicio de los empleados de una empresa.
Resp. Variable cuantitativa continúa.
b) Número de cheques girados diariamente en un mes.
Resp. Variable cuantitativa discreta.
c) Número de acciones comunes vendidas cada día en la Bolsa de Valores de
Bolivia.
Resp. Variable cuantitativa discreta.
d) Lugar de nacimiento de las personas que viven en Ivirgarzama.
Resp. Variable cualitativa nominal
e) Nivel de educación y religión de los cochabambinos.
Resp. Variables cualitativas Nivel de educación ordinal, religión nominal.
f) Temperatura y humedad diaria de Ivirgarzama.
Resp. Variable cuantitativa continúas.
n2 = 6, significa que en las familias encuestadas, seis tienen un hijo cada una.
Definición.- Se llama frecuencia absoluta acumulada “MENOR QUE” corresponde al
valor yi, al número de observaciones menores o iguales a y i (xi<= yi).
Si denotamos esta frecuencia por “Ni”.
𝑁𝑖 = 𝑛1 + 𝑛2 + 𝑛3 + ⋯ + 𝑛𝑖
Número de hijos Frecuencias Frecuencia
yi absolutas acumulada absoluta
ni “MENOR QUE”
Ni
0 n1 = 1 N1 = 1
1 n2 = 6 N2 = 7
2 n3 = 5 N3 = 12
3 n4 = 3 N4 = 15
4 n5 = 1 N5 = 16
Totales n = 16
N1 = n 1 = 1
N2 = n 1 + n 2 = 1 + 6 = 7
N3 = n1 + n2 + n3 = 1 + 6 + 5 = 12
N4 = n1 + n2 + n3 + n4 = 1 + 6 + 5 + 3 = 15
N5 = n1 + n2 + n3+ n4+ n5 = 1 + 6 + 5 + 3 + 1 = 16
Interpretación:
N1 = 1, significa, que en la encuesta hay 1 familia con 0 hijos.
N2 = 7, significa, que en la encuesta hay 7 familias con 1 o menos hijos.
N1* = 16, significa, las familias encuestadas tienen entre 0 y 4 hijos inclusive.
N2* = 15, significa, que en la encuesta, 15 familias tienen por lo menos 1 hijo.
N3* = 9, significa, que en la encuesta, 9 familias tienen por lo menos 2 hijos.
N4* = 4, significa, que en la encuesta, 4 familias tiene por lo menos 3 hijos.
N5* = 1, significa que de las familias encuestadas, solo una familia tiene 4 hijos.
Tema 4: Tabla de Distribución de Frecuencias
Definición 4.1: Se llama clases a cada uno de los grupos en que se divide el conjunto de
datos.
Xmax = max [x/i = 1, 2, 3, …, n]
Xmin = min [x/i = 1, 2, 3, … , n]
R
Xmin xmax
Definición 4.2: Amplitud del recorrido (l), es la longitud del recorrido del conjunto de
datos.
𝑙 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Definición 4.3: Amplitud de clase es la longitud del intervalo que define la clase.
𝑐𝑖 = 𝑦𝑖 ´ − 𝑦𝑖−1 ´ , 𝑖 = 1, 2, 3, … , 𝑚
𝑙
𝑐=
𝑚
Definición 4.4: La marca de clase es el punto medio del intervalo que representa a dicha
clase.
𝑦𝑖 = 1, 2, 3, … , 𝑚
𝑦𝑖−1 ´ + 𝑦𝑖 ´
𝑦𝑖 = , 𝑖 = 1, 2, 3, … , 𝑚.
2
Definición 4.5: La frecuencia absoluta (ni) de la clase i-esima, es el número de
observaciones del conjunto original que pertenecen a dicha clase.
Ejemplo: Suponga que se han registrado 50 observaciones referentes a los pesos de 50
lingotes de acero producidos por SIDERPERU, la muestra fue obtenida de la producción
semanal y las unidades están dadas en kg.
94.3 93.0 95.5 95.3 92.4 94.4 92.8 93.2 93.6 95.5
92.9 93.6 95.7 93.8 94.8 93.9 92.7 91.6 93.6 93.7
94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9
94.7 92.7 95.0 93.0 92.9 93.7 92.7 93.3 94.6 96.4
94.1 93.7 94.2 93.7 94.0 93.9 93.6 94.6 92.3 94.4
Solución:
m=5
xmin = 91.6 xmax = 96.4
𝑙 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 96.4 − 91.6 = 4.8
𝑙 4.8
𝑐= = = 0.96
𝑚 5
𝑐=1
y´0 = xmin = 91.5
y´1 = y´0 + c = 91.5 + 1 = 92.5
y´2 = y´1 + c =92.5 + 1 = 93.5
y´3 = y´2 + c = 93.5 +1 = 94.5