Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCION A LA ESTADISTICA
1. ESTADÍSTICA
Es la ciencia que nos provee un conjunto de métodos para la recolección, organización, análisis e interpretación
de datos.
CLASIFICACION DE LA ESTADISTICA.
a) Estadística Descriptiva.
Parte de la Estadística que se ocupa de la recolección, clasificación, presentación y descripción de los datos.
b) Estadística Inferencial.
Nos proporciona la teoría necesaria para hacer generalizaciones o inferencias sobre una población utilizando
una muestra.
2. POBLACIÓN Y MUESTRA
a) Población (Universo)
Es la totalidad de objetos o individuos que tienen características comunes, de la cual se desea información. Al
estudio destinado a obtener la información de toda la población se llama CENSO, los más conocidos son los
censos de población, vivienda y económicos. El tamaño de la población se denota por N. Existen poblaciones
finitas o infinitas
b) Muestra
Es una parte o un subconjunto representativo de la población, seleccionado aleatoriamente, cuyo estudio sirve
para hacer “inferencias” sobre la población completa. El proceso de selección de una muestra se llama
MUESTREO. El tamaño de la muestra se denota por n.
Población (N)
Muestra (n)
Inferencia
3. VARIABLE
Es toda característica de una muestra o población que toma valores diferentes. Se denotan con letras mayúsculas:
X, Y, Z, ….
a) Variables Cualitativas
Son aquellas cuyos valores son un conjunto de cualidades no numéricas a las que se les suele llamar categorías
o modalidades o niveles. A su vez pueden ser:
Nominal.
Sus respuestas no pueden ser sometidas a un criterio de orden.
Ordinal.
Sus respuestas toman diferentes valores ordenados según una escala establecida.
Continua.
Son variables que toman cualquier valor dentro de un intervalo real específico de valores.
Ejemplo:
Peso de alumnos de la UNSAAC medido en kilogramos.
Estatura de alumnos del CEPRU medido en metros.
Cantidad de hemoglobina en niños de una I.E. de la Provincia de Anta.
Temperatura corporal en grados centígrados.
DATO.- Es el resultado de medir una característica (variable) de un elemento de una población. También son
los valores que asume una característica de naturaleza cualitativa o cuantitativa.
Ejemplo:
Se tiene la información sobre el estado civil de una muestra de 200 profesores de la UNSAAC (dicha encuesta fue
realizada por la Unidad de Estadística de la UNSAAC, el año 2015) .
120
52,5%
100
80
60
22,5%
40 15%
10%
20
0
S C V D
S
D
15%
22.5%
V
10%
C
52.5%
5. ANÁLISIS DE DATOS CUANTITATIVOS
Distribución de Frecuencias:
Son tablas numéricas de datos ordenados al cual también se le llama tabla de frecuencias.
Propiedades:
F1 f1
Fk n
e) Frecuencia relativa acumulada (Hi).
Fi
Se define por: Hi h 1 h 2 hi
n
Propiedades:
H1 h1
Hk 1
Nº de hijos (xi) fi Fi hi Hi
0 2 2 0,10 0,10
1 4 6 0,20 0,30
2 8 14 0,40 0,70
3 4 18 0,20 0,90
4 2 20 0,10 1,00
Total 20 1,00
4| C E P R U 2 0 2 2
Edad (Ii) xi fi Fi hi Hi
[4 ,8 6 6 6 0,15 0,15
[ 8 , 12 10 8 14 0.20 0,35
[12 ,16 14 12 26 0.30 0,65
[16 ,20 18 10 36 0,25 0,90
[20 ,24] 22 4 40 0,10 1,00
Total 40 1,00
fi Fi
Polígono de
frecuencias Ojiva
0 4 8 12 16 20 24 0 4 8 12 16 20 24 Ii
Ii
6. PARAMETROS Y ESTADISTICOS
PARAMETROS
Son medidas utilizada para describir alguna característica de una población; se trabaja con toda la población y
las decisiones se toman con certidumbre total. Las más utilizadas son:
1.- La media poblacional (µ).
2.- La varianza poblacional (σ2).
3. La desviación estándar poblacional (σ)
ESTADISTICOS O ESTADIGRAFOS.- Son medidas que describen una característica de una muestra,
mediante un valor numérico. La toma de decisiones contiene un grado de incertidumbre. Las más utilizadas son:
1. MEDIA ARITMÉTICA X
a) Datos no tabulados
x1 x 2 xn 1 n
X
n
xi
n i 1
b) Datos tabulados
f1x1 f2x2 fk xk 1 k
X
n
f i xi
n i1
2. MEDIANA (Me)
Es el valor que divide a un conjunto de datos ordenados en dos grupos de igual tamaño o en dos partes iguales,
dejando la mitad de los datos por debajo y la otra mitad por encima.
a) Datos no tabulados
Dado un conjunto de “n” observaciones ordenadas, es decir: X1 X2 ... Xn .
x n 1 , si n impar
2
Me x n x n
2 1
2
, si n par
2
Ejemplo:
Hallar la mediana de las edades de los grupos de niños que se indican (en años):
i) 5, 4, 9, 6, 3, 8, 8, 2, 10
6| C E P R U 2 0 2 2
Solución
1º) Ordenamos: 2, 3, 4, 5, 6, 8, 8, 8, 10
2º) n = 9 impar
Me X n1 X 91 X5 6 años
2 2
ii) 2, 1, 5, 4, 8, 8, 7, 6
Solución
1º) Ordenamos: 1, 2, 4, 5, 6, 7, 8, 8
2º) n = 8 par
X n X n 1
X 4 X5 5 6
Me 2 2
5,5 años
2 2 2
b) Datos tabulados
1º) Calcular n/2
2º) Identificar la clase mediana
(Es aquella que hasta ese nivel acumuló y/o superó por primera vez a n/2) I = [Li , Li+1
3º) Usar la fórmula:
n
2 F i 1
Me L i w
f i
3. MODA (Mo)
Es una medida que localiza el dato o categoría que aparece con más frecuencia. Es la única medida
descriptiva que se usa para datos cualitativos y cuantitativos.
a) Datos no tabulados:
Ejemplo:
Hallar la moda para cada conjunto de datos:
a) 4, 7, 6, 6, 9, 8, 10, 11, 6, 7
b) 8, 4, 7, 8, 4, 6, 9, 8, 6, 10, 11, 4, 8, 6, 4, 8, 9, 1, 4
c) 4, 7, 6, 4, 6, 7, 7, 6, 4
Solución
a) xi fi b) xi fi c) xi fi
4 1 1 1 4 3
6 3 4 5 6 3
7 2 6 3 7 3
8 1 7 1
9 1 8 5
10 1 9 2
11 1 10 1
11 1
Mo = 6 Mo = 4 Mo=No existe
M’o = 8
Distribución Distribución
Distribución
unimodal uniforme
bimodal
b) Datos tabulados:
1º) Identificar la clase modal (asociada a la frecuencia absoluta máxima) I = [Li , Li+1
2º) Usar la fórmula:
d1
Mo L i w
d1 d 2
d1 = fi – fi -1
d2 = fi – fi +1
Ejemplo 1:
En el ejemplo anterior, referido al Número de hijos por familia. Hallar la X , Me y Mo
Solución
Completamos la tabla de frecuencias:
xi fi Fi fixi
0 2 2 0
1 4 6 4
2 8 14 16
3 4 18 12
4 2 20 8
Total 20 40
Media aritmética
X
fi xi 40 2 hijos
n 20
Mediana y Moda:
X10 X11 2 2
Me 2 hijos
2 2
Mo 2 hijos
Ejemplo 2:
Consideremos el ejemplo anterior sobre las edades de 40 pacientes atendidos en el Hospital Antonio Lorena.
X
fi x i 552
13,8 años
n 40
Mediana:
n
2 Fi 1 20 14
Me Li w 12 4 14 años
fi 12
Moda
d1 4
Mo Li w 12 4 14,7 años
d1 d 2 42
Me, mediana
Mo, la moda.
R X máx X mín
Esta medida presenta la ventaja de que cálculo es sencillo; sin embargo tiene la desventaja de que es sensible
a la presencia de datos atípicos y en su definición no interviene ningún promedio.
Ejemplo
Hallar el rango en cada grupo de datos:
Grupo 1: 8 9 2 3 9 9 2 7 4 5 3 5
Grupo 2: 16 10 4 8 12 10 8 20 4 13 12 22 16 26 20
Solución
R 1 x má x x mí n 9 2 7 años
R 2 x má x x mí n 26 4 22 años
2 Var[X] i 1
N
Varianza muestral
2
S2
x2i xi
n n
b) Datos tabulados
2
k k
fi .Xi2 fi x i
S2 Var[X] i 1
i 1 ; k es el número de marcas de clase.
n n
Inconveniente:
Las unidades de la varianza son las mismas que de las unidades originales pero elevadas al cuadrado: años2,
kg2, soles2, hijos2, etc
3) DESVIACIÓN ESTÁNDAR o DESVIACIÓN TÍPICA ()
Se define como la raíz cuadrada positiva de la varianza. Siempre se cumple que 0
xi
2
(5 6) 2 (6 6) 2 (6 6) 2 4 1
2
años 2
n 8 8 2
1 2
años
2 2
PROPIEDADES DE LA VARIANZA
2
Si X es una variable cuantitativa con varianza Var[X] . Si a y b son constantes, entonces:
1. Var[x] 0 , X 0
2. Var[a] 0 , a 0
3. Var[X b] Var[X] , X b X
2
4. Var[aX] a Var[X] , aXb a X
Se observa que:
Existen más varones que mujeres.
La mayoría de los profesores son casados
Hay 20 profesores varones divorciados
El 27% del total de encuestados son profesoras mujeres casadas.
15 profesores varones son viudos.
10 | C E P R U 2 0 2 2
EJERCICIOS
25. Dada la siguiente tabla de distribución simétrica 31. La siguiente tabla muestra el número de desayunos
donde se observa las sueldos de los empleados en que envía el Comedor Universitario de la UNSAAC
una fábrica: a tres organizaciones benéficas de la Región Cusco.
Sueldos fi hi El Comedor Universitario envía 300 desayunos
[400 , 450 5a diarios, para las tres organizaciones benéficas, el
[450 , 500 70% incluye leche de vaca y el 30% leche de soya en
[500 , 550 0,2
cada institución benefica.
[550 , 600 3a
[600 , 650]
Asilo de Hogar de Pastoral
¿Qué porcentaje de trabajadores reciben al menos ancianos niños
S/.475 y menos de S/.600? Lu a Vi 30% 50% 20%
A)40,5% B)41,5% C)44,5% D)42,5%. E)46,5% Sa 40% 60% ---
Do 20% 80% ---
26. La siguiente tabla muestra una distribución de ¿Cuántos desayunos con leche de soya envían
frecuencias con ancho de clase común: los jueves al hogar de niños?
Edades fi Hi A) 25 B) 45 C) 27
[a , 2a D) 45 E)30
[ , m
[ , 2m 32. Según el enunciado del problema anterior, el
[ , 5a 3a número promedio de desayunos que envía el
[ , 72] Comedor Universitario al asilo de ancianos
es:
¿Cuántos datos aparecen en el intervalo [36, 60, si
A) 85 B)75
la distribución es simétrica? B) 80 D) 90 E) 70
A) 60 B) 84 C) 72 D) 96. E) 108
II. Para el enunciado del problema 35, ¿cuántos
desayunos que incluyen leche de vaca envían
27. Hallar la varianza de las edades (en años) de 5
los días lunes y martes a la pastoral?
universitarios atendidos en ESSALUD: 13 10
8 16 18 A) 84
B) 74
A)12,3a2 B)13,6a C)15,3a D)15,3a2 E)13,6a2 C) 70
D) 80
28. Dada la siguiente tabla incompleta de los pesos de E) 68
150 alumnos de la UNSAAC.
Peso(Kg) xi fi Fi 33. En la siguiente distribución.
[45 , k
2k 54 Ii fi
[ ,
[16 , 32 6
[ , 38
[32 , 48 3a
[ , 62,5 a
[48 , 64 8
[ , ] k
[64 , 80 a
Siendo el ancho de clase constante. ¿Cuántos
[80 , 96] 3
alumnos pesan al menos 50kg y menos de 65Kg?
A) 110 B) 112 C) 114. D) 116 E) 120 Hallar el valor de “a” si se sabe que la moda es 44 y
la amplitud es constante.
A) 1 B) 2 C) 3. D) 4 E) 5
34. En la siguiente distribución incompleta de datos 38. Dado el polígono de frecuencias acumulado
con ancho de clase constante: (ojiva), la mayor moda es:
Ii xi fi Fi Fi
[45 , 7
[6 , 9 40
10 25 39
[ ,
[ , 28
[ , ] 40
Hallar la mediana. 22
A) 12 B) 13 C) 15. D) 16 E) 18
11
4
35. Dado el siguiente polígono de frecuencias:
Edades
8 16 24 32 40 48 56
fi
10k
A) 40,1 B) 42,8 C) 42,7. D) 45 E) 46
36. En el siguiente polígono de frecuencias, halle el Hallar la desviación típica de los gastos.
porcentaje de alumnos que tienen notas mayores o A)S/.26. B)S/.25 C)S/.27 D)S/.35 E)S/22
iguales a 10 pero menores que 16.
20
4
A) 38% B) 40% C) 45% D) 48% E) 52%
0 x 12 14 16 Ii
37. Dado el histograma, ¿cuántas personas ganan por A)8 B) 9 C)10 D) 12 E) 13
lo menos S/. 820?
41. La tabla muestra las notas de un grupo de alumnos
Nº personas matriculados en Bioestadística:
Notas xi fi
500 [00 , 04 4
[04 , 08 10
[08 , 12 18
300 [12 , 16 8
[16 , 20] 8
210
150
Hallar la varianza de las notas.
8
0 A) 86/4 B) 87/4 C) 89/4 D) 80/5 E) 83/5
300 500 700 900 1100 1300 Ingreso