Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APLICADA
INFERNCIA DEL
RESULTADO
MUESTRA
DESCRIPTIVA
POBLACIÓN
Población
Muestra
UNIDAD DE ANÁLISIS
TIPOS DE VARIABLE
Según la funcionalidad que tienen en la investigación, pueden ser:
EJEMPLO:
En un estudio estadístico realizado en un distrito de Lima, se intenta dar a conocer que las personas que cumplen los
protocolos de seguridad tienen menos posibilidades de contagiarse con el COVID-19
EJEMPLO
En un estudio estadístico realizado en un distrito de Lima, se intenta dar a conocer que las
personas mayores de 18 años que cumplen los protocolos de seguridad tienen menos
posibilidades de contagiarse con el COVID-19.
Se considera como:
➢ Variable independiente: ………........................………………………
➢ Variable dependiente: …………………………………………………….
➢ Variable interviniente: ............................................................
CAUSA EFECTO
•Sexo
Cualitativas •Modelo de zapatillas deportivas
•Distrito en que vive
(modalidad) •Deporte preferido
•Número de hermanos
•Núm.de aprobados en la 10 evaluación
Variables Discretas •Núm de libros leídos trimestralmente
•Num. de llamadas telefónicas diarias
Cuantitativas
(números) •Tiempo diario delante del televisor
•Tiempo de estudio
Continuas •Altura
•Peso
•Tiempo empleado en llamadas
Escalas de Medición
• Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
• Escala Nominal: • Escala Ordinal:
Está asociada a variables Los valores de la variable que tienen un
cualitativitas, no se pueden ORDEN con un nivel específico, pero no
hacer operaciones se pueden hacer operaciones aritméticas
aritméticas entre sus entre ellas.
valores, pues éstos son
únicamente ETIQUETAS.
Ejemplo:
Ejemplo: sexo, código Pésimo – Malo – Regular – Bueno –
postal, número telefónico, Excelente
número al correr en un
maratón, deporte favorito, Primaria – Secundaria – Bachiller –
carrera a estudiar, etc. Licenciatura-Maestría-Doctorado
ETIQUETAS ORDEN
• Escala de Intervalo:
• Escala de Razón:
En ella existe un orden entre
los valores de la variable y La magnitud tiene SENTIDO
además una NOCIÓN DE FÍSICO, existe el cero
DISTANCIA aunque no se absoluto, existe orden, se
puedan realizar operaciones. puede determinar cuántas
El cero o punto de inicio no es veces es mayor uno que
único, es más bien un punto otro.
de referencia.
• EJEMPLO
Variable Frecuencia
Ricardo Palma IIII
Internacional IIIIII
San Pablo I III
Maison de San té IIII
Anglo Americana II
Cayetano Heredia IIII
San Felipe
I
FRECUENCIA ABSOLUTA
• Está formada por dos columnas: una para la variable
“xi” y la otra para su frecuencia “f”, a esta frecuencia
se le llama frecuencia absoluta o frecuencia
observada.
Xi f
Ricardo Palma 4
Internacional 7
San Pablo 3
Maison de San té 4
Anglo Americana 2
Cayetano Heredia 4
San Felipe 1
FRECUENCIA RELATIVA
4/25
xi f h F
• Por lo regular, se agregan
dos columnas: la de la Ricardo Palma 4 0,16 4
frecuencia relativa “h” y la Internacional 0,28 11
de la frecuencia 7
acumulada “H”. San Pablo 3 0,12 14
dado.
TABLA DE FRECUENCIAS PARA DATOS NO AGRUPADOS
xi f h F H %
Ricardo Palma 4 0,16 4 0,16 16%
Internacional 7 0,28 11 0,44 28%
Total 25 1 100%
GRÁFICO CIRCULAR
Ejemplo Clínicas
60
Frecuencia absoluta
50
40
30
20
10
0
PERRO PAJARO
CONEJOS HAMSTER GATO
Excedrin Panadol Aspirina Ibuprofeno
PARA DATOS AGRUPADOS
• En ocasiones es conveniente acomodar los datos en
pequeños grupos de igual tamaño, llamados intervalos de
clase.
Límite inferior Límite superior
Intervalo de clase
38 – 42
43 – 47
Intervalos de clase.
48 – 52
53 – 57
58 – 62
63 – 67
MARCA DE CLASE
• Es el punto medio, se simboliza “xi”, se obtiene con:
53 – 57 55
58 – 62 60
63 – 67 65
AMPLITUD ( A )
El tamaño del intervalo se obtiene siguiendo el siguiente
procedimiento:
1.) Para el número de clases o intervalos( K ), se utiliza las
siguiente fórmula:
K = 1 + 3.3 log (n)
Donde K = número aproximado de clases
n = número de datos.
2.) Para el Rango ( R ), se utiliza las siguiente fórmula:
R = dato mayor - el dato menor.
3.) Amplitud de los intervalos ( A ), se utiliza las siguiente fórmula:
A=R/ K
EJEMPLO
Los puntajes de un examen de ingreso a la universidad realizado
por 40 alumnos son los siguientes:
110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108,
109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108,
96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.
R = 140 – 90 = 50
Paso 2. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde:
k = 1 + 3.3 log (n) ;
Para el ejemplo se tiene n = 40 datos, sustituyendo
k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) =
= 1 + 5.28 = 6.28
la cual se redondea al entero superior, k = 7.
Paso 3. Calculamos la amplitud de clase (A), que
corresponde a la cantidad de datos que van en cada
clase, dividiendo el rango R entre el numero de clases k:
A=R/K
A = 50 / 7 = 7,14
se redondea al entero siguiente
A = 8.
Paso 4. Construimos los intervalos o clases, como la variable
es cuantitativa discreta los intervalos o clases son cerrados, es
decir de la forma [Li, Ls].
Para formar las clases comenzaremos con los limites
inferiores:
· En la primer clase tomamos
Li = Xmin ( el dato mas pequeño) en este caso 90.
Ls= Li + A - 1 = 90 + 8-1 = 97 Si los intervalos son cerrados.
[90; 97]
Paso 5: Construimos la tabla de distribución de frecuencias
INTERVALOS DE CLASE MARCA DE CLASE
Xi
[ 90 – 97]
[ 98 – 105]
[ 106 – 113 ]
[ 114– 121]
[ 122 – 129]
[ 130 – 137]
[ 138 – 145]
TOTAL
Paso 6: hallamos la Marca de clase (Xi): corresponde al punto
medio del intervalo, Para nuestro ejemplo obtendríamos las
siguientes marcas de clase:
INTERVALOS DE CLASE XI
[ 90 – 97] 93,5 7
[ 98 – 105] 101,5 9
[ 106 – 113 ] 109,5 13
[ 114– 121] 117,5 3
[ 122 – 129] 125,5 4
[ 130 – 137] 133,5 3
[ 138 – 145] 141,5 1
TOTAL 40
Se hace el conteo
Paso 8: Se halla la frecuencia relativa ( h ) es decir se
divide la frecuencia absoluta entre el total de datos
INTERVALOS DE XI f h
7/40
CLASE
[ 90 – 97] 93,5 7 0,175
9/40
[ 98 – 105] 101,5 9 0,225
[ 106 – 113 ] 109,5 13 0,325 13/4
[ 114– 121] 117,5 3 0,075 0
[ 122 – 129] 125,5 4 0,100
[ 130 – 137] 133,5 3 0,075
[ 138 – 145] 141,5 1 0,025
TOTAL 40 1
Paso 9: Se halla la frecuencia porcentual (% ) es decir se
multiplica la frecuencia relativa por 100
INTERVALOS DE XI f h %
0,175x10
CLASE
0
[ 90 – 97] 93,5 7 0,175 17,5
[ 98 – 105] 101,5 9 0,225 22,5
[ 106 – 113 ] 109,5 13 0,325 32,5
[ 114– 121] 117,5 3 0,075 7,5
[ 122 – 129] 125,5 4 0,100 10,0
[ 130 – 137] 133,5 3 0,075 7,5
[ 138 – 145] 141,5 1 0,025 2,5
TOTAL 40 1 100
Paso 10: Se agregan las columnas
Frecuencia absoluta acumulada = F Frecuencia relativa acumulada = H
Frecuencia porcentual acumulada = %a
Intervalo de clase “xi” f F h H % %a
• Polígono de Frecuencias
• Histograma
14
60
12
50
10
40
8 30
6 20
4 10
2 0
0
0,95 2,95 4,95
Histograma 14
12
10
• Es la representación gráfica de 8
6
los datos mediante una sucesión 4
de rectángulos. 2
0
0,95 2,95 4,95
7 38 – 42 40 2
6 43 – 47 45 4
5
f 48 – 52 50 8
4
3 53 – 57 55 5
2 58 – 62 60 3
1 63 - 68 65 3
0
35 40 45 50 55 60 65 Total 25
xi
Polígono de Frecuencias
• Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a
la frecuencia de cada una de las clases.
60
40
20
10
0
9 Polígono de Frecuencias
Interval Punto f
8
o de medio
7
clase “xi”
6
38 – 42 40 2
5
43 – 47 45 4 f
4
48 – 52 50 8 3
53 – 57 55 5 2
58 – 62 60 3 1
0
63- 68 65 3 35 40 45 50 55 60 65 70
xi
Total 25
MEDIDAS DE RESUMEN.
MEDIDAS DE
MEDIDAS DE MEDIDAS DE MEDIDAS DE
TENDENCIA
DISPERSIÓN POSICIÓN RELATIVA FORMA
CENTRAL
ASIMETRÍA APUNTAMIENTO
MEDIDAS TENDENCIA CENTRAL
MODA
Agrupados cualitativa
No agrupados cuantitativa
2 modas = Bimodal
PARA DATOS NO AGRUPADOS
Xi f
Para calcular la moda para
Ricardo Palma 4
datos no agrupados, se busca
Internacional 7 el dato con mayor frecuencia
San Pablo 3
Maison de San té 4
Anglo Americana 2 En este caso la moda es la
Cayetano Heredia 4
Clínica Internacional.
San Felipe 1
PARA DATOS AGRUPADOS
donde:
Li es el límite inferior del intervalo modal.
d1= fi - fi-1
d2= fi - fi+1
A= amplitud del intervalo modal
EJEMPLO
La siguiente tabla muestra la edad de 40 personas de una comunidad:
Mo= 22 + 6 6 =
6+1
Mo= 22 + 0,86 x 6 =
Agrupados
Es el promedio aritmético de
los valores de la variable.
cuantitativa
No agrupados
x .
MUESTRA POBLACIÓN
MEDIA PARA DATOS NO AGRUPADOS
Sea x1, x2, .... ,xn los valores que toma una variable
cuantitativa X, entonces la media aritmética se
determina mediante:
x1 + x 2 + ....... + x n
media =
n
X ∑ Xi
= n
Ejemplo
x = 14,5
w1x1 + w 2 x 2 + .........+ w k x k
x=
w1 + w 2 + ..........+ w k
Ejemplo
Si un alumno el semestre pasado obtuvo 11 en Física 2 y su peso
es cinco, 13 en el curso Lengua de peso cuatro y 16 en cálculo 2
de peso 3, ¿ cuál fue su promedio ?
X = ∑ fi . Xi
n
f1 x 1 + f 2 x 2 + .........+ f k x k
x=
f1 + f 2 + ..........+ f k
Ejemplo
En un estudio de edades de estudiantes de Derecho se obtuvo
la siguiente tabla de distribución:
Determina la edad promedio.
x f
16 5
_ 5(16) + 10(17) + 6(18) + 4(19) + 2( 20)
17 10
x=
18 6
5 + 10 + 6 + 4 + 2
19 4
20 2 _
total 26 x = 30 + 170 + 108 + 76 + 40
26
_
x = 18,23 años
Media para datos agrupados
Marca de Frecuencias Frecuencias
Intervalo
clase acumuladas
xi fi hi Fi Hi
4, 10 7 1 0,025 1 0.025
10, 16 13 3 0,075 4 0.100
16, 22 19 6 0,150 10 0.250
22, 28 25 12 0,300 22 0.550
28, 34 31 11 0,275 33 0.825
34, 40 37 5 0,125 38 0.950
40, 46 43 2 0,050 40 1.000
40 1,000
MEDIANA
Agrupados
Es el valor que queda en la
parte central de un grupo de cuantitativa
observaciones arreglados en
orden de magnitud.
No agrupados
Para datos no agrupados
La mediana de un conjunto de datos
EJEMPLO es el valor que se encuentra al
10 – 12 – 17 – 18 - 20 – 23 – 25 Me = 18
Donde:
n
Li =Es el límite inferior del intervalo de
− Fi−1
la mediana
n = Número de datos observados
Me = Li + 2 A
Fi-1= Frecuencia acumulada absoluta del
intervalo
fi inmediatamente anterior al
intervalo de la mediana
fi = Frecuencia absoluta del intervalo
de la mediana
A = Amplitud del intervalo de la
mediana
Ejemplo: La siguiente tabla muestra la inversión anual de 40 clínicas , hallar la mediana.
RANGO ( R )
VARIANZA (σ 2 ó 2
S)
DESVIACIÓN TÍPICA (σ ó S)
EJEMPLO 10
13
La siguiente tabla representa la
RANGO pérdida de peso en libras, de
22
26
un grupo de personas que se 16
El Rango corresponde a la sometieron a un tratamiento 23
distancia entre el puntaje 35
mayor (llamado valor
durante el último año 53
máximo) y el puntaje Valor Máximo: 60 17
menor (llamado valor 32
mínimo) Valor Mínimo: 10 41
35
= 60 - 10 27
16
= 50 20
60
48
DESVIACION ESTANDAR Y VARIANZA DE UNA
POBLACIÓN PARA DATOS NO AGRUPADOS
(X - )2
= 2 =
N
LA DESVIACIÓN ESTÁNDAR
=
2 DESVIACIÓN
ESTÁNDAR
σ2 =
106
σ = √21,2 σ =4,6 σ2= 5
21,2
VARIANZA Y DESVIACIÓN ESTÁNDAR
EN MUESTRAS
s= s 2
VARIANZA Y DESVIACIÓN ESTÁNDAR PARA
DATOS AGRUPADOS
Ejemplo
Una encuesta realizada a una muestra de estudiantes de
Estadística aplicada, para conocer el número de horas que
navegan semanalmente en internet, arrojo los siguientes
datos de la tabla:
INTERVALO f
[0-10[ 2 Calcular:
[10-20[ 3 Varianza
[20-30[ 3 Desviación estándar
[30-40[ 7
[40-50[ 5
Xi f Xi .f Xi - X (Xi – X )2 f (Xi – X)2
[0-10[ 2
[10-20[ 3
[20-30[ 3
[30-40[ 7
[40-50[ 5
∑
1er paso 3er paso
2do
Xi f Xi .f Xi - X (Xi – X )2 f (Xi – X)2 paso
CUARTILES
DECILES
PERCENTILES
CUARTILES.
2, 3, 4, 5, 6, 7, 9
Q1 Q2 Q3
NÚMERO PAR DE DATOS.
1, 2, 3, 4, 5, 6, 7, 9
Q1 Q2 Q3
CALCULO DE LOS CUARTILES PARA DATOS
AGRUPADOS
[50, 60) 8 8
[60, 70) 10 18
Hallar el
cuartil 1
[70, 80) 16 34
Cuartil 2 [80, 90) 14 48
Cuartil 3 [90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
CALCULO DEL PRIMER CUARTIL
k.N = 1 x 65 = 16,25
4 4
Observamos que Li = 60
Fi-1 = 8
Q1 = 60 + 16.25 – 8 x 10 = 68.25
fi = 10
ai = 10
10
CALCULO DEL SEGUNDO CUARTIL
k.N = 2 x 65 = 32,5
4 4
Se busca en la tabla donde se
encuentra 32,5.
Observamos que Li = 70
Fi-1 = 18 Q2 = 70 + 32.5 – 18 x 10 = 79.06
fi = 16
16
ai = 10
CALCULO DEL TERCER
CUARTIL
k.N = 3 x 65 = 48,75
4 4
Se busca en la tabla donde
se encuentra 48,75.
Observamos que Li = 60
Fi-1 = 48
fi = 10 Q3 = 90 + 48,75 – 48 x 10 = 90.75
ai = 10 10
Muchas Gracias