Documentos de Académico
Documentos de Profesional
Documentos de Cultura
. . . . .
. . . . .
n 1
TOTAL n 1
FUENTE:
GRÁFICO DE LÍNEAS O BASTONES
• UN ESTUDIANTE DEL CURSO DE ESTADÍSTICA, DE LA UNIVERSIDAD NACIONAL
PEDRO RUIZ GALLO, APLICO RECIENTEMENTE UNA ENCUESTA EN 34 HOGARES
DE UNA URBANIZACIÓN CERCANA A SU DOMICILIO. UNA DE LAS PREGUNTAS FUE
CERCA DEL NÚMERO DE PERSONAS QUE CONFORMAN EL HOGAR DEL
ENTREVISTADO, LAS RESPUESTAS FUERON LAS SIGUIENTES.
5 1 6 3 1 4 3 6 3 6 5 1 2 1 4 2 5
2 1 5 3 1 1 4 4 4 4 6 4 6 1 3 3 5
2 3 0.08824 11 0.32353
3 6 0.17647 17 0.50000
4 7 0.20588 24 0.70588
5 5 0.14706 29 0.85294
6 5 0.14706 34 1
TOTAL 34 1
En la tercera columna, se muestran las frecuencias absolutas que representan el número de observaciones que
caen dentro del intervalo en el conjunto de datos.
En la cuarta columna, se muestran las frecuencias relativas () que representan la proporción de observaciones
que caen dentro del intervalo en el conjunto de datos.
En la quinta columna, se muestran las frecuencias absolutas acumuladas ( que se obtienen así:
=++…….+ a partir de la definición
En la sexta columna, se muestran las frecuencias relativas acumuladas( que se obtienen así
=++…….+ a partir de la definición
A continuación, se presenta una tabla de frecuencias por intervalos:
Tabla N°
TITULO:
INTERVALOS VALORES FRECUENCI FRECUENCI FRECUENCI FRECUENCI
DE CLASES OBSERVADO AS AS AS AS
S ABSOLUTAS RELATIVAS ABSOLUTAS RELATIVAS
ACUMULAD ACUMULAD
AS AS
>
>
. . . . . .
. . . . . .
.. .. .. .. .. ..
nn 11
TOTAL n 1
FUENTE:
• PASO 1. CALCULAR EL RANGO (R)
si la amplitud del intervalo es un número entero, entonces se trabaja con el número calculado; si no se redondea
por exceso de acuerdo con el número de decimales del conjunto de datos.
Para el redondeo, tener en cuenta lo siguiente:
Si los datos son números enteros, entonces la amplitud del intervalo tiene que ser un número entero si los datos
tienen un decimal, entonces la amplitud del intervalo tiene que tener un decimal, y así sucesivamente.
Por ejemplo, suponga que el valor de C es 6.2603 y los datos tienen dos decimales, entonces C también tendrá
dos decimales y su valor redondeado por exceso será igual a 6.27.
• PASO 4. CALCULAR LOS LIMITES DE LOS INTERVALOS
.
.
.
20.342 21.901 21.901 22.929 23.277 23.594 24.654 24.654 24.727 24.727
25.065 25.779 26.573 26.904 27.495 27.620 27.727 28.040 28.205 28.342
28.956 29.546 29.625 30.573 31.300 31.437 31.913 31.913 33.071 33.071
33.563 34.254 34.254 35.202 36.055 37.345 39.297 39.297 41.137 46.607
El valor de la amplitud se redondea por exceso con tres decimales porque los datos tienen tres decimales.
Paso 4. cálculo de los limites de los intervalos
.
.
[
• PASO 5. CONSTRUCCIÓN DE LAS COLUMNAS CORRESPONDIENTES
• TABLA N°02
• TITULO:
INVERSIÓN
ANUAL Xi fi hi Fi Hi hi% Hi%
[4.128, 10.197> 771.625 2 0.04 2 0.04 4% 4%
[10.197, 16.266> 13.2315 3 0.06 5 0.10 6% 10%
[16.266, 22.335> 19.3005 8 0.16 13 0.26 16% 26%
[22.335, 28.404> 25.3695 17 0.34 30 0.60 34% 60%
[28.404,34.473> 31.4385 13 0.26 43 0.86 26% 86%
[34.473, 40.542> 37.5075 5 0.10 48 0.96 10% 96%
[40.542,46.611> 43.5765 2 0.04 50 1 4% 100%
TOTAL 50 1 100%
• FUENTE:
HISTOGRAMA
CUADRO N°
18
TITULO
17
16
14
13
12
10
8
8
6
5
4
3
2 2
2
0
4.13 10.2 16.27 22.34 28.4 34.47 40.54 46.61
FUENTE:
POLIGONO
CUADRO N°
TITULO
18
17
16
14
13
12
10
8 8
6
5
4
3
2 2 2
0
4.13 10.2 16.27 22.34 28.4 34.47 40.54 46.61
¿CALCULE EL PORCENTAJE DE EMPRESAS QUE TIENEN UNA INVERSIÓN MENOR DE
28.404 SOLES?
• el porcentaje de empresas que tienen una inversión menor de 28.404 soles es 60%
¿ CALCULE EL PORCENTAJE DE EMPRESAS QUE TIENEN UNA INVERSIÓN POR LO
MENOS DE 34.473 SOLES?
• el porcentaje de empresas que tienen una inversión de por menos 34. 473soles es 14%.
EJEMPLO:
EN EL AULA DE ESTADISTICA, EN EL HORARIO DE 7:00 A.M A 9:00 A.M, SE REGISTRÓ
EL TIEMPO (EN MINUTOS) QUE TARDARON LOS ESTUDIANTES EN LLEGAR A
CLASES. LOS RESULTADOS OBTENIDOS SE MUESTRAN EN EL SIGUIENTE
HISTOGRAMA:
HISTOGRAMA DE LOS TIEMPOS QUE TARDARON LOS
ESTUDIANTES EN LLEGAR A CLASES.
14
13
12
10
10
6
6
4
3
2
2
1
0
0;5 5 ; 10 10 ; 15 15 ; 20 20 ; 25 25 ; 30
b) Como no se conoce el porcentaje en el intervalo [10 ; 12], entonces se interpola en el intervalo [10 ; 15 >
X%
0 5 10 12 15
2
5
• DE DONDE:
• LUEGO.
5 5
• CÁLCULO DE X:
• LUEGO:
CÁLCULO DE Y:
LUEGO:
0 5 X 10 15
X-5
5
DE DONDE:
LUEGO: X=6.38
POR LO TANTO, EL TIEMPO MÁXIMO QUE EL DOCENTE ESPERÓ PARA EMPEZAR LA CLASE ES
MEDIDAS DE TENDENCIA CENTRAL
Medidas de
Resumen
Desviación
Medidas de Coeficiente de
Medidas de estándar, varianza Coeficiente de
tendencia no asimetría de
tendencia central y coeficiente de curtosis
central Pearson
variación
Media, mediana,
moda, media Cuartiles, deciles
ponderada, y y percentiles
media total
• MEDIA ARITMÉTICA (
también llamada promedio aritmético. es la medida mas utilizada. conocida y fácil de interpretar.
Cálculo de la media aritmética para dato no agrupados.
Se realiza dividiendo la suma de todos los valores que toma la variable entre el número total de
valores.
Ejemplo: si una pequeña empresa tienen un total de cinco empleados a su cargo y sus remuneraciones
son: 800, 890, 950, 970 y 990 soles, calcule la remuneración promedio de los trabajadores.
X= remuneración de los empleados
=990
Intervalos Xi fi
[67 , 74> 70.5 6
[74 , 81> 77.5 5
[81 , 88> 84.5 10
[88 , 95> 91.5 8
[95 , 102> 98.5 16
[102 , 109> 105.5 3
[109 , 116> 112.5 2
Total 50
Ejemplo. La empresa tienen 5 operadores cuyos ingresos son 800,890,950,970 y 990 soles. Calcule la
mediana.
Sea la variable:
X= ingreso de los operadores
=990
Como n=5 (impar)
Esto quiere decir la mediana ocupa la tercera posición en el conjunto de datos. Luego:
=950
•cuando
el numero de datos (n) es par, la mediana se calcula de la siguiente manera:
La mediana es la semisuma de los dos valores centrales, es decir.
Donde:
Donde:
=limite inferior del intervalo donde se encuentra la mediana
C= amplitud del intervalo
= frecuencias absoluta acumulada del intervalo anterior donde se encuentra la mediana.
=frecuencia absoluta simple del intervalo donde se encuentra la mediana
=posición que ocupa la mediana en el conjunto de datos
• EJEMPLO:
Ahorro (soles)
[430 ; 500> 2 2
[500 ; 570> 12 14
[570 ; 640> 16 30
[640 ; 710> 10 40
[710 ; 780> 5 45
Total 45
Donde:
Donde:
=limite inferior del intervalo donde se encuentra la moda
C= amplitud del intervalo
=frecuencia absoluta simple del intervalo donde se encuentra la moda.
= frecuencia absoluta del intervalo anterior donde se encuentra la moda
= frecuencia absoluta del intervalo posterior donde se encuentra la moda
Observación:
La mayor frecuencia absoluta corresponde al intervalo donde se encuentra la moda.
Ejemplo:
Ahorro (soles)
[430 ; 500> 2
[500
[500 ;; 570>
570> 12
12
[570
[570 ;; 640>
640> 16
16
[640
[640 ;; 710>
710> 10
10
[710 ; 780> 5
[710 ; 780> 5
Total 45
Total 45
, =10
=598
=
Interpretación
==16 – 10=6 El ahorro mensual más frecuente de los clientes es 598 soles.
• RELACIÓN
ENTRE LA MEDIA ARITMÉTICA, MEDIANA Y MODA.
si la distribución se extiende más hacia la izquierda, se cumple que:
donde :
•EJEMPLO
• A CONTINUACIÓN SE MUESTRAN LAS CALIFICACIONES, CON SUS RESPECTIVOS CRÉDITOS, QUE OBTUVO
UN ESTUDIANTE DE LA ESPECIALIDAD DE ADMINISTRACIÓN EN EL QUINTO CICLO DE ESTUDIOS:
Donde:
EJEMPLO:
el gerente de una entidad bancaria sabe que, en el último mes, el ahorro promedio mensual de 45 clientes en la sucursal 1
fue 611.22 soles y el ahorro promedio mensual de 55 clientes en la sucursal 2 fue de 652.67 soles. Calcule el ahorro
promedio mensual en ambas sucursales.
Sucursal 1
Sucursal 2 El ahorro promedio mensual de los clientes es 634.02 soles
MEDIDAS DE TENDENCIA NO CENTRAL
• CUARTILES ():
los cuartiles son tres valores (que divide al conjunto de datos en cuatro partes iguales. Estos son:
25% 25% 25% 25%
DECILES ():
los deciles son nueve valores (que dividen al conjunto de datos en 10 partes iguales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
PERCENTILES ():
los deciles son noventa y nueve valores (que dividen al conjunto de datos en 100 partes iguales. 1% 1%
1%
PERCENTIL DECIL CUARTIL
• CÁLCULO DE PERCENTILES PARA DATOS AGRUPADOS
• HALLAR EL CUARTIL 1:
• REEMPLAZANDO
EN LA FORMULA :
REEMPLAZANDO EN LA FORMULA:
REEMPLAZANDO EN LA FORMULA:
EJEMPLO: tenemos el
VARIANZA MUESTRAL
Cálculo de la varianza muestral se realiza de la misma manera que la varianza poblacional, pero en vez de dividir la suma de
los cuadrados de las desviaciones entre el tamaño de la muestra n, se divide entre n-1.
Cálculo de la varianza muestral para datos no agrupados.
•
cálculo de la varianza muestral para datos agrupados.
¿cuál de las dos marcas de zapatillas tiene un mejor programa de control de calidad sobre el desgaste?
Se puede observar que la marca A tiene un tiempo promedio de duración mayor que la marca B
=88.29,
=30.36 5
•Se puede observar que la marca B tiene un tiempo promedio de duración mayor que la marca B
=88.29,
=270.3
como se puede observar, el es menor que el lo que quiere decir que los tiempos de degastes de las
zapatillas de la marca A son más homogéneos (se registran degastes similares ) en comparación con los
tiempos de degastes de las zapatillas de la marca B, lo cual indica que esta marca tienen el mejor programa
de control de calidad sobre el desgaste de sus zapatillas.
• ASIMETRÍA:
para describir la forma solo necesitamos comparar la media y la mediana. Si estas dos mediciones
son iguales, por lo general podemos considerar que los datos son simétricos. Si la media excede a la mediana los
datos pueden describirse de sesgo positivo o sesgo a la derecha. Si la media es menor que la mediana, estos datos
pueden llamarse de sesgo negativos o sesgo a la izquierda.
El coeficiente de asimetría muestral:
Si es igual a cero, indica que los datos se distribuyen en forma simétrica (media igual a la mediana)
Si es mayor que cero, se dice los datos se distribuyen en forma asimétrica positiva o sesgada ala derecha (media
mayor a la mediana).
Si es menor que cero, se dice que los datos se distribuyen en forma asimétrica negativa o sesgada a la izquierda
(media menor a la mediana).
• CURTOSIS
El coeficiente de curtosis.
Analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.
Se define tres tipos de distribuciones.
Distr. Mesocúrtica. presentan un grado de concentración medio alrededor de los valores centrales de la variable
(distribución normal).
Distr. Leptocúrtica. Presentan grado de concentración alrededor de los valores centrales de la variable.
Distr. Platicúrtica. Presentan un reducido grado de concentración alrededor de los valores centrales de la variable.
•COEFICIENTE
DE CURTOSIS:
Además:
Si < 0.263, entonces la distribución es leptocúrtica.
Si = 0.263, entonces la distribución es mesocúrtica.
Si , entonces la distribución es platicúrtica.
Ejemplo: