Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo de Estadística
Nombre : Erwing Olivares 2016-
0113J
Docente: Ing. Lester Emilio Marin
Fecha de entrega : 20 jun,2020
UNIVERSIDAD NACIONAL DE INGENIERIA
Resumen 43-53 ahora, paso por paso, cómo se elabora una tabla de frecuencias para la
variable continua. Antes te presento la simbología que se utiliza en la elaboración de
estas tablas, muchas de las cuales coinciden con las utilizadas en la elaboración de las
tablas para la variable discreta, tal como lo viste precedentemente.
N: tamaño poblacional
n: tamaño de la muestra
L.I. - L.S.: los intervalos en los que se divide la variable continua. Siendo L.I. el
límite inferior y L.S. el límite superior del intervalo.
rango: diferencia que hay entre el valor máximo y el valor mínimo de la serie
estadística.
UNIVERSIDAD NACIONAL DE INGENIERIA
1. se determina el valor máximo y el valor mínimo que toma la variable xi, en este
caso xmin= 47 y xmax= 92;
l. C. xi ri fri Ri Fri
46 - 54 50 3 0,10 3 0,10
54 - 62 58 6 0,20 9 0,30
62 - 70 66 10 0,33 19 0,63
70 - 78 74 6 0,20 25 0,83
78 - 86 82 3 0,10 28 0,93
86 - 94 90 2 0,07 30 1,00
-- 30 1,00 -- --
Tipos de gráficos
20
15
10
5
0
1989 1990 1991 1992 1993 1994 1995 1996 1997
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9
UNIVERSIDAD NACIONAL DE INGENIERIA
45
40
35
30
25
20
15
10
5
0
10-20
30-40
40-50
50-60
60-70
70-80
80-90
90-100
20-30
45
40
35
30
25
20
15
10
5
0
15 25 35 45 55 65 75 85 95
UNIVERSIDAD NACIONAL DE INGENIERIA
20
0
18
0
16
0
14
0
12 50-60
60-70
70-80
80-90
90-100
0
10
0
80
60
40
20
0
0-10
10-20
30-40
40-50
20-30
30
25
UNIVERSIDAD NACIONAL DE INGENIERIA
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
UNIVERSIDAD NACIONAL DE INGENIERIA
diagramas de barras: es uno de los gráficos mas utilizados por su sencillez y por
la facilidad que ofrece para representar las características cuantitativas y
cualitativas. Pueden ser:
Verticales
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
Horizontales
1996
1995
1994
1993
1992
1991
1990
0 5 10 15 20 25 30
UNIVERSIDAD NACIONAL DE INGENIERIA
Simples
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
Subdivididas
60
50
40
30
20
10
0
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2
Absolutas
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
UNIVERSIDAD NACIONAL DE INGENIERIA
Relativas
20,00%
15,00%
10,00%
5,00%
0,00
% 1990 1991 1992 1993 1994 1995 1996
Bidireccionales
Apareadas
30
25
20
15
10
5
0
1990 1991 1992 1993 1994 1995 1996
Valor 1 Valor 2
UNIVERSIDAD NACIONAL DE INGENIERIA
1996 1990
18% 11%
199
1
16
%
1995
14%
199
2
12
%
1994
16% 1993
UNIVERSIDAD NACIONAL DE INGENIERIA
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio
miden el grado de dispersión de los valores de la variable. Dicho en otros términos
las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre
sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir
un conjunto de datos entregando información acerca de su posición y su dispersión.
Según este criterio, haremos primero el estudio de las medidas estadísticas para
datos no agrupados y luego para datos agrupados.
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del
UNIVERSIDAD NACIONAL DE INGENIERIA
promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras
que el promedio de la muestra es variable puesto que diferentes muestras extraídas
de la misma población tienden a tener diferentes medias. La media se expresa en
la misma unidad que los datos originales: centímetros, horas, gramos, etc.
Ejemplo de desviaciones:
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la
variable que ocupa la posición central, cuando los datos se disponen en orden de
magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a
la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Moda
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está
bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
• Medidas de dispersión
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de
la variable.
Fórmulas
Donde µ es el promedio de la población.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
Donde:
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78 partos
por madre,
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca
de clase (Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
• Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes
iguales. De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa
que el 80% de los casos tiene edad igual o inferior a 35 años.
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
2. La mediana será:
Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a
$127.270.
3. El percentil 78 será:
Por lo tanto se puede decir que 78% de las familias tienen ingreso igual o inferior a
$174.660.
5. - La varianza será: