Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instituto Profesional
ESTADSTICA APLICADA
Probabilidad
Estadstica
Inferencial
Civil
Instituto Profesional
Qu significara Xi-1 si i = 3?
X2 = 18
0, 2, 5, 0, 3, 1, 8, 0, 3, 1, 1, 9 4, 0 2, 2, 9 , 3, 0, 1, 9, 8
Construya la tabla que muestre estos datos en forma ordenada
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
Instituto Profesional
Valores
RESPUESTA
EJEMPLO 1
0
1
2
3
4
5
8
9
Total
N
veces
5
4
3
3
1
1
2
3
22
DS
DS
DS
DS
DS
DS
DS
DS
DS
DI
DS
DS
DS
DI
DS
DS
DI
DI
DI
DI
DI
DI
DS
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
Instituto Profesional
Respuesta
Tipo de
procedimento
(X)
ni
fi
Ni
Fi
DS
DI
Total
16
8
24
66,7
33,3
100
16
24
66,7
100
PROF.:FLOR SOLIS F.
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
Instituto Profesional
RESPUESTA
EJEMPLO 2
El parmetro es..
La estadstica es
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
Instituto Profesional
Instituto Profesional
Instituto Profesional
Instituto Profesional
Frecuencia
Absoluta
ni
Frecuencia
Relativa fi
n1
n2
.
.
.
nk
n
f1
f2
.
.
.
fk
1
k clases o
categoras, o el
recorrido de la
variable en
intervalos
Total
Frecuencia
Absoluta
Acumulada Ni
N1
N2
.
.
.
Nk = n
ni = n
Frecuencia
Relativa
Acumulada
Fi
F1
F2
.
.
.
Fk = 1
i=1,2,3,.........k
n = tamao de la muestra
fi = ni/n proporcin de datos en la clase i ;
fi = n
i = 1,2,3,.........k
Ni = ni ;
Fi = fi
i = 1,2,3,.........k
i = 1,2,3,.........k
Una regla que puede ayudar a decidir el nmero de clases es la frmula de Sturges:
Nmero de clases = [1 + 3,3 log n] (donde n = tamao de la muestra)
Amplitud de intervalo
Amplitud de intervalo
Valor mximo Valor mnimo
Nmero de clases
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
Instituto Profesional
MEDIDAS DE RESUMEN
xi/n
xini/n
i =1
x =
i =1
X1 , X2, X3 , .... X
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
10
Instituto Profesional
X =
i=1
wx /
i = 1
Mediana (med(x):
Es aquel valor que divide a la muestra en dos partes iguales
dejando bajo y sobre ella el 50% de las observaciones.
Si el nmero de observaciones es impar, la mediana es el
valor central del conjunto ordenado. Si el nmero de datos es par se considera la
mediana como el promedio aritmtico de los valores
+1
med ( x )
N J 1
= Li + Ci 2
nJ
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
11
Instituto Profesional
ni
Ni
0.306 - 0.310
0.310 - 0.314
0.314 - 0.318
13 Nj-1
0.318 - 0.322
22
35 Nj
0.322 - 0.326
14
49
(X)
n = 49
Solucin:
El intervalo 0.318 0.322 contiene la clase mediana.
49
13
= 0.32
med ( x) = 0.318 + 0.004 * 2
22
Moda
Solucin:
moda = 16
12
Instituto Profesional
Pp = x
'
j1
np100 N j1
+ c j
nj
Cuartil:
(100 - p)%
|
Pp
|
x(n)
Mx.
II MEDIDAS DE DISPERSIN
Rango
El rango de un conjunto de nmeros es la diferencia entre el mayor y el
menor de todos ellos. Por ejemplo: el rango de los nmeros 2,3,3,4,4,4,5,10,12 es
12-2=10
Rango intercuartlico
Se calcula este rango, cuando la distribucin posee intervalos abiertos, no
tienen lmite superior o bien no tienen lmite inferior.
Q = Q3 Q1
Rango semi-intercuartlico o desviacin cuartilca
Se define por:
Q= (Q3 Q1)/2
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
13
Instituto Profesional
Varianza
La varianza de un conjunto de datos se define como el cuadrado de la
desviacin tpica o estndar, mide la dispersin que existe de los datos con respecto
a su promedio, el resultado de la varianza es en unidades cuadrticas, por lo tanto
para linealizar un conjunto al medir su dispersin, le extraemos raz cuadrada
llamada desviacin estndar, luego, para calcular la varianza tenemos.
Para datos sin tabular:
2(x) =
(xi )2/N
i =1
2(x) =
(xi )2ni /N
i =1
Desviacin estndar
Es la raz cuadrada de la varianza dada por:
Es decir, dado un conjunto de datos x1, x2, ...., xn de una variable X con
nivel de medicin en escala de intervalos o de razn, se define la desviacin
estndar o desviacin tpica: como el promedio de las desviaciones de los puntos xi
respecto a su promedio aritmtico.
La desviacin estndar toma valores no negativos y mide la dispersin:
a mayor desviacin estndar mayor dispersin.
El cuadrado de la desviacin estndar se denomina varianza S2
Observacin: S2 se llama varianza corregida, dividida por n 1 se utiliza en inferencia
estadstica como la estimacin de la varianza poblacional (
2)
Coeficiente de variacin
El coeficiente de variacin es una medida que nos permite comparar dos o ms
distribuciones con distintas unidades de medida. Diremos que mientras menor sea el
coeficiente de variacin la distribucin es ms homognea, es decir, los datos estn menos
dispersos con respecto al promedio: C.V( X ) =
X
X
*100
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
14
Instituto Profesional
0
7
3
2
1
2
5
1
0
6
0
2
2
5
1
0
3
1
2
0
0
0
0
1
4
500 - 600
600 - 700
700 - 800
800 - 900
Hombres
20
30
40
20
15
10
Mujeres
20
28
33
25
18
Sueldos M$
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
15
Instituto Profesional
< 20
20-50
50 y +
Total
Habitacional
Industriales
20
10
5
35
57,1
28,6
14,3
100,0
5
40
60
105
4,8
38,0
57,2
100,0
Empresas
comerciales
N
%
Total
5
20
15
40
30
70
80
180
12,5
50,0
37,5
100,0
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
16
Instituto Profesional
Sony
Samsung
10
10
Nokia
Samsung
38
15
Sagem
15
Sin
celular
40
30
20
10
0
Nokia
38
Sony
Sin celular
27
Sagem
Marca de celular
Histograma
Polgono de frecuencias
60,00%
40
55,00%
50,00%
Porcentaje
n de personas
45,00%
30
20
40,00%
38,1%
35,00%
32,1%
30,00%
25,00%
20,00%
17,9%
15,00%
10
10,00%
4,8%
5,00%
1,2%
0
0
ndice de temor
4,8%
1,2%
0,00%
12-19
19 - 26 26 - 33 33 - 40 40 - 47 47 - 54 54 - 61
indice de temor
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
17
Instituto Profesional
edad
n de
personas
25
20
15
10
5
0
0
Media =44,21
Desviacin tpica =16,1
N =84
8 12 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84 88 92
edad
DIAGRAMA DE PARETO
100
N DE PERSONAS
50
Porcentaje
60
40
30
50
20
17
15
10
12
7
0
excelente
bueno
regular
malo
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
18
Instituto Profesional
Tiempo en minutos
Frecuencia
tallo &
2,00
0
5,00
1
5,00
1
4,00
2
1,00
2
2,00
3
1,00 Extremes
.
.
.
.
.
.
hoja
78
02444
56899
0122
5
01
(>=41)
30
20
10
tiempo (minutos)
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
19
Instituto Profesional
Nmero
de
unidades
.
.
.
100
Total
.
.
.
Medidas de resumen
Barras separadas
Sectorial
Diagrama
de
Pareto
Moda
Nm. de
unidades
.
.
.
n
Frec.
Acum.
.
.
n
-
%
.
.
.
100
Medidas de resumen
Barras separadas
- Moda
Sectorial
Diagrama
de - Mediana
Pareto
- Percentiles
cuando
tenga
sentido
Grficos (ms
Medidas de resumen
utilizados)
Nombre
Var.
.
.
.
Total
Nm. de
unidades
.
.
.
n
Frec.
Acum.
.
.
n
-
%
.
.
.
100
Barras
separadas
- Moda
Tendencia
- Mediana
central
- Promedio
- Percentiles
Posicin
- Rango
- Rango Intercuartlico
- Desv. estndar
dispersin
- Coef. de variacin
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
20
Instituto Profesional
Nombre
Var.
[,)
.
Nm. de
unidades
.
.
.
n
Total
Frec.
Acum.
.
.
n
-
%
.
.
.
100
- Moda
Tendencia
- Mediana
central
- Promedio
- Percentiles
Histograma
Polgono de
frec.
Tallo - hojas
Diagrama de
caja
Otros
Posicin
- Rango
- Rango Intercuartlico
- Desv. estndar
dispersin
- Coef. de variacin
Asimetra positiva
Asimetra Negativa
10
10
10
Simtrica
8
2.5
7.5
12.5
17.5
22.5
27.5
32.5
0
2.5
7.5
12.5
17.5
22.5
X = Me = Mo
27.5
32.5
2. 5
7.5
12. 5
17.5
22.5
27.5
Mo < Me < X
32.5
X < Me < Mo
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
21
Instituto Profesional
Observaciones
Rango
Rango
intercuartlico
Varianza
Desviacin
estndar o
desviacin
tpica
s2 =
(x x)
i =1
s2 =
i =1
n -1
n
n
(x
s=
(x x)
(x
- x)
i =1
s=
- x)2
i =1
n-1
22
Instituto Profesional
Estatura
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Peso
1
250
,821**
,000
250
Estatura
,821**
,000
250
1
250
DIAGRAMA DE DISPERSIN.
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
23
Instituto Profesional
FORMULAS DE INTERS
x=
xi
i =1
s 2x =
x=
x n
i
i =1
(x
i =1
s 2x =
x)2
=
n-1
(x
i =1
xi
n
x i2 i =1
n
i =1
n-1
x) 2 ni
n-1
x i ni
k
x i2 ni i =1
n
i =1
n-1
Cov(x,y) = s xy =
(x
i =1
- x)(y i - y)
n -1
r=
Pp = x
'
j1
Sx =
S 2x
CV x =
sx
x
n n
x i y i
n
x i y i i =1 i =1
n
i =1
n -1
s xy
sxs y
np100 N j1
+ c j
nj
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
24
Instituto Profesional
Mo Varianza Poblacional
Mediana
Frecuencia
Percentiles
Cuartiles
Deciles
Q=Q3 Q1
Escala de Medicin
Distribucin de
Frecuencias
Asociacin entre
variables (dos o
ms)
(una variable)
Barras Simples
Circular o de torta
Barras
Subdivididas
Barras agrupadas
Histograma simple
Lineal
Histograma ajustado
Correlacin
Nominal u ordinal
Continuas
Intervalos o Razn
Polgono de
Frecuencias
[1+3.3 Log n]
Correccin de la Amplitud
nc =
Rango Intercuartlico
k * ni
ci
RI = Q3 Q1
2 = (x - )2 ni
Varianza
N
Desviacin Estndar
X = X2
Me
med ( x )
n
N j 1
= lim.inf . + ci ( 2
)
nj
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
25
Instituto Profesional
Coeficiente de Correlacin:
5.- Para determinada tarea en una fbrica, donde se necesita mucha destreza, se
quiere investigar si la productividad en el trabajo debe ser mayor al aumentar los
aos de experiencia. Se seleccionaron al azar diez empleados de entre lo que
tienen ese trabajo. Los datos de aos de experiencia y medicin de productividad
son los siguientes:
r(x,y) = Cov(x,y)
Sx * Sy
Y es a travs del diagrama de dispersin, donde es ms fcil apreciar, que tan
homogneos son los datos.
A
A
A
90,0
productividad
productividad
90,0
87,5
A
A
85,0
Regresin lineal
A
87,5
A
A
85,0
82,5
A
A
82,5
80,0
2,5
5,0
7,5
10,0
12,5
aos
A
A
80,0
2,5
5,0
7,5
10,0
12,5
aos
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
26
Instituto Profesional
Correlaciones
aos
aos
productividad
Correlacin de Pearson
n
Correlacin de Pearson
1
10
,920**
productividad
,920**
10
1
r = 0.9197 91.97%
Correlacin
Negativa
Fuerte
-1
Correlacin
Positiva
Perfecta
No hay
Correlacin
Correlacin
Negativa
Moderada
Correlacin
Negativa
Dbil
-0.5
Correlacin
positiva
Dbil
Correlacin
Positiva
Moderada
0.5
Correlacin
Positiva
Fuerte
Correlacin Negativa
Correlacin Positiva
____________________________________________________________________________________
ESTADSTICA APLICADA
Profesora: Flor Solis Flores
27