Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Untitled
Untitled
TEXTO PARALELO
INTRODUCCION
3
ESTADISTICA: MEDIDAS DE FRECUENCIA CENTRAL
MEDIDAS DE DISPERCION O VARIABILIDAD
7
AGRUPAMIENTO DE VALORES 10
MEDIDAS DE POSICION
11
GRAFICAS ESTADISTICAS 13
GRAFICAS CON VARIABLES CUANTITATIVAS
16
DIAGRAMA DE SECTORES O DIAGRAMA CIRCULAR
ANALISIS DE REGRESION Y CORRELACION
19
PRUEBA DE CHI CUADRADO 26
CURVA NORMAL
27
ANALISIS DE MUESTRA DE IGUAL TAMAO
32
ANALISIS DE MUESTRA DE DIFERENTE TAMAO 34
ANALISIS DE UNA MUESTRA DOS VECES
35
DISTRIBUCION COMPLETAMENTE AL AZAR
36
DISTRIBUCION EN BLOQUES AL AZAR 37
DISTRIBUCION DE CUADRO LATINO 39
DISTRIBUCION DE BLOQUES INCOMPLETOS
41
BIBLIOGRAFIA
42
17
INTRODUCCION
Estadstica
Es un conjunto de tcnicas orientadas a la recoleccin, tabulacin, graficacion, anlisi
s e interpretacin de datos y la toma de decisiones razonables a partir de los mis
mos. Se divide en 3 fases:
Estadstica descriptiva:
Permite la recoleccin, tabulacin y graficacion de valores.
Estadstica inferencial:
Consiste en el estudio de pequeos grupos llamados muestras y generaliza los resul
tados hacia la poblacin.
Diseo estadstico:
Permite a travs de la investigacin realizar procesos de comparacin de variables e i
dentifican a aquellos tratamientos que presentan los mejores resultados. Tambin s
e le llama diseo experimental.
Medidas de tendencia central
Se les llama tambin medidas de centralizacin. Son parmetros o estadsticos que permit
en agrupar en un solo valor central las caractersticas generales de una poblacin o
una muestra.
Se le llama parmetro a todo dato que se obtiene de una poblacin.
Se le llama estadstico a todo dato que se obtiene de una muestra.
Se le llama muestra a una parte representativa de una poblacin.
Se le llama poblacin o universo al total de sujetos por los cuales existe inters d
e investigacin.
Para que la muestra sea representativa es necesario que posea un tamao adecuado y
tenga las caractersticas generales de toda la poblacin. Las medidas de tendencia
central ms comunes son:
Media aritmtica:
Se le llama tambin promedio o promedio aritmtico. Su smbolo , M se define como la su
matoria de datos dentro el nmero de datos. Es la medida de tendencia central ms ut
ilizada pero presenta el problema que se deja influenciar por valores extremos.
Mediana:
Md es el valor central o el promedio de los 2 valores centrales de una serie ord
enada de datos.
Moda:
Es el valor o los valores que ms se repiten en una serie de datos. Cuando la seri
e no tiene moda se dice que es a modal, cuando tiene 1 moda es unimodal, cuando
tiene 2 modas es bimodal y cuando tiene ms de 2 modas es polimodal o multimodal.
Media cuadrtica:
Mc es la ms exacta en las medidas de centralizacin se define como la raz cuadrada d
el promedio cuadrtico de los valores.
Media armnica:
Ma. La totalidad de datos entre la sumatoria de recprocos.
Media geomtrica:
MG la ensima raz del producto de los valores.
Ejemplo:
12, 15, 10, 17, 16, 21, 23, 20, 19, 16, 19, 23, 22, 19.
X = (X)/(n@)
X=252/14 = 18
Md= 10, 12, 15, 16, 16, 17, 19, 19, 19, 20, 21, 22, 23, 23,
= Md=
(19+19)/2 = 19
c) Mo.= 19
d) Mc = (X)/2=
Mc = (100+144+225+256+256+289+361+361+361+400+441+484+529+529)/14
=18.39
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =14/(1/10+1/12+1/15+2/16+1/17+3/19+1/20+
1/21+1/22+2/23) = 17.04
f) MG=(n&X1*X2*X3 )
(14&10*12*15*16*16*17*19*19*19*20*21*22*23*23 ) =17.54
g) L a serie es unimodal.
Ejercicio # 1:
19, 22, 19, 16, 21, 23, 19, 23, 27, 28, 29, 23, 21, 19
X = (X)/n
X=309/14 = 22.07
b) Md= 16, 19, 19, 19, 19, 21, 21, 22, 23, 23, 23, 27, 28, 28, = Md= (21+22)
/2 =21.5
c) Mo.= 19
d) Mc = (X)/2=
Mc = (256+361+361+361+361+441+441+484+529+529+529+729+784+841)/14
=22.37
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =14/(1/16+4/19+2/21+1/22+3/23+1/27+1/28+
1/29) = 21.49
f) MG=(n&X1*X2*X3 )
(14&16*19*19*19*19*21*21*22*23*23*23*27*28*29 ) = 21.77
g) L a serie es unimodal.
15.4, 14.2, 16.3, 15.6, 19.1, 17.3
X = (X)/n
X=97.9/6 = 16.32
b) Md= 14.2, 15.4, 15.6, 16.3, 17.3, 19.1, = Md= (15.6+16.3)/2 =15.95
c) Mo.=
d) Mc = (X)/2=
Mc = (210.25+237.16+243.36+265.69+299.29+364.81)/6=16.38
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =6/(1/14.2+1/15.4+1/16.3+1/17.3+1/19.1)
= 16.17
f) MG=(n&X1*X2*X3 )
(6&14.2*15.4*15.6*16.3*17.3*19.1) = 16.24
g) L a serie es a modal
Medidas de dispersin o variabilidad
Son parmetros o estadsticos que expresan la variacin que existe entre los datos y l
a media aritmtica. Las medidas de dispersin ms importantes son:
Rango:
Se le llama tambin recorrido o amplitud general. Su smbolo R.
Desviacin media:
DM es el promedio de diferencias absolutas que existe entre los datos y la media
aritmtica.
Varianza o variacin:
Ejemplo:
12, 15, 19, 16, 18, 17, 20, 22, 16, 15, 17,
RANGO= dato menor-dato mayor = 22-12= 10
DM= (|x-x |)/n=
X=187/11 = 17 =
(5+2+2+1+1+0+3+5+1+2+0)/11
= 22/11= 2
S= ((x-x ))/n = (25+4+4+1+1+0+9+25+1+4+0)/11 = 6.73
S=( ((x-x ))/n) = S = 6.73 = 2.59
CV = (S/(x))100=
(2.60/17)100 = 15.29%
La x tiene alta representatividad.
26, 28, 24, 25, 30, 27, 29, 18, 22, 23, 26, 25, 24
a) RANGO= dato menor-dato mayor = 30-18 = 12
b) DM= (|x-x |)/n=
X=327/1 = 25.15 =
(0.85+2.85+1.15+0.15+4.85+1.85+3.85+7.15+3.15+2.15+0.25+1.15)/13 = 2.32
S= ((x-x ))/n = (0.75+8.12+1.32+0.02+23.52+3.42+14.82+51.12+9092+4.62+0.72+1
.32)/13 = 9.20
S=( ((x-x ))/n) = S = 9.20 = 3.03
CV = (S/(x))100=
(2.60/17)100 = 12.04%
La x tiene alta representatividad.
Ejercicio #2
19, 26, 29, 25, 32, 23, 25, 28, 23, 26, 25, 28, 27, 29, 24
X = (X)/n
X=389/15 = 25.93
b) Md= 19, 23, 23, 24, 25, 25, 25, 26, 26, 27, 28, 28, 29, 29, 32, = Md
= (26+26)/2 =26
c) Mo.= 25
d) Mc = (X)/2=
Mc = (361+529+529+576+625+625+625+676+676+729+784+784+841+841+102
4)/15=26.10
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =15/(1/19+2/23+1/24+3/25+2/26+1/27+2/28+2
/29+1/31@.) = 25.56
f) MG=(n&X1*X2*X3 )
(15&19*23*23*24*25*25*25*26*26*27*28*28*29*29*32 ) = 25.75
g) RANGO= dato menor-dato mayor = 32-19 = 13
h) DM= (|x-x |)/n=
X=389/15 = 25.93 =
(6.93+2.93+2.93+2.93+0.93+0.93+0.93+0.07+0.07+1.07+2.07+2.07+3.07+3.07+6.07)/15
= 2.338
Agrupamiento de valores
Cuando se tienen ms de 30 datos es necesario organizar los datos en grupos llamad
os intervalos. El nmero de intervalos debe de oscilar entre 6 y 15. Si se tiene m
enos de 6 intervalos pueden llegarse a conclusiones que no son validas para la i
nvestigacin. Por el contrario, si se utilizan ms de 15 intervalos no se cumple el
propsito real del agrupamiento de valores que es reducir tiempo, recursos y esfue
rzo en la tabulacin de los valores.
Al ancho de cada intervalo se le da el nombre de amplitud. El centro de cada int
ervalo recibe el nombre de punto medio, centro de clase o marca de clase.
Ejemplo:
76
83
48
62
76
59
67
78
45
55
56
68
63
57
61
60
52
80
41
56
25
48
50
56
61
60
66
61
60
61
56
49
46
41
53
62
56
63
56
61
78
63
59
66
72
68
60
58
61
66
90
71
60
77
59
60
71
63
59
46
50
66
59
63
72
73
78
63
54
63
48
58
57
56
52
49
58
84
46
71
67
67
50
59
62
58
62
71
60
56
64
75
70
77
52
60
56
72
54
63
71
61
57
61
78
64
56
64
56
76
70
56
64
61
55
77
66
48
52
61
72
66
50
48
46
38
75
62
65
69
56
61
78
80
84
34
61
76
67
68
52
56
64
61
72
66
61
47
50
56
52
48
50
52
55
50
55
52
49
60
Rango = 90-34= 56
Amplitud= R/(n.i)= 56/7= 8
Intervalo
33.5 41.5
41.5 49.5
49.5 57.5
57.5 65.5
65.5 73.5
73.5 81.5
81.5 89.5
89.5 97.5
f
4
15
41
53
27
16
3
1
=160
Medidas de posicin
Se les conoce tambin con el nombre de frac tilos, son medidas que permiten ubicar
la posicin que ocupa un valor en una serie de datos. Los frac tilos ms conocidos
son: los decilos, cuartilos y centilos.
A los cuartilos se les llama tambin cuartiles y permiten dividir en 4 partes la s
erie de datos. A los decilos se les llama tambin deciles y dividen la serie de da
tos en 10 partes. A los centilos se les llama cantiles o percentiles y dividen l
a serie de datos en 100 partes. El segundo cuartil y quinto decil y el quincuagsi
mo percentil equivalen a la mediana. El ltimo cuartil, decil y cantil equivalen a
l lmite superior del ltimo intervalo. Las formulas para el clculo de las medidas de
posicin son las siguientes.
Qx= Li +((xn/4- fac .ant.)/W)i =
Dx= Li +((xn/10- fac .ant.)/W)i =
Cx= Li+((xn/100- fac .ant.)/W)i
intervalo
3.5 - 8.5
8.5 13.5
13.5 18.5
18.5 23.5
23.5 28.5
28.5 33.5
33.5 38.5
f
12
20
29
43
22
18
14
Fac.
12
32
61
104
123
144
158
CUARTILES:
Q= Li +((n/4- fac .ant.)/W)i = 13.5 +((39.5-32)/29)5= Q= 14.79
Q= Li +((2n/4- fac .ant.)/W)i = 18.5 +((79-61)/43)5= Q= 20.59 = Mediana
Q= Li +((3n/4- fac .ant.)/W)i = 23.5 +((118.5-104)/22)5= Q= 26.79
Q= Li +((4n/4- fac .ant.)/W)i = 33.5 +((158-144)/14)5= Q= 38.5
DECILES:
D= Li +((n/10- fac .ant.)/W)i = 8.5 +((15.8-12)/20)5= D= 9.45
D= Li +((3n/10- fac .ant.)/W)i = 13.5 +((47.4-32)/29)5= D= 16.15
D= Li +((5n/10- fac .ant.)/W)i = 18.5 +((79-61)/43)5= D= 20.59
D= Li +((7n/10- fac .ant.)/W)i = 23.5 +((110.6-104)/22)5= D= 25.00
CENTILES:
C= Li+((14n/100- fac .ant.)/W)i = 8.5 +((22.12-12)/20)5= C= 11.03
C= Li+((45n/100- fac .ant.)/W)i = 18.5 +((71.1-61)/43)5= C= 19.67
C =Li+((78n/100- fac .ant.)/W)i = 23.5 +((123.24-104)/22)5= C= 27.87
C= 20.59
C= 26.79
C= 38.5
Graficas estadsticas
Constituyen representaciones estticas de las series de valores que existen grafic
as estadsticas para variables cualitativas y cuantitativas. se llama variable cua
litativa a aquella que expresa una relacin nominal, ordinal. Se llama variable cu
antitativa a la que expresa una relacin intervalar o proporcional y por lo tanto
constituye expresiones numricas. Las graficas ms utilizadas para variables cuantit
ativas son:
Histograma de pearson
Es una grafica que se construye colocando las frecuencias absolutas en el eje ve
rtical y los lmites de cada intervalo en el eje horizontal. En la construccin de e
sta grafica se elaboran una serie de rectngulos adyacentes.
En todas las graficas estadsticas para tener una representacin esttica la altura de
be de ser entre el 60 y el 75 % de la base.
Polgono de frecuencias absolutas
Para construir esta grafica se coloca en el eje vertical la frecuencia absoluta
y en el eje horizontal los respectivos puntos medios de cada intervalo. Si el lmi
te del primer intervalo no inicia en 0 la grafica se representa cortada. El polgo
no inicia en el lmite inferior del primer intervalo y finaliza en el lmite superio
r del ltimo intervalo.
Polgono de frecuencias relativas porcentuales
Esta grafica se diferencia del polgono de frecuencias absolutas en que en el eje
vertical se colocan las frecuencias relativas porcentuales. Esta grafica se reco
mienda cuando los datos se expresan en porcentajes.
Polgono de frecuencias acumuladas
es una grafica comnmente utilizada para expresar crecimiento. Se diferencia de lo
s otros polgonos en que:
En el eje vertical se escribe la frecuencia acumulada.
No surge del eje horizontal si no que surge del eje vertical a partir de
la primera frecuencia acumulada.
Esta grafica no desciende al eje horizontal pues como expresa crecimient
o se queda en el aire
Intervalo
3.5 8.5
8.5 13.5
13.5 - 18.5
18.5 23.5
23.5 28.5
28.5 33.5
33.5 38.5
f
10
18
20
36
22
15
7
99.99%
Histograma de pearson
xi
6
11
16
21
26
31
36
f.r.p Fac
7.81% 10
14.06% 28
15.63% 48
28.12% 84
17.19% 106
11.72% 121
5.47% 128
= 128
40
35
30
25
20
15
10
5
28.5
33.5
3.5
38.5
8.5
13.5
18.5
23.5
*
*
10
*
5
*
*
*
6
26
31
11
36
32
28
24
20
16
*
*
12
8
4
*
*
*
16
21
26
6
31
11
36
16
21
*
*
*
*
*
*
26
6
31
36
11
16
21
CUANTITATIVAS:
102.86
42.86
17.14
34.28
128.57
=42
= 359.99
12
10
8
6
4
Suchi
reu
cremas
os
Diagrama de barras horizontales
xela
usac
marquen.
roj
Suchi
Reu
Cremas
Xela
Usac
Marquense
Rojos
12
14
Diagrama de sectores
2
16
10
336/(392*630 )=0.68
R
erte.
Positiva perfecta
COEFICIENTE DE CORRELACION:
x
23
22
25
26
24
27
28
29
30
=234
3
=
y
25
26
28
23
22
25
28
26
25
xy
575
572
700
598
528
675
784
754
750
=228
x
529
484
625
676
576
729
784
841
900
=5936
y
yc
(y - y)
625
24.94 0.11
0.00
676
24.81 0.45
1.42
784
25.20 7.13
7.84
529
25.33 5.43
5.43
484
25.07 11.09 9.42
625
25.46 0.11
0.21
784
25.59 7.13
5.81
676
25.72 0.45
0.08
625
25.85 0.11
0.72
=6114
= 5808
1.02
Coeficiente de correlacin:
r: (nxy- xy)/([nx^2-(x)] [ny^2-(y)] )
(y - yc)
0.15
0.27
0.02
0.00
0.07
0.02
0.07
0.15
0.27
(yc - y)
=32.01
r = (S/St) = = (1.02/32.0
72/(540*288 )=0.18
=30.
Yc= 0.13x+21.95
Encontrar los valores corregidos de y.
x
23
0.58
20
0.02
21
0.67
24
0.15
25
0.07
20
0.03
=133
1.52
x
19
3.65
22
0.29
25
6.20
20
0.52
22
1.12
23
10.05
=131
=21.83
y
14
xy
322
x
529
xx
437
xy
266
x
361
yc
15.91
16
320
400
440
352
484
16.54
0.45
15
315
441
441
375
625
17.49
2.79
17
408
576
576
340
400
16.28
0.11
18
450
625
625
396
484
16.94
1.77
20
400
400
400
460
529
16.83
11.09
=100
y
= n a + bx
+ c x
xy= a x + b x + c xx=
xy=a x + b xx + c x =
100= 6a
+133b +131c =
2215= 133a + 2971b+2892c=
2189= 131a + 2892b+2892c=
((100= 6a
+bx+cx+dx=
= n a + b x + c x
+ d x
a x + b x + c xx + d xx =
a x + b xx + c x + d xx =
a x + b xx + c xx+ d x =
77=5a +
87b+
72c+
83d=
1333=87a+1531b+1245c+1437d=
1113=72a+1245b+1042c+1201d=
1286=83a+1437b+1201c+1395d=
((77=5 a+87b+72c+83d @1333=87a+1531b+1245c+1437d)) (87@-5)
R //34=86b+39c+36d
xx
xy
Curva normal
Posee simetra bilateral lo cual significa que al lado derecho del eje cen
tral se encuentra el 50% de los casos y al lado izquierdo el otro50%
Es asinttica lo cual significa que las cosas de la curva tienden a acerca
rse al eje horizontal pero jams llegan a unirse a l.
Posee 3 desviaciones estndar positivas y 3 desviaciones estndar negativas.
En el eje vertical coinciden todas las medidas de tendencia central.
A mas menos una desviacin estndar se encuentra el 68.34% de los casos
Para encontrar reas bajo a curva normal se aplican los siguientes reglas:
Si z es positivo y se pide lo que es superior a ella. Se busca z en la t
abla y ese valor se resta a 50%
Si z es positivo y se pide lo que es inferior a ella se busca z en la ta
bla y ese vlor se suma a 50%
Si z es negativo y se pide lo que es inferior a ella se busca z en la ta
bla y ese valor se resta a 50%
Si z es negativo y se pide lo que es superior a ella se busca z en la ta
bla y ese valor se suma a 50%
Si z se encuentra entre 2 valores de igual signo se buscan ambos puntaje
s en la tabla y se restan.
Si z se encuentra entre 2 valores de diferente signo se buscan ambos pun
tajes en la tabla y se suman
Si se quiere encontrar el nmero de casos que corresponden a una probabili
dad determinada. Se encuentra la probabilidad y se multiplica por el total de ca
sos, dividiendo este resultado entre 100.
Se hizo una investigacin con el propsito de determinar el % de TND (total de nutri
entes digeribles) en 740 muestras de arroz obtenindose un promedio de 81% con una
desviacin estndar de 6%. Si se selecciona una muestra de arroz al azar cual es la
probabilidad de que su % de TND sea:
Superior a 90
Z=(x-x )/S=(90-81)/6=1.50 = 43.32% -50%= 6.68%
Superior a 99
Z=(x-x )/S=(99-81)/6=3 = 49.87% -50%= 0.13%
Inferior a 95
Z=(x-x )/S=(95 -81)/6=2.33 = 49.01% +50%= 99.5%
Inferior a 99.5
Z=(x-x )/S=(99.5-81)/6=3.08 = 50% +50%= 100%
Superior a 70
Z=(x-x )/S=(70-81)/6=-1.833 = 46.64% +50%= 96.64%
Superior a 60
Z=(x-x )/S=(60-81)/6=-3.5 = 50% +50%= 100%
Inferior a 74
Z=(x-x )/S=(74-81)/6=-1.17 = 37.90% -50%= 12.10%
Inferior a 58
Z=(x-x )/S=(58-81)/6=-3.83 = 50% -50%= 0.00%
Entre 76 y 88
Z=(x-x )/S=(76-81)/6=-0.83 = 29.67%
Z=(x-x )/S=(88-81)/6=1.17 = 37.90%
Entre 83 y 94
Z=(x-x )/S=(83-81)/6=-0.33 = 12.93%
= 67.57%
= 35.57%
Entre 67 y 76
Z=(x-x )/S=(67-81)/6=-2.33 = 49.01%
Z=(x-x )/S=(76-81)/6=-0.83 = -29.67%
= 19.34%
(B-B)
1.30
3.46
0.02
0.74
4.58
3.46
1.30
214.86
se utiliza cuando se tiene dos grupos o tratamiento que pre
de repeticiones la metodologa que se utiliza recibe el nombr
R=(((A-A)^2+(B-B)^2 (1+1))/(nA+nB-2)
na
nB)
n-1
rA=
3.1
7.1
= 1.26
1.46 = 0.60
7-1
= 2.05
7
14
(dato)-Fc
Ejemplo:
Repeticin
I
12
144 26
676
18
324
20
400
24
576
II
15
225 20
400
16
256
16
256
25
625
III
17
289
24
576
15
225
17
289
24
576
IV
18
324
23
529
14
196
20
40
20
400
V
16
256
25
625
17
289
19
361
25
625
VI
19
361
26
676
19
361
20
400
26
676
97
9409
N - 1
144
20736
99
9801
122
12544
144
20736
596
73226
Cuadrado
(dato)-Fc
N - 1
trat
A
196
225
256
324
B
529
484
625
400
C
I
14
15
16
18
63
23
22
25
20
90
19
III
II
3969
8100
IV
361
23
529
28
784
22
484
92
8464
D
20
400
16
256
18
324
22
484
76
5776
E
25
625
24
576
22
484
20
400
91
8281
101
100
109
102
412
34590
BIBLIOGRAFIA
Notas del cuaderno 3er semestre del curso de Estadstica
www.goglee.com
Cuadrado
www.wikipedia.com