Está en la página 1de 22

ESTADISTICA

TEXTO PARALELO

INTRODUCCION
3
ESTADISTICA: MEDIDAS DE FRECUENCIA CENTRAL
MEDIDAS DE DISPERCION O VARIABILIDAD
7
AGRUPAMIENTO DE VALORES 10
MEDIDAS DE POSICION
11
GRAFICAS ESTADISTICAS 13
GRAFICAS CON VARIABLES CUANTITATIVAS
16
DIAGRAMA DE SECTORES O DIAGRAMA CIRCULAR
ANALISIS DE REGRESION Y CORRELACION
19
PRUEBA DE CHI CUADRADO 26
CURVA NORMAL
27
ANALISIS DE MUESTRA DE IGUAL TAMAO
32
ANALISIS DE MUESTRA DE DIFERENTE TAMAO 34
ANALISIS DE UNA MUESTRA DOS VECES
35
DISTRIBUCION COMPLETAMENTE AL AZAR
36
DISTRIBUCION EN BLOQUES AL AZAR 37
DISTRIBUCION DE CUADRO LATINO 39
DISTRIBUCION DE BLOQUES INCOMPLETOS
41
BIBLIOGRAFIA
42

17

INTRODUCCION

La estadstica es la rama de las matemticas que se ocupa en reunir organizar y anal


izar datos numricos y ayuda a resolver problemas como el diseo de experimento y l
a toma de decisiones.
En las siguientes pginas obtendremos informacin de los diferentes conceptos y cont
enidos que esta rama posee como por ejemplo: Medidas de tendencia Central, Medid
as de Dispersin o Variabilidad, Graficas Estadsticas, entre otros.
La estadstica es un elemento importante para hacer anlisis de alimentos y mtodos de
tratamientos y otros procesos es por eso que se da un amplio contenido para emp
learlo en lo que se desea analizar u organizar.

Estadstica
Es un conjunto de tcnicas orientadas a la recoleccin, tabulacin, graficacion, anlisi
s e interpretacin de datos y la toma de decisiones razonables a partir de los mis
mos. Se divide en 3 fases:
Estadstica descriptiva:
Permite la recoleccin, tabulacin y graficacion de valores.
Estadstica inferencial:
Consiste en el estudio de pequeos grupos llamados muestras y generaliza los resul
tados hacia la poblacin.
Diseo estadstico:
Permite a travs de la investigacin realizar procesos de comparacin de variables e i
dentifican a aquellos tratamientos que presentan los mejores resultados. Tambin s
e le llama diseo experimental.
Medidas de tendencia central
Se les llama tambin medidas de centralizacin. Son parmetros o estadsticos que permit
en agrupar en un solo valor central las caractersticas generales de una poblacin o
una muestra.
Se le llama parmetro a todo dato que se obtiene de una poblacin.
Se le llama estadstico a todo dato que se obtiene de una muestra.
Se le llama muestra a una parte representativa de una poblacin.
Se le llama poblacin o universo al total de sujetos por los cuales existe inters d
e investigacin.
Para que la muestra sea representativa es necesario que posea un tamao adecuado y
tenga las caractersticas generales de toda la poblacin. Las medidas de tendencia
central ms comunes son:
Media aritmtica:
Se le llama tambin promedio o promedio aritmtico. Su smbolo , M se define como la su
matoria de datos dentro el nmero de datos. Es la medida de tendencia central ms ut
ilizada pero presenta el problema que se deja influenciar por valores extremos.

Mediana:
Md es el valor central o el promedio de los 2 valores centrales de una serie ord
enada de datos.
Moda:
Es el valor o los valores que ms se repiten en una serie de datos. Cuando la seri
e no tiene moda se dice que es a modal, cuando tiene 1 moda es unimodal, cuando
tiene 2 modas es bimodal y cuando tiene ms de 2 modas es polimodal o multimodal.
Media cuadrtica:
Mc es la ms exacta en las medidas de centralizacin se define como la raz cuadrada d
el promedio cuadrtico de los valores.
Media armnica:
Ma. La totalidad de datos entre la sumatoria de recprocos.
Media geomtrica:
MG la ensima raz del producto de los valores.
Ejemplo:
12, 15, 10, 17, 16, 21, 23, 20, 19, 16, 19, 23, 22, 19.
X = (X)/(n@)
X=252/14 = 18
Md= 10, 12, 15, 16, 16, 17, 19, 19, 19, 20, 21, 22, 23, 23,
= Md=
(19+19)/2 = 19
c) Mo.= 19
d) Mc = (X)/2=
Mc = (100+144+225+256+256+289+361+361+361+400+441+484+529+529)/14
=18.39
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =14/(1/10+1/12+1/15+2/16+1/17+3/19+1/20+
1/21+1/22+2/23) = 17.04
f) MG=(n&X1*X2*X3 )
(14&10*12*15*16*16*17*19*19*19*20*21*22*23*23 ) =17.54
g) L a serie es unimodal.
Ejercicio # 1:
19, 22, 19, 16, 21, 23, 19, 23, 27, 28, 29, 23, 21, 19
X = (X)/n
X=309/14 = 22.07
b) Md= 16, 19, 19, 19, 19, 21, 21, 22, 23, 23, 23, 27, 28, 28, = Md= (21+22)
/2 =21.5
c) Mo.= 19
d) Mc = (X)/2=
Mc = (256+361+361+361+361+441+441+484+529+529+529+729+784+841)/14
=22.37
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =14/(1/16+4/19+2/21+1/22+3/23+1/27+1/28+
1/29) = 21.49
f) MG=(n&X1*X2*X3 )
(14&16*19*19*19*19*21*21*22*23*23*23*27*28*29 ) = 21.77
g) L a serie es unimodal.
15.4, 14.2, 16.3, 15.6, 19.1, 17.3
X = (X)/n
X=97.9/6 = 16.32
b) Md= 14.2, 15.4, 15.6, 16.3, 17.3, 19.1, = Md= (15.6+16.3)/2 =15.95
c) Mo.=
d) Mc = (X)/2=
Mc = (210.25+237.16+243.36+265.69+299.29+364.81)/6=16.38
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =6/(1/14.2+1/15.4+1/16.3+1/17.3+1/19.1)
= 16.17
f) MG=(n&X1*X2*X3 )
(6&14.2*15.4*15.6*16.3*17.3*19.1) = 16.24
g) L a serie es a modal
Medidas de dispersin o variabilidad
Son parmetros o estadsticos que expresan la variacin que existe entre los datos y l
a media aritmtica. Las medidas de dispersin ms importantes son:
Rango:
Se le llama tambin recorrido o amplitud general. Su smbolo R.
Desviacin media:
DM es el promedio de diferencias absolutas que existe entre los datos y la media
aritmtica.
Varianza o variacin:

Es el promedio de diferencias cuadrticas que existe entre los datos y la media cu


adrtica sus smbolos s^(2
), g^2 , ^2
Desviacin estndar:
Se le llama tambin desviacin tpica y se define como la raz cuadrada del promedio cua
drtico de la diferencia que existe entre los datos y la media aritmtica. Cuando se
conoce la varianza basta con sacarle la raz cuadrada para obtener la desviacin es
tndar.
Coeficiente de variacin o variabilidad:
Se le llama tambin coeficiente de variabilidad y se define como la relacin que se
da entre la desviacin estndar y la media aritmtica multiplicando ese resultado por
100.
Es la medida de dispersin ms importante pues expresa el grado de representatividad
de la media aritmtica. Si el coeficiente de variacin es menor que 16.66% la media
aritmtica tiene alta representatividad, si el coeficiente de variacin est entre 16
.67 y 25% la media aritmtica tiene baja representatividad y si el coeficiente de
variacin es superior a 25% la media aritmtica carece de representatividad.

Ejemplo:
12, 15, 19, 16, 18, 17, 20, 22, 16, 15, 17,
RANGO= dato menor-dato mayor = 22-12= 10
DM= (|x-x |)/n=
X=187/11 = 17 =
(5+2+2+1+1+0+3+5+1+2+0)/11
= 22/11= 2
S= ((x-x ))/n = (25+4+4+1+1+0+9+25+1+4+0)/11 = 6.73
S=( ((x-x ))/n) = S = 6.73 = 2.59
CV = (S/(x))100=
(2.60/17)100 = 15.29%
La x tiene alta representatividad.
26, 28, 24, 25, 30, 27, 29, 18, 22, 23, 26, 25, 24
a) RANGO= dato menor-dato mayor = 30-18 = 12
b) DM= (|x-x |)/n=
X=327/1 = 25.15 =
(0.85+2.85+1.15+0.15+4.85+1.85+3.85+7.15+3.15+2.15+0.25+1.15)/13 = 2.32
S= ((x-x ))/n = (0.75+8.12+1.32+0.02+23.52+3.42+14.82+51.12+9092+4.62+0.72+1
.32)/13 = 9.20
S=( ((x-x ))/n) = S = 9.20 = 3.03
CV = (S/(x))100=
(2.60/17)100 = 12.04%
La x tiene alta representatividad.
Ejercicio #2
19, 26, 29, 25, 32, 23, 25, 28, 23, 26, 25, 28, 27, 29, 24
X = (X)/n
X=389/15 = 25.93
b) Md= 19, 23, 23, 24, 25, 25, 25, 26, 26, 27, 28, 28, 29, 29, 32, = Md
= (26+26)/2 =26
c) Mo.= 25
d) Mc = (X)/2=
Mc = (361+529+529+576+625+625+625+676+676+729+784+784+841+841+102
4)/15=26.10
e) Ma. =n/(1/x1+1/x2+1/x3@.)
=Ma. =15/(1/19+2/23+1/24+3/25+2/26+1/27+2/28+2
/29+1/31@.) = 25.56
f) MG=(n&X1*X2*X3 )
(15&19*23*23*24*25*25*25*26*26*27*28*28*29*29*32 ) = 25.75
g) RANGO= dato menor-dato mayor = 32-19 = 13
h) DM= (|x-x |)/n=
X=389/15 = 25.93 =
(6.93+2.93+2.93+2.93+0.93+0.93+0.93+0.07+0.07+1.07+2.07+2.07+3.07+3.07+6.07)/15
= 2.338

i) S= ((x-x ))/n = (48.02+8058+8.58+3.72+0.26+0.86+0.86+4.09+4.9+0+0+1.14+4.28+4.28+


9.42+9.42+36.84)/15 = 9.12
j) S=( ((x-x ))/n) = S = 9.12 = 3.01
k) CV = (S/(x))100=
(3.01/25.93)100 = 11.60%
l) la serie es unimodal.
m) la x tiene alta representatividad.

Agrupamiento de valores
Cuando se tienen ms de 30 datos es necesario organizar los datos en grupos llamad
os intervalos. El nmero de intervalos debe de oscilar entre 6 y 15. Si se tiene m
enos de 6 intervalos pueden llegarse a conclusiones que no son validas para la i
nvestigacin. Por el contrario, si se utilizan ms de 15 intervalos no se cumple el
propsito real del agrupamiento de valores que es reducir tiempo, recursos y esfue
rzo en la tabulacin de los valores.
Al ancho de cada intervalo se le da el nombre de amplitud. El centro de cada int
ervalo recibe el nombre de punto medio, centro de clase o marca de clase.
Ejemplo:
76
83
48
62
76
59
67
78
45
55
56
68
63
57
61
60
52
80
41
56
25
48
50
56
61
60
66
61
60
61
56
49
46
41
53
62
56
63
56
61
78
63
59
66
72
68
60
58
61
66
90
71
60
77
59
60
71
63
59
46
50
66
59
63
72
73
78
63
54
63
48
58
57
56
52
49
58
84
46
71
67
67
50
59
62
58
62
71
60
56
64
75
70
77
52
60
56
72
54
63
71
61
57
61
78
64
56
64
56
76
70
56
64
61
55
77
66
48
52
61
72
66
50
48
46
38
75
62
65
69
56
61
78
80
84
34
61
76
67
68
52
56
64
61
72
66
61
47
50
56
52
48
50
52
55
50
55
52
49
60
Rango = 90-34= 56
Amplitud= R/(n.i)= 56/7= 8
Intervalo
33.5 41.5
41.5 49.5
49.5 57.5
57.5 65.5
65.5 73.5
73.5 81.5
81.5 89.5
89.5 97.5

f
4
15
41
53
27
16
3
1

=160

Medidas de posicin
Se les conoce tambin con el nombre de frac tilos, son medidas que permiten ubicar
la posicin que ocupa un valor en una serie de datos. Los frac tilos ms conocidos
son: los decilos, cuartilos y centilos.
A los cuartilos se les llama tambin cuartiles y permiten dividir en 4 partes la s
erie de datos. A los decilos se les llama tambin deciles y dividen la serie de da
tos en 10 partes. A los centilos se les llama cantiles o percentiles y dividen l
a serie de datos en 100 partes. El segundo cuartil y quinto decil y el quincuagsi
mo percentil equivalen a la mediana. El ltimo cuartil, decil y cantil equivalen a
l lmite superior del ltimo intervalo. Las formulas para el clculo de las medidas de
posicin son las siguientes.
Qx= Li +((xn/4- fac .ant.)/W)i =
Dx= Li +((xn/10- fac .ant.)/W)i =
Cx= Li+((xn/100- fac .ant.)/W)i

intervalo
3.5 - 8.5
8.5 13.5
13.5 18.5
18.5 23.5
23.5 28.5
28.5 33.5
33.5 38.5

f
12
20
29
43
22
18
14

Fac.
12
32
61
104
123
144
158

CUARTILES:
Q= Li +((n/4- fac .ant.)/W)i = 13.5 +((39.5-32)/29)5= Q= 14.79
Q= Li +((2n/4- fac .ant.)/W)i = 18.5 +((79-61)/43)5= Q= 20.59 = Mediana
Q= Li +((3n/4- fac .ant.)/W)i = 23.5 +((118.5-104)/22)5= Q= 26.79
Q= Li +((4n/4- fac .ant.)/W)i = 33.5 +((158-144)/14)5= Q= 38.5
DECILES:
D= Li +((n/10- fac .ant.)/W)i = 8.5 +((15.8-12)/20)5= D= 9.45
D= Li +((3n/10- fac .ant.)/W)i = 13.5 +((47.4-32)/29)5= D= 16.15
D= Li +((5n/10- fac .ant.)/W)i = 18.5 +((79-61)/43)5= D= 20.59
D= Li +((7n/10- fac .ant.)/W)i = 23.5 +((110.6-104)/22)5= D= 25.00
CENTILES:
C= Li+((14n/100- fac .ant.)/W)i = 8.5 +((22.12-12)/20)5= C= 11.03
C= Li+((45n/100- fac .ant.)/W)i = 18.5 +((71.1-61)/43)5= C= 19.67
C =Li+((78n/100- fac .ant.)/W)i = 23.5 +((123.24-104)/22)5= C= 27.87
C= 20.59
C= 26.79
C= 38.5

Graficas estadsticas
Constituyen representaciones estticas de las series de valores que existen grafic
as estadsticas para variables cualitativas y cuantitativas. se llama variable cua
litativa a aquella que expresa una relacin nominal, ordinal. Se llama variable cu
antitativa a la que expresa una relacin intervalar o proporcional y por lo tanto
constituye expresiones numricas. Las graficas ms utilizadas para variables cuantit
ativas son:
Histograma de pearson
Es una grafica que se construye colocando las frecuencias absolutas en el eje ve
rtical y los lmites de cada intervalo en el eje horizontal. En la construccin de e
sta grafica se elaboran una serie de rectngulos adyacentes.
En todas las graficas estadsticas para tener una representacin esttica la altura de
be de ser entre el 60 y el 75 % de la base.
Polgono de frecuencias absolutas
Para construir esta grafica se coloca en el eje vertical la frecuencia absoluta
y en el eje horizontal los respectivos puntos medios de cada intervalo. Si el lmi
te del primer intervalo no inicia en 0 la grafica se representa cortada. El polgo
no inicia en el lmite inferior del primer intervalo y finaliza en el lmite superio
r del ltimo intervalo.
Polgono de frecuencias relativas porcentuales
Esta grafica se diferencia del polgono de frecuencias absolutas en que en el eje
vertical se colocan las frecuencias relativas porcentuales. Esta grafica se reco
mienda cuando los datos se expresan en porcentajes.
Polgono de frecuencias acumuladas
es una grafica comnmente utilizada para expresar crecimiento. Se diferencia de lo
s otros polgonos en que:
En el eje vertical se escribe la frecuencia acumulada.
No surge del eje horizontal si no que surge del eje vertical a partir de
la primera frecuencia acumulada.
Esta grafica no desciende al eje horizontal pues como expresa crecimient
o se queda en el aire

Intervalo
3.5 8.5
8.5 13.5
13.5 - 18.5
18.5 23.5
23.5 28.5
28.5 33.5
33.5 38.5

f
10
18
20
36
22
15
7
99.99%

Histograma de pearson

xi
6
11
16
21
26
31
36

f.r.p Fac
7.81% 10
14.06% 28
15.63% 48
28.12% 84
17.19% 106
11.72% 121
5.47% 128
= 128

40
35
30
25
20
15
10
5
28.5

33.5

3.5
38.5

8.5

13.5

18.5

23.5

Polgono de frecuencias absoluta


40
35
30
25
20
15

*
*

10

*
5

*
*

*
6
26

31

11

Polgono de frecuencias relativas porcentuales

36

32
28

24
20
16

*
*

12
8
4

*
*
*

16

21

26

6
31

11
36

16

21

Polgono de frecuencias acumuladas


144
126
108
90
72
54
36
18

*
*
*
*
*
*

26

6
31

36

11

16

21

Las graficas para variables cualitativas:


Diagrama de barras verticales
En la construccin de esta grafica se escribe en el eje vertical las frecuencias a
bsolutas y en el eje horizontal cada una de las categoras. Entre las categoras se
deja un espacio igual al ancho utilizado para toda categora.
Diagrama de barras horizontales
Se construye de la misma manera que el diagrama de barras verticales pero con la
diferencia de que las frecuencias absolutas van en el eje horizontal y las cate
goras en el eje vertical.
Diagrama de sectores, diagrama de pastel o diagrama circular.
Es una grafica en forma de crculo que se construye distribuyendo los sectores de
la siguiente manera: cada frecuencia se multiplica por 360 y se divide dentro de
l total de datos.
GRAFICAS PARA VARIABLES
EQUIPO F.
GRADOS
SICHITEPEQUEZ 12
RETALHULEU
5
COMUNICACIONES 2
XELAJU 1
8.57
USAC
3
25.71
MARQUENSE
4
MUNICIPAL
15

CUANTITATIVAS:
102.86
42.86
17.14
34.28
128.57

Diagrama de barras verticales


16
14

=42

= 359.99

12
10

8
6
4
Suchi
reu
cremas
os
Diagrama de barras horizontales

xela

usac

marquen.

roj

Suchi
Reu
Cremas
Xela
Usac
Marquense
Rojos
12
14
Diagrama de sectores

2
16

10

Anlisis de regresin y correlacin


Se llama correlacin a la relacin que se da entre 2 o ms variables y se llama regres
in a la fuerza o intensidad con que se relaciona 2 o ms variables.
El anlisis de regresin y correlacin se utiliza para medir relaciones de dependencia
entre 2 o ms variables cuantitativas.
Ejemplo:
x
y
xy
x
y
yc
20
14
280
400
196
17.42
19
16
304
361
256
16.56
23
20
460
529
400
20
28
23
644
784
529
24.3
25
22
550
625
484
21.72
22
25
550
484
625
19.14
24
20
480
576
400
20.86
=161
140
=3268
=3759
=2890
Calcule:
Coeficiente de correlacin:
r: (nxy- xy)/([nx^2-(x)] [ny^2-(y)] )
r: (7(3268)-161(140))/([7(3759)-(161)] [7(2890)-(140)] )=

Para establecer el tipo


el siguiente criterio:
R
Es igual o est
R
Es igual a -1
R
-0.80 y -0.99
R
-0.60 y -0.79
R
-o.40 y -0.69
R
-0.20 y -0.39
R
-0.19 y 0.19
R
0.20 y 0.39
R
0.40 y 0.59
R
0.60 y 0.79
R
0.80 y 0.99

336/(392*630 )=0.68

de correlacin que existe en una serie de datos se utiliza


entre Correlacin
Negativa perfecta
Negativa muy fuerte
Negativa fuerte
Negativa moderada
Negativa dbil
No existe
Positiva dbil
Positiva moderada
Positiva fuerte
Muy fuerte

R
erte.

Positiva perfecta

qu tipo de correlacin existe?

0.68= existe correlacin positiva fu

Encuentre los coeficientes de regresin.


m= (xy- xy)/(nx^2-(x)) = 336/392 = 0.86
b=y - mx= 20 0.86 (23) = 0.22
y= (y)/n =140/7= 20
x=(x)/n =161/7= 23
Encuentre la ecuacin de regresin:
Yc= mx+b
Yc= 0.86x+0.22
Encuentre la lnea de regresin:

COEFICIENTE DE CORRELACION:
x
23
22
25
26
24
27
28
29
30
=234
3
=

y
25
26
28
23
22
25
28
26
25

xy
575
572
700
598
528
675
784
754
750
=228

x
529
484
625
676
576
729
784
841
900
=5936

y
yc
(y - y)
625
24.94 0.11
0.00
676
24.81 0.45
1.42
784
25.20 7.13
7.84
529
25.33 5.43
5.43
484
25.07 11.09 9.42
625
25.46 0.11
0.21
784
25.59 7.13
5.81
676
25.72 0.45
0.08
625
25.85 0.11
0.72
=6114
= 5808

1.02
Coeficiente de correlacin:
r: (nxy- xy)/([nx^2-(x)] [ny^2-(y)] )

(y - yc)
0.15
0.27
0.02
0.00
0.07
0.02
0.07
0.15
0.27

(yc - y)

=32.01

r = (S/St) = = (1.02/32.0

r: (9(5939)- 234(228 ))/([9(6144)-(234)] [9(5808)-(228)] )=

72/(540*288 )=0.18

qu tipo de correlacin existe? =


0.18= no existe correlacin.
Encuentre los coeficientes de correlacin.
m= (xy- xy)/(nx^2-(x)) = 72/540 = 0.13
b=y - mx= 25.33-0.13 (26) = 21.95
y= (y)/n =228/9= 25.33
x=(x)/n =234/9= 26
Encuentre la ecuacin de regresin:
Yc= mx+b

=30.

Yc= 0.13x+21.95
Encontrar los valores corregidos de y.

Encuentre la lnea de regresin:


Encuentre la variacin total:
St= (y - y) = 32.01
Encuentre la variacin explicada:
Se= (yc - y)= 1.02
Encuentre la variacin no explicada
Sn= (y yc)= 30.93

x
23
0.58
20
0.02
21
0.67
24
0.15
25
0.07
20
0.03
=133
1.52

x
19
3.65
22
0.29
25
6.20
20
0.52
22
1.12
23
10.05
=131
=21.83

y
14

xy
322

x
529

xx
437

xy
266

x
361

yc
15.91

(y-y) (yc-y) (y-yc


7.13

16

320

400

440

352

484

16.54

0.45

15

315

441

441

375

625

17.49

2.79

17

408

576

576

340

400

16.28

0.11

18

450

625

625

396

484

16.94

1.77

20

400

400

400

460

529

16.83

11.09

=100

=2215 =2971 =2892 =2189 =2883 =99.99 =23.34 =

Calcule la ecuacin de regresin:


Yc= a+bx+cx

y
= n a + bx
+ c x
xy= a x + b x + c xx=
xy=a x + b xx + c x =

100= 6a
+133b +131c =
2215= 133a + 2971b+2892c=
2189= 131a + 2892b+2892c=

((100= 6a

+133b +131c @2215=133a+2971b+2892c)) (133@-6)


R// 10= -137b +71c
((100=6a+133b+ 31c@2189=131a+2892b+2883c)) (131@-6)
R// -34=71b+137c
((10=-137b+ 71c@-34 =71b-137c)) (71@137)
R // -3948= -13728c
(-3948)/( -13728)= c = 0.29
(-34+137(0.29) )/71 =b= 0.08
(100-133(0.08)-131(0.29) )/6= a= 8.56
Yc= 8.56+0.08x+0.29x
Variacin total
St= (y - y) = 23.34
Variacin explicada
Se= (yc - y)= 1.25
Variacin no explicada
Sn= (y yc)= 21.83
Encuentre el coeficiente de correlacin
r = (S/St) = = (1.52/23.34)= 0.26
Tipo de correlacin existente =0.26= correlacin positiva dbil
x
x
x
y
xy
x
xx
xx
xy
x
yc
(y-y) (yc-y)
(yc-y)
20
13
17
15
300
400
260
340
195
169
221
255
14.82 0.16
0.34
0.03
19
14
15
14
266
361
266
285
196
196
210
210
14.5
1.96
0.81
0.25
17
15
16
16
272
289
255
272
240
225
240
256
15.36 0.36
0.00
0.41
15
16
20
17
255
225
240
300
272
256
320
340
17.18 2.56
3.17
0.03
16
14
15
15
240
256
224
240
210
196
210
225
15.16 0.16
0.06
0.03
= 87 = 72 = 83 = 77 = 1333
=
1531
=
1245
=
1437
=
1113
=
1042
=
1201
=
1286
=
77.02 =
5.20
=
4.40
=
0.75
Yc= a
y
xy=
xy=
xy=

+bx+cx+dx=
= n a + b x + c x
+ d x
a x + b x + c xx + d xx =
a x + b xx + c x + d xx =
a x + b xx + c xx+ d x =

77=5a +
87b+
72c+
83d=
1333=87a+1531b+1245c+1437d=
1113=72a+1245b+1042c+1201d=
1286=83a+1437b+1201c+1395d=
((77=5 a+87b+72c+83d @1333=87a+1531b+1245c+1437d)) (87@-5)
R //34=86b+39c+36d

xx

xy

((1333=87a+1531b+1245c+1437d @1113=72a+1245b+1042c+1201d)) (24@-29)


R //-285=639b-338c-341d
((1113=72a+1245b+1042c+1201d @1286=83a+1437b+1201c+1395d)) (83@-72)
R //-213=-129b+14c-757d
((34=86b+39c+36d @-285=639b+338c-341d)) (639@86)
R //-2784=4147c-6322d
((34=86b+39c+36d @-213=-129b+14c-757d)) (3@-2)
R //528=89c+1622d
((-2784=4147c-6322d @528=89c+1622d)) (89@4147)
R // 1941840=6163776d
d= 1941840/6163776 = 0.32
c= (528-1622(0.32))/89 = 0.10
b= (34-39(0.10)-36(0.32))/86 = 0.22
a= (77-87(0.22)-72(0.10)-83(0.32))/5 = 12.48
Yc =12.48-0.22x+0.10x+0.32x
Variacin total
St= (y - y) = 5.20
Variacin explicada
Se= (yc - y)= 4.40
Variacin no explicada
Sn= (y yc)= 0.75
Coeficiente de correlacin
r = (S/St) = = (4.40/5.20)= 0.92
Tipo de correlacin= 0.92= positiva muy fuerte

Curva normal
Posee simetra bilateral lo cual significa que al lado derecho del eje cen
tral se encuentra el 50% de los casos y al lado izquierdo el otro50%
Es asinttica lo cual significa que las cosas de la curva tienden a acerca
rse al eje horizontal pero jams llegan a unirse a l.
Posee 3 desviaciones estndar positivas y 3 desviaciones estndar negativas.
En el eje vertical coinciden todas las medidas de tendencia central.
A mas menos una desviacin estndar se encuentra el 68.34% de los casos
Para encontrar reas bajo a curva normal se aplican los siguientes reglas:
Si z es positivo y se pide lo que es superior a ella. Se busca z en la t
abla y ese valor se resta a 50%
Si z es positivo y se pide lo que es inferior a ella se busca z en la ta
bla y ese vlor se suma a 50%
Si z es negativo y se pide lo que es inferior a ella se busca z en la ta
bla y ese valor se resta a 50%
Si z es negativo y se pide lo que es superior a ella se busca z en la ta
bla y ese valor se suma a 50%
Si z se encuentra entre 2 valores de igual signo se buscan ambos puntaje
s en la tabla y se restan.
Si z se encuentra entre 2 valores de diferente signo se buscan ambos pun
tajes en la tabla y se suman
Si se quiere encontrar el nmero de casos que corresponden a una probabili
dad determinada. Se encuentra la probabilidad y se multiplica por el total de ca
sos, dividiendo este resultado entre 100.
Se hizo una investigacin con el propsito de determinar el % de TND (total de nutri
entes digeribles) en 740 muestras de arroz obtenindose un promedio de 81% con una
desviacin estndar de 6%. Si se selecciona una muestra de arroz al azar cual es la
probabilidad de que su % de TND sea:

Superior a 90
Z=(x-x )/S=(90-81)/6=1.50 = 43.32% -50%= 6.68%

Superior a 99
Z=(x-x )/S=(99-81)/6=3 = 49.87% -50%= 0.13%

Inferior a 95
Z=(x-x )/S=(95 -81)/6=2.33 = 49.01% +50%= 99.5%

Inferior a 99.5
Z=(x-x )/S=(99.5-81)/6=3.08 = 50% +50%= 100%

Superior a 70
Z=(x-x )/S=(70-81)/6=-1.833 = 46.64% +50%= 96.64%

Superior a 60
Z=(x-x )/S=(60-81)/6=-3.5 = 50% +50%= 100%

Inferior a 74
Z=(x-x )/S=(74-81)/6=-1.17 = 37.90% -50%= 12.10%

Inferior a 58
Z=(x-x )/S=(58-81)/6=-3.83 = 50% -50%= 0.00%

Entre 76 y 88
Z=(x-x )/S=(76-81)/6=-0.83 = 29.67%
Z=(x-x )/S=(88-81)/6=1.17 = 37.90%

Entre 83 y 94
Z=(x-x )/S=(83-81)/6=-0.33 = 12.93%

= 67.57%

Z=(x-x )/S=(88-81)/6=2.17 = -48.50%

= 35.57%

Entre 67 y 76
Z=(x-x )/S=(67-81)/6=-2.33 = 49.01%
Z=(x-x )/S=(76-81)/6=-0.83 = -29.67%

= 19.34%

Cuantas muestras de arroz tendrn un % de TND:


Superior a 87
Z=(x-x )/S=(87-81)/6=1.00 = 34.13% -50%= 15.87%
(15.87*740)/100= 117.44= 117 muestras
Inferior a 89
Z=(x-x )/S=(89-81)/6=1.33 = 40.82% +50%= 90.82%
(90.82*740)/100= 672.07= 672 muestras
Superior a 78
Z=(x-x )/S=(78-81)/6=0.50 = 19.15% +50%= 69.15%
(69.15*740)/100= 511.71 = 512 muestras
Inferior a 73
Z=(x-x )/S=(73-81)/6=-1.33 = 40.82% -50%= 9.18%
(9.18*740)/100= 67.932 = 68 muestras
Entre 86 y 92
Z=(x-x )/S=(86-81)/6=0.83 = 29.67%
Z=(x-x )/S=(92-81)/6=1.83 = -46.64%
= 16.97%
(16.97*740)/100= 125.7= 126 muestras
Entre 72 y 85
Z=(x-x )/S=(72-81)/6=-1.50 = 43.32%
Z=(x-x )/S=(85-81)/6=0.67 = 24.86%
= 68.18%
(68.18*740)/100=504.53 = 504 muestras
Entre 69 y 76
Z=(x-x )/S=(69-81)/6=-2.00 = 47.72%
Z=(x-x )/S=(76-81)/6=-0.83 = -29.67%
= 18.05%
(18.05*740)/100= 133.57= 134 muestras
Anlisis de muestra de igual tamao
A
B
(A-A)
20
18
5.24
18
15
18.40
23
17
0.50
19
16
10.82
24
19
2.92
25
15
7.34
27
18
22.18
156
178
267.40
Es una metodologa que
sentan el mismo nmero
e de Prueba de +

(B-B)
1.30
3.46
0.02
0.74
4.58
3.46
1.30
214.86
se utiliza cuando se tiene dos grupos o tratamiento que pre
de repeticiones la metodologa que se utiliza recibe el nombr

R=(((A-A)^2+(B-B)^2 (1+1))/(nA+nB-2)

na

nB)

Calcule X de cada tratamiento X= x


A=A = 156 = 22.29
N
7
B= B = 118 = 16.86
N
7
b) Calcule la s de cada tratamiento
SA=((A-A))/N=67.40/7 = 3.1
SB=((B-B))/N=14.86/7= 1.46
C) Encuentre el error de estndar de cada media
rx=
rB=

n-1

rA=

3.1
7.1

= 1.26

1.46 = 0.60
7-1

d) Encuentre el error estndar de la diferencia


rdif=((rA)^2 )+(rB)^2=((1-26)^2 )+(0.60)^2=1.40
e) encuentre el tc
tc= A-B= 22.29-16.86=3.88
rdir
1.40
f) encuentre el tt = 2.447
g) conclusin: existe diferencia estadstica entre los grupos pues tc >tt

Anlisis de muestra de diferente tamao.


Es una distribucin que se utiliza cuando existen dos tratamientos en grupo que pr
esentan diferentes nmeros de repeticiones.
En el procedimiento estadstico se utiliza la prueba de t.
A
B
(A-A) (B-B)
4
18
38.69 61.78
6
17.81
8
22
4.39
14.90
9
25
1.49
0.74
21
0.61
22
28
3.17
4.58
23
28
7.73
4.58
25
30
22.85 17.14
24
30
14.29 17.14
=182 181
111.57 120.86

Encuentre x de cada grupo x=x


A= A = 182 = 20.22
na
9
B= B = 181 = 25.86
nA
7
b=Encuentre la varianza de cada grupo
S=(X-x) = SA=(A-A)= 11.57 = 12.40
N
N
9
SB = 120.86 = 17.26
7
c) Encuentre el error estndar de la diferencia
rdif(nAS^2 A)+nBSB] 1 + 1 ]
nA+nB-2
nA nB
rdif (9(12.40) )+7(17.26)] 1 + 1] =232.42 + 16
9+7-2
9
63

= 2.05
7

14

e) tc = A-B = 20.22-25.86= -2.75


rdif
2.05
f) buscar tt 2.145
g) conclusin: existe diferencia estadstica entre los grupos pues tc>tt
Anlisis de una misma muestra 2 veces
Esta distribucin de tratamiento se utiliza cuando se analiza un grupo previo a un
tratamiento y despus del mismo.
Ejemplo:
Se hizo una evaluacin sobre la capacidad de llenado por hora de una envasadora, p
ero dndose cuenta el gerente de operaciones de la irregularidad de envasado proce
di a reparar la maquina y evalu los resultados desoyes de la reparacin; los result
ados obtenidos fueron los siguientes
A
D
d
Antes de la reparacin Despus de la reparacin
38
60
484
42
56
169
43
68
625
32
79
2209
35
60
625
46
42
16
42
56
196
278
421
4351
Encontrar x antes y despus:
x= (x)/n=
A= (A)/n = 278/7= 39.71
D= (D)/n = 421/7= 60.14
Encuentre la desviacin estndar
S=((d^(2-))/n)(A -D ) = S=(4351/7)(39.71-60.14) = S= 14.29
Encuentre el error estndar de la diferencia
dif=S/(n-1) = 14.29/(7-1) = 5.83
Encuentre (tc)
Tc= (A - D )/dif = (39.71-60.14)/5.83= -3.50
Busca (tt)= 2.447
Conclusin: existe diferencia estadstica significativa por tc>tt. Por lo

tanto la reparacin de la maquinaria incidi en la capacidad de envasado.


Distribucin completamente al azar:
Esta distribucin se utiliza cuando se tiene ms de dos tratamientos y las condicio
nes experimentales son homogneas. El mnimo nmero de grados de libertad del error de
be ser 16. En el procedimiento matemtico estadstico se utiliza el anlisis de varian
za (ANDVA). A travs de la prueba de Fischer. El formulario a utilizar para una di
stribucin completamente al azar es el siguiente:
Causas de variacin
Sumatoria de cuadrado Grados de libertad
Cuadrado
medio Factor calculado
Factor tabulado
Tratamiento
((trat))/(No.rep) -Fc
No. Trat. 1 (Sc trat.)/(Gl trat.)
(CM trat.)/(CM error.)
Buscar en tabla
Error Sc total
Sc trat.
Gl total
Gl trat.
(Sc error)/(Gl error)
total

(dato)-Fc

Ejemplo:
Repeticin
I
12
144 26
676
18
324
20
400
24
576
II
15
225 20
400
16
256
16
256
25
625
III
17
289
24
576
15
225
17
289
24
576
IV
18
324
23
529
14
196
20
40
20
400
V
16
256
25
625
17
289
19
361
25
625
VI
19
361
26
676
19
361
20
400
26
676

97

9409

N - 1

144
20736

99
9801

122
12544

144
20736

596
73226

FC= Factor de Correlacin= ((total))/n=((596))/30 = 11840.53


Sc trat.=73226/6-1140.53=363.80
Sc total= 12316 11840.53 = 475.47
Causas de variacin
Sumatoria de cuadrado Grados de libertad
medio Factor calculado
Factor tabulado
Tratamiento
363.80 4
90.95
20.35 2.76
Error
11.67 25
4.47
Total
475.47 29

Cuadrado

Conclusin: existe diferencia estadstica ente tratamientos pues fc>ft.

Distribucin en bloques al azar


Esta distribucin se utiliza cuando se tiene ms de dos tratamientos y las condicion
es experimentales son heterogneas. El mnimo nmero de grados de libertad para el err
or es 12 y las formulas que se utilizan son las siguientes:
Causas de variacin
Sumatoria de cuadrado Grados de libertad
Cuadrado
medio Factor calculado
Factor tabulado
No. Trat. 1 (Sc trat.)/(Gl trat.)
Tratamiento
((trat))/(No.bloques) -Fc
(CM trat.)/(CM error)
Buscar en tabla
Bloque
((bloques))/(No.trat.) -Fc
No. Bloq-1
(Sc bloq.)/(Gl bloq.)
(CM bloq.)/(CM error)
Buscar en tabla
Error Sc totalSc trat.-Sc bloq.
Gl trat.*
Gl boque.
(Sc error)/(Gl error)
total

(dato)-Fc

N - 1

trat
A
196
225
256
324
B
529
484
625
400
C

I
14
15
16
18
63
23
22
25
20
90
19

III

II

3969

8100

IV

361
23
529
28
784
22
484
92
8464
D
20
400
16
256
18
324
22
484
76
5776
E
25
625
24
576
22
484
20
400
91
8281

101
100
109
102
412
34590

10201 10000 11881 10404 42486 4286


FC= Factor de Correlacin= ((total))/n=((412))/20 = 8487.20
Sc trat.=34590/4-8487.20=160.30
Sc bloq.=42486/5-8487.20=10
Sc total= 8746 8487.20= 258.8
Causas de variacin
Sumatoria de cuadrado Grados de libertad
medio Factor calculado
Factor tabulado
Tratamiento
160.30 4
40.075 5.43
3.26
Bloque
10
3
3.33
0.45
3.49
Error 88.5
12
7.38
total 258.8 19
Conclusin:
Existe diferencia significativa entre tratamientos porque fc>ft.
No existe diferencia significativa entre bloques para fcft.
No existe diferencia estadstica entre bloques para fcft.

BIBLIOGRAFIA
Notas del cuaderno 3er semestre del curso de Estadstica
www.goglee.com

Cuadrado

www.wikipedia.com

También podría gustarte