Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Quejas x Central
16
12
8
4
0
15
Mes
22
29
12
2 =
2 3( + 1)
( + 1)
=1
22/11/2013
UNI Norte
ndice
Introduccin ............................................................................................................. 1
Captulo 1. Estadstica Descriptiva .......................................................................... 2
1.1 Introduccin. .......................................................................................................... 2
1.2 Anlisis de datos, Tablas de Distribucin de frecuencias y Tablas de
Contingencia ................................................................................................................ 5
1.3 Grficos ............................................................................................................... 14
1.4 Medidas de Tendencia Central ........................................................................... 19
1.4.1 Media Aritmtica............................................................................................ 20
1.4.2 La Mediana.................................................................................................... 21
1.4.3 La Moda ........................................................................................................ 22
1.4.4 Otras medidas de tendencia central .............................................................. 24
1.4.4.1 La Media Geomtrica ................................................................................. 24
1.4.4.2 La Media Cuadrtica .................................................................................. 25
1.4.4.3 Cuartiles, Deciles y Percentiles .................................................................. 25
1.5 Medidas de Dispersin o de Variabilidad ............................................................ 26
1.5.1 El Rango ....................................................................................................... 26
1.5.2 El Desvo Estndar........................................................................................ 27
1.5.3 La Varianza ................................................................................................... 29
1.5.4 El Coeficiente de variacin ............................................................................ 29
1.6 Otras medidas tiles en Estadstica Descriptiva ................................................. 30
1.6.1 La Asimetra o Sesgo .................................................................................... 30
1.6.2 La Curtosis .................................................................................................... 31
1.7 Muestras y Poblacin........................................................................................... 33
1.7.1 Muestreo Aleatorio Simple ............................................................................ 33
1.7.2 Muestreo Estratificado ................................................................................... 36
1.7.3 Muestreo por Conglomerados ....................................................................... 36
1.7.4 Muestreo Sistemtico .................................................................................... 37
Captulo 2. Teora Elemental de Probabilidades ................................................... 39
2.1 Introduccin a las Probabilidades ........................................................................ 39
2.2 Trminos Bsicos. ............................................................................................... 39
2.3 Propiedades de la Probabilidad ........................................................................... 41
2.3.1 Regla de la Suma. ......................................................................................... 42
2.3.2 Regla del producto. ....................................................................................... 43
2.4 Probabilidad condicionada ................................................................................... 43
2.5 Teorema de Bayes............................................................................................... 46
2.5.1 Regla de la probabilidad total ........................................................................ 46
2.5.2 Planteo del Teorema de Bayes ..................................................................... 47
2.6 Tcnicas de conteo: Combinaciones y Permutaciones ....................................... 51
Estadstica Bsica para Ingenieros
ii
UNI Norte
iii
UNI Norte
iv
Introduccin
Este texto bsico de estadstica est diseando y organizado en funcin del contenido
de la mayora de los temas que se aborda en las asignaturas de Estadstica I y
Estadstica II que se imparte en las carreras de Ingeniera en Sistemas, Civil, Industrial
y Agroindustrial de la Universidad Nacional de Ingeniera, UNI, Nicaragua. Sin embargo
por su forma sencilla y asequible con que se trat de abordar los diferentes temas,
este texto puede ser til como libro de texto en otras carreras universitarias.
Por ltimo, para realizar los ejercicios de este texto y construir grficos digitales se
sugiere utilizar el programa estadstico INFOSTAT, el cual dispone de una versin de
uso libre que se puede descargar gratuitamente desde la pgina www.infostat.com.ar .
UNI Norte
Objetivos
Reflexionar sobre el uso de la estadstica a travs de situaciones de la vida
profesional.
Introducir a la recoleccin de datos a partir de un problema del entorno de un
ingeniero y desde la experiencia del estudiante.
Construir medidas de tendencia central, de variabilidad y diferentes tipos de
Grficos ms comunes que permite una tabla de distribucin de frecuencia, TDF.
Diferenciar las diferentes formas de muestreos para estudiar el contexto
socioeconmico.
Calcular de forma representativa el tamao de una muestra con variables
construidas con ejemplos de su carrera.
1.1 Introduccin.
La estadstica, es una ciencia relativamente nueva pero con miles de aos de uso
emprico, Mara y Jos parten de Nazaret a Beln para ser censados por los romanos.
Hace 2000 aos ste imperio llevaba un control estadstico de lo que posean sus
colonias para cobrarles impuestos En la actualidad los procedimientos estadsticos son
de particular importancia en las diferentes ciencias, para reducir y abstraer datos. Una
definicin que describe la estadstica de manera utilitaria es la que dice que es: un
conjunto de tcnicas para describir grupos de datos y para tomar decisiones en
ausencia de una informacin completa. La estadstica a diferencia de la matemtica no
genera resultados exactos, los resultados siempre tienen asociada un grado de
incertidumbre o error. La estadstica trata de lograr una aproximacin de la realidad, la
cual es siempre mucho ms compleja y rica que el modelo que podemos abstraer. Si
bien esta ciencia es ideal para describir procesos cuantitativos, tiene serios problemas
para explicar por qu cualitativo de las cosas.
UNI Norte
En general podemos hablar de dos tipos de estadsticas, las descriptivas que nos
permiten resumir las caractersticas de grandes grupos de individuos y las
inferenciales que nos permite dar respuestas a preguntas (hiptesis) sobre poblaciones
grandes a partir de datos de grupos pequeos o muestras.
crear un
modelo numrico terico donde se estudian variables para describirlas y analizar sus
relaciones. Para hacer esto primero es necesario definir algunos trminos tericos.
Variable: es una caracterstica observable y que vara, una caracterstica constante en
el grupo de estudio, no es una variable. Por ejemplo en el conjunto de estudiantes de la
Universidad, ser estudiante de una determinada carrera es una variable, pero ser
Bachiller es una constante. Las variables se pueden clasificar de diferentes maneras,
un enfoque es reconocer dos grandes grupos de variables las Cualitativas y
Cuantitativas.
Tipos de
Variables
Cualitativas
Nominales
Ordinales
Cuantitativas
Continuas
Discretas
UNI Norte
Las variables Continuas o Reales pueden adquirir cualquier valor dentro de un intervalo
especificado de valores, permite siempre que se encuentre un valor nuevo entre dos
valores previos, aceptan valores con fracciones de enteros. El rendimiento de un lote
de frjol se mide en qq/mz es una variable continua. Generalmente estas variables se
obtienen de medir o pesar.
ordenamiento de datos en fila y columnas donde cada fila es un individuo, una parcela,
una muestra, una unidad experimental o una encuesta determinada y cada columna:
Estadstica Bsica para Ingenieros
UNI Norte
una variable. Los programas Access, Excel, Infostat y SPSS ordenan los datos en
forma de matriz numrica. Por ejemplo en una encuesta (cuestionario) cada pregunta
que se tiene, genera al menos, una variable generalmente discreta. Hay casos donde
una pregunta puede generar muchas variables de tipo dicotmico, SI- NO.
Ejercicio 1.1: Construya variables relacionadas con su carrera, 5 nominales, 5
ordinales, 5 continuas y 5 ordinales.
Ejercicio 1.2 Clasifique las siguientes variables.
Peso de un estudiante.
Color de ojos.
Temperatura semanal.
Tipo de techo.
Dimetro de un tornillo
UNI Norte
Creacin de la
matriz de datos
Definicin de
anlisis a
realizar
Ejecucin de
anlisis en
computadora
Interpretacin
de resultados
Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando informacin atpica o anormal y corregir los casos que la informacin extraa
se deba a una mala digitacin o error en la recoleccin de datos.
Lo siguiente para observar el comportamiento de los datos es realizar una distribucin
frecuencias en forma de tabla y grficos. Para esto, los datos se agrupan en clases o
categoras y para grupo se calcula las frecuencias absolutas y relativas.
UNI Norte
Las Escalas Ordinales, son discontinuas y se usan donde hay un orden jerrquico
de un conjunto de objetos o eventos con respecto a algn atributo especfico, por
ejemplo ordenar los ingresos en tres niveles: alto =1, medio = 2 y bajo = 3.
Las Escala de Razn Constante, tienen todas las propiedades de las Escalas de
intervalos ms un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor 0 representa ausencia del valor.
Un caso especial de escala ordinal es la escala de Likert, esta escala es muy usada en
las ciencias sociales y se usa para medir actitudes, Una actitud es una predisposicin
aprendida para responder consistentemente de una manera favorable o desfavorable.
As las personas tenemos actitudes hacia muy diversos objetos o smbolos, por
ejemplo: actitudes hacia la poltica econmica, un profesor, la ley, nosotros, etc. Las
actitudes estn relacionadas con el comportamiento que mantenemos. Estas
mediciones de actitudes deben interpretarse como sntomas y no como hechos. Esta
escala es bipolar porque
UNI Norte
Ejercicio 1.3: entre los participantes del grupo de clases tomar datos de 15 variables
al menos por ejemplo: Edad, Sexo, Procedencia, etc. Y luego ordnelos en forma de
matriz de datos, recodifique la informacin cualitativa en numrica.
Organizacin de una matriz de informacin a partir de un cuestionario de una
encuesta.
Una encuesta impersonal
Si las opciones que genera una variable discreta permite hacer combinaciones de las
respuestas se sugiere crear muchas variables dicotmicas del tipo Si o No. Veamos
un ejemplo: Si se pregunta: que prcticas de en los cultivos realiza un campesino,
estas pueden ser varias y combinadas como: Insecticidas Botnicos, Trampas
amarillas, Barreras vivas, Semilla resistente etc. En este caso lo que se hace es
Estadstica Bsica para Ingenieros
UNI Norte
generar un variable del tipo Si, No para cada opcin de prctica de cultivo, generando
muchas variables en una sola pregunta.
Para crear una base de datos hay que recordar que se est obteniendo una matriz de
datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto
de las filas los datos para cada
Encuesta
Sexo
Edad
Ingresos
Comunidad
semanales C$
Labor
realizada
31
1,394
35
1,311
43
1,300
28
1,304
45
1,310
36
1,443
21
1,536
32
1,823
Esta matriz se puede codificar as: la variable Sexo: varn, mujer. Para la variable
comunidad hay 4 tipos diferentes donde: 1= Estel, 2= Condega, 3= Pueblo Nuevo y
4= Limay y para Labor realizado: 1= en otra finca, 2= en la cuidad y 3= en la propia
finca.
Ejercicio 1.4: Intente codificar numricamente las respuestas que se generan a partir
de la
discuta las posibles respuestas, diga si las preguntas estn bien formuladas, sugiera si
alguna de ellas est de ms y que preguntas propone para completar la informacin.
Hoja de Encuesta
UNI Norte
Nmero de ficha___________
Fecha: ______________________________________________________
Primer Apellido_______________ Segundo Apellido___________________________
Nombres:________________________ Ao____________
Direccin: _____________________________________________________
Estado Civil: _____ Nmero de personas que habitan la vivienda________________
Nivel de estudio de ellos ______________Edad de cada una de ellos________
Profesin: _____________________________________________________
Ejercicio 1.5:
Defina variables para caracterizar a los estudiantes del curso con el objetivo de
determinar posibles causas que tengan influencia en el rendimiento acadmico
del grupo.
Peso
140
110
150
117
150
150
140
112
160
120
135
110
110
160
114
128
120
130
140
174
Origen
No
Estel
Estel
Estel
No
Estel
No
Estel
Estel
No
Estel
Estel
Estel
No
No
No
Estel
No
No
No
Ingresos
Alto
Media
Media
Media
Alto
Media
Media
Alto
Alto
Alto
Alto
Media
Media
Media
Alto
Alto
Alto
Alto
Media
Media
Becas opinin
No
3
Si
3
Si
2
No
4
No
5
No
5
Si
5
Si
1
No
4
No
4
No
2
No
3
Si
3
Si
3
No
2
No
5
No
5
Si
4
Si
2
Si
4
10
UNI Norte
Nmero de clases
30-50
5-7
51-100
6-10
101-250
7-12
+250
10-20
El valor central de una clase se llama marca de clase, este valor se usa para construir
los grficos de polgonos de frecuencia. Veamos un ejemplo de cmo se construye una
Estadstica Bsica para Ingenieros
11
UNI Norte
1,443
1,536
1,394
1,623
1,650
1,480
1,355
1,350
1,430
1,520
1,550
1,425
1,360
1,430
1,450
1,680
1,540
1,304
1,260
1,328
1,304
1,360
1,600
Secuencia de actividades
Se calcula el Rango de los datos, valor mayor menos valor menor: 1680- 1,260 =
420 C$.
Ancho de clase: El rango se divide en cuatro, 420/4= 105 C$, se ajusta a 100 C$ y
de esta manera el nmero de clases queda en cinco.
Se construye los lmites inferiores y superiores de cada clase como intervalos
semiabiertos,
Luego se cuentan las frecuencias por clase, esto es la Frecuencia Absoluta
Se calcula la Frecuencia Relativa (Frecuencia Absoluta / n)
Se hace Frecuencia Acumulada. que es la suma de las frecuencias absolutas.
Tambin se pueden hacer las frecuencias expresadas en porcentajes.
Tabla de Distribucin de frecuencias, TDF.
Clase
Lmite Inferior
Lim. Superior
Marca de
Frecuencia
Frecuencia
Frecuencia
Igual a
Menor a
clase
Absoluta
Relativa
Acumulada
1,200
<1,300
1,250
0.04
1,300
<1,400
1,350
0.33
1,400
<1,500
1,450
0.29
16
1,500
<1,600
1,550
0.17
20
1,600
<1,700
1,650
0.17
24
Total
24
1.00
12
UNI Norte
Texto..
frecuencia relativa
0.28
0.21
0.14
0.07
0.00
1100
1200
1300
1400
1500
1600
1700
1800
C$
Se puede observar que la informacin que lleva el grfico es completa, incluye todos
los datos y permite explicar el contenido del mismo por ejemplo: la barra de mayor
altura contiene la moda y al no ser un grfico simtrico concluyo que la media y
mediana son diferentes y que los datos son sesgados hay un agrupamiento de
frecuencias a la izquierda del centro.
Tablas de contingencia
Las tablas de contingencia, o tablas cruzadas, se usan para resumir la relacin de
variables cualitativas con pocas categoras, incluso dicotmicas. Estas tablas
generalmente vinculan dos variables y en las celdas generadas se muestran las
Estadstica Bsica para Ingenieros
13
UNI Norte
una de
Frecuencias absolutas
En columnas: Beca
En columnas: Beca
Sexo No
Si
Total
Sexo No
Si
Total
Mujer 10
17
Mujer 0.59
0.41
1.00
Varn 7
14
Varn 0.50
0.50
1.00
Total 17
14
31
Total 0.55
0.45
1.00
Ejercicio 1.6 Realizar una tabla de frecuencias con una variable discreta (contable) y
una variable continua (medible) de la matriz generada con los datos obtenidos en clase.
Con dos variables cualitativas construye una tabla de contingencia.
1.3 Grficos
Los grficos nos permiten presentar la informacin que dan los datos de manera
rpida, resumida y fcil de entender. Los grficos se pueden clasificar de mltiples
maneras pero en ste texto los consideraremos como: univariados, bivariados y
multivariados, segn el nmero de variables involucradas.
14
UNI Norte
Frecuencia de personas
30
20
10
0
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Edad
598 personas de origen rural. Este Grfico creado con frecuencias y porcentajes,
permite resaltar segmentos de clases determinadas.
15
UNI Norte
otros
19%
primaria
45%
ninguno
15%
secundaria
21%
observado a
16
UNI Norte
75.5
75.2
75.0
74.5
74.0
73.5
Nota Promedio
73.5
73.0
73.0
72.5
72.5
72.0
Matematica
Contabilidad
Programacin
Algebra
Asignatura
17
UNI Norte
30
20
10
0
13
20
27
34
41
48
55
62
69
76
120
100
98
eficiente la informacin de
80
hasta 6 o 7 variables. Es
ideal
para
usar
con
60
variables dicotmica, SI y
40
NO.
43
30
20
19
0
Escuela Cercana
Agua Potable
Electricidad
Asistencia Mdica
Telfono
Grfico De Barras,
18
UNI Norte
Bivariado en Agrupamientos
Un
Grfico
permite
ver
rpidamente lo que dicen los datos
Ejercicio 1.7. Realizar un grfico de barras y un grfico de Pastel a partir de los datos
recolectados en clase.
19
UNI Norte
(1 )
=
20
UNI Norte
Media Aritmtica
Muestra
Poblacin
Variable Nota = xi
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
10
1
xi =
Valor de xi
62
68
92
88
55
79
89
92
67
69
761.
1.4.2 La Mediana
La segunda medida de tendencia central en importancia es la mediana. La mediana
Me de un conjunto de mediciones x1, x2, x3,...., xn es el valor de x que se encuentra
en el punto medio o centro cuando se ordenan los valores de menor a mayor, ranking.
Esta medida no sufre la influencia de valores extremos atpicos.
21
UNI Norte
Datos ordenados
1
2
3
4
5
6
7
8
9
10
Valor de xi
55
62
67
68
69
79
88
89
92
92
1.4.3 La Moda
La moda, Mo, es la medida de tendencia central ms fcil de calcular y tambin es la
ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin. Por
esta razn la moda se suele usar para una evaluacin rpida de la tendencia central.
La moda se define como el valor ms frecuente de una distribucin. En una tabla de
Estadstica Bsica para Ingenieros
22
UNI Norte
La mediana suele ser la medida preferida cuando se emplea una escala ordinal, estas
son las situaciones donde el valor asignado a cada caso no tiene otro significado ms
que el indicar el orden entre los casos. Por ejemplo saber en una clase cuales alumnos
estn dentro del 50% con mejores notas y cuales dentro del 50% con peores notas.
Tambin se suele preferir la mediana cuando unos pocos valores extremos
distorsionan el valor de la media. Por ejemplo si tengo 9 personas con 0 ingresos y uno
sola que tiene ingresos de 10 unidades, la media dar a entender que la mayora recibe
1 unidad, cuando esto no es real.
23
UNI Norte
Aunque no necesariamente una escala de medida nos debe decir qu tipo de medida
de tendencia central debemos usar, pero si nos ayuda a determinar cul es la ms
apropiada.
Un aspecto interesante entre las tres medidas es su comportamiento referente a la
simetra que toma una distribucin. Cuando las distribuciones son simtricas, sin
sesgo, caso de la distribucin Normal que tiene forma de campana, la media, la
mediana y la moda coinciden. Si la distribucin es asimtrica con sesgo positivo, hay
ms datos hacia la izquierda de la media, entonces la media es mayor que la mediana
y esta mayor que la moda. Si ocurre lo contrario, el sesgo es negativo, entonces la
media es menor que la mediana y sta menor que la moda.
x g 4 (4)(5)(4)(6) 4.68
Su valor siempre es menor o igual a la media aritmtica. Una ventaja de su uso es que
considera todos los valores de la distribucin y es menos sensible que la media
aritmtica a los valores extremos, sin embargo es de clculo complicado y si un valor
vale 0 se anula.
24
UNI Norte
xc
xc
42 52 42 62
4.81
4
Se utiliza cuando se quiere evitar los efectos de los signos negativos. sta media solo
puede tomar valores positivos. Luego veremos que el desvo estndar es un tipo de
media cuadrtica.
anmalos de la distribucin.
Diagrama de caja, variable: cantidad de carne consumida por ao.
25
UNI Norte
18.7
Kg
14.9
11.2
Mediana
7.5
3.7
1.5.1 El Rango
El Rango, Recorrido o Amplitud de un conjunto de mediciones, es la diferencia entre el
valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades, en la
escala de medicin, para incluir los valores mnimo y mximo. Es la medida de
Estadstica Bsica para Ingenieros
26
UNI Norte
Cuando se trabaja con muestras el desvo estndar se simboliza con una S y con la
letra sigma minscula cuando se usan datos de una poblacin. Su frmula de
clculo tradicional es:
= ( (
1
)2 ) /
= ( ( )2 ) /( 1)
1
27
UNI Norte
(1 )2
2
1
=(
)
((55 76.1) 2 (62 76.1) 2 (67 76.1) 2 (68 76.1) 2 (69 76.1) 2 (79 76.1) 2
(88 76.1) 2 (89 76.1) 2 (92 76.1) 2 (92 76.1) 2 ) / 9
= 13.6
Estadstica Bsica para Ingenieros
28
UNI Norte
1.5.3 La Varianza
La varianza es el desvo estndar elevado al cuadrado y se simboliza con S 2 cuando
es de una muestra, o 2 cuando es poblacional. Este es una medida que se usa en
muchas pruebas de Hiptesis estadsticas, por ejemplo el Anlisis de Varianza,
ANDEVA que se basa en la descomposicin y relacin de las varianzas de las causas
de variacin de los datos. Pero para fines descriptivos se prefiere usar el desvo
estndar en vez de la varianza, que suele ser un valor mayor y difcil de interpretar.
29
UNI Norte
)
(
)
(
30
UNI Norte
frecuencia relativa
0.34
Asimetria 0.93
0.25
0.17
0.08
0.00
15
22
28
34
41
47
54
60
Cereal
Para datos que siguen una distribucin normal (ver Captulo 3) el sesgo estandarizado
debe caer dentro de un intervalo (-2,+2).
1.6.2 La Curtosis
La curtosis es una medida que indica o mide lo plano o puntiaguda que es una curva de
distribucin. Cuando esta es cero, curtosis = 0, significa que se trata de una curva
Normal. Si es positiva, quiere decir que la curva o distribucin o polgono es ms
puntiaguda o levantada que la curva normal (curva leptocrtica). Si es negativa quiere
decir que es ms plana (curva mesocrtica).
)
=(
Curtosis =
31
UNI Norte
Definicin:
Las medidas calculadas a partir de la poblacin, Ej. y se llaman
PARMETROS
Las medidas calculadas a partir de las muestras, Ej. x S se llaman
ESTADSTICOS
Ejercicio 1.8:
Tomando como fuente de datos las variables continuas recolectadas a partir de los
datos que generen los estudiantes en clase deben construir:
distribucin de frecuencias.
Ejercicio 1.9:
Se tiene los datos de 30 aos de precipitaciones de San Ramn, Matagalpa. Calcule
los datos promedios y el coeficiente de variacin
de los 30 aos
y de forma
quinquenal (cada 5 aos). Haga una tabla de los valores mximos y mnimos
quinquenales. Comente si observa alguna tendencia de variacin de lluvias.
Datos de precipitaciones, San Ramn Matagalpa
Ao
Mm
1970
1793
1971
1610
1972
1126
1973
1647
1974
1344
1975
1820
Estadstica Bsica para Ingenieros
Ao
Mm
1980
2373
1981
1854
1982
1470
1983
1185
1984
1522
1985
1154
Ao
mm
1990
1583
1991
1302
1992
1651
1993
2250
1994
1361
1995
2072
Luis Mara Dicovskiy Riobo
32
UNI Norte
1976
1977
1978
1979
974
1248
1530
1164
1986
1987
1988
1989
1383
1335
2266
1038
1996
1997
1998
1999
1869
1499
2980
2175
33
UNI Norte
El muestreo aleatorio simple debe utilizarse cuando los elementos de la poblacin son
homogneo respecto a las caractersticas a estudiar, es decir a priori no conocemos
que elementos de la poblacin tendrn valores altos de ella. El primer problema al
aplicar esta forma de muestreo, es calcular el n, nmero de de elementos de la
muestra.
Clculo de n por ecuacin predeterminada: Cuando la fraccin n / N a priori se
determina que ser
aproximada es el siguiente:
= (1)+
Dnde:
Si bien este modelo es bastante terico es un mtodo muy usado para aproximar un
valor de n entrevistados, cuando se realiza investigacin social o para determinar el
tamao de muestra de un lote de piezas donde lo que se evala es si stas estn
defectuosas o no, muestreo por atributos.
Clculo de n Grficamente: Se sabe que a ms grande la muestra mejor sta
estima la media de la poblacin, sin embargo hay un momento que la media que se
calcula a partir de la muestra casi no cambia, aunque sta aumente de tamao, en ese
momento el tamao de la muestra comienza a ser ptimo.
34
UNI Norte
68
82
88
65
79
89
92
67
69
75
79
71
78
75
x1
x2
x3
x4
x5
x6
x7
x8
x9
x 10
x 11
x 12
x 13
x 14
x 15
72
70
74
77
75
76
78
79
78
77
77
77
77
77
77
% de piezas de la muestra
35
UNI Norte
60-300
10
301-1000
1001-5000
+ 5000
a lo interno y
36
UNI Norte
37
UNI Norte
Si el orden de los elementos es tal que los ms prximos tienden a ser ms semejantes
que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio
simple al cubrir ms homogneamente toda la poblacin.
El muestreo sistemtico puede aplicarse como una variante del muestreo aleatorio o
utilizarse conjuntamente con el muestro estratificado para seleccionar la muestra dentro
de cada estrato.
38
UNI Norte
probabilidad condicional en
modelos aplicados.
Construir ejemplos del uso del teorema de Bayes al describir situaciones del
entorno profesional.
los
mismos.
Esta
ciencia
comenz
Sin
aleatorio:
39
UNI Norte
Es la definicin ms antigua y se atribuye al matemtico francs Pierre Laplace (17491827); tambin se conoce con el nombre de probabilidad a priori, pues para calcularla,
es necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y
el nmero de resultados o sucesos elementales que entran a formar parte del suceso.
40
UNI Norte
probabilidad de que una pieza sea defectuoso, no podemos utilizar la definicin clsica
pues necesitaramos conocer previamente el resultado del proceso de fabricacin.
Para resolver estos casos, se hace una extensin de la definicin de probabilidad, de
manera que se pueda aplicar con menos restricciones, llegando as a la definicin
frecuencial de probabilidad
Probabilidades, definicin frecuencial:
()
() = lim
Tiene dos reglas bsicas que la estructuran: la regla de la suma y la regla del
producto.
41
UNI Norte
( ) = () + ( ) ( ).
Siendo: = A unin B y la interseccin AB
Un caso especial ms sencillo sucede si dos eventos A y B son incompatibles, esto
quiere decir que los eventos A y B no pueden ocurrir al mismo tiempo ( ) =
0. (Un ejemplo de eventos incompatibles es cuando se tira una vez un dado y que
ocurran al mismo tiempo el nmero 1 y el nmero 6.)
En casos de eventos incompatibles la probabilidad que ocurra A o B es P(A o B) =
( ) = () + ( )
Ejemplo, si se arroja dos veces una moneda al aire, la probabilidad que salga una vez
escudo y el otro nmero sin importar el orden, es la probabilidad de los eventos
escudo, nmero y nmero, escudo. Debido a que son cuatro los eventos posibles
= 0.25,
de
42
UNI Norte
Ejercicio 2.2. Se hace un juego donde se tira un dado una vez, y se gana si sale el
nmero 1,2 3. Si sale un nmero diferente se pierde. Qu es ms probable perder o
ganar?
Una paradoja es que una persona que compra todas las semanas la lotera, para un
sorteo dado, tiene la misma probabilidad de sacar el premio mayor que una persona
que compr un nmero por primera vez.
Ejercicio 2.3: Estime la probabilidad que al elegir por sorteo dos estudiantes del grupo
de clase, ambos sean varones. Considere que la misma persona elegida en el primer
sorteo puede ser elegida en el segundo. Determinar tambin cuales eventos forman el
es este caso.
43
UNI Norte
(\) =
()
()
Si p (B) 0
Varones
Mujeres
Total
No consume
30
10
40
1-5 veces
50
25
75
Ms de 5 veces
20
15
35
100
50
150
Total
se selecciona al azar un
estudiante varn Cul es la probabilidad que ese que ese joven haya consumido ms
Estadstica Bsica para Ingenieros
44
UNI Norte
(+5 )
( )
Ejercicio 2.4 Si se tiene una escuela de 200 alumnos distribuidos en tres aulas: A, B y
C. Por sexo: mujer, y varn; como sigue:
Aula/ Sexo
Varn
Mujer
20
20
30
30
56
44
Total
106
94
Cul es la probabilidad que un estudiante, sin importar el sexo, sea del aula B?
Cul es la probabilidad que un estudiante que pasa por el corredor sea del aula A, si
el estudiante es mujer?
Ejercicio 2.5 En un aula hay 6 estudiantes realizando un examen, dos son mujeres y
cuatro son varones. Cul es la probabilidad que finalice una mujer de segunda dado
que el primero en finalizar fue un hombre?
Si la solucin es:
(\ ) =
( ) 8/30 2
=
=
()
4/6
5
45
UNI Norte
A1 A2 ... An = y Ai Aj = i j
A1
A2
An
Y si el conjunto de sucesos Ai que forman una particin del espacio muestral y sucede
que P(Ai) 0 Ai. Entonces si ocurre un suceso B dentro del mismo espacio muestral
y se cumple que:
() = ( ) + ( )+. . +( )
A1
A2
An
46
UNI Norte
() = (\ )( ) + (\ )( )+. . +(\ )( ) = (\ )( )
=
( \) =
P(B\Ai )P(Ai )
ni=1 P(B\Ai )P(Ai )
47
UNI Norte
Varn
0.27
0.50
0.23
Mujer
0.25
No Consume
0.33
1-5 Gaseosas
0.43
+5 Gaseosas
Resolviendo por Bayes, la probabilidad que una mujer no consuma gaseosas es:
(\) =
P(M\NoC)P(NoC)
P(M\NoC)P(NoC) + P(M\1 5)P(1 5) + P(M\ +5)P(+5)
(\ ) =
0.27 (0.25)
= 0.20
0.27 (0.25) + 0.50 (0.33) + 0.23 (0.43)
48
UNI Norte
Prob.
Mquina
Prob.
Tipo de
produccin
0.45
0.30
0.25
0.03
0.97
0.04
0.96
0.05
0.095
(\ ) =
( )(\)
() (\) + ( )(\ ) + ( )(\)
0.3(0.04)
12
=
= 0.316
0.45(0.03) + 0.3(0.04) + 0.25(0.05) 38
c. Calculamos P(A\D) y P(C\D), comparndolas con el valor de P(B\D) ya
calculado. Aplicando el teorema de Bayes, obtenemos:
49
UNI Norte
(\) =
0.45(0.03)
135
=
= 0.355
0.45(0.03) + 0.3(0.04) + 0.25(0.05) 380
( \) =
0.25(0.05)
125
=
= 0.329
0.45(0.03) + 0.3(0.04) + 0.25(0.05) 380
50
UNI Norte
!
! ( )!
4!
2!(42)!
=6
Luis Mara Dicovskiy Riobo
51
UNI Norte
10!
10.9. 8. 7. 6.5.4.3.2.1
=
= 210
4! (10 4)! (4.3.2.1)(6.5.4.3.2.1)
17,1 20,1
37,2
17 (20)
666
= 0.51
Permutaciones:
La expresin "Pm,n" representa las variaciones de "m" elementos, formando subgrupos
de "n" elementos. En este caso, un subgrupo se diferenciar del resto, bien por los
elementos que lo forman, o bien por el orden de dichos elementos. Para calcular el
nmero de permutaciones se aplica la siguiente frmula:
!
( )!
Ejemplo: Sea A= letras {a, b, c, d}, cuntos subgrupos de dos letras se pueden
obtener?
Lo que se pide es formar permutaciones u ordenaciones de 2 letras, cuando el total de
letras es 4. P(14,2) En este caso n=2 y m =4. Las "palabras" de 2 letras formadas son:
ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. En total son 12.
4,2 =
4!
= 12
(4 2)!
52
UNI Norte
10,4 =
10!
10.9. 8. 7. 6.5.4.3.2.1
=
= 5,040
(10 4)!
(6.5.4.3.2.1)
53
UNI Norte
54
UNI Norte
empricos. Debido a que estas distribuciones tratan sobre expectativas de que algo
suceda, resultan ser modelos tiles para hacer inferencias y para tomar decisiones en
condiciones de incertidumbre.
Una distribucin de frecuencias son las frecuencias observadas de todos los resultados
de un experimento que se presentaron cuando ya se efectu el experimento, es
emprica. Mientras que una distribucin de probabilidad es un listado de las
probabilidades de todos los posibles resultados que podran obtenerse si el
experimento se va a llevar a cabo, es terica.
55
UNI Norte
una poblacin que pesen entre 1,5-1,6 Kg. Las distribuciones discretas se asemejan a
las distribuciones continuas, cuando stas tienen muchos resultados posibles, todos
muy cercanos entre s.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia
de una presentacin a otra, sin seguir una secuencia predecible. Los valores de una
variable aleatoria son los valores numricos correspondientes a cada posible resultado
de un experimento aleatorio. Una variable aleatoria asocia un nmero o ms
generalmente una caracterstica a todo resultado posible del experimento. Por ejemplo,
si consideramos el experimento que consiste en realizar mediciones de
la
56
UNI Norte
Sucesos
px
{}
1/16
{v, v, v, v}
4/16
6/16
4/16
{vvvv}
1/16
57
UNI Norte
Probabilidad
0.39
0.31
0.22
0.13
0.05
0
Nro Nios
Sin embargo para las variables continuas la probabilidad de que una variable tome
cualquier valor concreto es 0, por lo tanto la fx slo permite calcular la probabilidad para
un intervalo del tipo (a<X<b), mediante el clculo de la integral correspondiente. Para
simplificar el clculo con variables aleatorias continuas, se aproximan estas a funciones
conocidas y con tablas de probabilidades, ahora con programas computacionales, se
pueden buscar los valores de P(a<X<b).
Distribucin acumulativa o funcin de distribucin. Funcin que acumula
probabilidades asociadas a una variable aleatoria. Su notacin es F(x) = p (X x). Para
el ejemplo anterior, F (X) es:
X
fx
Fx
0
1
2
3
4
1/16
4/16
6/16
4/16
1/16
1/16
5/16
11/16
15/16
16/16
a
f ( x)dx
58
UNI Norte
x E ( x) xf ( x)
xf ( x)dx
x E ( x)
Caso discreto
Caso continuo
x Eh( x) h( x) f ( x)
h( x) f ( x)dx
x Eh( x)
Caso discreto
Caso continuo
Ejemplo con una variable discreta: Si en una bolsa tengo 5 marcadores de 5 colores
diferentes: azul, amarillo, negro, rojo, verde. Y el experimento consiste en extraer un
marcador y observar su color Cul es la probabilidad media?
59
UNI Norte
La variable X solo puede tomar el valor 1 y para todos los colores f(x) = 1/5. En
consecuencia la media es
5
1
1
1
= ( ) = 1 + 1 + + 1 = 1
5
5
5
=1
h(x)
90
90
450
0
0
1
1
1
= ( ) ( ) = 90 + 90 + 450 + 0 + 0 = 126
5
5
5
=1
60
UNI Norte
Varianza
Es una medida de variabilidad de la variable aleatoria y se define como:
2 = ( )2
Para el clculo se usa sta otra frmula equivalente:
2 = ( 2 ) 2
dice que la
1
2
. Si E(x) es la media (o la
61
UNI Norte
(| ( )| )
1
2
, por ejemplo si a = 2
Ejercicio 3.2 Una industria produce ventanas cuya ancho tiene una media de 250 cm
y una desviacin estndar de 1.80 cm Construya un intervalo donde se encuentre al
menos el 8/9 de los datos?
Para una variable x con media y desviacin estndar que est normalmente
distribuida, escribimos: x es N (, ). La funcin de densidad de la distribucin normal
es:
62
UNI Norte
() =
1
2
()2
2 2
20
Frecuencia
10
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
63
UNI Norte
Luego con una tabla normal tipificada es fcil determinar probabilidades por intervalos
para diferentes valores de la variable x. Esta distribucin funciona relativamente bien
para hacer probabilidades cuando se tiene ms de 30 datos, y estos tienen una
distribucin en forma de campana. A continuacin
distribucin normal tipificada (0,1) donde est sombreado un intervalo de 1.96 desvi
estndar.
Funcin de densidad distribucin normal tipificada
0.40
Normal(0,1): p(evento)=0.9500
Densidad
0.30
0.20
0.10
0.00
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
Variable
28 =
(28 21)
3.2 = 2.1875 , se debe buscar la P (zi 2,1875) en una tabla
64
UNI Norte
Funcin de densidad
Normal(21,10.24): p(evento)=0.0144
0.13
Densidad
0.09
0.06
0.03
0.00
5.00
13.00
21.00
Variable
29.00
37.00
Ejercicio 3.4 Una fbrica produce puertas cuya altura tiene una distribucin normal con
media de 250 cm y una desviacin estndar de 2.60 cm
Cul es la probabilidad que una puerta seleccionada de este grupo tenga una altura
entre 244 y 255 cm?
Ejercicio 3.5 Una poblacin de nios en edad escolar tiene una media de 11.5 aos y
un desvo estndar de 3 aos. Cul es la probabilidad de que un nio sea entre 8.5 y
14.5 aos, ms de 10, y menos de 12?
Ejercicio 3.7 Se producen quesos con un dimetro es 35cm y se acepta una varianza
de 0.1 cm2. Si por problemas de envase se rechaza productos con dimetros menores
a 34.5cm y mayores a 35.5 Cul es la probabilidad de rechazo de la produccin por
problemas de envase?
Estadstica Bsica para Ingenieros
65
UNI Norte
Esta distribucin es simtrica, con forma de campana y su media vale 0. Cuando hay
pocos datos la campana es ms aplanada que una campana Normal, con de 30 datos
la distribucin t es casi igual que la distribucin Normal Tipificada (0,1). Esta
Distribucin se usa extensivamente para construir intervalos de confianza de y para
realizar pruebas de hiptesis de: uno y dos promedias, del coeficiente de correlacin y
de los coeficientes beta en la regresin lineal.
66
UNI Norte
n=100
n=10
Densidad
0.30
n=1
0.20
0.10
0.00
-5.00
-2.50
0.00
2.50
5.00
Variable
Se observa que a ms datos, la campana es ms alta, con valores menos dispersos y
semejante a una curva Normal.
Ejemplo Se sabe que la media histrica de edad de los estudiantes de una universidad
es de 21 aos. Cul es la probabilidad que un grupo de 30 estudiantes tenga un
promedio de edad mayor a 22 aos? En este grupo se calcul S, desvo estndar, y
este era de 5 aos La forma de clculo del estadstico es "" =
En este caso
"t" =
2221
5/30
67
UNI Norte
0.40
Densidad
0.30
0.20
0.10
0.00
-5.18
-2.59
0.00
Variable
2.59
5.18
Ejercicio 3.9 Histricamente se venden postes con un dimetro de 25cm, y con una
varianza de 64 cm. Si el comprador rechaza un lote si este tiene un promedio de
dimetro menor a 24 cm. Cul es la probabilidad de rechazar un lote de 100 postes?
Resolver con el mdulo didctico de INFOSTAT.
68
UNI Norte
Densidad
0.18
0.12
0.06
0.00
0.00
3.81
7.62
11.44
15.25
Variable
, =
69
UNI Norte
sobre variancias,
Hiptesis nula, dos variancias de dos grupos de una misma poblacin, son
iguales.
Hiptesis nula, las medias de los tratamientos pertenecen a una mismo media
0 : 1, 2
poblacional
Densidad
0.5
0.3
0.2
0.0
0.00
4.14
8.29
12.43
16.57
Variable
3. 7 La distribucin Binomial
Se utiliza para construir probabilidades con variables discretas, es decir cuyos valores
son contables. Este modelo se aplica a poblaciones finitas de las que tomamos
elementos al azar con reemplazamiento y tambin a poblaciones conceptualmente
infinitas, como son las piezas que generara una mquina, siempre que el proceso
generador sea estable (proporcin de pieza defectuosas constante a largo plazo) y sin
memoria (el resultado en cada momento es independiente de lo previamente ocurrido).
70
UNI Norte
Conociendo que:
( ) = ( )
siendo x = 0, 1, ..., n
71
UNI Norte
( ) = !! ( )!
A evento varn
Por lo tanto:
P (5 varones) =
12 5 125
0.5 0.5
5
12
5
72
UNI Norte
P (5 varones) =
Ejemplo 2. Existe una empresa que produce vasos, y se sabe que histricamente el 2
% de estos salen fallados. Por otro lado existe un comprador que tolera el 2 % de
fallos, si el valor es mayor rechaza el lote completo que quiere comprar. Se decide
tomar una muestra de 100 vasos, Cul es la probabilidad de que el comprador acepte
el lote?
( 2) = ( = 0) + ( = 1) + ( = 2) = 0.67
100
( = 0) = (
) 0.020 0.98100 = 0.13
0
100
( = 1) = (
) 0.021 0.9899 = 0.27
1
100
( = 1) = (
) 0.022 0.9898 = 0.27
2
Ejercicio 3.10 El Ministerio del Trabajo reporta que 20% de la fuerza de trabajo en un
pueblo est desempleada. De una muestra de 14 trabajadores, calcule las siguientes
probabilidades con la frmula de la distribucin binomial (n=14, p=0.2): Resuelva:
1. Tres estn desempleados. Respuesta: P(x=3)=.250
2. Al menos un trabajador est desempleado.
Respuesta: P(x 1) = 1 - P(x=0) =1 - .044 = .956
3. A lo ms dos trabajadores estn desempleados.
Respuesta: P(x 2)=.044 +.154 +.250 =.448
Ejercicio 3.11 Si el 15 % de las piezas producidas por una mquina son defectuosas,
cul es la probabilidad de que entre cuatro piezas elegidas al azar, a lo sumo una sea
defectuosa? Respuesta: P(x 1)=.89
Ejercicio 3.12 Si de seis a siete de la tarde se admite que un nmero de telfono de
cada cinco est comunicando, cul es la probabilidad de que, cuando se marquen 10
nmeros de telfono elegidos al azar, slo comuniquen dos? Respuesta: P(x=2) = .30
73
UNI Norte
() =
!
Donde es la media aritmtica del nmero de ocurrencias en un intervalo especfico de
tiempo, es la constante 2.71828 y X es el nmero de ocurrencias. El nmero medio
de xitos, , se puede determinar en situaciones binomiales por n p, donde n es el
nmero de ensayos y p la probabilidad de xito. La varianza de la distribucin de
Poisson tambin es igual a n p.
74
UNI Norte
75
UNI Norte
76
UNI Norte
95 %,
es el ms usado y para
IC 95 % de = x 1.96 ( s / n )
El IC
95 %
95 % se
variable que genera grupos, con una variable continua. En este grfico se observan las
medias de cada grupo con sus intervalos de confianza al 95 %, estos en forma de dos
rayas. Veamos un ejemplo de este tipo.
77
UNI Norte
al hacer una
Ejercicio 4.1 Una fbrica produce puertas, una muestra de 50 de stas arroja que
tienen una altura media de 250 cm y una desviacin estndar de 2.60 cm. Construir
el intervalo de confianza de la media poblacional?
78
UNI Norte
H0 rechazada
H0 cierta
H0 falsa, HA cierta
Error tipo I ()
Decisin correcta
Error tipo II ( )
79
UNI Norte
80
UNI Norte
"t" =
S=3.6
Se trata de un contraste sobre medias. La hiptesis nula (lo que queremos rechazar)
es: H0: = 18. La hiptesis alternativa es: HA: > 18. Este un contraste lateral derecho.
Fijamos "a priori" el nivel de significacin en = 0,05 y la regin crtica en este ejemplo
t(35)0,05=1,70.
81
UNI Norte
18.5 18
= 0.83
3.6
36
cambiado. B- Se quiere saber si diez fbricas artesanales que producen bloques estn
manteniendo la calidad de sus productos en el tiempo, para eso se comparan 10
muestras del mes uno con 10 muestras del mes dos.
El estadstico de contraste es
es la desviacin
82
UNI Norte
% Mes 6
86
82
80
78
75
82
85
86
86
% Mes 12
79
69
74
70
67
64
76
63
76
La hiptesis nula es H0: 6=12, hiptesis alternativa HA: 6>12. Fijamos "a priori" el
nivel de significacin en = 0,05 y la regin crtica en este ejemplo t (8)0,05=1,86.
11.33
= 5.96
5.70
9
El valor tc de 5.96 est en la regin crtica (el valor P es de 0.002), por lo tanto
rechazamos H0, concluimos que el poder germinativo de la semilla de maz disminuy
al estar 12 meses almacenados.
83
UNI Norte
1 2
12
22
+
1 1 2 1
Ejemplo. En un ensayo para evaluar la vida til de dos productos. La variable medida
es el tiempo de vida til en aos: producto T, n = 35;
producto K n = 40;
Como no conocemos como son las varianzas entre s, el modelo nos obliga a verificar
si la varianzas son iguales, si fueran distintas es otra la prueba t a realizar. Para ello
se debe plantear primero un contraste de prueba de hiptesis de variancias. Si las
variancias son iguales se sigue con la prueba t que se presenta, sino se debe hacer
otra variante de prueba t de ms difcil clculo.
Hiptesis de Variancias
H0: 2T = 2K, HA: 2T 2K
El estadstico es de contraste es una prueba F= S2K / S2T = 13.9 / 12.8= 1.09, como el
valor F de tabla es 1.74, en consecuencia aceptamos la H0 y concluimos que las
varianzas son iguales. Luego se hace la prueba de hiptesis de medias con el
estadstico antes detallado.
84
UNI Norte
15.1 3.7
13.9 + 12.8
35 1 40 1
= 13.28
II
III
IV
Pulpa caf
1.00
0.90
1.16
0.98
Lombrihumus
1.65
1.59
2.00
1.65
Realizar e Interpretar su prueba de hiptesis. Resolver con una prueba t para dos
grupos que pertenecen a una misma poblacin
85
UNI Norte
Desarrollar
5.1 Correlacin
Se puede definir la correlacin cmo la medida estadstica que sirve para evaluar la
intensidad de la asociacin entre dos o ms variables cuantitativas. Es comn que se
quiera saber, si sobre una misma poblacin los valores de dos o ms variables
cuantitativas distintas tienen alguna relacin medible entre ellas, o si los cambios en
una o varias de ellas influyen en los valores de otra variable. Si ocurre esto decimos
que las variables estn correlacionadas o bien que hay correlacin entre ellas. Este tipo
de anlisis funciona bien cuando las variables estudiadas son continuas, no es
adecuado usar esta prueba con variables cualitativas.
86
UNI Norte
hasta uno, -1 < r < 1, indicando que mientras ms cercano a uno sea el valor del
coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal
entre las dos variables. El coeficiente de correlacin de clculo r es un estimador
muestral del coeficiente poblacional Rho, . Mientras ms cercano a cero sea el
coeficiente de correlacin, este indicar que ms dbil es la asociacin entre ambas
variables. Si es igual a cero se concluir que no existe relacin lineal alguna entre
ambas variables. Hay varias maneras equivalentes de calcular r, a continuacin se
muestran tres formas.
Coeficiente de Correlacin, estimacin por Covarianzas y Desviaciones Estndares
(( )( ))2
=
( )2 ( )2
Coeficiente Correlacin, Estimacin por Suma de Cuadrados. Frmula ms utilizado
cuando se dispone de calculadoras de mano que hacen sumas de cuadrados.
( 2
2
2
) ( 2
)
87
UNI Norte
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden
darse, alguna de las siguientes relaciones: lineales o curvilneas cmo la cuadrtica,
cbica, etc. Dentro de estas nubes de puntos se pueden generar lneas poligonales a
partir de ecuaciones de regresin, que permitan predecir el comportamiento de la
variable dependiente.
5.2 Regresin
La regresin es una tcnica que permite predecir un valor numrico de una variable,
dependiente, basndonos en el conocimiento de un valor diferente de una o varias
variables independientes. El trmino regresin fue introducido por Francis Galton en su
libro Natural inheritance (1889), partiendo de los anlisis estadsticos de Karl Pearson.
Su trabajo se centr en la descripcin de los rasgos fsicos de los descendientes a
partir de los de sus padres. Estudiando la altura de padres e hijos lleg a la conclusin
de que los padres muy altos tenan una tendencia a tener hijos cuya altura regresaba a
la media.
Los tipos de regresin ms comunes entre dos variables son las del tipo polinmico
como la regresin: lineal, cuadrtica y cbica. La primera regresin genera una recta,
las otras diferentes tipos de curvas. Otros tipos de regresin que se pueden usar con
dos variables son la logartmica y la exponencial, la regresin logartmica permite
Estadstica Bsica para Ingenieros
88
UNI Norte
transformar una curva en una lnea recta. Cuando hay ms de una variable
independiente x, la regresin ms utilizada en la regresin mltiple. A continuacin se
expresan matemticamente los diferentes modelos comentados:
REGRESIN
ECUACIN
Lineal
= 0 + 1
Logartmica
= 0 + 1 ()
Exponencial
= 0 1
Cuadrtica
= 0 + 1 + 2 2
Cbica
= 0 + 1 + 2 2 + 3 3
Lineal Mltiple
= 0 + 1 1 + 2 2 +. . . +
=
El valor de
89
UNI Norte
)
= (
0
2
2
= 1 0
Por lo tanto la expresin del coeficiente de regresin, b 1, queda as:
1 =
2
2
= 1 ( )
Que puede replantearse como:
= 1 + 1
De tal manera que la ordenada al origen, cuando X vale 0, b 0, queda definida de la
siguiente manera:
= 0 = 1
90
UNI Norte
40
56
64
65
66
68
75
76
85
95
Espaol
45
59
67
59
69
70
61
82
75
100
Se supone que los alumnos con mejores notas en matemticas, variable independiente
X, tienen las mejores notas en espaol, variable dependiente Y. Esta pregunta se
puede responder con un anlisis de regresin correlacin.
Grfico de Dispersin
103
espaol
88
73
57
42
37
52
68
matemticas
83
98
91
UNI Norte
Clculo de la recta de regresin con datos generados con una calculadora de mano
que hace sumatorias:
= 69, = 68.7; = 690; 2 = 49,688 = 687
2 = 49,207; = 49,223
Coeficiente de correlacin r:
49,223
690(687)
10
= 0.891
2
Este valor de r de 0.891 refleja que hay una alta correlacin, asociacin, entre las
notas de matemticas y espaol, los mejores estudiantes en una asignatura son los
mejores estudiantes en la otra.
Para hacer la recta de regresin debemos calcular b1 y b0:
49,223
1 =
690(687)
10
2
49,688 690 10
= 0.876
Error
1.70
1.69
2.68
-6.20
2.93
2.18
74.83
-12.96 7.17
82.71
91.47
-7.72
8.53
92
UNI Norte
Regresin simple
100
espaol
85
70
56
41
37
52
68
83
98
matemticas
Grfico de Regresin de la asignatura Matemtica y Espaol. Se observa la recta de
regresin y los datos observados en forma de puntos.
93
Cuantiles observados(RDUO_espaol)
UNI Norte
10.5
r= 0.95 (RDUO)
Grfico QQ plot
4.6
-1.2
-7.1
-13.0
-13.0
-7.1
-1.2
4.6
10.5
X1, X2,,Xk
independientes;
deseamos describir la relacin que hay entre la variable respuesta y las variables
explicativas, si entre ellas hay una relacin lineal se espera que:
= 0 + 1 1 + 2 2 +. . . +
94
UNI Norte
= 0 + 1 1 + 2 2 +. . . + +
Donde ik es el desvo o error de cada observacin, este valor hace nico a cada dato
observado.
1 .2 =
(1 2 1 2 )
2 )(1 2 )
(1
1 2
2
2 .1 =
(2 1 1 2 )
2 )(1 2 )
(1
1 2
1
95
UNI Norte
1 .23
(1 .3 2 .3 12.3 )
=
2
(1
)(1 21 2 .3 )
2 .3
. ..
=(
)
=
=(
)
E s posible encontrar una ecuacin general del coeficiente de correlacin mltiple que
incluye k variables independientes, esta se puede construir a partir de los coeficientes
de correlacin parciales:
96
UNI Norte
2
2
2
2
2
1 .
= (1
)(1
)(1
) (1
)
1 2
1
2 .1
3 .1 2
.1 1
2 + 2 2
2
1 2 1 2
= 1
Se debe notar que en este ejemplo para hacer ry.x1x2 es necesario calcular previamente
tres correlaciones simples de tres variables.
0 + 11 + 2 2 =
Y se construye un sistema de ecuaciones normales
0 + 1 1 + 2 2 =
0 1 + 1 12 + 2 2 1 = 1
0 2 + 1 2 1 + 2 22 = 2
97
UNI Norte
Para poder resolver una regresin mltiple se puede usar una calculadora de mano que
tenga incorporada la funcin de regresin y permita calcular directamente sumas de
cuadrados y suma de productos de los valores de x y. Para esto se deben utilizar las
dos siguientes igualdades conocidas:
)2
( )2
=
( )( ) =
Ejemplo: Hay una hiptesis que sugiere que el consumo de un producto dado,
expresado en unidades compradas por persona en un ao est influido por: el ingreso
por persona que trabaja y el tamao de habitantes de la ciudad. Hacer estudio de
correlacin y regresin para responder a la suposicin.
Datos
Estadstica Bsica para Ingenieros
98
UNI Norte
Millones de
habitantes por
ciudad x1
0.6
1.4
1.3
0.3
6.9
0.3
4.2
0.6
Consumo del
producto,
unidades ao y
11
16
9
9
8
7
11
8
.1 2 =
0.00246+0.332(0.049)(0.574)(0.274)
10.075
= 0.613
La regresin se plantea como un sistema de dos ecuaciones, con los siguientes valores
obtenidos a partir de las sumatorias antes definidas.
0 = 1
1 2
2
0 = 9.875 (-0.27) 1.95 (0.28) 27.25 = 2.78
Calculo de los coeficientes b de manera general
Se debe hacer uso de la teora de algebra matricial, resolviendo la siguiente ecuacin:
= ( )1( )
Siendo:
99
UNI Norte
2
1 2
100
UNI Norte
El valor 5.55 es mayo que el valor t de tabla con 8 gl, de 2.3, por lo tanto se acepta la
hiptesis alternativa, Rho es diferente de 0, existe correlacin, por lo tanto se justifica
realizar un estudio posterior de regresin.
Anlisis de Variancia, ANDEVA, para la Regresin Simple o Mltiple
El ANDEVA, anlisis de variancia, permite responder pruebas de hiptesis sobre los
parmetros , la teora sobre cundo usar ste tipo de prueba y sus restricciones se
desarrollan con detalle en el Captulo
6.
0 : 1 = 2 = 3 = =0
: =0
Esta prueba se puede usar en casos de regresin simple o de regresin mltiple.
Suma de Cuadrados
Grados de Cuadrado F
Variacin
SC
Libertad
Medio
GL
CM
Total
Calculada
n-1
)
(
=
Regresin
. ..
)
(
n-k-1
Desviacin,
Error
. .. ) (
=(
) = =
(
= )
101
UNI Norte
. ..
=( )
=
=( )
Se hizo con INFOSTAT el anlisis de variancia del ejemplo de regresin mltiple entre
consumo, habitantes e ingreso. Se obtuvo el siguiente cuadro.
Cuadro de Anlisis de la Varianza
F.V.
SC
GL
Total
56.88 7
Regresin
21.43 2
Error
35.45 5
CM
10.71 1.51
p-valor
0.3066
7.09
Como el p-valor es mayor a 0.05 aceptamos la H0, los coeficientes tienen un valor de
0, por lo tanto la regresin estimada no sirve para predecir el consumo.
Prueba de hiptesis para los coeficientes Betas
De manera particular es posible hacer una prueba de hiptesis t para cada coeficiente
beta, donde:
: =
:
Dnde
( )2
(),()
Ejercicio 5.1 Tomar en clase el peso y la altura de 10 personas, hacer el grfico de
dispersin, calcular el coeficiente de correlacin y la recta de regresin de estos datos.
102
UNI Norte
Ejercicio 5.2 Hay una hiptesis de investigacin que sugiere que el gasto en comida
por familia, expresado en C$ por mes, est influido directamente por el ingreso
familiar mensual en C$. Haga estudio de regresin y correlacin de las dos variables.
Trabaje con calculadora.
Tabla de datos
Ingreso observado por
familia, en cientos C$
Gasto observados en
alimentacin, en cientos C$
30
34
17
26
29
18
32
32
21
26
5
19
18
7
23
25
103
UNI Norte
Datos
Y Materia
X1 p.p.m
seca
Nitrgeno Fsforo
22
34
35
35
36
37
38
34
35
35
76
82
121
88
90
94
81
79
79
86
X2 p.p.m
20
36
32
32
38
36
39
36
35
35
Y Materia
X1 p.p.m
seca
Nitrgeno Fsforo
22
33
21
17
38
18
22
35
19
29
66
73
58
31
38
56
64
87
56
55
X2 p.p.m
25
35
26
15
39
15
23
31
14
25
104
UNI Norte
Suma de
Grados de
Cuadrados Libertad
Regresin
18.5
Residual
12.0
20
Total
30.5
24
Cuadrado
Medio
105
UNI Norte
106
UNI Norte
107
UNI Norte
El ANDEVA usado para analizar experimentos, es un mtodo muy flexible que permite
construir modelos estadsticos para el anlisis de los datos experimentales.
Bsicamente es un procedimiento que permite dividir la varianza de la variable
dependiente, generalmente variable continua, en dos o ms componentes, cada uno de
los cuales puede ser atribuido a una fuente (variable o factor) identificable y la otra al
error experimental. Las variables independientes son generalmente nominales, son los
Factores en estudio y hacen grupos o tratamientos.
Los modelos que permite construir el ANDEVA pueden ser reducidos al cociente entre
dos varianzas, el numerador es la varianza del modelo como los tratamientos, bloques,
etc. y el denominador es la varianza de los errores. Por ejemplo en un caso de Andeva
unifactorial anova one way el valor F calculado es
108
UNI Norte
109
UNI Norte
debido al Teorema Central del Lmite. Sin embargo, si los errores de los datos son
extremadamente no-normales, es posible transformar los datos para cubrir este
requisito, o bien emplear mtodos no paramtricos.
tratamientos, pues si esto no se cumple se pueden invalidar los resultados de una HA.
Una poblacin heterognea en varianzas no permite detectar si las diferencias
observadas se deben diferencias de promedios o de las varianzas.
Para corroborar o refutar las afirmaciones hechas respecto de la hiptesis de la
homogeneidad de las varianzas de los grupos o tratamientos respecto a la variable
dependiente, se dispone de la prueba de Levene de homogeneidad de varianzas. Esta
prueba funciona como un estadstico F de la distribucin F de Fisher, donde la H0
consiste en suponer que las varianzas de los errores absolutos de los distintos grupos
son iguales. Se rechazar esta H0 en el caso de que la significacin del estadstico sea
menor que 0,05. El estadstico de Levene se hace realizando una ANDEVA con los
errores en valor absoluto, INFOSTAT calcula este tipo de error.
Independencia de promedios y varianzas: Que un promedio mayor no tenga
independencia entre medias y varianzas es un caso especial de falta de homogeneidad
de varianzas. En algunos datos existe una relacin definida entre las medias y sus
varianzas, por ejemplo el nmero de hojas de plantas de tomate de un mes y de tres
meses, en ambos casos no solo hay diferencias de promedios sino tambin de
varianzas, a ms edad mayor promedio y varianza. Este problema se puede manejar
con un buen diseo del experimento. Sin embargo esta relacin suele ser la causa ms
comn de heterogeneidad de varianza. Una correlacin positiva entre medias y
varianzas es una forma de detectar el problema. El estadstico de Levene tambin
detecta este problema.
Aditividad del modelo
Estadstica Bsica para Ingenieros
110
UNI Norte
Una prueba ANDEVA supone que los datos siguen un modelo lineal aditivo. Para cada
diseo experimental se construye un modelo matemtico lineal aditivo, para el caso de
un diseo completamente aleatorio, DCA, es = . La ecuacin expresa
que el valor de cualquier unidad experimental est compuesta por la media general,
ms o menos el efecto de tratamiento y ms o menos un termino de error
caracterstico de cada dato . En este modelo los trminos se suman, si esto no
ocurre as, el ANDEVA
aditividad puede ocurrir por un mal diseo del experimento, por ejemplo si se prueban
diferentes dosis de fertilizante, pero cada dosis se prueba en una especie de planta
diferente, puede resultar una interaccin entre dosis de fertilizante y especie de planta,
lo que rompa el modelo aditivo.
Qu hacer cuando el modelo no funciona?
La violacin o falta de apego a cualquiera de estas suposiciones indica que los
resultados del ANDEVA podran no tener validez. Dependiendo del tipo de problema,
puede haber solucin o no al objetivo buscado en el experimento. El dilema ms fuerte
con el que ha de luchar el investigador es el de la falta de homogeneidad de varianzas,
ya que si esto ocurre, no podemos saber si las diferencias entre los tratamientos se
deben a promedios diferentes o varianzas diferentes.
Logaritmo Log (x), til cuando los datos crecen en sentido exponencial o cuando
las
desviaciones
estndares
de
las
muestra
sean
aproximadamente
111
UNI Norte
La transformacin + 0.5
pequeos 0-10, por ejemplo son acontecimientos pocos comunes, tienen una
posibilidad muy baja de ocurrir en cualquier individuo. Estos datos tienden a
seguir una distribucin de Poisson.
Como ltimo recurso, ante datos dudosos de anlisis se puede hacer uso de mtodos
de estadstica no paramtrica. Es importante mencionar que el empleo de estadstica
no paramtrica o el uso de transformaciones no eliminan el problema de la falta de
aleatoriedad de las unidades experimentales, errores por un mal diseo del
experimento o por una mala toma de datos, es decir, la ejecucin incorrecta de un
experimento, no se tiene ms remedio que repetir el experimento, corrigiendo los
errores por falta de diseo o mal manejo.
este tiene
tratamientos y una variable dependiente continua. Este es un modelo que funciona aun
cuando el nmero de repeticiones por tratamiento no es constante. El modelo supone
que las repeticiones de los distintos tratamientos estn distribuidas al azar dentro del
experimento y que no necesariamente cada grupo o tratamiento tiene igual nmero de
repeticiones. El diseo de este modelo estadstico se llama Diseo Completamente
aleatorio y generalmente funciona bien controlando el error experimental cuando no
hay perturbaciones externas con algn sentido definido, como viento, tipos de suelo
diferentes, variaciones trmicas, etc.
112
UNI Norte
unidades
=
= Valor de la n-esima observacin ubicada en el tratamiento i.
= Promedio General
= Efecto del tratamiento i que es igual a , la media del tratamiento i
menos la media general. Estos efectos puede tener valor positivo o negativo y el
modelo supone que hay variacin entre los tratamientos, por los tanto se puede
calcular su variancia,
113
UNI Norte
cercano a uno.
HA: no todos los son iguales, al menos el menor y mayor promedios son diferentes.
2
Esto supone que la relacin
/2 es un valor relativamente grande, ya que la
= 2 /2
Regla de Decisin:
Si el valor Fcalculado es mayor que el valor frontera tomado de una tabla de distribucin
Ftabla, se rechaza Ho, ya que el Fcalculado est en la zona de rechazo de la hiptesis nula,
Ho de la distribucin F. El valor de F de frontera se busca en una tabla de valores
F, donde el valor de las columnas son los grados de libertad de los tratamientos y los
de las filas son los grados de libertad del error, para un del 0.05.
Si se usa un programa estadstico el anlisis de hiptesis se hace con el P valor.
Modelo de ANDEVA
Causa de
Cuadrado
Variacin
Libertad
Medio, CM
SC
S2
GL
Tratamientos
1(1 )2 (1 )
t 1
Error
(n -1)
FCalculado
SC
(t 1)
total
- SCtratamientos
114
UNI Norte
Total
n 1
(1 )
)
(
tratamientos, variacin que se refleja en la variancia del error o cuadrado medio del
error. Un experimento mal manejado puede presentar mucha variacin entre las
repeticiones de un mismo tratamiento, esto es error experimental. El CV tambin est
en dependencia de la variable que se mide o pesa. Si la variable est bien controlada,
en un experimento biolgico a campo el CV deber ser menor a 20 %, incluso en
laboratorio se pueden exigir CV menores al 10 %. Sin embargo en investigacin social
descriptiva o en variables biolgicas no controladas como es una plaga, es comn que
los CV sean grandes. Sin embargo en experimentos en la industria con condiciones
115
UNI Norte
(100)
II
III
IV
tratam
1.00
0.90
1.16
0.98
4.04
1.01
Abono de lombriz
1.65
1.59
2.00
1.65
6.89
1.72
Qumico
1.69
1.52
1.40
1.46
6.07
1.52
Tierra
0.58
0.60
0.60
0.46
2.24
0.56
repeticion es
4.92
4.61
5.16
4.55
19.24
Tabla de ANDEVA
Causa de
Grados de
Suma de
Cuadrado
Variacin
Libertad
Cuadrados
Medio, CM
FCalculada
S2
Tratamientos
4 1 = 3
3.28
3.28/ 3 =1.09
1.09/0.02=
65.18
Error
15- 3 = 12
0.20
0.2/12 =0.017
P valor 0.00
116
UNI Norte
Total
16 1 = 15
3.48
(
1 )
= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 / 16) =
26.61 19.242 / 16 = 26.61 23.13 = 3.48
1(1 )
(
1 )
Interpretacin
La prueba resulta en HA: no todos los son iguales
Ya que la F calculada 65.18 > F Tabla 3.49 (con 3 y 12 grados de libertad)
Tratamiento
Pulpa caf
Pulpa caf
Peso
1.00
0.90
Media
Total
1.2
1.2
Media
Tratamient
o
1.01
1.01
Efecto
Tratamiento
-0.19
-0.19
Error
-0.01
-0.11
Error
Absoluto
0.01
0.11
117
UNI Norte
Tratamiento Peso
Pulpa caf
1.16
Pulpa caf
0.98
Lombrihumus 1.65
Lombrihumus 1.59
Lombrihumus 2.00
Lombrihumus 1.65
Qumico
1.69
Qumico
1.52
Qumico
1.40
Qumico
1.46
Tierra
0.58
Tierra
0.6
Tierra
0.6
Tierra
0.46
Media
Total
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
1.2
Media
Tratamient
o
1.01
1.01
1.72
1.72
1.72
1.72
1.52
1.52
1.52
1.52
0.56
0.56
0.56
0.56
Efecto
Tratamiento
-0.19
-0.19
0.52
0.52
0.52
0.52
0.32
0.32
0.32
0.32
-0.64
-0.64
-0.64
-0.64
Error
0.15
-0.03
-0.07
-0.13
0.28
-0.07
0.17
0.00
-0.12
-0.06
0.02
0.04
0.04
-0.1
Error
Absoluto
0.15
0.03
0.07
0.13
0.28
0.07
0.17
0.00
0.12
0.06
0.02
0.04
0.04
0.1
0.28
0.16
0.04
-0.08
-0.20
-0.20
-0.08
0.04
Cuantiles de una Normal
0.16
0.28
118
UNI Norte
Variable
Rduo gr planta
n
16
Media D.E. W*
0.00 0.12 0.89
p (una cola)
0.10
La prueba de normalidad de Shapiro Wilks para los errores del modelo, realizado con el
programa INFOSTAT, confirma que stos se distribuyen de manera normal. Se acepta
la H0 de normalidad de los errores ya que el valor calculado p de 0.10 es mayor al
valor de 0.05.
promedios de los
errores de los
SC
gl
CM
Abono 0.02
0.01 1.10
Error
0.06
12
Total
0.08
15
p-valor
0.39
0.01
Como el p valor de 0.39 es mayor al valor de 0.05 se concluye que ocurre H0, las
variancias de los errores absolutos de los diferentes tratamientos son iguales, por lo
tanto en este experimento se cumple la homogeneidad de variancias.
119
UNI Norte
0.29
RABS_peso
0.22
0.14
0.06
-0.01
Pulpa
Lombrihumus
Qumico
Tierra
120
UNI Norte
Ejercicio 6.3 Se quera saber si los estudiantes utilizan la teora explicada en el aula al
resolver problemas prcticos. Se hizo un experimento con 12 estudiantes, se formaron
3 grupos, A-B-C, de cuatro estudiantes cada uno. A cada grupo se les dio un ejercicio
matemtico semejante para resolver de manera individual. A los cinco minutos al grupo
B se le dio un papel con una informacin terica adicional y al grupo C se les dio un
papel con dos informaciones. Cada estudiante resolva el problema de manera
individual. La variable dependiente fue el tiempo medido en segundos.
Los datos obtenidos fueron los siguientes:
Grupo/ Segundos para resolver
E.1
E.2
E.3
E.4
A. Testigo
242
206
300
282
B. Un informacin adicional
176
129
128
190
155
106
122
115
121
UNI Norte
un bloque completo cuando todos sus elementos componentes tienen valores vlidos y
estn representados todos los tratamientos.
=
= Valor de la j observacin ubicada en el i tratamiento.
= Promedio General
122
UNI Norte
Anlisis de Varianza
Hiptesis:
Sobre los tratamientos
Ho: 1= 2=..... = k, HA: no todas los k son iguales
Sobre los bloques
Ho: 1= 2=..... = j, HA: no todas j son iguales
Estadsticos de Prueba:
Ftratamientos = S2tratam/S2error ; Fbloques= S2bloque/S2error
Regla de Decisin:
Si Fcalculado es mayor que la Ftabla se rechaza Ho
Estadstica Bsica para Ingenieros
123
UNI Norte
Grados
Variacin
de
Suma de Cuadrados
Cuadrado
Medio, CM
S2
Libertad
Tratamientos
1(1 )
(1 )
t 1
Bloques
b 1
Error
(n -1) SC
(t 1)
FCalculado
1 (1 )
(1 )
total
- SC
tratam
- SC
bloq
2
2
(b -1)
Total
n 1
(1 )
( )
Donde:
i es cualquier tratamiento
j es cualquier bloque
t es el nmero de tratamientos
b es el nmero de bloques
n es el nmero de unidades experimentales, es igual a b x t.
Un Ejemplo
Para comparar diseos se analiza el mismo ejemplo anterior, de los fertilizantes, pero
considerando que las repeticiones tuvieron un diseo de bloques
Tabla de ANDEVA
Estadstica Bsica para Ingenieros
124
UNI Norte
Causa de
Grados de
Suma de
Cuadrado
Variacin
Libertad
Cuadrados
Medio, CM
FCalculada
S2
Tratamientos
4 1 = 3
3.28
1.09
Tratamiento
Bloques
4 1 = 3
0.06
0.02
Error
15- 3 - 3= 9
0.14
0.016
70.07
Bloques 1.29
16 1 = 15
Total
3.48
(
1 )
= (1.002 + 0.902 + 1.162 +0.982...+ 0.462 ) ((1.00 + 0.90 + 1.16 +0.98...+ 0.46)2 / 16)
= 26.61 19.242 / 16 = 26.61 23.13 = 3.48
1(
1 )
(
1 )
1 (1 )
(
1 )
bloques
/ G.L bloques
0.06 / 3 = 0.02
Cuadrado Medio del error = S.C error / G.L error
0.14 / 9 = 0.016
Estadstica Bsica para Ingenieros
125
UNI Norte
Separacin de Promedios
Estas pruebas se realizan solamente cuando el resultado del ANDEVA refleja que
estamos en HA, es decir al menos los promedios extremos son diferentes. Las pruebas
que veremos son: Diferencias significativas mnimas, Prueba de rangos mltiples de
Duncan y la Prueba de rangos mltiples de Tukey.
Diferencia Significativa Mnima, DSM, LSD
La prueba de diferencia significativa mnima, DSM o LSD en ingls, solo se debe usar
para comparar promedios adyacentes, o contra un testigo estndar, donde no se
involucren en la comparacin ms de 2 promedios. Esta prueba suele ser poco usada,
pero sirve como insumo para realizar la prueba de Duncan que es ms popular.
DSM0.05 = t0.05
2( )
126
UNI Norte
DSM0.05 = 2.262
2(0.016)
4
= 0.20
El valor t de tabla se busca con los grados de libertad del error, en este caso es de 9 y
para un alfa del 5 %. El valor DSM de 0.20 gr se contrasta con las diferentes
diferencias de promedios respecto al testigo. Si la diferencia de promedios es mayor
que el valor DSM, se concluye que estos promedios son diferentes.
Tratamientos
X en gr
Diferencia con el
Diferencias mayores
testigo Tierra de
de 0.20 gr
0.56 gr
Lombrihumus
1.72
1.16
Si
Qumico
1.52
0.96
Si
Pulpa caf
1.01
0.45
Si
127
UNI Norte
CM error
r
Donde q es un valor tabulado, ver tabla en Daniel (2006), donde se considera: el valor
alfa de 0.05, los grados de libertad del error, 9, y el nmero de tratamientos,4. En este
ejemplo el valor q es 4.415
DSM Tukey = 4.415 =
0.016
4
= 0.28
Tabla de Diferencias
Tratamientos
Lombri
Qumico
Pulpa caf
Tierra
0.20 NS
0.71**
1.16**
0.52**
0.96**
0.45**
humus
Lombrihumus
Qumico
Pulpa caf
Tierra
Segn este cuadro, los fertilizantes lombrihumus y qumico son iguales y diferentes y
mejores a los otros dos tratamientos, pero pulpa de caf es mejor que tierra. En
este ejemplo, coinciden en resultados la prueba de Tukey y la prueba DSM, debemos
considerar que no siempre sucede as.
128
UNI Norte
Grupo
Animales T1
T2
T3
/Tiempo
Grupo 1
Grupo 2
Grupo 3
En este caso, cada alimento se aplica una sola vez por cada grupo de animales junto
con cada tiempo, y si existiesen efectos sistemticos debido a diferencias entre los
animales o entre los tiempos, dichos efectos estaran presentes de igual manera en
cada tratamiento, esto es, en cada tipo de alimento.
129
UNI Norte
En este modelo se pueden observar que las diagonales repiten el mismo grupo, ver el
caso de la diagonal A-A-A, B-B y C-C. Estas diagonales no son problema en esta caso
ya que las columnas son el Factor tiempo, y el tiempo no se perturba diagonalmente,
sin embargo si el diseo fuera con filas y columnas en el espacio, por ejemplo filas E-O
y columnas NS, las diagonales no son deseables ya que pueden ser una fuente de
error. En este caso se recomienda sortear filas y columnas de forma independiente.
=
= valor de la observacin i ubicada en la columna k con la fila j usando el
tratamiento i.
= Promedio General
= Efecto del tratamiento i
= Efecto de la columna j
= efecto de la fila k
130
UNI Norte
Suma de Cuadrados
Variacin
Grados
Cuadrado
de
Medio, CM
Libertad
FCalculado
S2
Tratamiento
SCT
t-1
S2t
St/ S2error
Filas
SCF
c-1
S2f
Sf/S2error
Columnas
SCC
f-1
S2c
Sc/S2error
Error
SCTot (SCT+SCF+SCC)
Difer.
Total
SCTot
n-1
S2error
131
UNI Norte
Uno
Estadstica
B de D
Economa
Fsica
Dos
Fsica
Estadstica
B de D
Economa
Tres
Economa
Fsica
Estadstica
B de D
Cuatro
B de D
Economa
Fsica
Estadstica
Datos obtenidos
Asignatura
Economa
Economa
Economa
Economa
Fsica
Fsica
Fsica
Fsica
Grupo
Momento
Nota
Asignatura
Grupo
Momento
Nota
C
D
A
B
D
A
B
C
1
2
3
4
1
2
3
4
82
81
83
77
70
65
67
61
Estadstica
Estadstica
Estadstica
Estadstica
B de D
B de D
B de D
B de D
A
B
C
D
B
C
D
A
1
2
3
4
1
2
3
4
75
70
73
67
78
76
78
71
Suma de Cuadrados
= + + + = .
+ + +
= .
=
+ + +
= .
+ + +
= .
=
= = .
132
UNI Norte
133
UNI Norte
Tratamiento
0
10
20
30
0
10
20
30
0
10
20
30
0
10
20
30
Ovejas
A
B
C
D
B
A
D
C
D
C
B
A
C
D
A
B
Tiempo
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
CMS
424.6
427.2
567
774.7
523.3
519.43
444.27
772.56
559
699.1
702.61
734.6
586.2
432
656.78
574
134
UNI Norte
135
UNI Norte
Variacin
Libertad
Cuadrado
FCalculado
Medio, CM
S2
Total
SCtotal
n-1
SCtratamientos
t-1
Factor A
SCA
a-1
S2A
Factor B
SCB
b-1
S2B
Factor AxB
SCAxB
(a-1)(b-1)
S2AxB
Error
SCError
n-t
Tratamientos
Totales
S2A /Serror
S2B S2error
S2AxB S2error
Dnde:
136
UNI Norte
Sexo
Horas Repeticiones
Varn
0-3
70
74
73
69
286
71.50
Varn
4-6
78
75
80
76
309
77.25
Varn
+6
86
82
88
85
341
85.25
Mujer
0-3
64
70
69
76
279
69.75
137
UNI Norte
Mujer
4-6
80
81
73
79
313
78.25
Mujer
+6
80
90
84
82
336
84.00
1,864
77.67
Suma de Cuadrados
= + + +
+ + + +
+ +
CM
159.07
2.67
392.04
4.29
12.11
F
13.13
0.22
32.37
0.35
p-valor
<0.0001
0.6445
<0.0001
0.7064
Estos resultados dicen que no hay diferencias de notas segn sean los estudiantes
varones o mujeres (significacin de 0.64 mayor al 0.05), pero por otro lado si se
observa diferencias estadsticas entre las horas de estudio (significacin de 0.0001
138
UNI Norte
menor al 0.05), con esta ltima variable y este resultado se debe hacer una separacin
de promedios entre las tres categoras de horas de estudio.
Grfico de Interacciones
Este grfico nos permite observar si hay interaccin con los dos factores, sexo y
horas de estudio. Esta interaccin ocurre si las rayas generadas por las variables se
cruzan, lo que sera una confirmacin de la existencia de interaccin entre sexo y horas
de estudio. Como esto no se observa en el grfico que se muestra a continuacin, se
puede concluir que coinciden los resultados del ANDEVA y del grfico.
Grfico de Interacciones entre las Variables Sexo y Horas de estudio
139
UNI Norte
Aplicar el mismo modelo a casi todas las distribuciones en lugar a una sola.
Comparando ambos enfoques, en general los modelos paramtricos tienen una mayor
sensibilidad para detectar diferencias significativas entre grupos cuando la variable
dependiente es continua y normal, pero por otro lado los modelos no paramtricos se
pueden aplicar a casi todos los casos de pruebas de hiptesis, son ms fciles de
Estadstica Bsica para Ingenieros
140
UNI Norte
141
UNI Norte
142
UNI Norte
Notas Antes
1.5
2.0
3.5
3.0
3.5
2.5
2.0
1.5
1.5
2.0
3.0
2.0
Nota al finalizar
2.0
2.0
4.0
2.5
4.0
3.0
3.5
3.0
2.5
2.5
2.5
2.5
Signo
+
0
+
+
+
+
+
+
+
+
143
UNI Norte
Crtico
se acepta la H0 no
hay diferencias entre el nmero de signos (+) y (-), la mediana es (0), lo que nos
dice que la notas no han cambiado entre antes de hacer la capacitacin y despus
de recibirla. Se concluye que la capacitacin no ha mejorado la capacidad de
responder el examen por los estudiantes.
Ejercicio 7.2
En el siguiente grupo de estudiantes determinar por la prueba del signo, si hubo mejora
entre las notas promedios de la primera evaluacin de exmenes trimestrales y la
segunda evaluacin trimestral.
Estudiante
Sindy
Tatiana
Eyleen
Arlen
Wilmer
Primer
Trimestre
80
80
67
70
70
Segundo
Trimestre
87
85
70
85
75
Estudiante
Indira
Rosa
Lilliam
Heydi
Clark
Primer
Trimestre
75
69
70
75
75
Segundo
Trimestre
80
73
65
73
79
144
UNI Norte
Wendel
Juniel
Juan J
Nesly
Jeydels
Erick
Miriam
Nely
72
64
82
90
82
78
79
81
72
85
73
88
89
85
84
90
Heydi L.
Axel
Itzan
Milton
Meyling
Jasser
Darol
Karla
70
70
65
71
80
70
60
63
75
70
70
76
82
69
60
74
Ejercicio 7.3
Se informa acerca de un estudio en el que se evala un aditivo de motor, que reduce el
consumo de combustible. Se tienen datos de consumo de 20 motores al azar, sin y
con aditivo. Resolver usando prueba del signo si el nmeros de signos +obtenidos
con el uso de aditivo es de trece.
la
Por ejemplo si se quiere vincular la variable tener o no beca, Becas con el xito de un
examen acadmico, xito, dos variables cualitativas. Los resultados de un estudio de
este tipo se pueden comprimir en una tabla de contingencia 2x2 del tipo como la
siguiente
Becado
No Becado
145
UNI Norte
xito
m = a+b
No E
n = c+d
e = a+c
f = b+d
No Becado
xito
em/T
fm/T
No E
en/T
fn/T
( )
=
El estadstico calculado se distribuye segn una distribucin conocida denominada jicuadrado, que depende de un parmetro llamado "grados de libertad" (g.l.) Los g.l. en
la tabla anterior de 2X2 es 1. Esto se puede generalizar a tablas C x F siendo los
grados de libertad son (Columnas-1) x (Filas-1). El valor tabular se busca en una tabla
de ji-cuadrado, X2 a continuacin se muestra un resumen de la misma, para un alfa del
5%.
146
UNI Norte
Grados de
Valor X2 de
(filas X columnas)
Libertad
Tabla
2X2
3.84
3X2, 2X3
5.99
4X2, 2X4,
7.81
9.48
Ejemplo
En una muestra de 300 estudiantes que cursaron matemticas se observa que 231
aprobaron (xito). Se quiere estudiar su posible asociacin con el hecho de ser Becado
o No Becado (factor). La tabla de valores Observados, O, es
xito
No E
Becado
88
12
100
No Becado
143
57
200
231
69
300
Totales
Totales
No E
Becado
231x100/300=77
69x100/300=23
No Becado
231x200/300=154
69x200/300=46
Obsrvese que una vez calculado uno de los valores esperados, los dems vienen
dados para conservar los totales marginales (eso es lo que significa que hay 1 g.l.).
A partir de aqu calculamos el valor 2 con una correccin, sustraer 0.5 del valor
absoluto, correccin de Yates, que se usa solamente en las tablas 2x2 (de dos filas y
dos columnas), esto se hace para lograr continuidad en los datos. Como no existe un
consenso generalizado sobre la aplicacin de la correccin, el uso de esta queda a
Estadstica Bsica para Ingenieros
147
UNI Norte
criterio del investigador, sin embargo algunos autores sugieren usar la solamente la
correccin cuando los totales de ambas variables son fijos. En este ejemplo
aplicaremos la correccin de Yates a modo de ejemplo.
Valor aplicando la correccin de Yates:
77
23
154
46
2
=1
77
23 154 46
2
=1
2
El valor de tabla con un grado de libertad, (2-1) X (2-1), es de 1(0.05)
= 3.84
Sexo
Mujer
Mujer
Mujer
Mujer
Mujer
Beca
No
No
No
Si
Si
Sexo
Mujer
Mujer
Mujer
Varn
Varn
Luis Mara Dicovskiy Riobo
148
UNI Norte
Si
No
Si
Si
Si
No
No
No
Si
No
Mujer
Mujer
Varn
Varn
Varn
Varn
Mujer
Varn
Varn
Mujer
No
Si
No
No
No
No
No
No
Si
Si
Varn
Varn
Varn
Varn
Mujer
Varn
Mujer
Mujer
Mujer
Mujer
Tarde Noche
Defectuosos
450
550
No defectuosos
9000 8900
700
8600
Sea que p1, p2 y p3 representen las proporciones reales de artculos defectuosos para
los turnos del da, la tarde y la noche, respectivamente. Resolver la siguiente prueba de
hiptesis
Ho: p1 = p2 = p3;
149
UNI Norte
la variable dependiente, por tanto la prueba puede ser utilizada con pocos datos e
incluso con variables de naturaleza no continua, sin embargo el modelo pide que haya
varianzas poblaciones iguales.
2
12
=
3( + 1)
( + 1)
=1
Donde:
K: nmero de grupos.
Una vez calculado el estadstico H, se busca en una tabla diseada para esta prueba el
valor crtico, H
crtico,
si H
calculado>H crtico
Video:
150
UNI Norte
Internet:
K= 3
N= 19, NV = 6, NI =6, NP = 7.
Ranking Video:
1, 2, 4, 5, 6.5, 8
= 26.5
= 57.5
12
19(19+1)
26.52
6
57.52
6
1062
7
) 3(19+1)=11.78
La hiptesis nula de esta prueba establece igualdad de las medias de los tratamientos,
la alternativa es que al menos un tratamiento sea diferente. Esta prueba no necesita de
los supuestos de que los datos son independientes y la varianzas homogneas.
151
UNI Norte
En esta prueba los datos se organizan en una matriz, donde las filas son los bloques y
las columnas los tratamientos o grupos.
12
=
2 3( + 1)
( + 1)
2
=1
Donde:
n: nmero bloques.
Se puede usar los valores crticos de la tabla X2 con K-1 grados de libertad para
determinar que hiptesis se cumple.
Ejemplo, se les pidi a nueve estudiantes de Ingeniera Industrial las notas de las
cuatro asignaturas que haban cursado el semestre anterior. Se quiere saber si hay
diferencias en la evaluacin de las asignaturas, pero como se considera que cada
estudiante es diferente en su comportamiento, se trata de neutralizar este efecto con un
diseo de bloques aplicado a los estudiantes.
Datos
Estudiantes/
bloque
A
B
C
D
E
F
Programacin
II
74
75
72
79
74
76
Asignaturas, Notas
Probabilidades Fsica III
86
82
80
78
75
82
Metalurgia
79
99
84
80
67
84
93
95
86
88
93
96
152
UNI Norte
G
H
I
71
82
75
85
86
86
86
93
96
94
97
94
Programacin
II
1
1
1
2
2
1
1
1
1
11
2
4
3
3
1
3
3
3
4
26
4
3
4
4
4
4
4
4
3
34
2 =
12
9(4)(4+1)
Este valor calculado de 19.27 es mayor al valor X2 con 3 grados de libertad de 7.81, lo
que se puede concluir que, en cuanto a su forma de ser evaluada, al menos una
asignatura es diferente del resto.
153
UNI Norte
correlacin. El
6 1= 2
=1
(2 1)
Donde d es la diferencia entre los correspondientes ranking de valores de la
variable independiente y dependiente. Siendo el ranking la medida ordinal asignada
a cada observacin previamente ordenada segn cierto criterio relativo a una
caracterstica. El nmero de pares de observaciones es n.
El procedimiento de clculo lleva los siguientes pasos:
diez
Matemticas
Ranking
3.5
3.5
5.5
5.5
7.5
7.5
10
Espaol
10
Ranking
1.5
1.5
7.5
7.5
10
154
UNI Norte
Diferencia
-0.5
0.5
-0.5
-0.5
-0.5
-2.0
3.5
-1.5
1.5
Diferencia al 0.25
0.25
0.25
0.25
0.25
2.25
0.0
de ranking
cuadrado d2
Donde n= 10 pares de datos, siendo:
= 1
6(22)
133.5
=
= 0.87
10(100 1)
990
155
UNI Norte
156
UNI Norte
Los diagramas de control ms usados son los propuestos por Walter Shewhart, padre
del control estadstico de la calidad. Estos diagramas tienen un lmite central, uno
inferior y otro superior, estos dos ltimos lmites sealan cuando el proceso est fuera
de control
Los valores medidos se comparan con unos lmites (lneas paralelas al eje central). Los
lmites ms comunes son los siguientes: el Lmite superior de control (LSC) y el inferior
(LIC), paralelos a una lnea central (LC) representativa del valor medio. En este captulo
veremos 9 tipos de Diagramas de control.
157
UNI Norte
Variable
continua
No
Si
Ms de un
elemento
por
muestra
Si
Diagramas
Xbarra S y
Xbarra R
Ms de un
defecto por
elemento
No
Diagrama de
valores
individuales
Si
Diagramas
"u" "c"
No
Diagramas
"np "p"
Lmites. Un diagrama de control consiste en un grfico formado por una lnea central
(LC) y dos lneas paralelas una por encima, Lmite Superior del Control (LSC), y otra
por debajo. Lmite inferior del Control (LIC). Para cada grupo se van representando los
valores de , R, o S, etc., si los valores estn comprendidos en el intervalo LSC- LIC)
se dice que el proceso est bajo control, en caso contrario el proceso puede estar
descontrolado
158
UNI Norte
Estos lmites pueden ser conocidos por datos histricos o exigencias de la produccin,
sino es necesario estimarlos a partir de las observaciones de varios grupos de
muestreo. Es as que se deben calcular estimadores de los parmetros y .
Los tipos ms frecuentes de diagramas de control para una sola variable son:
Diagrama de Medias con lmites definidos por los Desvos estndares (S).
Da
Repeticiones
17.90
24.10
18.70
19.20
19.30
19.84 6.2
21.30
19.60
18.70
19.80
19.20
19.72 2.6
159
UNI Norte
18.50
20.30
21.20
19.80
19.00
19.76 2.7
21.90
23.10
22.10
20.10
21.90
21.82 3
23.10
22.10
20.10
19.20
21.40
21.18 3.9
20.46 3.68
Siendo:
2 para grupos de 5 muestras = 0.577, y n = 5 el tamao de cada grupo
Donde: LC = 20.46, LSC= 20.46 + 3.68 (0.577) = 22.59, LSC= 20.46 - 3.68 (0.577) =
18.34.
X-barra
19.84
19.72
19.76
21.82
21.18
Rango
6.20
2.60
2.70
3.00
3.90
22.9
X-barra
21.7
20.5
19.3
18.1
Da
160
UNI Norte
8.3
Rango
6.2
4.1
2.1
0.0
Da
8.3.3 Diagrama de Medias con lmites definidos por los Desvos estndares, S.
El diagrama de medias construido con lmites definidos por los S, es parecido al
diagrama de medias construido a partir de R, rangos, la diferencia consiste en que el
tamao de la muestra puede ser variable y adems es mucho ms sensible para
detectar cambios en la media o en la variabilidad del proceso. Lo lmites se calculan de
la siguiente forma:
Estadstica Bsica para Ingenieros
161
UNI Norte
LC =
LSC y LIC = 3
, siendo 4 un valor de tabla que considera el tamao de
4
cada grupo (ver tabla al final del captulo) y el promedio de los desvos
estndares por grupo.
Ejemplo con los datos del ejercicio de muestras de caf:
X-barra
19.84
19.72
19.76
21.82
21.18
Desvo estndar
2.44
0.98
1.06
1.08
1.55
22.8
X-barra
21.6
20.5
19.3
18.2
3
Da
LC = , LSC y LIC = 3
1 42
162
UNI Norte
Lnea Superior:
Lnea Central:
Lnea Inferior:
Desvo estndar
3.2
2.98
1.42
0.00
2.4
1.6
0.8
0.0
3
Da
Ejemplo con los datos del ejercicio de humedad de los granos de caf, considerando
que todas las muestras fueron tomadas al mismo tiempo:
Humedad
17.90
21.30
18.50
21.90
Humedad
22.10
20.10
19.20
163
UNI Norte
23.10
24.10
19.60
20.30
23.10
22.10
18.70
18.70
21.20
1.20
1.00
4.50
0.70
2.80
1.00
3.40
0.00
2.50
19.80
19.80
20.10
19.20
19.30
19.20
19.00
21.90
21.40
0.60
0.00
0.30
0.90
0.10
0.10
0.20
2.90
0.50
1.50
24.45
Lnea Central:
20.46
Lnea Inferior:
16.47
25.6
Humedad
23.0
20.5
17.9
15.3
13
19
25
Nmero de Muestra
164
UNI Norte
muestras
grandes (cientos miles). Por otro lado el costo unitario de inspeccionar un atributo es
menor y ms fcil que el de inspeccionar una variable que se mide o se pesa.
Estas grficas son tiles como medida del desempeo de un taller, departamento,
empresa, etc. Generalmente el desempeo de la industria mejora despus de introducir
una grfica para atributos como control de la calidad productiva, pues la grfica es una
representacin visual continua de su funcionamiento.
Ejemplos de control por atributos:
a) La pieza se rechaza si visualmente se observan una o ms ralladuras de 0.5 cm.
b) Un tornillo se acepta si su dimetro est comprendido entre 2.1 y 2.2 mm y se
rechaza en otro caso (no es necesario medir el dimetro, basta utilizar un calibre
que permita comprobar si se cumple la caracterstica).
c) Un lote se rechaza si posee ms de 15 piezas defectuosas.
165
UNI Norte
. Considerando
(1)
(1
)
# de Puros defectuosos
01
02
Estadstica Bsica para Ingenieros
9
5
Lote
11
12
# de Puros defectuosos
6
15
Luis Mara Dicovskiy Riobo
166
UNI Norte
03
4
13
14
04
7
14
11
05
8
15
12
06
9
16
13
07
9
17
10
08
11
18
11
09
13
19
7
10
14
20
8
Diagrama de Control p, proporcin de defectos, a partir de los datos del problema de
puros.
Para resolver ste problema con el programa INFOSTAT se debe crear una matriz de
dos columnas una con el nmero de defectos y la otra con el tamao de la muestras
(subgrupo) de 500. El nmero de filas sern 20.
Resolucin
Proporcin defectos
0.02
0.01
0.01
0.01
0.02
0.02
0.02
0.02
0.03
0.03
0.01
Proporcin defectos
0.03
0.03
0.02
0.02
0.03
0.02
0.02
0.01
0.02
167
UNI Norte
Diagrama de control p
Proporcin defectos
0.041
0.031
0.020
0.010
0.000
1
11
16
Lote
8.4.2 Diagrama n p
Cuando el tamao de las muestras en los diagramas p es constante se puede usar el
diagrama n p, o diagrama del nmero de defectuosos. Las grficas p y np muestran el
mismo comportamiento pero a diferente escala. Las grficas np se grafican
directamente con los datos de piezas defectuosas y no es necesario calcular
proporciones.
En ste diagrama se grafica el nmero de defectuosos por muestra di, en lugar de la
proporcin pi. Es as que = y = (1 ).
19.10
9.80
168
UNI Norte
Lnea Inferior:
0.50
Diagrama de control np
Cantidad defectos
20.3
15.3
10.2
5.1
0.0
1
11
16
Lote
8.4.3 Diagrama c, nmero de defectos
Es frecuente que en los procesos industriales existan ms de un tipo de defecto por
objeto de estudio y sin embargo no hacen que se clasifica al producto como
descartable, son caractersticas indeseables pero que no necesariamente impidan que
el producto pase o no a la siguiente fase del proceso como sucede con los diagramas
p y np. En esto caso se utilizan los diagramas c y u. Tambin se pueden usar
stos diagramas en casos como nmero de fallas por operario, nmeros de quejas
por un mal servicio nmero de fallas de una mquina, etc.
El objetivo de diagrama c es analizar la variabilidad del nmero de defectos, o no
conformidades por muestra de tamao uniforme, siendo ci el nmero de defectos en
la muestra i. Se parte de que c sigue una distribucin de Poisson, en la cual el
169
UNI Norte
Ejemplo: Se posee los datos de 30 meses del nmero de quejas de clientes por mes
de una central telefnica atendida por tres operarios los meses 1-15 y por dos
operarios los meses 16-30. Se quiere saber si las quejas por servicio se han mantenido
estables en el tiempo.
Mes
Quejas
Mes
Quejas
1
9
16
8
2
8
17
6
3
6
18
8
4
7
19
9
5
5
20
6
6
8
21
7
7
9
22
5
8
10
23
4
9
12
24
5
10
14
25
4
11
13
26
3
12
11
27
4
13
9
28
6
14
8
29
5
15
7
30
4
Diagrama de Control c, a partir de los datos del problema de quejas por central
telefnica
, = 7.33 3
7.33.
15.46
Lnea Central:
7.33
Lnea Inferior:
0.00
170
UNI Norte
Diagrama de control c
Quejas x Central
16
12
8
4
0
15
Mes
22
29
. Si =
Diagrama de Control u, a partir de los datos del problema de quejas por operario
LSC-LIC= 2.83 32.833 2
171
UNI Norte
Diagrama de control u
Media queja/operario
7.7
5.7
3.8
1.9
0.0
15
Mes
22
29
A2
1.880
1.023
0.729
0.577
0.483
0.419
0.373
0.337
0.308
D3
0.0000
0.0000
0.0000
0.0000
0.0000
0.0758
0.1359
0.1838
0.2232
D4
3.2686
2.5735
2.2822
2.1144
2.0039
1.9242
1.8641
1.8162
1.7768
C4
0.7979
0.8862
0.9213
0.9400
0.9515
0.9594
0.9650
0.9693
0.9727
D2
1.128
1.693
2.059
2.326
2.534
2.704
2.847
2.970
3.078
172
UNI Norte
Bibliografa Consultada
Cajal, H. U. (sf). Material docente de la Unidad de Bioestadstica Clnica. Recuperado el
15 de Enero de 2009, de http://www.hrc.es/bioest/M_docente.html#tema2
Cebran, M. (2001). Distribuciones continuas. Recuperado el 14 de Julio de 2009, de
Ministerio de Educacin y ciencia:
http://descartes.cnice.mecd.es/Bach_HCS_2/distribuciones_probabilidad/dis_con
tinuas.htm
CYTA. (s.f.). Gua de Estadsticas. Distribucin de Poisson . Recuperado el 14 de Julio
de 2009, de
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/index.htm
Daniel, W. (2006). Bioestadstica. Base para el anlisis de las ciencias de la salud .
Mxico: Limusa.
DATA MINING INSTITUTE . (2001). UNIANOVA - Diseo Completamente Aleatorio.
Recuperado el 17 de Julio de 2009, de
http://www.estadistico.com/arts.html?20011015
Gonzalez, L. (2004). INFOSTAT, Manual del usario. Crdoba: Universidad Nacional de
Crdoba.
Gutirrez, H., & De la Vara, R. (2004). Control estadstico de la calidad y seis sigmas.
Mxico: McGraw Hill.
Hernndez, L., Castillo, A., Bofill, A., & Pons, R. (87). Probabilidades. Habana: Pueblo y
Educacin.
Kessler, M. (2005). Apuntes de Mtodos estadsticos de la Ingeniera. Recuperado el
14 de Julio de 2009, de
http://filemon.upct.es/~mathieu/metodos/teoria/pdftema3.pdf
Lacayo, I. (2002). Anlisis de Variancia con SPSS 8.0. Recuperado el 5 de Diciembre
de 2008, de Universidad Rafael Belloso:
http://www.aibarra.org/Apuntes/Estadistica/00032969.doc
Little T y Hills, J. (1990.). Mtodos estadsticos para la investigacin en la agricultura.
Mxico: Trillas.
Martnez Garza, A. (1988). Diseos experimentales, mtodos y elementos de teora.
Mxico: Trillas.
Estadstica Bsica para Ingenieros
173
UNI Norte
174