Está en la página 1de 97

UNIVERSIDAD NACIONAL

PEDRO RUIZ GALLO


FACULTAD DE INGENIERIA QUIMICA E INDUSTRIAS
ALIMENTARIAS

CURSO DE TITULACION
ESCUELA PROFESIONAL DE INGENIERIA QUIMICA

MODULO II

METODOS ESTADISTICOS APLICADOS A


LA INGENIERIA QUIMICA
Grafico de control R.
8
LCS=6.46

Rango, R

6
4

LC= 2.83

2
0

LCI=0.00
0

10

15

N de muestra

MSc. ALFONSO TESEN ARROYO


Lambayeque, Enero del 2015

20

25

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

INTRODUCCIN
El presente curso responde a la necesidad de superar el nivel de anlisis y uso adecuado de la
informacin en la toma de decisiones empresariales.
Cada da se viene implementando mejoras en las tcnicas de recoleccin, procesamiento y
presentacin de los datos, pero muy poco se esta capacitando en el anlisis y uso de la informacin
para la toma de decisiones gerenciales.
Este gran problema se hace continuo por la falta capacitacin y formacin constante en el
rea y adems por no existir un sistema estadstico de informacin gerencial que facilite el anlisis y
uso de la informacin.
Los mtodos estadsticos son herramientas eficaces para mejorar el proceso de produccin, y
reducir sus defectos. Sin embargo, se debe tener en cuenta que las herramientas estadsticas son
precisamente herramientas: no servirn si se usan inadecuadamente.
El anlisis de datos comprende la traduccin de informacin reunida durante un proyecto de
investigacin, en una forma interpretable y til, independientemente del mtodo de reunin adoptado,
esto es, cuestionario, mediciones Fsico-Qumico, medicin fisiolgica, escala de observacin, o de
otro tipo; existe mucha ms informacin de la que puede ser manejada adecuadamente por el empleo
causal de los datos
En gran medida, la abundante informacin que se dispone sobre los diseos de productos,
procesos y el control de calidad en las empresas, no es usada para tomar decisiones y efectuar
ajustes correctivos; de otro lado, existe escasa disposicin de instrumentos para detectar las
necesidades de control de un proceso y las decisiones de la poblacin acerca de la buena utilizacin
de las herramientas de estadsticas.
En los procesos industriales, el anlisis de datos por lo regular entraa el empleo de tcnicas
estadsticas para organizar y reducir masas de datos a trminos descriptivos cmodos, y extraer
inferencias de ellos. El anlisis estadstico genera informacin precisa y definida respecto a las
caractersticas de los datos, en una forma que pueda ser comunicada con facilidad de un investigador
a otro.

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

A muchos estudiantes amedrenta o desanima la simple idea de usar estadsticas. El temor es


totalmente injustificado. El investigador no necesita tener conocimientos matemticos profundos para
entender a la estadstica, ya que actualmente al encontrase fcilmente con computadoras y
calculadoras, pero si es til tener idea de algunas operaciones. En la realidad todos utilizamos
terminologa estadstica, inclusive en nuestra conversacin diaria, cuando hablamos de produccin,
rendimiento de materia prima, calificaciones, promedios, o el porcentaje ingenieros colegiados que
pertenecen a uno u otro sexo, en realidad hacemos tipos tiles de estadsticas descriptivas. As
mismo cuando decimos que el nmero promedio de horas de trabajo de un ingeniero en planta es 10
horas, en realidad se ha organizado y entendido los datos, por innumerables operaciones que
hacemos a nivel inconsciente, hasta lograr un anlisis estadstico de datos simple.
De todo lo anteriormente comentado, es que se vio en la necesidad ser incluido en el
diplomado el curso de Mtodos Estadsticos y Control Estadstico de la Calidad, que ser de mucha
utilidad al profesional de Ingeniera, Ciencias de la Salud, y Otros, teniendo como objetivos:

OBJETIVOS

Reconocer la importancia y necesidad de la informacin estadstica como


herramienta fundamental de un proceso decisorio.

Utilizar las

tcnicas bsicas del mtodo estadstico para la

evaluacin de

resultados de investigaciones.

Calcular e interpretar indicadores tiles en investigaciones y acciones de un


ingeniero en una Planta.

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CAPITULO I

METODOS ESTADISTICOS UTILES EN EL ASEGURAMIENTO DE LA CALIDAD


CONCEPTOS IMPORTANTES
ESTADSTICA.
Es la Ciencia que nos proporciona un conjunto mtodos cientficos para recolectar, organizar, resumir y
analizar datos, para obtener conclusiones vlidas para la toma de decisiones razonables basadas con tal
anlisis. La estadstica se divide en:
ESTADSTICA DESCRIPTIVA.
La estadstica descriptiva, es la estadstica que slo se ocupa de describir y analizar un grupo de datos,
sin sacar conclusiones sobre un grupo mayor.
ESTADSTICA INFERENCIAL.
La estadstica inferencial, es un conjunto de procedimientos que nos permiten efectuar generalizaciones
de la muestra a la poblacin. Se utiliza para probar hiptesis y estimar parmetros, se basa en el concepto
de distribucin muestral.
UNIDAD DE ANALISIS O UNIDAD DE OBSERVACIN.
Es la unidad indivisible a quien se estudia, del cual se obtiene el dato estadstico. Tambin se define como
el objeto de estudio. Puede ser una paciente, una planta, un pescado, una lata de conserva, etc.
POBLACIN.
Es el conjunto de unidades de observacin o elementos de la misma especie que se pretende estudiar en
una investigacin cientfica y de la cual se obtiene una muestra.
PARMETRO.
Es una medida de resumen que nos describe alguna caracterstica de la poblacin. Para calcular dicho
valor es necesario utilizar todo los valores de la poblacin completa.
Algunos parmetros conocidos y que usaremos en este curso son:

La media poblacional

denotado por

La varianza poblacional

denotado por

La proporcin poblacional
El total poblacional

denotado por
denotado por

P
X

El coeficiente de correlacin poblacional

denotado por

MUESTRA.
Es un subconjunto de la poblacin sobre quienes se va estudiar, la cual debe haberse elegido al azar
(aleatorio) y ser representativa de la poblacin a la cual pertenece, esto quiere decir sin sesgos. En

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

general la muestra es toda parte representativa y adecuada de la poblacin. A partir del anlisis de la
muestra obtenida correctamente y al azar , se puede hallar conclusiones que sean extrapolables a la
poblacin de origen. Para elegir la muestra debe apelarse a un determinado mtodo de muestreo.
ESTADSTICO.
Es una medida de resumen que nos describe algunas caractersticas de inters y cuyo valor es calculado
usando slo los valores de los elementos o unidades de una muestra.
Algunos estadsticos conocidos y mas usados son:
La media muestral
La varianza muestral
La proporcin muestral
El total muestral
El coeficiente de correlacin muestral

denotado por

denotado por
denotado por
denotado por
denotado por

S2
p
x
r

VARIABLES.
Es una caracterstica o propiedad determinada de las unidades de anlisis, sea medible o no. Esta
propiedad hace que las unidades de anlisis de un grupo pueden diferir de las de otro grupo en la muestra
o poblacin de estudio.
CLASIFICACIN DE VARIABLES.
1.- Por Su Naturaleza. Se dividen.
Variable Cuantitativa: Es la que se puede medir. Habitualmente es llamada variable numrica o
mtrica, estas se clasifican en:
Variables Cuantitativas Discretas: Tienen un recorrido finito o a lo mas numerable.
Ejemplos: Nmero de latas de conserva que ingresan A una autoclave, Nmero de alumnos
matriculados en el Diplomado de Supervisin y Control, Nmero de plantas Agroindustriales
del departamento, Nmero de dientes con caries, Nmero de hijos por familia. etc.
Variables Cuantitativas Continuas: Tienen un recorrido infinito no numerable, la variable
puede tomar, tericamente, cualquier valor en un cierto intervalo. Ejemplos: Densidad,
humedad, acidez, temperatura, dureza del agua, Brix, Presin sangunea, nivel de colesterol
en la sangre, estatura, peso, ingreso econmico, edad, longitud, etc.

Variable Cualitativa: Son variables que representan cualidades o atributos de la muestra,


como por Ejemplo: El sabor, color, tipos de conservantes, tipos de licores, Genero ( masculino,
femenino), VIH(presente, ausente), grupo sanguneo( A, B, AB, O), grado de instruccin, ,
desnutricin, etc.

2.- Por su Relacin.- Se clasifican en:


Variables dependientes: Es la variable motivo del estudio, cuyos valores dependen de otras variables
que pueden influir en ella. Tambin se le llama variable respuesta. Ejemplo : Respuesta a un
tratamiento, rendimiento escolar, ventas, etc.

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Variable Independiente: Es la que modifica de una u otra manera a la variable dependiente,


llamndose tambin segn el caso factor de riesgo, factor predictivo, Ejemplo: Horas de estudio,
minutos de publicidad, etc.
Variable Interviniente: Son aquellas que coparticipan con la variable independiente condicionando a
la variable dependiente.
Ejemplo: Material de trabajo, medios de publicidad, etc.

ESCALAS DE MEDICION

Variables categricas nominales: Son variables cualitativas que no permiten establecer un orden.
Ejemplo: raza ( negra, blanca, trigueo, etc.), grupos sanguneos (A,B,AB,O). Tambin son
excluyentes entre si, o sea que cada individuo pertenece a una u otra categora pero no a las dos al
mismo tiempo.

Variables categricas ordinales: Estas si permiten establecer un orden determinado, por Ejemplo:
grado de instruccin de un paciente (inicial, primaria, secundaria, superior), nivel socioeconmico
(bajo, medio, alto). etc. Tambin son excluyentes entre si.

Escala Intervlica. Es una escala ordinal, que se usa en mediciones de variables continuas que
adems de tener un orden tienen mantienen una equidistancia entre s y para lo cual pueden iniciar
con un cero relativo o arbitrario y mantener un intervalo de separacin.
Ejemplo 1.- Temperatura, Presin de vapor, Brix, Acidez, Grado Alcholico, Las calificaciones de un test
o de un examen de conocimientos. Estas tienen un cero elegido arbitrariamente, por ejemplo si un
alumno obtuvo un calificativo de cero en un examen de matemticas I, esto significa que no sabe
nada de la materia pues con otra prueba ms fcil podra tener otra calificacin.
Ejemplo 2.- Si tres alumnos A, B,C han obtenido los puntajes 2, 4, 16 respectivamente, no solo se
verifica las relaciones 2 y 2<4<16, sino que 16-4 = 6 (4-2) donde se puede inferir que C y B es igual a
seis veces la diferencia entre los puntajes de B y A.

Escala de Razn o Cociente. la escala de razn es una escala de intervalo en donde adems
podemos comprobar cuantas veces un valor de la escala es mayor o menor que otro valor de la
escala. la escala de razn tiene cero absoluto
Ejemplo 1: Peso, talla, nmero de alumnos; en las que el cero representa la nulidad o ausencia de
lo que se estudia. Se dice que un peso de 50 libras es el doble que uno de 25 libras, o que uno de
100 libras es 4 veces mayor que uno de 25 libras.
Ejemplo 2: si tres objetos A, B y C miden 2, 4 y 16 metros, se pueden establecer las relaciones:

2
16
16
8 y
4 , es decir que la
=2;
4
2
4
longitud de 8 es el doble de A, el de C es 8 veces que el de A y el de C es 4 veces que el de B.
2 4 16 , 2 < 4 < 16, 16 - 4 = 6(4-2), y adems

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

ORGANIZACIN Y PRESENTACIN DE LOS DATOS


Despus de la recoleccin de los datos, es necesario resumirlos y presentarlos de tal forma en forma
tal, que faciliten la comprensin, anlisis, utilizacin y aplicaciones de los mismos. Hay dos formas de
presentar ordenadamente los datos estadsticos.
1) En forma tabular, como son los cuadros y tablas estadsticas.
2) Mediante grficos y diagramas.
Tablas Estadsticas. Las tablas estadsticas presentan ordenadamente los datos estadsticos en filas
y columnas, clasificados y agrupados de acuerdo a un criterio especfico. En las tablas
metodolgicamente, conviene distinguir las " tablas de frecuencia o de distribucin" y los "cuadros
estadsticos o de anlisis".
Tablas de frecuencia o de Distribucin.
Son tablas de trabajo estadstico, que presentan la distribucin de un conjunto de elementos de
acuerdo a las categoras de la variable. En ellas se observa la frecuencia o repeticin de cada uno de
los valores de la variable, que se obtiene despus de realizar la operacin de tabulacin.
Cuadros estadsticos.- El cuadro estadstico es el arreglo ordenado, de columnas y filas, de datos
estadsticos o caractersticas relacionadas, con el objeto de ofrecer informacin estadstica de fcil
lectura, comparacin e interpretacin (un cuadro estadstico es el resultado de trabajos previos)
(planeamiento, recopilacin, tabulacin , clculos, etc.). Estos cuadros constituyen los llamados
"Cuadros de anlisis" que se incluyen frecuentemente en el cuerpo de los estudios, de las
investigaciones o de informes.
TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS DE VARIABLES
CUALITATIVAS O ESTADISTICAS DE ATRIBUTOS.
V. CUALITATIVA.- Suponga que una muestra de n unidades estadsticas se observan k categoras o
modalidades C1, C2, ,Ck, de alguna variable cualitativa X. La tabulacin de estos n datos, es la
distribucin de frecuencias por categoras dados en el siguiente cuadro:

CUADRO N 1: DISTRIBUCIN DE FRECUENCIAS DE V. CUALITATIVAS


CATEGORAS
VARIABLE
X

FRECUENCIAS
ABSOLUTAS
fi

FRECUENCIAS
RELATIVAS
hi

FRECUENCIAS
RELATIVAS
PORCENTUALES Pi

C1
C2

f1
f2

h1
h2

..

..

CK

fK

hk

P1
P2
.
.
.
Pk

Frecuencia Absoluta (fi).- Es el nmero de datos observados en cada categora o modalidad. La Suma
de todas las frecuencias absolutas es igual al total de n datos observados.

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


k

f
i 1

MSc. Alfonso Tesn Arroyo

Frecuencia Relativa (hi)


Se define para cada i, i =1,2,...,k,

por hi =

fi
. La suma de todas las frecuencias relativas es igual a
n

uno, esto es,

hi 1
i 1

Frecuencia Porcentual (Pi)


Se define para cada i, i = 1,2,...,k, por Pi = hi x 100% . El total de las frecuencias porcentuales es igual a
k

cien. Esto es,

P 100
i 1

Ejemplo 1: Para evaluar el proceso de fabricacin de barnices sintticos se ha realizado un estudio en el


mes de abril del 2004, con la finalidad de establecer las causas ms importantes que originan fallos en el
producto elaborado.
El tiempo de duracin del estudio fue de un mes, siendo responsable el jefe de control de calidad.
Durante dicho periodo se identificaron diferentes causas de fallas y la intensidad o frecuencia de
ocurrencia, la misma que se muestra en la siguiente tabla.
A
B
C
B
D
A
C
B

D
A
C
B
E
D
A
B

A
B
B
D
B
A
B
B

A = Viscosidad; B =Color

E
B
A
E
E
B
D
A

D
B
E
A
B
D
B
A

; C= Peso por Galn;

A
E
B
E
A
B
B
A

E
A
E
B
A
B
B
E

B
E
A
B
B
B
A
B

E
B
D
A
B
B
A
E

B
A
B
A
E
B
E
B

D = Hermeticidad E = Contaminacin

CUADRO N2: DISTRIBUCIN DE CAUSAS DE FALLO EN EL PROCESO DE FABRICACIN DE


BARNICES SINTTICOS

CAUSAS DE FALLO
Viscosidad (A)
Color (B)
Peso por galn (C)
Hermeticidad (D)
Contaminacin(E)
TOTAL

INTENSIDAD
21
37
3
5
14
80

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CUADRO N3: DISTRIBUCIN DE CAUSAS DE FALLO EN EL PROCESO DE FABRICACIN DE


BARNICES SINTTICOS

CAUSA DE FALLO
Color (B)
Viscosidad (A)
Contaminacin (E)
Hermeticidad (D)
Peso por galn(C)
Total

Frecuencia

Frecuencia

Absoluta
37
21
14
5
3
80

Relativa
0.4625
0.2625
0.1750
0.625
0.375

Porcentaje
46,25
26,25
17,50
6,25
3,75
100,00

Ejemplo 2 : En una entrevista a una muestra de 20 Ingenieros afiliados al CIP, en la que respondieron
pertenecer a los siguientes captulos siendo los resultados siguientes: C ( Ing. Civil) , A (Ing. Agrcola) ,
M( Ing. Mecnica), obteniendo los siguiente resultados: A, C,C, A, M, C,C, A, A,C, A, C, C,M, A, C, M, A, C,
A

CUADRO N3: DISTRIBUCIN DE INGENIEROS AFILIADOS AL CIP POR CAPITULOS AL QUE


PERTENECE
INSTITUCIN DE
FRECUENCIAS
FRECUENCIAS
FRECUENCIA
SALUD
ABSOLUTAS: fi
RELATIVAS: hi
PORCENTAJE Pi
Ing. Civil (C)
9
0.45
45
Ing. Agrcola( A)

0.40

40

Ing Mecnica(M)
TOTAL
Fuente: Hipottica

3
20

0.15
1.00

15
100

REPRESENTACION GRFICA DE DATOS


La representacin grfica de la distribucin de frecuencias de variable cualitativa, se representa
comnmente por medio de barras y de sectores circulares.
A.- GRFICA DE BARRAS
Los datos de cada una de las modalidades C i se representan por una barra rectangular vertical (u
horizontal) cuya altura (o largo) es proporcional a su frecuencia, las barras se dibujan dejando un espacio
entre ellas. Si la escala es nominal las categoras pueden ser colocadas en cualquier orden, pero si el
nivel es ordinal las categoras deben ir ordenadas.

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

GRAFICO DE BARRAS
GRAFICO N 1: DISTRIBUCIN DE INGENIEROS AFILIADOS AL CIP SEGUN CAPITULO

0.5

0.45

0.40

0.4
0.3
0.15

0.2
0.1
0

Ing. Civil

Ing. Agricola

Ing. Mecnica

B.- GRAFICO CIRCULAR


GRFICO N2 DISTRIBUCION DE INGENIEROS AFILIADOS AL CIP POR CAPITULOS AL QUE
PERTENECE

Ing. Mecnica
15%
Ing. Civil
45%
Ing. Agricola
40%

Ejemplo 3: La nacionalidad de los ponentes del IX Congreso Nacional de Ingeniera Qumica, realizado
en Agosto del 2003, en la Universidad Nacional Pedro Ruiz Gallo fueron los siguientes:
X1 = C
X2 = BX3 = P
X4 = E
X5 = P
X6 = P X7 = V
X 8 = C X9 = B
X10 = P
X11 = PX12 = C
X13 = E
X14 = P
X15 = B
X16 = P
X17 = C
X 18 = V
X19 = P
X20 = V
B= Bolivia
C= Colombia E= Ecuatoriano P= PeruanoV= Venezolano
CUADRO N 3: DISTRIBUCIN DE LOS PONENTES PARTICIPANTES EN EL IX COPEIQ REALIZADO
EN LA U.NP.R.G. SEGN NACIONALIDAD. AGOSTO 2003
NACIONALIDAD
BOLIVIANOS
COLOMBIANOS
ECUATORIANOS
PERUANOS
VENEZOLANOS

fi
3
4
2
8
3

hi
0.15
0.20
0.10
0.40
0.15

10

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

C=5
n = 20
1.00
TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS DE VARIABLES CUANTITATIVAS
1) VARIABLE CUANTITATIVA DISCRETA.
Cuando se estudia una caracterstica X de la poblacin, el mayor inters del investigador es conocer la
distribucin de esta caracterstica a travs de los posibles valores del mismo.
Una distribucin de frecuencias es un arreglo de los valores observados x 1 . . . xk de la variable con sus
respectivas frecuencias, en una tabla de la forma siguiente.
Frecuencias
Relativas
hi

f1

Frecuencias
Absolutas
Acumuladas
Fi
F1

X2

f2

.
.

XK

Valor
de
X
X1

Frecuencias
Absolutas
fi

Total

h1

Frecuencias
Relativas
Acumuladas
Hi
H1

Frecuencias
Relativas
Porcentuales
hi %
h1 %

F2

h2

H2

fK

FK = n

hk

Hk = 1

h2 %
.
.
.
hk %

fi

i 1

hi

i 1

hi% 100

i 1

Para construir una tabla de frecuencias de una variable discreta, tambin se puede construir con intervalos
siempre y cuando el rango de la variable sea muy amplio y se construyen los intervalos tan igual que para
la variable continua que se detalla en la siguiente parte con la nica diferencia de que se trabaja con los
intervalos cerrados.
Ejemplo: En una poblacin formada por 100 lotes de 50 artculos cada uno, se consider la
cuantitativa discreta X= Nmero de artculos defectuosos en cada lote. Los resultados fueron:
1
5
4
2
3
4
5
3
5
4
2
4
5
6
4
5
2
5
4
6
3
4
5
1
6
3
2
5
4
3
6
3
5
7
2
5
7
4
6
5
2
8
3
3
6
4
2
4
3
4
8
1
5
3
7
2
4
1
3
5
3
8
4
6
5
4
5
4
5
4
5
2
4
3
5
2
3
4
3
1
4
5
4
4
7
4
6
2
6
2

variable
3
4
7
6
4

2
2
3
3
5

CUADRO N 4. DISTRIBUCIN DE 100 LOTES DE ACUERDO AL NUMERO DE ARTICULOS


DEFECTUOSOS.
Frecuencia
Frecuencia Frecuencia
N de
Frecuencia
Absoluta
Frecuencia
Relativa
Relativa
Artc.Defec
Absoluta
Acumulada
Relativa
porcentual Acumulada
Xi
fi
Fi
hi
hi%
Hi
1
5
5
0.05
5
0.05
2
14
19
0.14
14
0.19
3
18
37
0.18
18
0.37
4
25
62
0.25
25
0.62
5
20
82
0.20
20
0.82
6
10
92
0.10
10
0.92
7
5
97
0.05
5
0.97

11

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

8
3
100
0.03
3
1.00
Total
100
1.00
100
Grfico N3: GRFICO DE BASTONES DE LA DISTRIBUCIN DE 100 LOTES DE ACUERDO AL
NUMERO DE ARTICULOS DEFECTUOSOS.
fi N Familias
h
26
24
22
20
18
16 14 12 10 86420 1 2
2) VARIABLE CUANTITATIVA CONTINUA.

X : Artculos Defectuoso

DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS


La distribucin de frecuencia por intervalos o clases se usan cuando la variable estadstica es continua o
cuando el nmero de valores distintos de una variable discreta es muy grande.
Para la distribucin de frecuencias por intervalo se recomienda elegir no ms de 20 intervalos ni menos
de 5, ya que muchos intervalos pueden implicar innecesariamente los clculos de las medidas
descriptivas, y pocos intervalos podran omitir caractersticas importantes de los datos. En este curso se
eligen intervalos de igual amplitud (A); pero en la realidad no siempre se trabaja con intervalos de igual
amplitud ya que muchas veces las instituciones tienen estndares de trabajo como por ejemplo en salud
y otras instituciones.
Para construir la distribucin de frecuencias, se debe tener en cuenta los siguientes pasos:
1.- Determinar el Rango ( R ) de variacin de los datos que se define por: R= Xmax - Xmin
Donde :
Xmax= Es el dato mayor; Xmin= = Es el dato menor
2.- Determinar el nmero de intervalos ( K ); un valor aproximado del nmero de intervalos, K, nos
proporciona la Regla de Sturges, donde: K= 1+ 3.3 Log(n) ; n 10 : n es el nmero de datos
Redondeando al entero inmediato superior.
Por ejemplo si se tiene n = 45 datos sin decimales, entonces: K=1+3.3Log(45)=6.4556. luego, K podr
elegirse como 6,7,8 o cualquier nmero entero; tambin puede usarse K= 2.54 4 n
3.- Determinar la Amplitud ( A ) del intervalo se obtiene, dividiendo el Rango entre el nmero de
R
intervalos esto es: A =
K
R
S la divisin de A=
no es exacta en el nmero de decimales de los datos, entonces el valor de A se
K
aproxima por exceso de manera que se cubra todo el rango, esto es: KA R.
Cada intervalo o clase Ii, lo tomamos cerrado por la izquierda y abierto por la derecha esto es: I i=[Li,Ui[,
siendo Li el lmite o extremo inferior y U i el lmite o extremo superior del intervalo. El ltimo intervalo se
tomar como extremos cerrados, esto es, Ik= [Ik, Uk
Para construir la distribucin de frecuencia de intervalos hay varios procedimientos.
De manera que KA R; Los intervalos se forman de la siguiente manera:
I1 = [Xmin, Xmin + A[
I2 = [Xmin, Xmin + 2A[

12

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

I3 = [Xmin, Xmin + 3A[


.
Ik = [Xmin, Xmin + KA]
Marca de Clase.- Es el punto medio del intervalo de clase. Se obtiene sumando los lmites inferior y
superior de cada clase y dividindolo entre dos. As la marca de clase del intervalo 50-54 ser (50 + 54)/2
= 52. La marca es, en definitiva, el valor que representa a la informacin contenida en el intervalo de clase.
Ejemplo. Los sueldos mensuales (en dlares) de 60 empleados de la Empresa CAMPOSOL Trujillo en el
ao 2004 fueron los siguientes
440
560
335
587
613
400
424
466
565
393
574
480
453
650
407
376
470
560
320
500
528
526
500
625
570
475
618
537
409
600
550
432
591
428
462
507
440
340
558
460
560
607
382
669
512
492
380
645
450
530
501
471
660
470
364
634
580
450
518
382
Construir una tabla de distribucin de frecuencias.
1.-Rango: R= Xmax - Xmin = 669 - 320 = 349
2.- Nmero de Intervalos: K = 1+ 3.3 Log(60) = 6.9; K = 7 intervalos
669 320 349

49.9 50
3.- Amplitud. A =
7
7
CUADRO N5 DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL SEGN INGRESO
(EN DOLARES) EN EL AO DE 2004
Frecuencia Frecuencia Frecuencia

Valores que caen dentro

Conteo Frecuencia

del Intervalo

320- 370 320, 335, 340, 364

Absoluta

Absoluta

Relativa

Relativa

Acumulada

Simple

Acumulada

fi

Fi

hi

Hi

////

0.07

0.07

//// ///

12

0.13

0.20

//// //// /

11

23

0.18

0.38

//// ////

12

35

0.20

0.58

//// ////

10

45

0.17

0.75

//// ////

54

0.15

0.90

6
Total

60

0.10
1.00

1.00

376, 380, 382, 382, 393,

370- 420 400, 407, 409


424, 428, 432, 440, 440,

420- 470 450, 450, 453, 460, 462,


466
470, 470, 471, 475, 480,

470- 520 492, 500, 500, 501, 507,


512, 518

//

526, 528, 530, 537, 550,

520- 570 558, 560, 560, 560, 565


570, 574, 580, 587, 591,

570 620 600, 607, 613, 618


620- 670 625, 634, 645, 650, 660,
669

Total

//// /

Interpretacin:

13

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

f2

MSc. Alfonso Tesn Arroyo

:8

; 8 empleados de la empresa CAMPOSOL de Trujillo tienen sueldo mayor o igual que 370 pero
menor que 420 dlares.
F3
: 35 ; 35 empleados de la empresa CAMPOSOL de Trujillo tienen sueldos menores que 520
dlares.
h4 % : 20%; El 20% de los empleados de la Empresa CAMPOSOL de Trujillo tienen sueldo mayor o igual
que 470 pero menor que 520 dlares.
H5% : 0.75; El 75% de los empleados de la Empresa CAMPOSOL de Trujillo tienen sueldos menores
que 570 dlares.
GRAFICO PARA VARIABLES CUANTITATIVAS CONTINUAS.
Los grficos ms utilizados son: Histograma de frecuencias, Polgonos de frecuencia, Ojiva.
Histogramas. Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectngulos contiguos que tienen:
a) Sus bases sobre un eje horizontal ( eje de las x) con centros en las marcas de clase y longitud igual al
tamao de los intervalos de clase.
b) Las alturas proporcionales a la frecuencia ( Absoluta o relativa) tomados sobre el eje de las Y, a veces
conviene ms graficar en el histograma las frecuencias relativas en lugar de las frecuencias absolutas.
En este caso, la altura correspondiente a cada rectngulo que habr que levantar sobre el eje de
ordenadas ser el cociente entre la frecuencia relativa del mismo y la amplitud del intervalo. El nico
cuidado que debe tenerse es que el rea total del histograma sea igual a 1. Correspondiendo a la
suma total de reas de cada rectngulo.
Ejemplo N 3: Del cuadro N5 se tiene
GRAFICO N 3 : DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL DE TRUJILLO
SEGN INGRESO (EN DOLARES ) EN EL AO DE 2004

12
11
10
9
8
7
6
5
4
3
2
1

fi

320 370

420 470

520

570 620 670

Polgono de Frecuencias.- Son de dos tipos:

14

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

a) Si la variable es discreta , El polgono de frecuencias se obtiene uniendo los extremos superiores de


la barras.

b) Si la variable est agrupada en intervalo de clase, el polgono de frecuencia se obtiene uniendo los
puntos medios de las bases superiores de cada rectngulo.
GRAFICO N 5 POLIGONO DE FRECUENCIAS DE LA DISTRIBUCION DE 60 EMPLEDOS DE LA
EMPRESA CAMPOSOL DE TRUJILLO SEGN INGRESO (EN DOLARES) EN EL AO 2004

12
11
10
9
8
7
6
5
4
3
2
1

fi
Polgono

320 370

420 470

520

570 620 670

Polgono de frecuencia acumulada u Ojivas


Esta representacin es valida para variables estadsticas agrupadas en intervalos de clase.
En el eje de las abscisas representamos los distintos intervalos de clase que han de estar naturalmente
translapados. En el extremo superior de cada intervalo se levanta una vertical con altura igual a la
frecuencia (absoluta o relativa) acumulada, luego se unen los extremos superiores de las verticales con
segmentos rectilneos. As el polgono de frecuencias acumuladas absolutas alcanzar su mxima altura
en el ltimo intervalo.
Frecuencia

Freciencia

15

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

320- 370
370- 420
420- 470
470- 520
520- 570
570 620
620- 670
Total
60
55
50
45
40
35
30
25
20
15
10
5

Frecuencia.
Absoluta
fi
4
8
11
12
10
9
6
Total

Absoluta.
Acumulada
Menor Fi
4
12
23
35
45
54
60

MSc. Alfonso Tesn Arroyo


Absoluta
Acumulada
Mayor Fi
60
56
48
37
25
15
6

f
i

Ojiva Menor

320 370 420 470 520 570 620 670

60
55
50
45
40
35
30
25
20
15
10
5

Ojiva Mayor

Dlares
320 370 420 470 520 570 620 670
Ejercicio
2.1 Durante una semana, se ha medido diariamente el contenido de humedad correspondiente a 24
Dlares
paquetes de un determinado producto alimenticio, tomados al azar a la salida de una lnea de

envasado. Los resultados obtenidos son:


Lunes

8.20 8.05 8.53 8.48 8.15


8.36 8.76 8.64 8.34 8.15
8.37 8.51 8.83 8.51 8.68
8.52 8.18 8.35 8.08 8.79
Martes 8.61 9.30 8.59 8.32 9.08
9.14 8.58 8.66 8.33 9.13
8.52 8.81 8.70 8.41 8.69
9.20 8.68 9.08 9.07 8.46
Mircol 9.43 9.28 9.59 8.86 9.19
8.85 9.14 9.15 9.28 9.12
8.66 9.41 8.75 8.50 9.20
8.89 9.34 9.18 9.19 8.80
Elaborar una tabla de frecuencias, histograma

8.79 Jueves 8.97 9.21 8.86 8.76 9.55 9.38


8.91
9.02 9.53 8.75 9.21 9.50 9.58
8.32
9.61 9.28 9.64 8.76 9.48 9.09
8.49
9.15 9.28 9.05 9.40 9.58 9.46
8.43 Viernes 8.46 8.17 8.97 8.64 8.40 8.17
8.66
8.00 8.60 8.20 8.81 8.60 8.11
9.17
8.32 8.48 8.33 8.73 8.47 8.05
8.56
8.91 8.65 8.26 8.73 8.10 8.89
9.22
8.85
8.56
9.46
de frecuencias, polgonos de frecuencias y ojivas menor y

mayor. Interpretar: f2 , F3, h 4 %, H5 %.

16

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CAPITULO II
MEDIDAS DE POSICION.
Medidas de Tendencia Central
Son indicadores o Valores numricos que representan o describe la posicin o tendencia de todo un
conjunto de datos estadsticos, sirve como una base para medir y evaluar valores anormalmente altos o
anormalmente bajos ( o valores extremos).
Las medidas de tendencia central ms conocidas o importantes son: La Media Aritmtica, Mediana, Moda,
Media Geomtrica y la Media Armnica. etc.
I.- MEDIA ARITMTICA. ( X ) Es una medida de Tendencia Central ms utilizada en estadstica,
tambin se le conoce como el promedio de las observaciones u es el cociente que resulta de dividir la
suma de los valores de los datos entre el nmero de los mismos.
Para calcular la media aritmtica se debe tener en cuenta dos casos.
A)
Cuando los datos no se encuentran Tabulados
B)
Cuando los datos se encuentran tabulados
a) Media Aritmtica de datos no Tabulados
Sea
X

x1, x2 , . . . , xn , valores de la variable X. La media aritmtica simple de x representada por


es dado por:
Suma de Valores

( X) =

x1 x 2 x 3 ... x n
n

Nmero de valores
n

X =

xi
i 1

n
donde n es el tamao de la muestra o nmero de elementos del conjunto de observaciones.
Ejemplo. 1: Encuentre la media aritmtica del peso (g) de 5 mangos seleccionados al azar para su
control del peso que a continuacin se presentan: 250, 300, 350 ,250 , 280.
Solucin: Sustituyendo las observaciones en la frmula se tiene:
n

X =

xi =
i 1

250 300 350 250 280


5

Interpretacin: El peso promedio de los 5 magos es de 286 gramos .


Ejemplo. 2: Encuentre la media aritmtica de las edades de 5 estudiantes del Diplomado en Supervisin
en la Industria Alimentaria que a continuacin se detalla: 20, 23, 25 ,24 , 26.
Solucin: Sustituyendo las observaciones en la frmula se tiene:
n

X =

xi =
i 1

20 23 25 24 26
= 118/5 = 23.6
5

17

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Interpretacin: La edad promedio de los 5 estudiantes de titulacin es de 24 aos.

Ejemplo.-3: A continuacin de presenta los resultados de una encuesta realizada a 45 obreros de


empresa Pirmide de Chiclayo Abril 2004 , sobre sus ingresos en dlares.
63
89
36
49
56
64
59
35
78
43
53
70
57
62
43
68
62
26
64
72
52
51
62
60
71
61
55
59
60
67
57
67
61
67
51
81
53
64
76
44
73
56
62
63
60
Calcular el ingreso promedio de los encuestados.
n

X =

xi =
i 1

63 89 ... 63 60
2682
59.6
=
45
45

Interpretacin: El ingreso promedio de los 45 obreros de la Empresa Pirmide encuestados es de $ 59.6


b .- Media Aritmtica de datos Tabulados o Agrupados. Para calcular la media aritmtica para datos
tabulados se debe tener en cuenta el tipo de dato cuantitativo que puede ser discreto o continuo.
b1) Media para datos tabulados de variable discreta.
Sean: x1, x2 , . . . , xk , valores de la variable estadstica discreta X, con frecuencias absolutas
respectivas f1, f2 , . . . , fk, entonces la media aritmtica es el valor:
k
x1 f x2 ... f xk
f x
f
2
k
1) Y = 1
= Y= i i
i 1
n
n
k

2)

X =

hi xi

i 1

; Donde h1 , h2 hk son las frecuencias relativas respectivas.

Ejemplo. Calcular el promedio de artculos defectuosos.


CUADRO N 4. DISTRIBUCIN DE 100 LOTES DE ACUERDO AL NMERO DE ARTICULOS
DEFECTUOSOS.
Xi * fi
N de
Artc.Defec
Xi
1
2
3
4
5
6
7
8
Total

fi
5
14
18
25
20
10
5
3
100

5
28
54
100
100
60
35
24
406

18

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

Y=

Y=

MSc. Alfonso Tesn Arroyo

1x5 2 x14 3 x18 4 x 25 5 x 20 6 x10 7 x5 8 x3


f 1 x1 f 2 x2 ... f k xk
=
=
100
n
406
= 4.06 : Interpretacin: El promedio de artculos defectuosos por lote es de 4
100

b2. Media para datos tabulados por Intervalos.


Si n valores de alguna variable X ( discreta o continua ) estn tabulados en una distribucin de frecuencias
de k intervalos, donde y1 , y2 , . . . yk son las marcas de cada clase, y f 1, f2, , fk son las frecuencias
absolutas respectivamente, entonces, su media aritmtica es igual a:
k
f i yi

Y =
i 1
n
Ejemplo: Calcular la media aritmtica de los sueldos de los empleados de la Empresa CAMPOSOL de
Trujillo ( datos tabulados )
CUADRO N7 DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL DE TRUJILLO
SEGN INGRESO (EN DOLARES ) EN EL AO 2003
yi
fi
fi*yi

320 - 370
370 - 420
420 - 470
470 - 520
520 - 570
570 - 620
620 - 670
Total

345
395
445
495
545
595
645

4
8
11
12
10
9
6
60

1380
3160
4895
5940
5450
5355
3870
30050

Clculo de la media Aritmtica de los sueldos de los empleados


6

Y =

f i yi

i 1
n

fi yi

i 1
60

= 30050 / 60 = 500.83

Interpretacin : El sueldo promedio de los empleados de la Empresa CAMPOSOL de Trujillo fue


de 500.83 dlares.

II.- MODA ( MO ) .- Es el valor que con mayor frecuencia se presenta o se repite en un conjunto de
datos. La moda no siempre existe y no siempre es nica.
Para calcular la moda se tiene en cuenta dos casos:

19

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

a) Para Datos no Agrupados


Ejemplo1: Considere los pesos ( en kilos) de 10 estudiantes de Ingeniera

en Industria

Alimentara: 63, 78, 82, 85, 65, 72, 71, 81, 67, 83.
Respuesta En los 10 datos de los pesos de los estudiantes no existe moda.
Ejemplo 2: Considere la distribucin de los pesos de 15 estudiantes de la Escuela de Ingeniera
de Industrias Alimentarias:
68, 75, 74, 70, 82, 75, 72, 75, 81, 83, 75, 69, 63, 67, 75
Respuesta: La moda es 75, por que es el valor que ms se repite.
Ejemplo 3: Considere la distribucin del nmero de hijos por familia.
0, 1, 2, 3, 4, 5, 1, 2, 3, 3, 4, 2, 3, 2
Respuesta: El valor 2 y 3 ocurren 4 veces.
En este caso las distribucin se llamar bimodal.
En general, se tiene lo siguiente:
1) La distribucin que tiene una sola moda se llama unimodal
2) La distribucin que tiene dos modas se llama bimodal
3) La distribucin que tiene ms de dos modas se llama multimodal.
b) Para Datos Agrupados. Para calcular la moda en datos agrupados se calcula con la siguiente
frmula

f j 1

M0= Lj+ A

f j 1 f j 1

fj : Es la mayor frecuencia absoluta o repeticin ( fi )

fj-1 : Frecuencia absoluta inmediata anterior a fj

fj+1: Frecuencia absoluta inmediata posterior a fj.

Li : Extremo inferior del intervalo modal.

A : amplitud

Ejemplo:
CUADRO N 8: DISTRIBUCION
DE
yi
fi LA EMPRESA CAMPOSOL DE

DE 60 EMPLEDOS
TRUJILLO
SEGN
EN EL AO 2003
J=1
320
- 370 INGRESO
345 (EN DLARES)
4
J=2
J=3
J=4
J=5
J=6
J=7

370 - 420
420 - 470
470 - 520
520 - 570
570 - 620
620 - 670
Total

395
445
495
545
595
645

8
11fj-1
12 fj
10 fj+1
9
6
60

20

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Mo

Calculo de la Moda:

f j 1

10
10
= 470 + 50
= 470 + 50
= 494

11 10
21
f j 1 f j 1

M0= Lj+ A

Mo = 494
Interpretacin: El valor ms frecuente de los sueldos de los empleados de la Empresa CAMPOSOL de
Trujillo en el ao 2003 fue de 494 Dlares.

Ejercicio: Determinar la moda de la siguiente distribucin:


Intervalos
0, 1

Fi
3

1,

10

2,

17

4, 5
Total

8
5
43

III.- MEDIANA ( Me ) .- Es un valor que divide a un conjunto de observaciones ordenadas en forma


ascendente o descendente en dos grupos de igual nmero de observaciones.
La mediana es un valor posicional ( en comparacin con la Media Aritmtica), se ve menos afectada
por valores extremos dentro del grupo que la media. Esta propiedad de la mediana la convierte en
algunos casos, en una til medida de tendencia central.
Se calcula bsicamente en 2 formas.
1.- Mediana de datos no tabulados.
Para calcular la mediana de datos no tabulados existen dos casos.
a)

Cuando la variable en estudio es discreta y n (nmero de observaciones) es impar.


En este caso, la mediana ser el valor de la variable ordenada ya sea en forma ascendente
o descendente que ocupa la posicin media (rango de orden es ( n+1 )/2 ) o tambin se
puede expresar como X(n+1)/2 central.

21

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejemplo: Supongamos que el nmero de casos de cierta molestia en los meses de Julio de
los ltimos 7 aos fueron: 52, 41 , 37 , 82, 24, 63, 68 (n=7).
Solucin:
Ordenando estos valores de acuerdo a su magnitud se:
1ero 2do. 3ero
4to
5to
6to 7mo
24 , 37 , 41
52 ,
63 , 68, 82 .

50 %

mediana

50 %

Como n = 7 entonces.
El valor que ocupa la mediana es : ( n + 1)/2 = ( 7 + 1 )/2 = 4to. lugar; luego la mediana es el
valor que ocupa el 4to dato ordenado que divide a la serie en 2 grupos de 3 datos cada uno.
siendo este: Me = 52
Interpretacin: El 50% de los casos de molestia durante los ltimos 7 aos en el mes de
julio son menores que 52 casos y el 50% restante de los casos de molestia son mayores que
52 casos.
b) Cuando la variable en estudio es discreta y n (nmero de observaciones) es par.
En este caso, no existe en la ordenacin un valor de la variable que ocupe la posicin central,
esto es, la mediana es indeterminada, pues cualquier valor comprendido entre los valores que
n
n
1 , considerado como el centro de la de la ordenacin.
ocupen la posicin
y
2
2
El problema es resuelto tomando la media aritmtica de los valores ordenados que ocupan
n
n
1 , esto es:
las posiciones
y
2
2
Me

X n / 2 X (n / 2 1)
2

Ejemplo: Considere las observaciones muestrales.


24 , 41 , 63 , 24 , 68 , 82, 37
Ordenando estos valores en orden creciente tenemos.
1er 2do 3ero 4to 5to 6to
24 , 37, 41 , 63 , 68, 82
n
n
1 , esto es:
valores ordenados que ocupan las posiciones
y
2
2
n
n
1 = ( 6/2 + 1) = 4to.
= 6/2 = 3ero y
2
2
La mediana en este caso es el valor entre 41 y 63 , el cual es
X n / 2 X (n / 2 1)
41 63
52
Me
=
2
2
Interpretacin: El 50% de las observaciones muestrales son menores que 52 y el 50%
restantes son mayores que 52.
B) Mediana de datos tabulados. Para calcular la mediana para datos agrupados se calcula
con la siguiente formula.

22

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

2 F j 1
Me = Lj + A

fj

n = nmero total de datos.


Fj =Es una Fi inmediata superior a n/2
Fj-1 = Es una Fi inmediata inferior a n/2
Li = Extremo inferior al intervalo mediano ( IME)
IME= Es el intervalo que corresponde a Fj.
A= amplitud del intervalo mediano.

Ejemplo:
CUADRO N 9: DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL DE TRUJILLO
SEGN INGRESO (EN DOLARES) EN EL AO DE 2003

J=1
J=2
J=3
J=4
J=5
J=6
J=7

320 - 370
370 - 420
420 - 470
470 - 520
520 - 570
570 - 620
620 - 670
Total

2 F j 1
Me = Lj + A

fj

yi

fi

Fi

345
395
445
495
545
595
645

4
8
11
12 fj
10
9
6
60

4
12
23 Fj-1
35 Fj
45 Fj+1
54
60

60

2 23
= 470 + 50

12

Me

7
= 470 + 50
12

= 470 + 29.17

Me = 499.17

Interpretacin: El 50% de los empleados de la Empresa CAMPOSOL de Trujillo tienen


sueldos menores que 499.17 y el 50% restante de los empleados tienen sueldos mayores que
499.17 soles

RELACION ENTRE LA MEDIA MEDIANA Y MODA


1.- Si la distribucin de frecuencias es simtrica, entonces, la media, la mediana y la moda tienen el mismo
valor, esto es X = Me = Mo ( Figura N 01).
2.- Si la distribucin es asimtrica de cola a la derecha, entonces, la moda es menor que la mediana y esta
a su vez es menor que la media ( Figura N02); esto es
Mo Me X
3.- Si la distribucin es asimtrica de cola a la izquierda, entonces, la relacin es ( figura N 03)
Mo

X Me

23

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

X = Me = Mo

MSc. Alfonso Tesn Arroyo

X MeMo

Mo Me X

Cuartil ( Qi ).- Son medidas de posicin que divide en cuatro partes iguales a un conjunto de
observaciones o datos ordenados, o una distribucin de frecuencias. Se denota con la letra Q.
La primera cuarta parte o el 25% de una distribucin, recibe el nombre de primer cuartil (Q1).
La segunda cuarta parte o el 50% de una distribucin, recibe el nombre de segundo cuartil (Q2).
La tercera cuarta parte o el 75% de una distribucin, recibe el nombre de tercel cuartil (Q3).

Li . ......1/4 .......

2/4 ............3/4 ................ Ls

25%
50% .......... 75% ...........
Q1
Q2
Q3
Para calcular los cuartiles de datos agrupados se tiene en cuenta la siguiente frmula:

n(1 / 4) F j 1

fi

Q1 = Lj + A

n(1 / 2) F j 1
;
fi

Q2 = Lj + A

n(3 / 4) F j 1

fi

Q3 = Lj + A

PERCENTILES.
Los percentiles se encargan de dividir a una distribucin de frecuencias en 100 partes iguales y cada
punto determina el1% del total de datos. Su notacin es P.

Li

1/100 2/100 3/100 4/100 5/100 . . . . 99/100 ... LS

1%
2% 3%
4%
5% . . . .... 99%
P1
P2
P3
P4
P5 ............ P99
Para calcular los percentiles se utiliza la siguiente frmula.

n( k / 100) F j 1

fi

Pk = Lj + A

OTRAS MEDIAS.
MEDIA GEOMTRICA.- La media geomtrica de n valores positivos X1 , X2....., Xn es el valor X G

que

se define como la raz ensima del producto del producto de estos n valores. Esto es,

XG =

X 1 xX 2 x... Xn .

MEDIA ARMNICA.- La media armnica de n valores no nulos X1 , X2....., Xn es el nmero, X

que se

define como el recproco de la media aritmtica de los recprocos de esos n valores.


Esta medida se calcula de la siguientes manera.

24

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

n
X H=

x
i 1

La media armnica se utiliza mayormente en velocidades

CAPITULO III
MEDIDADAS DE VARIABILIDAD O DISPERSION.
Las medidas de variabilidad o dispersin, son aquellas que miden el grado de dispersin o concentracin
de los valores de datos, alrededor de alguna de las medidas de tendencia central.
Entre las medidas de dispersin ms utilizadas se tiene:
1) RECORRIDO O RANGO ( R). El recorrido de una variable estadstica es simplemente la diferencia
entre su valor mximo y su valor mnimo y e denota por: R= mx ( x ) - mn ( x )
La utilizacin del rango como medida de dispersin es muy limitado, si bien brinda una primera idea
acerca de la heterogeneidad de los datos, tiene el inconveniente que slo toma en cuanta los valores
extremos descuidando El conjunto de los valores intermedios.
Ejemplo: a continuacin se presentan un conjunto de datos de las edades de 10 alumnos del
Diplomado de Supervisin y Control en la Industria Alimentaria.
27, 29, 24, 28, 26 , 27, 28, 29, 27 , 25
El rango de los datos es:
R = 29 - 24 = 5 aos
2) VARIANZA.- Es la media aritmtica de los cuadrados de las desviaciones respecto a la media
aritmtica.
Desde un punto de vista prctico, es un valor muy engorros de interpretacin, por que las unidades
asignadas a ella son cuadrados, tales edades 2, soles2, dlares2, libras2 etc. Para convertir esta medida
de variabilidad en unidades originales, podemos tomar la raz cuadrada de s2 .
Se calcula de dos formas:
a)

Calculo de la Varianza para datos no Agrupados.


n
Xi X 2

a1).- V(x)= S2 =
i 1
n

25

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejercicio. Observado las edades en aos de un grupo de 4 nios atendidos en el Hospital Beln de
Lambayeque: 1, 3, 5, 7. Calcular la Varianza.

Solucin:
4

X =

xi = 1 3 5 7

=4

i 1
4
4
4
2
2
2
2
X X 2
S2 = i
= (1 4) (3 4) (5 4) (7 4) = S2= 5
i 1
4
4

b) Calculo de la Varianza para datos Agrupados


k
yi y 2 f i

2
V(X) = S =
i 1
n
Ejemplo: Calcular la varianza de los sueldos de los empleados de la Empresa CAMPOSOL de
Trujillo que a continuacin se dan en la siguiente tabla.

CUADRO N10: DISTRIBUCION DE 60 EMPLEDOS DE LA EMPRESA CAMPOSOL DE TRUJIILLO


SEGN INGRESO (EN DOLARES) EN EL AO DE 2003
yi
fi
Fiyi
(yi-y)2
fi*(yi-y)2
yi- y

320 - 370
345
4
1380
-155,83
24284,03
97136,11
370 - 420
395
8
3160
-105,83
11200,69
89605,56
420 - 470
445
11
4895
-55,83
3117,36
34290,97
470 - 520
495
12
5940
-5,83
34,03
408,33
520 - 570
545
10
5450
44,17
1950,69
19506,94
570 - 620
595
9
5355
94,17
8867,36
79806,25
620 - 670
645
6
3870
144,17
20784,03
124704,17
Total
60
30050
445458,33

Solucin: Para calcular la varianza se debe seguir los siguientes pasos.


1.-Clculo la media aritmtica :
6
k
fi yi
f i yi

=
Y =
i 1
i 1
n
60

= 30050 / 60 = 500.83

2.- Clculo la Varianza.

26

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

yi y 2 f i

S =

i 1

n
2
2
2
S2 = (345 500.83) (4) (395 500.83) (8) .... (645 500.83) (6) =
60

445458.33
=
60

7424.31
4) DESVIACIN ESTANDAR.- Es un indicador que nos determina el grado de normalidad de la
distribucin de los datos mustrales alrededor de la media aritmtica, dentro de sus valores
extremos mnimo y mximo.
La desviacin estndar o tpica se define como la raz cuadrada de la varianza.
A.- Datos no Agrupados.
n
n
X i X 2
X2

S=
S= i
i 1
I 1
X 2
n
n
Ejercicio. Observado las edades en aos de un grupo de 4 nios atendidos en El Hospital Beln
de Lambayeque: 1, 3, 5, 7. Calcular la desviacin estndar.
n
2
2
2
2
X X 2
S= i
= (1 4) (3 4) (5 4) (7 4) = 5 = 2.2360
i 1
4
n

Interpretacin: La variabilidad de las edades de los nios atendidos en el Hospital de Beln de


Lambayeque es de 2.24 aos.

B) Datos Agrupados

y i y 2 f i
k

S=

S2

i 1

V(X) = S =

y 2i f i

i 1
n

y 2

Ejemplo: Del ejemplo de los sueldos de la Empresa CAMPOSOL DE Trujillo calcular la


desviacin estndar.
S=

7427.64 = 86.16

Interpretacin: La variabilidad de los sueldos con respecto a la media de los empleados de la


Empresa CAMPOSOL de Trujillo es de 86.16 dlares.
5) COEFICIENTE DE VARIACION. Es una medida de variabilidad que indica el grado de homogeneidad
de la distribucin. Se considera que si el C.V. es menor que el 33% la distribucin es homognea,
caso contrario es heterognea . Se calcula de la siguiente manera
S
C.V =
* 100%
X

27

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejemplo: Calcular el Coeficiente de Variacin de los sueldos de los empleados de la Empresa


CAMPOSOL de Trujillo.
S
86.16
C.V =
=
= 0.17
X
500.83
Interpretacin: La distribucin de los sueldos de los empleados de la Empresa CAMPOSOL de Trujillo
es homognea por tener un coeficiente de variacin menor que el 33 %
Ejercicio de Aplicacin. En una serie de mediciones de la temperatura de un cuerpo realizadas con el
termmetro A, tiene media 12.01 y desviacin estndar, 0.027; mientras que con otro termmetro B, la
media de las mediciones fue 11.97 y la desviacin estndar, 0.014. Suponiendo que la persona que opera
los instrumentos no introduce sesgo alguno en las mediciones, Cul es el termmetro relativamente ms
consistente?
Solucin. El termmetro ms consistente es el que tiene menor coeficiente de variacin.
Termmetro A: CV =

S
0.027
=
= 0.0022 = 0.22%
X
12.01

Termmetro B: CV =

0.014
S
=
= 0.0012=
11.97
X

0.12%
Interpretacin: El coeficiente de variacin del termmetro A es 0.0022 ( 0.22%), mientras que para el
termmetro B este coeficiente es 0.0012 ( 0.12%), por lo tanto el termmetro B es ms consistente.
PRUEBA DE NORMALIDAD DE UNA DISTRIBUCION
Las pruebas para considerar normal una distribucin son la asimetra y curtosis.
ASIMETRIA:
En una curva normal, la media, mediana, y moda coinciden, AS= 0
Si la distribucin es sesgada a la izquierda la asimetra es negativa, si es sesgada a la derecha la
asimetra es positiva. El ndice de asimetra dado por PEARSON es.

Asimetria: As =

3(Y Me)
S

Si AS = 0: La distribucin es simtrica ( Fig. A)


Si As > 0 : La distribucin es Asimtrica Positiva ( Fig. B)
Si As < 0 : La distribucin es Asimtrica Negativa ( FIG. C)

X = Me = Mo
FIG: A

Mo Me X
FIG: B

X MeMo

FIG. C

28

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CURTOSIS: La curtosis se refiere a la altura de la distribucin; si una distribucin es ms apuntada de lo


normal, es Leptocurtica, en caso contrario es Platicurtica, el trmino medio es la Mesocurtica o normal
K=

Q3 Q1
2( P90 P10 )

Si K tiende a 0.25. la distribucin es normal. ( Mesocurtica)


Si K tiende a 0.5, la distribucin es (leptocurtica)
Si K tiende a 0 la distribucin es (platicurtica).
DIAGRAMA O GRAFICO DE CAJAS (BOXPLOT)
Este tipo de grfico es una representacin simple de la informacin obtenida que nos permite conocer:

La localizacin del centro de los datos( con la mediana).

La dispersin. ( con el rango intercuartil P75- P25).

La Simetra ( Observando la posicin de la mediana)

La extensin de los extremos( Con los segmentos que parten de los lados laterales.

La existencia de los valores aberrantes ( datos outliers en el idioma ingles que puede ser
dato incorrecto introducido al computador, puede ser una observacin diferente de la poblacin de la
cual viene el resto de las observaciones etc.)
La caja se construye graficando un rectngulo cuyos lmites son los cuartiles inferior (percentil 25) y
superior ( percentil 75), marcando la mediana con una lnea horizontal. Desde la caja se dibujan los
bigotes cuyos extremos son los lmites inferior y superior. Por fuera de los lmites se dibujan los puntos que
representan a los valores aberrantes, fuera del contexto o outliers.
GRAFICO DE CAJAS ( Box Plots)

Q1

Me= Q2

Q3

Donde:
Q1= P25, Q2=P50, Q3= P50, son los cuartiles o percentiles respectivamente. En el rectngulo se indica la
mediana, con un segmento vertical resaltado. De los datos que representan a los percentiles 25 y 75
parten, respectivamente, un segmento hasta el valor L=P25 1.5d, en donde d es el rango intercuartil y un
segmento hasta el valor U=P75+1.5d.
PASOS PARA LA CONSTRUCCIN DE UN GRAFICO DE CAJAS
1.- Ordenar los datos en forma ascendente o descendente.
2.- Calculo de la Mediana (Me).- Si existen n observaciones, el clculo de la mediana corresponde al valor
n/2 que crece segn regla anterior
3.- Cuartiles ( Qi ). El rango de un cuartil corresponde a n/4.
4.- Extremos ( L, U ). La observacin menor y la mayor. Corresponde a cada extremo de los nmeros
ordenados.
5.- Rango ( R ) o dispersin: Nmero mayor menos al menor . Es un valor muy afectado por la presencia
de los valores extremos

29

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

6.- Diferencia Intercuartil. ( dQ = Q3 - Q1 ). Es la distancia entre los cuartiles. Es un valor robusto


extremadamente resistente a los valores extremos.
7.- Limites ( Cercas ) y Valores Aberrantes o Outliers
Limite Superior = Cuartil Superior + 1.5 dQ = Q3 1.5(Q3 - Q1 )
Limite Inferior = Cuartil inferior 1.5 dQ = Q3 1.5 ( Q3-Q5 )
Los valores alejados de los lmites deben ser considerados aberrantes y han de ser examinados con
una atencin especial. Es importante detectar estos valores ya que dentro del anlisis estadstico
pueden tener un impacto importante sobre resultados y sus conclusiones.

Ejemplo: La siguiente figura un grfico de cajas correspondiente a 58 notas de los alumnos de un


curso de Qumica.

12

18
* *
19

20

Se observa que el centro de los datos es 9 ( la mediana ). El percentil 25 es 8, el percentil 75 es 12.


El rango intercuartil es 4. Las notas 19 y 20 son datos discordantes o outliers.
Ejercicio: Se obtuvieron los siguientes datos del nivel de glucosa en sangre medidos a 50 pacientes
diabticos. Los datos estn en milimoles por litro.
2.6
3.2
3.7
7.0
14.9

2.5
4.4
5.0
8.0
10.0

1.3
3.6
3.8
9.5
10.2

2.4
4.3
4.4
7.9
17.5

2.0
3.7
4.4
9.0
6.0

3.0
4.3
4.5
10.2
8.8

2.4
3.7
5.0
11.1
12.5

2.3
5.0
6.2
8.7
12.5

2.6
3.8
6.3
12.5
14.0

3.0
4.4
6.2
15.0
6.3

a) Elaborar un grfico de caja.

30

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CAPITULO III
INFERENCIA ACERCA DE LA CALIDAD DE PROCESOS
ESTIMACION DE PARAMETROS Y PRUEBAS DE HIPOTESIS

INTRODUCCION
ESTIMACION DE PARAMETROS
Los Mtodos de Inferencia Estadstica consisten en seleccionar una muestra aleatoria de la Poblacin, de
manera que a partir de la informacin que se obtenga de la muestra.
1) Determinar el valor del parmetro desconocido ,
2) Decidir si , alguna funcin de , es igual a algn valor preconcebido 0 de
El primero de estos procedimientos se denomina estimacin del parmetro
El segundo procedimiento se conoce como prueba de Hiptesis del parmetro . El mtodo de estimacin
de un parmetro puede ser puntual o por intervalo.
En el primer caso, la estimacin del parmetro es un nmero.
Mientras que en el segundo caso la estimacin incluye un intervalo en el que estn comprendidos los
valores del parmetro.
Un estimador puntual del parmetro es pues la funcin de la muestra

ESTIMACION PUNTUAL.
Un estimador puntual del parmetro es pues la funcin de la muestra variable aleatoria) , mientras que
una estimacin puntual es el valor Numrico del estimador.
Ejemplo

31

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Suponga que la variable aleatoria X tiene un distribucin normal con media desconocida . La media
muestral es un estimador puntual de la media poblacional desconocida .
Es decir X ,despus de seleccionar la muestra, el valor numrico es la estimacin puntual de
Ejemplo de Estimacin Puntual:
Por tanto, si X1 = 25, X2= 30, X3=29 y X4=31, entonces la estimacin puntual de es

25 30 29 31
28.5
4
De igual manera se puede encontrar el estimador puntual de la varianza etc.
x

ESTIMACION DE PARAMETROS POR INTERVALOS DE CONFIANZA


En muchas situaciones, la estimacin puntual de un parmetro no le ofrece informacin completa a un
investigador, ya que toda estimacin puntual debe ir acompaada con alguna medida de la dispersin de
la misma.
Intervalo de Confianza Estimado de Intervalo

Parmetro = Estimado error muestral


Se espera que el parmetro est dentro de los lmites de este intervalo

Limite Inferior

Limite Superior
Estimado

Ejemplo.
El promedio de las longitudes de cierto artculo es de 12 0.2m ([1.2 - 0.2, 1.2+0.2]) o que el candidato
obtendr el 64 3%(0.64 0.003) de las preferencias del electorado
El intervalo de confianza cuando n30, se calcula de la siguiente manera :

32

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo


X ( z1 / 2 ) n , X ( z1 / 2 ) n

Tabla de valores de Z
Coeficiente de confianza (1-)
0.90

0.1

Z/2
1.645

0.95

0.05

1.96

0.99

0.01

2.58

Ejemplo.
Una mquina de empaquetar bolsas de caf, esta calibrada para embalar bolsas cuyos pesos se
distribuyen normalmente con media 500g y desviacin estndar de 10g.
La maquina sufri un desperfecto y se desea calibrarla, para lo cual se desea saber el nuevo promedio
.Se toma una muestra aleatoria de 36 paquetes arrojando una media de 485g. Hallar un intervalo de
confianza de 95% de confianza para .

x 485g

10 g 1 - 0.95

0.05

0.025
2

Luego P Z z /2 0.025

El valor de z/2 que deja a su derecha un rea que representa una probabilidad igual a 0.025 es de z/2
=1.96
Por lo tanto el intervalo de confianza para con coeficiente de confianza es de =95% es

33

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

2.5%

10
10
I 485 - 1.96
, 485 1.96

36
36

I 481.73, 488.26

2 El intervalo de confianza cuando n<30, para una mediase calcula de la siguiente manera


X t1 2 n , X t1 2 n

S
Ejemplo
A continuacin se dan los pesos (g) de un pdto lcteo instantneo:
42.7

42.78

42.76

43.39

41.60

43.83

43.18

42.78

42.01

43.20

43.68

42.56

42.95

43.06

43.10

Hallar el intervalo al nivel de confianza del 99% para la media , de los pesos de todos los estudiantes del
colegio, se supone que los pesos se distribuyen normalmente

n 15 x 42.88
El valor de s es :
s

0.01

1 15
( xi x ) 2 0.5406

1
14

El valor de t1-/2, corresponde al cuartil en la distribucin estndar con 15-1 grados de libertad para lo cual

P t1 / 2 t t1 / 2 1 0.99

34

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

x t1 / 2

MSc. Alfonso Tesn Arroyo

s
s
, x t1 / 2
42.46 , 43.29
n
n

PRUEBA DE HIPOTESIS
Esta es otra parte de la estadstica inductiva o inferencial, llamada prueba de hiptesis,
significancia o procedimientos de toma de decisiones. La prueba de hiptesis, es otra manera de
abordar el problema de hacer una afirmacin acerca de un parmetro desconocido asociado con
una distribucin de probabilidades, basndose en una muestra aleatoria en lugar de hallar un
estimador para el parmetro a menudo es conveniente formular una hiptesis sobre el valor del
parmetro y luego usar la informacin de la muestra para confirmar o rechazar el valor de la
hiptesis con un nivel particular de confianza o seguridad.
El objetivo es brindar algunos mtodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa poblacin. Para
llegar a tomar decisiones estadsticas se debe partir de afirmaciones o conjeturas con respecto a
la poblacin en el que estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una
conjetura hecha sobre una poblacin o sobre sus parmetros deber ser
sometida a
comprobacin experimental con el propsito de saber si los resultados de una muestra aleatoria
extrada de esa poblacin, contradicen o no tal conjetura
Hiptesis estadsticas
Es cualquier afirmacin o conjetura que se hace acerca de la distribucin de una o ms
poblaciones.
La afirmacin o conjetura puede referirse bien a la forma o tipo de distribucin de probabilidad de
la poblacin o bien al valor o valores de uno o ms parmetros de la distribucin de la poblacin.
En este caso las hiptesis estadsticas consiste en suponer que los parmetros que definen a la
Poblacin toman determinados valores numricos.
Ejemplos:
1.
El promedio poblacional de la altura de los Peruanos es 1.6m. esto es:
1.60
2.
La varianza poblacional de los salarios de los obreros de la Industria Textil es:
S/. (500)2 esto es:
2 = (500)2 = 250,000
3.
La proporcin de unidades defectuosas de produccin por cierto proceso es menor o
igual a 8 por ciento, esto es:

P 0,08

Hiptesis nula (H0)


Se representa por H0, es la hiptesis que es aceptada provisionalmente como una verdad y cuya
validez ser sometida a verificacin o comprobacin experimental.
Hiptesis alternativa ( H1 )
Es la suposicin contraria a la hiptesis nula, se representa por H 1 y se acepta en el caso que la
hiptesis nula sea rechazada.

35

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


Ejemplo: Si se asume que

MSc. Alfonso Tesn Arroyo

es un valor del parmetro desconocido

de una poblacin cuya

distribucin se supone conocida, entonces son hiptesis nulas y alternativas respectivamente las
siguientes afirmaciones:

=0
H0: 0
H0: 0

1.

H0:

2.
3.

y
y
y

H1:

0
H1: > 0
H1: < 0

Prueba de Hiptesis Estadstica.


Es un proceso que nos conduce a tomar la decisin de aceptar o rechazar la hiptesis nula H 0, en
contraposicin de la hiptesis alternativa H 1 y en base a los resultados de una muestra aleatoria
seleccionada de la poblacin en estudio.
La hiptesis nula H0 es la primera hiptesis que se plantea y debe ser establecida de manera que
se especifique un valor 0 del parmetro en estudio. Por esta razn, algunos autores plantean
la hiptesis nula
H0 : = 0 an para los casos 2) y 3) del ejemplo anterior.
Tambin se puede definir como un ensayo de hiptesis o dcima de hiptesis, son procedimientos
que se usan para determinar, si es razonable o correcto, aceptar que el estadstico obtenido en la
muestra, puede provenir de la poblacin que tiene como parmetro, el formulado en H 0.
Tipo de pruebas de hiptesis
Las Pruebas de Hiptesis Estadsticas son de dos tipos:
(i)
Unilaterales y ( ii ) Bilaterales o dos colas.
Esta divisin se hace segn la regin de rechazo se localiza en una cola o en las dos colas de la
distribucin normal estndar.
El tipo de prueba depende bsicamente de la Hiptesis alternativa H1
1. Prueba Unilateral de Cola a la Derecha
Prueba de Hiptesis Acerca de la Media Poblacional
H0: = 0 contra H1 > 0

2. Prueba Unilateral de Cola a la Izquierda


H0:

= 0 contra H1 < 0

36

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

3. Prueba Bilateral o Dos Colas


H0:

= 0 contra H1 0

La experiencia indica que al tomar una decisin se puede cometer dos tipos de errores:
Errores de tipo I y tipo II
Al tomar la decisin de aceptar o rechazar la hiptesis nula H 0 :

0 en base a los resultados

obtenidos de una muestra aleatoria seleccionada de la poblacin en estudio; existen cuatro


posibles situaciones que determinan si la decisin tomada es correcta o incorrecta, como se
muestra en la siguiente Tabla:

DECISIN
Rechazar Ho
Aceptar H0

H0 ES
VERDADERA
Error de tipo I
Decisin Correcta

H0 ES FALSA
Decisin correcta
Error tipo II

Error de tipo I
Es el error que se comete al rechazar una Hiptesis nula H0 cuando sta es verdadera.
La Probabilidad de cometer un error de Tipo I se denota por :
=P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]
Error de tipo II
Es el error que se comete al aceptar una hiptesis nula H0 cuando en realidad es falsa.
La probabilidad de cometer un error tipo II se denota por

entonces:

P[error tipo II]=P[aceptar H0 cuando H0 es falsa]


Nivel de significacin de una prueba ( )
Es el subconjunto del espacio muestral que nos conduce a rechazar H 0 cuando es verdadero. Es
decir, es la probabilidad de cometer un error Tipo I.
=P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]
Los niveles de significacin ms usados en la prctica son:

= 0,05, =0,01

Potencia de una prueba


Es la probabilidad de tomar la decisin acertada de, rechazar H 0 cuando sta es falsa o de aceptar
H1 cuando sta es verdadera. La potencia de una prueba es calcula por 1- .
Regin crtica y regla de decisin

37

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Para aceptar o rechazar la hiptesis nula H 0, debemos conocer claramente tres aspectos: regin
crtica, el valor crtico y el estadstico de prueba:
a) El valor crtico. es el valor que separa a la regin de rechazo de la regin de aceptacin. Es el
primer valor de la regin crtica. El valor crtico depende del valor de y del enunciado de la
hiptesis alternativa H1. El valor crtico de una prueba puede considerarse tambin como el
riesgo que tiene el que decide cuando, al obtener un cierto valor del estimador, rechaza la
hiptesis nula.
b) La Regin Crtica.( o regin de rechazo), es el conjunto de valores para el estadstico de
prueba que nos llevar a rechazar la hiptesis nula. Est dado por el valor de .
c) Estadstico de Prueba. Es una variable aleatoria, cuyo valor se utiliza para rechazar H0 o
para aceptarla. Esta decisin depende en que regin cae el valor del estadstico de prueba.

Si el estadstico de prueba cae en la regin crtica, entonces rechazar H0.


Si el estadstico de prueba cae en la regin de aceptacin, entonces rechazar H0.

Cuando la hiptesis Nula( Ho) se rechaza con =0.05, diremos que el resultado es Significativo.
Cuando la hiptesis Nula( Ho) se rechaza con =0.01, afirmaremos que el resultado es
Significativo.
Procedimiento de la prueba de hiptesis
Previamente debe formularse el problema estadstico, determinar la variable en estudio y mtodo
estadstico adecuado para la solucin del problema.
El procedimiento general de la prueba de una hiptesis de parmetro
siguientes pasos:

se resume en los

1. Formular la hiptesis nula:H0 : = 0 y la hiptesis alternativa adecuada


H1: 0

H1: > 0

H1: < 0

2. Especificar el tamao
del nivel de significacin
3. Seleccionar la estadstica apropiada a usar en la prueba.
4. Establecer la Regla de decisin, determinando la Regin Crtica de la Prueba.
5. Calcular el valor del estadstico de la prueba de los datos de la muestra.
6. tomar la decisin de rechazar la hiptesis H 0 si el valor del estadstico de la prueba esta en
la regin crtica. En caso contrario no rechazar H0.
Casos de Pruebas de Hiptesis
1.

Pruebas de Hiptesis acerca de una media: Varianza


Sea

2 supuesta conocida.

X la media de una muestra aleatoria de tamao n seleccionada de una poblacin con

media y varianza 2 supuestamente conocida.


Si la poblacin es normal N(,2/n) para cualquier valor de n (n2). Si la poblacin no es
normal, pero el tamao de la muestra es suficientemente grande ( n 30), entonces, la
distribucin de

2
X es aproximadamente normal N(, /n). Consecuentemente la estadstica.

Z=

38

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Tiene una distribucin aproximadamente normal N(0,1).


Si se supone verdadera la hiptesis nula H 0 : = 0, la estadstica apropiada para la prueba de
H0 : = 0 contra cualquiera de las alternativas H1 : 0 o H1 : o o H1 : o es:
Z=

X
n

Cuya distribucin es aproximadamente normal estndar N(0,1), segn sea la poblacin normal
o no.
En consecuencia dado el nivel de significancia , o la probabilidad de error de tipo I, o la
probabilidad de rechazar Ho : = 0 cuando se supone que esta es verdadera, se puede utilizar
la distribucin de
Z= (

) para determinar una regin crtica.

Ejemplo N1.
Un determinado proceso de empaquetar un producto est controlado, si el peso medio del
producto empaquetado es de 400 gramos. Si en una muestra de 100 paquetes del producto se
ha encontrado que el peso medio es de 395 gramos, Se podra concluir que el proceso est
fuera de control a un nivel de significacin del 5%?. Suponga que el peso de los productos
empaquetados se distribuye normalmente con desviacin estndar de 20 gramos.
Solucin

1.- Formulacin de las Hiptesis


H0: = 400 gr
H1: 400 gr
2.- Nivel de significacin: = 0.05
3.-Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es Z=

n
4.- Regin Crtica: Para = 0.05; y una prueba bilateral con dos colas; en la tabla normal
N( 0,1) se encuentra el valor crtico
Z/2 =Z0.05/2 = Z0.025 = -1.96 Tambin es lo mismo:
Z1-/2 =Z1-0.05/2 = Z0.975 = 1.96

39

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

5.- Clculos de los datos se tiene.


n = 100; X = 395; = 20
Z=

395 400

= 20

100

5
2.5
2

6.- Decisin: Como el Zc = -2.5 Zt = -1,96, entonces rechazamos H0 y concluimos a un


nivel de significancia de 0.05 y afirmamos que la mquina no funciona adecuadamente, por
lo tanto, necesita un ajuste.
Ejemplo N2
Una mquina para enlatar conservas de pescado ha sido regulada para que el contenido de
cada lata sea de 16 onzas. Usando = 0.05, dira Ud. que la mquina ha sido
adecuadamente regulada, si una muestra de 36 latas dio un peso medio de 16.05 onzas y una
desviacin tpica de 1.5 onzas?

Ejemplo N3
De la experiencia de muchos exmenes de admisin a la Universidad Nacional Pedro Ruz
Gallo, se obtiene una calificacin media de 64 puntos, con una desviacin estndar de 8
puntos. De una muestra de 81 estudiantes que rindieron el ltimo examen. Se obtuvo una
calificacin media de 68 puntos. Utilizando = 0.01, puede asegurarse que los estudiantes
han elevado su rendimiento?
Solucin

Formulacin de las hiptesis :


H0: = 64 y la hiptesis alternativa adecuada
H1: > 64
2. Nivel de significacin: = 0.01
3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
X
Z=
n

40

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

4. Regin Crtica: Para = 0.01 y una prueba unilateral con cola a la derecha , en la tabla
normal N( 0,1) se encuentra el valor crtico
Z =Z0.01 = 2.33

0.99

5. Clculos: De los datos se tiene.


n=81, X = 68, = 8
X

Z=

68 64
8
81

= 4.4

Decisin: Como el ZC = 4.4 Zt= 2.33, entonces rechazamos H0 y concluimos que

6.

podemos asegurar que a un nivel de confiabilidad

del 99% que los postulantes han

elevado su rendimiento.
Ejemplo N4.
El gerente de la Empresa empresa de transportes E&S desconfa de la afirmacin de que la
vida til promedio de ciertos neumticos es de almenos 28 000 millas. Para verificar ese
argumento, la empresa instala 40 de esos neumticos en sus camiones y obtiene un ciclo de
vida medio de 27463 millas con una desviacin estndar de 1348 millas. Qu puede concluir
el gerente de ese dato, si la probabilidad de un error I se fija en cuando ms 0.05?
Solucin:
1.- Formulacin de las Hiptesis
H0 : 28 000 millas
H1 : 28 000 millas
2. Nivel de significacin: = 0.05
3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.

Z=

4. Regin Crtica: Para = 0.05 y una prueba unilateral con cola a la izquierda , en la tabla
normal N( 0,1) se encuentra el valor crtico

41

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Z =Z0.05 = -1.645

5.

Clculos: De los datos se tiene.


n=40 , X = 27 46368 , = 1 348
Z=

6.

27463 28000
= -2,52
1348
40

Decisin: Como -2,52 -1,645 entonces rechazamos H0 a un nivel de significancia de


0.05; en otras palabras se confirma la sospecha del gerente de la empresa de transportes
de que 28000 millas.

Ejemplo N5.
Una mquina llenadora de botellas de gaseosa; se supone que el volumen medio de gaseosa
en cada botella es de 32 onzas, con una desviacin estndar de 0.06 de onza. En una
comprobacin sistemtica para verificar que si la mquina funciona adecuadamente, se toman
aleatoriamente 36 botellas llenas y se advierte que contiene una media de 32.1 onzas. A un
nivel de significacin de 0.05, La mquina funciona adecuadamente ( o est bajo control)?
Solucin

1.- Formulacin de las Hiptesis


H0: = 32 onzas
H1: 32 onzas
2.- Nivel de significacin: = 0.05
3.-Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
X
Z=
n
4.- Regin Crtica: Para = 0.05; y una prueba bilateral con dos colas; en la tabla normal
N( 0,1) se encuentra el valor crtico
Z/2 =Z0.05/2 = Z0.025 = -1.96 Tambin es lo mismo:
Z1-/2 =Z1-0.05/2 = Z0.975 = 1.96

42

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

0.95

-1.96

1.96

5.- Clculos de los datos se tiene.


n = 36; X = 32.1; = 0.06
X

Z=

32.1 32

= 0.06

36

= 10

6.- Decisin: Como Zc =10 > Zt =1,96, entonces rechazamos la H0 a un nivel de significancia
de 0.05 y afirmamos que la mquina no funciona adecuadamente, por lo tanto, necesita un
ajuste.

2.- Pruebas de Hiptesis acerca de una media : Varianza

supuesta desconocida.

A) Poblacin no normal.
Si la poblacin no tiene distribucin normal, pero si el tamao de la muestra es grande ( n
X
30 ), se suele utilizar la estadstica Z=
n
Donde la desviacin estndar se estima puntualmente por S.

Ejemplo.
En la investigacin de varias denuncias respecto al aviso "Peso Neto 300gr"que aparece en
los frascos de caf molido" El Morenito", el comit de Defensa del Consumidor seleccion
una muestra de 36 frascos, la muestra arroj un peso neto medio de 298 g y una
desviacin estndar de 7.5 gr. Utilizando un nivel de significancia de 0.01, Qu conclusin
debe sacar el comit de Defensa acerca de la operacin de la compaa envasadora de
caf?
Solucin.
1.- Formulacin de las Hiptesis
H0: =300 gr
H1: 300 gr
2. Nivel de significacin: = 0.01

43

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

3. Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es. Z=


X
s

4. Regin Crtica: Para = 0.01 y una prueba unilateral con cola a la izquierda , en la
tabla normal N( 0,1) se encuentra el valor crtico
Z =Z0.05 = -2.33

0.99

=1%
-2.33

5. Clculos: De los datos se tiene.


n=36,

X = 298, = 7.5 S datos obtenidos de la muestra

t=

X
S
n

298 300

= 7.5

36

= -1.60

6.- Decisin: Como -1,60 -2.33; no se rechaza H0 ( se acepta H0), luego se puede
concluir que la compaa envasadora est cumpliendo con el peso neto enunciado.
B) Poblacin normal.
Sean X y S2 la media y la varianza de una muestra aleatoria de tamao n, seleccionada
de una poblacin con distribucin normal N ( ,2), donde y 2 son desconocidas.
X

Entonces, la estadstica. t = S

, tiene distribucin t-Student con n-1 grados de libertad:

Donde: t0 = t(1-) (n-1)


Ejemplo 1.
Las cajas de un cereal producidas en una fbrica, deben tener un contenido de 16 onzas.
Un inspector tom una muestra que arroj los siguientes pesos en onzas:
15.7, 15.7, 16.3, 15.8, 16.1, 15.9, 16.2, 15.9, 15.8, 15.6.
Indicar si es razonable que el inspector, usando un nivel de significacin del 5%, ordene se
multe al fabricante.
Solucin.

44

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

1.- Formulacin de las Hiptesis


H0: = 16
H1: < 16
2.- Nivel de significacin: = 0.05
3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
t=

X
s

, tiene distribucin t-Student con 9 grados de libertad.

4.- Regin Crtica: Para = 0.05 y una prueba de una cola a la izquierda, en la tabla
de probabilidades t-Student se encuentra t0= t() (n-1) = t(0.05)(9) = -1.833.
Observacin.
Si la cola estuviera hacia la derecha, entonces el valor de t se toma de la siguiente
manera: t(1-) (n-1) = t(0.95)(n-1)

-1.83

5.- Clculos: reemplazando en el estadstico de prueba los datos se tiene.


N =10,

X = 15.9 S= 0.231; Estos valores se calculan de la muestra.


15.9 16
= 0.231
= -1.368
n
10

tc = S

6. Decisin: Como tc = 1.368 > tT = -1.833; no se rechaza H 0 , por lo tanto se concluye


que no se multara al fabricante a un nivel de significancia del 5%, por estar bien los
pesos, la diferencia se debe al azar.
Ejemplo 2.
Se sabe que los ingresos quincenales de un gran nmero de individuos se distribuyen
normalmente con una media de S/ 152. En un estudio estadstico reciente una muestra aleatoria
de 9 individuos de esa poblacin ha dado los siguientes ingresos quincenales ( en soles):
158; 154; 152; 156; 151; 150; 153; 155; 157.
A nivel de significancia del 5% Ha cambiado el ingreso medio quincenal de tal poblacin?.
Solucin.
1.- Formulacin de las Hiptesis
H0: =152
H1: 152
2.- Nivel de significacin: = 0.05
3.- Estadstica: Poblacin normal con varianza conocida, la estadstica apropiada es.
X
t=
, tiene distribucin t-Student con 8 grados de libertad.
s n

45

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

4.- Regin Crtica: Para = 0.05 y una prueba bilateral con dos colas, en la tabla de
probabilidades t-Student se encuentra t0 = t(1-/2) (n-1) = t(0.975,8) = 2.306.

Zona de aceptacin

5.- Clculos: De los datos se tiene.


n= 9, X = 154 S= 2.7386 de la muestra
154 152
X
t= S
= 2.74
= 2.19
9
n

6. Decisin: Como 2.192.306; no se rechaza H 0 y se concluye que la media de los


ingresos quincenales no ha variado.
2.- Pruebas de Hiptesis acerca de dos medias:
Pruebas de hiptesis acerca de dos medias: Varianzas 12 y 22 supuestamente
conocidas.
Si las dos poblaciones son normales o no, pero n 1 y n2 son suficientemente grandes( n1 30 y
n2 30), entonces X Y tienen respectivamente
distribucin normal o aproximadamente
normal.
N(1, 2 -

Z=

12

2
2 ) . Luego, la estadstica.
n1 n2

X Y - ( 1 - 2)
12 / n1 22 / n 2

Ejemplo1: Dos grupos de trabajadores de una empresa Agroindustrial, han sido sometidos a
un entrenamiento por dos mtodos diferentes, que llamaremos A y B. Una vez terminada la
instruccin, para verificar la eficacia de los mtodos, se aplic un examen arrojando los
siguientes resultados:
Mtodo A

Mtodo B

x = 73.4

y = 70.3
46

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


S1 = 8
n1 = 50

MSc. Alfonso Tesn Arroyo

S2 = 10
n2 = 50

Utilizando un nivel de significancia de 0.05 puede asegurarse que las medias de ambos
mtodos no son iguales?
Solucin.
Como n1 30 y n2 30 entonces los datos se aproximan a una distribucin normal
tanto se puede aproximar a S1 1 y S2 2

y por lo

1. - Formula de hiptesis.
H0: 1 = 2 , (1 -2= 0)
H1: 2
2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con =0.05,
entonces:
P(Z z0 ) = 0.975
F(z0 ) = 0.975
z0 = 1.96
3.- Regin Crtica.

0.95

4. Clculo del estadstico "Z"


Por la frmula:
Z=

x y
12 22

n1 n2

73.4 70.3
64 100 =

50 50

1.71

5.- Toma de decisin. Como 1.71 no es mayor que 1.96, no se rechaza H 0 ( se acepta
H0) luego se puede concluir que las medias de ambos mtodos son iguales.
Ejemplo2. En un sistema acadmico universitario, se aplicaron dos mtodos A y B para la
enseanza de la Tecnologa de Alimentos; en un grupo de n 1 = 100 se aplic A y en otro de n 2 =
300 se aplic B. Las medias de las calificaciones obtenidas fueron:

x = 12 para A e y = 12.2 para

B. Puede admitirse que los mtodos de enseanza no difieren en los resultados y que las
diferencias encontradas en las muestras se deben al azar?. Por experiencias anteriores se conoce
que cada variable X e Y, que representan los resultados respectivos, tiene distribucin normal con
varianzas 3 y 3.12, respectivamente. Usar =0.01
Solucin.
1.- Formula de hiptesis.
H0: 1 = 2 , (1 -2= 0)
H1: 1 2 , ( 1 - 2 0 )

47

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

2.- Clculo del punto crtico"z0". Por ser una prueba de dos colas, con =0.01, pero
como es una prueba de dos colas se tiene /2=0.005 entonces:
P(Z z0 ) = 0.995
F(z0 ) = 0.995
z0 = -2.58
3.- Estadstica.
x y

Z=

12

2 =
2
n1 n2

4.- Regin Crtica

0.99

5.- El valor del estadstico, correspondiente a la diferencia de medias, es.


Z=

12 12.2
(3 / 100) (3.12 / 300)

0.9950

6.- Toma de Decisin: Como el valor de -0.9950 no cae en la regin de rechazo; podemos
considerar que la diferencia hallada entre las medias muestrales no es significativa al
nivel de 0.01.

CAPITULO IV
ANALISIS DE REGRESION LINEAL Y CORRELACION
ANALISIS DE REGRESION LINEAL
En la investigacin estadstica es muy frecuente encontrar variables que estn relacionadas o asociadas
entre s, es decir existen variables que se pueden explicar en funcin de otras variables.
Por ejemplo; el consumo de las familias depende de sus ingresos, el tiempo de servicios en el trabajo
depende de la edad, el peso de los alumnos depende de la estatura, el rendimiento acadmico del alumno
depende de las horas de estudio, las ventas dependen de la publicidad, etc., es decir existe una
dependencia mutua entre los diferentes fenmenos o acciones vinculados con el hombre.
A esta relacin de dependencia entre variables se le conoce con el nombre de regresin; que en resumen
consiste en observar en un determinado tiempo como ha influido el comportamiento de una variable en la

48

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

otra. Ajustando este comportamiento a una recta (recta de regresin) estaremos en condiciones de
efectuar predicciones para el futuro.
Cuando se tienen n observaciones bidimensionales, cada par de datos se puede expresar como pares
ordenados {(X1,Y1), (X2,Y2)......(Xn,Yn)}, que al graficarse en el plano cartesiano estos puntos forman una
NUBE DE PUNTOS que se le llama
DIAGRAMA DE DISPERSION que puede tomar diferentes formas:

Relacin lineal positiva

Relacin lineal negativa

Relacin no lineal

Ninguna relacin

En esta unidad trataremos de la parte bsica del tema de la regresin lineal simple determinado por la
funcin lineal : Y = b0 + b1 X

REGRESION LINEAL SIMPLE


Es una tcnica estadstica que analiza si los valores de una variable dependiente e independiente puede
predecirse mediante un modelo lineal.
Las variables implicadas en el modelo deben ser cuantitativas y continuas.
Para ajustar una lnea recta de Regresin, se considera la ecuacin de la recta:

Y = b0 + b1Xi; que tiene dos parmetros b0 y b1


Y = b0 + b1x i

b1
Unidad de X

49

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

b0
X

Donde : b0 = distancia que existe entre el origen de coordenadas y el punto de interseccin de la


recta con el eje Y
b1 = Coeficiente de Regresin (pendiente, proporcin de cambio)
X = Variable independiente. ( estimulo, de influencia, causa,)
Y = variable dependiente (respuesta, criterio, efecto)
Interpretacin del coeficiente b.
Si b1 0 : La tendencia lineal es creciente , es decir a mayores valores de X corresponden
mayores valores de y.
Si b1 0 : La tendencia lineal es decreciente, es decir, a menor valores de X corresponden
mayores valores de y.
Si b1 = 0 , entonces

Y = b0 . luego; Y permanece estacionario para cualquier valor de X, es

decir, no hay regresin.


Si los pares ( Xi , Yi ) se encuentran aproximadamente alineados, lo que indica que se puede ajustar una
lnea recta a los puntos; esto es, se puede hacer pasar una recta que est lo mas cerca de ellos. La
eleccin de tal recta puede hacerse por diversos mtodos, el ms simple es el que se realiza a mano
alzada. Este mtodo no es tan riguroso pues depende de la persona que lo ejecuta. Otro mtodo es el
que considera la recta que une los puntos ms extremos del grupo. Uno de los ms usados y que
describiremos a continuacin, es el mtodo de mnimos cuadrados.

ESTIMACION POR EL METODO DE LOS MINIMOS CUADRADOS :


Una tarea principal en el anlisis de regresin lineal, es estimar los parmetros b 0 y b1, cuyos valores
se determinan a partir de los datos bidimensionales. El mtodo de los mnimos cuadrados consiste en
hacer mnima la suma de los cuadrados de la diferencia entre los valores observados (y i), y los valores
estimados (

Y ) es decir:
SCD

(Y

Y ) 2 Sea mnima

El clculo de los estimadores de los coeficientes de regresin a partir de los datos muestrales, viene dado
por la siguiente expresin.

50

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

b1

MSc. Alfonso Tesn Arroyo

n XY ( Xi)( Yi )
n( X i2 ) ( Xi) 2
b0 Y b1 ( X )

Ejemplo de Aplicacin.
En un estudio de la relacin entre la publicidad por radio y las ventas de un producto durante 10 semanas
se han recopilado los tiempos de duracin en minutos de la publicidad por semana (X) y el nmero de
artculos vendidos (Y), resultando
Semana
1
2
3
4
5
6
7
8
9
10
Publicidad (X)
20
30
30
40
50
60
60
60
70
80
Ventas (Y)
50
73
69
87
108
128
135
132
148
170
a)Trazar el diagrama de dispersin, e indicar la tendencia
b) Calcular la recta de regresin de mnimos cuadrados con el fin de predecir las ventas.
c) Si en la novena semana se incrementara la publicidad en 5 minutos determine en cuanto se estima se
incrementen las ventas.
Solucin.
a) Al trazar el diagrama de dispersin, se observa que existe una relacin lineal positiva entre el nmero
de artculos vendidos y el tiempo de publicidad semanal por radio.
b) Para determinar la recta de regresin por el mtodo de mnimos cuadrados a partir de los datos, es
decir para calcular b0 y b1 se requiere realizar los siguientes clculos que se tienen a continuacin.

N de Artculos vendidos

DIAGRAMA DE DISPERSIN O NUBE DE


PUNTOS
180
160
140
120
100
80
60
40
20
0
0

10

20

30

40

50

60

70

80

90

Minutos de Publicidad

51

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

xy

x2

20

50

1000

400

2500

30

73

2190

900

5329

30

69

2070

900

4761

40

87

3480

1600

7569

50

108

5400

2500

11664

60

128

7680

3600

16384

60

135

8100

3600

18225

60

132

7920

3600

17424

70

148

10360

4900

21904

80

170

13600

6400

28900

500

1100

61800

28400

134660

Donde :

n = 10 ;
n

xi 2

Xi 500 ,
i 1
28400

i 1

yi 2

yi 1100 ,
i 1
134660 , x

i 1

xi.yi 61800

i1

500
50
10

1100
110
10

Estimando el parmetro b1:

n XY ( Xi )( Yi )
b1 =

n( X i2 ) ( Xi ) 2

10(61800) (500)(1100 )
=2
10( 28400) (500) 2

Estimando el parmetro b0 :
b0 = y b ( x ) = 110 - ( 2 )(50 ) = b0 = 10
Ecuacin de regresin estimada.

Y = 10 + 2 xi

C.- Incremento de las Ventas


c.1.- El valor estimado de las ventas en la novena semana es :
Si en la novena semana se invirti X = 70 minutos se espera vender.

9 = 10 + 2 ( 70 ) = 150 artculos
y

En la novena semana se espera vender 150 artculos.


c.2.- Si en la novena semana se incrementa el tiempo de la propaganda en 5 minutos, entonces, el
tiempo invertido con el incremento ser de X = 75 minutos la venta estimada ser de.
= 10 + 2( 75 ) = 160 artculos, entonces el incremento de las ventas despus
y

de aumentar los 5 minutos es de 160150= 10 artculos.

52

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejercicio propuesto.
1.- Los siguientes datos corresponden al ingreso mensual ( X) y egreso mensual ( Y ) de 10 profesores
estatales.
x
450
630
500
750
750
600
650
800
1000
850
y
420
600
500
730
720
580
600
750
850
800
a) Construir el diagrama de dispersin
b) Estimar la ecuacin de regresin y graficarla en el diagrama de dispersin.
b) En cuanto se estima el egreso mensual de un profesor que tiene un ingreso de 920 soles
mensuales.

CORRELACIN LNEAL
Es una parte de la Estadstica Descriptiva que tiene por objetivo investigar la relacin que hay entre dos o
ms variables estadsticas, determinar el sentido de relacin y cuantificar el grado de nivel de correlacin
entre las variables con respecto a sus coeficientes.

Coeficiente de correlacin
Es el valor numrico que da a conocer el grado de relacin que existe entre dos o ms variables. Se
representa por la letra r.
Propiedades

a)
b)
c)
d)
e)
f)

n xy ( x )( y )

n x ( x ) n y ( x)
2

1 r 1

Si r > 0 Correlacin Directa


Si r < 0 Se trata de una Correlacin Inverso Negativo.
Si r2 = 1 los datos forman una lnea recta.
Si r = +1 hay una correlacin perfecta (+)
Si r = -1 hay una correlacin perfecta (-)
Si r = 0 Los datos son incorrelacionados

Interpretacin Clsica ( Para valores positivos y negativos)


a) 0.00 < r < 0.20 es una correlacin no significativa.
b) 0.20 r < 0.40 es una correlacin baja.
c) 0.40 r < 0.70 es una significativa correlacin
d) 0.70 r < 1.00 alto grado de asociacin.
Ejemplo: Calcular el coeficiente de correlacin con los datos del ejemplo anterior para lo cual se requiere
realizar los siguientes clculos que se tienen a continuacin.
X
y
xy
X2
Y2
20

50

1000

400

2500

53

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


30

73

2190

900

5329

30

69

2070

900

4761

40

87

3480

1600

7569

50

108

5400

2500

11664

60

128

7680

3600

16384

60

135

8100

3600

18225

60

132

7920

3600

17424

70

148

10360

4900

21904

80

170

13600

6400

28900

500

1100

61800

28400

134660

Donde : n = 10 ;

Xi 500

yi 1100 ,

i 1
n

xi 2

MSc. Alfonso Tesn Arroyo

i 1

yi 2

28400

i 1

134660 , x

i 1

xi.yi 61800

i 1

500
50
10

1100
110
10

Clculo del coeficiente de Correlacin.

n xy ( x)( y )

n x ( x ) n y ( y )
2

10(61800) (500)(1100 )
10(28400) (500)2 10(134660) (110)2

Interpretacin: Existe un alto grado de asociacin entre los minutos de publicidad empleados en la radio y
el nmero de artculos vendidos, por lo tanto estas dos variables se pueden relacionar mediante una
funcin lineal y poder realizar pronsticos confiables, ya que los datos se ajustan muy bien a la recta
estimada.
Coeficiente de Determinacin.( R2 ).- Mide la proporcin o porcentaje de variacin existente en Y que es
explicada por la variacin de X, se expresa en trminos de porcentaje por 100*R 2 y se define por:

R2 1

(Y Y )

(Y Y )

Error de Estimacin (Se).- Es una medida de la cantidad media en que las observaciones reales Y varan
en torno a la recta de regresin. Y (regresin de Y/X ) viene dada por :
Se = S Y/X =

(Y Y )

n2

54

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

ESTIMACION DE INTERVALOS EN EL ANALISIS DE REGRESION


Uno de los fines bsicos del anlisis de regresin es proyectar y predecir valores de la variable
dependiente. Como hemos visto, una vez determinada la ecuacin de regresin, es sencillo hacer una
estimacin puntual de la variable dependiente con slo sustituir el valor de X en la ecuacin y resolver
sta para hallar Y . Pero adems, tambin se puede estar interesado en estimaciones de intervalo
que en muchas oportunidades son muy importantes.
Hay como mnimo dos estimaciones de intervalo que se suele asociar con los procedimientos de
regresin.

1.- Estimacin de Intervalo para el Valor Medio Y dado un valor de X. Se calcula de la siguiente
manera:
I:C: para y/x =

Y tSy = Y t(1-/2)Se

1 ( X i X )2

n ( X i X )2

; t con ( n-2)g.l.

Donde Y es el estimador puntual hallado a partir de la ecuacin de regresin original y el valor de t se


basa en un nivel de confianza elegido con n-2 grados de libertad. Hay n-2 grados de libertad porque
tenemos que calcular dos valores b 0 y b1 a partir de los datos maestrales. Perderemos dos grados de
libertad. Se es el error de estimacin.

2.- Intervalo predictivo para un valor nico de Y


I:C: para y/x =

1 ( X i X )2
n ( X i X )2

Y tSy = Y t(1-/2)Se 1

; t con ( n-2)g.l.

REGRESIN MULTIPLE
En la regresin simple, se investiga la relacin entre las variables independiente y dependiente. A menudo,
la relacin entre dos variables permite a una persona predecir con precisin la variable dependiente a
partir del conocimiento de la variable independiente. Por desgracia, muchas de las situaciones de la vida
real no son tan simples. Por lo regular, se necesita ms de una variable independiente para pronosticar
con precisin la variable dependiente . Cuando se emplea ms de una variable independiente o de
prediccin, el problema se convierte en uno para el anlisis de regresin mltiple. Los conceptos bsicos
siguen siendo los mismos, slo se utiliza mas de una variable independiente para pronosticar la variable
dependiente.
La Regresin mltiple comprende el uso de ms de una variable independiente para pronosticar una
variable dependiente.
En el anlisis de regresin mltiple se utilizan X con subndices para

representar a las variables

independientes ( X2,, X3, X4, . . . Xn. La variable dependiente se continua representando con Y. Teniendo la
siguiente ecuacin:

Y = bo + b2 X2 + b3 x3 + . . . + bn Xn Ecuacin de regresin mltiple

55

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ecuaciones normales cuando de tienen dos variables independientes y una variable dependiente.
= nb0 + b2 X 2 +b3

X
X

Y = b0 X 2 +b2

Y = b0 X 3 + b2

X
X

2
2

+ b3 X 2 X 3
X 3 + b3

2
3

Ejemplo:
Jaimito observa el gasto en publicidad, precio y volumen de venta de galones de leche de 10 semanas
elegidas en forma aleatoria. Los datos obtenidos se presentan en la siguiente tabla.
Semana

a)

Ventas( En Miles),
Y
1
10
2
6
3
5
4
12
5
10
6
15
7
5
8
12
9
17
10
20
Calcular la ecuacin de Regresin

Precio por Galn


X2
1.30
2.00
1.70
1.50
1.60
1.20
1.60
1.40
1.00
1.10

Publicidad( Cientos de
Dlares) X3
9
7
5
14
15
12
6
10
15
21

b)

Calcular e interpretar el Coeficiente de Regresin, determinacin, y error estandar

Solucin
Semana

X2

X3

X2Y

X3Y

X2X3

Y2

1
10
1.30
9
13
90
11.7
100
2
6
2.00
7
12
42
14.0
36
3
5
1.70
5
8.5
25
8.5
25
4
12
1.50
14
18
168
21.0
144
5
10
1.60
15
16
150
24.0
100
6
15
1.20
12
18
180
14.4
225
7
5
1.60
6
8
30
9.6
25
8
12
1.40
10
16.8
120
14.0
144
9
17
1.00
15
17
255
15.0
289
10
20
1.10
21
22
420
23.1
400
Totales
112
14.40
114
149.3
1480
155.3
1488
Medias
11.2
1.44
11.4
Reemplazando en las ecuaciones normales se obtiene los siguiente.
1) 112

X 22
1.69
4.00
2.89
2.25
2.56
1.44
2.56
1.96
1.00
1.21
21.56

X3
81
49
25
196
225
144
36
100
225
441
1522

= 10b0 + 14.4b2+ 114b3

2) 149.3 =14.4b0 +21.56b2+155.3b3


3) 1480 = 114b0 +115.3b2 + 1522b3

56

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Resolviendo las ecuaciones por cualquier mtodo, se obtiene los siguiente resultados: b 2 = -8.2476 ;
b3 = 0.5851

b0 = 16.4064

Sustituyendo en la ecuacin de regresin mltiple se tiene: Y = 16.41 8.25 X2 + 0.59 x3


Esta ecuacin resulta til para pronosticar las ventas de la prxima semana. Si se planea un precio
unitario de $ 1.50 y gastos de publicidad de $ 1000, el pronstico es de 9,930 galones; esto es.

Y = 16.41 8.25 X2 + 0.59 x3 = 16.41- 8.25(1.5)+ 0.59(10) = 9.93 ( miles de galones)


Correlacin Mltiple. Es otra herramienta que se utiliza para evaluar un modelo. Para mayor comodidad,
a menudo se da por su puesto el trmino mltiple en este contexto de la explicacin y se utiliza la
denominacin abreviada de coeficiente de determinacin. Se calcula de la siguiente manera.
R2 = 1-

(Y Y )
(Y Y )

= 1- 15.9/233.6= 1.0.068 =0.93 :

Interpretacin: El 93.2% de la varianza del volumen de ventas, estn influenciados por el precio por
galn de leche y los gastos de publicidad.

Error Estndar de Estimacin. Mide la cantidad estndar en que los valores reales (Y) difiere de los
valores estimados ( Y ). Es una medida de la cantidad media en que varan las observaciones reales
alrededor del plano de regresin y se calcula de la siguiente manera.
Sy..x2 x3 =

(Y Y )
nk

= Sy..x2 x3 =

15.901493
=
10 3

2.27 = 1.51

Interpretacin. La cantidad tpica en que el valor real de volumen de leche vendido difiere de lo
pronosticado mediante la ecuacin de regresin mltiple es de 1.510 galones.

57

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

CAPITULO V

Diseos Experimentales
INTRODUCCIN
Los experimentos son conducidos por los investigadores en todas las reas de estudio tanto para
descubrir algo sobre un proceso particular como para comparar el efecto de varias condiciones sobre
algn fenmeno. Por ejemplo, un analista de mercados podra estar interesado en saber si es que el tipo
de envoltura es un factor importante como criterio de seleccin de los consumidores, o un pedagogo
podra tener la intuicin de que los colegios con un nmero pequeo de alumnos por aula favorece la
educacin de ellos. Lo intuitivamente razonable para dilucidar estas interrogantes puede ser tomar
medias por tipo de envoltura o cantidad de alumnos por aula, para luego compararlas. Esto sin embargo
nos conduce a muchas interrogantes adicionales, por citar: Qu nmero de consumidores o alumnos
debern encuestar? Cuantos diseos o que cantidades de alumnos por aula se van a comparar?,
cuantos y cuales factores se van a controlar?, qu tipo de muestreo debe ser utilizado para tomar
las encuestas?, qu otros factores (aparte del tipo de envoltura o nmero de alumnos por aula) puede

58

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

afectar tanto a la demanda del producto o el nivel educativo?, qu tipo de anlisis efectuar?. Qu
diferencias de medidas sern consideradas importantes?, etc.

DISEO DE UN EXPERIMENTO
El diseo de un experimento es, la secuencia completa de pasos tomados de antemano para asegurar
que los datos apropiados se obtendrn de modo que permitan un anlisis objetivo que conduzca a
deducciones vlidas con respecto al problema establecido. Tal definicin de diseo de un experimento
implica, por supuesto, que la persona que formule el diseo entienda claramente los objetivos de la
investigacin propuesta.
NATURALEZA DEL DISEO EXPERIMENTAL.
En 1935, Sir Ronald A Fischer ech los cimientos de la materia que ha llegado a conocerse por el
ttulo de su libro The Design of Experiments. Desde entonces la teora del diseo experimental ha sido
considerablemente desarrollada y ampliada. Aplicaciones de esta teora se encuentran hoy en laboratorios
y en la investigacin en ciencias naturales, ingeniera y casi todas las ramas de las ciencias sociales.
PROPOSITO DE UN DISEO EXPERIMENTAL
El propsito de un diseo experimental es proporcionar mtodos que permitan obtener la mayor
cantidad de informacin vlida acerca de una investigacin, teniendo en cuenta el factor costo y el uso
adecuado del material disponible mediante mtodos que permitan disminuir el error experimental.
ERROR EXPERIMENTAL
El error experimental viene a constituir la variabilidad motivada por las diferencias que se producen
en los resultados de unidades experimentales tratadas en forma similar.
Las principales fuentes de error experimental son:
a.
La variabilidad inherente al material experimental (unidades experimentales).
b.
Falta de homogeneidad en la tcnica experimental.
c.
Errores de experimentacin.
d.
Errores de observacin y medicin.
e.
Efectos combinados de todos los factores extraos que puedan influir sobre los resultados del
experimento.
CONCEPTOS BASICOS DEL DISEOS DE EXPERIMENTOS.
TRATAMIENTO
Los tratamientos vienen a constituir los diferentes procedimientos, procesos, factores o materiales
y cuyos efectos van a ser medidos y comparados.
El tratamiento establece un conjunto de condiciones experimentales que deben imponerse a una
unidad experimental dentro de los fines del diseo seleccionado. Ejemplos:
Dosis del fertilizante, racin alimentaria, profundidad del sembrado, distanciamiento entre plantas,
variedad de un cultivo.
TESTIGO
El testigo es el tratamiento de comparacin adicional, que no debe faltar en un experimento; por
ejemplo, si se usan cinco tratamientos con fertilizante, el testigo puede ser aquel tratamiento que no
incluye fertilizante. La eleccin del tratamiento testigo es de gran importancia en cualquier investigacin,

59

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

este se constituye como referencial del experimento y sirve para la comparacin de los tratamientos en
prueba.
UNIDAD EXPERIMENTAL
La unidad experimental, es el objeto o espacio al cual se aplica el tratamiento en donde se mide y
analiza la variable que se investiga. En los experimentos pecuarios la unidad experimental por lo general
esta conformada por un animal (cuy, cerdo, pato, etc.), en los experimentos forestales la unidad
experimental en la mayora de los casos esta conformada por un rbol y en la mayor parte de las pruebas
de campo agrcolas, la unidad experimental es una parcela de tierra en lugar de una planta individual; es
en este ltimo caso que con frecuencia se presenta lo que se llama efecto de borde.
FACTOR.- Es un conjunto de tratamientos de una misma clase o caracterstica.
Ejemplo. Tipos de Riego(Aspersin, Goteo, Riego comn), Dosis de fertilizacin (25%, 50%, 75% niveles
de concentracin), variedades de cultivo, manejo de crianzas, etc.
ANALISIS DE LA VARIANZA
Es una tcnica estadstica que sirve para analizar la variacin total de los resultados experimentales
de un diseo en particular, descomponindolo en fuentes de variacin independientes atribuibles a cada
uno de los efectos en que se constituye el diseo experimental.
Est tcnica tiene como objetivo identificar la importancia de los diferentes factores tratamientos
en estudio y determinar como interactan entre s.

DISEO Y ANALISIS DE EXPERIMENTOS CON UN SOLO FACTOR O VIA


I. DISEO COMPLETAMENTE ALEATORIZADO (D.C.A )
En este diseo, los tratamientos en estudio se distribuyen al azar en todas las unidades experimentales;
siendo el nmero de repeticiones por tratamiento igual diferente. Este diseo se emplea cuando la
variabilidad en todo el material experimental es relativamente pequeo y uniformemente distribuido.
Ventajas:
Fcil de planear y analizar; adems es flexible en el empleo del nmero de tratamientos y repeticiones.
Finalmente, permite tener dentro del anlisis de varianza el mximo nmero de grados de libertad para la
suma de cuadrados del error.
Desventaja:
La principal desventaja que presenta este diseo est relacionado a la homogeneidad del material
experimental; el cual es difcil de encontrar en experimentos de campo, por lo que su uso se restringe con
mucha frecuencia a experimentos de laboratorio, all donde se pueda tener control de los efectos no
considerados en el estudio (ambiente, temperatura, luz, etc.)
Aleatorizacion.-En este diseo, la aleatorizacin de los tratamientos se realiza en forma irrestricta sobre
las unidades experimentales, as pues si tenemos 3 tratamientos T1, T2, T3, una posible distribucin
podra ser:
Modelo Estadstico
Modelo:
Yij
=

eij

60

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

Suma de
Cuadrados

Myy

Tyy

MSc. Alfonso Tesn Arroyo

Eyy

Donde: Yij = Valor observado en la j-sima repeticin para el i-simo tratamiento.


= Efecto de la media general.
i = Efecto del i-simo tratamiento
eij = Efecto aleatorio del error experimental
t = Nmero de tratamientos.
n = r1 + r2 + + rt .Nmero total de repeticiones de los -simo tratamientos.
El efecto del -simo tratamiento esta dado por i, siendo la expresin: i = i = , donde i es la media del
-simo tratamiento y la media general.
CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA IGUAL NUMERO DE OBSERVACIONES PARA
CADA TRATAMIENTO
Grados de
Suma de
Cuadrado
Razn
Fuente de
libertad
Cuadrados
Medio
F
Variacin
(gl)
(S.C)
( C.M)
Entre
Tratamiento
Error
Experimental
Total

t-1

Tyy

nt

Eyy

n-1

T=
E=

Tyy
t 1
Eyy
(n t )

T
E

R= =
RF

Ejemplo
En una determinada fbrica de galletas, se desea saber si las harinas de sus tres proveedores producen
la misma viscosidad de masa. Para ello produce durante un da nueve masas, tres de cada tipo de harina,
y se mide su viscosidad. Los resultados obtenidos son
Proveedor A
Proveedor B
Proveedor C
19
17
22
23
18
21
21
21
24
63
56
67
Puede decirse que existen diferencias en las viscosidades obtenidas?
No satisfechos con el resultado, se repite el experimento quince das ms tarde, con los siguientes
resultados.
Proveedor A
Proveedor B
Proveedor C
24
22
27
23
20
25
25
24
23
Considerando estos resultados, junto con los obtenidos anteriormente, cambia nuestra conclusin sobre
la influencia del proveedor en la viscosidad obtenida?.
Solucin
Paso N 1.- Planteamiento de Hiptesis.
Hiptesis nula
H0: i = 0 i = 1 = 2 .... 3 ; i =1,2..,3
Hiptesis alternativa H1 : No todos los i son iguales.

61

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Paso N 2.- Nivel de significacin. = 0.05

Paso N 3.- Clculo de Ecuaciones Para el Anlisis de Varianza


1) Suma Total de Cuadrados
Y 2 = Suma total de cuadrados

Y = y
2

nt

i 1 j 1

2
ij

: ( 19 )2 + (23 )2 + ... + (21)2 +(24)2 = 3886

2) Suma de Cuadrados debido a la Media ( Myy)


t
(186) 2 (34596)
Ti 2
T2

3844
Myy = = i 1
=
=
(3)(3)
9
tr
tr
3) Suma de Cuadrados entre Tratamientos ( Tyy)
t

SCT = Tyy

i 1

Myy =

Tyy = 3864.66

11594
(63) 2 (56) 2 (67) 2
3844
3844 =
3
3

- 3844 = 20,667

4) Suma de Cuadrados del Error Experimental ( Eyy )


Y 2 - Myy Tyy
S.C.E = Eyy =
= 3886 - 3844 - 20.667
Eyy = 21.33

CUADRO DE ANALISIS DE VARIANZA (ANVA)


Fuente de Variacin

Grados de
libertad
(gl)

Suma de
Cuadrados
(S.C)

Cuadrado Medio
( C.M)

Razn
F

Entre Tratamiento

20.667

10.33

F= 2.90

Error Experimental

21.33

3.56

Paso N 4.- Regin Crtica: Para = 5% t-1 = 3 1 = 2 y n t = 9 3 = 6


F ( t-1 , n-t) = ( F0.05; 2 , 6 ) = 5.14
Luego la regin crtica de la prueba de tamao = 5% ser
C= Fcal: Fcal < 5.14

se tiene:

Paso N 5.- Decisin: Como Fcal = 2.90 < Ftab = 5.14, entonces no se rechaza Ho, y Concluimos que no
existen diferencias significativas en las viscosidades de la harina a un nivel del 5% de error.
Tarea
Para verificar si nuestra conclusin cambia sobre la influencia del proveedor en la viscosidad obtenida
despus de los 15 das, se debe realizar la prueba con los nuevos datos.
Ejemplo
Un investigador desea indicar los efectos relativos de 4 tratamientos respecto a la vida activa de un tipo
particular de bateras trmicas. Para el experimento se dispone de 20 bateras
relativamente
homogneas, las bateras se asignaron aleatoriamente a los 4 tratamientos; con la restriccin de que a
cada tratamiento le corresponde 5 bateras.

62

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

Niveles o Tratamientos
II
III
IV
74
68
71
74
69
71
74
69
72
74
69
72
75
70
73
371
345
359

I
73
73
73
75
75
369

Observacin

Total

MSc. Alfonso Tesn Arroyo

Solucin
Paso N 1.- Planteamiento de Hiptesis.
Hiptesis nula
H0: i = 0 i = 1 = 2 .... 4 ; i =1,2..,4
Hiptesis alternativa H1 : No todos los i son iguales.
Paso N 2.- Nivel de significacin. = 0.05
Paso N 3.- Clculo de Ecuaciones Para el Anlisis de Varianza
1) Suma Total de Cuadrados

Y = Suma total de cuadrados


Y = y : ( 73 ) + (73 ) + ... + (72)
2
2

nt

i 1 j 1

2
ij

+(73)2 = 104352

2) Suma de Cuadrados debido a la Media ( Myy)


t
(1444) 2
Ti 2
T2
Myy = =
=
=
= 104 256.8
i 1
(4)(5)
tr
tr
3) Suma de Cuadrados entre Tratamientos ( Tyy)
t

SCT = Tyy

i 1

Myy =

(369) 2 (371) 2 ... (359)


=
- 104 256.8
5
521708
104256.8
5
Tyy = 104 341.6 - 104 256.8 = 84 .8
=

4) Suma de Cuadrados del Error Experimental ( Eyy )


S.C.E = Eyy =

Myy

Tyy

= 104 352 - 104 256.8 - 84.8


Eyy = 10.4

CUADRO DE ANALISIS DE VARIANZA (ANVA)


Fuente de Variacin

Grados de
libertad
(gl)

Suma de
Cuadrados
(S.C)

Cuadrado Medio
( C.M)

Razn
F

63

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Entre Tratamiento

84.8

28.27

Error Experimental

16

10.4

0.65

Paso N 4.- Regin Crtica: Para = 5% t-1 = 4 1 = 3 y n t = 20 4 = 16


F ( t-1 , n-t) = ( F0.05; 3 , 16 ) = 3.24
Luego la regin crtica de la prueba de tamao = 5% ser
C= Fcal: Fcal 3.24

F= 43.49

se tiene:

Paso N 5.- Decisin: Como Fcal = 43.49 Ftab = 3.24, entonces se rechaza Ho, y Concluimos con un nivel
de 5% que existe diferencias significativa en la vida activa del tipo particular de bateras trmicas.

ESTIMACION DE PARAMETROS PARA DESIGUAL NMERO DE OBSERVACIONES


1) SUMA TOTAL DE CUADRADOS

= Suma total de Cuadrados


nt

Y 2 = yij2 : Suma de los cuadrados de todas las observaciones.


i 1 j 1

nt : N de observaciones.
2) Suma de Cuadrados debido a la Media ( Myy)
T2

Myy =

i 1
t

i 1

i 1

3) Suma de Cuadrados entre Tratamientos ( Tyy)


t

Tyy =

i 1

- Myy =

r (y Y)
i

i 1

ri

4) Suma de Cuadrados del Error Experimental ( Eyy )

Eyy =

- Myy Tyy

CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA DESIGUAL NUMERO DE


OBSERVACIONES
Fuente de Variacin

Grados de libertad
(gl)

Suma de Cuadrados
(S.C)

Cuadrado Medio
( C.M)

Razn
F

64

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

t-1

Tyy

(r 1)

Eyy

Entre Tratamiento
t

Error Experimental

MSc. Alfonso Tesn Arroyo

T=

Tyy
t 1

R=

T
=
E

Eyy

E=

i 1

(r 1)
i

RF

i 1

i 1

Total

Ejemplo:
Se realiz un experimento para estudiar el efecto de la condicin de almacenamiento sobre el contenido
de humedad en madera blanca de pino, se investigaron 5 mtodos de almacenamiento con varios
nmeros de unidades experimentales, obtenindose los resultados que se presentan a condicin:
a) Se puede afirmar que la variabilidad de las condiciones de almacenamiento es la misma para cada
nivel?. Use =0.01
b) La evidencia estadstica nos permite afirmar que almenos una de las condiciones de almacenamiento
difiere de los dems. Use =0.05
Tratamientos ( Condiciones de
Humedad)

Observacin

M1
7.3
8.3
7.6
8.4
8.3
39.9

M2
5.4
7.4
7.1

M3
8.1
6.4

M4
7.9
9.5
10.0

M5
7.1

19.9

14.5

27.4

7.1

Solucin
1.- Planteamiento de Hiptesis
Hiptesis nula
:H0 : i = 0 i = 1 = 2.... 4 ;i = 1,2,...,4
Hiptesis alternativa : H1 : No todos los i son iguales.
2.- Nivel de significacin. = 0.05
3.- Criterio:
Rechace la hiptesis nula si F T 3.63, que es el valor de F 0.95, para t -1 = 5 1= 4 y

(n
i 1

1)

= 9: ( F0.95; 4 , 9 )=3.63 grados de libertad, donde F debe determinarse por medio de un anlisis de
varianza; si no, acptala.
4 CLCULO Y ESTIMACIN DE LOS PARMETROS.
1) Suma Total de Cuadrados

65

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

= Suma total de cuadrados

nt

Y 2 = yij2 : ( 7.3 )2 + (8.3 )2 + ... +(7.1)2 = 863.36


i 1 j 1

2) Suma de Cuadrados debido a la Media ( Myy)


Myy = =

T = T 2 =
ri
r
2

i 1

(108.8) 2
= 845.53
(14)

2) Suma de Cuadrados entre Tratamientos ( Tyy)


t

SCT=

Tyy

i 1

Myy =

(39.9) 2 (19.9) 2
(7.1) 2
+
+ ... +
- 845.53
5
3
1

521708
104256.8
5
Tyy

856.1936 - 845.53 = 10.66

4) Suma de Cuadrados del Error Experimental ( Eyy )

S.C.E

= Eyy =

- Myy Tyy
= 863.36 - 845.53 - 10.66 = 7.17

Eyy = 7.17

CUADRO DE ANALISIS DE VARIANZA (ANVA)


Fuente de
Variacin

Grados de
libertad
(gl)

Suma de
Cuadrados
(S.C)

Cuadrado Medio
( C.M)

Razn F

Entre Tratamiento

10.66

2.67

F= 2.67/0.80

Error Experimental
Total

9
20

7.17
863.36

0.80

F= 3.34

66

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

5.- Decisin: Como Fc= 3.34 Ft =3.63, el valor de F 0.95 para 4 y 9 grados de libertad, la hiptesis nula no
se rechazarse: en otras palabras los efectos medios de los tratamientos en lo que se refiere a humedad
no son significativos ( o sea que los tratamientos o efectos medios de los tratamientos son iguales). (no
vara un tratamiento uno de otro) ( no hay significancia estadstica).
II. DISEO EN BLOQUES COMPLETAMENTE ALEATORIZADO (D.B.C.A)

Es aqul en el que:
1.- Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que las unidades
experimentales dentro de un bloque sean relativamente homogneas y que el nmero de unidades
experimentales dentro de un bloque sea igual al nmero de tratamientos por investigar, y
2.- Los tratamientos se asignan al azar a las unidades experimentales dentro de cada bloque. En lo
anterior, la formacin de los bloques refleja el criterio del investigador respecto a las respuestas
diferenciales potenciales de las diversas unidades experimentales, mientras que el procedimiento de
aleatorizacin acta como una justificacin de la suposicin de independencia.
Modelo Estadstico
Modelo: Yij
Suma de
Cuadrados

= Myy

Bi
+

Byy

eij

Tyy

Eyy

Donde:

Yij = Valor observado en la i-sima repeticin para el i-simo tratamiento.


= Efecto de la media general.
Bi = Efecto del i-simo bloque.
j = Efecto del j-simo tratamiento
eij = Efecto aleatorio del error experimental
t = Nmero de tratamientos.
r = Nmero de repeticiones del -simo tratamiento.
El efecto del -esimo bloque esta dado por Bi , siendo la expresin:
Bi = i. = , donde i es la media del i-esimo bloque y la media general.
El efecto del j-esimo tratamiento esta dado por j , siendo la expresin: j = j = , donde j es la
media del j-esimo tratamiento y la media general.
CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA UN (DBCA)
Fuente de
Variacin

Grados de
libertad (gl)

Suma de
Cuadrados (S.C)

Entre
Tratamiento
(Columnas)

t-1

Tyy

Cuadrado Medio
( C.M)
T=

Tyy
t 1

Razn
F
R1=

T
=
E

Entre

67

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


Bloques
(filas)

b-1

Byy

Error
Experimental

(t-1) (b-1)

Eyy

Total

tb-1

MSc. Alfonso Tesn Arroyo

B=

Byy
b 1

E=

Eyy
(b 1)(t 1)

R2=

B
E

R F

Ejemplo: Se diseo un experimento para estudiar el desempeo de cuatro detergentes diferentes para
limpiar inyectores de combustible. Las siguientes lecturas de limpieza se obtuvieron con un equipo
especialmente diseado para 12 tanques de gas distribuidos en tres diferentes modelos de motores:
Considerando a los detergentes como tratamiento y los motores como bloques, obtenga la tabla apropiada
de anlisis de varianza y pruebe en el nivel de significancia de 0.01 si hay diferencias en los detergentes
en los motores
Solucin
Paso N1.- Planteamiento de Hiptesis.
Tratamiento
Bloque

Deterg
A

Deterg
B

Deterg
C

Deterg
D

Total
Ti.

Promedio
Y i.
45.5
44
51.75

Motor 1
45
47
48
42
182
Motor 2
43
46
50
37
176
Motor 3
51
52
55
49
207
Total T. j
139
145
153
128
565
46.33
48.33
51
42.67
Promedio Y . j
a) Tratamientos
H OT : j = 0 = (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio) .
j = 1,2, ..., t
: j = 0

H 1T : j 0 ( No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)


b) Bloques.
H OB : Bi = 0 = ( Todos los Bloques tienen el mismo efecto sobre la variable en estudio) . j = 1,2, ..., t
: i = 0
B
1

H : Bj 0 ( No todos los Bloques tienen el mismo efecto sobre la variable en estudio)


Paso N2.- Nivel de significancia: = 0.01
PASO N 3 Construccin de la Tabla del ANVA.
Calculo de ecuaciones para el Anlisis de Varianza.
1) Suma Total de Cuadrados

= Suma total de cuadrados


t

nt

Y = y
2

i 1 j 1

2
ij

= (45)2 + (47)2 + ... + (49)2 = 26867

2) Suma de Cuadrados debido a la Media ( Myy)

68

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

S.C.M= Myy =

319225
Ti 2 T 2 (565) 2
=
=
= =
i 1
bt

bt

12

3* 4

Myy = 26602.083
3) Suma de Cuadrados entre Bloques ( Byy)
b

S.C.B. = Byy =

i 1

2
j

- Myy =

t
(182) 2 (176) 2 ( 207)
106949
=
- 26602.083 =
-26602.083 =
4
4

Byy = 135.167.
4) Suma de Cuadrados entre Tratamientos ( Tyy)
t

S.C.T=Tyy =

T
i 1

139 2 (145) 2 ... (128) 2


-Myy =
-26602.08
3

b
= 267136 26602.083 = 110.917

5) Suma de Cuadrados del Error Experimental ( Eyy )


2
Eyy = Y - Myy - Byy Tyy
= 26867 26602.083 -135.167-110.917 = 18.833
Eyy = 18.833
CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA UN (DBCA)
Fuente de
Variacin

Grados de
libertad
(gl)

Suma de
Cuadrados
(S.C)

Cuadrado
Medio
( C.M)

Entre
Tratamiento
(Columnas)

110.917

36.972

Entre
Bloques
(filas)

135.167

67.584

RB= 21.530

18.833

3.139

R F

12

271391.917

Error
Experimental
Total

Razn
F
RT=11.778

PASO N 4 : Regin Crtica. Para = 1%,


i) Para los Tratamientos : t-1=3 ; (t-1)(b-1)= 6
En la tabla F se encuentra.
F tab = F 1% (3, 6) = 9.78
T
T
T
C = FCal : FCal Ftab = 9.78
T

Se rechaza H 0 en los tratamientos

69

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

ii) Para los Bloques: b-1 =2 ; (t-1)(b-1)= 6


F tab = F 1% (2, 6) = 10.9
Entonces la regin crtica de la prueba de tamao ser.
T

C B = FCal : FCal Ftab =10.92


B

Se rechaza H 0 en los Bloques.

PASO N 5 : Conclusin :
T
T
i) Si FCal Ftab = F ( t 1, ( t-1)( b 1)), se rechaza H 0 y se concluye con un riesgo de =0.01 de
que existe diferencia entre las medias de tratamientos y consecuentemente existe influencia del tipo de
detergente en el desempeo de la limpieza de inyectores.
B
B
ii) Si FCal Ftab = F ( b 1, ( t-1)( b 1)), se rechaza H 0 y se concluye con un riesgo de =0.01 de
que existe diferencia entre las medias de bloques y consecuentemente hay influencia o diferencia
significativa en el en el tipo de motor al cual se esta haciendo la limpieza

III. DISEO DE EXPERIMENTOS CON DOS FACTORES O DOS VIAS


En el anlisis de varianza con dos criterios de clasificacin o Factores los datos de la muestra son
clasificados por medio de un arreglo rectangular en el cual las columnas representan los niveles de un
factor A y las filas los niveles del factor B. Cada combinacin de fila y de columna define una celda en el
arreglo. Entonces se tiene Kr celdas.
El anlisis de varianza de dos factores se clasifica segn el nmero de observaciones en las celdas. Si
cada celda contiene una sola observacin de la muestra, el modelo se denomina sin replicas ( o sin
repeticin ). En cambio, si cada celda contiene dos o ms observaciones de la muestra, el modelo se
denomina con replicas ( o con repeticin).
El modelo de clasificacin de dos factores y sin replica es similar al modelo de clasificacin de un solo
factor aleatorizado en bloques. En este caso los niveles de uno de los factores son los bloques.
En el modelo de clasificacin de dos factores, las dos variables son independientes, es decir no hay
interaccin entre los dos factores. Slo hay interaccin si se toman las observaciones mltiples en las
diversas combinaciones de los dos factores.
En el modelo de clasificacin de dos factores con replicas los tratamientos no son independientes. En este
caso si hay interaccin de los factores.
a) ANALISIS DE VARIANZA DE DOS FACTORES SIN REPETICION.
Este modelo es exactamente igual que el modelo de clasificacin de una variable en bloques
completamente aleatorizados, excepto la interpretacin de los datos.
En el modelo de clasificacin de una variable en bloques completamente aleatorizados solo investigamos
los efectos de los tratamientos la variable independiente Aj; los bloques fueron considerados meramente
como material experimental. En cambio en el modelo de clasificacin en el modelo de clasificacin de dos
variables sin repeticin, los tratamientos y bloques son variables aleatorias independientes y son
evaluados simultneamente. En consecuencia mientras que Aj son tratamientos en el modelo de
clasificacin de una variables bloques completamente aleatorizados, los tratamientos en el modelo de
clasificacin de dos variables son realmente combinaciones de tratamientos, B i Aj.

b)
ANALISIS DE VARIANZA DE DOS FACTORES CON REPETICION.
El anlisis de varianza con dos factores o criterios de clasificacin, con replica o repeticin, conocido
tambin como diseo completamente aleatorizado de dos factores, se basa en un arreglo rectangular de
las observaciones, en el que las c columnas representan los niveles o tratamientos del factor A y las r filas

70

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

los niveles o tratamientos del factor B. Cada combinacin de tratamiento define una celda en la tabla. Se
tiene entonces rc celdas. Cada celda contiene n(n 2) observaciones( replicas). Los rcn datos se
muestran en la siguiente tabla

3.1 PASOS PARA EL CONTRASTE DE HIPOSTESIS EN UN MODELO DE DOS FACTORES CON


REPETICION
PASO N1 Planteamiento de Hiptesis.
Las tres hiptesis que usualmente se prueban son las siguientes:
I) Planteamiento de Hiptesis para los tratamientos
T
H O : Todas las medias de tratamientos ( columnas) son iguales (1 = 2 = = k = 0 )

H 1T : No todas las medias de los tratamientos son iguales (almenos uno de los efectos j no es igual a
cero)
De manera anloga, para determinar si las medias poblacionales de los bloques.
II) Planteamiento de Hiptesis para los bloques
H OB : Todas los medias de bloques (filas) son iguales
( 1 = 2 = = L = 0).

H 1B : No todos las medias de los bloques son iguales (al menos uno de los efectos i no es igual a cero).
Y con respecto a las interaccin:
III) Planteamiento de Hiptesis para la Interaccin
H OI : No existe interaccin entre los tratamientos y bloques.
( 11 = 12 = = LK = 0 ).

H 1I : Existe interaccin entre los tratamientos y bloques (al menos uno de los efectos Ij no es igual a
cero).
Estas pruebas se basarn en una comparacin de los estimadores independientes de la varianza
poblacional comn 2 . Estos estimadores se obtendrn separando la suma total de los cuadrados de los
datos en cuatro componentes .
Paso N 2 :Nivel de significancia : ( 0 1)
PASO N 3 Construccin de la Tabla del ANVA.
Calculo de ecuaciones para el Anlisis de Varianza.
De lo anterior, la suma total de cuadrados de los datos se descomponen en cuatro componentes, por
medio de la siguiente identidad.
SCT = SCTR +SCRL +SCI + SCE
Donde SCI = Suma de cuadrados debido a la interaccin.
Las formulas practicas para calcular estas sumas de cuadrados son:
a) Variacin Total.
c

SCT=


i 1

j 1

X ijk2 C
k 1

, donde C

T 2 ...
,
f *c*r

71

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

b) Variacin entre tratamientos


1
SCF =
cr

2
. j . C

j 1

c) Variacin entre Bloques.


1
SCC =
fr

2
i.. -

i 1

d) Variacin Residual
i

SCE =

2
X ijk

i 1 j 1 k 1

1
r

2
ij .

j 1

e) Variacin debido a la interaccin.


En la prctica, su valor ser obtenida por:
SCI = SCT SCC SCF SCE
CUADRO DE ANALISIS DE VARIANZA (ANVA) PARA DESIGUAL NUMERO DE OBSERVACIONES
Fuente de
Variacin

Grados de
libertad
(gl)

Suma de
Cuadrados
(S.C)

Entre Tratamiento
(Columnas)

C-1

SCC

Entre
Bloques
(filas)

f-1

SCF

Debido a la
interaccin

(c-1)(f-1)

SCI

CMC=

CMF=

CMI=

cf(r-1)
n-1

SCE
SCT

SCC
c 1

SCBL
f 1

SCI
(c 1)( f 1)

CME=

Error Residual
Total

Cuadrado Medio
( C.M)

SCE
cf (r 1)

Razn
F

FT=

CMC
=
CME

FB=

CMF
CME

FI =

CMI
CME

PASO N 4 : Regin Crtica:


i) La regin crtica de la prueba de tamao para contrastar los efectos de las columnas ( factor A), es
dado por:
T
T
C T = FCal : FCal Ftab = F ( c 1, cf( r 1)
La regin crtica de la prueba de tamao para contrastar los efectos de las filas ( factor B), es
dado por
B
B
= FCal : FCal Ftab = F ( c 1, cf( r 1)

i)
CB

ii) La regin crtica de la prueba de tamao para contrastar los efectos de interaccin, es dado por.
I

C i = FCal : FCal Ftab = F ( c 1, cf( r 1))


PASO N 5 : Conclusin :
T
T
i) Si FCal Ftab = F ( c 1, cf( r 1)), se rechaza H 0 y se concluye de que hay diferencia entre las
medias de tratamientos (columnas ) y consecuentemente hay influencia del factor A sobre la variable

72

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

analizada; en caso contrario no se rechaza H 0 y se concluye con un riesgo de de que el factor A no


causa efecto en la variable dependiente o respuesta.
B
B
ii) Si FCal F ( f 1, cf(r 1)), se rechaza H 0 y se concluye de que hay diferencia entre las medias de
bloques ( filas) y consecuentemente hay influencia del factor B sobre la variable respuesta; en caso
B
contrario no se rechaza H 0 . y se concluye con un riesgo de que el factor B no causa efecto en la
variable dependiente o respuesta.
I

I
iii) Si F F (( c 1), (f-1), cf(r 1)), se rechaza H 0 y se concluye de que hay interaccin entre las filas
I

y columnas; en caso contrario no se rechaza H 0 y se concluye con un riesgo de que la interaccin no es


significativa.
Ejercicio. Se comparan cuatro mtodos de dieta para determinar su eficacia en trminos del peso perdido
en kilos. Con este fin se disea un modelo de anlisis de varianza de dos factores considerando el mtodo
de dieta como el factor A con 4 niveles (A :Mtodo i, i =- 1. 2, 3, 4) y el peso inicial como el factor B con
tres niveles (Bi = moderadamente pesado B2:=pesado. B3=muy pesado). Se eligen al azar a dos personas
de B, para A1. dos para A2. etc Despus de un mes la prdida de peso en kilogramos de las 24 personas
que se someten a las dietas se registran en la tabla siguiente. Utilice un nivel de significacin de 0.05.
Peso
Tipos de Dieta
Total
Inicial
A1
A2
A3
A4
T.j.
B1
8
6
7
5
7
5
7
6
Total Ai
15
11
14
11
51
B2
4
5
3
4
3
4
4
4
Total Ai
7
9
7
8
31
7
6
5
7
B3
6
7
6
6
Total Ai
13
13
11
13
50
Total Ti..
35
33
32
32
T= 132
Solucin
4

SCT =

X
i 1 j 1 k 1

SCC =

SCF =

1
c* f

SCE =

1
f *r

2
i..

2
ijk

- C = (8)2 + (4)2 + +(3)2 726 = 772 -726 =46

-C=

1
(35)2 + (32)2 + (32)2 - 726 =1
3 2

-C=

1
(51)2 + (31)2 + (50)2 - 726 = 31.75
4 2

i 1
r

2
. j.

j 1

X
i 1 j 1 k 1

2
ijk

1
r

T
j 1

2
ij .

= 772 -

1
(15)2 + (11)++(13)2 = 5
2

SCI = SCT (SCC+SCF+SCE) = 46 ( 1 + 31.75 + 5) = 8.25


ANALISIS DE VARIANZA (ANVA )

73

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Fuentes de
Variacin

Grados de
Libertad

Suma de
Cuadrados

Cuadrado
Medio

Razn F
calculada

Dieta (A)

1.00

0.333

FC=0.799

Peso Inicial (B)

31.75

15.875

FF=38.10

Interaccin AXB

8.25

1.375

FI =3.30

Error de
Muestreo

12

0.417

Total

23

46

5.- Decisin: Dado que:

0.333
C
= 0.799 < 3.49, se acepta H 0
0.417
15
.875
38.1 > 3.89 , se rechaza H 0F
FF =
0.417
1.375
3.3 > 3.00, se rechaza H 0I
FI =
0.417
FC =

Ejercicio.
Para producir cierto bien una firma dispone de 4 mquinas de marcas distintas(A i) que produce con igual
velocidad y de tres fuentes distintas de materia prima (B j )de igual calidad. No se sabe si el nmero de
unidades defectuosas producidas es la misma para las mquinas y para las materias primas. Se hace
operar cada de mquina con cada tipo de material durante 2 horas y se registra el siguiente nmero de
unidades defectuosas por hora.
Utilice un nivel de significacin de 0.05 para verificar:
a) Si hay diferencias significativas entre las mquinas Ai
b) ) Si hay diferencias significativas entre las materas primas Bj
c) Si hay efecto de interaccin AxB
Materias
Mquinas
Primas
A1
A2
A3
A4
B1
6
4
5
3
5
3
5
4
B2
2
3
1
2
1
2
2
2
B3
5
3
3
4
4
4
4
3

74

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

UNIVERSIDAD NACIONAL PEDRO RUIZ GALLO

ESCUELA PROFESIONAL DE INGENIERIA


QUIMICA E INDUSTRIAS ALIMENTARIAS

75

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

PRACTICA DE LABORATORIO

METODOS ESTADISTICOS APLICADOS


EN LA INGENIERA QUMICA

MSc. ALFONSO TESEN ARROYO

INTRODUCCION
Hoy en da, los mtodos cuantitativos, han dado un gran desarrollo con la ayuda de las tecnologas
de la informacin y los software estadsticos que se encuentran en el mercado tales como Minitab,
SAS, Spss entre otros, es por eso que incluso la clases de Mtodos cuantitativos se desarrollan en
laboratorio de computacin haciendo uso de Software que es el SPSS V20.

76

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

OBJETIVOS:

Brindar habilidades y tcnicas de recoleccin, procesamiento, presentacin, anlisis


e interpretacin de informacin de estadstica unidimensional.

Presentar procedimientos necesarios sencillos para calcular e interpretar las


medidas de tendencia central

y dispersin de variables unidimensionales y

bidimensionales como regresin, correlacin y otros mtodos estadsticos que se


utilizan en la Investigacin y sobre todo la utilizacin de una base de datos,
haciendo uso del SPSS.

El SPSS.
Es un software estadstico y de gestin de datos, se maneja mediante instrucciones que se
agrupan en mdulos. Contiene programas capaces de realizar desde un simple anlisis
descriptivo hasta diferentes tipos de anlisis multivariante de datos.
Ejecucin del SPSS.
Para ejecutar el SPSS, se busca la ruta donde se encuentra el programa y se hace doble
Click con el cono correspondiente al programa SPSS como se muestra a continuacin.

Al hacer doble click en el cono del programa se muestra la siguiente pantalla

77

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Y posteriormente se muestra la pantalla con su respectiva ventana Editor de Datos y la


Ventana de Resultados que se muestran a continuacin. Cada ventana es independiente por
lo tanto, si se quiere grabar, se le tiene que dar un npmre que puede ser el mismo o diferente
segn criterio del responsable del procesamiento de datos.

VENTANA DE EDITOR DE DATOS

Ingreso
de datos

Definicin
de variables

VENTANA PARA LA DEFINICION DE VARIABLES

78

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

VENTANA DE INGRESO DE DATOS

79

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

SESIN BSICA.
Generar archivos de datos. SPSS. PRACTICA N01.SAV.
A continuacin se muestra una data hipottica con la que se va a realizar la prctica.
n de
lugar de
casos
id
sexo
procedencia estado civil
edad
peso
1
exped09
1
1
1
45
72
2
exped10
1
2
1
28
78
3
exped11
1
3
2
35
68
4
exped12
1
2
2
60
64
5
exped13
2
1
1
26
71
6
exped14
2
1
1
30
63
7
exped15
2
1
2
28
53
8
exped16
2
3
2
33
57

altura
168
171
174
166
164
156
158
155

Despus seguir los siguientes pasos:


Definir variables: (Ventana de definicin de variables en el SPSS), considerando las variables: id,
sexo, estado civil, edad, peso, altura con sus respectivas codificaciones.
Sexo: ( 1= Masculino; 2 =Femenino)
Lugar de procedencia: ( 1= Chiclayo; 2= Ferreafe;

3= Lambayeque)

Estado Civil: (1=Soltero; 2 = Casado; 3 = viudo).


Como se puede observar en la siguiente pantalla, la definicin de las variables se hacen en forma de
lneas lo que esta en columnas en la tabla de datos hipotticos. Adems hay que considerar el tipo de
variable, n de decimales , etiqueta etc.

80

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Una vez definida las variables ingresamos a la ventana de ingreso de datos que se muestran
en la tabla anterior.

Como se observa en la pantalla anterior solo se muestran nmeros en las variables como sexo, lugar
de procedencia etc, por lo que falta codificar las variables, tal como se muestra en la siguiente tabla.

Grabar el archivo dndole un nombre adecuado segn caractersticas o investigacin que se


esta realizando, buscando una carpeta donde crea Ud. Conveniente guardarlos ya que el SPSS
por defecto lo guarda en su archivo de programa.

81

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Estando lista la base de datos, se procede a encontrar los diferentes estadsticos necesarios.

PASOS A SEGUIR PARA EL ANALISIS.


Una vez ingresado los datos al SPSS, se procede a realizar los anlisis estadsticos.

82

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejemplo N1
Analizar/Estadsticos Descriptivos/Frecuencias

Si se pasan las variables a la ventana de dialogo y si se desea encontrar estadsticas y grficos

Ejemplo N02
Analizar/ Estadsticos Descriptivos /Explorar/. Cuadro de dilogo: dependient List: Peso, Lista
de Factores: sexo, Mostrar Statistic: En el cuadro dialogo: Descriptivos. Continuar / Mostrar
Plots : Boxplot : factor levels; Descriptive : Stem and leat / Continuar / OK

83

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Hacer Click en Descriptivos de igual manera en Plots

Ejemplo N 3
Cambiar en el ejemplo anterior, en lista de factores Estado Civil por Sexo

Ejercicio N01: Realizar un anlisis estadstico con los siguientes datos

84

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

Ejercicio N 02

Supongamos que se tiene la siguiente encuesta:


ENCUESTA SOBRE COMPRAS EN EL SUPERMERCADO.
Se quiere realizar un anlisis del comportamiento de los consumidores que realizaron sus
compras semanales en un supermercado, realizndose la siguiente encuesta.
Marque con una X la alternativa correcta o escriba en las lneas punteadas.
1) Edad:

a) Adolescente ( )

b) Joven ( )

2) Sexo:

a) Masculino ( )

b) Femenino ( )

c) Adulto ( )

3) Grado de Instruccion: a) Primaria ( ) b) Secundaria ( ) c) Superior ( ) d) No


tiene ( )
4) Estado Civil : a) Soltero ( ) b) Casado ( ) c) Divorciado ( ) d) Viudo ( )
5) Horario de Compra: a) Maana ( ) b) Tarde ( ) c) Noche ( )
6) Compras Semanales en Artculos de Aseo Personal ( Nuevos Soles ) :
7) Compras Semanales en verduras ( Nuevos Soles ):
8) Compra de abarrotes ( Nuevos Soles ) ..
9) Compras Semanales en Bebidas ( Nuevos Soles ):
CODIFICACIN DE LA ENCUESTA:
X1: Edad: (0: Adolescente; 1: Joven; 2: Adulto)

85

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

X2: Sexo (0:Femenino; 1: Masculino )


X3: Grado de Instruccin (1: No tiene; 2:Primaria; 3: Secundaria; 4: Superior)
X4: Estado Civil (1: Soltero; 2: Casado; 3: Divorciado; 4: Viudo)
X5: Turno (0:Maana; 1:Tarde; 2: Noche)
X6: Compra artculos de Aseo Personal ( Nuevos Soles)
X7: Compras de verduras ( Nuevos Soles )
X8: Compra de Abarrotes ( Nuevos Soles)
X9: Compra de Bebidas ( Nuevos Soles )
Resuelva lo siguiente:
Elabore e interprete una tabla de frecuencias de la variable edad, sexo y grado de
instruccin y horarios de compra.
Cul es el promedio en verduras, aseo personal compra de abarrotes y bebidas.
Cul es gasto en bebidas segn edad
Cul es el gasto en abarrotes segn horario
Cual es el gasto en verduras segn sexo

Llenado de la Base de datos (SPSS)


Como paso ltimo se realizar el llenado de la base de datos representado por la
muestra de 30 personas que realizaron sus compras en un supermercado. Los datos
se pueden llenar directamente del cuestionario (Encuesta). Las columnas nos indican
las variables que tenemos y las filas los casos o encuestados.
Encuestad
X1
X2
X3
X4
X5
X6
X7
X8
X9
o

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

0
2
2
1
2
2
1
0
2
1
2
2
2
2
1
2
2
2

0
0
0
0
0
0
0
0
1
1
1
0
0
1
0
0
0
0

3
4
2
2
3
4
2
3
4
2
4
3
4
4
1
1
1
2

2
1
3
4
4
4
2
2
3
2
1
2
4
4
1
2
3
2

0
2
2
1
2
2
0
0
2
1
2
2
2
2
1
2
2
2

2,0
3,0
0,3
3,3
1,3
0,4
1,5
4,5
2,5
0,3
1,0
6,0
5,6
6,0
1,2
0,2
6,0
5,5

17,0
20,0
10,0
9,0
23,0
13,0
12,0
19,0
18,0
24,0
7,0
10,0
5,0
14,0
15,0
12,0
14,0
6,0

34,5
40,0
31,6
35,4
30,0
32,9
33,2
33,1
35,6
33,0
34,5
33,2
31,5
36,2
36,8
35,4
33,2
35,9

6
6
6
6
6
6
6
6
6
6
6
6
6
1
1
2
2
2

86

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


19
20
21
22
23
24
25
26
27
28
29
30

2
2
2
2
1
2
2
2
0
2
2
2

0
0
0
0
0
0
0
0
0
0
0
0

4
1
3
2
1
2
3
2
3
2
2
2

4
4
1
2
1
4
4
2
2
3
2
2

2
2
2
2
1
2
2
2
0
2
2
2

MSc. Alfonso Tesn Arroyo


6,5
0,2
2,3
0,2
2,3
1,5
5,0
4,5
0,3
5,5
0,5
0,2

9,0
13,0
6,0
7,0
10,0
13,0
7,0
18,0
24,0
7,0
10,0
4,0

36,5
38,2
34,5
36,2
36,8
30,1
36,0
35,4
31,5
36,2
33,9
34,9

3
3
3
3
3
3
3
3
3
4
4
4

Nombre Apellido:
PRACTICA N3 DE LABORATORIO
BASE DE DATOS
La base de datos que se evaluar con fines prcticos (BASE01.exe), es la siguiente:
X1: Tamao familiar (Numero de integrantes de su familia)
X2: Edad
X3: Sexo
X4: Profesin
X5: Estado civil
X6: Lugar de procedencia
X7: Tenencia de seguro
X8: Tipo de enfermedad
X9: Ingreso mensual
X10: Actividad
Con la siguiente base de datos realizar lo siguiente:
a.
b.
c.
d.
e.
f.
g.

Indicar el comportamiento del tamao familiar de la muestra en estudio.


Determinar el comportamiento de la muestra son segn estado civil. Sealar sus
respectivos porcentajes.
Determinar el comportamiento de la muestra segn tenencia de seguro.
Determinar la edad promedio.
Determinar el ingreso mensual.
Realizar un cuadro de doble entrada segn sexo y estado civil. Interprete
algunos resultados.
Realizar un cuadro de doble entrada segn profesin y tenencia de seguros.
Interprete algunos resultados.

87

INGRESO MENSUAL

ACTIVIDAD

EDUCACION INICIAL

SOLTERO

TRUJILLO

NO

NINGUNA

350

CUIDA NIOS

MASCULINO

INFORMATICA

SOLTERO

TRUJILLO

NO

NINGUNA

400

VIGILANCIA

42

MASCULINO

ESTILISTA

SOLTERO

TRUJILLO

NO

NINGUNA

460

ESTILISTA

47

MASCULINO

ESTILISTA

SOLTERO

HUARAL

NO

NINGUNA

460

ESTILISTA

73

MASCULINO

CATEDRTICO

CASADO

AREQUIPA

SI

NINGUNA

4000

INVERSIONISTA

18

MASCULINO

ING. SISTEMAS

SOLTERO

PIURA

SI

NINGUNA

1200

COMERCIANTE

26

FEMENINO

CONTADORA

CASADO

TRUJILLO

NO

NINGUNA

450

NINGUNO

21

MASCULINO

ESTUDIANTE

SOLTERO

TRUJILLO

NO

NINGUNA

420

NINGUNO

25

MASCULINO

COMERCIANTE

SOLTERO

TRUJILLO

NO

NINGUNA

420

COMERCIANTE

10

35

MASCULINO

COMERCIANTE

CASADO

TRUJILLO

NO

NINGUNA

500

NEGOCIO

11

21

MASCULINO

ESTUDIANTE

SOLTERO

TALARA

SI

NINGUNA

600

COMERCIANTE

12

45

FEMENINO

COMERCIANTE

CASADO

HUANUCO

NO

NINGUNA

500

NEGOCIO

13

29

MASCULINO

D. TECNICO

SOLTERO

TRUJILLO

NO

NINGUNA

1200

ACADEMIA

14

20

MASCULINO

ESTUDIANTE

SOLTERO

TRUJILLO

SI

NINGUNA

800

ESTUDIANTE

15

21

MASCULINO

ESTUDIANTE

SOLTERO

TRUJILLO

NO

NINGUNA

460

DOCENTE

16

20

MASCULINO

ESTUDIANTE

SOLTERO

CAJAMARCA

NO

NINGUNA

300

ESTUDIANTE

17

32

MASCULINO

COMERCIANTE

CASADO

TRUJILLO

NO

NINGUNA

500

COMERCIANTE

18

30

MASCULINO

COMERCIANTE

CASADO

TRUJILLO

NO

NINGUNA

500

COMERCIANTE

19

23

FEMENINO

VENDEDORA

SOLTERO

TRUJILLO

NO

NINGUNA

400

VENDEDORA

20

45

FEMENINO

COMERCIANTE

CASADO

CAJAMARCA

NO

NINGUNA

600

COMERCIANTE

21

33

MASCULINO

ECONOMISTA

SOLTERO

TRUJILLO

SI

NINGUNA

700

ECONOMISTA

22

32

MASCULINO

COMERCIANTE

SOLTERO

CHICLAYO

NO

NINGUNA

500

COMERCIANTE

23

37

MASCULINO

ING. QUIMICO

CASADO

TRUJILLO

SI

NINGUNA

1200

ING. QUIMICO

24

80

MASCULINO

PROFESOR

CASADO

CAJAMARCA

SI

BRONQUITIS

800

COMERCIANTE

25

40

FEMENINO

AMA DE CASA

CASADO

TRUJILLO

SI

ALERGIAS

2000

NINGUNO

26

32

MASCULINO

COMERCIANTE

SOLTERO

VIRU

NO

NINGUNA

600

COMERCIANTE

27

81

MASCULINO

AGENTE VIAJERO

CASADO

SAN PEDRO

SI

ESTEOPOR

500

NINGUNO

28

50

MASCULINO

TOPOGRAFO

CASADO

TRUJILLO

NO

BRONQUITIS

1000

NINGUNO

29

21

MASCULINO

DOCENTE

SOLTERO

TRUJILLO

NO

NINGUNA

460

DOCENTE

30

75

MASCULINO

CHEFF

VIUDO

OTUZCO

SI

NINGUNA

700

COMERCIANTE

31

40

FEMENINO

AMA DE CASA

SOLTERO

TRUJILLO

SI

NINGUNA

415

NINGUNO

32

31

FEMENINO

INGENIERA

CASADO

CHICLAYO

NO

NINGUNA

1300

INGENIERO

33

52

MASCULINO

ING. CIVIL

CASADO

TRUJILLO

NO

LA GOTA

1000

COMERCIANTE

34

31

MASCULINO

ADMINISTRADOR

SOLTERO

TRUJILLO

SI

NINGUNA

1500

ADMINISTRADOR

35

46

MASCULINO

CONTADOR

CASADO

CARTAVIO

SI

NINGUNA

2500

CONTADOR

36

12

81

FEMENINO

AMA DE CASA

CASADO

TRUJILLO

NO

PRESION

700

AMA DE CASA

37

80

MASCULINO

DOCENTE

VIUDO

AMAZONAS

SI

ARTROSIS

900

CESANTE

38

32

MASCULINO

TECNICO

SOLTERO

TRUJILLO

SI

NINGUNA

1200

TECNICO

39

68

FEMENINO

DOCENTE

SOLTERO

ANCASH

SI

NINGUNA

800

CESANTE

40

36

FEMENINO

SECRETARIA

CASADO

TRUJILLO

SI

NINGUNA

1500

DOCENTE

41

63

MASCULINO

ARQUITECTO

CASADO

PIURA

SI

NINGUNA

7200

ARQUITECTURA

42

41

FEMENINO

CONTADORA

GUADALUPE

SI

NINGUNA

4000

CONTADOR

43

62

MASCULINO

ABOGADO

CASADO
DIVORCIAD
O

LAMBAYEQUE

SI

NINGUNA

5800

ABOGACIA

44

49

FEMENINO

OBSTETRIZ

CASADO

LAMBAYEQUE

SI

NINGUNA

3000

OBSTETRIZ

45

46

MASCULINO

ABOGADO

CASADO

SAN PEDRO

SI

NINGUNA

7000

ABOGACIA

46

46

MASCULINO

DOCTOR

CASADO

TRUJILLO

SI

NINGUNA

6500

ODONTOLOGO

47

56

MASCULINO

CONTADOR

CASADO

CHICLAYO

SI

NINGUNA

5600

CONTADOR

48

39

FEMENINO

ENFERMERA

SOLTERO

TRUJILLO

SI

NINGUNA

3200

ENFERMERIA

49

42

FEMENINO

PROFESORA

SOLTERO

LIMA

SI

NINGUNA

4300

DOCENTE

50

21

MASCULINO

ESTUDIANTE

SOLTERO

TRUJILLO

NO

NINGUNA

460

DOCENTE

ENFERMEDAD

PROCEDENCIA

FEMENINO

19

SEGURO

ESTADO CIVIL

28

EDAD

TAMAO FAMILIAR

N ENC.

PROFESION

MSc. Alfonso Tesn Arroyo

SEXO

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

88

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

NOMBRE Y APELLIDOS:
PRACTICA N4 DE LABORATORIA
MEDIDAS DE TENDENCIA Y VARIABILIDAD
1. EVALUACIN DE UN CASO: (Ejercicio obtenido de material de trabajo de ESAN)
Wells y Asociados es una de las firmas consultoras financieras ms importantes de los Estados
Unidos. Ofrece asesora financiera y servicios a firmas particulares y a gobiernos estatales y
locales. Lori Mulier, acababa de ser encargada del departamento de personal de esta empresa.
En los tres aos pasados, se han agregado otros ayudantes y hace seis semanas, se sum al
departamento un estadstico recin graduado.
Lori Muller empez hace poco a revisar las prcticas de contratacin del departamento.
Empez la revisin examinando el campo ms crtico, las personas en adiestramiento
financiero. La firma contrata entre 60 y 130 de estas personas al ao, segn sea el
crecimiento de la firma, el movimiento de empleados y el nmero de perspectivas notables"
que encuentre. Prcticamente todos los que estn en adiestramiento financiero se contratan
entre los estudiantes del ltimo ao de escuelas superiores con especializacin financiera.
Lori Muller seleccion al azar 100 de los 197 candidatos que haban sido

contratados hace dos aos y an seguan trabajando. Cada ficha contena la


informacin siguiente (los datos van en el apndice adjunto):
1. Genero. (0=Femenino y 1=Masculino)
2. Edad al contratarse
3. Promedio ponderado de sus notas universitarias (escala de 0 a 20).
4. Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena y
4=Regular)
5. Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy improbable
que tenga xito en el trabajo) a 100 (muy probable que tenga xito en el trabajo).
6. Evaluacin del rendimiento al final del segundo ao.
Esta evaluacin produce una
puntuacin numrica desde 0 (muy malo) hasta 100 (excelente). Muller y Koehler estn
seguros de que la escala es de intervalo y tambin han decidido, con base en los tres aos
de experiencia con dicha escala, que una puntuacin inferior a 50 es insatisfactoria, 50-69
es satisfactoria, 70-89 por sobre el promedio, y por encima de 89 es excelente.
Lori Muller llama al estadstico a su oficina y le dice: "Estoy encantada de tener un estadstico
que nos ayude. No estamos an listos a desarrollar un modelo estadstico acabado de lo que
constituye una buena contratacin, pero es tiempo de empezar a evaluar algunas de las
variables de que tenemos informacin. El gran nmero de personas que contratamos, el alto

89

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

costo de adiestrarlas y el hecho de que no podemos evaluar realmente los rendimientos, hasta
fines del segundo ao, significan que cualquier mejora en nuestra eficacia de contratacin
tendr por resultado ahorros sustanciales para la firma. Para comenzar a tratar el tema,
Podras dar respuesta a las siguientes preguntas?
1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de
calificaciones de grado y de la evaluacin del rendimiento en el segundo ao, para tener
una apreciacin general del grupo en adiestramiento financiero. Cul es el perfil de este
personal?
2. Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de mujeres?
Y en la evaluacin del rendimiento?
3. Un criterio inicial en Wells era mantener la calificacin promedio de grado de los
contratados por encima de 14.00. Se sigue manteniendo este criterio?
4. Otro criterio era mantener por lo menos un tercio de los contratados que provengan de
escuelas de categora 2. Se sigue manteniendo este criterio?
5. Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de
escuelas de donde provienen los candidatos? Y en la Evaluacin del rendimiento del
segundo ao?
Si Ud. fuera el estadstico que conclusiones le dara a Lori respecto al anlisis que
realiz.
Tener como referencia la base de datos que a continuacin se presenta.
No.

Genero

Edad

Calificacin

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

1
1
1
1
1
1
0
1
1
1
1
0
0
1
0
1
1
1
1
1
0
1
1
0
1
0
1
1
1
0
1

22
26
22
23
25
26
27
23
23
26
24
24
36
27
26
24
26
23
24
24
25
23
23
26
25
25
24
23
22
30
24

15.41
15.71
12.45
15.69
16.05
16.21
14.42
12.87
13.08
16.30
15.82
14.85
13.31
16.67
16.35
12.50
12.32
14.72
13.94
16.92
13.14
14.92
13.81
15.53
15.33
12.95
12.24
14.94
12.57
12.92
15.94

Calidad
Universitaria
3
1
2
2
1
3
2
3
2
3
4
3
4
4
2
1
1
2
2
2
3
3
2
3
3
2
4
4
3
3
1

ndice xito

Rendimiento 2

62
60
80
86
86
64
54
80
62
77
61
67
95
62
50
62
81
76
87
73
85
57
89
70
65
89
87
89
94
71
63

72
71
66
91
48
95
82
92
73
81
67
95
96
59
79
88
52
71
75
75
93
84
90
83
73
97
88
81
74
67
80

90

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88

1
1
1
1
0
1
0
1
0
1
1
1
1
1
1
1
0
1
1
1
0
1
1
1
0
1
1
1
0
1
1
1
1
0
1
0
1
1
1
1
1
0
0
0
1
1
1
0
1
1
1
1
0
0
1
1
0

25
23
24
26
23
26
26
26
23
22
26
24
26
25
24
25
24
22
25
25
23
25
24
24
23
23
26
26
23
24
24
27
22
23
24
25
24
22
23
22
24
26
28
26
25
25
25
23
24
25
23
24
24
25
24
23
23

13.80
14.42
14.72
12.60
14.53
14.76
13.12
13.35
14.76
15.27
17.00
16.57
14.02
13.08
13.93
14.17
14.65
13.92
13.28
12.96
13.97
13.92
14.92
16.33
14.25
15.29
15.23
15.73
12.94
15.96
16.96
12.23
15.35
16.77
16.12
14.34
14.69
14.67
15.56
12.35
13.39
16.99
15.29
15.93
13.41
15.55
13.97
12.81
12.99
15.67
12.47
12.77
14.67
13.94
14.90
15.44
16.03

4
3
2
3
3
4
3
4
2
4
2
2
3
1
3
2
3
1
3
2
2
3
3
2
4
1
3
3
1
1
2
3
2
2
2
3
3
2
2
2
3
1
4
2
3
2
1
4
2
2
3
3
1
3
1
2
4

MSc. Alfonso Tesn Arroyo


67
96
73
92
88
82
84
86
72
82
77
66
73
85
58
58
79
50
93
75
82
57
67
60
56
94
92
81
73
91
72
85
96
85
89
92
66
85
54
85
65
76
63
89
83
57
96
72
73
53
86
64
80
77
52
70
90

64
82
82
81
77
89
95
58
74
89
68
77
67
99
96
97
92
95
67
52
82
83
87
73
67
72
66
95
82
84
98
93
87
57
85
81
95
90
80
48
71
63
87
97
97
79
71
72
89
94
78
89
84
91
69
89
91

91

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


89
90
91
92
93
94
95
96
97
98
99
100

1
0
0
0
0
1
1
1
1
1
1
1

29
22
26
22
30
25
23
26
23
22
26
23

12.15
13.42
12.02
13.04
14.35
13.65
12.66
13.22
13.43
15.54
16.51
16.91

MSc. Alfonso Tesn Arroyo

4
2
4
3
4
2
2
3
3
4
3
3

74
95
84
68
92
52
82
56
85
85
64
61

89
94
95
78
84
85
69
71
58
93
97
83

Nombre y Apellidos:
PRACTICA N5 DE LABORATORIA
Realice una anlisis estadsticos de los siguientes datos.
Cuadro N 1: caractersticas del Whisky
Precio
70
60
65
74
70
73
70
55
77
93
82
73
62
87
78
73
87
80
85
87
80
83
90
110
87
113
96
82
127

Proporcin
20
20
20
25
25
30
30
30
30
30
30
33
33
33
35
40
40
40
40
40
40
40
40
40
40
45
45
45
100

Categora
Vejez
Apreciacin
1
5.0
3
LEYENDA
Precio:
litro de whisky 2
en
1 Precio de 15.0
francos.
1
7.5
2
Proporcin: Proporcin de malta en %.
1
12.0del producto. 2
Categora:
Categora
1 1=lujo 12.0
3
1 2=estndar
5.0
0
3= pura malta
1
8.0
0
Vejez: Vejez del producto en aos.
1
5.0
2
Apreciacin: Apreciacin de un jurado
degustadores.
1
5.5
0
0=
mala
1
12.0
0
1 = mediocre
1 2 = mediana
12.0
2
2 3 = buena6.5
1
4
=
muy
buena
2
8.0
3
2
12.0
3
2
10.0
2
2
8.5
4
2
8.5
2
2
9.5
2
2
8.5
2
2
9.5
4
2
9.5
2
2
12.5
1
2
12.0
2
2
5.5
3
2
12.0
2
2
12.0
4
2
12.0
3
2
8.5
3
3
12.0
4

92

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .


160
90
86
100
100
95

100
100
100
100
100
100

3
3
3
3
3
3

12.0
12.0
12.0
10.0
11.0
12.0

MSc. Alfonso Tesn Arroyo

3
4
2
3
3
0

93

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

94

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

95

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

96

Mtodos Estadsticos aplicados en la Ingeniera Qumica. .

MSc. Alfonso Tesn Arroyo

97