Documentos de Académico
Documentos de Profesional
Documentos de Cultura
~~ NACIONAL
DE COLOMBIA
"~~=~ S E D E P A L M 1R A
FACULTAD DE INGENIERA
Y ADMINISTRACIN
ESTADSTICA DESCRIPTIVA PARA
INGENIERA AMBIENTAL CON SPSS
VIVIANA VARGAS FRANCO
ISBN 978-958-33-9319-3
Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestin del Medio Ambiente de Cali-DAGMA.
Corporacin Autnoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira
Agradecimientos
La autora expresa sus ms sinceros agradecimientos a las diversas personas e
instituciones que han colaborado en la elaboracin de este libro, entre las que se
destacan las siguientes:
Adela Parra Romero. Estadstica - Universidad del Valle.
Juan Jos Castillo. Ingeniero Ambiental- Universidad Nacional de Colombia, Sede
Palmira.
Mauricio Rojas Delgado. Estudiante Ingeniera Agrcola - Universidad Nacional de
Colombia, Sede Palmira.
Natalia Tamayo Gonzlez. IngenieraAmbiental- Universidad Nacional de Colombia,
Sede Palmira.
Rafael Domnguez Lasso. Ingeniero Agroindustrial - Universidad Nacional de
Colombia, Sede Palmira.
Ricardo Alberto Londoo Saldaa. Ingeniero Agroindustrial - Universidad Nacional
de Colombia, Sede Palmira.
Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestin del Medio Ambiente de Cali-DAGMA.
Corporacin Autnoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira
Contenido
Pg.
Introduccin ....................................................................................................
Captulo 1
Fundamentos de los mtodos estadsticos
1.1 Modelos estadsticos............................................... .............. ....... ..... .... 4
1.2 Aspectos generales del mtodo cientfico............................................. 5
1.3 Los datos como materia prima de los mtodos estadsticos .... ... ....... ... 8
1.4 Aspectos relacionados con la calidad del dato..................................... 9
1.5 Conceptos en la aplicacin de los mtodos estadsticos.. ..................... 11
1.6 Estadstica descriptiva vs estadstica inferencial.................................. 13
1. 7 Definicin de variables ............... ....................... ..... .............................. 14
1. 7.1 Variables cualitativas o categricas.......... ....... ....... ....... ....... ...... 14
1.7.2 Variables cuantitativas................................................................ 15
1.7.3 Otras clasificaciones................................................................... 17
1.8 Mtodos paramtricos y no paramtricos ............................................. 17
1.9 Mtodos estadsticos por tipo de variable............................................. 18
1.10 Etapas generales en la construccin de un modelo estadstico ............. 20
Captulo 2
Medidas descriptivas
2.1 Medidas de tendencia central............ ............ ................ .............. ......... 23
2.1.1 Media.......................................................................................... 24
2.1.2 Mediana...................................................................................... 36
2.1.3 Moda........................................................................................... 38
2.2 Medidas de dispersin .......... .................. ...... ................ ................ ....... 41
2.2.1 Rango....................................................... .................. ................ 41
2.2.2 Desviacin media ....................................................................... 42
2.2.3 Varianza...................................................................................... 44
2.2.4 Desviacin estndar.... ............................... ............ ......... ............ 46
2.2.5 Coeficiente de variacin ...... ....................................................... 48
Captulo 4
Medidas y grficas de posicin
4.1 Cuartiles................................................................................................ 98
4.2 Deciles .................................................................................................. 103
4.3 Percentiles............................................................................................. 106
4.4 Medidas de dispersin para indicadores de posicin............................ 11 O
4.5 Representacin grfica de las medidas de posicin .............................. 11 O
4.5.1 Diagramas de cajas y alambres .................................................. 110
4.5.2 Diagrama de tallos y hojas ......................................................... 120
Captulo 5
Modelos de regresin
5.1 Modelo de regresin lineal simple........................................................ 127
5.2 Supuestos del modelo de regresin lineal simple ................................. 131
5.3 Diagrama de dispersin ........................................................................ 132
5.4 Otros modelos de regresin .................................................................. 136
5.5 Coeficiente de correlacin.................................................................... 147
5.6 Coeficiente de determinacin ............................................................... 155
Captulo 6
Planeacin estadstica en un proyecto de investigacin
6.1 Objetivos del proyecto .......................................................................... 159
6.2 Descripcin del sistema ........................................................................ 159
6.3 Codificacin del sistema........................ ............................................... 161
6.4 Definicin de variables, sitios y frecuencia de muestreo ..................... 162
6.5 Formatos de muestreo........................................................................... 164
Captulo 7
Evaluacin de sistemas para tratamiento de agua potable
7.1 Estadsticas descriptivas ..... ..................... .................... ..... .................... 171
7.2 Grficos de medias, mnimos y mximos............................................. 173
7.3 Histogramas ............................................................................. ... ......... . 180
7.4 Tablas cruzadas..................................................................................... 182
7.5 Grficos de frecuencias acumuladas ..................................................... 185
7.6 Grficos de tallos y hojas .... ... ............................ .. ............... ............. ... .. 186
7.7 Percentiles .... ... .... ........ ....... ........... ..... ..... .. ... ... ................ .. ..... ............. .. 190
7.8 Diagrama de cajas y alambres .............................................................. 193
Captulo 8
Calidad de aire
8.l Grficos de estadsticas descripti vas.. .... ..... .. .............. ............. ............. 204
8.2 Histogramas ........ .... .. .. ........ ... ....... ... .... ....... .. ........ ...... ... .. ..... ..... .. ........ . 211
8.3 Tablas cruzadas..................................................................................... 214
8.4 Grficas de frecuencias acumuladas .. ................ ................................... 217
8.5 Percentiles... ........... ............................ .............. .............................. ....... 220
8.6 Contaminacin del aire en Ciudad de Mxico ....................... ............... 224
Captulo 9
Calidad de agua en una fuente superficial
9.l Estadsticas descriptivas ....................................................................... 237
9.2 Presentacin grfica.............................................................................. 239
9.3 Histogramas .......... ......... ......... .... .......................................................... 245
9.4 Tablas cruzadas..................................................................................... 248
9.5 Frecuencias acumuladas ....................................................................... 251
9.6 Percentiles....... .... ................................................. ... .... ....... .......... ......... 252
Captulo 10
Instrucciones en SPSS
10.1 Ingresando los datos a SPSS .................................................................. 257
10.2 Importando archivos de Excel ....................... ................................. ....... . 259
10.3 Estadsticas descriptivas................................................... ... ..... ............... 263
Captulo 11
Grficas en Excel
11.1 Grfico para la media, desviacin estndar y el mximo.... ........ ......... ... 283
11.2 Grfico para media, mximo y mnimo .... .... ....... .... ... .......... .. ......... ...... . 288
11.3 Grfico de series de tiempo ............................................................... ...... 291
1
Fundamentos
de los mtodos estadsticos
Poblacin
Muestreo probabilstico
MlIestra representativa
X" Xl' XJ'
X 4 , X 5 , ........ X .. ,
X ..+/, X m +l ,
X/ . Xl'" XJ
........ X p XIV'
X4 X k +/
Xk+1" ....... X n
Teora de probabilidad
Los mtodos estadsticos estn relacionados con el mtodo cientfico en las etapas
de recoleccin, organizacin, presentacin y anlisis de datos, para la deduccin
de conclusiones y la toma de decisiones razonables de acuerdo con los anlisis
estadsticos.
PREGUNTAS DE
INVESTIGACIN OBJETIVOS HIPTESIS
Definir: Definir: ~ Definir los posibles resulta-
Antecedentes Objetivo general dos de las preguntas de in-
Justificacin Objetivos vestigacin.
Preguntas a especficos
resolver
t
t MARCO TERICO
Describir teoras y concep-
NUEVAS tos aplicados en la investi-
PREGUNTAS DE gacin .
INVESTIGACIN
PROCESAMIENTO Y
t
ANLISIS DE DATOS
Aplicar:
Instrumentos de
recoleccin de datos.
t
METODOLOGA
CONCLUSIONES y Sistemas de informacin. Describir el diseo ex-
RECOMENDACIONES
Generar en relacin con las ....... Teora de muestreo.
Estadstica descriptiva. ~
perimental, materiales y
mtodos para desarrollar
preguntas de investigacin
y anlisis de datos.
Inferencia estadstica.
Modelos matemticos.
los objetivos de la inves-
tigacin.
o Abstraccin vs concrecin
o Induccin vs deduccin
o Anlisis vs sntesis
o Conocimiento heurstico vs cientfico
No se puede caer en la frase "ricos en datos, pobres en iriformacin ". En general los
textos de mtodos estadsticos no mencionan o suponen que el proceso de recoleccin
y calidad del dato es un aspecto conocido por los investigadores o profesionales
que realizan estudios, sin embargo es una de las fases de la experimentacin que
generalmente no se planea con el cuidado que se requiere.
La recoleccin de datos y su posterior anlisis no son la finalidad principal de
una investigacin o un estudio, es necesario realizar procesos de modelacin
matemtica y estadstica que permitan generar informacin sobre las preguntas
de la investigacin. La informacin que se genere del proceso de anlisis debe
+
DATOS
J ( INFORMACIN )
Organizacin y
digitalizacin en Teoras y conceptos
bases de datos del fenmeno de
y sistemas de estudio
infonnacin
Estadistica descriptiva o
estadlstica deductiva Inferencia estadlstica o
estadlstica Inductiva
Univariada o
multivariada Unlvariada o
1 multivariada
( TEoRA DE LA PROBABILIDAD )
1
Intervalos de confianza.
Presentacin grfica de datos. Pruebas de hiptesis.
Medidas de tendencia central. Modelos de regresin.
Medidas de dispersin. Modelos de diseo de experimentos.
Modelos de series de tiempo.
Medidas de posicin.
Distribucin de frecuencias. Anlisis multivariado.
Geoestadstica.
Meta-anlisis.
( CLASlFICACIN DE VARIABLES)
CUALITATIVAS CUANTITATIVAS
Escala de medicin
INTERVALO RAZN
del valor de las variables se consideran como etiquetas, pero no poseen el significado
numrico usual, los valores tienen una naturaleza no-mtrica, no se puede decir
que una categora es mejor que otra y la asignacin numrica es arbitraria. Algunos
ejemplos de variables cualitativas nominales son : gnero, raza, profesin, credo
religioso, color de ojos, partidos polticos y estado civil.
Ordinal, se denomina a una variable que genera datos de cualidad y no de cantidad,
los nmeros asignados a las diversas categoras se consideran etiquetas, pero se
genera una relacin de orden que se preserva en el sistema numrico. Los nmeros
que se asignan a los atributos deben respetar o conservar el orden de las caractersticas
que se miden. El tipo de datos que resulta tiene naturaleza no-mtrica. A pesar
del orden jerrquico no es posible obtener valoracin numrica lgica entre dos
valores. Algunos ejemplos de variables cualitativas ordinales son: estrato socio-
econmico, nivel de satisfaccin (acuerdo-total, acuerdo-parcial, desacuerdo-parcial
y desacuerdo-total) y calificacin (E-excelente, S-satisfactorio, A-aceptable, D-
deficiente, I-insuficiente).
Las funciones de distribucin asociadas a una variable discreta son: uniforme discreta,
Bemoulli, binomial , hypergeomtrica, Poisson, geomtrica, binomial negativa,
Beta-binomial y logartmica.
En general las medidas dan origen a datos continuos, mientras que las enumeraciones
o conteos originan datos discretos. Es siempre posible pasar de una escala a otra
menos exigente. Ejemplo: los estudiantes pueden medirse en metros (variable
continua-razn), pero pueden tambin ordenarse de mayor a menor, convirtindose
en una variable ordinal.
los supuestos estadsticos requeridos para las diferentes pruebas, se utilizan los
mtodos no paramtricos.
Los mtodos utilizados para las variables de tipo cuantitativo (intervalo o razn)
son los mtodos paramtricos, los cuales presentan buenos niveles de confiabilidad
en la prediccin. En las escalas cualitativas (nominales u ordinales) se utilizan los
mtodos estadsticos no paramtricos, que no son tan precisos en su prediccin. En
la Tabla 1.1 se presentan las principales caractersticas de los mtodos paramtricos
y no paramtricos.
Tabla 1.1 Principales caractersticas de los mtodos paramtricos y no
paramtricos.
2
Medidas descriptivas
armnica
cuadrtica
rango medio
ponderada
Mediana
Moda
Las medidas de centralidad ms utilizadas son la media aritmtica, mediana y moda.
En algunos textos al clculo de estas tres medidas se le denomina promedio.
2.1.1 Media
o O O O! O
Si XI' X]' X J,............, X N _ l ' X N representan los valores de una variable en una
poblacin, entonces la media aritmtica se calcula por medio de la ecuacin 2.2.
N
f.l
: (es la letra griega minscula mu): media de un conj unto de datos p rovenientes de una poblacin
N : nmero de datos de una poblacin
-,
Ventajas Limitaciones
Es la medida estadstica ms comnmente Es fuertemente afectada por los valores ex
empleada. tremos, ya sean valores mximos o mnimos
Es fcil de calcular y entender. Ypor consiguiente puede estar lejos de ser
Se pueden realizar clculos algebraicos. una representacin de la muestra.
En su clculo se incluye cada uno de los No es conveniente utilizarla en: conjunto
datos de la muestra o la poblacin. de datos demasiado heterogneos, cuando
los datos sean proporcionales o estn en
Es un valor nico para cada conjunto de
progresin geomtrica.
datos.
Se debe analizar junto con medidas de
Las unidades son las mismas de la variable
dispersin.
analizada.
Se debe acompaar por otras medidas de
La distribucin de las medias que se obtienen
tendencia central, tales como la mediana y
de muestreos repetidos de una poblacin se
la moda.
conoce y es de gran utilidad en el proceso de
inferencia. Generalmente es la distribucin Slo tiene sentido en variables cuantitati
normal. vas.
X;
Datos primer muestreo: 5; 4; 5; 4; 8; 10,' 9 (UNT) -+ X = ~ = 6,4 (UNT)
7
8
X;
Con una muestra adicional: 12 (UNT) -+ X=~= 7,1 (UNT)
8
9
X;
Con otra muestra adicional: 150 (UNT) -+ X=~= 23(UNT)
9
10
x;
Con otra muestra adicional: 320 (UNT) -+ X=~= 52,7 (UNT)
10
n
e = ne donde e es constante y n el nmero de datos
;=/
n n
eX;=eX;
;=/ ;=/
11
X=nX
;=/
n n n
(aX;bYj=aX;bY;
;= / ;=/ ;=/
n
"x.
- . /
X=~-
-
X.=nX
n
I
"
11
;=/ I
I (X-xy es mnima.
Si cada uno de los datos de una variable toma valores constantes (k) , la media
ser igual al valor de la constante. En trminos algebraicos:
Si X= k , para todo i = 1,2, ..... n, entonces X= k .
Si cada uno de los datos de una variable es afectado aditivamente (negativamente)
por una constante (k) , la media de la nueva variable es equivalente a sumar
(restar) la constante a la media de la variable original. Enforma algebraica:
Si Y = k X,para todo i = 1,2, ..... n , entonces Y= k X.
Si cada uno de los datos de una variable es afectado multiplicativamente por
una constante (k) , la media de la nueva variable es equivalente a multiplicar la
constante por la media de la variable original. Enforma algebraica:
Si Y = kX , para todo i = 1, 2, ..... n , entonces Y = kX.
Si cada uno de los datos de una variable es dividido por una constante (k) ,
entonces la media de la nueva variable es la media de la variable original,
dividida por la constante. Algebraicamente:
X -
Si Y. = -'- , para todo i = 1, 2, ..... n , entonces Y = X
, k k
Si se genera una variable como la combinacin lineal de dos variables, la media
de la nueva variable ser la combinacin lineal de las medias de las variables
originales. Algebraicamente:
Si Z = aX + bY , para todo i = 1,2, ..... n, entonces Z = aX + bY.
En general, de todas las medidas utilizadas para calcular la tendencia central
de una poblacin, la media es la menos sujeta a variacin debida a cambios en
la muestra.
(2.4)
_1
- -log ( XI' Xl' XII)
n
_1
- - ( log XI + log Xl + ... + log XII)
n
generando la ecuacin 2.5.
11
Llog(X/)
/
l og X g= . .---=1'---_ _
. : (2.5)
n
Ventajas Limitaciones
Es una medida resistente a datos extremos, pero No es fcil de calcular y para un nmero considera
mite detectar en un conjunto muy heterogneo, ble de datos (n > 150), se presentan limitaciones
una medida de tendencia central confiable. en el programa Excel. En el programa SPSS
Las unidades de la media geomtrica son las no est considerada dentro de las rutinas ms
mismas de la variable. comunes.
Se pueden realizar clculos algebraicos. Puede presentar limitaciones en su interpreta
En su clculo se incluye cada uno de los datos de cin.
la muestra. Cuando existe uno o varios valores de la variable
Es un valor nico para un conjunto de datos. iguales a cero, el valor de la media geomtrica
Es muy til cuando el conjunto de datos represen toma automticamente el valor de cero.
ta aumentos o disminuciones porcentuales. Slo se puede calcular cuando la raz nsima
Se utiliza para promediar valores cuyo crecimiento exista.
sea en progresin geomtrica. Programas como Excel no validan el signo del
producto y siempre que hay valores negativos no
la calcula.
Slo tiene sentido en variables de carcter cuan
titativo.
El desarrollo algebraico de esta medida puede
tener un grado de complejidad mayor que el
desarrollo de la media aritmtica.
La media armnica de un conjunto de datos XI' X 2 , Xl' ............, XII _I' XII
provenientes de una muestra se define como la media de los recprocos del
conjunto de datos, tal como se presenta en la ecuacin 2.7.
1 n
1
I-
11
(2.7)
X
=I
n
Siempre que X :; O
N
Siempre que X '* O
La relacin entre las medias aritmtica, geomtrica y armnica se presenta en la
desigualdad 2.9.
X" :5 X g :5 X (2.9)
7,5 (UNT)
320 (UNT)
Es otra medida de tendencia central, que consiste en elevar al cuadrado los valores y
generar la raz cuadrada de la media aritmtica de estos nuevos valores, es poco afectada
por valores extremos, pero presenta pocas ventajas algebraicas y de distribucin.
La media cuadrtica de un conjunto de datos Xl' X 2 , X 3 , ............ , Xn_l' X n
provenientes de una muestra se define como se presenta en la ecuacin 2.10.
-2
X=
r;Zx/n
(2.10)
p.
2
=
~~X/ (2.11)
N
p.2 es la notacin para la media cuadrtica poblacional
~
5; 4; 5; 4; 8; 10; 9 (UNT) -+
X/
X 2
= ;=17 = 6,8 (UNT)
Con un dato adicional:
12 (UNT) -+
X2 = [f;
X/
;=18 = 7,7 (UNT)
~
150 (UNT) -+
X/
X = 2
;=19 = 50,5 (UNT)
Con otro dato adicional:
~
o
320 (UNT) -+
X/
X2 =
= 112 (UNT)
;=1
10
El valor de la media cuadrtica para turbiedad en el primer muestreo es 6,8
UNT, pero a medida que se adicionan valores extremos el valor de la media
cuadrtica aumenta significativamente.
La media cuadrtica presenta ms variabilidad que la media aritmtica. Esta
medida es fuertemente afectada por valores extremos.
El rango medio se define como la media aritmtica del valor mximo y el valor
mnimo de un conjunto de datos y se calcula como se presenta en la ecuacin
2.12.
X mn +Xmx
RM = ~~--.:.=- (2.12)
2
Donde X mn es el valor mnimo y X mx es el valor mximo del conjunto de
datos.
(2.13)
X p = 9,7 mg/l
2.1.2 A4ediana
Es la segunda medida ms utilizada despus de la media aritmtica para estimar
el centro de un conjunto de datos. Para hallar la mediana de un conjunto de datos
estos deben ser inicialmente puestos en orden de magnitud, de manera creciente o
decreciente. La mediana es el elemento central del conjunto de datos, es una medida
de posicin; hay el mismo nmero de observaciones a la derecha y a la izquierda
del valor de la mediana.
La mediana divide la distribucin de los datos en el punto medio; el 50% de los datos
est por encima de la mediana y el otro 50% est por debajo de la mediana, es decir,
es el valor que divide el conjunto de datos en dos grupos iguales.
X n+l si n es impar
2
Me =ixn+xn (2.14)
- - +1
2 2
si n es par
2
M=
e XN+XN (2.15)
- -+1
] 2
si N espar
2
Ventajas Limitaciones
12 (UNT) -+
M=
e
Xi +
'"
X~ + /= X 4 : X s = 6,5 (UNT)
2.1.3 Moda
Como su nombre lo indica, representa el valor o valores que tienen la mayor
frecuencia en el conjunto de datos; son los valores que ms se repiten, ya sean estos
muestrales o poblacionales. En un conjunto de datos puede no existir un valor modal
o existir una o ms modas. Cuando hay una moda, el conjunto de datos se denomina
unimodal, en el caso de dos modas se denomina bimodal, en el caso de tres modas se
denomina tri modal y en el caso de ms modas se denomina multimodal. La moda
se representa como M o para datos muestrales o poblacionales. En la Tabla 2.4 se
muestran algunas ventajas y limitaciones de la moda.
Ventajas Limitaciones
Los datos del primer muestreo presentan dos modas, es decir, es un conjunto de
datos bimodal; los valores que mayor frecuencia presentan en turbiedad son 4
UNT y 5 UNT A medida que se incorporan datos extremos al conjunto de datos
las modas se mantienen constantes, en este caso especfico.
esta rama de la estadstica. Una media muestral con seguridad est ms cerca de la
media poblacional que la mediana o la moda de la muestra.
La media, la mediana y la moda proporcionan una parte de la descripcin del conjunto
de datos. Sin embargo, es necesario definir indicadores que permitan estimar el grado
de variacin o dispersin de los datos con relacin a las medidas de tendencia central
y del conjunto de datos en general. Estas medidas por s solas no son suficientes
para analizar y tomar decisiones en relacin con un fenmeno en estudio, como se
ilustra en el siguiente ejemplo.
Como se puede apreciar, los datos arrojados por los dos reactores en color real
difieren significativamente, factor que no se puede evidenciar slo a travs del
valor de la media. Por lo tanto, a pesar de ser la media una de las medidas ms
utilizadas para resumir y analizar un conjunto de datos, es necesario acompaar
esta medida con otras medidas de centralidad y dispersin, las cuales permitan
estimar el grado de variacin del conjunto de datos.
2.2.1 Rango
Es la diferencia entre el valor mximo y el valor mnimo del conjunto de datos.
Mide la longitud en la cual se encuentran los datos, en general a mayor longitud
mayor dispersin de los datos; sin embargo, es necesario analizar la variable y las
unidades en las cuales se est midiendo, con el fin de hacer un anlisis adecuado de
esta medida de dispersin.
Ventajas Limitaciones
Si Xl' Xl' X 3 , ............ , X,, _I' X" representan los valores de una variable en
una muestra, entonces la desviacin media se calcula por medio de la ecuacin
2.17.
"
Ix;-xl (2.17)
dm =.:..;=.-:1'----_ _
n
IX;-pl (2.18)
DM = .:. ;=.-:1'------
N
5; 4; 5; 4; 8; 10; 9 (UNT) -+
lx;-xl
;= I
dm= =2,2 (UNT)
7
Con un dato adicional: 8
12 (UNT)-+
lx;-xl
;=/
dm= =2,6 (UNT)
8
Con otro dato adicional: 9
150 (UNT) -+
1x;-xl
;= /
dm= =28,2 (UNT)
9
Con otro dato adicional: 10
320 (UNT)-+
Ix;-xl
;=1
dm= = 72,9 (UNT)
10
La desviacin media para el primer conjunto de datos toma el valor de 2,2 UNT,
que indica el nivel de dispersin de los datos con relacin al valor medio, que es
6,4 UNT Cuando se introducen datos extremos al muestreo, la desviacin media
aumenta evidenciando el grado de dispersin del conjunto de datos.
2.2.3 Varianza
Debido a las limitaciones algebraicas que evidencian el rango y la desviacin media,
se origina el concepto de varianza, que mide las variaciones del conjunto de datos con
respecto a su media aritmtica y se define como la media aritmtica de los cuadrados
de las desviaciones de cada dato a la media aritmtica. En general, cuanto menor sea
el valor de la varianza, menor es el grado de variacin o heterogeneidad del conjunto
de datos con respecto a su media aritmtica. Sin embargo, es necesario contextualizar
el anlisis de esta medida a la variable y las unidades en que est medida.
S2
~ (x-X/ = (X-X/+(X -X/+(X -X/+ + (Xn-X/
2 3
n-l n-l
(2.19)
1 ~ (x- f.l/ (X- f.l/+ (X2 - f.l/+ (X3 - f.l/+ .... + (XN- f.l/
(J = =
N N
0": es la letra griega "sigma" (2.20)
Ventajas limitaciones
Es de las medidas de variacin, la ms utili Las unidades de esta medida son las uni
dades de la variable al cuadrado.
zada.
No es fcil su interpretacin debido a sus
Se pueden realizar clculos algebraicos. unidades.
Se debe acompaar de otras medidas de
Se incluyen todos los datos en su clculo. dispersin para su anlisis.
(Xi-Xl
5; 4; 5; 4; 8; 10; 9 (UNT) ~
S= ;gl = 6,3 (UNTl
7-1
Con un dato adicional:
8
12 (UNT) ~
(X/-Xl
S= ;~1 = 9,3 (UNTl
8-1
Con otro dato adicional:
9
(X-Xl
150 (UNT) ~ s= 1_ _ __
c...;--0
2276,3 (UNTl
9-1
Con otro dato adicional:
10
320 (UNT) ~
(X;-Xl
S = ;-1 = 10844,3 (UNTl
10-1
Como se puede apreciar la varianza genera una idea significativa del grado
de variabilidad de un conjunto de datos, pues a medida que aumenta el grado
de heterogeneidad esta medida aumenta sustancialmente, aunque sus unidades
elevadas al cuadrado limitan fuertemente su interpretacin.
Si cada uno de los datos en anlisis se multiplica por una constante, la varianza
resultar multiplicada por la constante al cuadrado. Algebraicamente:
Si 1'; = kXi , para todo i = 1, 2, ..... n, entonces S:= S:.
k
2
Si se divide por un mismo nmero a cada uno de los datos en anlisis, la varianza
quedar multiplicada por el cuadrado de dicho divisor. En este caso la constante
debe ser diferente de cero. Algebraicamente:
Si Y i = : Xi ' para todo i = 1,2, ..... n, entonces S: = /2 S: ; k,* O
IX;
S2=~-X2
n
2.2.4 Desviacin estndar
La forma de superar una de las limitaciones de la varianza, sus unidades al cuadrado,
es a travs del uso de la raz cuadrada, dando origen al concepto de desviacin
estndar.
La desviacin estndar muestral se define como la raz cuadrada positiva de la
varianza muestral, tal como se presenta en la ecuacin 2.21.
I"
/-1
(Xi-Xl
(2.21)
S=-Vs2=
n-1
La desviacin estndar poblacional se define como la raz cuadrada positiva de
la varianza poblacional, tal como se presenta en la ecuacin 2.22.
N
I (Xi-P.)]
u={Gi= i-l (2.22)
N
Ventajas Limitaciones
Es, junto con la varianza, una de las medidas Se debe acompaar de otras medidas de
de variacin ms utilizadas.
dispersin para su anlisis.
Tiene las mismas unidades de la variable
analizada.
Para su clculo primero debe calcularse la
Se pueden realizar clculos algebraicos.
Se incluyen todos los datos en su clculo. varianza.
9-1
=47,7 (UNT)
Para los datos del primer muestreo la desviacin estndar es 2,5 UNT, que
indica poca variacin entre los datos, es decir, los datos se alejan de la media
(6,4 UNT) en una desviacin estndar en 2,5 UNT hacia adelante yen 2,5 UNT
hacia atrs de la media. A medida que el conjunto de datos se vuelve heterogneo,
la desviacin estndar toma valores bastante grandes. Por ejemplo, con todo
el conjunto de datos analizados, el valor de la desviacin estndar es 104,1
UNT, lo que significa que los datos se alejan en promedio 104,1 UNT del valor
medio (6,4 UNT).
sta es una buena medida del grado de dispersin del conjunto de datos; a
medida que aumenta el grado de variacin de los datos esta medida aumenta,
en las mismas unidades de la variable de origen.
(1 (2.24)
CV=-x 100%
Siempre que JI. "# O
Esta medida es adimensional, sus unidades estn dadas en porcentaje, por lo tanto
es un buen indicador de comparacin entre dos o ms diferentes variables o dos o
ms diferentes poblaciones.
De otra forma:
Si S~ O.3X entonces el conjunto de datos es poco variable u homogneo
con relacin a la media.
Si O.3X < S ~ O. 7X entonces el conjunto de datos es variable o heterogneo con
relacin a la media.
Si S>0.7X entonces el conjunto de datos es muy variable o muy
heterogneo con relacin a la media.
Medidas Smbolo
Reactor 1 Reactor 2 I
descriptivas matemtico
Media X 10 UPC 10 UPC
.
Mediana Me 10 UPC 2 UPC
Media geomtrica Xg 9,9 UPC 3,2 UPC
Moda Mo 10 UPC 2 UPC
Rango R 4 UPC 56 UPC
Varianza SZ 2,7 UPC 2 448 UPC 2
Desviacin estndar S 1,6 UPC 21,2 UPC
Coeficiente de variacin e.v. 16,3 % 211,7 %
A pesar de tener los mismos promedios en color real, los dos reactores presentan
eficiencias bastante diferentes, tal como se puede evidenciar en las medidas de
dispersin. El rango para el primer reactor es 4 UPC Y para el segundo es 56 UPC,
10 cual evidencia que en los datos del segundo reactor la distancia entre el valor
mnimo y el valor mximo es mucho mayor que la del reactor 1.
La desviacin estndar, esto es, el promedio de la distancia de los datos con respecto
a la media, es 1,6 UPC para el primer reactor y 21,2 UPC para el segundo reactor. Es
decir, los datos se alejan de la media en 1,6 UPC para el primer reactor y se alejan
21,2 UPC para el segundo reactor, lo cual permite concluir que existe una mayor
variacin en el reactor 2.
El coeficiente de variacin es tambin un buen indicador del grado de variacin de
los datos en relacin con la media; para el reactor 1 es 16,3% y para el reactor 2 es
211,7%. Un CV=16,3% significa que el conjunto de datos es homogneo para el caso
del reactor 1; sin embargo, un CV= 211,7% significa gran variacin o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
Tambin, las medidas de centralidad, como la mediana, la media geomtrica y la
moda, indican el grado de variacin de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersin que permiten caracterizar
el fenmeno en estudio. Adicionalmente es necesario estudiar la distribucin del
conjunto de datos, tal como se desarrolla en el prximo captulo.
del reactor 1; sin embargo, un CV= 211,7% significa gran variacin o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
Tambin, las medidas de centralidad, como la mediana, la media geomtrica y la
moda, indican el grado de variacin de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersin que permiten caracterizar
el fenmeno en estudio. Adicionalmente es necesario estudiar la distribucin del
conjunto de datos, tal como se desarrolla en el prximo captulo.
3
Distribucin de frecuencias
N =n
N] = NI + n} = nI + n]
N3 = N 2 + n 3 = nI + n 2 + n 3
: :
:
N k_ =Nk _] + n k _ = n + n] + n 3 + ..... + n k _] + n k _1
N k =Nk _ + n k = nI + n] + n 3 + ..... + n k _ 1 + n k = n
Por ejemplo, el valor N 4 es el nmero de datos que tienen valores menores o iguales
aX4
En este caso se debe cumplir la desigualdad de la ecuacin 3.1.
n,
h,=-lOO%
n
:
n
hk _ ]=~lOO%
n
: :
H k_ =Hk_2 + h k_ = h + h 2 + h3+ .... + h k_2 + h k_
Hk =Hk_+hk=h+hz+h; + .... +hk _+hk=l lOO%
(3.2)
Siguiendo los pasos del 1 al5 se construye la Tabla 3.1, que representa la distribucin
de frecuencias para una variable cuantitativa discreta, presentando un buen resumen
del conjunto de datos de la muestra o poblacin estudiada.
Tabla 3.1 Distribucin de frecuencias para una variable discreta.
Frecuencia Frecuencia
Valores absoluta Frecuencia relativa
Frecuencia relativa
de la acumulada acumulada 1%1
absoluta
variable ;
n;
;
n; N;=n h;=-100% H;=h;
X;
;= I n ;-1
Xl nI NI hl Hl
Xz nz Nz hz Hz
Xl n] N] h] H]
: : : : :
: : : : :
: : : :
X k_l nk_l N k_l h k_l H k_1
Xk nk Nk=n hk H k= 100%
k k
Totales n;=n h;=100%
;~1
-- ;=1
--
XII' = (3.3)
;-/
n-l
El valor de h; debe utilizarse sin porcentaje (%), tanto para el clculo de la media
como de la varianza.
A partir de estas dos medidas se pueden estimar la desviacin estndar y el coeficiente
de variacin; su conceptualizacin, interpretacin y unidades son similares a las
presentadas en el Captulo 2.
Y
j
hJ%)
J J Y
ni
2
h nj
h3 n3
h2 n2
hk nk
hk _ 1 1
t nk _ 1
XI X2 X X
3 k_1 Xk
Variable X
Figura 3.1 Grfica de frecuencias absoluta y relativa para una variable discreta.
hK =100%
Y,
H K_ I
H K _]
! o---e
o---e
o---e r
Nk=n
Nk_1
Nk _]
H4 o---e N4
H3 o---e N3
H] o---e N]
H o---e N
XI X] X3 X4 X k _] X k _ 1 Xk
Variable X
10 1 1 8,3 8,3
23 2 3 16,7 25,0
47 4 7 33,3 58,3
99 2 9 16,7 75,0
156 2 11 16,7 91,7
232 1 12 8,3 100%
Totales n=12 -- 100% --
h(%) ni
33,3 4
16,7 2
~
8,3 1
10 23 47 99 156 232
J
Coliformes IOlales (UFC/m )
HJ%) Ni
100 o o 12
91,7 o o 11
75,0 o o 9
58,3 0----0 7
25,0 0-----0 3
8,3~ 1
10 23 47 99 150 232
Coliformes IOlales (UFC/m J)
n X
2
a l
n ( ) ( - 82,2/
S ag = ----11---- => S ag = 68,1 (UFC 1m3)
L=JL (3.6)
K
XI = X o + L; X 2 = Xl + L; :::::; X k- I = X k- 2 + L; X k = X k- I + L
Paso 4: Calcular la marca de clase, que se define como el punto medio de cada
intervalo, y se calcula mediante la ecuacin 3.7.
X'I (3.7)
Frecuencia Frecuencia
Nmero Marca absoluta acu relativa
Frecuencia Frecuencia
del Intervalo de mulada acumulada
absoluta relativa
intervalo (X;-J,XJ clase
X' I.
n N=n h=nln (%) H=h
k
= / ; =1
1 {Xo,Xti x', n, N, h, H,
:z (X"Xz] X'z nz Nz hz Hz
3 (Xz' X,] X'J nj Nj hj Hj
: : : : : : :
: : : : : : :
k-l (X. _l , X. _ti X'. _, nk _ 1 N. _, h. _, H. _,
k (X. _"X.] x'. n. N.=n h. H.=IOO%
-- Totales -- n -- 100% --
k k
n;X/ n;X/ k
;=1 ;-1
X ag = k
= =h;X/ (3.8)
; =1
ni n
;=1
X ag I100%
IEagl = X-X (3.9)
I
Siempre que X:f:: O
k k
nJX/-X"gl nJX:"'X"gl k
Sl= .....:/:.....-...:..'----- = /- 1 -::::.'Lh/(x/-x.l (3.10)
"11 (fn,)-l n-l /-/
/- /
(3.11)
Siempre que S #: O
(3.12)
(3.13)
Siempre que S #: O
En general, se puede decir que los datos estn bien agrupados si el error de agrupacin
presenta valores menores al 30%, medianamente bien agrupados si ste se encuentra
entre 30% y 70% Yun deficiente agrupamiento para errores mayores a 70%, tal como
se ilustra a continuacin:
-2- N1-1
Me:: X I _ 1 + n ni 1(L) (3.14)
[
Donde:
X;-J Lmite inferior del intervalo que contiene el valor de la mediana
n Nmero de observaciones en el conjunto de datos
X; -1 Frecuencia absoluta acumulada hasta el intervalo anterior a la clase que
contiene la mediana
ni Frecuencia absoluta del intervalo donde se encuentra la mediana
H-l Frecuencia relativa acumulada hasta el intervalo anterior a la clase que
contiene la mediana (sin porcentaje)
h Frecuencia relativa del intervalo donde se encuentra la mediana (sin
porcentaje)
L Longitud del intervalo donde se encuentra la mediana
.!J
CAPfTULO 3. DISTRIBUCiN DE FRECUENCIAS
(3.16)
Donde:
X; - 1 lmite inferior del intervalo que contiene el valor de la moda
dI =Ini - ni-! I diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia absoluta del intervalo precedente.
d] = Ini - nj+ 1I diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia del intervalo siguiente.
L longitud del intervalo donde se encuentra la moda
Si la longitud de los intervalos es igual, se pueden considerar las frecuencias relativas
(sin porcentaje), tal como se presenta a continuacin:
h,f") ",
hJ "J
h, "1
h, "1
hk nk
Xo X, Xl XJ Xk _ 1 X k
Variable X
Figura 3.5. Histograma, grfica de los intervalos de clase vs. las frecuencias
absoluta y relativa.
h,(%) n/
hJ
h1
t ~ ! n
3
n1
h'l
hk _ 1
"
~
1 ni
nk _ 1
hk t .. t nk
Variable X
Figura 3.6. Polgono de frecuencias , grfica de las marcas de clase vs. las
frecuencias relativas y absolutas.
H(%)
Variable X
H(%) Ni
H J=100% NJ=n
H1 N1
HJ NJ
H4 N4
------e
Xk _ J
Variable X
(b) Ojiva, para valores mayores o iguales
Figura 3.7 Ojiva, grfica de los intervalos y las frecuencias relativa y absoluta
acumuladas.
HJ%) NI
100% Nk=n
HK_J Nk _ J
HJ NJ
50%
H2 N2
HJ
Xo
/ XJ X2 XJ Xk _ J Xk
NJ
Me = valor de la mediana
Variable X
Tabla 3.4 Muestras del nivel de presin sonora de ruido medida en decibles (dB)
en diferentes estaciones de la ciudad de Cali. (LPD, en el da; LPN,
en la noche).
Esto es, la longitud de cada intervalo ser de 4 dB. Considerando que el valor mnimo
es de 50,2 dB, se selecciona el menor entero al valor mnimo como el valor de X o,
es decir:
X o=50dB
A partir del valor mnimo se generan los lmites superiores de los intervalos:
Xl = X o + L = 50 + 4 = 54 dB
X 2 = X + L = 54 + 4 = 58 dB
X 3 = X 2 + L = 58 + 4 = 62 dB
X 4 = X3 + L = 62 + 4 = 66 dB
X s = X 4 + L = 66 + 4 = 70 dB
X = X s + L = 70 + 4 = 74 dB
X 7 =X +L= 74+4= 78dB
Las marcas de clase se construyen como el valor medio de los intervalos de clase:
Xo+X 50+54
X; 2
=
2
=52dB
X+X2 54+58
X'=
2 =56dB
2 2
X; X +X7 = 74 + 78 = 76dB
2 2
Nmero de Porcentaje
Nmero de datos acumulado de
Nmero Intervalos de Marca acumulados Porcentaje de datos por
de datos por
del ruido por intervalo de datos por intervalo
clasa intervalo
intarvalo (X_oX) da ruido ruido intervalo de ruido de ruido
k (dB) x.', ni
; h=nln(%) ;
1 [50,54] 52 3 3 6 6
2 (54,58] 56 3 6 6 12
3 (58,62] 60 6 12 12 24
4 (62,66] 64 11 23 22 46
5 (66,70] 68 6 29 12 58
6 (70,74] 72 12 41 24 82
7 (74, 78] 76 9 50 18 100
-- Totales --- 50 --- 100% ---
25
~
~
20
.~
ji 15
~
.~
r----1
10
"';:s"
'"
"~
lt., 5
O
50-54 54-58 58-62 62-66 66-70 70-74 74-78
Niveles de ruido LPD (dB)
~ 100
~
i5 90
..s;:s 80
70
g 60
.~ 50
Ji <\)
40
~ 30
.~ 20
<ll
~ la
~ O~I~~-:~~~--~--~~--~--
54 58 62 66 70 74 78
Niveles de ruido LPD (dB)
Figura 3.10 Ojiva para los niveles de ruido en el da para la ciudad de Cali.
-
LP=101og
[1n ~
~10
O,I.LP] (3.17)
Donde:
LP Nivel de presin sonora equivalente.
n Nmero de mediciones.
LP Nivel de presin.
Es decir, el nivel de presin sonora (LP) no se puede promediar directamente ya que
esta medida se encuentra en escala logartmica. Es necesario entonces utilizar como
parmetro la ecuacin 3.17. Redefiniendo las ecuaciones 3.8 a la 3.16 con base en
la ecuacin 3.17 y la informacin de la Tabla 3.5, se calculan la media, varianza,
desviacin estndar, mediana y moda.
Me""'67.3dB
- , -lEag 1%=167,05-67,31
67,05
%=04%
,
1 [42,47} 44,5 3 3 6 6
4 (57,62) 59,5 7 25 14 50
5 (62,67) 64,5 9 34 18 68
6 (67,72) 69,5 13 47 26 94
-- Totales -- 50 -- 100% --
30
25
~
~
.~ 20
.
~
15
.~
"s:::
<Il
;os 10
"~
~
5
O
42-4 7 4 7-52 52-5 7 57-62 62-67 67- 72 72- 77
Figura 3.11 Histograma del nivel de presin sonora, ruido, medido en la noche en
la ciudad de Cali.
En la Figura 3.12 se presenta la ojiva, que representa la grfica de los lmites
superiores de clase versus los valores de frecuencia relativa acumulada. Donde se
puede analizar que el 50% de los datos tienen niveles de ruido menores o iguales a
62dB y el 94% niveles menores o iguales a 72dB.
~
~
100
90
.----.
/
~ 80
-S!;:s
;; 70
;:s
60
"<:s
.~ 50
.----/
-S!
~ 40
.~
t.J 30
s:::
<\)
;:s 20
t.J
~
c..:; la
O
54 58 62 66 70 74 78
Niveles de ruido LPD (dB)
Figura 3.12 Ojiva para los niveles de ruido en la noche para la ciudad de Cali.
Los valores de la moda y la mediana son menores en las horas de la noche que en las
horas del da. El error de agrupamiento de la moda, en este caso, es mucho mayor
que el presentado para el nivel de ruido en las horas del da.
Basura Basura
Basura por Basura por
Vivienda No. de por vivien Vivienda No. de por vivien
habitante habitante
No. habitantas da No. habitantas da
(kg/dial (kg/dial
(kg/dial (kg/dial
1 3 1.70 0,57 20 6 3,93 0,65
2 5 4,51 0,90 21 8 4,06 0,51
3 5 5,14 1,03 22 5 4,29 0,86
4 4 0,95 0,24 23 10 4.71 0,47
5 6 1.73 0,29 24 6 2,59 0,43
6 5 1,08 0,22 25 3 3,87 1,29
7 10 8,55 0,86 26 5 6.75 1,35
8 8 3.73 0,47 27 8 5,83 0.73
9 8 8,87 1,11 28 11 10,65 0,97
10 2 2,72 1,36 29 6 3,72 0,62
11 7 1,01 0,14 30 4 2,18 0,54
12 5 1,80 0,36 31 4 1,97 0,49
13 2 2,26 1,13 32 2 2,09 1,04
14 5 6,39 1,28 33 10 5,00 0,50
15 7 5,43 0.78 34 5 6,44 1,29
16 7 3.71 0,53 35 2 1,14 0,57
17 7 7,86 1.12 36 9 3,39 0,38
18 6 6,67 1,11 37 6 4,12 0,69
19 6 4,44 0.74
Datos Porcentaje
Intervalos de Marca acumulados Porcentaje de acumulado de
Nmero de Datos por datos por intervalo de
basura por por intervalo de datos por
del clase intervalo basura
vivienda basura intervalo de
intervalo de basura ; ;
(X./1Xj X.', basura
k ni
(kg/da) (kg/da) N;=Ln; h;=n;ln(%) H;=Lh(%)
;=1 = I
5 (8,IO] 9 2 36 5A 97,2
-- Totales -- 37 -- 100% --
35
30
~
~
25
.~
.....!:! 20
~
.S! 15
u
~
;:
u 10
~
t:.;
5
I
O I I
0-2 2-4 4-6 6-8 8 -10 10 - 12
Basura por vivienda (kg/da)
100
~ 90
~
~ 80
-Sl;:
t:
70
;:
<.>
~
60
~ 50
]
~ 40
.9 30
<.>
s.::
1\)
;: 20
<.>
J: 10
o
2 4 6 8 la 12
Basura por vivienda (kg/da)
El valor medio de produccin de basura por vivienda es 4,2 kg/da, con una
desviacin de 2,5 kglda. La mediana y la moda toman valores de 3,9 kglda y 3,5
kglda, respectivamente. En general, las distribuciones de frecuencias presentan una
buena agrupacin del conjunto de datos, pues se obtuvieron errores de agrupamiento
relativamente pequeos. El error de agrupamiento de la moda no existe, debido a que
en el conjunto de datos no existe moda, a pesar de que este valor se puede estimar
con la tabla de frecuencias.
Porcentaje
Datos acumulado
Intervalos de Marca acunwlados Porcentaje de
de datos por inter
Nmero de Datos por
datos por
basur por por intervalo
del clase intervalo valo de
habitente de basura intervalo de
intervalo de basura 1 basura
k
(X./JX,j X'1 basura
(kg/dl) ni N=Ln hl=nln(%)
(kg/dI) 1- / H1=Lh l (%)
i- l
-- Totales -- 37 -- 100% --
30
~ 25
~
~ 20
~
9
15
~ 10
~ 5
O +------+------r-----~----~r_----~----~----~
1-1,2 1,2 -1,4
Basura por vivienda (kg/da)
100
~ 90
~
.g 80
-Sl;:s
E::
70
;:s
<.;
(] 60
(]
.;: 50
~
~ 40
.S!<.; 30
s::
~
;:s 20
"~
~ 10
O
0,2 0,4 0,6 0,8 1 1,2 1,4
Basura por vivienda (Kg/da)
Figura 3.16 Ojiva de produccin de basura diaria por habitante para el municipio
de Talaigua (Bolvar) .
A continuacin se presentan medidas de centralidad y dispersin para la medicin
de basura por habitante en kg/da, estimados a partir de la distribucin de
frecuencias.
El valor medio de la produccin de basura por habitante es 0,7 kg/da, con una
desviacin de 0,3 kg/da. La mediana y la moda toman valores de 0,7 kg/da y 0,5
kg/da, respectivamente. En general, la distribucin de frecuencias presenta una
buena agrupacin del conjunto de datos, pues se obtuvieron errores de agrupamiento
iguales a cero, excepto para el valor de la moda.
d) En forma de J e) En forma de J
v j) En forma de U
invertida
"
(X-Xl
1-/
curtosis =k (3.19)
ns4
Donde s es la desviacin estndar y n el nmero de datos en la muestra.
~
k=0,263 k < 0,263 k> 0,263
(a) Mesoertiea: (b) Platiertiea: (e) Leptoertiea:
distribucin normal distribucin achatada distribucin apuntada
Figura 3.19 Clasificacin del nivel de apuntamiento de una curva a travs del
coeficiente de curtosis.
Intervalos para la media. Para una distribucin aproximadamente normal se pueden
estimar intervalos con relacin a la media y la desviacin estndar, como se ilustra
a continuacin:
f.I. a : contiene aproximadamente el 68% de los datos.
f.I. 2a: contiene aproximadamente el 95% de los datos.
I
I
I
I
I
I
I
I
I
I
._0-;
\. )
Y
68%
\. )
Y
95%
\. )
Y
99%
~
Frecuencias
VIfiBbII x
Y, y] Y3 .. Yk-/ Y,
margina/es de X
nll n,z n'3 n/,k _1 n"k n,.
X, hll h/2 h'3 .. hlk _ 1 h,.
h"k
n21 n2Z nZ3 nZ,k- 1 nz,' nz.
X2 hZI hzz hZ3
..
hU _1 hu hz.
n31 n3Z n33 n3,k_1 nu n3.
X3
h31 h3Z h33
.. hU _1 hu h3.
En este caso cada frecuencia absoluta, nij' es el nmero de datos que presentan los
valores Xi y lj, simultneamente.
Por ejemplo, n]3 es el nmero de datos que toman los valores X] y Y3' simultneamente.
n 34 es el nmero de datos que tienen los valores de X3 y Y4, simultneamente.
As mismo se pueden hallar las frecuencias absolutas marginales, que son equivalentes
al anlisis de las variables unidimensionales o de una variable independiente de la
otra y se denota por ni. para la variable X y nj . para la variable Y.
Por ejemplo, n 3. es el nmero de datos que toman el valor de X3 para cualquier valor
de la variable Y y es equivalente a la expresin:
k
n.4 es el nmero de datos que toma el valor de Y4 para cualquier valor de la variable
X y es equivalente a la expresin:
n. 4+ n 14 + nu+ ...... + n p4 = f
;=1
nu
~n . =n
~ l.
i= /
De forma similar:
De forma similar:
n , (h,J
Y, x, Ix: x ..
II
1( I A,A X,/
x
/
y,
y, /
/ /
7
/
/
'.
/
11
/
/
/
1/
/
/
/
/
y, / / / / / /
~
Frecuencias
Variable X [Yo. V,I IY,.Y 21 IY 2.Y31 .. (YK.,.YKI
marginales de X
n11 n12 n13 n1K n1.
[X Xd h11 h12 h13 .. h1K h1.
n21 n22 n23 n2K n2.
IX 1 X21
h21 h22 h23 .. h2k h2.
n31 n32 n33 n3K n3.
IX 2 X31
h31 h32 h33
.. h3K h3.
n 3 = n 31 + nn+ ...... + n 3k = n
j=/
3j
nI. + n].
+.n 3 + ...... + np. = ~
~ n = n L
i=1
De forma similar:
Por ejemplo, h3' es el porcentaje de datos que toman valores entre ( X 2, X 3] para
cualquier valor de la variable Y. Es equivalente a la siguiente expresin:
k
h.4 es el porcentaje de datos que toman valores entre (Y3' y J para cualquier valor de
la variable X. Es equivalente a la expresin:
De forma similar:
P k
hlJ +hll + h/3 + ...... + h p1 +hp 2 + .... +hpk = hij = 1 100%
i=l j =l
n(h)
/ /
/ /
:. f- ~
/ /
/ /
V / V /
/ / / /
h
.~
Xl XJ / Xl ....
YI / /
"XI
/ V
I
1/ ,. x
1/ / / /
YJ / 1/ 1/ /
/ / 1/ 1/ V / /
,/ / V / / / /
/ / / / /
4
Medidas y grficas
de posicion
4.1 Cuartiles
Los cuartiles son los valores que dividen un conjunto de datos que previamente han
sido ordenados en forma creciente, en cuatro partes iguales. Existen tres cuartiles
que se denominan Q/ , Q2 y Q3 y presentan las siguientes caractersticas:
Q/ : Es el valor de la variable donde el 25% de los datos es menor que este valor
y el 75% de los datos es mayor que l.
Q2: Es el valor de la variable donde el 50% de los datos es menor y el 50% de
los datos es mayor que este valor. Coincide con el valor de la mediana.
Q3: Es el valor de la variable donde el 75% de los datos es menor que l y el 25%
de los datos es mayor que este valor.
Entre los valores Q/ y Q3 se encuentra el 50% de los datos.
Entre dos cuartiles consecutivos se encuentra un 25% de los datos, tal como se
observa en la Figura 4.1.
mn. Ql Q2 Q3 mx.
Cuartiles para datos sin agrupar, en este caso se deben ordenar los datos de forma
creciente. El clculo de los cuartiles se debe realizar considerando diferentes opciones
de acuerdo con el nmero de datos. Generalmente los textos presentan que el cuartil
.. Xn+Xn
uno, Q, se puede calcular como X n + / SI n es Impar o 4 4+ / SI n es par y que
4 2
. . X 3n +X3n .
el cuartll tres, Q3' se puede calcular como X 3 (n +/) SI n es par o 7 7+ / SI n
4 2
es impar, pero estas frmulas no funcionan en todos los casos. (El lector puede
verificarlo con los ejemplos que se muestran en este captulo).
Para el clculo de los cuartiles los datos deben estar ordenados en forma ascendente,
los valores repetidos deben considerarse en el conjunto de datos. Las diferentes
opciones para el clculo de cuartiles se presentan en las siguientes ecuaciones:
. n+l
S1 --2- es par: (4.2)
(4.3)
Q3 = X3" +J (4.5)
4
X"+X,,
- -+1
Q1= 1 1
Si n es par: 2 (4.6)
3X"
-+1 +X"
-
Si !!. es par: QI= 4 4 4 O, 75X" + 0,25X" (4.7)
2 -+I -
(4.8)
es un nmero par, se utilizan las ecuaciones 4.1,4.2 Y 4.3 para el primero, segundo
y tercer cuartil, respectivamente, tal como se presenta a continuacin:
X S +X6
Q/ = 2 0,5Xj + 0,5X6 = 0,5( 152) + 0,5( 155) = 153,5 mg / I
Es decir, el 25% de los datos son menores que 153,5 mg/l y el 75% de los datos
superan este valor en el efluente de DQO en la planta UASB.
Q2=X/ o =191 mg/I
Donde el 50% de los datos son menores que 191 mg/I y el 50% de los datos
supera este valor. Es el valor de la mediana.
X U +X/5
Q3 = 2 = 0,5Xu + 0,5X/5 = 0,5( 257) + 0,5( 260) = 258,5 mg / I
Significa que el 75% de los datos es menor que 258,5 mg/l y e125% de los datos
supera este valor en el efluente de DQO en la planta UASB.
Cuartiles para datos agrupados: En este caso se considera que los datos estn
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los cuartiles. Los cuartiles se pueden calcular a travs de la ecuacin
4.11 si se utilizan las frecuencias relativas, o con la ecuacin 4.12 si se utilizan las
frecuencias absolutas.
Q. =x1-/ + (0,25k-H
2 1- / ) (L) (4.11)
Donde:
k : Valor del k-simo cuartil a ser calculado (k = 1, 2 3)_
X _/: Lmite inferior del intervalo que contiene el valor cuartiL
n : Nmero de observaciones.
H - 1: Frecuencia relativa acumulada del intervalo anterior al que contiene el cuartil
(sin porcentaje).
h : Frecuencia relativa del intervalo donde se encuentra el cuartil (sin
porcentaje).
N - 1: Frecuencia absoluta acumulada del intervalo anterior al que contiene el
cuartiL
n : Frecuencia absoluta del intervalo donde se encuentra el cuartiL
Significa que e125% de los datos es menor que 62.2 dB Yel 75% de los datos supera
este valor.
Segundo cuartil
Se encuentra en el quinto intervalo, considerando que los datos hasta all son menores
o iguales que 58% y en el cuarto intervalo los datos son menores o iguales al 46%,
segn la columna de frecuencia relativa acumulada, presentndose los siguientes
valores:
n = 50; k = 2; X 4 = 66 dB; H 4 = 46% = 0,46; hs = 12% = 0,12; L = 4
Entonces:
Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.
Tercer cuartil
Se encuentra en el sexto intervalo, pues los datos hasta all son menores o iguales al
82%, segn la columna de frecuencia relativa acumulada. Por lo tanto, se generan
los siguientes valores:
n = 50; k = 3; X s = 70 dB; H s = 58% = 0,58; h = 24% = 0,24; L = 4
Entonces:
(0,75 - 0,58) (4) = 72,8 dB
Q3 = 70 + 0,24
Significa que el 75% de los datos es menor que 72,8 dB Y e125% de los datos supera
este valor.
4.2 Deciles
Los deciles son los valores que dividen el conjunto de datos, ordenados en forma
creciente, en diez partes iguales. Existen nueve deciles que se denominan DI' D2J ,
D9' Cada decil representa el! 0% del total de los datos y entre dos deciles consecutivos
se encuentra un 10% de los datos, tal como se presenta en la Figura 4.2. El clculo
de los deciles se puede realizar para variables no agrupadas y variables agrupadas.
X ... si n es par
D=
k 10
Xk(It+I)
10
si n es impar
(4.13)
Ejemplo 4.3 Para los datos del ejemplo 4.1, sobre la Demanda Qumica de
Oxgeno (DQO) en el efluente de una planta de tratamiento anaerbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
110; 126; 135; 145; 152; 155; 160; 181; 191; 191; 200; 208; 216; 257; 260;
312; 315; 320 Y 320 (mg/l).
Se calculan a continuacin los deciles del conjunto de datos (n=19):
D s = X s (fI + 1) = X IO = 191 mg / I
10
D 6 = X 6 (fI + 1) = X 12 = 208 mg / I
10
El decil 3, D J , significa que el 30% de los valores es menor que 155 mg/l y el
70% de los datos supera este valor.
El decil5, D s , significa que el 50% de los datos es menor que 191 mg/l y el 50%
de los datos supera este valor.
El decil 9, D 9 , significa que el 90% de los datos es menor que 320 mg/l y el1 0%
de los datos supera este valor.
Deciles para datos agrupados: En este caso se considera que los datos estn agrupados
en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre cada
uno de los deciles a estimar. Los deciles se pueden calcular a travs de la ecuacin
4.14, si se utilizan las frecuencias relativas, o con la ecuacin 4.15, si se utilizan las
frecuencias absolutas.
Donde:
k : Valor del k-simo decil a ser calculado. (k = 1,2, 3, 4, .... , 9)
X _I : Lmite inferior del intervalo que contiene el valor decil.
n : Nmero de observaciones en el conjunto de datos.
Ejemplo 4.4 Considerando los datos del ejemplo 3.2 y la tabla de distribucin
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presin sonora de ruido medido en decibeles (dB), para diferentes estaciones
de la ciudad Santiago de Cali, en el da. Se calculan a continuacin los deciles
D, DsY D", utilizando la ecuacin 4.14.
Primer decil
Se encuentra en el segundo intervalo, debido a que los datos hasta all son menores o
iguales al 12%, segn la columna de frecuencia relativa acumulada y el primer decil
es el valor que genera el 10% de los datos menores que l. Por lo tanto, se generan
los siguientes valores:
n = 50; k = 1; XI = 54 dB ; HI = 6% = 0,06 ; h } = 12% = 0,12; L = 4
Entonces:
D =X + [0,1(l)-HJ (L)
I I h
1
Es decir, el 10% de los datos es menor que 55,3 dB Y el 90% de los datos supera
este valor.
Quinto decil
Se encuentra en el quinto intervalo, debido a que los datos hasta all son menores
o iguales al 58%, segn la columna de frecuencia relativa acumulada y el quinto
decil es el valor que genera el 50% de los datos menores que l. De esta manera se
generan los siguientes valores:
n = 50; k = 5; X 4 = 66 dB; H 4 = 46% = 0,46; h5 = 12% = 0,12; L = 4
Entonces:
Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.
Noveno decil
Se encuentra en el sptimo intervalo, pues los datos hasta all son menores o iguales
al 100%, segn la columna de frecuencia relativa acumulada, y el noveno decil es
el valor que genera el 90% de los datos menores que l. Por lo tanto, se generan los
siguientes valores:
n = 50; k = 9; X = 74 dB; H = 82% = 0,82; h7 = 18% = 0,18; L = 4
Entonces:
Significa que el 90% de los datos es menor que 75,8 dB Yel 10% de los datos supera
este valor.
4.3 Percentiles
Los percentiles son aquellos valores que dividen los datos ordenados de forma
creciente, en cien partes iguales. Existen noventa y nueve percentiles que se denotan
por P, P 2 , . . . . . . . oo. , P 99 , donde cada percentil representa el 1% del total de los
datos.
El percentil 1, PI> supera el uno por ciento de los valores y es superado por el 99%
de los datos restantes. El percentil 95, P 95 , supera el 95% de los datos y es superado
por el 5% de los datos. P k : Percentil k-simo, es aquel valor de la variable que deja
a su izquierda el k% de la distribucin.
Percentiles para datos sin agrupar, en este caso se deben ordenar los
datos en forma creciente. Si se considera el conjunto de datos ordenados
XI' X 2 , X 3 , X n _ l' X n , los percentiles se pueden calcular a travs de la
ecuacin 4.16.
x ... si n espar
P=
Ir lOO
XIr(If+J)
110
si n es impar
(4.16)
Ejemplo 4.5 Para los datos del ejemplo 4.1, sobre la Demanda Qumica de
Oxgeno (DQO) en el efluente de una planta de tratamiento anaerbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
Se calculan a continuacin los percentiles 35, 80 Y 95.
El percentil 35, P35 , significa que el 35% de los valores es menor que 160 mg/l
y el 65% de los datos es mayor que este valor.
El percentil 80, Pao, significa que el 80% de los datos es menor que 312 mg/l y
el 20% es mayor que este valor.
El percentil95, P 95 , significa que el 95% de los datos es menor que 320 mg/l y
el 5% es mayor que este valor.
Percentiles para datos agrupados. En este caso, se considera que los datos estn
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los percentiles a estimar. Los percentiles se pueden calcular a travs de
la ecuacin 4.17, si se utilizan las frecuencias relativas, o con la ecuacin 4.18, si
se utilizan las frecuencias absolutas.
Donde:
k : Valor del k-simo percentil a ser calculado. (k = 1,2,3,4,5, 6, 7, .... , 98,99)
n : Nmero de observaciones.
Ejemplo 4.6 Considerando los datos del ejemplo 3.2 y la tabla de distribucin
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presin sonora de ruido medido en decibeles (dE), para diferentes estaciones
de la ciudad de Santiago de Cali, en el da. Se calculan a continuacin los
percentiles 25, 80 Y 95, utilizando la ecuacin 4.17.
Percentil 25
Se encuentra en el cuarto intervalo, debido a que los datos hasta all son menores
o iguales al 46%, segn la columna de frecuencia relativa acumulada y el percentil
25 es el valor que genera el 25% de los datos menores que l, lo cual genera los
siguientes valores:
n = 50; k = 25; X 3= 62 dB; H3 = 24% = 0,24; h4 = 22% = 0,22; L = 4
Entonces:
( 0,25 - 0,24 )
P 15 = 62 + 0,22 ( 4 ) = 62,2 dB
Es decir, el 25% de los datos es menor que 62,2 dB Y el 75% de los datos supera
este valor.
Percentil 80
Se encuentra en el sexto intervalo, debido a que los datos hasta all son menores o
iguales al 82%, segn la columna de frecuencia relativa acumulada. De esta manera
se generan los siguientes valores:
n = 50; k = 80; X 5 = 70 dB; H5 = 58% = 0,58; h5 = 24% = 0,24; L = 4
Entonces:
( 0,80 - 0,58 )
Pao = 70 + 0,24 ( 4) = 73,7 dB
Es decir, el 80% de los datos es menor que 73,7 dB Y el 20% supera este valor.
Percentil 95
Se encuentra en el sptimo intervalo, pues los datos hasta all son menores o iguales
al 100%, segn la columna de frecuencia relativa acumulada. De esta manera se
generan los siguientes valores:
n = 50; k = 90; X = 74 dB ; H = 82% = 0,82; h 7 = 18% = 0,18; L = 4
Entonces:
( 0,95 - 0,82 )
P 95 =74+ 0,18 (4)= 76,9dB
Significa que el 95% de los datos es menor que 76,9 dB Y el 5% supera este valor.
Tambin existen los quintiles que dividen el conjunto de datos en cinco partes iguales;
existen cuatro quintiles que se pueden denominar k l , k], k j Y k".
En teora, los percentiles 25%, 50% Y 75% son el primero, segundo y tercer cuartil,
respectivamente. As mismo, los percentiles P/O ' p]O ' PjO, P"o , P so , Po, P 70, Pao Y
P 90 corresponden a cada uno de los deciles DI ' D] , D j , Do Ds, D, D 7 , DaY D 9,
respectivamente. Tal como se presenta a continuacin:
PJO = DI ; P10 = Dl ; P30 = Dj Y as sucesivamente hasta P 90 = D9 Y
Sem;rrecorr;do ;nter-cuartil
SRa = QJ- Q (4.22)
2
Diagrama general. Se basa en el valor mnimo, los cuartiles (Q/> Q2 y Q3) y el valor
mximo. Los pasos para construirlo se presentan a continuacin:
Dibujar y marcar un eje de medida horizontal o vertical.
Construir una caja (rectngulo), con ancho arbitrario (el ancho no tiene
representacin estadstica alguna), cuyo borde izquierdo (inferior) sea el valor del
primer cuartil y el borde derecho (superior) sea el valor del segundo cuartil.
Construir una segunda caja a partir del lmite derecho (superior) de la primera
caja, hasta el valor del tercer cuartil.
- ",4x.
-Q3
- M. =Qz
-Q
mn. Q Qz = M. Q] mx.
I I I
I
-mn.
(a) (b)
Figura 4.3 Diagrama general de cajas y alambres en un eje vertical (a) y un eje
horizontal (b).
La dispersin est dada tanto por la longitud de la caja, como por la distancia
entre los extremos de los bigotes.
El sesgo se observa en la desviacin que exista entre la lnea de la mediana en
relacin con el centro de la caja, y tambin la relacin entre las longitudes de los
bigotes.
Las colas de la distribucin se pueden apreciar por la longitud de los bigotes
en cuanto a la altura de la caja, y tambin por las observaciones que se marcan
explcitamente.
_ : '::lf::I~,. :l
!(
I
110
I
153,5
I
191
I
258,5
I
320
Xmn Q Qz QJ Xmx
Niveles de DQO (mg/I)
Figura 4.4 Diagrama de cajas y alambres para los datos de DQO en una planta
de tratamiento UASB.
Considerando que en cada cuartil se encuentra e125% de los datos, se puede analizar
que la distribucin es asimtrica en relacin con la mediana, as mismo, que existe
menor dispersin en el intervalo (153,5; 191) mgll que en el intervalo (191; 258,5)
mgll. El bigote de la izquierda presenta menor longitud que el bigote de la derecha,
evidenciando que por debajo del valor de la mediana; 191 mgll, el conjunto de datos
presenta menor nivel de variacin que por encima de este valor.
Diagrama con puntos extremos. En este caso se realizan las cajas como en el caso del
diagrama general, adicionando los lmites generados por cercos internos y externos,
utilizando las siguifntes expresiones:
cerco interno inferior ~ QJ-1.5*RlC
cerco interno superior ~ Q3+ 1.5*RlC
cerco externo inferior ~ QJ-3*RlC
cerco externo superior ~ Q3 +3*RlC
-QJ}
_ Ql 50 % de datos
-Q/
- 1,5RlC
o
O Puntos extremos
O
3RIC
*
* Puntos raros u "outliers"
*
~ En. Feb Mlr Abr Jun Jul Al' 5., Oct Nov Die
1994 63,5 70,4 160,5 101 89,5 92,5 100,5 115,3 158,9 99,4 97,8
1995 58,4 78,3 168,9 110 95,6 80.7 115,2 120,3 166,2 103 89.7
1996 60,2 80,1 152,3 108 102 89,6 97,3 109,4 171,3 96,5 80,4
1997 70,2 70,4 156,3 112 98,4 86,9 103,3 110,3 169,2 97,5 86,3
1998 98,2 78,2 159.7 106 90,1 90,6 105,8 114,5 160,5 89,3 94,2
1999 57,3 69,8 148,9 98.7 85,6 79,4 95,4 100,2 149.7 90,1 85,2
2000 68,2 75,6 158,9 112 98,9 88,1 108,4 109,8 168,4 86,3 79,8
2001 59,8 71.2 160,2 105 88,5 83.7 104,2 118,2 170,2 90,4 86,3
2002 68,1 73,2 156.7 110 96,8 91.7 107,9 111,8 165,9 94.7 95,8
RlC= Q3 - QJ = 8,7 mm
200
195.3
182,3
169.2
166,2
160.5
150
147,4
134.4
,......,
'O'"
'-'
Q
' (3 100
111 .3
101
!
.....
:&U
90,6
88.1
e
p.,
83,7
73.3
63
50
Julio Octubre
Meses
63,5 70,4 89,5 92,5 97,8 99,4 100,5 101 115,3 158,9
Precipitacin en el ao de 2002:
68,1 73,2 91,7 94,7 95,8 96,8 110 107,9111,8 156,7 165,9
Q2=X6 = 96,8 mm
Precipitacin
(mm) o \ 65 ,9
\ 59,8 \ 58,3
\35
\34
\ 09,9
08,2
99,4 96,8
9\ 93,2
65,2
68, \
43 ,\
39,4
1994 2002
Aos
Altura del hijo =85 (cm) + (0,5)* altura del padre (cm)
y=a+bx (5.1)
Por ejemplo, si el padre mide 2,0 m = 200 cm, entonces se desea estimar la estatura
media de su hijo, es decir, cunto vale y = ?, para un valor x = 200 cm, reemplazando
en la ecuacin 5.1 se obtiene:
y = 85 + 0,5( 200 ) = 185 cm
Entonces, se espera que el hijo mida 185 cm = 1,85 m, es decir alto, pero no tanto
como el padre. El valor tiende a regresar a la media.
Si el padre mide 1,2 m = 120 cm, entonces se desea estimar qu se espera de la
estatura de su hijo:
y = 85 + 0,5( 120 ) = 145 cm
En este caso, se espera que el hijo mida 1,45 m, es decir bajo, pero no tanto como
el padre. El valor tiende a regresar a la media.
Actualmente el trmino regresin se utiliza para predecir una variable en funcin de
otra, y no implica que se est estudiando si se produce una regresin a la media.
El aspecto estadstico de la regresin consiste en lograr una estimacin funcional
de la relacin entre dos o ms variables. En este proceso es necesario identificar
una variable independiente o de respuesta, y, la cual no es controlada en el estudio;
los valores de esta variable dependen de una o ms variables independientes o de
regresin, que se denominan x" x], x 3 , , x n. Estas variables independientes o
de regresin no son aleatorias y no tienen propiedades poblacionales.
La variable y puede ser de carcter cuantitativo o dicotmico (aquella que
slo admite dos categoras que definen opciones o caractersticas mutuamente
excluyentes: s o no). En el primer caso se habla del modelo de regresin lineal y
en el segundo caso del modelo de regresin logstica. La diferencia fundamental
entre el modelo de regresin lineal y de regresin logstica es que el primero
predice el valor medio de la variable dependiente (y) a partir de una o ms variables
independientes; mientras que el segundo permite predecir la proporcin de una
Modelo de regrala
I
I I!I
Simple Mldple
Una variable independiente x Varias variables independientes
Una variable dependiente: y x"xz,,x"
Una variable dependiente: y
Lineal N o lineal Lineal No lineal
-'"
(a) (b)
Et
Evapotranspiracin
Qv
Caudales de entrada Excesos
EMBALSE
dS
Cambio en almacenamiento
P Suministro
Precipitacin Q
Infiltracin
F
BALANCE: 1 + P = Et + F + Qv + Q + dS
a) Esquema de un modelo determinstico. Balance de agua en un embalse
F.L.A.
Ag Ul1 ,- -.
atl lente
....
agua
Posibles valores en el
(5.2)
Donde:
Y : Valores de la variable de respuesta o dependiente. Genera un vector fila
T
transpuesto de dimensin (n x 1): [Y'Y]'Y3' .......'Ynl
x Valores de la variable independiente. Genera un vector fila transpuesto de
dimensin (n x 1) : [x, x]' x 3 , , xnl T
}Jo Valor poblacional desconocido, el cual se estima a travs del conjunto de datos.
Es el valor de y cuando la variable x toma el valor de O. Punto de corte con el
ejey
}J, Valor poblacional desconocido, el cual se estima a travs del conjunto de
datos. Es el valor de la pendiente de la recta.
E Error aleatorio. Genera un vector de dimensin (n x 1) : [E" E], E3 , ....... , Enl T
Modelo poblacional
...--
. - Estimacin de parmetros
y=a+bx Modelo muestral
I'xIy = E (y / x) = E ( Y) = y = a + bx (5.3)
y= a +bx
Variable y
Variable x
ft n ft
Para obtener los mnimos de la ecuacin 5.4 se deben encontrar primero las derivadas
parciales con respecto de a y b, tal como se presenta en las ecuaciones 5.5 y 5.6,
respectivamente.
(5.5)
(5.6)
- 2 (y - a - bxi = O
-2 x(y,-a-bx,i= O
Y - a- b x =O
xY- a x-b x/=O
" "
na+b x=y
- 1 - I
(5.7)
"
a x;+ b
" x/ = xy
"
- 1 ;- 1 ;- 1
" ""
=;
n (x;y) - ( LXi)
;
(y;)
b (5.8)
" "
n (x/) - ( xli
;
Una vez calculado b se puede despejar de alguna de las ecuaciones del sistema 5.7
el valor de a, generando la ecuacin 5.9.
" "
y- b
---'--1
LXi = _YI
_
- -=----1_....:....1-....:....1_
bx1
a n =y-bx (5.9)
n n
E {e} ro
E {el] O
E { e;} = O => E { e;} = I =
E {en]1 IO
E ( e) - N ( o,rl )
El cumplimiento de este supuesto permite realizar inferencias sobre los parmetros
estimados del modelo de regresin.
del conjunto de datos; puntos atpicos u outliers, los cuales se pueden confirmar a
travs de las grficas de cajas y alambres.
Estos diagramas se pueden realizar con relativa facilidad en diferentes programas de
computador. En la Figura 5,5 se presenta el esquema general de un diagrama de dispersin,
el cual representa una gran ayuda en la definicin de la ecuacin matemtica que permita
estimar la tendencia de los datos. Por ejemplo, en la Figura 5,6 se evidencia una tendencia
de los datos a una lnea recta, con pendiente positiva y corte en el origen.
Yi
:
.
- -+-
~* ~ x
.
Xi
1200
=
~ 1000
!.
'" 800
"5
~
600
~
::s
'" 400
~'"
-
~
200
O
O 200 400 600 800
Turbiedad (UNT)
Figura 5.6 Diagrama de dispersin entre las variables slidos suspendidos (y) y
turbiedad (x).
Para hallar los parmetros a y b del modelo de regresin lineal se presenta en la
Tabla 5.1 el clculo de las operaciones requeridas para su estimacin.
Tabla 5.1 Datos de turbiedad y slidos suspendidos en una estacin del ro Cauca,
para ser analizados en un modelo de regresin lineal.
.
Slidos
Nmero de Turbiedad
observacin suspendidos
Fecha (UNT)
(mg/l) Xi * X, x, * y,
i Xi
Yi
1 04Mar-91 42 71 1764 2982
2 07-Mar91 72 146 5184 10512
3 11Mar91 360 505 129600 181800
4 14-Mar91 35 61 1225 2135 ;
5 08Abr91 65 136 4225 8840
6 11Abr91 120 169 14400 20280
7 15Abr91 100 190 10000 19000i
8 14May-91 190 269 36100 51110 I
9 16May-91 650 978 422500 635700
10 20May-91 230 394 52900 90620
11 23May-91 105 176 11025 18480
12 27-May-91 75 120 5625 9000
13 30May-91 69 99 4761 6831
Slidos
Nmero de Turbiedad
observacin Suspendidos
Fecha (UNT) x*x X*Yi
(mgfl)
i x
y
14 04Jun91 125 133 15625 16625
15 06Jun91 85 140 7225 11900
16 11Jun91 32 53 1024 1696
17 13Jun91 34 54 1156 1836
18 17Jun-91 85 123 7225 10455
19 24-Jun91 450 568 202500 255600
20 02Jul91 51 84 2601 4284
21 04-Jul91 37 73 1369 2701
22 11Jul-91 62 84 3844 5208
21
=suma 3074 4626 941878 1367595
;=/
Utilizando los resultados de la Tabla 5.1 y las ecuaciones 5.8 y 5.9 se tienen los
siguientes resultados para los coeficientes de regresin a y b.
Inversa y
.PI
=.Po + -+8
x
Contina en la pgina siguiente
Los modelos lineales son tiles en muchas situaciones, y aunque la relacin entre
la variable de respuesta y las variables regresoras no sea lineal, en muchos casos
la relacin es "linealizable" en el sentido de que haciendo transformaciones con
logaritmos o funciones inversas en la variable de respuesta y/o algunas variables
regresoras, la relacin se convierte en lineal. Sin embargo, existen situaciones
donde una relacin no lineal no es factible su linealizacin. En este ltimo caso se
denomina modelo de regresin no lineal (El estudio de un modelo de regresin no
lineal es muy extenso y complejo, pero existe una amplia literatura sobre el tema).
En la Tabla 5.3 se presentan ejemplos de modelos no lineales y su transformacin a
modelos lineales en los parmetros y variables de regresin.
Tabla 5.3 Modelos de regresin no lineales y su transformacin a modelos de
regresin lineales.
Funci6n Modelo no lineal Modelo transformado a lineal
1 1
Hiprbola 1 y= +8 -=fl
y o+fl X+8
flo+ fl1x
x 1 fl
Hiprbola 2 y= +8 y=flo--X+ 8
flox-fl
1
Raz y =fJofJ~+ & Iny=lnfJo+-X Infl+&
1
logstica 1 Y = fJ fJ; + & In y = -lnfJo -x InfJ+ &
o
Gamma o
especial de Hoerl y =fJOeP1XxP' + & In y = InfJo + flx + fJ]ln x + &
Gauss y =fJo eP{X -fJ,/ + & ; fJ < O Iny = InfJo + fJ (x-fJ]l + &
1 1
Especial 2 Y =fJo+fJe- x +&
y=a+bx mues/ral a xl + b
1- /
;- /
x: = Xy
;- /
n n
y=po+p/lnx+e poblacional na+b Inx= y
- / - /
n n n
y=a+blnx mues/ral a Inx+b (lnxl/= ylnx
;- 1 - l - J
n n
Y = PoxtI'+ e
lny = InPo +plnx +e
} poblacional n In a + b In x =
;- / ;- /
In y
n n n
n n
y =Po efl,x+ e
Iny=lnPo+px+e } poblacional n In a + b x =
;- /
i=I
Iny
n n n
n 1 n
y=Po+ p +e poblacional na+b -=y
x _ I Xi _ I
n 1 n 1 n y.
b
y=a+ -x mues/ral a-+b-=~
;_1 X 1_ / xi _ I x
Y =Pop/'+ e
1 } poblacional n In a + In b -x1 =
n
_ / _ /
n
In y
Iny = In Po +-X Inp+e
n 1 n 1 n Iny .
1 Ina-+b2=-'
Iny=lna+ -X Inb mues/ral _ / x 1_ / XI _ / x
n n n
na +b xl+c x/= y
;- / i=I i- J
y=Po+PX+P2r +e poblacional n n n n
a x+b x/+c x; = xy
;- / - I =/ ;=/
y=a+bx+d mues/ral n n n n
a x:+ b x/+ C x/ =
;- / ;- / - I
; ""' 1
X2y
na+b ix,'h+eix,=iy,
- I 1- 1 - 1
y = flo + flx'h + fllX + e poblaeional
a ix,'h+bix,+e ix~=ix:y,
/- / /- / /- / ;- /
y=a+bx'h + ex muestral
a ix,+bix~+e i x / = ix/y/
/- / /- / /- 1 - I
- fl2 +e ;fl< O }
Y 1 +efl+fl,x poblacional n n e
na + b x = In ( - - 1 )
In (L
y
-1 )=flo+flx+e - /- y
,. " ,. e
a x+b x/= xln (- -1)
e - / /- / /- / y
In(--1)=ax+b muestral
y
n n
y =fl o efl,(x- fl ,/ + e,fl<O } n In a + b (x - e/ = In y
/- / - /
Iny=lnflo+fl/(x-fll/ +e poblacional
Ejemplo 5.2 Calcular el modelo potencial y =flo X fJ1 + e para estimar niveles
de slidos suspendidos a partir de valores de turbiedad, en una estacin de
monitoreo del ro Cauca, con los datos presentados en el ejemplo 5.1. Con el
fin de seguir los procedimientos para estimar los coeficientes de regresin de
la lnea recta, se debe linealizar la ecuacin potencial aplicando logaritmo
natural, generando la ecuacin 5.11, que es lineal en los parmetros de
regresinfloY fll '
.,
7
7
~
:;;
.
1::
~
6
:oc 6
''""
~
:::: 5
.~
'"
~ 5
~
....
4
3
3 4 4 5 5 6 6 7 7
LN de turbiedad
Hallando las derivadas parciales con respecto a cada uno de los parmetros a estimar,
se obtienen las ecuaciones 5.13 y 5.14.
oLe: n
~ =- 2
ob
In x ( In Y -In a - b In x)
=1
(5.14)
n In a + b In x = In y
1-1 1-1
n n n (5.15)
In a ~)nx+b (Inx,l=
-1 -1
-1
Inx Iny,
Con el fin de calcular las diversas sumas que se requieren para la estimacin de
los coeficientes, se presentan en la Tabla 5.5 los datos que permiten reemplazar las
ecuaciones normales del modelo potencial, para el ejemplo 5.2.
Tabla 5.5. Valores que permiten estimar el sistema de ecuaciones normales del
modelo potencial y =/Jo xP 1 + e
Slidos In
turbiedad
suspendidos In Un tur)x Un tur)x
Observacin (slidos
fecha (x} (turbiedad) (lntur) Un slidos)
i (y} suspendidos)
(UNT) ( lnx} (lnx;/ (lnx,lny)
(mgll) ( lny,)
1 04Mar91 42 71 3.74 4,26 13,97 15,93
2 07Mar-91 72 146 4,28 4,98 18,29 21,31
3 ll -Mar-91 360 505 5,89 6,22 34,65 36,64
4 14-Mar-91 35 61 3,56 4,11 12,64 14,62
5 08-Abr-91 65 136 4,17 4,91 17,43 20,51
6 ll-Abr-91 120 169 4.79 5,13 22,92 24,56
7 15-Abr-91 100 190 4,61 5,25 21,21 24,16
8 14-May-91 190 269 5,25 5,59 27,53 29,36
22 In a + 99,88 b = 109,98
99,88 In a + 468,47 b = 513,09
b = 0,917814 Y In a = 0,8322
a =2,2984
Por lo tanto el modelo de regresin queda definido por la ecuacin 5.16 5.17.
, I
I
I ~ I ,
t It
I
1-....
t t
I
I
I
c-;.",.... I
I
I
I
v.- I
1M
I
-.----------------------------- I
Jl
tic
61.
7 7
6>'
x x
116 116
y y
/1
6
y=ax 6 /1
--_-:y=ax
x 1 x
y b>O y b<O
y =a +blnx
y=a +blnx
X
X
, ,
,-u"" ,-_""
l:
b<'
x x
y
1
y (a + be-X)
l/a 1- - - - 1- - - - - - - - :.::.;:..::.::- - - - -
o x
~
,,
y=a + be-x
a--r---------------------+ a
x x
n n
(x-x)(y-y) (xi-xl
- / -/
r= =b (5.18)
n n n
(xi-xl (y-il (y-il
-/ -/ -1
(5.19)
y y
r<'
6<'
x x
a) b)
y y
r 'Z O
l
.
r -:: :, O
-=----.x
I
x
t
a) b)
y
r=:.1
y
r =:. -1
y.
r=-1
a) b)
t No hay
j
Correlacin correlacin Correlacin
negati va positi va
perfecta perfecta
Correlacin negativa Correlacin positiva
~ ~
Igual valor de r
/
...
Igual valor de r
(xi-xl 512356,36
r=b ;=1 = 1,40765* 1035004,36 = 0,99 o r = 99%
n
~:rY;-YY
;=1
Turbiedad Slidos
Observacin
IUNT) suspendidos Irng/ll (xi-xl (Y/-yi
i
Xi Yi
1 42 71 9549,20 19396,13
2 72 146 4586,00 4130,63
3 360 505 48523,28 86865.77
4 35 61 10966,28 22281,53
5 65 136 5583.08 5516,03
6 120 169 388,88 1703.21
7 100 190 1577,68 410.87
8 190 269 2528,08 3449,21
9 650 978 260385.68 589409,35
10 230 394 8150.48 33756.71
11 105 176 1205.48 1174.43
12 75 120 4188.68 8148,67
13 69 99 5001.32 12381.01
14 125 133 216.68 5970.65
15 85 140 2994,28 4937.87
Contina en la pgina siguiente
Turbiedad Slidos
Observecin
(UNT) suspendidos (mg/l) (x-xl (Y-yl
i
XI YI
16 32 53 11603,60 24733.85
17 34 54 11176,72 24420.31
18 85 123 2994,28 7616.05
19 450 568 96273.68 127970,75
20 51 84 7871.24 15944,11
21 37 73 10551,40 18843,05
22 62 84 6040,40 15944.11
22
=suma 3074 4626 512356.36 1035004.36
- 1
"
( In x-In xl
15,06
- I
r=b - - - - - - - =0,917814 * - - - = 0,98 o r = 98%
n 13,11
(lny-Inyl
- I
(5.20)
Modelo Tipo r K
ss = 13,5856 + 1,40765 * TU Lineal 0,99039 0,98087
Coeficiente de no determinacin
A partir del coeficiente de determinacin, se puede definir el coeficiente de no
determinacin, el cual mide la proporcin de la variacin total de y, que no es
explicada por la variacin de x y se calcula como 1 - R 2 . Por ejemplo, para un valor
de r = 0.8, el valor del coeficiente de determinacin es R 2 = 0,64 o 64%, el coeficiente
de no determinacin es 1- R 2 = 0,36 o 36%, es decir, e136% de la variacin de y no
se debe a la variacin de la variable x.
Algunos aspectos para definir el modelo de regresin
A continuacin se presentan algunos aspectos a considerar en la estimacin de un
modelo de regresin.
Analizar el grado de causa-efecto entre las variables a correlacionar. Si se sabe
el comportamiento del fenmeno en trminos de su ecuacin diferencial, como
por ejemplo, si el crecimiento de y por cada unidad de x es constante, es decir:
6
Planeacin estadstica
en un proyecto
de investigacin
Figura 6.1 Esquema general de una planta de tratamiento con tecnologa FiME.
(Galvis, 1999).
Filtro Grueso Dinmico (FGDi). Consiste en una estructura que consta de una capa
de grava fina del orden de 0,2m-0,3m de profundidad. El agua que entra en la unidad
fluye sobre la capa fina de grava y parte de ella drena, a travs del lecho, hacia una
tubera perforada y continua hacia la siguiente etapa en el sistema de tratamiento. La
velocidad de operacin de estas unidades puede estar entre 1,0 m/h y 9,0 m/h.
Filtro Grueso Ascendente en Serie (FGAS). Consiste en tres estructuras, de 1,2 m a
1,5 m de altura, encontrndose en cada una determinado tamao de grava. La grava
se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava gruesa
hasta la grava ms fina, con flujo ascendente. La velocidad de operacin es del orden
de 0,3 m/h a 3,0 m/h.
FLA 1
-t.4 ~
FLA2
-2.2 ~
FLA3
~uenteO.1
deagua ~~[B~:]uP~~~~~ 3.4 ~
FLA4
-4.4 ~
FLA 5
-5.4 ~
Filtracin Gruesa Descendente en serie 3 Etapas (FGDS3)
Filtro Grueso Ascendente en Capas (FGAC). Consiste en una sola estructura, de 1,2 m
a 1,5 m de altura, en la cual la grava se encuentra instalada por capas, quedando en
el fondo el material grueso y en la superficie el material fino. La grava se coloca de
gruesa a fina. El agua atraviesa la estructura desde la grava gruesa hasta la grava
ms fina, con flujo ascendente. La velocidad de operacin es del orden de 0,3 m/h
a 3,0 m/h.
Filtro Grueso Horizontal (FGH). Consiste en una estructura rectangular, compuesta
de tres capas de grava las cuales van de gruesa a fina. El flujo del agua va en sentido
horizontal. La velocidad de operacin es del orden de 0,3 m/h a 3,0 m/h.
Temperatura (OC) 4d 4d
Laboratorio Direccin
flsico-gulmico del
proyecto
Comit de
Toma de
Anlisis de
muestras y
reporte de
datos
1-----
rea de in:enierla
seguimiento y
control de
proyectos Cinara
muestras
Responsable del
proyecto
Laboratorio
microbiol:ico Informacin
tcnica y socio
Anlisis de econmica
rea de
muestras y informacin ~
reporte de datos sistemas
Base de datos
Anlisis estadstico
Proyecto Integrado de Investigacin y Demostracin de Mtodos de Pretratamiento para Sistemas de Abastecimiento de Agua. <
~
:Il
Fecha: G)
~
~
(j)
LINEA 1 LINEA 2 LINEA 3 LINEA 4 LINEAS "TI
:Il
FGASl FGAS2 FGAS3 FLAl FGAC FLA2 FGHMl FGHM2 FGHM3 FLA3 FGHl FGH2 FGH3 FLA4 FGDSl FGDS2 FGDS3 FLAS ~
Z
()
Variable 1.1 1.2 1.3 1.4 2.1 2.2 3.1 3.2 3.3 3.4 4.1 4.2 4.3 4.4 5.1 5.2 5.3 5.4 o
Hora
Turbiedad (UNTl
Color real (UPC)
pH (Unidades)
m
(j)
Alcalinidad
~ (l11li/1 CaCo3)
o
Dureza total (mgJI CaCo3)
-i
Oxgeno disuelto (l11li/11
~
O Slidos suspendidos (l11li/11
m
(j)
() Estabilidad en suspensin
:Il (an/h)
~ Slidos sedimentables
~ (mI/h)
~
:Il 000 (l11li/11
~
~atura(OC)
Z
G)
m Estreptococos fecales
Z
;Ti (UFC/lOOmI)
:Il
i> CoIiformes fecales
~ (UFC/1OOmI)
;::
!!1 Prdida de carga (an)
m
Z Caudal II/s)
~
r Filtrabilidad (mI/3nin)
()
O r....,(dias)
Z - - - - - ---- -- - --- ---
Ul
"tl
Ul
Ul Observaciones:
CAPrTULO 6 - PLANEACIN ESTADrSTICA DE UN PROYECTO DE INVESTIGACiN
l. CRUDA
2. ACONDICIONADA
L-J:I l FGD-A
FGD-B
- -
FGD -C
---J
[ FGAS 1
3. INTEGRADA
FGAS2
FGAS3
FGHM 1
I I FGHM3
FGHI
FGH2
~~ FGH3
[
=-ti
FLA I l I
FGDSI
F0002
FGDS 3
5. FILTROS LENTOS
EN ARENA H-.[ FLA2 l
[ FLA3 l
[ FLA4 l
( FLA5 l
Figura 6.4 Esquema de la base de datos del proyecto de investigacin.
7
Evaluacin de sistemas para
tratamiento de agua potable
Turbiedad
La siguiente tabla presenta los resultados del programa estadstico SPSS en el clculo
de algunas estadsticas descriptivas.
Estadsticas descriptivas para turbiedad (UNT)
Los filtros con menores efluentes promedios son el FGAS3 y el FGH3, estos
presentan un menor valor en la desviacin estndar y el rango, que significa una
mayor concentracin de los datos alrededor del valor medio, seguidos del FGDS.
Por el contrario, los filtros que presentan mayores valores en los efluentes son el
FGHM3 y el FGAC, con valores de dispersin y rango ms elevados, mostrando
una mayor dispersin en relacin con el valor medio efluente.
Las estadsticas descriptivas para la remocin de turbiedad se observan en la siguiente
tabla:
Estadsticas descriptivas para remocin de turbiedad (%)
REMFAGS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS
Media 80,3 66,2 65,1 77,5 73,6
Mediana 80,8 66,6 65,3 78,6 74,3
Moda 80,0 70,0 50,0 80,0 60,0
Varianza 82,5 127,0 194,6 103,0 124,9
Desviacin tpica 9,1 11,3 13,9 10,1 11,2
Rango ordinal 45.4 59.4 82,1 50,8 71,5
N total 294 294 294 294 294
Se puede analizar que los filtros con mayor eficiencia en la remocin de turbiedad son
el FGAS3 y el FGH3, los de menor eficiencia son el FGAC y el FGHM3, generando
los dos primeros menor variacin en cuanto al valor medio que los dos ltimos. En
la remocin de turbiedad la distribucin del FGAS es muy simtrica, considerando
que los valores de la media, la mediana y la moda son muy similares. El filtro que
presenta menor simetra es el FGHM3.
Coliformes fecales
Las estadsticas descriptivas para coliformes fecales se presentan en la siguiente
tabla:
Estadsticas descriptivas para coliformes fecales (UFC/100 mI)
INTEGRAD FGAS3 FGAC FGHM3 FGH3 FGDS
Media 24758 65 369 929 182 147
Mediana 13200 35 260 867 141 80
Moda 12900 12 10 1600 110 50
Varianza 992226516 8287 150381 525016 18199 26053
Desviacin tpica 31500 91 388 725 135 161
Rango ordinal 155000 389 1790 3807 618 760
N total 31 31 31 31 31 31
Al igual que en turbiedad, los filtros con menores efluentes son el FGAS3, el FGDS
y el FGH3, similarmente con los menores valores de dispersin. Los filtros con
mayores efluentes en coliformes fecales son el FGAC y el FGHM3, as mismo, con
los mayores valores de dispersin.
A continuacin se presentan las estadsticas descriptivas para la remocin de
coliformes fecales.
Estadsticas descriptivas para remocin de coliformes fecales(%)
REMFGAS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS
Media 99 98 93 99 99
Mediana 100 98 96 99 99
Moda 100 99 76 99 91
Varianza 1 3 39 3 4
Desviacin tpica 1 2 6 2 2
Rango ordinal 6 8 24 9 9
N total 31 31 31 31 31
Turbiedad
La siguiente grfica muestra los valores medios de los efluentes de los filtros gruesos,
la desviacin estndar y el valor mximo.
so .ID
~
. .-._--........ '. '10
~
~
~ >201
ro
~
'00
80 i
t
! 20
~ 60 .1
i:1; ,o 40 ~
,o
,GAS, 'GAC fGHM3 FGH3 FGDS3
Medi. _ _ _ Mlimo
'. 1111
1'. : '00
ID
I ~
:i l60
~
60 1l
~ 40
40
~
~
~
.'"
1 20 20
;
~
):
~
Media _ _ _ Mximo
1+-----~--~~--~----~----_r----~----~~
50 70 90 1 lO 130 150 170 190
Da de operacin
---FGAS3 - - - FGAC
30 +-----~----r_----r_----r_--~~--~----~~
110
roo
~
150
lZ0 i""
-- -
J-e 90
60
r-'
~
30
~
O
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ M edia
,to
~100 1""
J 80
1~
60
,~ 40
.~ '-
S
=c:
20
o
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
Co/iformes fecales
El siguiente grfico muestra los valores: medio, desviacin estndar y valor mximo
del efluente de los filtros gruesos en coliformes fecales.
,
I
...
~
~
1000
100
lO
~
120
---
r-
-- -
-=- --
--......
-- 100 I
@
1- f- - - 1------ 80
.
_. ~
f- i- f-- ~.
- f--
60 1
r-- 1- - - f-- 40 ..
~
f-- r-- t- - t- 1- 20 .i
~
o o
FGAS3 FGAC FGHM3 FGH3 FGDS3
c:=::::J Media ____ Mximo
10000
1 1000
~
e. 100
I
~
a 10
110~i--~~~~~~~--~------~---------------'
:;.
~1001 ~. ~
............... ;;j'*'f' cc:::::::: ::;::w
tI 90 I '1 .
,
t~
i
~
80 I
---~,L\t------------------------~
\} \1
____
70+1----~----~----r_--~__--~----~----~~
SO 70 90 110 130 150 170 190
Dla de operacin
- - - FGAS3 ---FGAC - - - FGHM3
El siguiente grfico ilustra los valores mnimo, mximo y media de los efluentes de
los filtros gruesos en coliformes fecales.
10VV'
....
:-
000 ;;.;.;-
...
~:-
~
L.... ~ ~
100 ~
L....
10
-
1
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
110
1 t .~
~
1
70
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
7.3 Histogramas
Las grficas de histograma penniten visualizar la fonna de la distribucin del conjunto
de datos, la cual se puede comparar con distribuciones tericas establecidas. Para
variables discretas las distribuciones a comparar pueden ser binomial, poisson,
geomtrica e hipergeomtrica, entre otras. En una variable continua las distribuciones
a comparar pueden ser unifonne, t-student, nonnal, chi-cuadrado, entre otras.
A continuacin, se presentan, para algunos filtros gruesos, los histogramas de turbiedad y
remocin de turbiedad, comparado con la distribucin nonnal. Las grficas corresponden
al procesamiento realizado en el software estadstico SSPS (las instrucciones se presentan
en el captulo 10). En cada grfico se observa la desviacin estndar (Desv. tip.), el valor
de la media (Media) y el nmero de datos analizados (N).
Turbiedad
70 T'-----------------------, loor,- - - - - - - - - - - - ,
60
80
50
.~ 40
~
~
.:: 30
'r
.::
O
40
20
UlIII,~ J~~;".
20
D~sv.tlp. - 18,50
10
Media - 21
N-2 94,OO
38g~n~~~a~~~~~nn~~ 47.g.~n~u~M~~a~~
50
40
'g
~ 30
.::
20
El grfico de frecuencias del FGAC muestra valores hasta 88 UNT, con frecuencias
significativas hasta 53 UNT Yfrecuencias mximas entre 3 UNT Y28 UNT. El FGH3
tiene valores hasta 49 UNT, con frecuencias significativas hasta 28 UNT Yfrecuencias
mximas entre 4 UNT Y 19 UNT. El FGHM3 presenta valores hasta 57 UNT, con
frecuencias significativas hasta 42 UNT Y frecuencias mximas entre 9 UNT Y 18
UNT. Las distribuciones evidencian cierto grado de asimetra con relacin al valor
medio, con sesgo a la derecha, es decir, las mayores frecuencias se presentan en los
valores menores de turbiedad, disminuyendo la frecuencia a medida que aumentan
los valores de turbiedad.
Analizando la distribucin de frecuencias, el mejor filtro en turbiedad es el FGH3,
pues tiene sus mayores frecuencias entre 4 UNT y 7 UNT, superando ms de 120
datos en este rango, mientras que el FGAC tiene ms de 120 datos en el rango de
8 UNT a 18 UNT.
Remocin de turbiedad
40 ~-------' 30. - - - - - - - - - ,
30
20
/
~
10
/
10
1\
I L ni n
rlAf1
Dtn.tip.- n ,17 I Dtn.tp..- JI.IJ
0J;!
35 :I,J
40 ..!,J"U,
50U,
,,U,
eo.J.65,J..!,,J..!
O,"""5 eo
"""85
J,.U,.1.
90 J,J'
95 N-1U,H O~
46 ""
52 ..!,J
56..!,J
eoU,64U,
eaU,
'2U,'6.J.eo,J..!84,J..!8,8u92
,u96
L,LJ N -1f4,1IJ
FGAC - remocin en turbiedad (") FGHJ remocin en turbiedad (")
60
50
40
';
_ 30 ,\
~ .\
20 ~
/ ~
.~
10
~
Desv. tlp. - IJ,95
Ittl!diQ - 65
h- N-194.00
U~~503540"50"9085roU908590~
De la tabla se pueden analizar diversos aspectos: El 35,7% de los valores del afluente
estuvieron entre 20 UNT Y40 UNT yen este caso los valores efluentes se presentaron
entre OUNT Y 10 UNT con un porcentaje representativo del 97 ,1 %. Se obtiene que el
25,2% de los datos del FGAS3, se encuentran entre OUNT Y 5 UNT Y el 32,3% entre
5 UNT Y 10 UNT. Tambin se puede analizar que el 84% de los datos del FGAS3
son menores que 20 UNT Y el 57,5% de los datos son menores que 10 UNT.
Se puede analizar que el 35,7% de los datos del agua integrada se encuentran entre
20 UNT Y 40 UNT Y para este rango los valores efluentes al FGH3 se tienen entre O
UNT Y 5 UNT Y 5 UNT Y 10 UNT en porcentajes de 21 ,9 Y 70,5 respectivamente.
Se visualiza que el 11,9% de los datos del FGH3 se dan entre O UNT Y 5 UNT Y
el 40,8% entre 5 UNT Y 10 UNT. Tambin se puede analizar que el 80,6% de los
efluentes del FGH3 son menores que 20 UNT Y el 52,7% de los datos son menores
que 10 UNT.
Tabla para FGAC
Tabla de contingencia Integrada FGAC
FGAC
(05) (510) (1020) (2030) >30 Total
Integrada (020) Recuento 7 2 O O O 9
%de Integrada 77,8% 22,2% ,0% ,0% ,0% 100,0%
%de fGAC 50,0% 3,1% ,0% ,0% ,0% 3,1%
(2040) Recuento 7 58 40 O O 105
%de Integrada 6.7% 55,2% 38,1% ,0% ,0% 100,0%
%de fGAC 50,0% 89,2% 44,0% ,0% ,0% 35,7%
(4050) Recuento O 3 26 12 O 41
%de Integrada ,0% 7,3% 63.4% 29,3% ,0% 100,0%
%de fGAC ,0% 4.6% 28,6% 18,5% ,0% 13,9%
(50100) Recuento O 2 20 41 13 76
%de Integrada ,0% 2,6% 26,3% 53,9% 17,1% 100,0%
%de fGAC ,0% 3,1% 22,0% 63,1 22,0% 25,9%
> 100 Recuento O O 5 12 46 63
%de Integrada ,0% ,0% 7,9% 19,0% 73,0% 100.0%
%de fGAC ,0% ,0% 5,5% 18,5% 78,0% 21.4%
Total Recuento 14 65 91 65 59 294
%de Integrada 4,8% 22,1% 31,0% 22,1% 20,1% 100,0%
- -
%de fGAC , 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
'''''
75
.~
lO:
~ !O\
.:
""
'" 25.0 ""O 75,0 100,0 '" 25,0 ""O 15.0 100,0 125,0
FGAS3
FGDS
'''''
'"
.~
lO:
~ !O\
.:
""
FGHM3
,00 o
33,00 o 2222222333333333
63,00 o 4444444444444444444455555555555
46,00 o 66666666667777777777777
27,00 o 8888888889999
2,00 1 ,\;
13,00 1 223333
27,00 1 4444444555555
18,00 1 66666777
18,00 1 88889999
8,00 2 0111
6,00 2 233
4,00 2 5&
7,00 2 677
4,00 2 9&
6,00 3 011
2,00 3 2
10,00 Extr~m~~ (>=33)
14,00 o 334444.q
65,00 O 55566666677777888888888999999999
27,00 1 223333.q444.q40;
64,00 1 5555556666777777777788888889999
3 9,00 2 000111223333444444
26,00 2 55666678889
17,00 3 001134.q&
12,00 3 5678&
8,00 4 023&
6,00 4 6&
1,00 5 &
15,00 Extremes ( > =51)
Aqu, las mximas frecuencias se encuentran entre los valores de 4UNT y 9 UNT
y las menores frecuencias entre los valores de 20 UNT a 32 UNT. Del diagrama de
tallos y hojas se puede evidenciar que 16 datos tomaron el valor de 3 UNT, 40 datos
se encuentran entre 4 UNT y 5 UNT; 71 datos se dan entre 6 UNT y 7 UNT y 28
datos entre 8 UNT y 9 UNT, siendo estas las mayores frecuencias.
16,00 o 3333333&
40,00 o 4444444445555555555
71,00 o 66666666666666666666677777777777777
28,00 o 88888888999999
1,00 1 &
8,00 1 2333
26,00 1 4444455555555
25,00 1 666677777777
22,00 1 88888888899
17,00 2 00000111
9,00 2 2233
6,00 2 445
6,00 2 77&
5,00 2 99&
1,00 3 &
5,00 3 22&
2,00 3 &
6,00 Extreme!!! (>~38)
De los diagramas de tallos y hojas, para los tres filtros analizados, el FGAS3 tiene la
mejor distribucin, debido a que 169 datos tienen valores de turbiedad en el rango
de 2 UNT a 9 UNT, seguido del FGH3 con 155 datos en el mismo rango y luego se
encuentra el FGAC con slo 79 datos en este rango.
, ....
fGAC 1
1
33 Ir
'l'al.1o
o 1 2222222333333333
....
JGAI
I
44444555 Ir o 1 4444444444444444444455555555555 I
66666677777 I o 66666666667777777777777 I
888888888999999999 Ii o 1I 8888888889999 I
223333
I1
Ii
1
1
1I
1I
223333
I
I
444444555555 I1 1 1I 4444444555555
66667777777777 11 1 li 66666777
88888889999 11 1 1 88889999
000111 11 I 1 0111
223333 11 2 233
44444455 11 I I 5.
66667 11 2 I 677
8889 I1 2 I 9&
0011 I1 J I 011
3& 11 J 1I 2.
445 11 1 I
67 11 J I
8& 11 J 1I
o
I
23& 11
1I
I
I
6&
& 11
5
I
1I
bt-.
51 11 33
1 (>-) 1
I
I
[
...
JGAC
33
44444555
I ftllo
o
o
1
I
I
11
11 H555555
.....
I'GIIIII
I
1
1
1
66666671771 o 11 666117777777
.
1
888888888999999999 o 11 88888888888999999999 1
[ 1 11 00 1
223333 1I 1 11 2333 1
444444555555 1I 1 11 444445555555 I
66667777777777 11 1 11 66666677777177 1
88888889999 I 1 11 88 888 888999 I
000111 11 00011111 I
223333 11 22233 I
44444455 11 45 1
66667 11 666671777 I
8889 11 88999
0011 11 01
I 3& I 333
445 I 4H5
67 11
8& 11 3 8.
o 11 0001
23& 11
3.
6& 11
I
6&
--
11
11 I 3&
51 11 54
l>el
7.7 Percentiles
Los percentiles son valores que permiten analizar de forma detallada las frecuencias,
en general los percentiles ms utilizados son el percentil 95 y el percentil 99.
De la tabla se puede analizar que el 50%, es decir, la mediana de los datos, toman
valores menores a 48 UNT en la integrada; 8 UNT en el FGAS3; 18 en el FGAC;
9,5 en el FGH3 ; 17 en el FGHM3 y 14 en el FGDS.
. ~----------------------~
- ...
110 too
....
~ ....
*t..
*tAO .....
*t..
.....
1100
... *to.
.........
*t..
*to,
....
20 -,..
:
50
...
FGAS3
... ...
FGAC FGHM3
... ...
FGH3 FGDS FGAS3 FGAC FGHM3 FGH3
...
FGDS
(a) (b)
Grfico de cajas y alambres para turbiedad
Coliformes fecales
En el diagrama de cajas general (a) se puede evidenciar que los filtros ms
homogneos son el FGAS3 , FGH3 y el FGDS. El filtro con mayor dispersin lo
presenta el FGHM3 , seguido del FGAC.
Considerando el diagrama con valores extremos (b) se puede evidenciar que en el
efluente del FGHM3 no se presentan ni valores extremos ni atpicos, mientras que en
los otros filtros se presentan entre 1 o 2 valores extremos y 1 o 2 valores atpicos.
~rl-----------------------------'
*"
=-1500
S f500
~ ~
2- 2-
,; ,;
~ 1000 ~1ooo
u. u.
J
8 500
I ....
Q,
-w,
500
B'
01
N-
I
~ N_ 31
~
"
FGAS3
"
FGAC
"
FGHM3
"
FGH3
"
FGDS
"
FGAS3
"
FGAC FGHM3
"
FGH3
"
FGDS
(a) (b)
Grfico de cajas y alambres para coliformes fecales
En general, se puede analizar que los mejores filtros gruesos evaluados en cuanto
a turbiedad ycoliformes fecales fueron el FGAS y el FGH, seguido del FGDS; por
ltimo se encuentran el FGAC y el FGHM. En el porcentaje de remocin los mejores
filtros fueron el FGAS, FGDS y FGH, seguidos del FGAC y el FGHM.
Sin embargo, para una adecuada seleccin de un filtro grueso es necesario
analizar otros parmetros de calidad de agua y considerar factores de operacin y
mantenimiento, as como los costos de inversin inicial, administracin, operacin
y mantenimiento de cada una de las unidades.
8
Calidad de aire
Alrededor del mundo se ha encontrado que en los centros urbanos las fuentes mviles
son las mayores contribuyentes de emisiones contaminantes a la atmsfera, siendo
siempre ms significativas, comparadas con las emisiones de fuentes fijas. Un menor
aporte de emisiones es ocasionado por fenmenos asociados a las actividades de
urbanizacin, tales como: deforestacin, tala de rboles, apertura de vas, erosin de
cerros, disposicin de escombros, disposicin de desechos slidos y almacenamiento
de combustibles, entre otros. A continuacin se describen algunos parmetros de
calidad de aire.
Ozono (03)
El ozono es un gas altamente reactivo, de color azul plido, constituido por tres
tomos de oxgeno en su estructura molecular. Este se puede clasificar en dos grandes
grupos: ozono estratosfrico y ozono troposfrico.
Ozono estratosfrico. Se origina en forma natural en la estratosfera (entre 12 km y
50 km a partir del suelo) mediante la fotodisificacin del oxgeno producida por la
radiacin solar ultravioleta; se concentra en una capa delgada denominada ozonosfera,
la cual filtra y modera la radiacin solar ultravioleta y otras partculas energticas
que inciden sobre la superficie terrestre. Esta accin protectora de la capa de ozono
permite que se lleven a cabo diversos procesos en los ecosistemas naturales: en la
clula evita que se rompan las molculas de ADN y enlaces de carbono. En los
ltimos cincuenta aos la emisin de clorofiuorocarbono (CFC), usado en equipos
de refrigeracin, aire acondicionado, aerosoles y esponjas plsticas, ha provocado
el deterioro y debilitamiento de la ozonosfera en un orden de 3% cada diez aos.
Ozono troposfrico. En la troposfera (de O km a 12 km a partir de la superficie
terrestre) el ozono se produce por la reaccin fotoqumica de xidos de nitrgeno
(NOx) y compuestos orgnicos voltiles (COY' s) derivados del uso de combustibles
fsiles, los cuales se denominan precursores del ozono. La reaccin fotoqumica se
produce cuando los NOx y los COY's reaccionan con la luz solar, lo que produce
un tomo libre de oxgeno (O). Este tomo libre puede adicionarse a una molcula
de oxgeno (02) y formar una molcula de ozono (0 3), El proceso es reversible y
est condicionado por la intensidad de la radiacin solar.
La OMS recomienda como lmite para preservar la salud pblica una concentracin
de ozono de 0,05 a 0,10 ppm (partes por milln) por hora, cada tres aos.
y aire se oxidan para fonnar xido ntrico y algo de dixido de nitrgeno. Los xidos
ntricos emitidos en el aire se convierten en dixido de nitrgeno mediante reacciones
fotoqumicas condicionadas por la luz solar. El dixido de nitrgeno daa el sistema
respiratorio porque es capaz de penetrar las regiones ms profundas de los pulmones.
As mismo, contribuye a la fonnacin de la lluvia cida.
legislacin ambiental
El gobierno nacional, a travs del Ministerio de Transporte y mediante nonnas como el
Estatuto del Transporte para el transporte masivo (No. 3109 de 1997), ha contribuido
a definir lineamientos necesarios para la correcta planificacin, ejecucin y control
de dichos proyectos, centrando su atencin en las grandes ciudades que integran
polos de desarrollo industrial y comercial. Para el anlisis del comportamiento de
la contaminacin es preciso realizar una comparacin de los valores registrados de
cada contaminante con la nonna nacional vigente para emisiones atmosfricas (D.L.
02/82). Para poder aplicar esta nonna deben calcularse los valores especficos de
acuerdo con la temperatura promedio y la presin atmosfrica de cada ciudad. Los
valores para Cali se muestran en la Tabla 8.1.
Nonna Nonnapare
Pmmetro SirmoIo Condicin lIICionaI o candici6n
EPAnl local 121
Norma Nonnapara
Par6metro SInmoIo CandiI:i4n nacional O condicin
EPAI11 1ocaI 12l
- ..:-- -- J
M.CAUII. . . _ . . . . . . . .
M &un6N
IJU"'iUfAIWfQ . . . . . .TUtwo
. . . . . . . . .--:NR . ........
I
Figura 8.1 Ubicacin geogrfica de estaciones de monitoreo de calidad de aire
en Santiago de Cali (www.dagmacali.gov. co).
t : >~ ~'i .
Centro Diagnstico ,.: ,'.... 1.';-, ~':';'''.:
.", t'''~~
Automotor del Valle
." . (",' . )",'" '.,
.' .
(CDAVI ~~-,y.;
,;
""
5 CVC Pance
t
,
.....
!,-": ~. ..' t-,- .. ,,! 1:+:..:"
6 Escuela Repblica Argentina (ERA)
l,'. ,{~ '*,;:. ,,{:.'t'!:';;
Seala los eventos extremos. Es sensible a cualquier Mximo diario 03. N02. CO.
Mximo suceso extraordinario (incendios. desfogues industriales. S02. PST.
eventos meteorolgicos. etc.). Colecta de 24 horas PMlO
Promedio diario
Permite evaluar el cumplimiento de normas de proteccin S02. PST.
Promedio a la salud y el comportamiento anual de algunos parme Colecta de 24 horas PM 1o. pH.
tras. Es sensible a valores extremos. NOj. S04
Colecta semanal
Promedio horario
Indica la frecuencia de valores de un contaminante en 03. N02. CO.
Promedio mvil
intervalos especificas. algunos se asocian a los lmites S02. PST.
Intervalos
permisibles definidos en las Normas Oficiales Mexicanas PM10. pH.
Colecta de 24 horas
de Salud Ambiental. N03. S04
Colecta semanal
60,00
50,00
i. 40,00
~9
g
.
30,00
....
<.> 20,00
a 10,00
0,00
COAV BA POO ERA CALLE 15
Es/acin
Promedio anual - Norma anual 50 "g/m3
100
i zso
i ZOO
j 150
~ 100 -
I
<:l 50 -
80
60 I __
::-
f.
-3 40
,
';..
20
o l' , - 'i
COAV BA POD ERA CVC CALLE 15
o Domingo C Lunl!s Martes O Mircoles Jueves Viernes Sdbado
1~r.1======================================~~
140
120
::- 100
l
-3
80
~ 60
40
20
o I-~,~- \.J V
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Dias (t)
- - CDAV - + - BA - - PDD ---..-CVC ~ ERA - + - CA LLE/5 - - - NormadiariaI50pg!m3
Se pueden apreciar concentraciones bajas y poco variables durante los primeros diez
das del mes en las estaciones graficadas y un comportamiento variable que alcanza
concentraciones mayores en la estacin Calle 15 y CDAV, a partir del da 8 (www.
dagmacali.gov.co). La estacin que evidencia los menores valores de PMIO es la
estacin CVC, seguida por las estaciones PDD y ERA.
En la siguiente grfica se muestran las mximas concentraciones horarias en algunas
de las estaciones monitoreadas. Se puede ver que, a excepcin de la estacin CVC
- Pance, ubicada en la zona rural, las mximas concentraciones ocurren entre las
10 Y 12 horas, con un incremento de las concentraciones a partir de las 18: 00 horas,
excepto para la estacin PDD que mostr una disminucin progresiva a partir de las
18 horas (www.dagmacali.gov.co).
100
80
........
~.,
~
60
'-
....
~
40
~
20
o
o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 23
horas (1)
ERA -+-- CALLE 1 5
40
130
~
120
,
1
~ 10
l
O +1_.1..-.........
CDAV BA PDD ERA
Estacin
Concentracin promedio anual -Norma anual 34,ZZ ppb
~~-7--~-C~~~~--~~--~-C~--~~--~~--~~~--~~--~
1
. .
100
!{
t 10 ~~ :
. . .
J 'TT:'" :...... l . ., .
..
<.l
-~~---~~~~ ~~~~~--~~~
~CDAV ~- BA -7" PDD ~ ERA --Norma diaria 136,61 ppb
Se puede apreciar que en general las estaciones graficadas estn por debajo de la
norma diaria establecida que es de 136,61 ppb, excepto la estacin CDAV con un
valor superior a la norma en noviembre. De marzo a julio la estacin PDD evidenci
en general las menores concentraciones mximas de S02. De octubre a diciembre
la estacin que mostr los valores ms altos fue la CDAV y la estacin que dio los
valores ms bajos fue ERA.
La siguiente grfica muestra los valores promedios horarios de concentracin de
S02
20
t~
liS .................. ... _.*. :* .. \ ..................... - ....... .
20.---------------------------------------------~
15
1
~'
10
o
CDAV BA PDD ERA
o Do",ingo CJ Lunes Martes O MUrcoles Jueves Viernes Sbado
Ozono (03)
La siguiente grfica presenta la mxima concentracin horaria de ozono en dos
estaciones monitoreadas: PDD y CVc.
aeJJO
84.00
82.00
i 80.00
-5
c" 78.00
76.00
74.00
72.00 +1------~----~~------~----~--------~----~
PDD O/e
= Mximo J hora - Norma horaria 77.57 ppb
>- .
Domingo -.- LI,II\f'~ Io4Irt.. Mi6rcoIes ........- J\M'ItI ____ VemeS --"-- $M)ado
8.2 Histogramas
600 300
'~
~ 400 '1200
~
'"
200 100
_"'J2.'1
Mtfif-j7
_ . - 2lJf
M... "
..........u,u.........1,I-I,Ju,u,J-li"'i"'i'''''' Nl121." NUfl."
42031152 6884100116132148164111196 W~JIIQ~II~I~1151!m
PMII PM"
Es/acin: 6 ERA
700
600
500
_.'14.14
II... 'J
N'u;~"
3 15 n ! 51 ~ ~u mlDl! 147
PM"
En la estacin ERAse observan frecuencias hasta 147 ..tglm3, con su mxima concentracin
en el rango de 15 ..tglm3 a 63 ..tglm3, evidencindose un buen ajuste a la curva normal.
El valor promedio es de 43 ..tglm3 con una desviacin de 24,94 ..tglm3 .
En general, las estaciones PDD y ERA evidencian la misma tendencia sin diferencias
significativas en los valores promedios de PM 1O. Tambin se puede evidenciar que
de las estaciones graficadas solo la CDAV muestra frecuencias por encima de la
norma anual de PM JO, pero con pocas frecuencias en estos valores.
800
200
Dm. n,. ',H
Mp -',7
J,I,I,l,J,l,l,l,LM1IL,I,1,I,l.w;t_ N-'JIf,H
I~u~~~~w~m~~~ J~U~UU~u~~u.u
SO, SO,
E,"cin: 6 ERA
7011 . - - - - - - - - - ,
6011
500
200
1011
J,U,LJ,LI,IJI,U,U,u,u.,u,u,IJ;I:I;J
-.. ""
M" ~, I
N-11"'"
J 1) 1 11 il 1)11 1111 ".I1lJl11~1
SO,
10,4 ppb; con un valor medio de 9,7 ppb Y una desviacin estndar de 9,06 ppb. La
forma de la distribucin se concentra en los valores menores a 13,6 ppb. A partir de
este valor las frecuencias disminuyen sustancialmente, la grfica de la distribucin
presenta sesgo hacia el lado izquierdo.
En la estacin PDD se observan frecuencias hasta 13,7 ppb; con una concentracin
mxima de frecuencias en el rango entre 0,3 ppb y 4,8 ppb; con un valor medio de 3,3
ppb y una desviacin estndar de 2,51 ppb. La forma de la distribucin es asimtrica,
concentrndose la mayora de valores hacia la franja izquierda de la grfica y muy
pocos valores mayores a 7,0 ppb.
En la estacin ERA se dan valores en la distribucin hasta 14,7 ppb, con concentracin
de frecuencias en el rango entre 0,3 ppb y 3,9 ppb; con un valor medio de 4,1 ppb
y una desviacin estndar de 4,58 ppb. La forma de la distribucin es asimtrica en
cuanto al valor medio, con sesgo alIado izquierdo.
De las estaciones graficadas slo la CDAV evidencia valores por encima de la norma
anual de S02, con bajas frecuencias.
Estacin COA V
Tabla de contingencia PMIO *S02 8
S02
Total
10201 (20-40) [40-60) >60
Recuento 2266 63 6 O 2335
<50 %de PM lO 97,0% 2.7 ,3% ,0% 100.0%
%de 502 49,8% 15.4% 11,8% ,0% 46,5%
Recuento 1904 245 21 8 2178
(50100J %de PMlO 87.4% 11,2% 1,0% .4% 100.0%
%de 502 41,9% 60,0% 41,2% 50,0% 43.4%
PMlO
Recuento 316 85 17 7 425
(100150) %de PMlO 74.4% 20,0% 4,0% 1.6% 100,0%
%de 502 6,9% 20,8% 33,3% 43,8% 8,5%
Recuento 61 15 7 1 84
>150 %de PM,o 72,6% 17,9% 8,3% 1,2% 100,0%
%de 502 1,3% 3.7% 13.7% 6,3% 1.7%
Recuento 4547 408 51 16 5022
Total %de PMlO 90,5% 8,1% 1,0% ,3% 100,0%
%de 502 100,0% 100,0% 100,0% 100,0% 100,0%
a. Estacin - CDAV
En esta estacin el 46,5% de los datos muestreados del material particulado PM 1O, da
concentraciones menores a 50 glm 3 y el 43,4% se encuentra entre 50 glm3 y lOO
3
glm , es decir, en estos dos intervalos se halla el 89,9% de los datos de PM\O.
Para dixido de azufre, S02, se observa que 90,5% de los datos se encuentran en el
rango de Oppb a 20 ppb Y el 8, I % en el rango de 20 ppb a 40 ppb, es decir, en estos
dos rangos se encuentra el 98,6% de los datos de S02.
Cuando el PM lOse encuentra entre O glm 3 y 50 glm 3, el 97% de los datos de S02
se da entre O ppb Y 20 ppb Y el 2,7% entre 20 ppb Y 40 ppb.
Cuando el S02 se encuentra entre Opbb Y 20 ppb, el 49,8% de los datos de PMIO se
encuentra entre O glm 3 y 50 glm 3 y eI41,9% entre 50glm 3 y lOO g/m 3 .
Del total de datos analizados, el 45,1% se encuentra entre O ppb Y 20 ppb de S02
3
y entre O glm y 50 glm 3 de PM 10, simultneamente. El 37,9% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 glm 3 y 100 glm 3 de PM 10,
simultneamente.
Estacin POO
A continuacin se presenta la tabla de contingencia para la estacin PDD.
S02 Total
[020) (20-40)
(100150) Recuento 86 O 86
%de PMlO 100,0% ,0% 100,0%
%de S02 2,5% ,0% 2,5%
>150 Recuento 10 O 10
%de PMlO 100,0% ,0% 100,0%
%de S02 ,3% ,0% ,3%
a. Estacin - POO
En esta estacin el 65,6% de los datos muestreados del material particulado PMIO
presenta concentraciones menores a 50 .tg/m3 y el 31 ,6% se encuentra entre 50
.tg/m3 y 100 .tg/m 3, es decir, en estos dos intervalos se encuentra el 97,2% de los
datos de PM 1O.
Para dixido de azufre, S02, se presenta que 99,9% de los datos se encuentran en
el rango de O ppb a 20 ppb.
Cuando el PMIO se halla entre O .tg/m3 y 50 .tg/m 3 , el 99,9% de los datos S02 se
encuentra entre O ppb Y 20 ppb.
Cuando el S02 se da entre Oppb Y20 ppb, el 65,6% de los datos de PM 10 se encuentra
entre O .tg/m3 y 50 .tg/m3 y el 31 ,6% se encuentra entre 50 .tg/m3 y 100 .tg/m3 .
Del total de datos analizados el 65,5% se encuentra entre O ppb Y 20 ppb de S02
y entre O .tg/m 3 y 50 .tg/m3 de PM 10, simultneamente. El 31 ,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 .tg/m3 y 100 .tg/m3 de PM 10,
simultneamente.
Estacin ERA
A continuacin se presenta la tabla de contingencia para la estacin ERA.
80 2
Total
[0201 (20-401 [40601 >60
Recuento 2406 5 1 2 2414
<50 %de PMIl 99,7% ,2% ,0% ,1% 100,0%
%de 802 65,6% 14.7% 20,0% 50,0% 65,1%
Recuento 1167 18 2 2 1189
(50-1001 %de PMlO 98,1% 1.5% ,2% ,2% 100,0%
%de 502 31,8% 52,9% 40,0% 50,0% 32,1%
PMlO
Recuento 88 11 1 O 101
(100-1501 %de PMlO 87,1% 10,9% 2,0% ,0% 100,0%
%de 502 2.4% 32,4% 40,0% ,0% 2.7%
Recuento 4 O O O 4
>150 %de PMIl 100,0% ,0% ,0% ,0% 100,0%
%de 502 ,1% ,0% ,0% ,0% ,1%
Recuento 3665 34 5 4 3708
Total %de PMIl 98,8% ,9% ,1% ,1% 100,0%
%de 502 100,0% 100,0% 100.0% 100.0% 100,0%
a_Estacin - ERA
En esta estacin e165 ,1% de los datos muestreados del material particulado PMIO
evidencia concentraciones menores de 50 .tg/m 3 y el 32,1% entre 50 .tg/m3 y
100 Ilg/m3, es decir, en estos dos intervalos se encuentra el 97,2% de los datos
de PM1o.
Para dixido de azufre, S02, se observa que 98,8% de los datos se encuentra en el
rango de Oppb a 20 ppb Y el 0,9% en el rango de 20 a 40 ppb, es decir, en estos dos
rangos se da el 99,7% de los datos de S02.
Cuando el PMIO se da entre O Ilg/m3 y 50 llg/m3, el 99,7% de los datos S02 se
encuentran entre O ppb Y 20 ppb.
Cuando el S02 se halla entre O ppb Y 20 ppb, el 65,6% de los datos de PMIO se
encuentran entre O Ilg/m3 y 50 Ilg/m3 y el 31,8% entre 50 Ilg/m3 y 100 llg/m3.
Del total de datos analizados, el 64,9% se observa entre O ppb Y 20 ppb de S02
y entre O Ilg/m3 y 50 Ilg/m3 de PM 10, simultneamente. El 31,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50Ilg/m3 y 100 llg/m3 de PMIO,
simultneamente.
15% 15%
.~ "-
~ "~
el; "'" el; "'"
,,% 25%
PMII PM"
ERA
1(lO'"
15%'
.~
~ 50%
<>':
""
PM"
Grfica de frecuencias acumuladas para material particulado, PMO
(Viene de la pgina anterior)
En la estacin CDAV alrededor del 50% de los datos toman valores menores o iguales
a 50 Ilglm 3 de material particulado, PM 10 Y aproximadamente el 88% de los datos
son menores o iguales que 100 Ilg/m 3 .
En la estacin PDD cerca del 75% de los datos toman valores menores o iguales
que 50 Ilglm 3 y aproximadamente el 98% de los datos son menores o iguales que
lOOllglm3.
En la estacin ERA alrededor del 65% de los datos son menores o iguales que 50 Ilglm3
y aproximadamente el 98% de los datos son menores o iguales que 100 Ilglm 3.
De las estaciones graficadas la nica que muestra frecuencias por encima de la norma
es la CDAV, con bajas frecuencias.
CDAV PDD
100% 100%
75" 75"
"i~- .~
~
~
&: "'" ~
&:
"'"
"" ""
10,00 20,00 30,00 40,00 50,00 '" 0,00 10,00 20,00 JO,OO
SO, SO]
ERA
75"
.~
l!
c:
~ "'"
&:
""
"',~~~~uw~~~~ww~
0.00 10,00 20,00 JO,OO
SO]
En la estacin CDAV alrededor del 75% de los datos son menores o iguales que 10
ppb Y aproximadamente el 90% de los datos son menores o iguales que 20 ppb de
dixido de azufre.
En la estacin PDD alrededor del 97% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores que 20 ppb de dixido
de azufre.
En la estacin ERA alrededor del 95% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores o iguales que 20 ppb de
dixido de azufre.
De las estaciones graficadas la nica que evidencia frecuencias por encima de la
norma es la CDAV, con bajas frecuencias.
8.5 Percentiles
Este tem ilustra el anlisis de los valores percentiles para material particulado, PM 1O
Y dixido de azufre S02
Estacin
CDAV BA PDD ERA
Percentil 05 13.66 3,98 9,25 9.00
Percentil 25 33,96 16,80 25,88 25,00
Mediana 51,54 36.68 41,15 40.20
PMlO
Percentil 75 73.93 56.49 57,13 56.80
Percentil 95 116.30 89,05 89.12 89.00
Percentil 99 158.16 122,15 127,37 119.70
En la estacin CDAV el 50% de los datos son valores menores o iguales que
51,5 Jlg/m3 ; el 75% menores o iguales que 73,9 Jlglm 3 ; el 95% menores o iguales
que 116,3 Jlglm 3 y el 99% menores o iguales que 158,1 Jlglm 3 . Evidenciando que
existen datos por encima de la norma anual de PM lO, en esta estacin.
En la estacin BA el 50% de los datos toma valores menores o iguales que
36,7 Jlg/m 3 ; el 75% menores o iguales que 56,5 Jlg/m 3 ; el 95% menores o iguales
que 89,1 Jlglm3 y el 122,2% menores o iguales que 158,1 Jlg/m 3 Es decir, en esta
estacin se cumple la norma anual de PM 10 en el periodo analizado.
En la estacin PDD el 50% de los datos toma valores menores o iguales
que 41,2 Jlg /m 3 ; el 75% valores menores o iguales que 57,1 Jlg /m 3 ; el
95% menores o iguales que 89,1 Jlg/m 3 y el 99% menores o iguales que
127,4 Jlg/m 3 . Lo cual indica que esta estacin cumple la norma anual de
PMIO en el periodo analizado.
En la estacin ERA el 50% de los datos toma valores menores o iguales que
40,2 Jlg/m 3 ; el 75% valores menores o iguales que 56,8 Jlg /m 3 ; el 95% de
los datos toma valores menores o iguales que 89,0 Jlg/m 3 y el 99% menores
o iguales que 119,7 Jlg /m 3 . As, en esta estacin se cumple la norma anual
de PMIO en el periodo analizado.
PM'O
Parcentil 05 Parcantil 25 Mediana Parcantil75 Parcentil 95 Parcantil 99
Abril 6.40 21,40 42,05 67,30 111,40 146.42
Mayo 12,32 29,32 45,50 64,66 110,46 153.70
Junio 5,02 17,55 36,90 61,52 111,82 160,00
Julio 5,87 24,90 42,91 63,55 102,13 143,29
Mes Agosto 3,94 10,59 27,10 46,52 80,00 113,07
Septiembre 11 ,80 28,20 43,49 59,55 95,44 138,33
Octubre 8,88 26,12 42 .. 21 61 ,62 95,00 127,59
Noviembre 14,19 31 ,51 44,33 59,82 90,40 121.01
Diciembre 18,92 34,99 49,87 67,00 98,29 126,26
En mayo el 50% de los datos fueron menores o iguales que 45,5 llg/m3; 75% de
los datos son menores o iguales que 64,7 llg/m3 y 95% de los datos son menores o
iguales que 110;5 llg/m3.
En agosto se observ que el 50% de los datos son menores o iguales que 27,1 llg/m3;
el 75% son menores o iguales que 46,5 Ilg/m3 y el 95% menores o iguales que 80
Ilg/m3.
Para el mes de diciembre el 50% de los datos son menores o iguales que 49,9%
llg/m3; el 75% son menores o iguales que 67,0 Ilg/m3 y el 95% de los datos son
menores o iguales que 98,3 llg/m3.
En general, en el percentil 95 , los meses con los valores ms altos de material
particulado se encuentran entre abril a julio, 10 mismo sucede con el percentil 99.
La siguiente grfica presenta los valores percentiles de material particulado, PMIO
a travs de los meses en la estacin CDAY.
180
160
.:;--. 140"
t 120
~ 10 -* * *. ~ .
~~ 80
Q.; 60 ~. .)(. lE )~( )( )( ~
40
20 .~ _~,.~=:~~=_~<;=-~_:m=:=.~.~:._~'.':_-~~
O
ABR. MAY. JUN. JUL. AGO. SEP. OCT. NOV. DIC.
Mes
--+-- Perc. S __ Perc. 25 --4- Perc. SO ~Perc. 75 --*- Perc. 95 - - Perc. 99
I Estacin
I
CDAV BA PDD ERA
S02 Percentil 05 1.63 1,13 .31 .53
Percentil 25 3.96 2,59 1.53 1,64
Mediana 7.41 4,71 2.90 2,87
Percentil 75 12.48 8.06 4.36 5.16
Percentil 95 24.79 15.78 7.90 11.08
Percentil 99 42.82 26.19 11.96 21.38
En la estacin CDAV el 50% de los datos son valores menores o iguales que 7,4 ppb;
el 75% menores o iguales que 12,5 ppb; el 95% de los datos toma valores menores
o iguales que 24,8 ppb Y el 99% menores o iguales que 42,9 ppb. Por lo cual, esta
estacin cumple la norma anual de S02 en el perodo analizado.
En la estacin BA el 50% de los datos toma valores menores o iguales que 4,7 ppb;
e175% valores menores o iguales que 8,1 ppb; e195% valores menores o iguales que
15,8 ppb Y el 99% menores o iguales que 26,2 ppb. De este modo, en esta estacin
se cumple la norma anual de S02 en el periodo analizado.
En la estacin PDD el 50% de los datos toma valores menores o iguales que 2,9 ppb;
el 75% valores menores o iguales que 4,4 ppb; el 95% de los datos toma valores
menores o iguales que 7,9 ppb Y el 99% menores o iguales que 11 ,9 ppb. As, esta
estacin cumple la norma anual de S02 en el periodo analizado.
En la estacin ERA el 50% de los datos toma valores menores o iguales que
2,9 ppb; el 75% de los datos toma valores menores o iguales que 5,2 ppb; el 95%
de los datos toma valores menores o iguales que 11,1 ppb Y el 99% son menores o
iguales que 21,4 ppb. Es decir, en esta estacin se cumple la norma anual de S02
en el periodo analizado.
En general, se puede observar un comportamiento similar en las estaciones ERA
y PDD, con valores bajos de dixido de azufre, seguidas de la estacin BA, y por
ltimo con los valores ms elevados la estacin CDAY. Pero las estaciones cumplen
la norma anual de S02.
En la siguiente tabla se observan los valores percentiles mensuales de dixido de
azufre, S02, en la estacin CDAY.
Tabla de valores percentiles mensuales para
dixido de azufre. S02. en la estacin CDAV.
S02
Percentil 05 Percentil 25 Mediana Percentil 75 Percentil 95 Percentil 99
Mes Abril ,15 ,93 1,67 2,75 6,05 9,44
Mayo ,47 1,94 3,34 5,65 11 ,34 18,73
Junio 1,34 2,39 3,96 7,50 15,17 27,12
Julio 1,91 3,60 5,94 8,95 17,11 24,21
Agosto ,33 2,73 4,17 6,24 11,37 16,20
Septiembre 1,89 4,37 7,50 10,60 18,07 26,00
Octubre 1,36 3.44 5,62 8,89 15,80 26,46
Noviembre ,90 2,60 5,08 9,84 21,95 39,42
Diciembre 1,08 2,98 5,73 12,18 26,26 46,93
En mayo, el 50% de los datos son menores o iguales que 3,3 ppb, el 75% son menores
o iguales que 5,7 ppb y el 95% son menores o iguales que 11 ,3 ppb de dixido de
azufre. En agosto, el 50% de los datos son menores o iguales que 4,2 ppb, el 75%
son menores o iguales que 6,2 ppb y el 95% son menores o iguales que 11 ,4 ppb de
dixido de azufre.
Para diciembre, el 50% de los datos son menores o iguales que 5,7 ppb, el 75% son
menores o iguales que 12,2 ppb Y el 95% son menores o iguales que 26,3 ppb de
dixido de azufre.
En general, en el percentil 95 se observa que los meses con los valores ms altos de
dixido de azufre se encuentran entre septiembre y diciembre.
En la siguiente grfica se muestran los valores percentiles de dixido de azufre a
travs de los meses, en la estacin CDAY.
!~ r - - :---:--::-----.--.-.--.~------:--~~--:-------'------------:--- ~.--~-------.--.---:--.-.-/~-j
40
35
: 30
,s; 25
~ 20
15]
;
. >~ ~ .,.~
~ -~ ... ! ~ ~~ ....
....
10
5
O
F;:~- -':- -!=- ~j-~
t_----- _______ a....:..:_ --_'a_n
. ~
.. ; .". ~
___
Material particulado, PM 10
A continuacin se observa la grfica de los valores promedios diarios de partculas
menores de 10 micrmetros (PMIO), monitoreada entre 1995 a 2005 (fuente: www.
sma.df.gob.mxIsimatlpnindicadores.htm).
1995 1996 1997 1996 1999 2000 2001 2002 2003 2004 2005
Ano
c:::::::J Dlas arriba del valor limite -+- Percentil 90
1995 1996 1997 1998 1999 2000 2001 2002 200] 2004 2005
Se puede analizar que la mayor dispersin de los valores promedios diarios de PM 1O,
se dan entre 1997 y 2003. En el percentil 90 se puede observar que entre 1995 y
1998 se evidencian las mayores concentraciones promedio de PM 10, mientras que
entre 1999 y 2005 estos valores son menores.
A continuacin se observa la grfica del comportamiento tpico diario de partculas
menores de 10 micrmetros (PMIO), monitoreada de 1995 a 2005, donde se
evidencia la tendencia anual cada 24 horas (fuente: www.sma.df.gob.mxlsimat/
pnindicadores.htm).
120
-lOO
~ 80-
c
~ 60
i...
~
40
t..l 20
0+1-'--r-.-'-'--r-r~~r-r-.-'--r-r~~--r-r-.-'-'--r~~
1 2 3 4 S 6 7 8 9 10 11 12 13 14 1 S 16 17 18 19 20 21 22 23 24
Hora
-+- 1995 1996 -4- 1997 ~ 1998 --*-1999 -+- 1000
1400
1233
')' 1200
's:
~1000
721 7+4
i 800
......
"~ 600
763
670
i 400
~
1: .. .. ..
a 200
o
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Ao
'" lO
1 '0
..... 0
1: 50
60
SI . 1$
57
51
5'
~ .0
1 30
~ 20
a
1:
lO
O
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Ao
0,500
0,400
i'
~ 0,300
a 0,100
0,000 i i i i I i i i i I j , i i I i i i
1~1~1~1~1~~ 1~1~1~1~1~1_1~1~~~1~=~~
Ano
)K P~rcenlil 7S - Mximo _ Perunlll 90 - Percenta SO _ MI"I",o Percentlllj
Ozono, 03
A continuacin se muestra la grfica de los valores mximos diarios de ozono, desde
el ao de 1986 a 2005 (fuente: www.sma.df.gob.mxlsimatlpnindicadores.htm).
0,350 380
0,300
300
i' 0,250
240
~
" 0,200
~
: ~ 180
-lI
e
!
~ 0,150
0,100
0,050
120
80
~
0,000 IL.iIII,L..II,L.., ,.....,,,i',i 1,'- ,I 1,1 1,1.....01,1 j,l J,I 1,1 J ,L..l ,L......I,I."""",I,L '"', - 1
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
1986 Yentre 1990 a 1993 . A partir de 1993 los valores inician un descenso paulatino
hasta e12005 (valor estimado).
A continuacin se expone la grfica del comportamiento tpico diario de ozono, por aos,
durante las horas del da (fuente: www.sma.df.gob.mxJsimatlpnindicadores.htm).
0,150
,19",
-.-""
____ '989
..
0,120
-+-,-
--m,
1 0090
- -1"1
1993
m,
~ ... 40 1995
.
~ ~
_ _ _ 1997
/996
~ 0.060 _ _ _ 1998
a -+-1000
/999
1 2 3 4 S 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Grfica del comportamiento tpico diario del ozono (Oj), 1986 -julio 2005
Se puede observar que a travs de los aos el comportamiento tpico diario de ozono
sigue la misma tendencia, es decir, valores relativamente bajos hasta las primeras
diez horas, altos entre las 11 horas y las 16 horas y nuevamente disminucin a partir
de las 18 horas, aproximadamente.
A continuacin se muestra la grfica de los valores maXlmo maximorum de
concentraciones horarias de ozono, monitoreada de 1995 a 2005 (fuente: www.sma.
df.gob.mxJsimatlpnindicadores.htm).
0 ,000
O,soo
0,500 ,j''''
i'
.. " 0,475
:~
W
0,400
0,300
---- "-
D,U1 0,40<4 e," ,0
.. O,H9
0,323
~18 . jfZl
. .. 0,2804
'
a~.'
0 .312 0,307 0 ,226
0 ,200
0,282 0,271
-.---.
0,222
0,100
o ,OOO-l-_ -_ _- _ _- _ _- _ _- _ _- _ -_ _- _ _- __
,- = - -
-
_
~
~ ,~ ~ ,~ ~ ,~ ,~ ,~ ~ ~ ~ ,~ ,~ ~ ~ ~
Mo
0.200 30
25
O.lSO
i' ~
~
20
e
:~ ~
0.100 15 2
~
e
~ .1
<3
~
.
10
O.OSO
-,
Ano
;:::::::::t mllS arribll dld Wllor lI"u'u -e Peru ntll 90
Se puede observar que el nmero mximo de das por encima del lmite de S02, se
dio en 1992; entre 1986 a 1998 se encuentran los valores ms elevados del nmero
de das por encima de la norma. Sin embargo, a partir de 1993 estos valores bajan
considerablemente con pocos datos por encima de la norma en el 2000 y 2001. El
percentil 90 permite analizar cmo los niveles de concentracin descienden a partir
del ao 1992, mostrando valores altos nuevamente en los aos 2000 y 200 l.
A continuacin se ilustra la grfica de los valores promedios diarios de dixido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mxIsimat/
pnindicadores.htm).
0.3DO 1
1
""
O.2!lO
0.200 ; T
I 1 1
X
1991
"na,,'" 7J
1992
-
1993 1994
MbJ_
r ---r---r--- - . , . - - , - - - r
~tU H
1995
_
1996 1997
hr,,1IJ s,
.-'-
- Mtl_ +
'---,.~
hrft,.tI/ U
-r-
2003 2004 2005
No
Se puede analizar que la mayor dispersin de los valores promedios diarios de SOz se
dan entre 1986 y 1992. A partir del ao 1993 , los valores medio, mximo y mnimo
de los valores promedio de S02 empiezan a descender, excepto para el ao 2001 ,
cuando se observa la mayor dispersin de la base de datos analizada.
A continuacin se muestra la grfica de los valores promedios diarios de dixido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mx/simat/
pnindicadores.htm).
-~ ~ ,..
,""
,...
~
...
-:r- IHI
--.. - '''1
- -,"" ...
.
."'-
I PlJ
''''
m,
,,,,
'06',.... ,
~,,,,
~ ,
- t " - l00J
- - J()(U
O,!XXl +--~~~~~~~~~~_~ _ _ ~~~ __ ~_~ _ _ --I -JllI.lfJO$
1 2 3 .. 5 e 7 8 9 10 11 12 13 '4 15 16 17 18 19 20 21 22 23 24
Hora
Grfica del comportamiento tpico diario del dix ido de azufre (SO]),
1986 - julio 2005
Se puede observar que a travs de los aos el comportamiento tpico diario del
dixido de azufre sigue la misma tendencia, es decir, valores relativamente bajos hasta
las primeras ocho horas, valores altos entre las 9 horas y las 11 horas y nuevamente
disminucin a partir de las 14 horas, aproximadamente.
A continuacin se muestra la grfica de los valores mximo maximorum de
concentracin horaria de dixido de azufre (S02), monitoreado de 1995 a 2005.
(fuente: www.sma.df.gob.mxJsimat/pnindicadores.htrn).
CI.IIIII
o,lIIO
ICI.IIIII
t 0,110
o,..z ~o.. . . .
0,41
0,100
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Mo
0,060
0,052 o,~" , 0,056
Q,i
~
~ 0,030
g
. --
0,020
S
..... .--- -
--- ....
0,018
0,020 ...... 0,016 0,016
~
13 0,010
---
0,017
0,014
0,Q1.
~ 0,0'4
...... 0,012 0,011
0,0 12 0,012
O,CXXl -~-~--r-~-~--r--'--~--r--'--"'---r--'--"'---r-~-~--r--,-----l
+-1
1986 1967 1968 1969 1990 1991 1992 1993 1994 1995 1996 1997 1996 1999 200l 2001 2002 2003 2004 2005
Mo
9
Calidad de agua en una
fuente superficial
I
ESTACICN AbKlsa(Km)
1. Ante. Suarez 1.8
2. Ante. Ovejas 3.1
3. Antes TITTlt>. 24.1
... Paso de III Belsa 27." ""-"'"
5. P. .o de III Bol.. 78.9
6. Puente Hormiguero 113.5
7. Antes Navarro 127.7
8. Juanc:hlto 139.3
9. PISO del Comercio 1.....6
10. Puerto lsaacs 155.5
11 . Paso de la Torre 170.8
12. Vljes 181 .8
13. Yotoco 211 .8
14. Medi8CIIl'lOll 220.9
15. Puente RIofrio 284.8
16. Pueril Guayabal 347.0
17. Puente La VIctoria 369.6
18. An.calO 418.5
-
Front....
d ... Cuenea
o 25 50
19. Puente La VrginJa .....7 km
~
MIdiI DmiIci6n
Minino MIdiI Milimo Madi MedIIII Rango 'llrilnzl Coef. di
llImtricI EstindIr
Img/I) ImII/II Img/I) ImgIIl ImII/II Img/I) lmgII2 Vllilci6n1'lo1
EstICin ImgIIl ImgII)
1. A. Surez 0.10 1.88 7.80 0.60 1.40 1.38 7,70 2.28 1.51 80.5%
2. A. Ovejas 0.10 1.51 7.00 1.20 1.20 1.11 6.90 1.39 1.18 78.2%
3. A. Timba 0.10 1.46 4,70 0,70 1.15 1.19 4.60 0.83 0.91 62.4%
4. P. Balsa 0.20 1.55 4.80 0.90 1.30 1.25 4.60 1.04 1.02 65.7%
5. P. Bolsa 0.10 1.94 5.30 1.90 1.90 1.49 5.20 1.54 1.24 63.8%
6. Hormiguero 0.20 2.18 6.30 2.50 2.00 1,78 6.10 1.64 1.28 58,7%
7. A. Navarro 0.60 2.64 13.50 2.10 2.30 2.27 12.90 3.23 1.80 68.1%
8. Juanchito 0.30 2.48 5.70 2.20 2.25 2.20 5.40 1.32 1.15 46.2%
9. P. Comercio 0.60 4.61 18.40 4.20 3.80 3.93 17.80 8.76 2.96 64.2%
10. Pto. Isaacs 1.30 4.44 16,70 2.80 3.72 3.96 15.40 6.29 2.51 56.6%
11. P. La Torre 0.77 5.05 14.80 3.00 4.48 4.43 14.03 7.42 2.72 53.9%
12. Vijes 0.86 6.40 18.50 5.30 5.15 5.33 17.64 16.64 4.08 63,7%
13. Votoco 0.80 5.08 16.50 2.80 4.10 4.15 15,70 11.58 3.40 66.9%
14. Mediacanoa 1.20 4.77 13.20 2.00 3.95 4.04 12.00 8.23 2.87 60.1%
15. Pte. Riofro 0.68 4,79 14.60 1.90 3.80 3,75 13.92 11.42 3.38 70.5%
16. Pte. Guayabal 0.85 4.16 13.20 3.80 3,71 3.45 12.35 7.10 2.66 64.0%
17. La Victoria 0.50 3.53 11.60 2.50 3.05 2.99 11.10 4.56 2.14 60.4%
18. Anacaro 0.70 3.85 13.90 1.80 2.64 3.06 13.20 8.10 2.85 74.0%
19. Pte. Virginia 1.12 3.36 10.80 2.40 2.60 2.94 9.68 4.07 2.02 60.0%
.....
Medidas de tandencil cantral Medida de dispersin
Estacin
lq.4) .... .... .... .... ...
lIbiIIII
s.itricI "-" VIriIIII
..,; ...
E.-.. VIridt
111
1. A. Surez 0.70 4.64 8.00 4.80 4,70 4.20 7.30 3.19 1,79 38%
2. A. Ovejas 0.90 5.09 8.00 6.20 5.30 4.74 7.10 2.57 1.60 32%
3. A. Timba 0,70 6.23 7.91 7.20 6.45 5.92 7.21 1.80 1.34 22%
4. P. Balsa 1.80 6.28 8.00 7.20 6.60 6. " 6.40 1.43 1.19 19%
5. P. Bolsa 0.40 5.95 7.27 6.40 6.30 5.71 6.87 1.38 1.17 20%
6. Hormiguero 1.60 5,76 7.80 6.10 5.96 5.60 6.20 1.19 1.09 19%
7. A. Navarro 0.80 5.52 7.50 5.90 5.90 5.31 6,70 1.38 1.17 21%
8. Juanchito 3.10 5.19 8.20 5.30 5.30 5.12 5.10 0,76 0.87 17%
9. P. Comercio 1.20 4.50 8.10 4.20 4.60 4.30 6.90 1.47 1.21 27%
10. Plo. Isaacs 0.50 3.55 5.80 3.00 3,70 3.26 5.30 1.55 1.24 35%
". P. La Torre 0.10 2.14 6.30 0.20 2.12 1.49 6.20 2.14 1.46 69%
12. Viies 0.20 1,71 4.60 0,70 1.60 1.29 4.40 1.44 1.20 70%
13. Voloco 0.20 1.51 4.30 1.20 1.35 1.22 4.10 0.92 0.96 64%
14. Mediacanoa 0.10 1.65 4.10 1.30 1.50 1.39 4.00 0.81 0.90 54%
15. PIe. Riofrlo 0.60 2.21 4.30 2.10 2.15 2.05 3.70 0.67 0.82 37%
16. PIe. Guayabal 0.30 2.40 4.60 2.40 2.40 2.23 4.30 0.66 0.81 34%
17. La Victoria 0,70 2.75 5.00 3.10 2.80 2.65 4.30 0.49 0.70 25%
18. Anacaro 1.20 2.92 6.40 3.20 2.85 2.84 5.20 0.51 0,71 24%
19. Pte. Virginia 2.20 3.55 6.00 3.80 3.60 3.48 3.80 0.49 0,70 20%
mnimos y medios de DBO, excepto en la estacin Vijes. Sin embargo, los valores
mximos superan el valor admisible en los siguientes tramos: Antes Surez a Antes
Ovejas, Hormiguero a Antes Navarro, Paso del Comercio a Puente La Virginia, es
decir, cerca del 85% de las estaciones evaluadas no cumplen la norma de DBO en
los valores mximos, aunque el 95% s la cumple en el valor medio.
34.0 100
r-
eoo
18,0
r-
500
:!
HIlo, AbrJsib/~
Q 12,0
~ <:)1
T ~ ~
..
6.0
-r .
. .,
~.~lII -t 4 ~. -i. ~ 11. I~
~. _.~ I 1'-. ~ I ~
200
lOO
o
.. U.
0,0
l:!oc s ;:
~ .,~
~;:
e
::; e
::
: e
O
tl lo
~
l:l
~ ~ ..
e ...
;: ~ e ~
~
..,~ ~
e ...:
e
1>
:
:::
~
~~ ~ ~ ~
le ~
~ ..
~ ili
~
~;: ~
.., ~
...: ...: '" '" .. .., 8 ~ e
~ '" Estacin
'" ~ ~
1>
.
~
~
.
~
- D80 CAUDA L
11 ~----------------------------------------------------------~
1 .. . -. ~ "'lo ~
12 .' . ............... ..
10 ,,- .......,.Oo ..
1964 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Se puede evidenciar que en las primeras estaciones, desde Antes Surez hasta
Juanchito, los valores de DBO son menores al valor admisible de 6 mgll, en cada
uno de los meses del ao. Sin embargo, en las estaciones centrales se observan los
mayores niveles de DBO, es decir, entre Puente del Comercio y La Victoria, los
valores de DBO se incrementan considerablemente con valores mximos en los meses
de enero a marzo, disminuyendo entre los meses de abril a mayo e incrementndose
nuevamente hasta el mes de diciembre donde alcanza valores mximos.
La DBO vuelve a mostrar valores bajos en las ltimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a generar
niveles bajos de DBO. En general los meses de marzo, abril y mayo muestran
los niveles ms bajos, incrementndose hasta llegar a los valores mximos en
diciembre.
tU
1,0
11 __ -- -
.,.. ""'" -. fIIMr -
..,
500
11,0
i"""Q I '1 rI " 11 l. 11 ~
r
~
~
300
!~
l.
4,0
~II~ ~~ ~
~- ""' 11
2,0
~~
L..
1.-11--1 ~ . '"11 -
111 JI 200
100
0,0 ., . ...;: ..
::::: eus: .e
;: e e e :: ; e
~ ~ tl
~2 ~ ~ ~
e~
~:
~
::
.. ...
~
:li ~ ~ ;: ~
~
~ >:
U
~
;;S
es:: u
., '~"
'..."
e
... ...
I ~
... ...~ 8.. ~
Estacin
.. ~
~
:1; ~
:li
::!'"
..
:
~
..::!
. OD CAUDAL
Grficamente se evidencia una relacin inversa entre los niveles medios de OD y los
valores medios de caudal, pues en el tramo Antes Surez a Puente del Comercio los
valores medios de OD tienen tendencia hacia valores bajos y los valores medios de
caudal tienen tendencia a incrementarse, mientras que en el tramo Puerto Isaacs a
Puente La Virginias los valores medios de caudal tienden a incrementarse y los valores
medios de OD muestran fluctuacin con tendencia a tomar valores mnimos.
En la siguiente grfica se observan los valores mximos, mnimos y medios de
oxgeno disuelto por mes en cuatro estaciones.
~
7.00 1
6.001
I
9.00 , - - - - - - - - - - - - - - - - - - , - - - - - - - - - : - - - - - ; - - . . . . . . . . ,
8.00
I
! s.OO 1
~ 4.00 + -~+_++=H_++--_+;;;.-.~+'_+_"".......,"..,j._=r-+.r..___iI_+_=____'lI....-++.....;+_+.=f1
1 -
Q 3.00 ~
2 .00~
1.00 !
: -~--~-'--~-~--~-~-_--'--_-_-_--~-_l
0 .00 1--
ENE"O FEIRUO MA"ZO AUI.. IoI"YO JlHO
Mes
---+- A. Slldr~z ---+- Hor".g,,~ro --... - Plo. ISQQCS --+- Pte Virginia
IJ I :.._.;.".,..
8
7 ~ .
o I F' v
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 19971998 1999 200 2001 200
6 ,00
i'6
o 4,00
;
.2'
el
2,00
0,00
~ i
Se puede evidenciar que en las primeras estaciones, desde Antes Surez hasta Juanchito,
los valores de OD son mayores al valor admisible de 4 mg/l, en cada uno de los meses
del ao. Sin embargo, en las estaciones centrales se observan los menores niveles
de OD; entre Puente del Comercio y La Victoria los valores de OD disminuyeron
considerablemente, con valores mnimos en los meses de enero a marzo.
La OD vuelve a generar valores altos en las ltimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a evidenciar
niveles altos de OD.
9.3 Histogramas
En este tem se muestran grficas de histogramas para algunas estaciones de muestreo
sobre el ro Cauca en la variable oxgeno disuelto. A continuacin se observan
histogramas en las estaciones Antes Ovejas, Paso de la Balsa y Hormiguero.
ESTACIN: 2,00 Antes Ovejas Estacin: 4,00 Paso de la Balsa
16 , - - - - - - - - - - , JO
12
20
10
/ \
1\
~
1\ /)mI. tp. ',19
Medj. - 6J
h-L N - 61,OO
1,0 1,5 O u 3.0 3.5 Oj o~ ~o ~5 lO 1.5 7,0 7,5 lO u O 5 3.0 3,5 0,0 O~ ~O 5,5 6.D 6~ 7,0 7~ lO
Oxigeno disuelto Oxgeno disuelto
20
0""/1p. /.1I8
Me. - j.7
.L.J.,__ :;...,.J.........,................,..L.,...l...J..,.J N - 71.OII
/,
r-
\
~
20
_1 \
--'
10
20
10
En esta estacin se puede apreciar que el 69,8% de los datos de DBO se encuentran
en el rango O mg/l a 2,0 mg/l y el 15,9% se dan en el rango de 2,0 mg/l a 3,0 mg/l,
es decir, en estos dos rangos se halla el 85,7% de los datos de DBO.
Para el oxgeno disuelto, el 33,3% de los datos se encuentra en el rango 5,5 mg/l a
8,0 mg/l y e138,1 % en el rango 3,5 mg/l a 5,5 mg/l, es decir, en estos dos rangos se
encuentra el 71,4% de los datos de OD.
Cuando el oxgeno disuelto se encuentra entre 5,5 mg/l y 8,0 mg/l; la DBO toma
valores entre O mg/l y 2,0 mg/l; el 66,7% de las veces y entre 2,0 y 3,0 mg/l el
23,8%.
Cuando la DBO se halla en el rango Omg/l a 2,0 mg/l; el 11,4% de los datos de OD
se encuentra entre O mg/l y 2,5 mg/l y el 18,2% de los datos se da entre 2,5 mg/l y
3,5 mg/l.
Del total de datos analizados, el 22% se hallan entre 5,5 mg/l a 8,0 mg/l de OD y entre
Omg/l y 2,0 mg/l de DBO, simultneamente. El 27% de los datos se encuentra entre
3,5 mg/l y 5,5 mg/l de OD y entre Omg/l y 2,0 mg/l de DBO, simultneamente.
En esta tabla se puede evidenciar que valores menores de DBO estn asociados a valores
altos de OD, valores altos de DBO repercuten en una disminucin de la OD.
La siguiente tabla muestra el cruce entre oxgeno disuelto y DBO, en la estacin
Juanchito.
Tabla de contingencia oBO * Oxigeno disuelto 8
Oxigeno disuelto
Total
(2.53.51 (3.55.51 (5.58.01
OBO [02.01 Recuento O 20 11 31
%de OBO ,0% 64,5% 35,5% 100,0%
%de Oxigeno disuelto ,0% 39,2% 44,0% 39,2%
(2.03.01 Recuento 1 17 6 24
%de OBO 4,2% 70,8% 25,0% 100,0%
%de Oxgeno disuelto 33,3% 33,3% 24,0% 30.4%
(3.05.01 Recuento 2 13 8 23
%de OBO 8.7% 56,5% 34,8% 100,0%
%de Oxigeno disuelto 66.7% 25,5% 32,0% 29,1%
>5.0 Recuento O 1 O 1
%de OBO ,0% 100,0% ,0% 100,0%
%de Oxigeno disuelto ,0% 2,0% ,0% 1,3%
Total Recuento 3 51 25 79
%de OBO 3,8% 64,6% 31,6% 100,0%
%de Oxgeno disuelto 100,0% 100,0% 100,0% 100,0%
a. Estacin - Juanchito
Cuando el OD se encuentra entre 3,5 rng/ I y 5,5 mg/I; el 39,2% de los datos de DBO
se halla entre O mg/I a 2,0 mg/I; el 33,3% entre 2,0 mg/I a 3,0 mg/I y el 25,5% entre
3,0 mg/I a 5,0 mg/l.
Cuando la DBO se da entre 3,0 mg/I y 5,0 mg/I; el OD se halla entre 2,5 mg/l y 3,5
mg/I el 8,7% de las veces; el 56,5% se da entre 3,5 mg/l y 5,5 mg/l y el 34,8% entre
5,5 mg/l y 8,0 mg/l de OD.
Del total de datos analizados, el 25,3% de los datos est entre 3,5 mg/l y 5,5 mg/l de OD
y entre Omg/l a 2,0 mg/l de DBO, simultneamente. El 16,5% de los datos se da entre
3,5 mg/l y 5,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO, simultneamente.
A continuacin se muestra la tabla de contingencia entre rangos de DBO y oxgeno
disuelto, en la estacin Vijes.
Tabla de contingencia DBO Oxigeno disuelto
Oxigeno disuelto
Total
[02.51 (2.5-3.51 (3.55.51
oBo [02.01 Recuento 2 1 O 3
%de OBo 66.7% 33,3% ,0% 100,0%
%de Oxigeno disuelto 3,6% 10,0% ,0% 4,2%
(2.03.01 Recuento 5 2 3 10
%de OBO 50,0% 20,0% 30,0% 100,0%
%de Oxgeno disuelto 9,1% 20,0% 42,9% 13,9%
(3.05.0%1 Recuento 11 5 2 18
%de OBO 61.1% 27,8% 11,1% 100,0%
%de Oxgeno disuelto 20,0% 50,0% 28,6% 25,0%
>5.0 Recuento 37 2 2 41
%de OBO 90,2% 4,9% 4,9% 100,0%
%de Oxgeno disuelto 67,3% 20.0% 28,6% 56,9%
Total Recuento 55 10 7 72
%de OBo 76.4% 13,9% 9.7% 100,0%
%de Oxgeno disuelto 100,0% 100,0% 100,0% 100,0%
a. Estacin - Vijes
En esta estacin el 4,2% de los datos de DBO se dan entre O mg/l y 2,0 mg/l, el
13,9% entre 2,0 mg/l y 3,0 mg/I y el 25,0% entre 3,0 mg/l y 5,0 mg/l, es decir, en
estos tres intervalos se halla e143,1 % de los datos de DBO.
En OD, el 76,4% de los datos se encuentra en el rango mgll a 2,5 mg/l, el 13,9%
entre 2,5 mgll y 3,5 mgll y el 9,7% entre 3,5 mgll y 5,5 mgll.
Cuando el OD se halla entre 2,5 mgll y 3,5 mg/l; el 10% de los datos de DBO est
en el rango de mg/l a 2,0 mgll; el 20% entre 2,0 mg/l y 3,0 mg/l y el 50% entre
3,0 mg/l a 5,0 mgll.
Cuando la DBO se da entre 3,0 mg/l y 5,0 mgll; el OD se halla entre mg/l y 2,5
mgll e161, 1% de las veces; entre 2,5 mgll y 3,5 mg/l el 27,8% Y el 11,1 % entre 3,5
y 5,5 mg/l de OD.
Del total de datos analizados, el 51,4 % de los datos se da entre mg/l y 2,5
mg/l de OD y > 5,0 mg/l de DBO, simultneamente. El 15,3% de los datos
se ubica entre mg/l y 2,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO,
simultneamente.
J",ndita
,.,. ,.,. ,.,.
7i-' 7
7 / 1/
V /
~
I
I
/
/ 1/
V
dI A
~
l
'"0,0 4,0 lO '" 0,0 l,O 40 1,0 '" 0,0 l,O ..o 1,0
00 00 00
Grfica de frecuencias acumuladas en oxgeno disuelto, en las estaciones
Antes Surez, Paso de la Balsa y Juanchito
De la grfica se puede analizar que en la estacin Antes Surez alrededor del 43% de
los datos toma valores menores a 4,0 mgll, es decir, el 57% cumpli el valor admisible.
En la estacin Paso de la Balsa alrededor del 5% de los datos son menores a 4 mg/l,
y el 95% de los datos cumple el valor admisible. En la estacin Juanchito alrededor
del 12% muestra valores menores a 4 mgll y el 88% toma valores admisibles. Lo
''''''
JlijtS
10'"'
- - - - - - -_.-
M t djfl(llffHI
..
"
PUtnl, GII.)'ab.J
,,. ,. .
,
..
t.
~
oS-
E
~
~
".
~
!!" ".
,. ,. ,.
,,' 20
" 00
',' " " 00
" " "
00
." 00 00
9.6 Percentiles
Este tem muestra el anlisis de los valores percentiles para oxgeno disuelto y
demanda bioqumica de oxgeno.
Oxgeno disuelto
En la siguiente tabla se muestran los valores percentiles de OD en las diversas
estaciones monitoreadas sobre el ro Cauca en el Valle del Cauca.
00
Parcantil ParcantM Parcantil Parcantil P8rcantil
Mediana
05 25 75 95 99
Estacin Antes Suraz 1,3 3,5 4,7 5,8 7,5 8,0
Antes Ovejas 1.8 4,1 5,3 6,1 7,5 8,0
Antes Timba 4,3 6,0 6,5 7,1 7.4 7,9
Paso de la Balsa 4,1 5,7 6,6 7,1 7,6 8,0
Paso de la Bolsa 3,8 5,7 6,3 6,7 7,1 7,3
Hormiguero 3,3 5,5 6,0 6.4 6,7 7,8
Antes Navarro 1.7 5,2 5,9 6,2 6,5 7,5
Juanchito 3,7 4,7 5,3 5,7 6,3 8,0
Paso del Comercio 1,9 3,6 4,6 5,3 5,9 8,0
Puerto Isaacs ,8 2.7 3,7 4,6 5,3 5,8
Paso de la Torra ,1 ,7 2,0 3,0 4,6 6,3
Vijes ,2 ,6 1.4 2.4 4,0 4,6
Yotoco ,2 ,8 1,3 1.8 3,5 4,3
Mediacanoa ,3 1,0 1.5 2,0 3,7 4,1
Puente Riofrlo ,9 1,6 2,2 2.7 3,6 4,3
Puente Guayabal 1,0 1.8 2.4 2,8 3,6 4,6
Puente La Victoria 1,7 2,3 2,8 3,1 3,8 5,0
Anacaro 2,1 2,5 2,8 3,2 3,9 6.4
Puente La Virginia 2.4 3,1 3,6 3,9 4,5 6,0
De la tabla se puede analizar que en la estacin Antes Surez el 50% de los datos son
menores o iguales que 4,7 mg/l; el 75% son menores o iguales a 5,8 mg/l; el 95%
son menores o iguales a 7,5 mg/l y el 99% son menores o iguales a 8 mg/l.
En la estacin Paso de la Bolsa el 50% de los datos son menores o iguales a 6,3 mg/l;
el 75% son menores o iguales a 6,7 mg/l; el 95% menores o iguales a 7,1 mg/l y el
99% son menores o iguales a 7,3 mg/l.
En la estacin Paso de la Torre el 50% de los datos son menores o iguales a 2,0 mg/l;
el 75% son menores o iguales a 3,0 mg/l; el 95% son menores o iguales a 4,6 mg/l
y el 99% son menores o iguales a 6,3 mg/l.
En la estacin Yotoco el 50% de los datos son menores o iguales a 1,3 mg/l; el 75%
menores o iguales a 1,8 mg/l; e195% menores o iguales a 3,5 mg/l y el 99% menores
o iguales a 4,3 mg/l.
Los percentiles en forma grfica se observan a continuacin.
, OI
.... .r ....
Valdr Gd",i;ible
.=......
~ .~
~ ~ ~ .~ . ... :;: :: ~ ~ .
O e e
e ~ t3 e tl ~
~ "u ~
t;j ~ ::;J ~ ~ ~
oc <:;
u .~
~
~
::!i ~
e ~ ~
~ ;:s
...'" ...'" ... '" '" "~ ... ...::!i
e ~ : ~ ::!i ~
~ ~ ~ ~ ..., s::
~ \,)
~ ~ "~ .I:! ~
~ '" '"
ESTACIN
En la estacin Hormiguero el 50% de los datos son menores o iguales a 2,0 mgll;
el 75% son menores o iguales a 2,8 mg/l; el 95% menores o iguales a 4,8 mg/l y el
99% son menores o iguales a 6,3 mg/1. En la estacin Vijes el 50% de los datos
son menores o iguales a 5,2 mgll; el 75% son menores o iguales a 9 mgll; el 95%
son menores o iguales a 15,7 mgll y el 99% son menores o iguales a 18,5 mg/1. Los
percentiles en forma grfica se muestran a continuacin.
4
2
.... . ...
o
!:! g ;:
~
.~
Q
!:l'"
Q
::: ~ tJ ':::" ::
s: ~ ~iJ'"
Q ....
;: '1
Q
'"
'1
~
~ ~ ~ ~
;:'" :::: iJ
;: Q
::l ~ :::
"..;
Q
"
:lO
~...
~
Q
;: ~ l!!
'"
..;
..;
'" '"
I ~
..;
~
<.;;
'"
.
:! ::
'"
'1
~ ~ "
~
;;:
:: " "~
.
ESTACIN
~Perc. 5 -----Perc. 25 --+-Perc. 50 - - Pe re. 75 -+-Perc. 95 - - - Pe re. 99
Analizando en general los valores percentiles para DBO, se da que las estaciones con
mejor desempeo son: Antes Timba, Paso de la Balsa, Paso de la Bolsa, Hormiguero
y Juanchito, pues el 99% de los datos son menores o iguales a 4,7, 4,8, 5,3 , 6,3 Y
5,7 mg/l, respectivamente.
Le siguen las estaciones Antes Surez, Antes Ovejas y Antes Navarro, debido a que
el 95% de los datos son menores o iguales a 5,1, 3,7 Y 6,0 mg/l, respectivamente.
Las estaciones con valores crticos en DBO son Paso de la Torre, Vijes y Yotoco, debido
a que el 50% de los datos son menores a 4,6, 5,2 Y 4,1 mg/l, respectivamente.
De los resultados descriptivos desarrollados en este captulo, la presentacin grfica
de los datos y consideraciones de carcter tcnico se pueden generar los siguientes
anlisis generales:
En el tramo Antes Surez a ro Ovejas se dan aumentos leves en la concentracin
de oxgeno disuelto y una disminucin leve de la demanda bioqumica de oxgeno;
el ro en este tramo inicia un proceso de recuperacin, recibiendo una reaireacin
que es utilizada para la degradacin de la materia orgnica.
En el tramo Antes ro Ovejas a Hormiguero el ro recibe aguas de tres ros afluentes :
ro Ovejas, ro Timba y ro Palo, aumentando considerablemente los niveles de
caudal del ro Cauca, lo cual permite una estabilizacin de la demanda bioqumica
de oxgeno y el incremento en la concentracin de oxgeno disuelto, considerando
que los ros Timba y Ovejas aportan un caudal importante con altas concentraciones
de oxgeno disuelto y valores bajos de demanda bioqumica de oxgeno.
En el tramo Hormiguero a Vijes se observa la mayor contaminacin del ro por
materia orgnica, debido a que en este tramo recibe las descargas de la ciudad de
Cali, Palmira y el corredor industrial Cali-Yumbo, donde se encuentra gran parte
de los ingenios azucareros, la mayora de las industrias de produccin de pulpa de
papel, industrias productoras de qumicos y la principal destilera del departamento
del Valle del Cauca. En este tramo se dan constantemente valores bajos de oxgeno
disuelto y un incremento progresivo de la demanda bioqumica de oxgeno.
En el tramo Vijes a Mediacanoa se tiene la condicin ms crtica a nivel de
concentracin de oxgeno disuelto, pues en general se encuentra entre 1 mg/l y 2 mg/l.
En este sector hay una fuerte exigencia en la demanda bioqumica de oxgeno. La
contaminacin en este sector es aportada por los municipios de El Cerrito, Guacar
y Yotoco. (Vlez, 2003).
En el tramo Mediacanoa a La Virginia el ro muestra una marcada recuperacin, pues
la carga contaminante es menor y esto posibilita la auto-recuperacin de la calidad de
agua. En este sector se observan descargas de aguas residuales e industriales, debido a
los ingenios, beneficiaderos de caf e industrias alimenticias, as como de los municipios
de Buga, Tulu, Riofro, Bugalagrande, Cartago y Caicedonia. (Vlez, 2003).
10
Instrucciones en SPSS
En este captulo se presentan los procesos bsicos para el uso del programa estadstico
SPSS (Statistical Package for the Social Sciences), en su versin 11.5, para el
sistema operacional Windows (Las nuevas versiones tienen los mismos procesos
para la estadstica descriptiva que los presentados en este libro). SPSS es uno de los
programas ms comnmente utilizados para el anlisis estadstico de datos. Entre sus
ventajas se encuentran: cubre un amplio rango de los anlisis ms comunes y grficos
estadsticos, los datos pueden ser grabados en SPSS o pueden ser importados de
otros programas, como Excel. Los resultados del anlisis de datos estn claramente
estructurados en un archivo de salida, en el cual se pueden realizar modificaciones
y pueden ser editados en el procesador de texto Word (Microsoft). '
Para ingresar al programa SPSS en el men de inicio se debe seleccionar:
Programas>SPSS for Windows>SPSS 11 .5 para Windows, o simplemente d
doble clic en el icono de SPSS si este se encuentra instalado en el escritorio, SPSS
automticamente abrir una hoja vaca: "Sin titulo - SPSS para Windows Editor
de datos". Para finalizar el programa SPSS se debe seleccionar Archivo>Salir, de
la barra del men o clic en el botn X, en la parte superior de la esquina derecha
de Windows.
1
CeIIiMID
r
........
r
........ 1
v...
35.00
EIIIp
I ~;I
,
2 r 1 42.00 I
3 r 1 65.00
4 1 72,00
J
5 1 75,00
6 1 100,00
7 1 105.00
c==-:u
e 1 120,00
9 1 190.00 ~,
-
[~;.:::'- . ---A
-o-Ir.-v=-d
AcepW Pega! , R~ I CenceIIr I .. I
_...,5...
i
........ ~
e
71 00
, " te t l i ti
... c:::::J
07 ...,.... ' 12.. '''00
_ .00
8UlO
".00
,.o. '''00
100.0 '0000
,to.O .... 00
MO .7100
>0. .....00
,oe. 17800
_........
70. '2000
12&0
1t00
'3)00
'''00
32.
.,.2..
OlOO
..00
123.00
. . . 00
" .00
37.0 7>00
"00
Seale los datos de las variables que se van a procesar y d clic en el icono de
copiar, en este caso turbiedad y slidos suspendidos,
~ -
- 1- f
+-
+
t
i
'Ir
1
-+ ,
, 1 t - t
~
~
i ~ l- :
- 1-' t .~
- ~ -
j-
-
tt
-r- -+----1--+ ---i -t-. --i-- t
t -~ -~
-t--- "'.- r-T-Y- -1- ---- -
t ~
-
L
1-
t
j f" 1-1
~- J
~ '.-
l tt -..j:
+ -.
-:
_.
-
t
1 f j: r
+
--+-
t
.
+ -.
f - .. -+. f
~
i
.tj
t
; ~
-; ~
- r ~
+
,
j
.t
I ~
f. t . ~ - +-
~
r j ~ +
~
1 1t.___ t
1"
f
f l-
.---t" -, - t
.ffI
_..
.....
.....
.......
"" '
'''00
\CIt_
.00
"08
ItSOi!!
__
11000
U).ao
:
).l.
1100
...
.00
14000
"00
114(1)
Inoo ! ,
:::! .
.....
j t ~
+
t
i
+
" I
rt
t
.
t
j
t +
+
+
!
i-
.
t ..
t t f
~;;;;;!'r-~:::::::::----~=:l:'
t ,. 1-
~ t +
.~
--
Vista de variables
Campos que deben ser diligenciados de acuerdo con el contexto del estudio.
f
,.,
~
I
I
f
I
+
I
I
,.
f
t
t:j
t
n
- 3IlO
~I
7~r
\46
SII5 I
I
I
I
I
I I
'!l --
~
35
65 136
. t----- -
121 IliOi - 1
~
1CX) 1901 i !...
- m""'---2Ii81 I
I
6SO
Dl
978 1 I
!!l * 1 I I
I
~
105 \10
~ - 1$
te
\20
99 t -- f---._-.- - ... _ ...... f------- --_ ..._. ....+--
lA 125 \33
W 85 UO I ,
I \6
,.-
32 53
-_ - --u-r--
R
I
I
\
I
-85 -
e -,
54
129 ,
---+-_. ..
I _. __ .
-t-
,
...
I
~ 51 1M I j I
2t
iliJ\-.-~ .:--...1
-_._-
11 73
- _.
.-- -- -
1
- .. ~.
" -_~_I
-
I
-
~
I
1
, .:r
262 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPfTULO 10 - INSTRUCCIONES EN SPSS
c~.. mecIas
Modelo lneaI generlll
Modelos mixtos
Coneledones
R~
lOQlnNl
CIesflc..
RldJcdn de datos
Esealas
PruIbas no perllll6b1ces
Series teqIorlles
~
RespJeStes ~
AnilsIs de valores penIcIos
Seleccione del lado izquierdo del cuadro de dilogo las variables a las cuales desea
calcularles estadsticas descriptivas y pselas alIado derecho (Variables) mediante
el botn que se encuentra en el medio de las dos subventanas. Para seleccionar
las estadsticas descriptivas que desea calcular, d un dic en Opciones.
_.
-~ - - - - ---- .._------- _. ---- - - --~ ~
~I ~ ~I
~feche
Acepte! I
$llIInIgas3 F>.\lII I
1lIInI~
.leII\IghnJ
Rttttbletll! I
""",gh3 Ctn:ei I
$""",gcb
~ I
~SJ>
'~~P~-Pki;~~"::, ..",.__..,_ ~
~ Mea ~ SI.IlIa {anna}
Dispersin
~ Minino
~I
~ Oesv. tpica
~ Varaanza ~ Mmoo
AjWa I
~ An1*ud ~ E.T. mea
~= Orden de "'-Iz1IICi6n
~ Asineb a
(O LAta de vllrietlles
r AlabIico
r MediIIIs IICendenIes
r Meas d.cendrri1llS
Una vez haya hecho clic en Aceptar se abrir una nueva ventana, la cual contendr
el resultado de los procedimientos realizados en la sesin de trabajo. Esta nueva
ventana, que se visualiza, es independiente del editor de datos de SPSS y se llama
Visor SPSS, donde se presentan los resultados de los procesos estadsticos. Los
resultados presentados en la ventana Visor de SPSS se pueden trasladar a un
editor de texto, como Word, mediante el proceso de sealar, copiar y pegar.
1:..tC!~I I~S l _Vl ~L~!!>.>. _ _ _ _~ ____________ ......_ ._~ ... ~ ....... . ~.,:...,JII'
_ _ os
r_booc.... .
r_ _ ..... ..
~ .....
Corn0iecJ0005
LoghNI
Tata;do , ~~ .. .
Tata; do freo..oerOas.
00sl1Ul'
Rll<UxJOO do datos
PruIIbas no paramblc.as
..
boIrpJraIos
SuperviYenda
~ ~
- . . . de valores " " ' _. ..
r~ _......
_".. .
~:' ...
~
~ I I_I
' frJwU._
.
, fuh3 111ti11
,:~==.
J
~ ~~
............
" -'-
f---
S _
Una vez que ha pasado las variables, d clic en el lado derecho del mouse y en
el men que se despliega elija Seleccionar todas las variables de columna.
~.;~------- -- .-_. -- ---_.._.- -- ,. ~~:
.-
. _ A>
Cat.,gol iu
Cort.
Copiar
etn+x
ctrI+C
r~--
l'<9flI' etn+_
{vtJIWIe do Eimin. 5..-
~
t-bitrar nOrrOre de VoIY!abIe
<ti Mostrar eti~ de varl.!bje
----~:~~ ~~:!"~~:.~::~_._--_._~;..... ~I
D~nr -------------. E~"li<osde,.......nl -------------~
Una vez que se han seleccionado las variables en el rea de diseo de la tabla,
vaya al cuadro Definir (parte inferior izquierda) y localice el cursor sobre
Estadsticos de resumen y d un clic; inmediatamente se desplegar la ventana
donde podr seleccionar las diferentes estadsticas que desea calcular. Slo debe
buscar y seleccionar de la lista Estadsticos la estadstica de preferencia, luego
pasarla al cuadro Visualizacin mediante la flecha que se encuentra en medio
de las dos subventanas. Cuando haya terminado de seleccionar las estadsticas,
d un clic en Aplicar a seleccin, entonces volver a la ventana de diseo de la
tabla personalizada.
~blC'~ d.:- C''X I ~,....~~~, ~. I
V",ioble seleccionada: IM l~ v",iabl.. )
e-tadi,licos; Vtluahzacin;
Pe,C<II"II199 .:
.z.
Eno'lpicode lamea - . I~'~" I ~~ I'''''''''''''ICO
Detv. tpica A.
Suma
N total
I AplicO! eleccin I ApliC<ll ~ lodo Cenor
J~..J
' do{dol
. I
IIiI NOIft\II I!I e_ .,
<+........
I 14M
'' nle!ilod
lecho!"'...
1IIIo"ld 190t3 IIIIC I~ Iv
' 1ga<311g.. Mido r.."!I''W'VY'I I'N'ln....n IIm'I M ""mM N
'fooc~gocl nnnn..nn
Mldono (1'111'1)'1'", r,'l1'lJ'1'l N HY\.ftl n
" !fTnl{f.
' tg\l{lgh3)
Modo rlflmm rI'lI\I\.nn fYTl'\/Wl mm.m ro
~'~~':' . :
Cgoff.:
F ~
M:4I4I""
Oefol
-
~ j;1I1d1111C01 d........... ,
..
I AcOlIta I~ Rec\otNc. l CoraIa I~
A
Aparecer la ventana del Visor SPSS con los resultados de la tabla personalizada
disefiada, tal como se presenta a continuacin.
+ Tablas personallzactas
".dl.
M.atana
",",GRIIO
13,50
48,00
.......
12,4!i
',00
."'"
11 ,14
,.......
18,00
21 ,19
11,00
'GHl
13,20
9,45
'ODa
10,!;1
14,00
.oo,
.......
.Ini~
" .00
5'0,00
17,00
14.00
115,00
2,00
" ,00
170,00
3,80
17.00
130,00
'.90
'8.00
",00
>,"
18.00
140,00
2,"
Vartanza 5190,08 139,66 342,18 256,57 100,02 228,31
Desvl.clnlipltl 16.(}g 11 .82 18.50 '6.02 10.00 15."
Rango otdlnol 56:J,oo 11:J,OO 186,20 '26,10 70,2iI 1:J7,40
10.4 Histograma
Para realizar el histograma en SPSS se deben seguir los siguientes pasos:
En la pantalla de Editor de datos de SPSS vaya a Grficos y seleccione
Histograma .
'lislogrilITla '!
" " ~I "'l " J ",j"j ~t ~ ~II~
..t ',-:j :.JW ~, ;>,
~ oo ~,
-
[!] Vm:
1. .
.1 "'- s-. .,~o
~ Iecha a~
~ iga13
I
~ I w
~~ ... ~ PInia - - _ . - - f Ret!#m l I
<t> 1gm.1 l' r lJlalal~~bde: :
D
('..miv l
<i> gu
<i> i!Ps j -=:J ~
~ 1fJIOlI3 ~\
~~ ~.;<t."'i\'~~';;:''i,"
~ oet#A3 ~ IiMosil.amraNi T... I
Para editar el grfico d doble clic sobre el grfico, aparecer una ventana de
edicin llamada Editor de grficos de SPSS; en esta ventana podr editar el
nombre de los ejes, el tamao de la fuente y el nmero de decimales de los
ejes.
100
BO
60
40
20
INTEGRAD
Para editar cualquier elemento del grfico d doble clic sobre el componente que
desea modificar, aparecer el cuadro de dilogo correspondiente. Por ejemplo, si
se desea modificar el eje X, el cuadro de dilogo que aparecer es llamado Eje
de intervalo, como se muestra en la figura; en este cuadro se puede modificar
el ttulo del eje, los intervalos y el formato de las etiquetas. Si da un clic en
Etiquetas aparecer un nuevo cuadro de dilogo donde se puede modificar el
nmero de etiquetas, el tipo, el nmero de decimales, el factor de escala del eje
y la orientacin de las etiquetas.
,-
fje Ge;~leIVa, ~_
Mcnb. --
('" T..... I.. ~
--
Ic..a-I
r~ c..do r
M..oao _ _
dirJJOIat
",p.~_
c:..c.r. 1
...... 1
~T~~----------------~
~ P.no..... ('" fWngo
eir... decIn*..
rS _ _ d e _
r
Eomc>Io
_____123f~
Fottorde -
0rie!Uc6rc
r-
1 _ :::J
aarr.,....
.......
-".......,
",
!'ooao",
LheM~ .,
"'.....
Dlet;J'nas.c......
ISarrasde.-ror .. ,
I
,[I~
, (int_ad1
'",_odoI r.....,.
'11-_1
,
, (,-g0s31
"'----
, (,-gdol
'('~I
, (".",.....31
Acepo- ~
R_ _
C"",*-
-
270 ESTAD fsTI CA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPITULO 10 . INSTRUCCIONES EN SPSS
_
~
~_
.....
Al. . ,
....
-..
""0.....
~
----1
~. . o.c""
..,..dI.-ror ...
"
-_
o.._docojo. .
a.r.. di.,..,.,
...
Pase las variables que desea graficar del lado izquierdo a cada uno de los cuadros
marcados como ejes, como se muestra en la figura, luego en la pestaa ajuste
verifique que el Mtodo sea Suavizador, en la opcin Kernel que por defecto
utiliza la distribucin normal; puede elegir tambin la distribucin uniforme.
x
,,--- U:!fB5
" , .., J.J .. , , ~ ... (
_-\_1'_ ......1'_1_1
"c.o_
" ............
,~
1.
(7oolodl
1.c.~)D-
-
_ - - \ ' -......IT_I_I
1- :::1
,~
,~,
,c.o._.
,~
, DeO_
,[---
,c.o.v-..
....
v. . . . .~~_________
_ .. _ . - XI
......
X2~
JOF""
11 u.. .. _~ .... een ...................
:::J
'* 1 ~
''000_
,DIOI<b>I
E'"
000 .........
,--- v_. _------
-,
'_-11_
,_ _1
'_1 ~~
,--
~,tb60' ~
,,--
'f......,.._ _ ...
i
--- r """",
,." ....
r
---- ----- r_
- _ 1_1 c-Io I _
-- -
D un clic en Aceptar y el grfico en tres dimensiones aparecer en la ventana
de resultados.
'-
s-
--
0 i0II>-
o
o
~'- = - __
~""
_. ~~ --7'
.... ..
,---
:::: -I _ =~
...... ..
~_ ~ l -.'ii'---;;"I----,.-I
o..ar- . .....
a.r.,de fITrtII
Seale las variables que desea graficar y pselas alIado izquierdo, a cada uno de
los cuadros marcados como ejes, como se muestra en la figura.
---------------------------------------------
".11',1""
(ff"U r.',l111IJ di' IX
I fP tPor--.t.," ($pct)
lJO!O FGH3 (fgh3cal)
..........
- 1, IrQgID ",,-..J -
V .......... ~ ---
Color; I Al ~ :1
Eodo: I a. pIIf 1
...-------
V.w.IHcW......, - - - --
-=---
--
_ _ _ JI
COn_
.....,
."'- 7$
-
_ _ dodotoo
deofk. n
!lO
!lO
65
n
n
5.t
69
75
79
E8
69
li6
65
69
!i6
51
81
l ltpluf<H
[!]
F.clofea;
R_I
--
"-
rx
I
I
_.- j[-
ro
C~ __
N.... delot'..."'.......
ro---.......
P T.... """"
rHto!otJ.....
J
leomru. l
~I
Alu!al
...- 11
Cancellt
. ,I:l
[!] r GI_ con l>IUIboo do .......,,jod
Oiopoqo6n por rweI"", pruebe do u......- - - - ,
[!] ro
E_Ioo ..... _
r '"
r_r
M08Ib. - --
E"",,_r.G'lficooj E ,- 1 G,Mioot... 0_
Irr T,wI_.
'1 norm3dor
P"'..- JlOll""'.... ::::J
j
D un clic en Aceptar y el grfico de tallo y hojas para cada variable aparecer
en la ventana de resultados.
,00 o
33,00 o 2222222333333333
63,00 o 4 4 44444444444444444455555555555
16,00 o 66666666667777777777777
21,00
2,00
o
,
8e8e8lS8IS8i9;9
13 , 00 1 223333
21,00 1144444555S55
18,00 1 66666711
11S,OO 1 8e81S999i
8,00 0111
6,00 233
4,00
7,00
4,00
6,00 011
2,00 2
10,00 lxeremes ( > -33)
Al: 17
Aii:;
,.
12
..
111
111
12
..,.
12
54
"-j
.,
0,0
,,
",Q ~
83,1.
~:[ -:
19
u "747 1 - 55"
u
"'1 ..56
'.' n.!
:~~ :~1'
...~-.
I h.U~1 ,1111,' .. d" , -1)" X lb 1,'111111' ,l. , q' q'"I'I., H, '11111, 111' I',H , ,11 ,,,11\ 111 X
1M
-1
Ii!3s. c-I
I
, Ooh
~_od
IoNI
1 10<03
~Iooc ~
~--- ~I
~"""3
~ ...... I' [D
~~
~fQhl
~1gcIo
A.....' . '
c.-I
l
~~
~-'913
~
I
I '"-~-- ~- -.J
('"1'1.......... " " ' . _ ... _ ,*_"'1." QJ [_100._ _ [ 5 ]
~FGAS31fooo3
;~"",........-
l. .
. --- <l>FGHN3_" 't --
:::
. :::
10.10 Percentiles
En la barra men de SPSS vaya a Analizar>Tablas>Tablas Personalizadas... ,
en este momento se despliega el cuadro de dilogo Tablas Personalizadas.
c"
Arctlyo Etkln Ver Datos Transformar l:.. Grftc:os lJ:ldades "'ertana 1
~ IiiIJ~ ~ ~~ ~ ~J r,
Informes ~J
Estadstlcos deSCr1JtIvos .,
11:<10 ~2
do fecha
COrroarar medas ConjJntos: de res:luest:as mt~les ... h
Modelo ..... a1 general
~
62.00 03-MAR91 Tobl.. b...., ... ..
1 Modelos mIXtos Toblo> Qoneroie,,,.
2 63.00 Q4MAR91 CorrelacIOnes
~
Tabl.. de res>.Jest .. .rul~, ...
3 63.00 Q4MAR91 Regre<ln T1IblllS de frecueflClllS. ,.
4 63.00 Q4MAR91 Le>;Iineal 1m
5 64.00 05-MAR91 Clad'lcar O 5.10 2,80 2,60
6 64.00 05MAR91 Reduccin d. dotas O 5.40 3.40 700
7 64.00 05-MAR91
Escalas O 6,70 4.10 5,60
8 65.00 ffi-MAR91
Pruebas no pSl'IItn::-,s O 17.00 9,60 8,80
ffi-MAR9 1
5e!1.. temporole<
9 65.00 S4Jer""-'enda OO 16.00 7,60 8,50
6)0
10
11
65.00
66.00
ffi-MAR91
07MAR-91
R.spuO<t .. .rullples
An~sl s die valor.s percldas ..
O 15.00
12.00
6,90
4,60 8,!ll
1? ~h nn n7.MJl.Q.Ql n 7htl A An "lq('!
;:;~~;I:;;:;;;:';-;~.~~~~Ji1I~I
. --I - -'" Opciono.1
--
,"ec. . ..
T<SbI. Tltuloo l Etladr.lCO.d.con~asI.1
VeriabiM IHiiI N~ l!l CoaPo ~ CaQ<OO
11. ...
( jOIUf""" I
,".."ocI. ~
"ga. 3[f" ..
'fgac[f_J
' fr;r.m3 (I. ..
'frN[fr;J13J I
' fgrJ. (lgrJoJ
, .mg>a3 ...
, .m~
I".m<twn
,
~
;
--'"
. ff
Celegorlet
5a. C4Ir:QoIId <
r'-"
.~
[Derri'
~ ~*I.ddo:l de lettrne
I [E~r'~M '~~
PO$IC16n: CoI~ ~
Una vez que ha pasado las variables, d clic en el lado derecho del mouse y en
el men que se despliega, elija Seleccionar todas las variables de columna.
~
"'~
{vaIitJbIe'*' I
""o
Elri"l.
Ctrl+v
5up<
.".. I Mostrar l"IOn"II:n de Yaflable
" MO$trar etl!JJeta de va~
~. ~~.:TI~.-!- ... :-~ ... _-'"':":. !",.;".~ ... _. :_ 1i 3
Defri,------..., Eotodlttioo,de_
~ ..d l _ ' d . _ .. PooicOl: CciJoM.. r ~ I P""''''d.. ~''og"".,
ti ~oI.egcAl".,..tot.elt:~ Ongon VftlOe, de "'...... o>or d""',o
Variable ~ fgac
E$ladralicot: ViaAaizaci6n;
Moda E....tIatic:o EIiauet.
1"1 .. '
~ ; I t"" I
1~
,'l
Percerd05
1P!ryri25
f'ercentj
f'ercentj
05
25
...
Rango MIKianI MIKianI ~- ....
Error Hpco de la me<ia Percenti 75
D~.tr~
,. ._ ~
278 ESTADrSTICA D ESCRIPTIVA PARA ING ENIERrA AMBI ENTAL CON SPSS
CAPITULO 10 - INSTRU CCIONES EN SPSS
,-,..
'do(dol
''o*"pAL
..
1'"
I
I
Igool
~~".
,---
,.....,...
'ftlOIIDorl.-
.. ... .
". ,::; .:
:
CoIogaoc
..
~
~
--'01
N.tt-._-
Doh - - - - - - - -
te!P ar, .
J
--
..!.I.!.J.!l.:.J d!2J ~ ~
I!IT-::-
_1
_..
+ TIIIIIIIs persofMIIzadas
.60S
-
fGOSJ f~ FGfO
_:15
_15
U
-..
.~
'U
5.1
U
11~
71~
)~
,.,..-
U
..
l.f
,~
,."
emt... _ _ _ . .
~ T'":J
1Isignar._
~--- ...
I ~I ~-
_; a ca5D5
~""""a
oeor_~ . ....
-.....,wIores ...........
GJ
....
v. ........ v... __
-......--- --
);.
;;;;;- ....... ,
~
'.~
- --
r_-
r _ ...._
I \ ' \, " " "
r ................. _
~
I
---,..... - . .-
r _~
".
c-_ _r-
, \ \
...
. ,. x
- - - - C!J ....
r "-P ... tS!I -41
~ JI' .. l
1""- -- ~
~ "'41'1,...-H1 ...
.!J r t.._. _ _ _
--,- 1 "-
;--_oI_ r
r T..... _ _ r ",-""""
.. I ...... ,~n" , c.. I ~
- 1- 1 ... '
Si requiere que en la Tabla cruzada generada por SPSS aparezcan los intervalos
y no las categoras, puede ir al Editor de datos de SPSS, y en la pestaa Vista
de variables (parte inferior derecha del editor) seleccionar las nuevas variables
creadas y asignar etiquetas, como se muestra en la figura.
MnQuno
v.ort'!S ~ ..
Oancha
~
Ningwlo 10 Oancha
Ningwlo Ninguno 8 o...ct..
5 Ninguno Ninguno 8 o.ndwo
- ----- Ningwlo Ninguno 8 Oe\'tCha
MnQuno Ninguno 8 o.ndwo
Tm-~'-
2.OO-~r Ningwlo Ninguno 8 Oincha
lOO-wmr MnQuno Ninguno 8 o...ct..
4,OO-"!!5Il-1~
NInguno Ninguno 8 o.ndwo
Ningwlo Ninguno 8 Oatac:No
MnQuno Ninguno 8 ~
lbIMirico 8 2 Ningwlo Ninguno 8 0IIrec:ha
l'bMnco 8 2 Ningwlo Ninguno 8 o.ndwo
lIbnnco B 2 Inlegrldo CatelNjUo Ninguno B o...ct..
llUnrico B 2 FGAS3 Cllleg Ninguno Ninguno 8 o.ndwo
I'bnrico 8 2 FGHI/D Categ MnQuno Ninguno 8 ~
lbIMirico 8 2 FGH) Categon Ningwlo Ninguno 8 Dancha
tUMnco 8 2 FGAC Categor MnQuno Ninguno 8 Oincha
.1
l<f;~;cediiiii$A\II$"" "" I/IlI""M ',.-------,1 ~ ... __________________
, , - - - - - - - - - - - - - - - - - - - - - - - -, r - - - - - -- -- -----------~
...
"d ..
R..... men
Tablas de contingencia
,_""o CatOS
V'lIdo. PercUdas Total
N Porc.nh', N Porcant. I N Portlntll'.
1nt8lJrada Ctegorlca
.. FOAS3 Coalegorlca 294 I 100,Oc;l, I O I ,0'- mi 100,0'-
11
Grficas en Excel
,-
22 70 11 ....-91 12'.0 7) 16.0 14)) 5) 62
n 70 11-"'..-91 240.0 7" 22.0 17 P 6)) 8,1
!J!r~~-=zt!il1~J ,
PaI<D/ll1.
A B
'- - OO- - FctiA-
;w 191 IIhM91
2!11 192 I I .Ju~91
E ' 192 I I .Ju~91
:BJ 192 1 1 .Ju ~9 1
291 193 12.Ju~9 1
,292 193__ J 2~!,!:91
293 194 13-Ju ~9 1
294 194 13-M91
~ 195 - ""4-PJ?;u~:-';9:;"-1-- -
296 195 14-Ju~9 i
'B1
~
""'"
~ Anal
.....CfNTL :do....'!<3c296)
A B
--------------
O E F
--------
G H
1 DO FECHA INTEGRADA FGAS3 FGAC FGHM] FGH3 FGosa
lf!l 191 l().Jul-91 40.0 47 13.0 6.5 6 .0 7.5
B 192 11.Ju1.91 34.0 3p 9 .4 7p 5p 6.8
2li9 192 11.Jul-91 56 .0 4S 15 .0 9.5 5S 7 .1
200 192 11.Jul-91 55 .0 4J1 17 .0 10.0 5p 62
291 193 12.Jul-91 66 .0 4A 9,6 9S 6p 710
292 193 12.Ju1-91 26 .0 4.0 6,9 7.5 6.0 6p
293 194 13.Jul-91 26.0 4.0 9J1 7S 5p 6,9
294 194 13.Ju1-91 26 .0 4p 9 J1 6Jl 6.2 6 Jl
295 195 U .Jul-91 21.0 4.' 9p 6.7 6J1 7 .1
296 195 1 ~Jul.91 17 41 6 6 6 .2 6,9
m
2!18 736 12.4 21.7 21.2 13.3 16.5
=deS'lllstc3 c296)
3D
..
,~t! _~..,ort.
'( \.J:'!I..Q.. """ ' A L'!I'AI\. .10:. ..... ..... ... ~ "" . c',," dilO. ,.. , ,.:d m".,.... :t&
. """ ' 1'0 .II...L..L ~..:.~ ;;:;t~ , ... _ .. *....If. -iJ. -, "'- ..JI!'
PEMCDfT1L ~ -maxl'c3
~1 .....G2~ _ F
F~ I F~
A B . . . . . . . . E ..
1 DO FEC ...... INTEGRADA FGAS3 FGAC FGH\13
7Hl 191 10.Ju1-91 _ 4il1l - 47 130 8.5 6 7Ji
l1.J-
:~
2BB 192 3,6 94 7 ,6 5 6.0
2BB 192 ll -Ju~91 45 15 9.5 5 71
I :~~~~-r ~t
29D 192 4.8 17 5
291""' 193 44 9 \f- 6
8.2
7A
292 '*1--l. 1~.:-!~'91 26l! 40 6 7:' 6 8.Ii
m 194 13-1u1-91 26l! 4l! 9 7:, 5 6,9
294 194 I 13-Ju1-91 2sl! 4 .6 9.8 8l! 6.2 . 8Jl
295
296.
195
195
l ~ul-91
1 4.Ju~91
;;g 4 .4
41
9.6
8 .6
87
8l!
6.0
62
7.1
6.9
297
29B 73,6 12.4 21.7 21.2 13.3 ~6.5
;.
:rn l _.x 761
<30296)
11.8 18.5 16,0 10,0 I 15.1
'fl Olio cr
....
yi';lI,It.lt ,,ut.e,,1>-:l'J'A
".....
n , ,Q11:J . Jl.. ~ ~ LLII, i& ""J-"1.,.,. -
....- ! -
.
Esot.VMI cnort.e
I
56l! 4.5 '5.0 9 .S S.5
~ 192 l1.JW.Sl 56l! 4 .0 17.0 10l! Sp 92
291 193 1:.,u.91 t 66 l! 44 9.6 9 :' 6.6 7 ,1
~ 193 12-Ju191 2611 411 6)1
193 194 1 ~1 2611 4.0 9 J1
7 .5
7.5
611
Si> t 6.6
6,9
:294 194 lJ..U.91 2611 4.6 9.0 8 Jl 6,2 9Jl
295 195 1~ 21 11 4 .4 . 9~ 81 6 .11 . ~ 7,1
296 195 1 ~1 1711 41 8p 8 Jl 62 6,9
:Hl .
2!18 -. 73,6 12,4 2V 21.2 13,3 16.5 1
=.
:Jl1
,O-Uc"'OII_
tol....
76 1
!BlJl
11 .8
11511
18.5
170l!
16.0
1:JJl!
10.0
81l! !
15.1
141lJl
- .
~1!!Ut.11t:!!~s.:!:"~ ~d~1 (l~r~E) r1flE2.~~~
~~ -
!!!:tl!1.L!!12J. I~~!1~:M!<........ "~'"'>... 7<"'''''''''''''''''' l ,....,
~. ~
><~ ..~ ~
I lit ros
lJ,l c"""',en~ I'I)JIO
..
(OOm!s y .."" ",00
"'
~ L..... coiaidos
IL..... ",dos ejes
~~ I_ k~ n;_
~ L..... sua,;UIdos ....
10,00 ~ r.i"
'CAl' !'CAe
,....
40,(10
f
IIt L..... ycoUmos I
~GP',t;DI ....
~ Logorbn<o
----------=--=..
-'i~e:dl"''' de<do
, OOelHcbporelyslJ/llo
I
~;:::::;;:;:::;;;::;::=;::=~
M
Ci!i!:J~
1- ~ ~.br.. :
M&xino
.....-biedadl$E$300: jH$300
. ruqacb
B6tUo< del ojo de ,atogoas (Xl: [.....-biedadl$f$1 :$1$1
del '"'l\l'ldo ele de catogorios (lI): --; L:III-'
En Datos de origen seale cada una de las series y en Nombre seale la casilla
que contiene el nombre Media y el Mximo; asgnele a cada uno sus Valores
correspondientes y en Rtulos del eje de categoras (x) seale el rango donde se
encuentran los nombres de las variables (pretratamientos).
Rtulos de eje de
Nombre Valores
Categorias (x)
A B o E F G H I
---FECHA- DO INTEGRADA FGAS3 FGAC FGHM3 FGH3 FGDS3
293 13-Jul91 194 28.00 4.60 9.ao 8.00 6.20 8.00
294 14-)ul91 195 21.00 4.40 9.60 8,70 6.ao 7,10
295 U Jul91 195 17 .00 4,10 8,60 8.00 6.20 6,90
29.
297
medll 73,56 12,.5 21,19 13,26 16,1;1
299 m.,uma 5Ill,00 115.00 130,00 81,00 1~,oo
iiif deSVIaClon 76 11 1602 1000 15,11
301
iif 1eo,00
180.00
303
ii- 140.00
120,00
~
305 100,00
iis
307
iia
309
.
&O,()()
SOllO
,()()
20,00
ollO
-+-,",><>no
Con doble dic sobre las barras se desplegar el cuadro de dilogo Formato
de serie de datos ; d un dic en la pestaa Barras de error Y; seleccione en
el subcuadro Presentar>Por exceso y en Personalizada:+ seale el rango
donde se encuentran los valores de la desviacin estndar para las variables
(pretratamientos ).
~~~~d~~~~i~ "d-~~--~t:;~---_~--"'~-~'==>::=::::::=:':' ~I
Tr_
,.f,r-e-s:entar - - - -------=il
rn . [JO
O
AnIb<>s
,cuante a. erNlf
~aIar fijo,
O PQrt:Enta)e'
O t ! e S - _:
O finr tt>;co
[5
15
[1
.:
..
Por "".-. Por doRdo NilQul!>
~ I c:..nc..er
50 ~----------------~----------------------------~ 180
40 150
120
30
90
20
60
10 30
O O
FGAS3 FGAC FGHM3 FGH3
1- Media -+-Mximo I
11.2 Grfico para media, mximo y mnimo
Calcule la media, el mximo y el mnimo para cada variable, como se indic en
el procedimiento anterior. Adicionalmente, calcule la distancia desde la media
hasta el valor mximo y la distancia desde el valor mnimo hasta la media para
cada variable. Para esto debe restar al mximo el valor de la media, este valor ser
el que aparecer en el grfico como el mximo, seguidamente reste a la media el
valor mnimo.
herramientas,
Seleccione el tipo de grfico Lneas como se muestra en la figura, d clic en
Siguiente,
T de Men:
lIi CoUmas
=: a..rrM
~~~........................~.
~ CiraJar
It:Xl'(~)
lIIfII iwas
@ AnIos
*
~~
R.<IdoI
~ lk6bujas
a...... dodoloo,
Series:Wt:
1_
~
oc_
..-....,.. Ji]
- ,.,;,- - - - - -
.....-0_,...,..
c_
&_dolojodo_(X), ~~l : tH.l
!lm!~~!~_,._,'fi
T,_
o~
~
., Mwoda.
0.....-
0 '"'""
--
n_ 1 Qo 1 .... do .... ' 1_"_1 OoW>do"'_
[!JCh]O
I- .
0- ,0 - - Par.allO Pw *'-ID ......
- 1- - 11 , ~ r-c-i::Jt:--"" <~dtti~
g,Iar, I~.=
- =:.:: ~ .... 1- Olelar"'" ~
c:....1
_.
O~:
-. I "P>' OQoMOn-.w,
0 __ E=tI
'-o ~ 1_ [:JI '"
0_ - - : + I-
_1_--
,"
!Si:] 1 .....11.:.- 1
180 ~------------------------~
150 '---~---ir-""""----------- __'"
120 -b-~----~~~~--~------+--i
90 +-~----+-~~~--~----~~ l. Medial
60
30 +--+----~--------~r_---~~
o ~~----~~--..~----~~~
FGAS3 FGAC FGHM3 FGH3 FGDS3
herramientas.
Seleccione el tipo de grfico XY (Dispersin) y el subtipo de grfico Dispersin
con puntos de datos conectados por lneas sin marcadores de datos, como se
muestra en la figura, d un clic en Siguiente; en Rango de datos seleccione el
rango correspondiente a la serie de datos; este rango debe incluir, adems, una
variable que sern los valores del eje X, que para el ejemplo es el da de operacin
(DO), los datos de turbiedad (eje Y) de las variables (pretratamientos) con sus
respectivos nombres. D un clic en Finalizar .
...........,..
,
-......... \, .
.
\
"",..
11 .,. ,~, <Jo J .1 1
t \ .,. ,
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ --1
, ,. - .. 1M ...
180 -
160
140 F GAS3
120
F GAC
100
80 i F GHM
60 I I F GH3
40 111, II I 1 FGDS3
20 - ;.., Aul/\ 1:. .H I 1
o ~J~~"'~
o 50 100 150 200 250
,~__-JA;_-=t~i--'-- ''P1IM''(I'~
(..
4,_
~.'r
~~
\T
VI:.
.........
iijj ':
JI' ~
TF
'"
,-~
.:u.
' IlO
W.
'"
O
fF
..
~
. '--t-
: ';"..1.: o" .~ t _"_'::::~_
I,_:..
n ( ' .., ,.. :ni
ir
...."
llf
.tr
H
~_c;c;;;;7'iV
t-
Para editar el formato de los ejes d doble clic sobre el eje que necesita editar;
para el eje Yen Escala seleccione la opcin Escala logartmica. Para el eje X,
puede cambiar los valores mximo y mnimo del eje; para este ejemplo el da de
operacin mnimo es 50, por lo que podemos escribir en valor mnimo 50 para
que los valores del eje X empiecen en 50 y no en cero.
292 ESTADIsTICA DESCRIPTI VA PARA ING ENI ERIA AMBIEN TAL CON SPSS
CAPiTULO 11 - GRFICAS EN EXCEL
-
~J'!P.!PJI..:.JJ:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~
.
~~~~:.::.=:::::,-f!
~
_:
~dIII ...
........"'.
..... L"""'*-I_IAftocin !
dt v.onas (Y) Aut_
~ Escol.
~doI*de"GOI"CS()O
I ...rte I ""-o I _In I
~
/J M<>mo:
-IrQ: 1:00 . ] Mi:ono.: 250
El tridad ........ :
~::::J ~ UnldodmaJ""' :
~ li*Iod me",, :
SO
I.tidodnUI(J"': 1'0 ] lO
E}6o. vafores(X) /J Ejc de """,.. ('1)
gUli..- !
io I g'\2OM: 150 I
lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4 ...~ i!3 Moltr(l' r~ de trldades: ;.dodesdovisuoliz";';": I ~". .~ _ . rtUode..-.dollos
~~i<o~"-E IJ EsulaPlriab
f'J ..,.,.., Ofden~ D "-"onor_~
r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno (] e cM wkres (Y) cruI!a en VoIbr *'O
"'...... I ca-aIor I I
- 1I C........
I
1~ .-----------------------------------------
100 ~------------------+-------------------
1 +-----~------~--------------r_------------~
50 75 100 125 150 175 200
-
~J'!P.!PJI..:.JJ:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~
.
~~~~:.::.=:::::,-f!
~
_:
~dIII ...
........"'.
..... L"""'*-I_IAftocin !
dt v.onas (Y) Aut_
~ Escol.
~doI*de"GOI"CS()O
I ...rte I ""-o I _In I
~
/J M<>mo:
-IrQ: 1:00 . ] Mi:ono.: 250
El tridad ........ :
~::::J ~ UnldodmaJ""' :
~ li*Iod me",, :
SO
I.tidodnUI(J"': 1'0 ] lO
E}6o. vafores(X) /J Ejc de """,.. ('1)
gUli..- !
io I g'\2OM: 150 I
lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4 ...~ i!3 Moltr(l' r~ de trldades: ;.dodesdovisuoliz";';": I ~". .~ _ . rtUode..-.dollos
~~i<o~"-E IJ EsulaPlriab
f'J ..,.,.., Ofden~ D "-"onor_~
r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno (] e cM wkres (Y) cruI!a en VoIbr *'O
"'...... I ca-aIor I I
- 1I C........
I
1~ .-----------------------------------------
100 ~------------------+-------------------
1 +-----~------~--------------r_------------~
50 75 100 125 150 175 200
Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadsticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html
Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadsticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html