Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadisticasdescriptivaparaingenieraambiental 160430213459 PDF
Estadisticasdescriptivaparaingenieraambiental 160430213459 PDF
~~ NACIONAL
DE COLOMBIA
"~~=~ S E D E P A L M 1R A
FACULTAD DE INGENIERÍA
Y ADMINISTRACIÓN
ESTADíSTICA DESCRIPTIVA PARA
INGENIERíA AMBIENTAL CON SPSS
VIVIANA VARGAS FRANCO
ISBN 978-958-33-9319-3
Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestión del Medio Ambiente de Cali-DAGMA.
Corporación Autónoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira
Agradecimientos
La autora expresa sus más sinceros agradecimientos a las diversas personas e
instituciones que han colaborado en la elaboración de este libro, entre las que se
destacan las siguientes:
Adela Parra Romero. Estadística - Universidad del Valle.
Juan José Castillo. Ingeniero Ambiental- Universidad Nacional de Colombia, Sede
Palmira.
Mauricio Rojas Delgado. Estudiante Ingeniería Agrícola - Universidad Nacional de
Colombia, Sede Palmira.
Natalia Tamayo González. IngenieraAmbiental- Universidad Nacional de Colombia,
Sede Palmira.
Rafael Domínguez Lasso. Ingeniero Agroindustrial - Universidad Nacional de
Colombia, Sede Palmira.
Ricardo Alberto Londoño Saldaña. Ingeniero Agroindustrial - Universidad Nacional
de Colombia, Sede Palmira.
Instituciones
Instituto Cinara de la Universidad del Valle. Santiago de Cali
Departamento Administrativo de Gestión del Medio Ambiente de Cali-DAGMA.
Corporación Autónoma Regional del Valle del Cauca-CVC.
Universidad Nacional de Colombia - Sede Palmira
Contenido
Pág.
Introducción ....................................................................................................
Capítulo 1
Fundamentos de los métodos estadísticos
1.1 Modelos estadísticos............................................... .............. ....... ..... .... 4
1.2 Aspectos generales del método científico............................................. 5
1.3 Los datos como materia prima de los métodos estadísticos .... ... ....... ... 8
1.4 Aspectos relacionados con la calidad del dato..................................... 9
1.5 Conceptos en la aplicación de los métodos estadísticos.. ..................... 11
1.6 Estadística descriptiva vs estadística inferencial.................................. 13
1. 7 Definición de variables ............... ....................... ..... .............................. 14
1. 7.1 Variables cualitativas o categóricas.......... ....... ....... ....... ....... ...... 14
1.7.2 Variables cuantitativas................................................................ 15
1.7.3 Otras clasificaciones................................................................... 17
1.8 Métodos paramétricos y no paramétricos ............................................. 17
1.9 Métodos estadísticos por tipo de variable............................................. 18
1.10 Etapas generales en la construcción de un modelo estadístico ............. 20
Capítulo 2
Medidas descriptivas
2.1 Medidas de tendencia central............ ............ ................ .............. ......... 23
2.1.1 Media.......................................................................................... 24
2.1.2 Mediana...................................................................................... 36
2.1.3 Moda........................................................................................... 38
2.2 Medidas de dispersión .......... .................. ...... ................ ................ ....... 41
2.2.1 Rango....................................................... .................. ................ 41
2.2.2 Desviación media ....................................................................... 42
2.2.3 Varianza...................................................................................... 44
2.2.4 Desviación estándar.... ............................... ............ ......... ............ 46
2.2.5 Coeficiente de variación ...... ....................................................... 48
Capítulo 4
Medidas y gráficas de posición
4.1 Cuartiles................................................................................................ 98
4.2 Deciles .................................................................................................. 103
4.3 Percentiles............................................................................................. 106
4.4 Medidas de dispersión para indicadores de posición............................ 11 O
4.5 Representación gráfica de las medidas de posición .............................. 11 O
4.5.1 Diagramas de cajas y alambres .................................................. 110
4.5.2 Diagrama de tallos y hojas ......................................................... 120
Capítulo 5
Modelos de regresión
5.1 Modelo de regresión lineal simple........................................................ 127
5.2 Supuestos del modelo de regresión lineal simple ................................. 131
5.3 Diagrama de dispersión ........................................................................ 132
5.4 Otros modelos de regresión .................................................................. 136
5.5 Coeficiente de correlación.................................................................... 147
5.6 Coeficiente de determinación ............................................................... 155
Capítulo 6
Planeación estadística en un proyecto de investigación
6.1 Objetivos del proyecto .......................................................................... 159
6.2 Descripción del sistema ........................................................................ 159
6.3 Codificación del sistema........................ ............................................... 161
6.4 Definición de variables, sitios y frecuencia de muestreo ..................... 162
6.5 Formatos de muestreo........................................................................... 164
Capítulo 7
Evaluación de sistemas para tratamiento de agua potable
7.1 Estadísticas descriptivas ..... ..................... .................... ..... .................... 171
7.2 Gráficos de medias, mínimos y máximos............................................. 173
7.3 Histogramas ............................................................................. ... ......... . 180
7.4 Tablas cruzadas..................................................................................... 182
7.5 Gráficos de frecuencias acumuladas ..................................................... 185
7.6 Gráficos de tallos y hojas .... ... ............................ .. ............... ............. ... .. 186
7.7 Percentiles .... ... .... ........ ....... ........... ..... ..... .. ... ... ................ .. ..... ............. .. 190
7.8 Diagrama de cajas y alambres .............................................................. 193
Capítulo 8
Calidad de aire
8.l Gráficos de estadísticas descripti vas.. .... ..... .. .............. ............. ............. 204
8.2 Histogramas ........ .... .. .. ........ ... ....... ... .... ....... .. ........ ...... ... .. ..... ..... .. ........ . 211
8.3 Tablas cruzadas..................................................................................... 214
8.4 Gráficas de frecuencias acumuladas .. ................ ................................... 217
8.5 Percentiles... ........... ............................ .............. .............................. ....... 220
8.6 Contaminación del aire en Ciudad de México ....................... ............... 224
Capítulo 9
Calidad de agua en una fuente superficial
9.l Estadísticas descriptivas ....................................................................... 237
9.2 Presentación gráfica.............................................................................. 239
9.3 Histogramas .......... ......... ......... .... .......................................................... 245
9.4 Tablas cruzadas..................................................................................... 248
9.5 Frecuencias acumuladas ....................................................................... 251
9.6 Percentiles....... .... ................................................. ... .... ....... .......... ......... 252
Capítulo 10
Instrucciones en SPSS
10.1 Ingresando los datos a SPSS .................................................................. 257
10.2 Importando archivos de Excel ....................... ................................. ....... . 259
10.3 Estadísticas descriptivas................................................... ... ..... ............... 263
Capítulo 11
Gráficas en Excel
11.1 Gráfico para la media, desviación estándar y el máximo.... ........ ......... ... 283
11.2 Gráfico para media, máximo y mínimo .... .... ....... .... ... .......... .. ......... ...... . 288
11.3 Gráfico de series de tiempo ............................................................... ...... 291
1
Fundamentos
de los métodos estadísticos
Población
Muestreo probabilístico
MlIestra representativa
X" Xl' XJ'
X 4 , X 5 , ........ X .. ,
X ..+/, X m +l , •••
X/ •••.• Xl'" XJ
........ X p •••• XIV'
X4 •••••• X k +/
Xk+1" •....••..•. X n
Teoría de probabilidad
Los métodos estadísticos están relacionados con el método científico en las etapas
de recolección, organización, presentación y análisis de datos, para la deducción
de conclusiones y la toma de decisiones razonables de acuerdo con los análisis
estadísticos.
PREGUNTAS DE
INVESTIGACIÓN OBJETIVOS HIPÓTESIS
Definir: Definir: ~ Definir los posibles resulta-
• Antecedentes • Objetivo general dos de las preguntas de in-
• Justificación • Objetivos vestigación.
Preguntas a específicos
resolver
t
t MARCO TEÓRICO
Describir teorías y concep-
NUEVAS tos aplicados en la investi-
PREGUNTAS DE gación .
INVESTIGACIÓN
PROCESAMIENTO Y
t ·
ANÁLISIS DE DATOS
Aplicar:
Instrumentos de
recolección de datos.
t
METODOLOGÍA
CONCLUSIONES y · Sistemas de información. Describir el diseño ex-
RECOMENDACIONES
Generar en relación con las ....... ·· Teoría de muestreo.
Estadística descriptiva. ~
perimental, materiales y
métodos para desarrollar
preguntas de investigación
y análisis de datos.
··Inferencia estadística.
Modelos matemáticos.
los objetivos de la inves-
tigación.
o Abstracción vs concreción
o Inducción vs deducción
o Análisis vs síntesis
o Conocimiento heurístico vs científico
No se puede caer en la frase "ricos en datos, pobres en iriformación ". En general los
textos de métodos estadísticos no mencionan o suponen que el proceso de recolección
y calidad del dato es un aspecto conocido por los investigadores o profesionales
que realizan estudios, sin embargo es una de las fases de la experimentación que
generalmente no se planea con el cuidado que se requiere.
La recolección de datos y su posterior análisis no son la finalidad principal de
una investigación o un estudio, es necesario realizar procesos de modelación
matemática y estadística que permitan generar información sobre las preguntas
de la investigación. La información que se genere del proceso de análisis debe
+
DATOS
J ( INFORMACIÓN )
Organización y
digitalización en Teorías y conceptos
bases de datos del fenómeno de
y sistemas de estudio
infonnación
Estadistica descriptiva o
estadlstica deductiva Inferencia estadlstica o
estadlstica Inductiva
Univariada o
multivariada Unlvariada o
1 multivariada
( TEoRÍA DE LA PROBABILIDAD )
1
• Intervalos de confianza.
• Presentación gráfica de datos. • Pruebas de hipótesis.
• Medidas de tendencia central. • Modelos de regresión.
• Medidas de dispersión. • Modelos de diseño de experimentos.
• Modelos de series de tiempo.
• Medidas de posición.
• Distribución de frecuencias. • Análisis multivariado.
• Geoestadística.
• Meta-análisis.
( CLASlFICACIÓN DE VARIABLES)
CUALITATIVAS CUANTITATIVAS
Escala de medición
INTERVALO RAZÓN
del valor de las variables se consideran como etiquetas, pero no poseen el significado
numérico usual, los valores tienen una naturaleza no-métrica, no se puede decir
que una categoría es mejor que otra y la asignación numérica es arbitraria. Algunos
ejemplos de variables cualitativas nominales son : género, raza, profesión, credo
religioso, color de ojos, partidos políticos y estado civil.
Ordinal, se denomina a una variable que genera datos de cualidad y no de cantidad,
los números asignados a las diversas categorías se consideran etiquetas, pero se
genera una relación de orden que se preserva en el sistema numérico. Los números
que se asignan a los atributos deben respetar o conservar el orden de las características
que se miden. El tipo de datos que resulta tiene naturaleza no-métrica. A pesar
del orden jerárquico no es posible obtener valoración numérica lógica entre dos
valores. Algunos ejemplos de variables cualitativas ordinales son: estrato socio-
económico, nivel de satisfacción (acuerdo-total, acuerdo-parcial, desacuerdo-parcial
y desacuerdo-total) y calificación (E-excelente, S-satisfactorio, A-aceptable, D-
deficiente, I-insuficiente).
Las funciones de distribución asociadas a una variable discreta son: uniforme discreta,
Bemoulli, binomial , hypergeométrica, Poisson, geométrica, binomial negativa,
Beta-binomial y logarítmica.
En general las medidas dan origen a datos continuos, mientras que las enumeraciones
o conteos originan datos discretos. Es siempre posible pasar de una escala a otra
menos exigente. Ejemplo: los estudiantes pueden medirse en metros (variable
continua-razón), pero pueden también ordenarse de mayor a menor, convirtiéndose
en una variable ordinal.
los supuestos estadísticos requeridos para las diferentes pruebas, se utilizan los
métodos no paramétricos.
Los métodos utilizados para las variables de tipo cuantitativo (intervalo o razón)
son los métodos paramétricos, los cuales presentan buenos niveles de confiabilidad
en la predicción. En las escalas cualitativas (nominales u ordinales) se utilizan los
métodos estadísticos no paramétricos, que no son tan precisos en su predicción. En
la Tabla 1.1 se presentan las principales características de los métodos paramétricos
y no paramétricos.
Tabla 1.1 Principales características de los métodos paramétricos y no
paramétricos.
2
Medidas descriptivas
armónica
cuadrática
rango medio
ponderada
Mediana
• Moda
Las medidas de centralidad más utilizadas son la media aritmética, mediana y moda.
En algunos textos al cálculo de estas tres medidas se le denomina promedio.
2.1.1 Media
o O O O! O
Si XI' X]' X j , •••••••••••• , X n _ l' X n representan los valores de una variable en una
muestra, entonces la media aritmética se calcula por medio de la ecuación 2.1.
11
Si XI' X]' X J,............, X N _ l ' X N representan los valores de una variable en una
población, entonces la media aritmética se calcula por medio de la ecuación 2.2.
N
f.l
: (es la letra griega minúscula mu): media de un conj unto de datos p rovenientes de una población
N : número de datos de una población
-,
Ventajas Limitaciones
• Es la medida estadística más comúnmente • Es fuertemente afectada por los valores ex·
empleada. tremos, ya sean valores máximos o mínimos
• Es fácil de calcular y entender. Ypor consiguiente puede estar lejos de ser
• Se pueden realizar cálculos algebraicos. una representación de la muestra.
• En su cálculo se incluye cada uno de los • No es conveniente utilizarla en: conjunto
datos de la muestra o la población. de datos demasiado heterogéneos, cuando
los datos sean proporcionales o estén en
• Es un valor único para cada conjunto de
progresión geométrica.
datos.
• Se debe analizar junto con medidas de
• Las unidades son las mismas de la variable
dispersión.
analizada.
• Se debe acompañar por otras medidas de
• La distribución de las medias que se obtienen
tendencia central, tales como la mediana y
de muestreos repetidos de una población se
la moda.
conoce y es de gran utilidad en el proceso de
inferencia. Generalmente es la distribución • Sólo tiene sentido en variables cuantitati·
normal. vas.
¿ X;
Datos primer muestreo: 5; 4; 5; 4; 8; 10,' 9 (UNT) -+ X = ~ = 6,4 (UNT)
7
8
¿X;
Con una muestra adicional: 12 (UNT) -+ X=~= 7,1 (UNT)
8
9
¿X;
Con otra muestra adicional: 150 (UNT) -+ X=~= 23(UNT)
9
10
¿x;
Con otra muestra adicional: 320 (UNT) -+ X=~= 52,7 (UNT)
10
n
· ¿ e = ne donde e es constante y n el número de datos
;=/
n n
• ¿eX;=e¿X;
;=/ ;=/
11
• ¿X=nX
;=/
n n n
• ¿(aX;±bY¡j=a¿X;±b¿Y;
;= / ;=/ ;=/
n
"x.
- . /
• X=~-
¿
-
¿X.=nX
n
I
"
11
;=/ I
I (X¡-xy es mínima.
• Si cada uno de los datos de una variable toma valores constantes (k) , la media
será igual al valor de la constante. En términos algebraicos:
Si X= k , para todo i = 1,2, ..... n, entonces X= k .
• Si cada uno de los datos de una variable es afectado aditivamente (negativamente)
por una constante (k) , la media de la nueva variable es equivalente a sumar
(restar) la constante a la media de la variable original. Enforma algebraica:
Si Y¡ = k ± X¡,para todo i = 1,2, ..... n , entonces Y= k ± X.
• Si cada uno de los datos de una variable es afectado multiplicativamente por
una constante (k) , la media de la nueva variable es equivalente a multiplicar la
constante por la media de la variable original. Enforma algebraica:
Si Y¡ = kX¡ , para todo i = 1, 2, ..... n , entonces Y = kX.
• Si cada uno de los datos de una variable es dividido por una constante (k) ,
entonces la media de la nueva variable es la media de la variable original,
dividida por la constante. Algebraicamente:
X -
Si Y. = -'- , para todo i = 1, 2, ..... n , entonces Y = X
, k k
• Si se genera una variable como la combinación lineal de dos variables, la media
de la nueva variable será la combinación lineal de las medias de las variables
originales. Algebraicamente:
Si Z¡ = aX¡ + bY¡ , para todo i = 1,2, ..... n, entonces Z = aX + bY.
• En general, de todas las medidas utilizadas para calcular la tendencia central
de una población, la media es la menos sujeta a variación debida a cambios en
la muestra.
(2.4)
_1
- -log ( XI' Xl' •••• XII)
n
_1
- - ( log XI + log Xl + ... + log XII)
n
generando la ecuación 2.5.
11
Llog(X/)
/
l og X g= . .---=1'---_ _
. : (2.5)
n
Ventajas Limitaciones
• Es una medida resistente a datos extremos, pero • No es fácil de calcular y para un número considera·
mite detectar en un conjunto muy heterogéneo, ble de datos (n > 150), se presentan limitaciones
una medida de tendencia central confiable. en el programa Excel. En el programa SPSS
• Las unidades de la media geométrica son las no está considerada dentro de las rutinas más
mismas de la variable. comunes.
• Se pueden realizar cálculos algebraicos. • Puede presentar limitaciones en su interpreta·
• En su cálculo se incluye cada uno de los datos de ción.
la muestra. • Cuando existe uno o varios valores de la variable
• Es un valor único para un conjunto de datos. iguales a cero, el valor de la media geométrica
• Es muy útil cuando el conjunto de datos represen· toma automáticamente el valor de cero.
ta aumentos o disminuciones porcentuales. • Sólo se puede calcular cuando la raíz n·ésima
• Se utiliza para promediar valores cuyo crecimiento exista.
sea en progresión geométrica. • Programas como Excel no validan el signo del
producto y siempre que hay valores negativos no
la calcula.
• Sólo tiene sentido en variables de carácter cuan·
titativo.
• El desarrollo algebraico de esta medida puede
tener un grado de complejidad mayor que el
desarrollo de la media aritmética.
La media armónica de un conjunto de datos XI' X 2 , Xl' ............, XII _I' XII
provenientes de una muestra se define como la media de los recíprocos del
conjunto de datos, tal como se presenta en la ecuación 2.7.
1 n
1
I-
11
(2.7)
X
¡=I ¡
n
Siempre que X¡ :; O
N
Siempre que X¡ '* O
La relación entre las medias aritmética, geométrica y armónica se presenta en la
desigualdad 2.9.
X" :5 X g :5 X (2.9)
7,5 (UNT)
320 (UNT)
Es otra medida de tendencia central, que consiste en elevar al cuadrado los valores y
generar la raíz cuadrada de la media aritmética de estos nuevos valores, es poco afectada
por valores extremos, pero presenta pocas ventajas algebraicas y de distribución.
La media cuadrática de un conjunto de datos Xl' X 2 , X 3 , ............ , Xn_l' X n
provenientes de una muestra se define como se presenta en la ecuación 2.10.
-2
X=
¡r;Zx/n
(2.10)
p.
2
=
~~X/ (2.11)
N
p.2 es la notación para la media cuadrática poblacional
~
5; 4; 5; 4; 8; 10; 9 (UNT) -+
¿X/
X 2
= ;=17 = 6,8 (UNT)
Con un dato adicional:
12 (UNT) -+
X2 = [f;
¿X/
;=18 = 7,7 (UNT)
~
150 (UNT) -+
¿X/
X = 2
;=19 = 50,5 (UNT)
Con otro dato adicional:
~
o
320 (UNT) -+
¿X/
X2 =
= 112 (UNT)
;=1
10
El valor de la media cuadrática para turbiedad en el primer muestreo es 6,8
UNT, pero a medida que se adicionan valores extremos el valor de la media
cuadrática aumenta significativamente.
La media cuadrática presenta más variabilidad que la media aritmética. Esta
medida es fuertemente afectada por valores extremos.
El rango medio se define como la media aritmética del valor máximo y el valor
mínimo de un conjunto de datos y se calcula como se presenta en la ecuación
2.12.
X mín +Xmáx
RM = ~~--.:.=- (2.12)
2
Donde X mín es el valor mínimo y X máx es el valor máximo del conjunto de
datos.
(2.13)
X p = 9,7 mg/l
2.1.2 A4ediana
Es la segunda medida más utilizada después de la media aritmética para estimar
el centro de un conjunto de datos. Para hallar la mediana de un conjunto de datos
estos deben ser inicialmente puestos en orden de magnitud, de manera creciente o
decreciente. La mediana es el elemento central del conjunto de datos, es una medida
de posición; hay el mismo número de observaciones a la derecha y a la izquierda
del valor de la mediana.
La mediana divide la distribución de los datos en el punto medio; el 50% de los datos
está por encima de la mediana y el otro 50% está por debajo de la mediana, es decir,
es el valor que divide el conjunto de datos en dos grupos iguales.
X n+l si n es impar
2
Me =ixn+xn (2.14)
- - +1
2 2
si n es par
2
M=
e XN+XN (2.15)
- -+1
] 2
si N espar
2
Ventajas Limitaciones
12 (UNT) -+
M=
e
Xi +
'"
X~ + /= X 4 : X s = 6,5 (UNT)
2.1.3 Moda
Como su nombre lo indica, representa el valor o valores que tienen la mayor
frecuencia en el conjunto de datos; son los valores que más se repiten, ya sean estos
muestrales o poblacionales. En un conjunto de datos puede no existir un valor modal
o existir una o más modas. Cuando hay una moda, el conjunto de datos se denomina
unimodal, en el caso de dos modas se denomina bimodal, en el caso de tres modas se
denomina tri modal y en el caso de más modas se denomina multimodal. La moda
se representa como M o para datos muestrales o poblacionales. En la Tabla 2.4 se
muestran algunas ventajas y limitaciones de la moda.
Ventajas Limitaciones
Los datos del primer muestreo presentan dos modas, es decir, es un conjunto de
datos bimodal; los valores que mayor frecuencia presentan en turbiedad son 4
UNT y 5 UNT A medida que se incorporan datos extremos al conjunto de datos
las modas se mantienen constantes, en este caso específico.
esta rama de la estadística. Una media muestral con seguridad está más cerca de la
media poblacional que la mediana o la moda de la muestra.
La media, la mediana y la moda proporcionan una parte de la descripción del conjunto
de datos. Sin embargo, es necesario definir indicadores que permitan estimar el grado
de variación o dispersión de los datos con relación a las medidas de tendencia central
y del conjunto de datos en general. Estas medidas por sí solas no son suficientes
para analizar y tomar decisiones en relación con un fenómeno en estudio, como se
ilustra en el siguiente ejemplo.
Como se puede apreciar, los datos arrojados por los dos reactores en color real
difieren significativamente, factor que no se puede evidenciar sólo a través del
valor de la media. Por lo tanto, a pesar de ser la media una de las medidas más
utilizadas para resumir y analizar un conjunto de datos, es necesario acompañar
esta medida con otras medidas de centralidad y dispersión, las cuales permitan
estimar el grado de variación del conjunto de datos.
2.2.1 Rango
Es la diferencia entre el valor máximo y el valor mínimo del conjunto de datos.
Mide la longitud en la cual se encuentran los datos, en general a mayor longitud
mayor dispersión de los datos; sin embargo, es necesario analizar la variable y las
unidades en las cuales se está midiendo, con el fin de hacer un análisis adecuado de
esta medida de dispersión.
Ventajas Limitaciones
Si Xl' Xl' X 3 , ............ , X,, _I' X" representan los valores de una variable en
una muestra, entonces la desviación media se calcula por medio de la ecuación
2.17.
"
¿Ix;-xl (2.17)
dm =.:..;=.-:1'----_ _
n
Si XI' Xl' X 3 , •••••••••••• , X N _ I' X N representan los valores de una variable en una
población, entonces la desviación media se calcula por medio de la ecuación
2.18.
N
¿IX;-pl (2.18)
DM = .:. ;=.-:1'------
N
5; 4; 5; 4; 8; 10; 9 (UNT) -+
¿lx;-xl
;= I
dm= =2,2 (UNT)
7
Con un dato adicional: 8
12 (UNT)-+
¿lx;-xl
;=/
dm= =2,6 (UNT)
8
Con otro dato adicional: 9
150 (UNT) -+
¿1x;-xl
;= /
dm= =28,2 (UNT)
9
Con otro dato adicional: 10
320 (UNT)-+
¿Ix;-xl
;=1
dm= = 72,9 (UNT)
10
La desviación media para el primer conjunto de datos toma el valor de 2,2 UNT,
que indica el nivel de dispersión de los datos con relación al valor medio, que es
6,4 UNT Cuando se introducen datos extremos al muestreo, la desviación media
aumenta evidenciando el grado de dispersión del conjunto de datos.
2.2.3 Varianza
Debido a las limitaciones algebraicas que evidencian el rango y la desviación media,
se origina el concepto de varianza, que mide las variaciones del conjunto de datos con
respecto a su media aritmética y se define como la media aritmética de los cuadrados
de las desviaciones de cada dato a la media aritmética. En general, cuanto menor sea
el valor de la varianza, menor es el grado de variación o heterogeneidad del conjunto
de datos con respecto a su media aritmética. Sin embargo, es necesario contextualizar
el análisis de esta medida a la variable y las unidades en que está medida.
S2
~ (x¡-X/ = (X¡-X/+(X -X/+(X -X/+ •••• + (Xn-X/
2 3
n-l n-l
(2.19)
1 ~ (x¡- f.l/ (X¡- f.l/+ (X2 - f.l/+ (X3 - f.l/+ .... + (XN- f.l/
(J = =
N N
0": es la letra griega "sigma" (2.20)
Ventajas limitaciones
• Es de las medidas de variación, la más utili· • Las unidades de esta medida son las uni·
dades de la variable al cuadrado.
zada.
• No es fácil su interpretación debido a sus
• Se pueden realizar cálculos algebraicos. unidades.
• Se debe acompañar de otras medidas de
• Se incluyen todos los datos en su cálculo. dispersión para su análisis.
¿(Xi-Xl
5; 4; 5; 4; 8; 10; 9 (UNT) ~
S= ;gl = 6,3 (UNTl
7-1
Con un dato adicional:
8
12 (UNT) ~
¿ (X/-Xl
S= ;~1 = 9,3 (UNTl
8-1
Con otro dato adicional:
9
¿(X¡-Xl
150 (UNT) ~ s= 1_ _ __
c...;--0
2276,3 (UNTl
9-1
Con otro dato adicional:
10
320 (UNT) ~
¿ (X;-Xl
S = ;-1 = 10844,3 (UNTl
10-1
Como se puede apreciar la varianza genera una idea significativa del grado
de variabilidad de un conjunto de datos, pues a medida que aumenta el grado
de heterogeneidad esta medida aumenta sustancialmente, aunque sus unidades
elevadas al cuadrado limitan fuertemente su interpretación.
• Si cada uno de los datos en análisis se multiplica por una constante, la varianza
resultará multiplicada por la constante al cuadrado. Algebraicamente:
Si 1'; = kXi , para todo i = 1, 2, ..... n, entonces S:= S:.
k
2
• Si se divide por un mismo número a cada uno de los datos en análisis, la varianza
quedará multiplicada por el cuadrado de dicho divisor. En este caso la constante
debe ser diferente de cero. Algebraicamente:
Si Y i = : Xi ' para todo i = 1,2, ..... n, entonces S: = /2 S: ; k,* O
IX;
S2=~-X2
n
2.2.4 Desviación estándar
La forma de superar una de las limitaciones de la varianza, sus unidades al cuadrado,
es a través del uso de la raíz cuadrada, dando origen al concepto de desviación
estándar.
La desviación estándar muestral se define como la raíz cuadrada positiva de la
varianza muestral, tal como se presenta en la ecuación 2.21.
I"
/-1
(Xi-Xl
(2.21)
S=-Vs2=
n-1
La desviación estándar poblacional se define como la raíz cuadrada positiva de
la varianza poblacional, tal como se presenta en la ecuación 2.22.
N
I (Xi-P.)]
u={Gi= i-l (2.22)
N
Ventajas Limitaciones
• Es, junto con la varianza, una de las medidas • Se debe acompañar de otras medidas de
de variación más utilizadas.
dispersión para su análisis.
• Tiene las mismas unidades de la variable
analizada.
• Para su cálculo primero debe calcularse la
• Se pueden realizar cálculos algebraicos.
• Se incluyen todos los datos en su cálculo. varianza.
9-1
=47,7 (UNT)
Para los datos del primer muestreo la desviación estándar es 2,5 UNT, que
indica poca variación entre los datos, es decir, los datos se alejan de la media
(6,4 UNT) en una desviación estándar en 2,5 UNT hacia adelante yen 2,5 UNT
hacia atrás de la media. A medida que el conjunto de datos se vuelve heterogéneo,
la desviación estándar toma valores bastante grandes. Por ejemplo, con todo
el conjunto de datos analizados, el valor de la desviación estándar es 104,1
UNT, lo que significa que los datos se alejan en promedio 104,1 UNT del valor
medio (6,4 UNT).
Ésta es una buena medida del grado de dispersión del conjunto de datos; a
medida que aumenta el grado de variación de los datos esta medida aumenta,
en las mismas unidades de la variable de origen.
(1 (2.24)
CV=¡¡-x 100%
Siempre que JI. "# O
Esta medida es adimensional, sus unidades están dadas en porcentaje, por lo tanto
es un buen indicador de comparación entre dos o más diferentes variables o dos o
más diferentes poblaciones.
De otra forma:
Si S~ O.3X entonces el conjunto de datos es poco variable u homogéneo
con relación a la media.
Si O.3X < S ~ O. 7X entonces el conjunto de datos es variable o heterogéneo con
relación a la media.
Si S>0.7X entonces el conjunto de datos es muy variable o muy
heterogéneo con relación a la media.
Medidas Símbolo
Reactor 1 Reactor 2 I
descriptivas matemático
Media X 10 UPC 10 UPC
.
Mediana Me 10 UPC 2 UPC
Media geométrica Xg 9,9 UPC 3,2 UPC
Moda Mo 10 UPC 2 UPC
Rango R 4 UPC 56 UPC
Varianza SZ 2,7 UPC 2 448 UPC 2
Desviación estándar S 1,6 UPC 21,2 UPC
Coeficiente de variación e.v. 16,3 % 211,7 %
A pesar de tener los mismos promedios en color real, los dos reactores presentan
eficiencias bastante diferentes, tal como se puede evidenciar en las medidas de
dispersión. El rango para el primer reactor es 4 UPC Y para el segundo es 56 UPC,
10 cual evidencia que en los datos del segundo reactor la distancia entre el valor
mínimo y el valor máximo es mucho mayor que la del reactor 1.
La desviación estándar, esto es, el promedio de la distancia de los datos con respecto
a la media, es 1,6 UPC para el primer reactor y 21,2 UPC para el segundo reactor. Es
decir, los datos se alejan de la media en 1,6 UPC para el primer reactor y se alejan
21,2 UPC para el segundo reactor, lo cual permite concluir que existe una mayor
variación en el reactor 2.
El coeficiente de variación es también un buen indicador del grado de variación de
los datos en relación con la media; para el reactor 1 es 16,3% y para el reactor 2 es
211,7%. Un CV=16,3% significa que el conjunto de datos es homogéneo para el caso
del reactor 1; sin embargo, un CV= 211,7% significa gran variación o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
También, las medidas de centralidad, como la mediana, la media geométrica y la
moda, indican el grado de variación de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersión que permiten caracterizar
el fenómeno en estudio. Adicionalmente es necesario estudiar la distribución del
conjunto de datos, tal como se desarrolla en el próximo capítulo.
del reactor 1; sin embargo, un CV= 211,7% significa gran variación o heterogeneidad
en el conjunto de datos, para el caso del reactor 2.
También, las medidas de centralidad, como la mediana, la media geométrica y la
moda, indican el grado de variación de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor 2.
En general las medidas descriptivas permiten resumir adecuadamente un conjunto de
datos en medidas de centralidad y medidas de dispersión que permiten caracterizar
el fenómeno en estudio. Adicionalmente es necesario estudiar la distribución del
conjunto de datos, tal como se desarrolla en el próximo capítulo.
3
Distribución de frecuencias
N¡ =n¡
N] = NI + n} = nI + n]
N3 = N 2 + n 3 = nI + n 2 + n 3
: :
:
N k_¡ =Nk _] + n k _¡ = n¡ + n] + n 3 + ..... + n k _] + n k _1
N k =Nk _¡ + n k = nI + n] + n 3 + ..... + n k _ 1 + n k = n
Por ejemplo, el valor N 4 es el número de datos que tienen valores menores o iguales
aX4 •
En este caso se debe cumplir la desigualdad de la ecuación 3.1.
n,
h,=-lOO%
n
:
n
hk _ ]=~lOO%
n
: :
H k_¡ =Hk_2 + h k_¡ = h¡ + h 2 + h3+ ....• + h k_2 + h k_¡
Hk =Hk_¡+hk=h¡+hz+h; + •.... +hk _¡+hk=l ólOO%
(3.2)
Siguiendo los pasos del 1 al5 se construye la Tabla 3.1, que representa la distribución
de frecuencias para una variable cuantitativa discreta, presentando un buen resumen
del conjunto de datos de la muestra o población estudiada.
Tabla 3.1 Distribución de frecuencias para una variable discreta.
Frecuencia Frecuencia
Valores absoluta Frecuencia relativa
Frecuencia relativa
de la acumulada acumulada 1%1
absoluta
variable ;
n;
;
n; N;=¿n¡ h;=-100% H;=¿h;
X;
;= I n ;-1
Xl nI NI hl Hl
Xz nz Nz hz Hz
Xl n] N] h] H]
: : : : :
: : : : :
: : : :
X k_l nk_l N k_l h k_l H k_1
Xk nk Nk=n hk H k= 100%
k k
Totales ¿n;=n ¿h;=100%
;~1
-- ;=1
--
XII' = (3.3)
;-/
n-l
El valor de h; debe utilizarse sin porcentaje (%), tanto para el cálculo de la media
como de la varianza.
A partir de estas dos medidas se pueden estimar la desviación estándar y el coeficiente
de variación; su conceptualización, interpretación y unidades son similares a las
presentadas en el Capítulo 2.
Y
j
hJ%)
J J Y
ni
2
h¡ nj
h3 n3
h2 n2
hk nk
hk _ 1 1 •
• t nk _ 1
XI X2 X ················X
3 k_1 Xk
Variable X
Figura 3.1 Gráfica de frecuencias absoluta y relativa para una variable discreta.
hK =100%
Y,
H K_ I
H K _]
! o---e
o---e
o---e r
Nk=n
Nk_1
Nk _]
H4 o---e N4
H3 o---e N3
H] o---e N]
H¡ o---e N¡
XI X] X3 X4 X k _] X k _ 1 Xk
Variable X
10 1 1 8,3 8,3
23 2 3 16,7 25,0
47 4 7 33,3 58,3
99 2 9 16,7 75,0
156 2 11 16,7 91,7
232 1 12 8,3 100%
Totales n=12 -- 100% --
h¡(%) ni
33,3 4
16,7 2
~
8,3 1
10 23 47 99 156 232
J
Coliformes IOlales (UFC/m )
HJ%) Ni
100 o o 12
91,7 o o 11
75,0 o o 9
58,3 0----0 7
25,0 0-----0 3
8,3~ 1
10 23 47 99 150 232
Coliformes IOlales (UFC/m J)
¿ n ¡ X¡
2
¿
¡a l
n¡ ( ) ( - 82,2/
S ag = ----11---- => S ag = 68,1 (UFC 1m3)
L=JL (3.6)
K
XI = X o + L; X 2 = Xl + L; :::::; X k- I = X k- 2 + L; X k = X k- I + L
Paso 4: Calcular la marca de clase, que se define como el punto medio de cada
intervalo, y se calcula mediante la ecuación 3.7.
X'I (3.7)
Frecuencia Frecuencia
Número Marca absoluta acu· relativa
Frecuencia Frecuencia
del Intervalo de mulada acumulada
absoluta relativa
intervalo (X;-J,XJ clase ¡ ¡
X' I.
n¡ N¡=¿n¡ h¡=n¡ln (%) H¡=¿h¡
k
¡= / ; =1
1 {Xo,Xti x', n, N, h, H,
:z (X"Xz] X'z nz Nz hz Hz
3 (Xz' X,] X'J nj Nj hj Hj
: : : : : : :
: : : : : : :
k-l (X. _l , X. _ti X'. _, nk _ 1 N. _, h. _, H. _,
k (X. _"X.] x'. n. N.=n h. H.=IOO%
-- Totales -- n -- 100% --
k k
¿n;X/ ¿n;X/ k
;=1 ;-1
X ag = k
= =¿h;X/ (3.8)
; =1
¿ni n
;=1
X ag I100%
IEagl = X-X (3.9)
I
Siempre que X:f:: O
k k
¿nJX/-X"gl ¿nJX¡:"'X"gl k
Sl= .....:/:.....-...:..'----- = /- 1 -::::.'Lh/(x/-x.l (3.10)
"11 (fn,)-l n-l ¡ /-/
/- /
(3.11)
Siempre que S #: O
(3.12)
(3.13)
Siempre que S #: O
En general, se puede decir que los datos están bien agrupados si el error de agrupación
presenta valores menores al 30%, medianamente bien agrupados si éste se encuentra
entre 30% y 70% Yun deficiente agrupamiento para errores mayores a 70%, tal como
se ilustra a continuación:
-2- N1-1
Me:: X I _ 1 + n ni 1(L) (3.14)
[
Donde:
X;-J Límite inferior del intervalo que contiene el valor de la mediana
n Número de observaciones en el conjunto de datos
X; -1 Frecuencia absoluta acumulada hasta el intervalo anterior a la clase que
contiene la mediana
ni Frecuencia absoluta del intervalo donde se encuentra la mediana
H¡-l Frecuencia relativa acumulada hasta el intervalo anterior a la clase que
contiene la mediana (sin porcentaje)
h¡ Frecuencia relativa del intervalo donde se encuentra la mediana (sin
porcentaje)
L Longitud del intervalo donde se encuentra la mediana
.!J
CAPfTULO 3. DISTRIBUCiÓN DE FRECUENCIAS
(3.16)
Donde:
X; - 1 límite inferior del intervalo que contiene el valor de la moda
dI =Ini - ni-! I diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia absoluta del intervalo precedente.
d] = Ini - nj+ 1I diferencia entre la frecuencia absoluta del intervalo modal y la
frecuencia del intervalo siguiente.
L longitud del intervalo donde se encuentra la moda
Si la longitud de los intervalos es igual, se pueden considerar las frecuencias relativas
(sin porcentaje), tal como se presenta a continuación:
h,f") ",
hJ "J
h, "1
h, "1
hk nk
Xo X, Xl XJ •••••••• Xk _ 1 X k
Variable X
Figura 3.5. Histograma, gráfica de los intervalos de clase vs. las frecuencias
absoluta y relativa.
h,(%) n/
hJ
h1
t ~ ! n
3
n1
h'l
hk _ 1
"
~
1 ni
nk _ 1
hk t .. t nk
Variable X
Figura 3.6. Polígono de frecuencias , gráfica de las marcas de clase vs. las
frecuencias relativas y absolutas.
H¡(%)
Variable X
H¡(%) Ni
H J=100% NJ=n
H1 N1
HJ NJ
H4 N4
------e
Xk _ J
Variable X
(b) Ojiva, para valores mayores o iguales
Figura 3.7 Ojiva, gráfica de los intervalos y las frecuencias relativa y absoluta
acumuladas.
HJ%) NI
100% Nk=n
HK_J Nk _ J
HJ NJ
50%
H2 N2
HJ
Xo
/ XJ X2 XJ Xk _ J Xk
NJ
Me = valor de la mediana
Variable X
Análisis para el nivel de presión sonora de la ciudad de Cali durante el día (lPO)
El número de intervalos se estima utilizando la ecuación 3.5:
Tabla 3.4 Muestras del nivel de presión sonora de ruido medida en decibles (dB)
en diferentes estaciones de la ciudad de Cali. (LPD, en el día; LPN,
en la noche).
Esto es, la longitud de cada intervalo será de 4 dB. Considerando que el valor mínimo
es de 50,2 dB, se selecciona el menor entero al valor mínimo como el valor de X o,
es decir:
X o=50dB
A partir del valor mínimo se generan los límites superiores de los intervalos:
Xl = X o + L = 50 + 4 = 54 dB
X 2 = X¡ + L = 54 + 4 = 58 dB
X 3 = X 2 + L = 58 + 4 = 62 dB
X 4 = X3 + L = 62 + 4 = 66 dB
X s = X 4 + L = 66 + 4 = 70 dB
X ó = X s + L = 70 + 4 = 74 dB
X 7 =Xó +L= 74+4= 78dB
Las marcas de clase se construyen como el valor medio de los intervalos de clase:
Xo+X¡ 50+54
X; 2
=
2
=52dB
X¡+X2 54+58
X'=
2 =56dB
2 2
X; Xó +X7 = 74 + 78 = 76dB
2 2
Número de Porcentaje
Número de datos acumulado de
Número Intervalos de Marca acumulados Porcentaje de datos por
de datos por
del ruido por intervalo de datos por intervalo
clasa intervalo
intarvalo (X¡_oX¡) da ruido ruido intervalo de ruido de ruido
k (dB) x.', ni
; h¡=n¡ln(%) ;
1 [50,54] 52 3 3 6 6
2 (54,58] 56 3 6 6 12
3 (58,62] 60 6 12 12 24
4 (62,66] 64 11 23 22 46
5 (66,70] 68 6 29 12 58
6 (70,74] 72 12 41 24 82
7 (74, 78] 76 9 50 18 100
-- Totales --- 50 --- 100% ---
25
~
~
20
.~
ji 15
~
.~
r----1
10
"';:s"
'"
"~
lt., 5
O
50-54 54-58 58-62 62-66 66-70 70-74 74-78
Niveles de ruido LPD (dB)
~ 100
~
i5 90
..s;:s 80
§ 70
g 60
.~ 50
Ji <\)
40
~ 30
.~ 20
<ll
~ la
~ O~I~~-:~~~--~--~~--~--
54 58 62 66 70 74 78
Niveles de ruido LPD (dB)
Figura 3.10 Ojiva para los niveles de ruido en el día para la ciudad de Cali.
-
LP=101og
[1n ~
~10
O,I.LP] (3.17)
Donde:
LP Nivel de presión sonora equivalente.
n Número de mediciones.
LP Nivel de presión.
Es decir, el nivel de presión sonora (LP) no se puede promediar directamente ya que
esta medida se encuentra en escala logarítmica. Es necesario entonces utilizar como
parámetro la ecuación 3.17. Redefiniendo las ecuaciones 3.8 a la 3.16 con base en
la ecuación 3.17 y la información de la Tabla 3.5, se calculan la media, varianza,
desviación estándar, mediana y moda.
• Me""'67.3dB
- , -lEag 1%=167,05-67,31
67,05
%=04%
,
1 [42,47} 44,5 3 3 6 6
4 (57,62) 59,5 7 25 14 50
5 (62,67) 64,5 9 34 18 68
6 (67,72) 69,5 13 47 26 94
-- Totales -- 50 -- 100% --
30
25
~
~
.~ 20
.§
~
15
.~
"s:::
<Il
;os 10
"~
~
5
O
42-4 7 4 7-52 52-5 7 57-62 62-67 67- 72 72- 77
Figura 3.11 Histograma del nivel de presión sonora, ruido, medido en la noche en
la ciudad de Cali.
En la Figura 3.12 se presenta la ojiva, que representa la gráfica de los límites
superiores de clase versus los valores de frecuencia relativa acumulada. Donde se
puede analizar que el 50% de los datos tienen niveles de ruido menores o iguales a
62dB y el 94% niveles menores o iguales a 72dB.
~
~
100
90
.----.
/
~ 80
-S!;:s
¡;; 70
;:s
60
"<:s
.~ 50
.----/
-S!
~ 40
.~
t.J 30
s:::
<\)
;:s 20
t.J
~
c..:; la
O
54 58 62 66 70 74 78
Niveles de ruido LPD (dB)
Figura 3.12 Ojiva para los niveles de ruido en la noche para la ciudad de Cali.
Los valores de la moda y la mediana son menores en las horas de la noche que en las
horas del día. El error de agrupamiento de la moda, en este caso, es mucho mayor
que el presentado para el nivel de ruido en las horas del día.
Basura Basura
Basura por Basura por
Vivienda No. de por vivien· Vivienda No. de por vivien·
habitante habitante
No. habitantas da No. habitantas da
(kg/dial (kg/dial
(kg/dial (kg/dial
1 3 1.70 0,57 20 6 3,93 0,65
2 5 4,51 0,90 21 8 4,06 0,51
3 5 5,14 1,03 22 5 4,29 0,86
4 4 0,95 0,24 23 10 4.71 0,47
5 6 1.73 0,29 24 6 2,59 0,43
6 5 1,08 0,22 25 3 3,87 1,29
7 10 8,55 0,86 26 5 6.75 1,35
8 8 3.73 0,47 27 8 5,83 0.73
9 8 8,87 1,11 28 11 10,65 0,97
10 2 2,72 1,36 29 6 3,72 0,62
11 7 1,01 0,14 30 4 2,18 0,54
12 5 1,80 0,36 31 4 1,97 0,49
13 2 2,26 1,13 32 2 2,09 1,04
14 5 6,39 1,28 33 10 5,00 0,50
15 7 5,43 0.78 34 5 6,44 1,29
16 7 3.71 0,53 35 2 1,14 0,57
17 7 7,86 1.12 36 9 3,39 0,38
18 6 6,67 1,11 37 6 4,12 0,69
19 6 4,44 0.74
Datos Porcentaje
Intervalos de Marca acumulados Porcentaje de acumulado de
Número de Datos por datos por intervalo de
basura por por intervalo de datos por
del clase intervalo basura
vivienda basura intervalo de
intervalo de basura ; ;
(X¡./1X¡j X.', basura
k ni
(kg/día) (kg/día) N;=Ln; h;=n;ln(%) H;=Lh¡(%)
;=1 ¡= I
5 (8,IO] 9 2 36 5A 97,2
-- Totales -- 37 -- 100% --
35
30
~
~
25
.~
.....!:! 20
~
.S! 15
u
~
;:
u 10
~
t:.;
5
I
O I I
0-2 2-4 4-6 6-8 8 -10 10 - 12
Basura por vivienda (kg/día)
100
~ 90
~
~ 80
-Sl;:
t:
70
;:
<.>
~
60
~ 50
]
~ 40
.9 30
<.>
s.::
1\)
;: 20
<.>
J: 10
o
2 4 6 8 la 12
Basura por vivienda (kg/día)
El valor medio de producción de basura por vivienda es 4,2 kg/día, con una
desviación de 2,5 kgldía. La mediana y la moda toman valores de 3,9 kgldía y 3,5
kgldía, respectivamente. En general, las distribuciones de frecuencias presentan una
buena agrupación del conjunto de datos, pues se obtuvieron errores de agrupamiento
relativamente pequeños. El error de agrupamiento de la moda no existe, debido a que
en el conjunto de datos no existe moda, a pesar de que este valor se puede estimar
con la tabla de frecuencias.
Porcentaje
Datos acumulado
Intervalos de Marca acunwlados Porcentaje de
de datos por inter·
Número de Datos por
datos por
basur por por intervalo
del clase intervalo valo de
habitente de basura intervalo de
intervalo de basura 1 basura
k
(X¡./JX,j X'1 basura ¡
(kg/dÚl) ni N¡=Ln¡ hl=n¡ln(%)
(kg/dÚI) 1- / H1=Lh l (%)
i- l
-- Totales -- 37 -- 100% --
30
~ 25
~
~ 20
~
·9
15
~ 10
~ 5
O +------+------r-----~----~r_----~----~----~
1-1,2 1,2 -1,4
Basura por vivienda (kg/día)
100
~ 90
~
.g 80
-Sl;:s
E::
70
;:s
<.;¡
(] 60
(]
.;: 50
~
~ 40
.S!<.;¡ 30
s::
~
;:s 20
"~
~ 10
O
0,2 0,4 0,6 0,8 1 1,2 1,4
Basura por vivienda (Kg/día)
Figura 3.16 Ojiva de producción de basura diaria por habitante para el municipio
de Talaigua (Bolívar) .
A continuación se presentan medidas de centralidad y dispersión para la medición
de basura por habitante en kg/día, estimados a partir de la distribución de
frecuencias.
El valor medio de la producción de basura por habitante es 0,7 kg/día, con una
desviación de 0,3 kg/día. La mediana y la moda toman valores de 0,7 kg/día y 0,5
kg/día, respectivamente. En general, la distribución de frecuencias presenta una
buena agrupación del conjunto de datos, pues se obtuvieron errores de agrupamiento
iguales a cero, excepto para el valor de la moda.
d) En forma de J e) En forma de J
v j) En forma de U
invertida
"
¿(X¡-Xl
1-/
curtosis =k (3.19)
ns4
Donde s es la desviación estándar y n el número de datos en la muestra.
~
k=0,263 k < 0,263 k> 0,263
(a) Mesoeúrtiea: (b) Platieúrtiea: (e) Leptoeúrtiea:
distribución normal distribución achatada distribución apuntada
Figura 3.19 Clasificación del nivel de apuntamiento de una curva a través del
coeficiente de curtosis.
Intervalos para la media. Para una distribución aproximadamente normal se pueden
estimar intervalos con relación a la media y la desviación estándar, como se ilustra
a continuación:
f.I. ± a : contiene aproximadamente el 68% de los datos.
f.I. ± 2a: contiene aproximadamente el 95% de los datos.
I
I
I
I
I
I
I
I
I
I
._0-;
\. )
Y
68%
\. )
Y
95%
\. )
Y
99%
~
Frecuencias
VIfiBbII x
Y, y] Y3 · .. Yk-/ Y,
margina/es de X
nll n,z n'3 n/,k _1 n"k n,.
X, hll h/2 h'3 · .. hlk _ 1 h,.
h"k
n21 n2Z nZ3 nZ,k- 1 nz,' nz.
X2 hZI hzz hZ3
· ..
hU _1 hu hz.
n31 n3Z n33 n3,k_1 nu n3.
X3
h31 h3Z h33
· .. hU _1 hu h3.
En este caso cada frecuencia absoluta, nij' es el número de datos que presentan los
valores Xi y lj, simultáneamente.
Por ejemplo, n]3 es el número de datos que toman los valores X] y Y3' simultáneamente.
n 34 es el número de datos que tienen los valores de X3 y Y4, simultáneamente.
Así mismo se pueden hallar las frecuencias absolutas marginales, que son equivalentes
al análisis de las variables unidimensionales o de una variable independiente de la
otra y se denota por ni. para la variable X y nj . para la variable Y.
Por ejemplo, n 3. es el número de datos que toman el valor de X3 para cualquier valor
de la variable Y y es equivalente a la expresión:
k
n.4 es el número de datos que toma el valor de Y4 para cualquier valor de la variable
X y es equivalente a la expresión:
n. 4+ n 14 + nu+ ...... + n p4 = f
;=1
nu
~n . =n
~ l.
i= /
De forma similar:
De forma similar:
n , (h,J
Y, x, Ix: x ..
II
1( I A,A X,/
x
/
y,
y, /
/ /
7
/
/
'.
/
11
/
/
/
1/
/
/
/
/
y, / / / / / /
~
Frecuencias
Variable X [Yo. V,I IY,.Y 21 IY 2.Y31 · .. (YK.,.YKI
marginales de X
n11 n12 n13 n1K n1.
[X •• Xd h11 h12 h13 · .. h1K h1.
n21 n22 n23 n2K n2.
IX 1• X21
h21 h22 h23 · .. h2k h2.
n31 n32 n33 n3K n3.
IX 2• X31
h31 h32 h33
· .. h3K h3.
Así mismo , se pueden hallar las frecuencias absolutas marginales, que son
equivalentes al análisis de cada una de las variables unidimensionales o de una
variable independiente de la otra y se denota por ni. para la variable X y n.j para la
variable Y.
n 3• = n 31 + nn+ ...... + n 3k = ¿n
j=/
3j
nI. + n].
+.n 3 + ...... + np. = ~
~ n· = n L
i=1
De forma similar:
Por ejemplo, h3' es el porcentaje de datos que toman valores entre ( X 2, X 3] para
cualquier valor de la variable Y. Es equivalente a la siguiente expresión:
k
h.4 es el porcentaje de datos que toman valores entre (Y3' y J para cualquier valor de
la variable X. Es equivalente a la expresión:
De forma similar:
P k
hlJ +hll + h/3 + ...... + h p1 +hp 2 + .... +hpk = ¿¿hij = 1 Ó 100%
i=l j =l
n¡(h)
/ /
/ /
¿:. f- ~
/ /
/ /
V / V /
/ / / /
h
.~
Xl XJ / Xl ....
YI / /
"XI
/ V
I
1/ ,. x
1/ / / /
YJ / 1/ 1/ /
/ / 1/ 1/ V / /
,/ / V / / / /
/ / / / /
4
Medidas y gráficas
de posicion
4.1 Cuartiles
Los cuartiles son los valores que dividen un conjunto de datos que previamente han
sido ordenados en forma creciente, en cuatro partes iguales. Existen tres cuartiles
que se denominan Q/ , Q2 y Q3 y presentan las siguientes características:
Q/ : Es el valor de la variable donde el 25% de los datos es menor que este valor
y el 75% de los datos es mayor que él.
Q2: Es el valor de la variable donde el 50% de los datos es menor y el 50% de
los datos es mayor que este valor. Coincide con el valor de la mediana.
Q3: Es el valor de la variable donde el 75% de los datos es menor que él y el 25%
de los datos es mayor que este valor.
• Entre los valores Q/ y Q3 se encuentra el 50% de los datos.
Entre dos cuartiles consecutivos se encuentra un 25% de los datos, tal como se
observa en la Figura 4.1.
mín. Ql Q2 Q3 máx.
Cuartiles para datos sin agrupar, en este caso se deben ordenar los datos de forma
creciente. El cálculo de los cuartiles se debe realizar considerando diferentes opciones
de acuerdo con el número de datos. Generalmente los textos presentan que el cuartil
.. Xn+Xn
uno, Q¡, se puede calcular como X n + / SI n es Impar o 4 4+ / SI n es par y que
4 2
. . X 3n +X3n .
el cuartll tres, Q3' se puede calcular como X 3 (n +/) SI n es par o 7 7+ / SI n
4 2
es impar, pero estas fórmulas no funcionan en todos los casos. (El lector puede
verificarlo con los ejemplos que se muestran en este capítulo).
Para el cálculo de los cuartiles los datos deben estar ordenados en forma ascendente,
los valores repetidos deben considerarse en el conjunto de datos. Las diferentes
opciones para el cálculo de cuartiles se presentan en las siguientes ecuaciones:
. n+l
S1 --2- es par: (4.2)
(4.3)
Q3 = X3" +J (4.5)
4
X"+X,,
- -+1
Q1= 1 1
• Si n es par: 2 (4.6)
3X"
-+1 +X"
-
Si !!. es par: QI= 4 4 4 O, 75X" + 0,25X" (4.7)
2 -¡+I -¡
(4.8)
es un número par, se utilizan las ecuaciones 4.1,4.2 Y 4.3 para el primero, segundo
y tercer cuartil, respectivamente, tal como se presenta a continuación:
X S +X6
Q/ = 2 0,5Xj + 0,5X6 = 0,5( 152) + 0,5( 155) = 153,5 mg / I
Es decir, el 25% de los datos son menores que 153,5 mg/l y el 75% de los datos
superan este valor en el efluente de DQO en la planta UASB.
Q2=X/ o =191 mg/I
Donde el 50% de los datos son menores que 191 mg/I y el 50% de los datos
supera este valor. Es el valor de la mediana.
X U +X/5
Q3 = 2 = 0,5Xu + 0,5X/5 = 0,5( 257) + 0,5( 260) = 258,5 mg / I
Significa que el 75% de los datos es menor que 258,5 mg/l y e125% de los datos
supera este valor en el efluente de DQO en la planta UASB.
Cuartiles para datos agrupados: En este caso se considera que los datos están
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los cuartiles. Los cuartiles se pueden calcular a través de la ecuación
4.11 si se utilizan las frecuencias relativas, o con la ecuación 4.12 si se utilizan las
frecuencias absolutas.
Q. =x1-/ + (0,25k-H
2 1- / ) (L) (4.11)
Donde:
k : Valor del k-ésimo cuartil a ser calculado (k = 1, 2 Ó 3)_
X¡ _/: Límite inferior del intervalo que contiene el valor cuartiL
n : Número de observaciones.
H¡ - 1: Frecuencia relativa acumulada del intervalo anterior al que contiene el cuartil
(sin porcentaje).
h¡ : Frecuencia relativa del intervalo donde se encuentra el cuartil (sin
porcentaje).
N¡ - 1: Frecuencia absoluta acumulada del intervalo anterior al que contiene el
cuartiL
n¡ : Frecuencia absoluta del intervalo donde se encuentra el cuartiL
Significa que e125% de los datos es menor que 62.2 dB Yel 75% de los datos supera
este valor.
• Segundo cuartil
Se encuentra en el quinto intervalo, considerando que los datos hasta allí son menores
o iguales que 58% y en el cuarto intervalo los datos son menores o iguales al 46%,
según la columna de frecuencia relativa acumulada, presentándose los siguientes
valores:
n = 50; k = 2; X 4 = 66 dB; H 4 = 46% = 0,46; hs = 12% = 0,12; L = 4
Entonces:
Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.
• Tercer cuartil
Se encuentra en el sexto intervalo, pues los datos hasta allí son menores o iguales al
82%, según la columna de frecuencia relativa acumulada. Por lo tanto, se generan
los siguientes valores:
n = 50; k = 3; X s = 70 dB; H s = 58% = 0,58; hó = 24% = 0,24; L = 4
Entonces:
(0,75 - 0,58) (4) = 72,8 dB
Q3 = 70 + 0,24
Significa que el 75% de los datos es menor que 72,8 dB Y e125% de los datos supera
este valor.
4.2 Deciles
Los deciles son los valores que dividen el conjunto de datos, ordenados en forma
creciente, en diez partes iguales. Existen nueve deciles que se denominan DI' D2J ••• ,
D9' Cada decil representa el! 0% del total de los datos y entre dos deciles consecutivos
se encuentra un 10% de los datos, tal como se presenta en la Figura 4.2. El cálculo
de los deciles se puede realizar para variables no agrupadas y variables agrupadas.
X ... si n es par
D=
k ¡ 10
Xk(It+I)
10
si n es impar
(4.13)
Ejemplo 4.3 Para los datos del ejemplo 4.1, sobre la Demanda Química de
Oxígeno (DQO) en el efluente de una planta de tratamiento anaeróbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
110; 126; 135; 145; 152; 155; 160; 181; 191; 191; 200; 208; 216; 257; 260;
312; 315; 320 Y 320 (mg/l).
Se calculan a continuación los deciles del conjunto de datos (n=19):
D s = X s (fI + 1) = X IO = 191 mg / I
10
D 6 = X 6 (fI + 1) = X 12 = 208 mg / I
10
El decil 3, D J , significa que el 30% de los valores es menor que 155 mg/l y el
70% de los datos supera este valor.
El decil5, D s , significa que el 50% de los datos es menor que 191 mg/l y el 50%
de los datos supera este valor.
El decil 9, D 9 , significa que el 90% de los datos es menor que 320 mg/l y el1 0%
de los datos supera este valor.
Deciles para datos agrupados: En este caso se considera que los datos están agrupados
en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre cada
uno de los deciles a estimar. Los deciles se pueden calcular a través de la ecuación
4.14, si se utilizan las frecuencias relativas, o con la ecuación 4.15, si se utilizan las
frecuencias absolutas.
Donde:
k : Valor del k-ésimo decil a ser calculado. (k = 1,2, 3, 4, .... , 9)
X¡ _I : Límite inferior del intervalo que contiene el valor decil.
n : Número de observaciones en el conjunto de datos.
Ejemplo 4.4 Considerando los datos del ejemplo 3.2 y la tabla de distribución
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presión sonora de ruido medido en decibeles (dB), para diferentes estaciones
de la ciudad Santiago de Cali, en el día. Se calculan a continuación los deciles
D¡, DsY D", utilizando la ecuación 4.14.
• Primer decil
Se encuentra en el segundo intervalo, debido a que los datos hasta allí son menores o
iguales al 12%, según la columna de frecuencia relativa acumulada y el primer decil
es el valor que genera el 10% de los datos menores que él. Por lo tanto, se generan
los siguientes valores:
n = 50; k = 1; XI = 54 dB ; HI = 6% = 0,06 ; h } = 12% = 0,12; L = 4
Entonces:
D =X + [0,1(l)-H¡J (L)
I I h
1
Es decir, el 10% de los datos es menor que 55,3 dB Y el 90% de los datos supera
este valor.
• Quinto decil
Se encuentra en el quinto intervalo, debido a que los datos hasta allí son menores
o iguales al 58%, según la columna de frecuencia relativa acumulada y el quinto
decil es el valor que genera el 50% de los datos menores que él. De esta manera se
generan los siguientes valores:
n = 50; k = 5; X 4 = 66 dB; H 4 = 46% = 0,46; h5 = 12% = 0,12; L = 4
Entonces:
Es decir, el 50% de los datos es menor que 67,3 dB Y el 50% de los datos supera
este valor. Coincide con el valor de la mediana.
• Noveno decil
Se encuentra en el séptimo intervalo, pues los datos hasta allí son menores o iguales
al 100%, según la columna de frecuencia relativa acumulada, y el noveno decil es
el valor que genera el 90% de los datos menores que él. Por lo tanto, se generan los
siguientes valores:
n = 50; k = 9; X ó = 74 dB; Hó = 82% = 0,82; h7 = 18% = 0,18; L = 4
Entonces:
Significa que el 90% de los datos es menor que 75,8 dB Yel 10% de los datos supera
este valor.
4.3 Percentiles
Los percentiles son aquellos valores que dividen los datos ordenados de forma
creciente, en cien partes iguales. Existen noventa y nueve percentiles que se denotan
por P¡, P 2 , . . . . . . . oo. , P 99 , donde cada percentil representa el 1% del total de los
datos.
El percentil 1, PI> supera el uno por ciento de los valores y es superado por el 99%
de los datos restantes. El percentil 95, P 95 , supera el 95% de los datos y es superado
por el 5% de los datos. P k : Percentil k-ésimo, es aquel valor de la variable que deja
a su izquierda el k% de la distribución.
Percentiles para datos sin agrupar, en este caso se deben ordenar los
datos en forma creciente. Si se considera el conjunto de datos ordenados
XI' X 2 , X 3 , •••••••••••• X n _ l' X n , los percentiles se pueden calcular a través de la
ecuación 4.16.
x ... si n espar
P=
Ir ¡ lOO
XIr(If+J)
110
si n es impar
(4.16)
Ejemplo 4.5 Para los datos del ejemplo 4.1, sobre la Demanda Química de
Oxígeno (DQO) en el efluente de una planta de tratamiento anaeróbico para
agua residual tipo UASB (Upflow Anaerobic Sludge Blanket):
Se calculan a continuación los percentiles 35, 80 Y 95.
El percentil 35, P35 , significa que el 35% de los valores es menor que 160 mg/l
y el 65% de los datos es mayor que este valor.
El percentil 80, Pao, significa que el 80% de los datos es menor que 312 mg/l y
el 20% es mayor que este valor.
El percentil95, P 95 , significa que el 95% de los datos es menor que 320 mg/l y
el 5% es mayor que este valor.
Percentiles para datos agrupados. En este caso, se considera que los datos están
agrupados en una tabla de frecuencias y se debe ubicar el intervalo donde se encuentre
cada uno de los percentiles a estimar. Los percentiles se pueden calcular a través de
la ecuación 4.17, si se utilizan las frecuencias relativas, o con la ecuación 4.18, si
se utilizan las frecuencias absolutas.
Donde:
k : Valor del k-ésimo percentil a ser calculado. (k = 1,2,3,4,5, 6, 7, .... , 98,99)
n : Número de observaciones.
Ejemplo 4.6 Considerando los datos del ejemplo 3.2 y la tabla de distribución
de frecuencias 4.1, donde se presentan las frecuencias de la variable nivel de
presión sonora de ruido medido en decibeles (dE), para diferentes estaciones
de la ciudad de Santiago de Cali, en el día. Se calculan a continuación los
percentiles 25, 80 Y 95, utilizando la ecuación 4.17.
• Percentil 25
Se encuentra en el cuarto intervalo, debido a que los datos hasta allí son menores
o iguales al 46%, según la columna de frecuencia relativa acumulada y el percentil
25 es el valor que genera el 25% de los datos menores que él, lo cual genera los
siguientes valores:
n = 50; k = 25; X 3= 62 dB; H3 = 24% = 0,24; h4 = 22% = 0,22; L = 4
Entonces:
( 0,25 - 0,24 )
P 15 = 62 + 0,22 ( 4 ) = 62,2 dB
Es decir, el 25% de los datos es menor que 62,2 dB Y el 75% de los datos supera
este valor.
• Percentil 80
Se encuentra en el sexto intervalo, debido a que los datos hasta allí son menores o
iguales al 82%, según la columna de frecuencia relativa acumulada. De esta manera
se generan los siguientes valores:
n = 50; k = 80; X 5 = 70 dB; H5 = 58% = 0,58; h5 = 24% = 0,24; L = 4
Entonces:
( 0,80 - 0,58 )
Pao = 70 + 0,24 ( 4) = 73,7 dB
Es decir, el 80% de los datos es menor que 73,7 dB Y el 20% supera este valor.
• Percentil 95
Se encuentra en el séptimo intervalo, pues los datos hasta allí son menores o iguales
al 100%, según la columna de frecuencia relativa acumulada. De esta manera se
generan los siguientes valores:
n = 50; k = 90; X ó = 74 dB ; Hó = 82% = 0,82; h 7 = 18% = 0,18; L = 4
Entonces:
( 0,95 - 0,82 )
P 95 =74+ 0,18 (4)= 76,9dB
Significa que el 95% de los datos es menor que 76,9 dB Y el 5% supera este valor.
También existen los quintiles que dividen el conjunto de datos en cinco partes iguales;
existen cuatro quintiles que se pueden denominar k l , k], k j Y k".
En teoría, los percentiles 25%, 50% Y 75% son el primero, segundo y tercer cuartil,
respectivamente. Así mismo, los percentiles P/O ' p]O ' PjO, P"o , P so , Póo, P 70, Pao Y
P 90 corresponden a cada uno de los deciles DI ' D] , D j , Do Ds, Dó, D 7 , DaY D 9,
respectivamente. Tal como se presenta a continuación:
PJO = DI ; P10 = Dl ; P30 = Dj Y así sucesivamente hasta P 90 = D9 Y
Sem;rrecorr;do ;nter-cuartil
SRa = QJ- Q¡ (4.22)
2
Diagrama general. Se basa en el valor mínimo, los cuartiles (Q/> Q2 y Q3) y el valor
máximo. Los pasos para construirlo se presentan a continuación:
• Dibujar y marcar un eje de medida horizontal o vertical.
• Construir una caja (rectángulo), con ancho arbitrario (el ancho no tiene
representación estadística alguna), cuyo borde izquierdo (inferior) sea el valor del
primer cuartil y el borde derecho (superior) sea el valor del segundo cuartil.
• Construir una segunda caja a partir del límite derecho (superior) de la primera
caja, hasta el valor del tercer cuartil.
- ",4x.
-Q3
- M. =Qz
-Q¡
mín. Q¡ Qz = M. Q] máx.
I I I
I
-mín.
(a) (b)
Figura 4.3 Diagrama general de cajas y alambres en un eje vertical (a) y un eje
horizontal (b).
• La dispersión está dada tanto por la longitud de la caja, como por la distancia
entre los extremos de los bigotes.
• El sesgo se observa en la desviación que exista entre la línea de la mediana en
relación con el centro de la caja, y también la relación entre las longitudes de los
bigotes.
• Las colas de la distribución se pueden apreciar por la longitud de los bigotes
en cuanto a la altura de la caja, y también por las observaciones que se marcan
explícitamente.
_ : '::lf·¡::I~,·. :l
!(
I
110
I
153,5
I
191
I
258,5
I
320
•
Xmín Q¡ Qz QJ Xmáx
Niveles de DQO (mg/I)
Figura 4.4 Diagrama de cajas y alambres para los datos de DQO en una planta
de tratamiento UASB.
Considerando que en cada cuartil se encuentra e125% de los datos, se puede analizar
que la distribución es asimétrica en relación con la mediana, así mismo, que existe
menor dispersión en el intervalo (153,5; 191) mgll que en el intervalo (191; 258,5)
mgll. El bigote de la izquierda presenta menor longitud que el bigote de la derecha,
evidenciando que por debajo del valor de la mediana; 191 mgll, el conjunto de datos
presenta menor nivel de variación que por encima de este valor.
Diagrama con puntos extremos. En este caso se realizan las cajas como en el caso del
diagrama general, adicionando los límites generados por cercos internos y externos,
utilizando las siguifntes expresiones:
cerco interno inferior ~ QJ-1.5*RlC
cerco interno superior ~ Q3+ 1.5*RlC
cerco externo inferior ~ QJ-3*RlC
cerco externo superior ~ Q3 +3*RlC
-QJ}
_ Ql 50 % de datos
-Q/
- 1,5RlC
o
O Puntos extremos
O
3RIC
*
* Puntos raros u "outliers"
*
~ En. Feb Mlr Abr Jun Jul Al' 5., Oct Nov Die
1994 63,5 70,4 160,5 101 89,5 92,5 100,5 115,3 158,9 99,4 97,8
1995 58,4 78,3 168,9 110 95,6 80.7 115,2 120,3 166,2 103 89.7
1996 60,2 80,1 152,3 108 102 89,6 97,3 109,4 171,3 96,5 80,4
1997 70,2 70,4 156,3 112 98,4 86,9 103,3 110,3 169,2 97,5 86,3
1998 98,2 78,2 159.7 106 90,1 90,6 105,8 114,5 160,5 89,3 94,2
1999 57,3 69,8 148,9 98.7 85,6 79,4 95,4 100,2 149.7 90,1 85,2
2000 68,2 75,6 158,9 112 98,9 88,1 108,4 109,8 168,4 86,3 79,8
2001 59,8 71.2 160,2 105 88,5 83.7 104,2 118,2 170,2 90,4 86,3
2002 68,1 73,2 156.7 110 96,8 91.7 107,9 111,8 165,9 94.7 95,8
RlC= Q3 - QJ = 8,7 mm
200
195.3
182,3
169.2
166,2
160.5
150
147,4
134.4
,......,
'Oª'"
'-'
Q
' (3 100
111 .3
101
!
.....
:&U
90,6
88.1
e
p.,
83,7
73.3
63
50
Julio Octubre
Meses
63,5 70,4 89,5 92,5 97,8 99,4 100,5 101 115,3 158,9
Q2=X6 = 96,8 mm
Precipitación
(mm) o \ 65 ,9
\ 59,8 \ 58,3
\35
\34
\ 09,9
08,2
99,4 96,8
9\ 93,2
65,2
68, \
43 ,\
39,4
1994 2002
Años
Así mismo, se realizó un estudio con más de mil registros de grupos familiares y
se encontró la relación que se presenta en la ecuación 5.1, que permite estimar la
altura media del hijo a partir de la altura del padre.
Altura del hijo =85 (cm) + (0,5)* altura del padre (cm)
y=a+bx (5.1)
Por ejemplo, si el padre mide 2,0 m = 200 cm, entonces se desea estimar la estatura
media de su hijo, es decir, cuánto vale y = ?, para un valor x = 200 cm, reemplazando
en la ecuación 5.1 se obtiene:
y = 85 + 0,5( 200 ) = 185 cm
Entonces, se espera que el hijo mida 185 cm = 1,85 m, es decir alto, pero no tanto
como el padre. El valor tiende a regresar a la media.
Si el padre mide 1,2 m = 120 cm, entonces se desea estimar qué se espera de la
estatura de su hijo:
y = 85 + 0,5( 120 ) = 145 cm
En este caso, se espera que el hijo mida 1,45 m, es decir bajo, pero no tanto como
el padre. El valor tiende a regresar a la media.
Actualmente el término regresión se utiliza para predecir una variable en función de
otra, y no implica que se esté estudiando si se produce una regresión a la media.
El aspecto estadístico de la regresión consiste en lograr una estimación funcional
de la relación entre dos o más variables. En este proceso es necesario identificar
una variable independiente o de respuesta, y, la cual no es controlada en el estudio;
los valores de esta variable dependen de una o más variables independientes o de
regresión, que se denominan x" x], x 3 , •• ••••• , x n. Estas variables independientes o
de regresión no son aleatorias y no tienen propiedades poblacionales.
La variable y puede ser de carácter cuantitativo o dicotómico (aquella que
sólo admite dos categorías que definen opciones o características mutuamente
excluyentes: sí o no). En el primer caso se habla del modelo de regresión lineal y
en el segundo caso del modelo de regresión logística. La diferencia fundamental
entre el modelo de regresión lineal y de regresión logística es que el primero
predice el valor medio de la variable dependiente (y) a partir de una o más variables
independientes; mientras que el segundo permite predecir la proporción de una
Modelo de regralóa
I
I I!I
Simple Múldple
Una variable independiente x Varias variables independientes
Una variable dependiente: y x"xz,···,x"
Una variable dependiente: y
• •
Lineal N o lineal Lineal No lineal
-'"
(a) (b)
Et
Evapotranspiración
Qv
Caudales de entrada Excesos
EMBALSE
dS
Cambio en almacenamiento
P Suministro
Precipitación Q
Infiltración
F
BALANCE: 1 + P = Et + F + Qv + Q + dS
a) Esquema de un modelo determinístico. Balance de agua en un embalse
F.L.A.
Ag Ul1 ,- -.
atl lente
¡....
agua
•• Posibles valores en el
(5.2)
Donde:
Y¡ : Valores de la variable de respuesta o dependiente. Genera un vector fila
T
transpuesto de dimensión (n x 1): [Y¡'Y]'Y3' .......'Ynl
x¡ Valores de la variable independiente. Genera un vector fila transpuesto de
dimensión (n x 1) : [x¡, x]' x 3 , ••••••• , xnl T
}Jo Valor poblacional desconocido, el cual se estima a través del conjunto de datos.
Es el valor de y cuando la variable x toma el valor de O. Punto de corte con el
ejey
}J, Valor poblacional desconocido, el cual se estima a través del conjunto de
datos. Es el valor de la pendiente de la recta.
E¡ Error aleatorio. Genera un vector de dimensión (n x 1) : [E" E], E3 , ....... , Enl T
Modelo poblacional
¡ ...--
. - Estimación de parámetros
y=a+bx Modelo muestral
I'xIy = E (y / x) = E ( Y) = y = a + bx (5.3)
A partir de la ecuación 5.3 los errores se pueden calcular como e¡ = !y¡ - y¡!; es la
diferencia entre el valor muestral y y el valor estimado de la línea de regresión, y.
Existen dos formas de estimar los coeficientes del modelo de regresión (a y b): el
método de los mínimos cuadrados y el método de máxima verosimilitud. El método
de los mínimos cuadrados consiste en estimar los coeficientes de regresión, de tal
forma que se minimicen las distancias de los puntos muestrales a la recta estimada,
como se ilustra en la Figura 5.4. El método de máxima verosimilitud consiste en
hallar un modelo matemático o función de verosimilitud con los datos, de tal forma
que maximice la probabilidad de los parámetros del modelo.
y= a +bx
Variable y
Variable x
ft n ft
Para obtener los mínimos de la ecuación 5.4 se deben encontrar primero las derivadas
parciales con respecto de a y b, tal como se presenta en las ecuaciones 5.5 y 5.6,
respectivamente.
(5.5)
(5.6)
- 2 ¿ (y¡ - a - bx¡i = O
-2 ¿x¡(y,-a-bx,i= O
¿ Y¡ - ¿ a- b ¿ x¡ =O
¿ x¡Y¡- a ¿x¡-b ¿ x/=O
" "
na+b ¿x¡=¿y¡
¡- 1 ¡- I
(5.7)
"
a ¿x;+ b
" x/ = ¿x¡y¡
" ¿
¡- 1 ;- 1 ;- 1
" ""
=;
n (¿x;y¡) - ( LXi)
;
(¿y;)
¡
b (5.8)
" "
n (¿x/) - ( ¿xli
¡ ;
Una vez calculado b se puede despejar de alguna de las ecuaciones del sistema 5.7
el valor de a, generando la ecuación 5.9.
" "
¿y¡- b
---'--1
LXi = _¿YI
_
- -=----1_....:....1-....:....1_
b¿x1
a n =y-bx (5.9)
n n
E {e¡} ro
E {el] O
E { e;} = O => E { e;} = I =
E {en]1 IO
E ( e¡) - N ( o,rl )
El cumplimiento de este supuesto permite realizar inferencias sobre los parámetros
estimados del modelo de regresión.
del conjunto de datos; puntos atípicos u outliers, los cuales se pueden confirmar a
través de las gráficas de cajas y alambres.
Estos diagramas se pueden realizar con relativa facilidad en diferentes programas de
computador. En la Figura 5,5 se presenta el esquema general de un diagrama de dispersión,
el cual representa una gran ayuda en la definición de la ecuación matemática que permita
estimar la tendencia de los datos. Por ejemplo, en la Figura 5,6 se evidencia una tendencia
de los datos a una línea recta, con pendiente positiva y corte en el origen.
••• •
Yi
:
•
.
- •••-+-¡•••••
•~* ~ x
. ••• •
Xi
~
•• •
1200
=
~ 1000
!. •
'" 800
"ª5
~
600
~
::s
'" 400
~'"
-
~
200
O
O 200 400 600 800
Turbiedad (UNT)
Figura 5.6 Diagrama de dispersión entre las variables sólidos suspendidos (y) y
turbiedad (x).
Para hallar los parámetros a y b del modelo de regresión lineal se presenta en la
Tabla 5.1 el cálculo de las operaciones requeridas para su estimación.
Tabla 5.1 Datos de turbiedad y sólidos suspendidos en una estación del río Cauca,
para ser analizados en un modelo de regresión lineal.
.
Sólidos
Número de Turbiedad
observación suspendidos
Fecha (UNT)
(mg/l) Xi * X, x, * y,
i Xi
Yi
1 04·Mar-91 42 71 1764 2982
2 07-Mar·91 72 146 5184 10512
3 11·Mar·91 360 505 129600 181800
4 14-Mar·91 35 61 1225 2135 ;
5 08·Abr·91 65 136 4225 8840
6 11·Abr·91 120 169 14400 20280
7 15·Abr·91 100 190 10000 19000i
8 14·May-91 190 269 36100 51110 I
9 16·May-91 650 978 422500 635700
10 20·May-91 230 394 52900 90620
11 23·May-91 105 176 11025 18480
12 27-May-91 75 120 5625 9000
13 30·May-91 69 99 4761 6831
Sólidos
Número de Turbiedad
observación Suspendidos
Fecha (UNT) x¡*x¡ X¡*Yi
(mgfl)
i x¡
y¡
14 04·Jun·91 125 133 15625 16625
15 06·Jun·91 85 140 7225 11900
16 11·Jun·91 32 53 1024 1696
17 13·Jun·91 34 54 1156 1836
18 17·Jun-91 85 123 7225 10455
19 24-Jun·91 450 568 202500 255600
20 02·Jul·91 51 84 2601 4284
21 04-Jul·91 37 73 1369 2701
22 11·Jul-91 62 84 3844 5208
21
¿=suma 3074 4626 941878 1367595
;=/
Utilizando los resultados de la Tabla 5.1 y las ecuaciones 5.8 y 5.9 se tienen los
siguientes resultados para los coeficientes de regresión a y b.
Inversa y
.PI
=.Po + -+8
x
Continúa en la página siguiente
Los modelos lineales son útiles en muchas situaciones, y aunque la relación entre
la variable de respuesta y las variables regresoras no sea lineal, en muchos casos
la relación es "linealizable" en el sentido de que haciendo transformaciones con
logaritmos o funciones inversas en la variable de respuesta y/o algunas variables
regresoras, la relación se convierte en lineal. Sin embargo, existen situaciones
donde una relación no lineal no es factible su linealización. En este último caso se
denomina modelo de regresión no lineal (El estudio de un modelo de regresión no
lineal es muy extenso y complejo, pero existe una amplia literatura sobre el tema).
En la Tabla 5.3 se presentan ejemplos de modelos no lineales y su transformación a
modelos lineales en los parámetros y variables de regresión.
Tabla 5.3 Modelos de regresión no lineales y su transformación a modelos de
regresión lineales.
Funci6n Modelo no lineal Modelo transformado a lineal
1 1
Hipérbola 1 y= +8 -=fl
y o+fl¡ X+8
flo+ fl1x
x 1 fl¡
Hipérbola 2 y= +8 y=flo--X+ 8
flox-fl¡
1
Raíz y =fJofJ~+ & Iny=lnfJo+-X Infl¡+&
1
logística 1 Y = fJ fJ; + & In y = -lnfJo -x InfJ¡+ &
o
Gamma o
especial de Hoerl y =fJOeP1XxP' + & In y = InfJo + fl¡x + fJ]ln x + &
Gauss y =fJo eP¡{X -fJ,/ + & ; fJ¡ < O Iny = InfJo + fJ¡ (x-fJ]l + &
1 1
Especial 2 Y =fJo+fJ¡e- x +&
n n
y=po+p/lnx+e poblacional na+b ¿Inx¡= ¿y¡
¡- / ¡- /
n n n
y=a+blnx mues/ral a ¿Inx¡+b ¿(lnxl/= ¿y¡lnx¡
;- 1 ¡- l ¡- J
n n
Y = PoxtI'+ e
lny = InPo +p¡lnx +e
} poblacional n In a + b ¿ In x¡ = ¿
;- / ;- /
In y¡
n n n
n n
y =Po efl,x+ e
Iny=lnPo+p¡x+e } poblacional n In a + b ¿x¡ =
;- /
¿
i=I
Iny¡
n n n
n 1 n
y=Po+ p¡ +e poblacional na+b ¿-=¿y¡
x ¡_ I Xi ¡_ I
n 1 n 1 n y.
b
y=a+ -x mues/ral a¿-+b¿-=¿~
;_1 X¡ 1_ / xi ¡_ I x¡
Y =Pop/'+ e
1 } poblacional n In a + In b ¿ -x¡1 = ¿
n
¡_ / ¡_ /
n
In y¡
Iny = In Po +-X Inp¡+e
n 1 n 1 n Iny .
1 Ina¿-+b¿2=¿-'
Iny=lna+ -X Inb mues/ral ¡ _ / x¡ 1_ / XI ¡_ / x¡
n n n
na +b ¿xl+c ¿x/= ¿y¡
;- / i=I i- J
y=Po+P¡X+P2r +e poblacional n n n n
a ¿x¡+b ¿x/+c ¿x; = ¿x¡y¡
;- / ¡- I ¡=/ ;=/
y=a+bx+d mues/ral n n n n
a ¿x:+ b ¿x/+ C ¿x/ =
;- / ;- / ¡- I
¿
; ""' 1
X¡2y¡
na+b ix,'h+eix,=iy,
¡- I 1- 1 ¡- 1
y = flo + fl¡x'h + fllX + e poblaeional
a ix,'h+bix,+e ix~=ix:y,
/- / /- / /- / ;- /
y=a+bx'h + ex muestral
a ix,+bix~+e i x / = ix/y/
/- / /- / /- 1 ¡- I
- fl2 +e ;fl¡< O }
Y 1 +efl·+fl,x poblacional n n e
na + b ¿ x¡ =¿ In ( - - 1 )
In (L
y
-1 )=flo+fl¡x+e ¡- ¡ /- ¡ y¡
,. " ,. e
a ¿x¡+b ¿x/= ¿x¡ln (- -1)
e ¡- / /- / /- / y¡
In(--1)=ax+b muestral
y
n n
y =fl o efl,(x- fl ,/ + e,°fl¡<O } n In a + b ¿ (x¡ - e/ = ¿ In y¡
/- / ¡- /
Iny=lnflo+fl/(x-fll/ +e poblacional
Ejemplo 5.2 Calcular el modelo potencial y =flo X fJ1 + e para estimar niveles
de sólidos suspendidos a partir de valores de turbiedad, en una estación de
monitoreo del río Cauca, con los datos presentados en el ejemplo 5.1. Con el
fin de seguir los procedimientos para estimar los coeficientes de regresión de
la línea recta, se debe linealizar la ecuación potencial aplicando logaritmo
natural, generando la ecuación 5.11, que es lineal en los parámetros de
regresiónfloY fll '
.,
7
7
•
~
:;¡;
.
1::
~
6
:oc 6
''""
~
:::: 5
.~
'"
~ 5
~
....¡
4
3
3 4 4 5 5 6 6 7 7
LN de turbiedad
Hallando las derivadas parciales con respecto a cada uno de los parámetros a estimar,
se obtienen las ecuaciones 5.13 y 5.14.
oLe: n
~ =- 2
ob
¿ In x¡ ( In Y¡ -In a - b In x¡)
¡=1
(5.14)
n In a + b ¿ In x¡ = ¿ In y¡
1-1 1-1
n n n (5.15)
In a ~)nx¡+b ¿(Inx,l=
¡-1 ¡-1
¿
¡-1
Inx¡ Iny,
Con el fin de calcular las diversas sumas que se requieren para la estimación de
los coeficientes, se presentan en la Tabla 5.5 los datos que permiten reemplazar las
ecuaciones normales del modelo potencial, para el ejemplo 5.2.
Tabla 5.5. Valores que permiten estimar el sistema de ecuaciones normales del
modelo potencial y =/Jo xP 1 + e
Sólidos In
turbiedad
suspendidos In Un tur)x Un tur)x
Observación (sólidos
fecha (x¡} (turbiedad) (lntur) Un sólidos)
i (y¡} suspendidos)
(UNT) ( lnx¡} (lnx;/ (lnx,lny¡)
(mgll) ( lny,)
1 04·Mar·91 42 71 3.74 4,26 13,97 15,93
2 07·Mar-91 72 146 4,28 4,98 18,29 21,31
3 ll -Mar-91 360 505 5,89 6,22 34,65 36,64
4 14-Mar-91 35 61 3,56 4,11 12,64 14,62
5 08-Abr-91 65 136 4,17 4,91 17,43 20,51
6 ll-Abr-91 120 169 4.79 5,13 22,92 24,56
7 15-Abr-91 100 190 4,61 5,25 21,21 24,16
8 14-May-91 190 269 5,25 5,59 27,53 29,36
22 In a + 99,88 b = 109,98
99,88 In a + 468,47 b = 513,09
b = 0,917814 Y In a = 0,8322
a =2,2984
Por lo tanto el modelo de regresión queda definido por la ecuación 5.16 ó 5.17.
, I
I
I ~ I ,
•t It
I
••
1-....¡
t t
I
I
I
• c-;.",.... I
I
I
••
I
v.- I
1M
I
-.----------------------------- • I
Jl
tic
61.
7 7
6>'
x x
116 116
y y
/1
6
y=ax 6 /1
--_-:y=ax
x 1 x
y b>O y b<O
y =a +blnx
y=a +blnx
X
X
, ,
,-u"" ,-_""
l:
b<'
x x
y
1
y (a + be-X)
l/a 1- - - - 1- - - - - - - - :.::.;:..::.::- - - - -
o x
~
,,
y=a + be-x
a--r---------------------+ a
x x
n n
¿(x¡-x)(y¡-y) ¿(xi-xl
¡- / ¡-/
r= =b (5.18)
n n n
¿(xi-xl ¿(y¡-il ¿(y¡-il
¡-/ ¡-/ ¡-1
(5.19)
y y
r<'
6<'
x x
•
•
a) b)
y y
•
•
• •
• r 'Z O •
• l •
.
• r -:: :, O
-=----.x
• • I •
•• x
•
•
•
t
a) b)
y
r=:.1
y
r =:. -1
y.
r=-1
a) b)
t No hay
j
Correlación correlación Correlación
negati va positi va
perfecta perfecta
Correlación negativa Correlación positiva
~ ~
Igual valor de r
/
...
Igual valor de r
¿(xi-xl 512356,36
r=b ;=1 = 1,40765* 1035004,36 = 0,99 o r = 99%
n
~:rY;-YY
;=1
Turbiedad Sólidos
Observación
IUNT) suspendidos Irng/ll (xi-xl (Y/-yi
i
Xi Yi
1 42 71 9549,20 19396,13
2 72 146 4586,00 4130,63
3 360 505 48523,28 86865.77
4 35 61 10966,28 22281,53
5 65 136 5583.08 5516,03
6 120 169 388,88 1703.21
7 100 190 1577,68 410.87
8 190 269 2528,08 3449,21
9 650 978 260385.68 589409,35
10 230 394 8150.48 33756.71
11 105 176 1205.48 1174.43
12 75 120 4188.68 8148,67
13 69 99 5001.32 12381.01
14 125 133 216.68 5970.65
15 85 140 2994,28 4937.87
Continúa en la página siguiente
Turbiedad Sólidos
Observeción
(UNT) suspendidos (mg/l) (x¡-xl (Y¡-yl
i
XI YI
16 32 53 11603,60 24733.85
17 34 54 11176,72 24420.31
18 85 123 2994,28 7616.05
19 450 568 96273.68 127970,75
20 51 84 7871.24 15944,11
21 37 73 10551,40 18843,05
22 62 84 6040,40 15944.11
22
¿=suma 3074 4626 512356.36 1035004.36
¡- 1
"
¿( In x¡-In xl
15,06
¡- I
r=b - - - - - - - =0,917814 * - - - = 0,98 o r = 98%
n 13,11
¿(lny¡-Inyl
¡- I
(5.20)
Modelo Tipo r K
ss = 13,5856 + 1,40765 * TU Lineal 0,99039 0,98087
Coeficiente de no determinación
A partir del coeficiente de determinación, se puede definir el coeficiente de no
determinación, el cual mide la proporción de la variación total de y, que no es
explicada por la variación de x y se calcula como 1 - R 2 . Por ejemplo, para un valor
de r = 0.8, el valor del coeficiente de determinación es R 2 = 0,64 o 64%, el coeficiente
de no determinación es 1- R 2 = 0,36 o 36%, es decir, e136% de la variación de y no
se debe a la variación de la variable x.
Algunos aspectos para definir el modelo de regresión
A continuación se presentan algunos aspectos a considerar en la estimación de un
modelo de regresión.
• Analizar el grado de causa-efecto entre las variables a correlacionar. Si se sabe
el comportamiento del fenómeno en términos de su ecuación diferencial, como
por ejemplo, si el crecimiento de y por cada unidad de x es constante, es decir:
6
Planeación estadística
en un proyecto
de investigación
Figura 6.1 Esquema general de una planta de tratamiento con tecnología FiME.
(Galvis, 1999).
Filtro Grueso Dinámico (FGDi). Consiste en una estructura que consta de una capa
de grava fina del orden de 0,2m-0,3m de profundidad. El agua que entra en la unidad
fluye sobre la capa fina de grava y parte de ella drena, a través del lecho, hacia una
tubería perforada y continua hacia la siguiente etapa en el sistema de tratamiento. La
velocidad de operación de estas unidades puede estar entre 1,0 m/h y 9,0 m/h.
Filtro Grueso Ascendente en Serie (FGAS). Consiste en tres estructuras, de 1,2 m a
1,5 m de altura, encontrándose en cada una determinado tamaño de grava. La grava
se coloca de gruesa a fina. El agua atraviesa las tres estructuras, desde la grava gruesa
hasta la grava más fina, con flujo ascendente. La velocidad de operación es del orden
de 0,3 m/h a 3,0 m/h.
FLA 1
-t.4 ~
FLA2
-2.2 ~
FLA3
~uenteO.1
deagua ~~[B~:]uP~~~~~ 3.4 ~
FLA4
-4.4 ~
FLA 5
-5.4 ~
Filtración Gruesa Descendente en serie 3 Etapas (FGDS3)
Filtro Grueso Ascendente en Capas (FGAC). Consiste en una sola estructura, de 1,2 m
a 1,5 m de altura, en la cual la grava se encuentra instalada por capas, quedando en
el fondo el material grueso y en la superficie el material fino. La grava se coloca de
gruesa a fina. El agua atraviesa la estructura desde la grava gruesa hasta la grava
más fina, con flujo ascendente. La velocidad de operación es del orden de 0,3 m/h
a 3,0 m/h.
Filtro Grueso Horizontal (FGH). Consiste en una estructura rectangular, compuesta
de tres capas de grava las cuales van de gruesa a fina. El flujo del agua va en sentido
horizontal. La velocidad de operación es del orden de 0,3 m/h a 3,0 m/h.
Los sitios de muestreo están relacionados con los objetivos de la investigación así
como de las necesidades de evaluar y comparar el sistema integralmente. En la Tabla
6.3 se presenta la frecuencia de muestreo para cada una de las variables a analizar en
esta investigación. Las frecuencias y puntos de muestreo se definieron de acuerdo
con la experiencia de los investigadores, los cuales consideraron la importancia de
las variables, los objetivos y el presupuesto disponible del proyecto de investigación.
En otros casos, se utiliza la teoría estadística del muestreo para estimar el número de
muestras requerido en cada variable, considerando niveles de error, confiabilidad,
variabilidad y recursos.
Tabla 6.3 Frecuencia y puntos de muestreo para análisis de calidad de agua en
el proyecto de investigación.
Temperatura (OC) 4d 4d
Laboratorio Dirección
flsico-gulmico del
proyecto
Comité de
Toma de
Análisis de
muestras y
reporte de
datos
1-----
Área de in¡:enierla
seguimiento y
control de
proyectos Cinara
muestras
Responsable del
proyecto
Laboratorio
microbioló¡:ico Información
técnica y socio
Análisis de económica
Área de
muestras y información ~
reporte de datos sistemas
Base de datos
Análisis estadístico
Proyecto Integrado de Investigación y Demostración de Métodos de Pretratamiento para Sistemas de Abastecimiento de Agua. <
~
:Il
Fecha: G)
~
~
(j)
LINEA 1 LINEA 2 LINEA 3 LINEA 4 LINEAS "TI
:Il
FGASl FGAS2 FGAS3 FLAl FGAC FLA2 FGHMl FGHM2 FGHM3 FLA3 FGHl FGH2 FGH3 FLA4 FGDSl FGDS2 FGDS3 FLAS ~
Z
()
Variable 1.1 1.2 1.3 1.4 2.1 2.2 3.1 3.2 3.3 3.4 4.1 4.2 4.3 4.4 5.1 5.2 5.3 5.4 o
Hora
Turbiedad (UNTl
Color real (UPC)
pH (Unidades)
m
(j)
Alcalinidad
~ (l11li/1 CaCo3)
o
¡¡¡ Dureza total (mgJI CaCo3)
-i
Oxígeno disuelto (l11li/11
~
O Sólidos suspendidos (l11li/11
m
(j)
() Estabilidad en suspensión
:Il (an/h)
~ Sólidos sedimentables
~ (mI/h)
~
:Il 000 (l11li/11
~
~atura(OC)
Z
G)
m Estreptococos fecales
Z
;Ti (UFC/lOOmI)
:Il
i> CoIiformes fecales
~ (UFC/1OOmI)
;::
!!1 Pérdida de carga (an)
m
Z Caudal II/s)
~
r Filtrabilidad (mI/3nin)
()
O r....,(dias)
Z - - - - - ---- -- - --- ---
Ul
"tl
Ul
Ul Observaciones:
CAPrTULO 6 - PLANEACIÓN ESTADrSTICA DE UN PROYECTO DE INVESTIGACiÓN
l. CRUDA
2. ACONDICIONADA
L-J:I l FGD¡-A
FGD¡-B
- -
FGD¡ -C
---J
[ FGAS 1
3. INTEGRADA
FGAS2
FGAS3
FGHM 1
I I FGHM3
FGHI
FGH2
~~ FGH3
[
=-ti
FLA I l I
FGDSI
F0002
FGDS 3
5. FILTROS LENTOS
EN ARENA H-.[ FLA2 l
[ FLA3 l
[ FLA4 l
( FLA5 l
Figura 6.4 Esquema de la base de datos del proyecto de investigación.
7
Evaluación de sistemas para
tratamiento de agua potable
• Turbiedad
La siguiente tabla presenta los resultados del programa estadístico SPSS en el cálculo
de algunas estadísticas descriptivas.
Estadísticas descriptivas para turbiedad (UNT)
Los filtros con menores efluentes promedios son el FGAS3 y el FGH3, estos
presentan un menor valor en la desviación estándar y el rango, que significa una
mayor concentración de los datos alrededor del valor medio, seguidos del FGDS.
Por el contrario, los filtros que presentan mayores valores en los efluentes son el
FGHM3 y el FGAC, con valores de dispersión y rango más elevados, mostrando
una mayor dispersión en relación con el valor medio efluente.
Las estadísticas descriptivas para la remoción de turbiedad se observan en la siguiente
tabla:
Estadísticas descriptivas para remoción de turbiedad (%)
REMFAGS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS
Media 80,3 66,2 65,1 77,5 73,6
Mediana 80,8 66,6 65,3 78,6 74,3
Moda 80,0 70,0 50,0 80,0 60,0
Varianza 82,5 127,0 194,6 103,0 124,9
Desviación típica 9,1 11,3 13,9 10,1 11,2
Rango ordinal 45.4 59.4 82,1 50,8 71,5
N total 294 294 294 294 294
Se puede analizar que los filtros con mayor eficiencia en la remoción de turbiedad son
el FGAS3 y el FGH3, los de menor eficiencia son el FGAC y el FGHM3, generando
los dos primeros menor variación en cuanto al valor medio que los dos últimos. En
la remoción de turbiedad la distribución del FGAS es muy simétrica, considerando
que los valores de la media, la mediana y la moda son muy similares. El filtro que
presenta menor simetría es el FGHM3.
• Coliformes fecales
Las estadísticas descriptivas para coliformes fecales se presentan en la siguiente
tabla:
Estadísticas descriptivas para coliformes fecales (UFC/100 mI)
INTEGRAD FGAS3 FGAC FGHM3 FGH3 FGDS
Media 24758 65 369 929 182 147
Mediana 13200 35 260 867 141 80
Moda 12900 12 10 1600 110 50
Varianza 992226516 8287 150381 525016 18199 26053
Desviación típica 31500 91 388 725 135 161
Rango ordinal 155000 389 1790 3807 618 760
N total 31 31 31 31 31 31
Al igual que en turbiedad, los filtros con menores efluentes son el FGAS3, el FGDS
y el FGH3, similarmente con los menores valores de dispersión. Los filtros con
mayores efluentes en coliformes fecales son el FGAC y el FGHM3, así mismo, con
los mayores valores de dispersión.
A continuación se presentan las estadísticas descriptivas para la remoción de
coliformes fecales.
Estadísticas descriptivas para remoción de coliformes fecales(%)
REMFGAS3 REMFGAC REMFGHM3 REMFGH3 REMFGDS
Media 99 98 93 99 99
Mediana 100 98 96 99 99
Moda 100 99 76 99 91
Varianza 1 3 39 3 4
Desviación típica 1 2 6 2 2
Rango ordinal 6 8 24 9 9
N total 31 31 31 31 31
• Turbiedad
La siguiente gráfica muestra los valores medios de los efluentes de los filtros gruesos,
la desviación estándar y el valor máximo.
so .ID
~
. .-._--........ '. '10
~
~
~ >201
ro
~
'00
80 i
t
! 20
~ 60 .1
i:1; ,o 40 ~
,o
,GAS, 'GAC fGHM3 FGH3 FGDS3
Medi. _ _ _ MlÚimo
'. 1111
1'. : '00
ID
I ~
:i l60
~
60 1l
~ 40
40
~
~
~
.'"
1 20 20
;
~
):
~
Media _ _ _ Máximo
1+-----~--~~--~----~----_r----~----~~
50 70 90 1 lO 130 150 170 190
Día de operación
---FGAS3 - - - FGAC
30 +-----~----r_----r_----r_--~~--~----~~
110
roo
~
150
lZ0 i""
-- -
J-e 90
60
r-'
~
30
~
O
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ M edia
,to
~100 1""
J 80
1~
60
,~ 40
.~ '-
S
=c:
20
o
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
• Co/iformes fecales
El siguiente gráfico muestra los valores: medio, desviación estándar y valor máximo
del efluente de los filtros gruesos en coliformes fecales.
,
I
...
~
~
1000
100
lO
~
120
---
r-
-- -
-=- --
--......
-- 100 I
@
1- f- - - 1------ 80
.
_. ~
f- i- f-- ~.
- f--
60 1
r-- 1- - - f-- 40 ..
~
f-- r-- t- - t- 1- 20 .i
~
o o
FGAS3 FGAC FGHM3 FGH3 FGDS3
c:=::::J Media ____ Máximo
10000
1 1000
~
e. 100
I
~
a 10
110~i--~~~~~~~--~------~---------------'
:;¡.
~1001 ~. ~
............... «;;j'*'f' cc:::::::: ::;::w
tI 90 I '1 .¡
,
t~
i
~
80 I
---~,L\t------------------------~
\} \1
____
70+1----~----~----r_--~__--~----~----~~
SO 70 90 110 130 150 170 190
Dla de operación
- - - FGAS3 ---FGAC - - - FGHM3
El siguiente gráfico ilustra los valores mínimo, máximo y media de los efluentes de
los filtros gruesos en coliformes fecales.
10VV'
....
:-
000 ;;.;.;-
...
~:-
~
L.... ~ ~
100 ~
L....
10
-
1
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
110
1 t .~
~
1
70
FGAS3 FGAC FGHM3 FGH3 FGDS3
+ Media
7.3 Histogramas
Las gráficas de histograma penniten visualizar la fonna de la distribución del conjunto
de datos, la cual se puede comparar con distribuciones teóricas establecidas. Para
variables discretas las distribuciones a comparar pueden ser binomial, poisson,
geométrica e hipergeométrica, entre otras. En una variable continua las distribuciones
a comparar pueden ser unifonne, t-student, nonnal, chi-cuadrado, entre otras.
A continuación, se presentan, para algunos filtros gruesos, los histogramas de turbiedad y
remoción de turbiedad, comparado con la distribución nonnal. Las gráficas corresponden
al procesamiento realizado en el software estadístico SSPS (las instrucciones se presentan
en el capítulo 10). En cada gráfico se observa la desviación estándar (Desv. tip.), el valor
de la media (Media) y el número de datos analizados (N).
• Turbiedad
70 T'-----------------------, loor,- - - - - - - - - - - - ,
60
80
50
.~ 40
~
~
.:: 30
'r
.::
O
40
20
UlIII,~ J~~;".
20
D~sv.tlp. - 18,50
10
Media - 21
N-2 94,OO
38g~n~~~a~~~~~nn~~ 47.g.~n~u~M~~a~~
50
40
'g
~ 30
.::
20
El gráfico de frecuencias del FGAC muestra valores hasta 88 UNT, con frecuencias
significativas hasta 53 UNT Yfrecuencias máximas entre 3 UNT Y28 UNT. El FGH3
tiene valores hasta 49 UNT, con frecuencias significativas hasta 28 UNT Yfrecuencias
máximas entre 4 UNT Y 19 UNT. El FGHM3 presenta valores hasta 57 UNT, con
frecuencias significativas hasta 42 UNT Y frecuencias máximas entre 9 UNT Y 18
UNT. Las distribuciones evidencian cierto grado de asimetría con relación al valor
medio, con sesgo a la derecha, es decir, las mayores frecuencias se presentan en los
valores menores de turbiedad, disminuyendo la frecuencia a medida que aumentan
los valores de turbiedad.
Analizando la distribución de frecuencias, el mejor filtro en turbiedad es el FGH3,
pues tiene sus mayores frecuencias entre 4 UNT y 7 UNT, superando más de 120
datos en este rango, mientras que el FGAC tiene más de 120 datos en el rango de
8 UNT a 18 UNT.
• Remoción de turbiedad
40 ~-------' 30. - - - - - - - - - ,
30
20
/
~
10
/
10
1\
I L ni n
rlAf1
Dtn.tip.- n ,17 I Dtn.típ..- JI.IJ
0J;!
35 :I,J
40 ..!,J"U,
50U,
,,U,
eo¡.J.65,J..!,,J..!
O,"""5 eo
"""85
J,.U,.1.
90 J,J'
95 N-1U,H O~
46 ""
52 ..!,J
56..!,J
eoU,64U,
eaU,
'2U,'6¡.J.eo,J..!84,J..!8,8u92
,u96
L,LJ N -1f4,1IJ
FGAC - remoción en turbiedad (") FGHJ • remoción en turbiedad (")
60
50
40
';
_ 30 ,\
~ .\
20 ~
/ ~
.~
10
~
Desv. tlp. - IJ,95
Ittl!diQ - 65
h- N-194.00
U~~503540"50"9085roU908590~
De la tabla se pueden analizar diversos aspectos: El 35,7% de los valores del afluente
estuvieron entre 20 UNT Y40 UNT yen este caso los valores efluentes se presentaron
entre OUNT Y 10 UNT con un porcentaje representativo del 97 ,1 %. Se obtiene que el
25,2% de los datos del FGAS3, se encuentran entre OUNT Y 5 UNT Y el 32,3% entre
5 UNT Y 10 UNT. También se puede analizar que el 84% de los datos del FGAS3
son menores que 20 UNT Y el 57,5% de los datos son menores que 10 UNT.
Se puede analizar que el 35,7% de los datos del agua integrada se encuentran entre
20 UNT Y 40 UNT Y para este rango los valores efluentes al FGH3 se tienen entre O
UNT Y 5 UNT Y 5 UNT Y 10 UNT en porcentajes de 21 ,9 Y 70,5 respectivamente.
Se visualiza que el 11,9% de los datos del FGH3 se dan entre O UNT Y 5 UNT Y
el 40,8% entre 5 UNT Y 10 UNT. También se puede analizar que el 80,6% de los
efluentes del FGH3 son menores que 20 UNT Y el 52,7% de los datos son menores
que 10 UNT.
• Tabla para FGAC
Tabla de contingencia Integrada • FGAC
FGAC
(0·5) (5·10) (10·20) (20·30) >30 Total
Integrada (0·20) Recuento 7 2 O O O 9
%de Integrada 77,8% 22,2% ,0% ,0% ,0% 100,0%
%de fGAC 50,0% 3,1% ,0% ,0% ,0% 3,1%
(20·40) Recuento 7 58 40 O O 105
%de Integrada 6.7% 55,2% 38,1% ,0% ,0% 100,0%
%de fGAC 50,0% 89,2% 44,0% ,0% ,0% 35,7%
(40·50) Recuento O 3 26 12 O 41
%de Integrada ,0% 7,3% 63.4% 29,3% ,0% 100,0%
%de fGAC ,0% 4.6% 28,6% 18,5% ,0% 13,9%
(50·100) Recuento O 2 20 41 13 76
%de Integrada ,0% 2,6% 26,3% 53,9% 17,1% 100,0%
%de fGAC ,0% 3,1% 22,0% 63,1 22,0% 25,9%
> 100 Recuento O O 5 12 46 63
%de Integrada ,0% ,0% 7,9% 19,0% 73,0% 100.0%
%de fGAC ,0% ,0% 5,5% 18,5% 78,0% 21.4%
Total Recuento 14 65 91 65 59 294
%de Integrada 4,8% 22,1% 31,0% 22,1% 20,1% 100,0%
- -
%de fGAC , 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
'''''
75•
.~
lO:
~ !O\
.¡:
""
'" 25.0 ""O 75,0 100,0 '" 25,0 ""O 15.0 100,0 125,0
FGAS3
FGDS
'''''
'"
.~
lO:
~ !O\
.¡:
""
FGHM3
,00 o
33,00 o 2222222333333333
63,00 o 4444444444444444444455555555555
46,00 o 66666666667777777777777
27,00 o 8888888889999
2,00 1 ,\;
13,00 1 223333
27,00 1 4444444555555
18,00 1 66666777
18,00 1 88889999
8,00 2 0111
6,00 2 233
4,00 2 5&
7,00 2 677
4,00 2 9&
6,00 3 011
2,00 3 2
10,00 Extr~m~~ (>=33)
14,00 o 334444.q
65,00 O 55566666677777888888888999999999
27,00 1 223333.q444.q40;
64,00 1 5555556666777777777788888889999
3 9,00 2 000111223333444444
26,00 2 55666678889
17,00 3 001134.q&
12,00 3 5678&
8,00 4 023&
6,00 4 6&
1,00 5 &
15,00 Extremes ( > =51)
Aquí, las máximas frecuencias se encuentran entre los valores de 4UNT y 9 UNT
y las menores frecuencias entre los valores de 20 UNT a 32 UNT. Del diagrama de
tallos y hojas se puede evidenciar que 16 datos tomaron el valor de 3 UNT, 40 datos
se encuentran entre 4 UNT y 5 UNT; 71 datos se dan entre 6 UNT y 7 UNT y 28
datos entre 8 UNT y 9 UNT, siendo estas las mayores frecuencias.
16,00 o 3333333&
40,00 o 4444444445555555555
71,00 o 66666666666666666666677777777777777
28,00 o 88888888999999
1,00 1 &
8,00 1 2333
26,00 1 4444455555555
25,00 1 666677777777
22,00 1 88888888899
17,00 2 00000111
9,00 2 2233
6,00 2 445
6,00 2 77&
5,00 2 99&
1,00 3 &
5,00 3 22&
2,00 3 &
6,00 Extreme!!! (>~38)
De los diagramas de tallos y hojas, para los tres filtros analizados, el FGAS3 tiene la
mejor distribución, debido a que 169 datos tienen valores de turbiedad en el rango
de 2 UNT a 9 UNT, seguido del FGH3 con 155 datos en el mismo rango y luego se
encuentra el FGAC con sólo 79 datos en este rango.
, ....
fGAC 1
1
33 Ir
'l'al.1o
o 1 2222222333333333
....
JGAI
I
44444555 Ir o 1 4444444444444444444455555555555 I
66666677777 I o 66666666667777777777777 I
888888888999999999 Ii o 1I 8888888889999 I
223333
• I1
Ii
1
1
1I
1I
•
223333
I
I
444444555555 I1 1 1I 4444444555555
66667777777777 11 1 li 66666777
88888889999 11 1 1 88889999
000111 11 I 1 0111
223333 11 2 233
44444455 11 I I 5.
66667 11 2 I 677
8889 I1 2 I 9&
0011 I1 J I 011
3& 11 J 1I 2.
445 11 1 I
67 11 J I
8& 11 J 1I
o
• I
23& 11
• 1I
I
I
6&
& 11
•
5
I
1I
bt-.
51 11 33
1 (>-) 1
I
I
[
...
JGAC
33
44444555
I ftllo
o
o
1
I
I
11
11 H555555
.....
I'GIIIII
I
1
1
1
66666671771 o 11 666117777777
.
1
888888888999999999 o 11 88888888888999999999 1
[ 1 11 00 1
223333 1I 1 11 2333 1
444444555555 1I 1 11 444445555555 I
66667777777777 11 1 11 66666677777177 1
88888889999 I 1 11 88 888 888999 I
000111 11 00011111 I
223333 11 22233 I
44444455 11 45 1
66667 11 666671777 I
8889 11 88999
0011 11 01
I 3& I 333
445 I 4H5
67 11
8& 11 3 8.
o 11 • 0001
23& 11
• 3.
6& 11 •
I
6&
--
• 11
11 I 3&
51 11 54
l>el
7.7 Percentiles
Los percentiles son valores que permiten analizar de forma detallada las frecuencias,
en general los percentiles más utilizados son el percentil 95 y el percentil 99.
De la tabla se puede analizar que el 50%, es decir, la mediana de los datos, toman
valores menores a 48 UNT en la integrada; 8 UNT en el FGAS3; 18 en el FGAC;
9,5 en el FGH3 ; 17 en el FGHM3 y 14 en el FGDS.
. ~----------------------~
- ...
110 too••
....
~ ....
*t..
*tAO .....
*t..
.....
1100
... *to.
.........
*t..
*to,
....
20 -,..
:
50
...
FGAS3
... ...
FGAC FGHM3
... ...
FGH3 FGDS FGAS3 FGAC FGHM3 FGH3
...
FGDS
(a) (b)
Gráfico de cajas y alambres para turbiedad
• Coliformes fecales
En el diagrama de cajas general (a) se puede evidenciar que los filtros más
homogéneos son el FGAS3 , FGH3 y el FGDS. El filtro con mayor dispersión lo
presenta el FGHM3 , seguido del FGAC.
Considerando el diagrama con valores extremos (b) se puede evidenciar que en el
efluente del FGHM3 no se presentan ni valores extremos ni atípicos, mientras que en
los otros filtros se presentan entre 1 o 2 valores extremos y 1 o 2 valores atípicos.
~rl-----------------------------'
*"
=-1500
S f500
~ ~
2- 2-
,; ,;
~ 1000 ~1ooo
u. u.
J
8 500
I ....
Q,
-w, •
500
B'
01
N-
I
~ N_ 31
~
"
FGAS3
"
FGAC
"
FGHM3
"
FGH3
"
FGDS
"
FGAS3
"
FGAC FGHM3
"
FGH3
"
FGDS
(a) (b)
Gráfico de cajas y alambres para coliformes fecales
En general, se puede analizar que los mejores filtros gruesos evaluados en cuanto
a turbiedad ycoliformes fecales fueron el FGAS y el FGH, seguido del FGDS; por
último se encuentran el FGAC y el FGHM. En el porcentaje de remoción los mejores
filtros fueron el FGAS, FGDS y FGH, seguidos del FGAC y el FGHM.
Sin embargo, para una adecuada selección de un filtro grueso es necesario
analizar otros parámetros de calidad de agua y considerar factores de operación y
mantenimiento, así como los costos de inversión inicial, administración, operación
y mantenimiento de cada una de las unidades.
8
Calidad de aire
Alrededor del mundo se ha encontrado que en los centros urbanos las fuentes móviles
son las mayores contribuyentes de emisiones contaminantes a la atmósfera, siendo
siempre más significativas, comparadas con las emisiones de fuentes fijas. Un menor
aporte de emisiones es ocasionado por fenómenos asociados a las actividades de
urbanización, tales como: deforestación, tala de árboles, apertura de vías, erosión de
cerros, disposición de escombros, disposición de desechos sólidos y almacenamiento
de combustibles, entre otros. A continuación se describen algunos parámetros de
calidad de aire.
• Ozono (03)
El ozono es un gas altamente reactivo, de color azul pálido, constituido por tres
átomos de oxígeno en su estructura molecular. Este se puede clasificar en dos grandes
grupos: ozono estratosférico y ozono troposférico.
Ozono estratosférico. Se origina en forma natural en la estratosfera (entre 12 km y
50 km a partir del suelo) mediante la fotodisificación del oxígeno producida por la
radiación solar ultravioleta; se concentra en una capa delgada denominada ozonosfera,
la cual filtra y modera la radiación solar ultravioleta y otras partículas energéticas
que inciden sobre la superficie terrestre. Esta acción protectora de la capa de ozono
permite que se lleven a cabo diversos procesos en los ecosistemas naturales: en la
célula evita que se rompan las moléculas de ADN y enlaces de carbono. En los
últimos cincuenta años la emisión de clorofiuorocarbono (CFC), usado en equipos
de refrigeración, aire acondicionado, aerosoles y esponjas plásticas, ha provocado
el deterioro y debilitamiento de la ozonosfera en un orden de 3% cada diez años.
Ozono troposférico. En la troposfera (de O km a 12 km a partir de la superficie
terrestre) el ozono se produce por la reacción fotoquímica de óxidos de nitrógeno
(NOx) y compuestos orgánicos volátiles (COY' s) derivados del uso de combustibles
fósiles, los cuales se denominan precursores del ozono. La reacción fotoquímica se
produce cuando los NOx y los COY's reaccionan con la luz solar, lo que produce
un átomo libre de oxígeno (O). Este átomo libre puede adicionarse a una molécula
de oxígeno (02) y formar una molécula de ozono (0 3), El proceso es reversible y
está condicionado por la intensidad de la radiación solar.
La OMS recomienda como límite para preservar la salud pública una concentración
de ozono de 0,05 a 0,10 ppm (partes por millón) por hora, cada tres años.
y aire se oxidan para fonnar óxido nítrico y algo de dióxido de nitrógeno. Los óxidos
nítricos emitidos en el aire se convierten en dióxido de nitrógeno mediante reacciones
fotoquímicas condicionadas por la luz solar. El dióxido de nitrógeno daña el sistema
respiratorio porque es capaz de penetrar las regiones más profundas de los pulmones.
Así mismo, contribuye a la fonnación de la lluvia ácida.
• legislación ambiental
El gobierno nacional, a través del Ministerio de Transporte y mediante nonnas como el
Estatuto del Transporte para el transporte masivo (No. 3109 de 1997), ha contribuido
a definir lineamientos necesarios para la correcta planificación, ejecución y control
de dichos proyectos, centrando su atención en las grandes ciudades que integran
polos de desarrollo industrial y comercial. Para el análisis del comportamiento de
la contaminación es preciso realizar una comparación de los valores registrados de
cada contaminante con la nonna nacional vigente para emisiones atmosféricas (D.L.
02/82). Para poder aplicar esta nonna deben calcularse los valores específicos de
acuerdo con la temperatura promedio y la presión atmosférica de cada ciudad. Los
valores para Cali se muestran en la Tabla 8.1.
Nonna Nonnapare
Pmmetro SirmoIo Condición lIICionaI o candici6n
EPAnl local 121
Norma Nonnapara
Par6metro SInmoIo CandiI:i4n nacional O condición
EPAI11 1ocaI 12l
- ..:-- -- J
M.CAUII. . . _ . . . . . . . .
M &un6N
IJU"'iUfAIWfQ . . . . . .TUtwo
. . . . . . . . .--:NR . ........
I
Figura 8.1 Ubicación geográfica de estaciones de monitoreo de calidad de aire
en Santiago de Cali (www.dagmacali.gov. co).
t : >~ ~'i .
Centro Diagnóstico ,.: ,'.... 1.';-, ~':';'''.:
.¡", t'''~~
Automotor del Valle
." . (",' . )",'" '.,
.' .
(CDAVI ~~-,y.;
,;
""
5 CVC Pance
t
,
.....
!,-": ~. ..' t-,- .. ,,! 1:+:..:"«
6 Escuela República Argentina (ERA)
l,'. ,{~ '*,;:. ,,{:.'t'!:';;
Señala los eventos extremos. Es sensible a cualquier Máximo diario 03. N02. CO.
Máximo suceso extraordinario (incendios. desfogues industriales. S02. PST.
eventos meteorológicos. etc.). Colecta de 24 horas PMlO
Promedio diario
Permite evaluar el cumplimiento de normas de protección S02. PST.
Promedio a la salud y el comportamiento anual de algunos paráme· Colecta de 24 horas PM 1o. pH.
tras. Es sensible a valores extremos. NOj. S04
Colecta semanal
Promedio horario
Indica la frecuencia de valores de un contaminante en 03. N02. CO.
Promedio móvil
intervalos especificas. algunos se asocian a los límites S02. PST.
Intervalos
permisibles definidos en las Normas Oficiales Mexicanas PM10. pH.
Colecta de 24 horas
de Salud Ambiental. N03. S04
Colecta semanal
60,00
50,00
i. 40,00
~9
g
.
30,00
....
<.> 20,00
a 10,00
0,00
COAV BA POO ERA CALLE 15
Es/ación
Promedio anual - Norma anual 50 "g/m3
100
i zso
i ZOO
j 150 ·
~ 100 -
I
<:l 50 -
80
60 I __
::-
f.
-3 40
,
';..
20
o l' , - 'i
COAV BA POD ERA CVC CALLE 15
o Domingo C Lunl!s • Martes O Miércoles • Jueves • Viernes • Sdbado
1~r.1======================================~~
140
120
::- 100
l
-3
80
~• 60
40
20
o I-~,~- \.J V
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Dias (t)
- - CDAV - + - BA - - PDD ---..-CVC ~ ERA - + - CA LLE/5 - - - NormadiariaI50pg!m3
Se pueden apreciar concentraciones bajas y poco variables durante los primeros diez
días del mes en las estaciones graficadas y un comportamiento variable que alcanza
concentraciones mayores en la estación Calle 15 y CDAV, a partir del día 8 (www.
dagmacali.gov.co). La estación que evidencia los menores valores de PMIO es la
estación CVC, seguida por las estaciones PDD y ERA.
En la siguiente gráfica se muestran las máximas concentraciones horarias en algunas
de las estaciones monitoreadas. Se puede ver que, a excepción de la estación CVC
- Pance, ubicada en la zona rural, las máximas concentraciones ocurren entre las
10 Y 12 horas, con un incremento de las concentraciones a partir de las 18: 00 horas,
excepto para la estación PDD que mostró una disminución progresiva a partir de las
18 horas (www.dagmacali.gov.co).
100
80
........
~.,
~
60
'-
....
~
40
~
20
o
o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2122 23
horas (1)
ERA -+-- CALLE 1 5
40
130
~
120
,
1
~ 10
él
O +1_.1..-.........
CDAV BA PDD ERA
Estación
Concentración promedio anual -Norma anual 34,ZZ ppb
~~-7--~-C~~~~--~~--~-C~--~~--~~--~~~--~~--~
1
. .
100
!{
t 10 ~~ :
. . .
J 'TT:'" :....•.. l •. ., .
..
<.l
-~~---~~~~ ~~~~~--~~~
~CDAV ~- BA -7" PDD ~ ERA --Norma diaria 136,61 ppb
Se puede apreciar que en general las estaciones graficadas están por debajo de la
norma diaria establecida que es de 136,61 ppb, excepto la estación CDAV con un
valor superior a la norma en noviembre. De marzo a julio la estación PDD evidenció
en general las menores concentraciones máximas de S02. De octubre a diciembre
la estación que mostró los valores más altos fue la CDAV y la estación que dio los
valores más bajos fue ERA.
La siguiente gráfica muestra los valores promedios horarios de concentración de
S02·
20
····t~···············
liS .................. ... _.*. :* .. \ ..................... - ....... .
20.---------------------------------------------~
15
1
~'
10
o
CDAV BA PDD ERA
o Do",ingo CJ Lunes • Martes O MUrcoles • Jueves • Viernes • Sábado
• Ozono (03)
La siguiente gráfica presenta la máxima concentración horaria de ozono en dos
estaciones monitoreadas: PDD y CVc.
aeJJO¡
84.00
82.00
i 80.00
-5
c" 78.00
76.00
74.00
72.00 +1------~----~~------~----~--------~----~
PDD O/e
= Máximo J hora - Norma horaria 77.57 ppb
>- .
¡Domingo -.- · LI,II\f'~ Io4Irt.. Mi6rcoIes ........- J\M'ItI ____ V¡emeS --"-- $M)ado
8.2 Histogramas
600 300
'~
~ 400 '1200
~
'"
200 100
_"'·J2.'1
Mtfif-j7
_ . - 2lJf
M... · "
..........u,u.........1,I-I,Ju,u,J-li"'i"'i'''''' N·l121." N·Ufl."
42031152 6884100116132148164111196 W~JIIQ¡~II~I~1151!m
PMII PM"
Es/ación: 6 ERA
700
600
500
_.'14.14
II... ·'J
N'u;~"
3 15 n ! 51 ~ ~u• mlDl! 147
PM"
En la estación ERAse observan frecuencias hasta 147 ¡..tglm3, con su máxima concentración
en el rango de 15 ¡..tglm3 a 63 ¡..tglm3, evidenciándose un buen ajuste a la curva normal.
El valor promedio es de 43 ¡..tglm3 con una desviación de 24,94 ¡..tglm3 .
En general, las estaciones PDD y ERA evidencian la misma tendencia sin diferencias
significativas en los valores promedios de PM 1O. También se puede evidenciar que
de las estaciones graficadas solo la CDAV muestra frecuencias por encima de la
norma anual de PM JO, pero con pocas frecuencias en estos valores.
800
200
Dm. n,. ·',H
Mp -',7
J,I,I,l,J,l,l,l,LM1IL,I,1,I,l.w;t_ N-'JIf,H
I~u~~~~w~m~~~ J~U~UU~u~~u.u
SO, SO,
E,"ción: 6 ERA
7011 . - - - - - - - - - ,
6011
500
200
1011
J,U,LJ,LI,IJI,U,U,u,u.,u,u,IJ;I:I;J
-.. ""
M" · ~, I
N-11"'"
J 1) ¡1 11 il 1)11 1111 ".I1lJl11~1
SO,
10,4 ppb; con un valor medio de 9,7 ppb Y una desviación estándar de 9,06 ppb. La
forma de la distribución se concentra en los valores menores a 13,6 ppb. A partir de
este valor las frecuencias disminuyen sustancialmente, la gráfica de la distribución
presenta sesgo hacia el lado izquierdo.
En la estación PDD se observan frecuencias hasta 13,7 ppb; con una concentración
máxima de frecuencias en el rango entre 0,3 ppb y 4,8 ppb; con un valor medio de 3,3
ppb y una desviación estándar de 2,51 ppb. La forma de la distribución es asimétrica,
concentrándose la mayoría de valores hacia la franja izquierda de la gráfica y muy
pocos valores mayores a 7,0 ppb.
En la estación ERA se dan valores en la distribución hasta 14,7 ppb, con concentración
de frecuencias en el rango entre 0,3 ppb y 3,9 ppb; con un valor medio de 4,1 ppb
y una desviación estándar de 4,58 ppb. La forma de la distribución es asimétrica en
cuanto al valor medio, con sesgo alIado izquierdo.
De las estaciones graficadas sólo la CDAV evidencia valores por encima de la norma
anual de S02, con bajas frecuencias.
• Estación COA V
Tabla de contingencia PMIO *S02 8
S02
Total
10·201 (20-40) [40-60) >60
Recuento 2266 63 6 O 2335
<50 %de PM lO 97,0% 2.7 ,3% ,0% 100.0%
%de 502 49,8% 15.4% 11,8% ,0% 46,5%
Recuento 1904 245 21 8 2178
(50·100J %de PMlO 87.4% 11,2% 1,0% .4% 100.0%
%de 502 41,9% 60,0% 41,2% 50,0% 43.4%
PMlO
Recuento 316 85 17 7 425
(100·150) %de PMlO 74.4% 20,0% 4,0% 1.6% 100,0%
%de 502 6,9% 20,8% 33,3% 43,8% 8,5%
Recuento 61 15 7 1 84
>150 %de PM,o 72,6% 17,9% 8,3% 1,2% 100,0%
%de 502 1,3% 3.7% 13.7% 6,3% 1.7%
Recuento 4547 408 51 16 5022
Total %de PMlO 90,5% 8,1% 1,0% ,3% 100,0%
%de 502 100,0% 100,0% 100,0% 100,0% 100,0%
a. Estación - CDAV
En esta estación el 46,5% de los datos muestreados del material particulado PM 1O, da
concentraciones menores a 50 ¡¡glm 3 y el 43,4% se encuentra entre 50 ¡¡glm3 y lOO
3
¡¡glm , es decir, en estos dos intervalos se halla el 89,9% de los datos de PM\O.
Para dióxido de azufre, S02, se observa que 90,5% de los datos se encuentran en el
rango de Oppb a 20 ppb Y el 8, I % en el rango de 20 ppb a 40 ppb, es decir, en estos
dos rangos se encuentra el 98,6% de los datos de S02.
Cuando el PM lOse encuentra entre O ¡¡glm 3 y 50 ¡¡glm 3, el 97% de los datos de S02
se da entre O ppb Y 20 ppb Y el 2,7% entre 20 ppb Y 40 ppb.
Cuando el S02 se encuentra entre Opbb Y 20 ppb, el 49,8% de los datos de PMIO se
encuentra entre O ¡¡glm 3 y 50 ¡¡glm 3 y eI41,9% entre 50¡¡glm 3 y lOO ¡¡g/m 3 .
Del total de datos analizados, el 45,1% se encuentra entre O ppb Y 20 ppb de S02
3
y entre O ¡¡glm y 50 ¡¡glm 3 de PM 10, simultáneamente. El 37,9% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 ¡¡glm 3 y 100 ¡¡glm 3 de PM 10,
simultáneamente.
• Estación POO
A continuación se presenta la tabla de contingencia para la estación PDD.
S02 Total
[0·20) (20-40)
(100·150) Recuento 86 O 86
%de PMlO 100,0% ,0% 100,0%
%de S02 2,5% ,0% 2,5%
>150 Recuento 10 O 10
%de PMlO 100,0% ,0% 100,0%
%de S02 ,3% ,0% ,3%
a. Estación - POO
En esta estación el 65,6% de los datos muestreados del material particulado PMIO
presenta concentraciones menores a 50 ¡.tg/m3 y el 31 ,6% se encuentra entre 50
¡.tg/m3 y 100 ¡.tg/m 3, es decir, en estos dos intervalos se encuentra el 97,2% de los
datos de PM 1O.
Para dióxido de azufre, S02, se presenta que 99,9% de los datos se encuentran en
el rango de O ppb a 20 ppb.
Cuando el PMIO se halla entre O ¡.tg/m3 y 50 ¡.tg/m 3 , el 99,9% de los datos S02 se
encuentra entre O ppb Y 20 ppb.
Cuando el S02 se da entre Oppb Y20 ppb, el 65,6% de los datos de PM 10 se encuentra
entre O ¡.tg/m3 y 50 ¡.tg/m3 y el 31 ,6% se encuentra entre 50 ¡.tg/m3 y 100 ¡.tg/m3 .
Del total de datos analizados el 65,5% se encuentra entre O ppb Y 20 ppb de S02
y entre O ¡.tg/m 3 y 50 ¡.tg/m3 de PM 10, simultáneamente. El 31 ,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50 ¡.tg/m3 y 100 ¡.tg/m3 de PM 10,
simultáneamente.
• Estación ERA
A continuación se presenta la tabla de contingencia para la estación ERA.
80 2
Total
[0·201 (20-401 [40·601 >60
Recuento 2406 5 1 2 2414
<50 %de PMIl 99,7% ,2% ,0% ,1% 100,0%
%de 802 65,6% 14.7% 20,0% 50,0% 65,1%
Recuento 1167 18 2 2 1189
(50-1001 %de PMlO 98,1% 1.5% ,2% ,2% 100,0%
%de 502 31,8% 52,9% 40,0% 50,0% 32,1%
PMlO
Recuento 88 11 1 O 101
(100-1501 %de PMlO 87,1% 10,9% 2,0% ,0% 100,0%
%de 502 2.4% 32,4% 40,0% ,0% 2.7%
Recuento 4 O O O 4
>150 %de PMIl 100,0% ,0% ,0% ,0% 100,0%
%de 502 ,1% ,0% ,0% ,0% ,1%
Recuento 3665 34 5 4 3708
Total %de PMIl 98,8% ,9% ,1% ,1% 100,0%
%de 502 100,0% 100,0% 100.0% 100.0% 100,0%
a_Estación - ERA
En esta estación e165 ,1% de los datos muestreados del material particulado PMIO
evidencia concentraciones menores de 50 ¡.tg/m 3 y el 32,1% entre 50 ¡.tg/m3 y
100 Ilg/m3, es decir, en estos dos intervalos se encuentra el 97,2% de los datos
de PM1o.
Para dióxido de azufre, S02, se observa que 98,8% de los datos se encuentra en el
rango de Oppb a 20 ppb Y el 0,9% en el rango de 20 a 40 ppb, es decir, en estos dos
rangos se da el 99,7% de los datos de S02.
Cuando el PMIO se da entre O Ilg/m3 y 50 llg/m3, el 99,7% de los datos S02 se
encuentran entre O ppb Y 20 ppb.
Cuando el S02 se halla entre O ppb Y 20 ppb, el 65,6% de los datos de PMIO se
encuentran entre O Ilg/m3 y 50 Ilg/m3 y el 31,8% entre 50 Ilg/m3 y 100 llg/m3.
Del total de datos analizados, el 64,9% se observa entre O ppb Y 20 ppb de S02
y entre O Ilg/m3 y 50 Ilg/m3 de PM 10, simultáneamente. El 31,5% de los datos
toman valores entre O ppb Y 20 ppb de S02 y entre 50Ilg/m3 y 100 llg/m3 de PMIO,
simultáneamente.
15% 15%
.~ "§-
~ "~
el; "'" el; "'"
,,% 25%
PMII PM"
ERA
1(lO'"
15%'
.~
~ 50%
<>':
""
PM"
Gráfica de frecuencias acumuladas para material particulado, PM¡O
(Viene de la página anterior)
En la estación CDAV alrededor del 50% de los datos toman valores menores o iguales
a 50 Ilglm 3 de material particulado, PM 10 Y aproximadamente el 88% de los datos
son menores o iguales que 100 Ilg/m 3 .
En la estación PDD cerca del 75% de los datos toman valores menores o iguales
que 50 Ilglm 3 y aproximadamente el 98% de los datos son menores o iguales que
lOOllglm3.
En la estación ERA alrededor del 65% de los datos son menores o iguales que 50 Ilglm3
y aproximadamente el 98% de los datos son menores o iguales que 100 Ilglm 3.
De las estaciones graficadas la única que muestra frecuencias por encima de la norma
es la CDAV, con bajas frecuencias.
CDAV PDD
100% 100%
75" 75"
"i~- .~
~
~
&: "'" ~
&:
"'"
"" ""
10,00 20,00 30,00 40,00 50,00 '" 0,00 10,00 20,00 JO,OO
SO, SO]
ERA
75"
.~
l!
c:
~ "'"
&:
""
"',~~~~uw~~~~ww~
0.00 10,00 20,00 JO,OO
SO]
En la estación CDAV alrededor del 75% de los datos son menores o iguales que 10
ppb Y aproximadamente el 90% de los datos son menores o iguales que 20 ppb de
dióxido de azufre.
En la estación PDD alrededor del 97% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores que 20 ppb de dióxido
de azufre.
En la estación ERA alrededor del 95% de los datos son menores o iguales que 10
ppb Y aproximadamente el 99% de los datos son menores o iguales que 20 ppb de
dióxido de azufre.
De las estaciones graficadas la única que evidencia frecuencias por encima de la
norma es la CDAV, con bajas frecuencias.
8.5 Percentiles
Este ítem ilustra el análisis de los valores percentiles para material particulado, PM 1O
Y dióxido de azufre S02·
Estación
CDAV BA PDD ERA
Percentil 05 13.66 3,98 9,25 9.00
Percentil 25 33,96 16,80 25,88 25,00
Mediana 51,54 36.68 41,15 40.20
PMlO
Percentil 75 73.93 56.49 57,13 56.80
Percentil 95 116.30 89,05 89.12 89.00
Percentil 99 158.16 122,15 127,37 119.70
En la estación CDAV el 50% de los datos son valores menores o iguales que
51,5 Jlg/m3 ; el 75% menores o iguales que 73,9 Jlglm 3 ; el 95% menores o iguales
que 116,3 Jlglm 3 y el 99% menores o iguales que 158,1 Jlglm 3 . Evidenciando que
existen datos por encima de la norma anual de PM lO, en esta estación.
En la estación BA el 50% de los datos toma valores menores o iguales que
36,7 Jlg/m 3 ; el 75% menores o iguales que 56,5 Jlg/m 3 ; el 95% menores o iguales
que 89,1 Jlglm3 y el 122,2% menores o iguales que 158,1 Jlg/m 3• Es decir, en esta
estación se cumple la norma anual de PM 10 en el periodo analizado.
En la estación PDD el 50% de los datos toma valores menores o iguales
que 41,2 Jlg /m 3 ; el 75% valores menores o iguales que 57,1 Jlg /m 3 ; el
95% menores o iguales que 89,1 Jlg/m 3 y el 99% menores o iguales que
127,4 Jlg/m 3 . Lo cual indica que esta estación cumple la norma anual de
PMIO en el periodo analizado.
En la estación ERA el 50% de los datos toma valores menores o iguales que
40,2 Jlg/m 3 ; el 75% valores menores o iguales que 56,8 Jlg /m 3 ; el 95% de
los datos toma valores menores o iguales que 89,0 Jlg/m 3 y el 99% menores
o iguales que 119,7 Jlg /m 3 . Así, en esta estación se cumple la norma anual
de PMIO en el periodo analizado.
PM'O
Parcentil 05 Parcantil 25 Mediana Parcantil75 Parcentil 95 Parcantil 99
Abril 6.40 21,40 42,05 67,30 111,40 146.42
Mayo 12,32 29,32 45,50 64,66 110,46 153.70
Junio 5,02 17,55 36,90 61,52 111,82 160,00
Julio 5,87 24,90 42,91 63,55 102,13 143,29
Mes Agosto 3,94 10,59 27,10 46,52 80,00 113,07
Septiembre 11 ,80 28,20 43,49 59,55 95,44 138,33
Octubre 8,88 26,12 42 .. 21 61 ,62 95,00 127,59
Noviembre 14,19 31 ,51 44,33 59,82 90,40 121.01
Diciembre 18,92 34,99 49,87 67,00 98,29 126,26
En mayo el 50% de los datos fueron menores o iguales que 45,5 llg/m3; 75% de
los datos son menores o iguales que 64,7 llg/m3 y 95% de los datos son menores o
iguales que 110;5 llg/m3.
En agosto se observó que el 50% de los datos son menores o iguales que 27,1 llg/m3;
el 75% son menores o iguales que 46,5 Ilg/m3 y el 95% menores o iguales que 80
Ilg/m3.
Para el mes de diciembre el 50% de los datos son menores o iguales que 49,9%
llg/m3; el 75% son menores o iguales que 67,0 Ilg/m3 y el 95% de los datos son
menores o iguales que 98,3 llg/m3.
En general, en el percentil 95 , los meses con los valores más altos de material
particulado se encuentran entre abril a julio, 10 mismo sucede con el percentil 99.
La siguiente gráfica presenta los valores percentiles de material particulado, PMIO
a través de los meses en la estación CDAY.
180
160
.:;--. 140" ·
t 120
~ 10 -* * *. ~ .
~~ 80
Q.; 60 ~. .)(. lE ·· )~( )( )( ~
40
20 .~ _~,.~=:~~=_~<;=-~_:m=:=.~.~:._~'.':_-~~
O
ABR. MAY. JUN. JUL. AGO. SEP. OCT. NOV. DIC.
Mes
--+-- Perc. S __ Perc. 25 --4- Perc. SO ~Perc. 75 --*- Perc. 95 - - Perc. 99
I Estación
I
CDAV BA PDD ERA
S02 Percentil 05 1.63 1,13 .31 .53
Percentil 25 3.96 2,59 1.53 1,64
Mediana 7.41 4,71 2.90 2,87
Percentil 75 12.48 8.06 4.36 5.16
Percentil 95 24.79 15.78 7.90 11.08
Percentil 99 42.82 26.19 11.96 21.38
En la estación CDAV el 50% de los datos son valores menores o iguales que 7,4 ppb;
el 75% menores o iguales que 12,5 ppb; el 95% de los datos toma valores menores
o iguales que 24,8 ppb Y el 99% menores o iguales que 42,9 ppb. Por lo cual, esta
estación cumple la norma anual de S02 en el período analizado.
En la estación BA el 50% de los datos toma valores menores o iguales que 4,7 ppb;
e175% valores menores o iguales que 8,1 ppb; e195% valores menores o iguales que
15,8 ppb Y el 99% menores o iguales que 26,2 ppb. De este modo, en esta estación
se cumple la norma anual de S02 en el periodo analizado.
En la estación PDD el 50% de los datos toma valores menores o iguales que 2,9 ppb;
el 75% valores menores o iguales que 4,4 ppb; el 95% de los datos toma valores
menores o iguales que 7,9 ppb Y el 99% menores o iguales que 11 ,9 ppb. Así, esta
estación cumple la norma anual de S02 en el periodo analizado.
En la estación ERA el 50% de los datos toma valores menores o iguales que
2,9 ppb; el 75% de los datos toma valores menores o iguales que 5,2 ppb; el 95%
de los datos toma valores menores o iguales que 11,1 ppb Y el 99% son menores o
iguales que 21,4 ppb. Es decir, en esta estación se cumple la norma anual de S02
en el periodo analizado.
En general, se puede observar un comportamiento similar en las estaciones ERA
y PDD, con valores bajos de dióxido de azufre, seguidas de la estación BA, y por
último con los valores más elevados la estación CDAY. Pero las estaciones cumplen
la norma anual de S02.
En la siguiente tabla se observan los valores percentiles mensuales de dióxido de
azufre, S02, en la estación CDAY.
Tabla de valores percentiles mensuales para
dióxido de azufre. S02. en la estación CDAV.
S02
Percentil 05 Percentil 25 Mediana Percentil 75 Percentil 95 Percentil 99
Mes Abril ,15 ,93 1,67 2,75 6,05 9,44
Mayo ,47 1,94 3,34 5,65 11 ,34 18,73
Junio 1,34 2,39 3,96 7,50 15,17 27,12
Julio 1,91 3,60 5,94 8,95 17,11 24,21
Agosto ,33 2,73 4,17 6,24 11,37 16,20
Septiembre 1,89 4,37 7,50 10,60 18,07 26,00
Octubre 1,36 3.44 5,62 8,89 15,80 26,46
Noviembre ,90 2,60 5,08 9,84 21,95 39,42
Diciembre 1,08 2,98 5,73 12,18 26,26 46,93
En mayo, el 50% de los datos son menores o iguales que 3,3 ppb, el 75% son menores
o iguales que 5,7 ppb y el 95% son menores o iguales que 11 ,3 ppb de dióxido de
azufre. En agosto, el 50% de los datos son menores o iguales que 4,2 ppb, el 75%
son menores o iguales que 6,2 ppb y el 95% son menores o iguales que 11 ,4 ppb de
dióxido de azufre.
Para diciembre, el 50% de los datos son menores o iguales que 5,7 ppb, el 75% son
menores o iguales que 12,2 ppb Y el 95% son menores o iguales que 26,3 ppb de
dióxido de azufre.
En general, en el percentil 95 se observa que los meses con los valores más altos de
dióxido de azufre se encuentran entre septiembre y diciembre.
En la siguiente gráfica se muestran los valores percentiles de dióxido de azufre a
través de los meses, en la estación CDAY.
!~ r - - :---:--::-----.--.-.--.~------:--~~--:-------'------------:--- ~.--~-------.--.---:--.-.-/~-j
40
35
:¡ 30 ·
,s; 25
~ 20
15]
;¿
.• >~ ~ .,.~
~ -~ ... ! ~ ~~ ....
....
10 ·
5
O
F;:~·- -':- -·!=·- ~j-~
t_----- _______ a....:..:_ --_'a_n
. ~
.. ; .". ~
___
• Material particulado, PM 10
A continuación se observa la gráfica de los valores promedios diarios de partículas
menores de 10 micrómetros (PMIO), monitoreada entre 1995 a 2005 (fuente: www.
sma.df.gob.mxIsimatlpnindicadores.htm).
1995 1996 1997 1996 1999 2000 2001 2002 2003 2004 2005
Ano
c:::::::J Dlas arriba del valor limite -+- Percentil 90
1995 1996 1997 1998 1999 2000 2001 2002 200] 2004 2005
Se puede analizar que la mayor dispersión de los valores promedios diarios de PM 1O,
se dan entre 1997 y 2003. En el percentil 90 se puede observar que entre 1995 y
1998 se evidencian las mayores concentraciones promedio de PM 10, mientras que
entre 1999 y 2005 estos valores son menores.
A continuación se observa la gráfica del comportamiento típico diario de partículas
menores de 10 micrómetros (PMIO), monitoreada de 1995 a 2005, donde se
evidencia la tendencia anual cada 24 horas (fuente: www.sma.df.gob.mxlsimat/
pnindicadores.htm).
120
-¡lOO
~ 80- ··
c
~ 60
i...
~
40
t..l 20
0+1-'--r-.-'-'--r-r~~r-r-.-'--r-r~~--r-r-.-'-'--r~~
1 2 3 4 S 6 7 8 9 10 11 12 13 14 1 S 16 17 18 19 20 21 22 23 24
Hora
-+- 1995 1996 -4- 1997 ~ 1998 --*-1999 -+- 1000
1400
1233
')' 1200
's:
~1000
721 7+4
i 800
......•
"~ 600
763
670
i 400
~
1: .. .. ..
a 200
o
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Año
'" lO
1 '0
..... 0
1: 50
60
SI . 1$
57
51
5'
~ .0
1 30
~ 20
a
1:
lO
O
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Año
0,500
0,400
i'
~ 0,300
a 0,100
0,000 i ¡ i i i I i i i i I j , i i I i i i
1~1~1~1~1~~ 1~1~1~1~1~1_1~1~~~1~=~~
Ano
)K P~rcenlil 7S - Máximo _ Perunlll 90 - Percenta SO _ MI"I",o • Percentlllj
• Ozono, 03
A continuación se muestra la gráfica de los valores máximos diarios de ozono, desde
el año de 1986 a 2005 (fuente: www.sma.df.gob.mxlsimatlpnindicadores.htm).
0,350 380
0,300
300
i' 0,250
240
~
" 0,200
~
:§ ~ 180
-lI
e
!
~ 0,150
0,100
0,050
• 120
80
~
¡
0,000 IL.iIII,L..II,L.., • • ,¡.....,,¡,i',i 1,'- ¡,I 1,1 1,1.....01,1 j,l J,I 1,1 J ,L..l ,L......I,I."""",I,L '"', - 1
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
1986 Yentre 1990 a 1993 . A partir de 1993 los valores inician un descenso paulatino
hasta e12005 (valor estimado).
A continuación se expone la gráfica del comportamiento típico diario de ozono, por años,
durante las horas del día (fuente: www.sma.df.gob.mxJsimatlpnindicadores.htm).
0,150
,19",
-.-""
____ '989
..
0,120
-+-,-
--m,
1• 0•090
- -1"1
1993
m,
~ ... 40 1995
.
~ ~
_ _ _ 1997
/996
~ 0.060 _ _ _ 1998
a -+-1000
/999
1 2 3 4 S 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Gráfica del comportamiento típico diario del ozono (Oj), 1986 -julio 2005
Se puede observar que a través de los años el comportamiento típico diario de ozono
sigue la misma tendencia, es decir, valores relativamente bajos hasta las primeras
diez horas, altos entre las 11 horas y las 16 horas y nuevamente disminución a partir
de las 18 horas, aproximadamente.
A continuación se muestra la gráfica de los valores maXlmo maximorum de
concentraciones horarias de ozono, monitoreada de 1995 a 2005 (fuente: www.sma.
df.gob.mxJsimatlpnindicadores.htm).
0 ,000
O,soo
0,500 ,j''''
i'
.. " 0,475
:~
W
0,400
0,300
---- "-
D,·U1 0,40<4 e,¡" ,0
.. • O,H9
•
0,323
~18 • . jfZl
• . .. 0,2804
'
a~.'
0 .312 0,307 0 ,226
0 ,200
0,282 0,271
-.---.
0,222
0,100
o ,OOO-l-_ -_ _- _ _- _ _- _ _- _ _- _ -_ _- _ _- __
,- = - -
-
_
~
~ ,~ ~ ,~ ~ ,~ ,~ ,~ ~ ~ ~ ,~ ,~ ~ ~ ~
Mo
0.200 30
25
O.lSO
i' ~
~
20
e
:~ ~
0.100 15 2
~
e
~ .1
<3•
~
.
10
O.OSO
-,
Ano
¡¡;:::::::::t mllS arribll dld Wllor lI"u'u -e Peru ntll 90
Se puede observar que el número máximo de días por encima del límite de S02, se
dio en 1992; entre 1986 a 1998 se encuentran los valores más elevados del número
de días por encima de la norma. Sin embargo, a partir de 1993 estos valores bajan
considerablemente con pocos datos por encima de la norma en el 2000 y 2001. El
percentil 90 permite analizar cómo los niveles de concentración descienden a partir
del año 1992, mostrando valores altos nuevamente en los años 2000 y 200 l.
A continuación se ilustra la gráfica de los valores promedios diarios de dióxido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mxIsimat/
pnindicadores.htm).
0.3DO 1
1
""
O.2!lO
0.200 ; T
¡
I 1 1
X
1991
"na,,'" 7J
1992
-
1993 1994
MbJ_
¡ r ---r---r--- - . , . - - , - - - r
• ~tU H
1995
_
1996 1997
hr«,,1IJ s,
.-'-
- Mútl_ +
'---,.~
hrft,.tI/ U
-r-
2003 2004 2005
No
Se puede analizar que la mayor dispersión de los valores promedios diarios de SOz se
dan entre 1986 y 1992. A partir del año 1993 , los valores medio, máximo y mínimo
de los valores promedio de S02 empiezan a descender, excepto para el año 2001 ,
cuando se observa la mayor dispersión de la base de datos analizada.
A continuación se muestra la gráfica de los valores promedios diarios de dióxido de
azufre (S02), monitoreado entre 1995 y 2005 (fuente: www.sma.df.gob.mx/simat/
pnindicadores.htm).
-~ ~ ,..
· ,""
· ,...
~
...
-:r- IHI
--.. - '''1
- -,"" ...
.•
."'-
I PlJ
''''
m,
,,,,
· '06',.... ,
~,,,,
~ ,
- t " - l00J
- - J()(U
O,!XXl +--~~~~~~~~~~_~ _ _ ~~~ __ ~_~ _ _ --I -JllI.lfJO$
1 2 3 .. 5 e 7 8 9 10 11 12 13 '4 15 16 17 18 19 20 21 22 23 24
Hora
Gráfica del comportamiento típico diario del dióx ido de azufre (SO]),
1986 - julio 2005
Se puede observar que a través de los años el comportamiento típico diario del
dióxido de azufre sigue la misma tendencia, es decir, valores relativamente bajos hasta
las primeras ocho horas, valores altos entre las 9 horas y las 11 horas y nuevamente
disminución a partir de las 14 horas, aproximadamente.
A continuación se muestra la gráfica de los valores máximo maximorum de
concentración horaria de dióxido de azufre (S02), monitoreado de 1995 a 2005.
(fuente: www.sma.df.gob.mxJsimat/pnindicadores.htrn).
CI.IIIII
o,lIIO
ICI.IIIII
t 0,110
o,..z ~o.. . . .
0,41
0,100
1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Mo
0,060
0,052 o,~" , 0,056
Q,i
~
~ 0,030
g
. --
0,020
S
..... .--- -
--- ....
0,018
0,020 ...... 0,016 0,016
~
13 0,010
---
0,017
0,014
0,Q1.
~ 0,0'4
...... 0,012 0,011
0,0 12 0,012
O,CXXl -~-~--r-~-~--r--'--~--r--'--"'---r--'--"'---r-~-~--r--,-----l
+-1
1986 1967 1968 1969 1990 1991 1992 1993 1994 1995 1996 1997 1996 1999 200l 2001 2002 2003 2004 2005
Mo
9
Calidad de agua en una
fuente superficial
I
ESTACICN AbKlsa(Km)
1. Ante. Suarez 1.8
2. Ante. Ovejas 3.1
3. Antes TITTlt>. 24.1
... Paso de III Belsa 27." ""-"'"
5. P. .o de III Bol.. 78.9
6. Puente Hormiguero 113.5
7. Antes Navarro 127.7
8. Juanc:hlto 139.3
9. PISO del Comercio 1.....6
10. Puerto lsaacs 155.5
11 . Paso de la Torre 170.8
12. Vljes 181 .8
13. Yotoco 211 .8
14. Medi8CIIl'lOll 220.9
15. Puente RIofrio 284.8
16. Pueril Guayabal 347.0
17. Puente La VIctoria 369.6
18. An.calO 418.5
-
Front....
d ... Cuenea
o 25 50
19. Puente La VrginJa .....7 km
~
MIdiI DmiIci6n
Minino MIdiI Milimo Madi MedíIIII Rango 'llrilnzl Coef. di
llImtricI EstindIr
Img/I) ImII/II Img/I) ImgIIl ImII/II Img/I) lmgII¡2 Vllilci6n1'lo1
EstICián ImgIIl ImgII)
1. A. Suárez 0.10 1.88 7.80 0.60 1.40 1.38 7,70 2.28 1.51 80.5%
2. A. Ovejas 0.10 1.51 7.00 1.20 1.20 1.11 6.90 1.39 1.18 78.2%
3. A. Timba 0.10 1.46 4,70 0,70 1.15 1.19 4.60 0.83 0.91 62.4%
4. P. Balsa 0.20 1.55 4.80 0.90 1.30 1.25 4.60 1.04 1.02 65.7%
5. P. Bolsa 0.10 1.94 5.30 1.90 1.90 1.49 5.20 1.54 1.24 63.8%
6. Hormiguero 0.20 2.18 6.30 2.50 2.00 1,78 6.10 1.64 1.28 58,7%
7. A. Navarro 0.60 2.64 13.50 2.10 2.30 2.27 12.90 3.23 1.80 68.1%
8. Juanchito 0.30 2.48 5.70 2.20 2.25 2.20 5.40 1.32 1.15 46.2%
9. P. Comercio 0.60 4.61 18.40 4.20 3.80 3.93 17.80 8.76 2.96 64.2%
10. Pto. Isaacs 1.30 4.44 16,70 2.80 3.72 3.96 15.40 6.29 2.51 56.6%
11. P. La Torre 0.77 5.05 14.80 3.00 4.48 4.43 14.03 7.42 2.72 53.9%
12. Vijes 0.86 6.40 18.50 5.30 5.15 5.33 17.64 16.64 4.08 63,7%
13. Votoco 0.80 5.08 16.50 2.80 4.10 4.15 15,70 11.58 3.40 66.9%
14. Mediacanoa 1.20 4.77 13.20 2.00 3.95 4.04 12.00 8.23 2.87 60.1%
15. Pte. Riofrío 0.68 4,79 14.60 1.90 3.80 3,75 13.92 11.42 3.38 70.5%
16. Pte. Guayabal 0.85 4.16 13.20 3.80 3,71 3.45 12.35 7.10 2.66 64.0%
17. La Victoria 0.50 3.53 11.60 2.50 3.05 2.99 11.10 4.56 2.14 60.4%
18. Anacaro 0.70 3.85 13.90 1.80 2.64 3.06 13.20 8.10 2.85 74.0%
19. Pte. Virginia 1.12 3.36 10.80 2.40 2.60 2.94 9.68 4.07 2.02 60.0%
.....
Medidas de tandencil cantral Medida de dispersión
Estación
lq.4) .... .... .... .... ...
lIbiIIII
s.itricI "-" VIriIIII
..,; ...
E.-.. VIridt
111
1. A. Suárez 0.70 4.64 8.00 4.80 4,70 4.20 7.30 3.19 1,79 38%
2. A. Ovejas 0.90 5.09 8.00 6.20 5.30 4.74 7.10 2.57 1.60 32%
3. A. Timba 0,70 6.23 7.91 7.20 6.45 5.92 7.21 1.80 1.34 22%
4. P. Balsa 1.80 6.28 8.00 7.20 6.60 6. " 6.40 1.43 1.19 19%
5. P. Bolsa 0.40 5.95 7.27 6.40 6.30 5.71 6.87 1.38 1.17 20%
6. Hormiguero 1.60 5,76 7.80 6.10 5.96 5.60 6.20 1.19 1.09 19%
7. A. Navarro 0.80 5.52 7.50 5.90 5.90 5.31 6,70 1.38 1.17 21%
8. Juanchito 3.10 5.19 8.20 5.30 5.30 5.12 5.10 0,76 0.87 17%
9. P. Comercio 1.20 4.50 8.10 4.20 4.60 4.30 6.90 1.47 1.21 27%
10. Plo. Isaacs 0.50 3.55 5.80 3.00 3,70 3.26 5.30 1.55 1.24 35%
". P. La Torre 0.10 2.14 6.30 0.20 2.12 1.49 6.20 2.14 1.46 69%
12. Viies 0.20 1,71 4.60 0,70 1.60 1.29 4.40 1.44 1.20 70%
13. Voloco 0.20 1.51 4.30 1.20 1.35 1.22 4.10 0.92 0.96 64%
14. Mediacanoa 0.10 1.65 4.10 1.30 1.50 1.39 4.00 0.81 0.90 54%
15. PIe. Riofrlo 0.60 2.21 4.30 2.10 2.15 2.05 3.70 0.67 0.82 37%
16. PIe. Guayabal 0.30 2.40 4.60 2.40 2.40 2.23 4.30 0.66 0.81 34%
17. La Victoria 0,70 2.75 5.00 3.10 2.80 2.65 4.30 0.49 0.70 25%
18. Anacaro 1.20 2.92 6.40 3.20 2.85 2.84 5.20 0.51 0,71 24%
19. Pte. Virginia 2.20 3.55 6.00 3.80 3.60 3.48 3.80 0.49 0,70 20%
mínimos y medios de DBO, excepto en la estación Vijes. Sin embargo, los valores
máximos superan el valor admisible en los siguientes tramos: Antes Suárez a Antes
Ovejas, Hormiguero a Antes Navarro, Paso del Comercio a Puente La Virginia, es
decir, cerca del 85% de las estaciones evaluadas no cumplen la norma de DBO en
los valores máximos, aunque el 95% sí la cumple en el valor medio.
34.0 100
r-
eoo
18,0
r-
¡ 500
:!
HIlo, AbrJsib/~
Q 12,0
~ <:)1
T ~ ~
..
6.0
-r .
. .,
~.~lI¡I -t· 4 ~. -i. ~ 11. I~
~. _.~ I 1'-. ~ I ~
200
lOO
o
.. U.
0,0
l:!oc s ;:¡
~ .,~
~;:¡
e
:¡:;¡ e
::¡
¡: e
O
tl lo¡
~
l:l
¡¡¡ ~ ~ ..
e ...
;:¡ ~ e ~
~
..,~ ~
e ...:
e
1>
:¡
:::
~
~~ ~ ~ ~
le ~
~ ..
~ ili
~
~;: ~
.., ~
...: ...: '" '" .. .., 8 ~ e
~ '" Estación
'" ~ ~
1>
.
~
~
.
~
- D80 • CAUDA L
La estación Puente La Virginia evidencia hasta el año 1994 valores por debajo de la
norma y valores superiores al valor admisible en 1994, 1995, 1997 Y 2000.
11 ~----------------------------------------------------------~
1 .. • . -. • • ~ "'lo ~ ••
12 .' . ............... ..
10 ,,- .......,.Oo ..
1964 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Se puede evidenciar que en las primeras estaciones, desde Antes Suárez hasta
Juanchito, los valores de DBO son menores al valor admisible de 6 mgll, en cada
uno de los meses del año. Sin embargo, en las estaciones centrales se observan los
mayores niveles de DBO, es decir, entre Puente del Comercio y La Victoria, los
valores de DBO se incrementan considerablemente con valores máximos en los meses
de enero a marzo, disminuyendo entre los meses de abril a mayo e incrementándose
nuevamente hasta el mes de diciembre donde alcanza valores máximos.
La DBO vuelve a mostrar valores bajos en las últimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a generar
niveles bajos de DBO. En general los meses de marzo, abril y mayo muestran
los niveles más bajos, incrementándose hasta llegar a los valores máximos en
diciembre.
tU
1,0
11 • __ -- -
.,.. ""'" -.¡ fIIMr -
..,
500
11,0
i"""Q I '1 rI " 11 l. 11 ~
r
~
~
300
!~
l.
4,0
~II~ ~~ ~
~- ""' 11
2,0
~~
L..
1.-11--1 ~ . '"11 -
111 JI •• 200
100
0,0 ., . ...;:¡ ..
::::: eus: .e
;:¡ e e e ::¡ ¡; e
~ ~ tl
~2 ~ ~ ~
e~
~:¡
~
::
.. ...
~
:li ~ ~ ;:¡ ~
~
~ >:
U
~
;;S
es:: u
., '~"
'..."
e
... ...
I ~
... ...~ 8.. ~ ª
Estación
.. ~
~
:1; ~
:li
::!'"
..
:¡
~
..::!
. OD • CAUDAL
Gráficamente se evidencia una relación inversa entre los niveles medios de OD y los
valores medios de caudal, pues en el tramo Antes Suárez a Puente del Comercio los
valores medios de OD tienen tendencia hacia valores bajos y los valores medios de
caudal tienen tendencia a incrementarse, mientras que en el tramo Puerto Isaacs a
Puente La Virginias los valores medios de caudal tienden a incrementarse y los valores
medios de OD muestran fluctuación con tendencia a tomar valores mínimos.
En la siguiente gráfica se observan los valores máximos, mínimos y medios de
oxígeno disuelto por mes en cuatro estaciones.
~
7.00 1
6.001
I
9.00 , - - - - - - - - - - - - - - - - - - , - - - - - - - - - : - - - - - ; - - . . . . . . . . ,
8.00
¡I
! s.OO ¡ 1
~ 4.00 + -~+_++=H_++--_+;;;.-.~+'_+_"".......,¡"..,j._=r-+.r..___iI_+_=____'lI....-++.....;¡+_+.=f1
1 -
Q 3.00 ~
2 .00~
1.00 !
: -~--~-'--~-~--~-~-_--'--_-_-_--~-_l
0 .00 1--
ENE"O FEIRUO MA"ZO AUI.. IoI"YO JlHO
Mes
---+- A. Slldr~z ---+- Hor".¡g,,~ro --... - Plo. ISQQCS --+- Pte Virginia
La siguiente gráfica muestra la serie de tiempo para oxígeno disuelto desde el año
1984 al año 2002 en cinco estaciones monitoreadas sobre el río Cauca.
IJ I :.._.;.".,.¡.
8
7 ~ .
o I F' ív
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 19971998 1999 200 2001 200
6 ,00
i'6
o 4,00
á;
.2'
el
2,00
0,00
~ i
Se puede evidenciar que en las primeras estaciones, desde Antes Suárez hasta Juanchito,
los valores de OD son mayores al valor admisible de 4 mg/l, en cada uno de los meses
del año. Sin embargo, en las estaciones centrales se observan los menores niveles
de OD; entre Puente del Comercio y La Victoria los valores de OD disminuyeron
considerablemente, con valores mínimos en los meses de enero a marzo.
La OD vuelve a generar valores altos en las últimas estaciones monitoreadas, es
decir, en el tramo Anacaro a Puente La Virginia, donde la tendencia es a evidenciar
niveles altos de OD.
9.3 Histogramas
En este ítem se muestran gráficas de histogramas para algunas estaciones de muestreo
sobre el río Cauca en la variable oxígeno disuelto. A continuación se observan
histogramas en las estaciones Antes Ovejas, Paso de la Balsa y Hormiguero.
ESTACIÓN: 2,00 Antes Ovejas Estación: 4,00 Paso de la Balsa
16 , - - - - - - - - - - , JO
12
20
10
/ \
1\
~
1\ /)mI. típ. · ',19
Medj. - 6J
h-L N - 61,OO
1,0 1,5 ¡O u 3.0 3.5 Oj o~ ~o ~5 lO 1.5 7,0 7,5 lO u ¡O ¡5 3.0 3,5 0,0 O~ ~O 5,5 6.D 6~ 7,0 7~ lO
Oxigeno disuelto Oxígeno disuelto
20
0""/1p. · /.1I8
Me¡¡. - j.7
.L.J.,__ :;.¡..,.J.........,................,..L.,...l...J..,.J N - 71.OII
/,
r-
\
~
20
_1 \
--'
10
20
10
En esta estación se puede apreciar que el 69,8% de los datos de DBO se encuentran
en el rango O mg/l a 2,0 mg/l y el 15,9% se dan en el rango de 2,0 mg/l a 3,0 mg/l,
es decir, en estos dos rangos se halla el 85,7% de los datos de DBO.
Para el oxígeno disuelto, el 33,3% de los datos se encuentra en el rango 5,5 mg/l a
8,0 mg/l y e138,1 % en el rango 3,5 mg/l a 5,5 mg/l, es decir, en estos dos rangos se
encuentra el 71,4% de los datos de OD.
Cuando el oxígeno disuelto se encuentra entre 5,5 mg/l y 8,0 mg/l; la DBO toma
valores entre O mg/l y 2,0 mg/l; el 66,7% de las veces y entre 2,0 y 3,0 mg/l el
23,8%.
Cuando la DBO se halla en el rango Omg/l a 2,0 mg/l; el 11,4% de los datos de OD
se encuentra entre O mg/l y 2,5 mg/l y el 18,2% de los datos se da entre 2,5 mg/l y
3,5 mg/l.
Del total de datos analizados, el 22% se hallan entre 5,5 mg/l a 8,0 mg/l de OD y entre
Omg/l y 2,0 mg/l de DBO, simultáneamente. El 27% de los datos se encuentra entre
3,5 mg/l y 5,5 mg/l de OD y entre Omg/l y 2,0 mg/l de DBO, simultáneamente.
En esta tabla se puede evidenciar que valores menores de DBO están asociados a valores
altos de OD, valores altos de DBO repercuten en una disminución de la OD.
La siguiente tabla muestra el cruce entre oxígeno disuelto y DBO, en la estación
Juanchito.
Tabla de contingencia oBO * Oxigeno disuelto 8
Oxigeno disuelto
Total
(2.5·3.51 (3.5·5.51 (5.5·8.01
OBO [0·2.01 Recuento O 20 11 31
%de OBO ,0% 64,5% 35,5% 100,0%
%de Oxigeno disuelto ,0% 39,2% 44,0% 39,2%
(2.0·3.01 Recuento 1 17 6 24
%de OBO 4,2% 70,8% 25,0% 100,0%
%de Oxígeno disuelto 33,3% 33,3% 24,0% 30.4%
(3.0·5.01 Recuento 2 13 8 23
%de OBO 8.7% 56,5% 34,8% 100,0%
%de Oxigeno disuelto 66.7% 25,5% 32,0% 29,1%
>5.0 Recuento O 1 O 1
%de OBO ,0% 100,0% ,0% 100,0%
%de Oxigeno disuelto ,0% 2,0% ,0% 1,3%
Total Recuento 3 51 25 79
%de OBO 3,8% 64,6% 31,6% 100,0%
%de Oxígeno disuelto 100,0% 100,0% 100,0% 100,0%
a. Estación - Juanchito
Cuando el OD se encuentra entre 3,5 rng/ I y 5,5 mg/I; el 39,2% de los datos de DBO
se halla entre O mg/I a 2,0 mg/I; el 33,3% entre 2,0 mg/I a 3,0 mg/I y el 25,5% entre
3,0 mg/I a 5,0 mg/l.
Cuando la DBO se da entre 3,0 mg/I y 5,0 mg/I; el OD se halla entre 2,5 mg/l y 3,5
mg/I el 8,7% de las veces; el 56,5% se da entre 3,5 mg/l y 5,5 mg/l y el 34,8% entre
5,5 mg/l y 8,0 mg/l de OD.
Del total de datos analizados, el 25,3% de los datos está entre 3,5 mg/l y 5,5 mg/l de OD
y entre Omg/l a 2,0 mg/l de DBO, simultáneamente. El 16,5% de los datos se da entre
3,5 mg/l y 5,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO, simultáneamente.
A continuación se muestra la tabla de contingencia entre rangos de DBO y oxígeno
disuelto, en la estación Vijes.
Tabla de contingencia DBO • Oxigeno disuelto·
Oxigeno disuelto
Total
[0·2.51 (2.5-3.51 (3.5·5.51
oBo [0·2.01 Recuento 2 1 O 3
%de OBo 66.7% 33,3% ,0% 100,0%
%de Oxigeno disuelto 3,6% 10,0% ,0% 4,2%
(2.0·3.01 Recuento 5 2 3 10
%de OBO 50,0% 20,0% 30,0% 100,0%
%de Oxígeno disuelto 9,1% 20,0% 42,9% 13,9%
(3.0·5.0%1 Recuento 11 5 2 18
%de OBO 61.1% 27,8% 11,1% 100,0%
%de Oxígeno disuelto 20,0% 50,0% 28,6% 25,0%
>5.0 Recuento 37 2 2 41
%de OBO 90,2% 4,9% 4,9% 100,0%
%de Oxígeno disuelto 67,3% 20.0% 28,6% 56,9%
Total Recuento 55 10 7 72
%de OBo 76.4% 13,9% 9.7% 100,0%
%de Oxígeno disuelto 100,0% 100,0% 100,0% 100,0%
a. Estación - Vijes
En esta estación el 4,2% de los datos de DBO se dan entre O mg/l y 2,0 mg/l, el
13,9% entre 2,0 mg/l y 3,0 mg/I y el 25,0% entre 3,0 mg/l y 5,0 mg/l, es decir, en
estos tres intervalos se halla e143,1 % de los datos de DBO.
En OD, el 76,4% de los datos se encuentra en el rango mgll a 2,5 mg/l, el 13,9% °
entre 2,5 mgll y 3,5 mgll y el 9,7% entre 3,5 mgll y 5,5 mgll.
Cuando el OD se halla entre 2,5 mgll y 3,5 mg/l; el 10% de los datos de DBO está
°
en el rango de mg/l a 2,0 mgll; el 20% entre 2,0 mg/l y 3,0 mg/l y el 50% entre
3,0 mg/l a 5,0 mgll.
Cuando la DBO se da entre 3,0 mg/l y 5,0 mgll; el OD se halla entre mg/l y 2,5 °
mgll e161, 1% de las veces; entre 2,5 mgll y 3,5 mg/l el 27,8% Y el 11,1 % entre 3,5
y 5,5 mg/l de OD.
Del total de datos analizados, el 51,4 % de los datos se da entre mg/l y 2,5 °
mg/l de OD y > 5,0 mg/l de DBO, simultáneamente. El 15,3% de los datos
°
se ubica entre mg/l y 2,5 mg/l de OD y entre 3,0 mg/l y 5,0 mg/l de DBO,
simultáneamente.
J",ndita
,.,. ,.,. ,.,.
7i-' 7
7 / 1/
V /
~
I
I
/
/ 1/
V
dI A
~
l
'"0,0 4,0 lO '" 0,0 l,O 40 1,0 '" 0,0 l,O ..o 1,0
00 00 00
Gráfica de frecuencias acumuladas en oxígeno disuelto, en las estaciones
Antes Suárez, Paso de la Balsa y Juanchito
De la gráfica se puede analizar que en la estación Antes Suárez alrededor del 43% de
los datos toma valores menores a 4,0 mgll, es decir, el 57% cumplió el valor admisible.
En la estación Paso de la Balsa alrededor del 5% de los datos son menores a 4 mg/l,
y el 95% de los datos cumple el valor admisible. En la estación Juanchito alrededor
del 12% muestra valores menores a 4 mgll y el 88% toma valores admisibles. Lo
''''''
JlijtS
10'"'
- - - - - - -_.-
M t djfl(llffHI
..
"
PUtnl, GII.)'ab.J
,,. ,. .
,
.¡.
t.
~
oS-
E
~
~
".
~
!!" ".
,. ,. ,.
,,' 20
" 00
',' " " 00
" " "
00
." 00 00
9.6 Percentiles
Este ítem muestra el análisis de los valores percentiles para oxígeno disuelto y
demanda bioquímica de oxígeno.
• Oxígeno disuelto
En la siguiente tabla se muestran los valores percentiles de OD en las diversas
estaciones monitoreadas sobre el río Cauca en el Valle del Cauca.
00
Parcantil ParcantM Parcantil Parcantil P8rcantil
Mediana
05 25 75 95 99
Estación Antes Suáraz 1,3 3,5 4,7 5,8 7,5 8,0
Antes Ovejas 1.8 4,1 5,3 6,1 7,5 8,0
Antes Timba 4,3 6,0 6,5 7,1 7.4 7,9
Paso de la Balsa 4,1 5,7 6,6 7,1 7,6 8,0
Paso de la Bolsa 3,8 5,7 6,3 6,7 7,1 7,3
Hormiguero 3,3 5,5 6,0 6.4 6,7 7,8
Antes Navarro 1.7 5,2 5,9 6,2 6,5 7,5
Juanchito 3,7 4,7 5,3 5,7 6,3 8,0
Paso del Comercio 1,9 3,6 4,6 5,3 5,9 8,0
Puerto Isaacs ,8 2.7 3,7 4,6 5,3 5,8
Paso de la Torra ,1 ,7 2,0 3,0 4,6 6,3
Vijes ,2 ,6 1.4 2.4 4,0 4,6
Yotoco ,2 ,8 1,3 1.8 3,5 4,3
Mediacanoa ,3 1,0 1.5 2,0 3,7 4,1
Puente Riofrlo ,9 1,6 2,2 2.7 3,6 4,3
Puente Guayabal 1,0 1.8 2.4 2,8 3,6 4,6
Puente La Victoria 1,7 2,3 2,8 3,1 3,8 5,0
Anacaro 2,1 2,5 2,8 3,2 3,9 6.4
Puente La Virginia 2.4 3,1 3,6 3,9 4,5 6,0
De la tabla se puede analizar que en la estación Antes Suárez el 50% de los datos son
menores o iguales que 4,7 mg/l; el 75% son menores o iguales a 5,8 mg/l; el 95%
son menores o iguales a 7,5 mg/l y el 99% son menores o iguales a 8 mg/l.
En la estación Paso de la Bolsa el 50% de los datos son menores o iguales a 6,3 mg/l;
el 75% son menores o iguales a 6,7 mg/l; el 95% menores o iguales a 7,1 mg/l y el
99% son menores o iguales a 7,3 mg/l.
En la estación Paso de la Torre el 50% de los datos son menores o iguales a 2,0 mg/l;
el 75% son menores o iguales a 3,0 mg/l; el 95% son menores o iguales a 4,6 mg/l
y el 99% son menores o iguales a 6,3 mg/l.
En la estación Yotoco el 50% de los datos son menores o iguales a 1,3 mg/l; el 75%
menores o iguales a 1,8 mg/l; e195% menores o iguales a 3,5 mg/l y el 99% menores
o iguales a 4,3 mg/l.
Los percentiles en forma gráfica se observan a continuación.
, OI
.... .r ....
Valdr Gd",i;ible
.=......
~ .~
~ ~ "~ .I:! ~
~ '" '"
ESTACIÓN
En la estación Hormiguero el 50% de los datos son menores o iguales a 2,0 mgll;
el 75% son menores o iguales a 2,8 mg/l; el 95% menores o iguales a 4,8 mg/l y el
99% son menores o iguales a 6,3 mg/1. En la estación Vijes el 50% de los datos
son menores o iguales a 5,2 mgll; el 75% son menores o iguales a 9 mgll; el 95%
son menores o iguales a 15,7 mgll y el 99% son menores o iguales a 18,5 mg/1. Los
percentiles en forma gráfica se muestran a continuación.
4
2
.... . ...
o
!:! g ;:¡
~
.~
Q
!:l'"
Q
:::¡ ~ § tJ ':::¡" ::¡
s: ~ ~iJ'"
Q ....
;:¡ '1
Q
'"
'1
~
~ ~ ~ ~
;:¡'" :::: iJ
;:¡ Q
::l ~ :::
"..;
Q
"
:lO
~...
~
Q
¡¡¡ ;:¡ ~ l!!
'"
..;
..;
'" '"
I ~
..;
~
<.;;
'"
.
¡:! ::¡
'"
'1
~ ~ "
~
;;:
::¡ " "~
.
ESTACIÓN
~Perc. 5 -----Perc. 25 --+-Perc. 50 - - Pe re. 75 -+-Perc. 95 - - - Pe re. 99
Analizando en general los valores percentiles para DBO, se da que las estaciones con
mejor desempeño son: Antes Timba, Paso de la Balsa, Paso de la Bolsa, Hormiguero
y Juanchito, pues el 99% de los datos son menores o iguales a 4,7, 4,8, 5,3 , 6,3 Y
5,7 mg/l, respectivamente.
Le siguen las estaciones Antes Suárez, Antes Ovejas y Antes Navarro, debido a que
el 95% de los datos son menores o iguales a 5,1, 3,7 Y 6,0 mg/l, respectivamente.
Las estaciones con valores críticos en DBO son Paso de la Torre, Vijes y Yotoco, debido
a que el 50% de los datos son menores a 4,6, 5,2 Y 4,1 mg/l, respectivamente.
De los resultados descriptivos desarrollados en este capítulo, la presentación gráfica
de los datos y consideraciones de carácter técnico se pueden generar los siguientes
análisis generales:
En el tramo Antes Suárez a río Ovejas se dan aumentos leves en la concentración
de oxígeno disuelto y una disminución leve de la demanda bioquímica de oxígeno;
el río en este tramo inicia un proceso de recuperación, recibiendo una reaireación
que es utilizada para la degradación de la materia orgánica.
En el tramo Antes río Ovejas a Hormiguero el río recibe aguas de tres ríos afluentes :
río Ovejas, río Timba y río Palo, aumentando considerablemente los niveles de
caudal del río Cauca, lo cual permite una estabilización de la demanda bioquímica
de oxígeno y el incremento en la concentración de oxígeno disuelto, considerando
que los ríos Timba y Ovejas aportan un caudal importante con altas concentraciones
de oxígeno disuelto y valores bajos de demanda bioquímica de oxígeno.
En el tramo Hormiguero a Vijes se observa la mayor contaminación del río por
materia orgánica, debido a que en este tramo recibe las descargas de la ciudad de
Cali, Palmira y el corredor industrial Cali-Yumbo, donde se encuentra gran parte
de los ingenios azucareros, la mayoría de las industrias de producción de pulpa de
papel, industrias productoras de químicos y la principal destilería del departamento
del Valle del Cauca. En este tramo se dan constantemente valores bajos de oxígeno
disuelto y un incremento progresivo de la demanda bioquímica de oxígeno.
En el tramo Vijes a Mediacanoa se tiene la condición más crítica a nivel de
concentración de oxígeno disuelto, pues en general se encuentra entre 1 mg/l y 2 mg/l.
En este sector hay una fuerte exigencia en la demanda bioquímica de oxígeno. La
contaminación en este sector es aportada por los municipios de El Cerrito, Guacarí
y Yotoco. (Vélez, 2003).
En el tramo Mediacanoa a La Virginia el río muestra una marcada recuperación, pues
la carga contaminante es menor y esto posibilita la auto-recuperación de la calidad de
agua. En este sector se observan descargas de aguas residuales e industriales, debido a
los ingenios, beneficiaderos de café e industrias alimenticias, así como de los municipios
de Buga, Tuluá, Riofrío, Bugalagrande, Cartago y Caicedonia. (Vélez, 2003).
10
Instrucciones en SPSS
En este capítulo se presentan los procesos básicos para el uso del programa estadístico
SPSS (Statistical Package for the Social Sciences), en su versión 11.5, para el
sistema operacional Windows (Las nuevas versiones tienen los mismos procesos
para la estadística descriptiva que los presentados en este libro). SPSS es uno de los
programas más comúnmente utilizados para el análisis estadístico de datos. Entre sus
ventajas se encuentran: cubre un amplio rango de los análisis más comunes y gráficos
estadísticos, los datos pueden ser grabados en SPSS o pueden ser importados de
otros programas, como Excel. Los resultados del análisis de datos están claramente
estructurados en un archivo de salida, en el cual se pueden realizar modificaciones
y pueden ser editados en el procesador de texto Word (Microsoft). '
Para ingresar al programa SPSS en el menú de inicio se debe seleccionar:
Programas>SPSS for Windows>SPSS 11 .5 para Windows, o simplemente dé
doble clic en el icono de SPSS si este se encuentra instalado en el escritorio, SPSS
automáticamente abrirá una hoja vacía: "Sin titulo - SPSS para Windows Editor
de datos". Para finalizar el programa SPSS se debe seleccionar Archivo>Salir, de
la barra del menú o clic en el botón X, en la parte superior de la esquina derecha
de Windows.
1
CeIÑIiMID
r
........
r
........ 1
v...
35.00
EIIIpá
I ~;I
,
2 r 1 42.00 I
3 r 1 65.00
4 1 72,00
J
5 1 75,00
6 1 100,00
7 1 105.00
c==-:u
e 1 120,00
9 1 190.00 ~,
-
[~;.:::'- . ---A
-o-Ir.-v=-d
AcepW Pega! , R~ I CenceIIr I .. I
_...,5...
i
........ ~
e
71 00
, " te t l ¡ íi ti •
... c:::::J
07• ...,.... ' 12.. '''00
_ .00
8UlO
".00
,.o. '''00
100.0 '0000
,to.O .... 00
MO • .7100
• >0. .....00
,oe. 17800
_........
70. '2000
•••
12&0
1t00
'3)00
'''00
32.
.,.2.•••.
OlOO
..00
123.00
. . . 00
" .00
37.0 7>00
"00
Señale los datos de las variables que se van a procesar y dé clic en el icono de
copiar, en este caso turbiedad y sólidos suspendidos,
~ -
¡- 1- f
+-
+
t
i
'Ir
·1
-+¡ ,
, 1 t - t
~
~
i ~ l- :
- 1-' t .~
- ~ ¡-
j-
-
tt
-r- -+----1--+ -¡--i -t-. --i-- t
t -~ -~
-t--- "'.- r-T-Y- -1- ---¡- -
t ~
¡-
L
1-
t
j f" 1-1¡
~- J
~ '.-
l tt -..j:
+ -.
-:
_.
-
t
1 f j: ¡ r
+ ¡
--+-
t
.
+ -.
f - .. -+. f
~
i
.tj
t
; ~
-; ~
- r ~
+
,
j
.t
I ~
f. t . ~ - +-
~
r j • ~ +
~
1 1t.___ t
1"
f
f l-
.---t" -, - t
.ffI
_..
.....
.....
.......
"" '
'''00
\CIt_
.00
"08
ItSOi!!
__
11000
U).ao
:
).l.
1100
...
.00
14000
"00
114(1)
Inoo ! , ¡
:::! .
.....
j t ~
¡ +
t
i
+
" I
rt
t
.
t
j
t +
+
+
!
¡ i-
•.
¡
t ..
t t f
~;;;;;¡¡!'r-~:::::::::----~=:l:'
t¡ ,.•• 1-
¡ ~ t +
.~
--
Vista de variables
Campos que deben ser diligenciados de acuerdo con el contexto del estudio.
f
,.,
~
I
I
f
I
+
I
¡
I
,.
f
t¡
t:j
t
n
- 3IlO
~I
7~r
\46
SII5 I
I
I
I
I
I I
¡
'!l -- ¡
~
35
65 136
. t----- -
121 IliOi - 1
~
1CX) 1901 i ¡!...
- m""'---2Ii81 I
I
6SO
Dl
978 1 I
!!l * 1 I I
I
~
105 \10
~ - 1$
te
\20
99 t -- f---._-.- - ... _ ...... f------- --_ ..._. ....+--
lA 125 \33
W 85 UO I ,
I \6
,.-
32 53
-_ - --u-r·--
R
I
I
\
I
-85 -
e -,
54
129 ,
---+-_. ..
I _. __ .
-t-
,
...
I
~ 51 1M I j I
2t
iliJ\-.-~ .:--...1
-_._-
11 73
- _.
.-- -- -
1
- .. ~.
" -_~_I
-
I
-
~
I
1
, .:r
262 ESTADIsTICA DESCRIPTIVA PARA INGENIERIA AMBIENTAL CON SPSS
CAPfTULO 10 - INSTRUCCIONES EN SPSS
c~.. mecIas
Modelo lneaI generlll
Modelos mixtos
Coneledones
R~
lOQlnNl
CIesflc..
RldJcdán de datos
Esealas
PruIbas no perllll6b1ces
Series teqIorlles
~
RespJeStes ~
AnilsIs de valores penIcIos •••
• Seleccione del lado izquierdo del cuadro de diálogo las variables a las cuales desea
calcularles estadísticas descriptivas y páselas alIado derecho (Variables) mediante
el botón que se encuentra en el medio de las dos subventanas. Para seleccionar
las estadísticas descriptivas que desea calcular, dé un dic en Opciones.
_.
-~ - - - - ---- .._------- _. ---- - - --~ ~
~I ~ ~I
~feche
Acepte! I
$llIInIgas3 F>.\lII I
1lIInI~
.leII\IghnJ
Rttttbletll! I
""",gh3 Ctn:ei« I
$""",gcb
~ I
~SJ>
'~~·P~-Pki¡;~~"::, ..",.__..,_ ~
~ Meóa ~ SI.IlIa {anna}
Dispersión
~ Minino
~I
~ Oesv. típica
~ Varaanza ~ Mmoo
AjWa I
~ An1*ud ~ E.T. meáa
~= Orden de "'-Iz1IICi6n
~ Asineb ía
(O LAta de vllrietlles
r AlabéIico
r MediIIIs éIICendenIes
r Meóas d.cendrri1llS
Una vez haya hecho clic en Aceptar se abrirá una nueva ventana, la cual contendrá
el resultado de los procedimientos realizados en la sesión de trabajo. Esta nueva
ventana, que se visualiza, es independiente del editor de datos de SPSS y se llama
Visor SPSS, donde se presentan los resultados de los procesos estadísticos. Los
resultados presentados en la ventana Visor de SPSS se pueden trasladar a un
editor de texto, como Word, mediante el proceso de señalar, copiar y pegar.
1·:..tC!~I I~S l _Vl ~L~!!>.>. _ _ _ _~ •____________ ......_ ._~ ... ~ ....... . ~.,:...,JI¡I'
_ _ os
r_bóooc.... .
r_ _ ..... ..
~ .....
Corn0iecJ0005
LoghNI
Tata;do , ~~ .. .
Tata; do freo..oerOas. ••
00sl1Ul'
Rll<UxJOO do datos
PruIIbas no paraméblc.as
..
boIrpJraIos
SuperviYenda
~ ~
- . . . de valores " " ' _. ..
r~ _......
_".. .
~:' ...
~
~ I I_I
' frJwU._
.
, fuh3 111ti11
,:~==.
J
~ ~~
............
" -'-
f---
¡ Sñ _
Una vez que ha pasado las variables, dé clic en el lado derecho del mouse y en
el menú que se despliega elija Seleccionar todas las variables de columna.
~.;~------- -- .-_. -- ---_.._.- -- ,. ~~:
.-
. _ A>
Cat.,gol iu
Cort.
Copiar
etn+x
ctrI+C
r~--
l'<9flI' etn+_
{vtJIWIe do Eimin. 5..-
~
t-bitrar nOrrOre de VoIY!abIe
<ti Mostrar eti~ de varl.!bje
----~:~~ ~~:!"~~:.~::~_._--_._~;..... ~I
D~nr -------------. E~"li<osde,.......nl -------------~
• Una vez que se han seleccionado las variables en el área de diseño de la tabla,
vaya al cuadro Definir (parte inferior izquierda) y localice el cursor sobre
Estadísticos de resumen y dé un clic; inmediatamente se desplegará la ventana
donde podrá seleccionar las diferentes estadísticas que desea calcular. Sólo debe
buscar y seleccionar de la lista Estadísticos la estadística de preferencia, luego
pasarla al cuadro Visualización mediante la flecha que se encuentra en medio
de las dos subventanas. Cuando haya terminado de seleccionar las estadísticas,
dé un clic en Aplicar a selección, entonces volverá a la ventana de diseño de la
tabla personalizada.
~blC'~ d.:- C''X «I ~,....~~~, ~. I
V",ioble seleccionada: IM úl~ v",iabl.. )
e-tadi,licos; Vtluahzación;
Pe,C<II"II199 .:
.¡z.
Eno'lÍpicode lameóa - . I~'~" I ~~ I'''''''''''''ICO
Detv. típica A. ••
Suma
N total
• I AplicO! ••elección I ApliC<ll ~ lodo Cenor
J~..J
' do{dol
. I
IIiI NOIft\II I!I e_ .,
¡¡¡<+........
Iñ 14M
'' nle!ilod
lecho!"'...
1IIIo"ld 190t3 IIIIC I~ Iv
' 1ga<311g.. Mido r.."!I''W'VY'I I'N'ln....n IIm'I M ""mM N
'fooc~gocl nnnn..nn
Mldono (1'111'1)'1'", r,'l1'lJ'1'l N HY\.ftl n
" !fTnl{f.
' tg\l{lgh3)
Modo rlflmm rI'lI\I\.nn fYTl'\/Wl mm.m ro
~'~~':' . ü:
Cágoff.:
F ~
M:4I4I""
Oefol¡
-
~ j;1I1d1111C01 d........... ,
..
I AcOlIta I~ Rec\otNc. l CoraIa I~
A
Aparecerá la ventana del Visor SPSS con los resultados de la tabla personalizada
disefiada, tal como se presenta a continuación.
+ Tablas personallzactas
".dl.
M.atana
",",GRIIO
13,50
48,00
.......
12,4!i
',00
."'"
11 ,14
,.......
18,00
21 ,19
11,00
'GHl
13,20
9,45
'ODa
10,!;1
14,00
.oo,
.......
.Ini~
" .00
5'0,00
17,00
14.00
115,00
2,00
" ,00
170,00
3,80
17.00
130,00
'.90
'8.00
",00
>,"
18.00
140,00
2,"
Vartanza 5190,08 139,66 342,18 256,57 100,02 228,31
Desvl.clónlipltl 16.(}g 11 .82 18.50 '6.02 10.00 15."
Rango otdlnol 56:J,oo 11:J,OO 186,20 '26,10 70,2iI 1:J7,40
10.4 Histograma
Para realizar el histograma en SPSS se deben seguir los siguientes pasos:
En la pantalla de Editor de datos de SPSS vaya a Gráficos y seleccione
Histograma .
• 'lislogrilITla '!
" " ~I "'l " J ",j"j ~t ~ ~II~
.¡.t ',-:j ¡:.JW ~, ;>,
~ oo ~,
-
[!]• Vm:
1. .
.1 "'- s-. .,~o
~ Iecha a~
~ iga13
I
~ I w
~~ ... ~ PInia - - _ . - - f Ret!#m l I
<t> 1gm.1 l' r lJlalal~~bde: :
D
('..miv l
<i> ¡gu
<i> i!Ps j -=:J ~
~ 1fJIÍOlI3 ~\
~~ ~.;<t."'i\'¿~~';;:''i,"
~ oet#A3 ~ IiMosil.amraNi T... ·I
• Para editar el gráfico dé doble clic sobre el gráfico, aparecerá una ventana de
edición llamada Editor de gráficos de SPSS; en esta ventana podrá editar el
nombre de los ejes, el tamaño de la fuente y el número de decimales de los
ejes.
100
BO
60
40
20
INTEGRAD
• Para editar cualquier elemento del gráfico dé doble clic sobre el componente que
desea modificar, aparecerá el cuadro de diálogo correspondiente. Por ejemplo, si
se desea modificar el eje X, el cuadro de diálogo que aparecerá es llamado Eje
de intervalo, como se muestra en la figura; en este cuadro se puede modificar
el título del eje, los intervalos y el formato de las etiquetas. Si da un clic en
Etiquetas aparecerá un nuevo cuadro de diálogo donde se puede modificar el
número de etiquetas, el tipo, el número de decimales, el factor de escala del eje
y la orientación de las etiquetas.
,-
fje Ge;~leIVa, ~_
Mcnb. --
('" T..... I.. ~
--
Ic..a-I
r~ c..do r
M..oao _ _
dirJJOIat
",p«.~_
c:..c.r. 1
...... 1
~T~~----------------~
~ P.no..... ('" fWngo
eir... decíIn*..
rS _ _ d e _
r
Eíomc>Io
_____123f~
Fottorde -
0rie!Ucí6rc
r-
1 _ :::J
aarr.,....
.......
-".......,
",
!Í'ooao",
LheM~ .•,
"'.....
Dlet;J'nas.c......
ISarrasde.-ror .. ,
I
,[I~
, (int_ad1
'",_odoI r.....,.
'11-_1
,
, (,-g0s31
"'----
, (,-gdol
'('~I
, ("•.",.....31
Acepo- ~
R_ _
C"",*-
-
270 ESTAD fsTI CA DESCRIPTIVA PARA INGENIERfA AMBIENTAL CON SPSS
CAPITULO 10 . INSTRUCCIONES EN SPSS
_
~
~_
.....
Al. . ,••
....
-..
""0.....
~
----1
~. . o.c""
..,..dI.-ror ...
"
-_
o.._docojo. .•
a.r.. di.,..,.,
...
Pase las variables que desea graficar del lado izquierdo a cada uno de los cuadros
marcados como ejes, como se muestra en la figura, luego en la pestaña ajuste
verifique que el Método sea Suavizador, en la opción Kernel que por defecto
utiliza la distribución normal; puede elegir también la distribución uniforme.
x
,,--- U:!fB5
" , .., J.J .. , , ~ ... (
_-\_1'_ ......1'_1_1
"c.o_
" ............
,~
1.
(7oolodl
1.c.~)D-
-
_ - - \ ' -......IT_I_I
1- :::1
,~
,~,
,c.o._.
,~
, DeO_
,[---
,c.o.v-..
....
v. . . . .~~_________
_ .. _ . - XI
......
X2~
JOF""
11 u.. .. _~ .... een ...................
:::J
'* 1 ~
''000_
,DIOI<b>I
E'"
000 .........
,--- v_. _------
-,
'_-11_
,_ _1
'_1 ~~
,--
~,tb60' ~
,,--
'f......,.._ _ ...
i
--- r """",»
,." ....
r
---- ----- r_
- _ 1_1 c-Io I _
-- -
• Dé un clic en Aceptar y el gráfico en tres dimensiones aparecerá en la ventana
de resultados.
'-
s-¡
--
0 i0II>-
o
o
~'- = - __
~""
_. ~~ --7'
.... ..
,---
:::: -I _ =~·
...... ..
~_ ~ l -·.¡'ii'---¡¡;;"I----¡,.-I
o..ar- . .....
a.r.,de fITrtII •••
• Señale las variables que desea graficar y páselas alIado izquierdo, a cada uno de
los cuadros marcados como ejes, como se muestra en la figura.
---------------------------------------------
".11',1""
(ff"U r.',l111IJ di' IX
I fP tPor--.t.,¡" ($pct)
lJO!O FGH3 (fgh3cal)
..........
- 1, IrQgID ",,-..J -
V .......... ~ ---
Color; I Al ~ :1
Eodo: I a. ÁpIIf ·1
...-------
V.w.IHcW......, - - - --
-=---
--
_ _ _ JI
COn_
.....,
."'- 7$
-
_ _ dodotoo
deofk. n
!lO
!lO
65
n
n
5.t
69
75
79
E8
69
li6
65
69
!i6
51
81
• l ltpluf<H
[!]
F.clofea;
R_I
--
"-
rx
I
I
_.- j[-
ro
C~ __
N.... delot'..."'.......
ro---.......
P T.... """"
rHto!otJ.....
J
leomru. l
~I
Alu!al
...- 11
Cancellt
. ,I:l
[!] r GI_ con l>IUIboo do .......,¡,jod
Oiopoqo6n por rweI"", pruebe do u......- - - - ,
[!] ro
E_Ioo ..... _
r '"
r_r
¡ M08Ib. - --
E"",,_r.G'lficooj E ,- 1 G,Mioot... 0_
Irr T,wI_.
'1 norm3dor
P"'..- JlOll""'.... ::::J
j
Dé un clic en Aceptar y el gráfico de tallo y hojas para cada variable aparecerá
en la ventana de resultados.
,00 o
33,00 o 2222222333333333
63,00 o 4 4 44444444444444444455555555555
16,00 o 66666666667777777777777
21,00
2,00
o
,
8e8e8lS8IS8i9;9
13 , 00 1 223333
21,00 1144444555S55
18,00 1 66666711
11S,OO 1 8e81S999i
8,00 0111
6,00 233
4,00
7,00
4,00
6,00 011
2,00 2
10,00 lxeremes ( > -33)
Al: 17 •
Aii:;
,.
12
..
111
111
12
..,.
12
54
"-j
.,
0,0
,,»
",Q ~
83,1.
~:[ -:
19
•
u "747 1 - 55"
u·
"'1 ..56
'.' n.!
:~~ :~1'
...~-.
I h.U~1 ,1111,' .. d" , -1)" X • lb 1,'111111' ,l. , q' q'"I'I., H, '11111, 111' I',H , ,11 ·,,,11\ 111 X
1M
-·1
Ii!3s. c-I
I
, Ooh
~_od
IoNI
1 10<03
~Iooc ~
~--- ~I
~"""3
~ ...... ¡I' [D
~~
~fQhl
~1gcIo
A.....' . '
c.-I
l
~~
~-'913
~
I
I '"-~-- ~- -.J
('"1'1.......... " " ' . _ ... _ ,*_"'1." QJ [_100._ _ [ 5 ]
~FGAS31fooo3
¡;~"",........-
l. .
. --- <l>FGHN3_¡" • 't --
:::
. :::
10.10 Percentiles
En la barra menú de SPSS vaya a Analizar>Tablas>Tablas Personalizadas... ,
en este momento se despliega el cuadro de diálogo Tablas Personalizadas.
c"
Arctlyo Etklón Ver Datos Transformar l:.. Gráftc:os lJ:ldades "'ertana 1
~ IiiIJ~ ~ ~~ ~ ~J r,¡
Informes • ~J
Estadstlcos deSCr1JtIvos • .,
11:<10 ~2
do fecha
COrroarar medas • ConjJntos: de res:¡luest:as mút~les ... h
Modelo ..... a1 general •
~
62.00 03-MAR·91 Tobl.. b...., ... ..
1 Modelos mIXtos • Toblo> Qoneroie,,,.
2 63.00 Q4·MAR·91 CorrelacIOnes •
~
Tabl.. de res¡>.Jest .. .rul~, ...
3 63.00 Q4·MAR·91 Regre<lón • T1IblllS de frecueflClllS. ,.
4 63.00 Q4·MAR·91 Le>;¡Iineal • 1m
5 64.00 05-MAR·91 Clad'lcar •O 5.10 2,80 2,60
6 64.00 05·MAR·91 Reducción d. dotas •O 5.40 3.40 700
7 64.00 05-MAR·91
Escalas •O 6,70 4.10 5,60
8 65.00 ffi-MAR·91
Pruebas no p«Sl'IIétn::-,s •O 17.00 9,60 8,80
ffi-MAR·9 1
5e!1.. temporole< •
9 65.00 S4Jer""-'enda • OO 16.00 7,60 8,50
6)0
10
11
65.00
66.00
ffi-MAR·91
07·MAR-91
R.spuO<t .. .rullples
An~sl s die valor.s percldas •..
•O 15.00
12.00
6,90
4,60 8,!ll
1? ~h nn n7.MJl.Q.Ql n 7htl A An "lq('!
;:;~~;I:;;:;;;:';-;~.~~~~Ji1I~I ·
. --I - -'" Opciono.1
--
,"ec. . ..
T<SbI. Tltuloo l Etladr.lCO.d.con~asI.1
VeriabiM IHiiI N~ l!l CoaPo ~ CaQ<OO
11. ...
( ¡jOIUf""" I
,".."ocI. ~
"ga. 3[f" ..
'fgac[f_J
' fr;r.m3 (I. .. ¡
'frN[fr;J13J I
' fgrJ. (lgrJoJ
, •.mg>a3 ...
, •.m~
I".m<twn··
,
~
;
--'"
. ff
Celegorlet
5a. C4Ir:QoIId <
r'-"
.~
[Derri'
~ ~*I.dído:l de lettrne
I [E~r'~M '~~
PO$IC16n: CoI~ ~
Una vez que ha pasado las variables, dé clic en el lado derecho del mouse y en
el menú que se despliega, elija Seleccionar todas las variables de columna.
~
"'~
{vaIitJbIe'*' I
""o«
Elri"l.
Ctrl+v
5up<
• .".¡.¡ I Mostrar l"IOn"II:n de Yaflable
" MO$trar etl!JJeta de va~
~. ~~.:TI~.-!- ... :-~ ... _-'"':":. !",.;".~ ... _. :_ 1i 3
Defri,------..., Eotodlttioo,de_
~¡ ..d l _ ' d . _ .. PooicOl: CciJoM.. r ~ I P""''''d.. ~''og"".,
ti ~oI.egcAl".,..tot.elt:~ Ongon VftlOe, de "'...... o>or d""',o
Variable ~ fgac
E$ladralicot: ViaAaizaci6n;
Moda E....tIatic:o EIiauet.
1"1 .. '
~ ; I t"" I
1~
,'l
Percerd05
• 1P!ryri25
f'ercentj
f'ercentj
05
25
...
Rango MIKianI MIKianI ~- ....
Error Hpóco de la me<ia Percenti 75
D~.tr~
,. ._ ~
278 ESTADrSTICA D ESCRIPTIVA PARA ING ENIERrA AMBI ENTAL CON SPSS
CAPITULO 10 - INSTRU CCIONES EN SPSS
,-,..
'do(dol
''o*"pAL
..
1'"
I
I
Igool
~~".
,---
,.....,...
'ftlOIIDorl.-
.. ... .
". ,::; .¡:
:
CoIogaoíc
..
~
~
--'01
N.tt-._-¡
Doh - - - - - - - - ¡
t«e!P ar, .
J
--
..!.I.!.J.!l.:.J d!2J ~ ~
I!IT-::-
_1
_..
+ TIIIIIIIs persofMIIzadas
.60S
-
fGOSJ f~ FGfO
_:15
_15
U
-..
.~
'U
5.1
U
11~
71~
)~
,.,..-
U
..
l.f
,~
,."
emt... _ _ _ . .•
~ •• T'¡":J •
1Isignar._
~--- ...
I ~I ~-
_; a ca5D5•• •
~""""a
oeor_~ . ....
-.....,wIores ...........
GJ
....
v. ........ v... __
-......--- --
);.
¡;¡;;;;- ....... ,
~
'.~
- --
r_¡-
r _ ...._
I \ ' \, " " "
r ................. _
~
I
---,..... - . .-
r _~
".
c-_ _r-
, \ \
...
. ,. x
¡ - - ¡ - - C!J ....
r "-P ... tS!I -41
~ JI' .. l
1""- ¡-- ~
~ "'41'1,...-H1 ...
.!J r t.._. _ _ _
--,- 1 "-
¡;¡¡--_oI_ r
r T..... _ _ r ",-""""
.. I ...... ,~n" , c.. I ~
- 1- 1 ... '
Si requiere que en la Tabla cruzada generada por SPSS aparezcan los intervalos
y no las categorías, puede ir al Editor de datos de SPSS, y en la pestaña Vista
de variables (parte inferior derecha del editor) seleccionar las nuevas variables
creadas y asignar etiquetas, como se muestra en la figura.
MnQuno
v.ort'!S ~ ..
Oancha
~
Ningwlo 10 Oancha
Ningwlo Ninguno 8 o...ct..
5 Ninguno Ninguno 8 o.ndwo
- ----- Ningwlo Ninguno 8 Oe\'tCha
MnQuno Ninguno 8 o.ndwo
Tm-~'-
2.OO-~r Ningwlo Ninguno 8 Oincha
lOO-wmr MnQuno Ninguno 8 o...ct..
4,OO-"!!5Il-1~
NInguno Ninguno 8 o.ndwo
Ningwlo Ninguno 8 Oatac:No
MnQuno Ninguno 8 ~
lbIMirico 8 2 Ningwlo Ninguno 8 0IIrec:ha
l'bMnco 8 2 Ningwlo Ninguno 8 o.ndwo
lIbnénco B 2 Inlegrldo CatelNíjUño ¡Ninguno B o...ct..
llUnérico B 2 FGAS3 Cllleg Ninguno Ninguno 8 o.ndwo
I'bnérico 8 2 FGHI/D Categ MnQuno Ninguno 8 ~
lbIMirico 8 2 FGH) Categon Ningwlo Ninguno 8 Dancha
tUMnco 8 2 FGAC Categor MnQuno Ninguno 8 Oincha
•.1
l<f;~¡¡¡;c¡ediiiii$A\II$"" "" I/IlI""M ',.-------,1 ~ ... __________________
, , - - - - - - - - - - - - - - - - - - - - - - - -, r - - - - - -- -- -----------~
...
"d ..
R..... men
Tablas de contingencia
,_""o CatOS
V'lIdo. PercUdas Total
N Porc.nh', N Porcant. I N Portlntll'.
1nt8lJrada C¡tegorlca
.. FOAS3 Coalegorlca 294 I 100,Oc;l, I O I ,0'- mi 100,0'-
11
Gráficas en Excel
,-
22 70 11· ....-91 12'.0 7) 16.0 14)) 5) 62
n 70 11-"'..-91 240.0 7" 22.0 17 P 6)) 8,1
!J!r~~-=zt!í¡il1~J ,
PaI<D/ll1.
A B
'- - OO- - FÉctiA-
;w 191 IIhM91
2!11 192 I I .Ju~91
E ' 192 I I .Ju~91
:BJ 192 1 1 .Ju ~9 1
291 193 12.Ju~9 1
,292 193__ J 2~!,!:91
293 194 13-Ju ~9 1
294 194 13-M91
~ 195 - ""4-PJ?;u~:-';9:;"-1-- -
296 195 14-Ju~9 i
'B1
~
""'"
~ Anal
.....CfNTL :do....'!<3·c296)
A B
--------------
O E F
--------
G H
1 DO FECHA INTEGRADA FGAS3 FGAC FGHM] FGH3 FGosa
lf!l 191 l().Jul-91 40.0 47 13.0 6.5 6 .0 7.5
B 192 11.Ju1.91 34.0 3p 9 .4 7p 5p 6.8
2li9 192 11.Jul-91 56 .0 4S 15 .0 9.5 5S 7 .1
200 192 11.Jul-91 55 .0 4J1 17 .0 10.0 5p 62
291 193 12.Jul-91 66 .0 4A 9,6 9S 6p 710
292 193 12.Ju1-91 26 .0 4.0 6,9 7.5 6.0 6p
293 194 13.Jul-91 26.0 4.0 9J1 7S 5p 6,9
294 194 13.Ju1-91 26 .0 4p 9 J1 6Jl 6.2 6 Jl
295 195 U .Jul-91 21.0 4.' 9p 6.7 6J1 7 .1
296 195 1 ~Jul.91 17 41 6 6 6 .2 6,9
m
2!18 736 12.4 21.7 21.2 13.3 16.5
=deS'lllst¡c3 c296)
3D
.. •
,~t! _~..,ort.
'( \.J:'!I..Q.. """ ' A L'!I'AI\. .10:. ..... ..... ... ~ "" . c',," ¡ ¡¡¡¡ dilO. ,.. , ,.:d m".,.... :t&
. """ ' 1'0 .II...L..L ~..:.~ ;;:;t~ , ... _ .. *....If. • -iJ. -, "'- ..JI!'
PEMCDfT1L ~ -maxl'c3
~1 .....G2~ _ F
· F~ I F~
A B . . . . . . . . E ..
1 DO FEC ...... INTEGRADA FGAS3 FGAC FGH\13
7Hl 191 10.Ju1-91 _ 4il1l - 47 130 8.5 6 7Ji
l1.Jú-¡¡¡¡
:~
2BB 192 3,6 94 7 ,6 5 6.0
2BB 192 ll -Ju~91 45 15 9.5 5 71
I :~~~~-r ~t··
29D 192 4.8 17 5
291""' 193 44 9 \ºf- 6
8.2
7A
292 '*1--l. 1~.:-!~'91 26l! 40 6 7:' 6 8.Ii
m 194 13-1u1-91 26l! 4l! 9 7:, 5 6,9
294 194 I 13-Ju1-91 2sl! 4 .6 9.8 8l! 6.2 . 8Jl
295
296.
195
195
l ~ul-91
1 4.Ju~91
;;g 4 .4
41
9.6
8 .6
87
8l!
6.0
62
7.1
6.9
297
29B 73,6 12.4 21.7 21.2 13.3 ~6.5
;.
:rn l _.x 761
<30296)
11.8 18.5 16,0 10,0 I 15.1
'fl Olio cr
....
yi';lI,It.lt ,,ut¡.e,,1>-:l'J'A
".....
n , ,Q11:J . Jl.. ~ ~ LLII¡, i&· ""J-"1.,.,. -
....- ! -
.
Esot.VMI cnort.e
I
56l! 4.5 '5.0 9 .S S.5
~ 192 l1.JW.Sl 56l! 4 .0 17.0 10l! Sp 92
291 193 1:¡.,u.91 t 66 l! 44 9.6 9 :' 6.6 7 ,1
~ 193 12-Ju191 2611 411 6)1
193 194 1 ~1 2611 4.0 9 J1
7 .5
7.5
611
Si> t 6.6
6,9
:294 194 lJ..U.91 2611 4.6 9.0 8 Jl 6,2 9Jl
295 195 1~ 21 11 ¡ 4 .4 . 9~ 81 6 .11 . ~ 7,1
296 195 1 ~1 1711 41 8p 8 Jl 62 6,9
:Hl .
2!18 -. 73,6 12,4 2V 21.2 13,3 16.5 1
=.
:Jl1
,O-Uc"'OII_
tolú....
76 1
!BlJl
11 .8
11511
18.5
170l!
16.0
1:JJl!
10.0
81l! !
15.1
141lJl
í
- .
~1!!Ut.11t:!!~s.:!:"~ ~d~1 (l~r~E) r1flE2.~~¡~
~~ -
!!!:tl!1.L!!12J. I~~!1~:M!<........ "~'"'>... 7<"'''''''''''''''''' l •• ,....,
~. ~
><~ ..~ ~
I lit¡ «ros
lJ,l c"""',en~ I'I)JIO
..
(OOm!s y .."" ",00
"'
~ L..... coiaidos
IáL..... ",dos ejes
~~ I_ k~ n;_
~ L..... sua,;UIdos ....
10,00 ~ r.i"
'CAl' !'CAe
,....
40,(10
f
IIt L..... ycoUmos I
~GP'·,t;DI ....
~ Logorbn<o
----------=--=..
-'i~e:dl"''' de<do
, OOelHcbporelyslJ/llo
I
~;:::::;;:;:::;;;::;::=;::=~
M
Ci!i!:J~
1- ~ ~.br.. :
M&xino
.....-biedadl$E$300: jH$300
. ®¡ruqacb
B6tUo< del ojo de ,atogoñas (Xl: [.....-biedadl$f$1 :$1$1
del '"'l\l'ldo ele de catogorios (lI): --; L:III-'
En Datos de origen señale cada una de las series y en Nombre señale la casilla
que contiene el nombre Media y el Máximo; asígnele a cada uno sus Valores
correspondientes y en Rótulos del eje de categorías (x) señale el rango donde se
encuentran los nombres de las variables (pretratamientos).
Rótulos de eje de
Nombre Valores
Categorias (x)
A B o E F G H I
-¡--FECHA- DO INTEGRADA FGAS3 FGAC FGHM3 FGH3 FGDS3
293 13-Jul·91 194 28.00 4.60 9.ao 8.00 6.20 8.00
294 14-)ul·91 195 21.00 4.40 9.60 8,70 6.ao 7,10
295 U ·Jul·91 195 17 .00 4,10 8,60 8.00 6.20 6,90
29§.
297
medll 73,56 12,.5 21,19 13,26 16,1;1
299 m.,uma 5Ill,00 115.00 130,00 81,00 1~,oo
iiif deSVIaClon 76 11 1602 1000 15,11
301
iif 1eo,00
180.00
303
ii¡- 140.00
120,00
~
305 100,00
iis
307
iia
309
.
&O,()()
SOllO
,()()
20,00
ollO
-+-,",><>no
Con doble dic sobre las barras se desplegará el cuadro de diálogo Formato
de serie de datos ; dé un dic en la pestaña Barras de error Y; seleccione en
el subcuadro Presentar>Por exceso y en Personalizada:+ señale el rango
donde se encuentran los valores de la desviación estándar para las variables
(pretratamientos ).
~~·~~d~~~~i~ ·"d-~~--~·t:;~--··-··_~--··"'·~··-~'==>::=::::::=:':' ~I
Tr_
,.f,r-e-s:entar - - · - -------=il
rn . [¡JO
O
AnIb<>s
,cuantíe a. erNlf
~aIar fijo,
O PQrt:Enta)e'
O t ! e S - _:
O finr tt>;co
[5
15
[1
.:
..•
Por "".-. Por doRdo NilQul!>
~ I c:..nc..er
50 ~----------------~----------------------------~ 180
40 150
120
30
90
20
60
10 30
O O
FGAS3 FGAC FGHM3 FGH3
1- Media -+-Máximo I
11.2 Gráfico para media, máximo y mínimo
Calcule la media, el máximo y el mínimo para cada variable, como se indicó en
el procedimiento anterior. Adicionalmente, calcule la distancia desde la media
hasta el valor máximo y la distancia desde el valor mínimo hasta la media para
cada variable. Para esto debe restar al máximo el valor de la media, este valor será
el que aparecerá en el gráfico como el máximo, seguidamente reste a la media el
valor mínimo.
herramientas,
Seleccione el tipo de gráfico Líneas como se muestra en la figura, dé clic en
Siguiente,
T de Míen:
lIi CoUmas
=: a..rrM
~~~........................~.
~ CiraJar
It¿:Xl'(~)
lIIfII iwas
@ AnIos
*
~~
R.<IdíoI
~ lk6bujas
a...... dodoloo,
Series:Wt:
1_
®~
oc_
..-....,.. Ji]
- ,.,;¡,¡- - - - - -
.....-0_,...,..
c_
&_dolojodo_(X), ~~l : tH.l
!lm!~~!~_,._,'fi
T,_
o~
®~
., Mwoda.
0.....-
0 '"'""
--
n_ 1 Qo 1 .... do .... ' 1_"_1 OoW>do"'_
[!JCh]O
I- .
0- ,0 - - Par.allO Pw *'-ID ......
- 1- - 11 , ~ r-c-i::Jt:--"" <~dtti~
g,Iar, I~.=
- =:.:: ~ .... 1- Olelar"'" ~
c:....1
_.
O~:
-. I • "P>' • OQoMOón-.w,
0 __ E=tI
'-o ~ 1_ [:JI '"
0_ ® - - : + I-
_1_--
,"
!Si:] 1 .....·11.:.- 1
180 ~------------------------~
150 '---~---ir-""""----------- __'"
120 -b-~----~~~~--~------+--i
90 +-~----+-~~~--~----~~ l. Medial
60
30 +--+----~-----±---~r_---~~
o ~~----~~--..~----~~~
FGAS3 FGAC FGHM3 FGH3 FGDS3
herramientas.
Seleccione el tipo de gráfico XY (Dispersión) y el subtipo de gráfico Dispersión
con puntos de datos conectados por líneas sin marcadores de datos, como se
muestra en la figura, dé un clic en Siguiente; en Rango de datos seleccione el
rango correspondiente a la serie de datos; este rango debe incluir, además, una
variable que serán los valores del eje X, que para el ejemplo es el día de operación
(DO), los datos de turbiedad (eje Y) de las variables (pretratamientos) con sus
respectivos nombres. Dé un clic en Finalizar .
...........,..
,
-......... \, .
.
\
"",..
11 .,. ,~, <Jo J .1 1
t \ • .,. ,
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ --1
, ,. - .. 1M ...
180 -
160
140 • F GAS3
120 •
F GAC
100
80 i F GHM
60 I I F GH3
40 111, II I 1 FGDS3
20 - • ;.., Aul/\ 1:. .H I 1
o ~J~~"'~
o 50 100 150 200 250
,~_·_-JA;·_··-=t~i--'-- ''P1IM''(I'~
(..
4,_
~.'r
~~
\T
VI:.
.........
¡iijj ':
JI' ~
TF
'"
,-~
.:u.
' IlO
W.
'"
O
fF
..
~
. '--t-
: ';"..1.: o" • ¡.~ t _"_'::::~_
I,_:..
n ( •• ' .., ,.. :ni
ir
...."
llf
.tr
H
~_c;c;;;;7'iV
t-
• Para editar el formato de los ejes dé doble clic sobre el eje que necesita editar;
para el eje Yen Escala seleccione la opción Escala logarítmica. Para el eje X,
puede cambiar los valores máximo y mínimo del eje; para este ejemplo el día de
operación mínimo es 50, por lo que podemos escribir en valor mínimo 50 para
que los valores del eje X empiecen en 50 y no en cero.
292 ESTADIsTICA DESCRIPTI VA PARA ING ENI ERIA AMBIEN TAL CON SPSS
CAPiTULO 11 - GRÁFICAS EN EXCEL
-
~·J'!P.!PJI·..:.J·J:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~
.
~~~~:.::.=:::::,-f!
~
_:
~dIII ...
........"'.
..... L"""'*-I_IAftociín !
dt v.onas (Y) Aut_
~ Escol.
~doI*de"GOI"CS()O
I ...rte I ""-o I _Ión I
~
/J M<>mo:
-IrQ: 1:00 . ] Mi:ono.: 250
El tridad ........ :
~::::J ~ UnldodmaJ""' :
~ li*Iod me",, :
SO
I.tidodnUI(J"': 1'0 ] lO
E}6o. vafores(X) /J Ejc de """,.. ('1)
gUli..- !
io I g'\2OM: 150 I
lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4 ...~ i!3 Moltr(l' r~ de trldades: ¡;.dodesdovisuoliz";';": I ~". .~ _ . rótUode..-.dollos
~~i<Ío~"-E€ IJ EsulaPlriab
f'J ..,.,.., Ofden~ D "-"onor_~
r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno (] §e cM wkres (Y) cruI!a en VoIbr Ñ*'O
"'...... I ca-aIor I I
- 1I C........
I
1~ .-----------------------------------------
100 ~------------------+-------------------
1 +-----~------~--------------r_------------~
50 75 100 125 150 175 200
-
~·J'!P.!PJI·..:.J·J:;:''-'~''''''H ..... _~.....to:,....._ _ ..~...._~ ~
.
~~~~:.::.=:::::,-f!
~
_:
~dIII ...
........"'.
..... L"""'*-I_IAftociín !
dt v.onas (Y) Aut_
~ Escol.
~doI*de"GOI"CS()O
I ...rte I ""-o I _Ión I
~
/J M<>mo:
-IrQ: 1:00 . ] Mi:ono.: 250
El tridad ........ :
~::::J ~ UnldodmaJ""' :
~ li*Iod me",, :
SO
I.tidodnUI(J"': 1'0 ] lO
E}6o. vafores(X) /J Ejc de """,.. ('1)
gUli..- !
io I g'\2OM: 150 I
lJ'*Iede:s cID ..... .,d6n: !ffrQ&Al4 ...~ i!3 Moltr(l' r~ de trldades: ¡;.dodesdovisuoliz";';": I ~". .~ _ . rótUode..-.dollos
~~i<Ío~"-E€ IJ EsulaPlriab
f'J ..,.,.., Ofden~ D "-"onor_~
r:J ti. de yalorfl 00 0'UZ8 en '1lla mixno (] §e cM wkres (Y) cruI!a en VoIbr Ñ*'O
"'...... I ca-aIor I I
- 1I C........
I
1~ .-----------------------------------------
100 ~------------------+-------------------
1 +-----~------~--------------r_------------~
50 75 100 125 150 175 200
Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadísticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html
Referencias URL
http://escuela.med.puc.cl
htpp://www.uaq.mx/matematicas/estadísticas.html
htpp://www.dagmacali.gov.co
htpp://www.sma.df.gob.mx/simatlpnindicadores.html