Está en la página 1de 11

UNIVERSIDAD DEL CAUCA

FACULTAD DE CIENCIAS NATURALES, EXACTAS Y DE LA


EDUCACIÓN
CURSO VIRTUAL DE ESTADÍSTICA – Ingeniería Ambiental
PERIODO del 25 de Octubre al 22 de Marzo de 2022
TUTOR: Edwin Rengifo Canizales. Estadístico (Mg)-U.V.
Profesor Titular de Planta - Depto. de Matemáticas

MATERIAL DE CLASE # 2

CAPITULO I
EXPLORANDO GRÁFICAMENTE DISTRIBUCIONES DE
DATOS

LA DISTRIBUCIÓN DE UNA VARIABLE NUMÉRICA DISCRETA

Ejemplo 2: Durante una época del año se registró, en una zona geográfica, el número de días con
lluvia por semana. Los resultados obtenidos para un conjunto de 15 semanas fueron los siguientes:
4 0 3 1 2 2 1 1 0 2 3 2 2 1 5.
¿Inicialmente, como podemos caracterizar gráficamente la distribución de estos datos? (¡no de estos
números!)
Empecemos con algunas preguntas:
¿Cuál es la variable en estudio? Sea 𝑋: “número de días con lluvia”. ¿Cuál es
la unidad de observación? Cada una de las 15 semanas. ¿Esta variable de qué
naturaleza o tipo es? Cuantitativa discreta, puesto que no puede tomar cualquier
valor, no se habla de semanas con, por ejemplo, 3.4 días con lluvia. ¿De dónde
a dónde varía el número de días con lluvia por semana, en este caso? ¡De 0 a 5, muy bien! ¿Cuántos
valores diferentes arrojó la variable, en este caso? Seis valores diferentes, así es. ¿Algunos valores se
repiten? Claro que sí. ¿Cuáles? El 1, el 2 y el 3. La repetición de datos hace que aparezca la frecuencia
absoluta de los mismos.
Para describir visualmente la distribución de una variable numérica discreta, se presentan acá dos
gráficos que, usualmente, se conocen con los siguientes nombres: el diagrama de puntos, y el que ya
conocemos como, diagrama de barras. Veamos el primero:

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
▪ El Diagrama de puntos:
Se utiliza para describir visualmente la distribución de pequeños conjuntos de datos (30 o menos)
para variables numéricas. Para su construcción se realiza una escala horizontal que cubra la variación
total de los datos. Cada dato o valor se representa por un punto a lo largo de la escala de valores.
Cuando hay valores repetidos, se apilan los puntos uno encima del otro para cada valor repetido.

Mediante el conteo del número de semanas con igual número de días con lluvia, se observa que en
los datos hay dos semanas donde no hubo días con lluvia ( hay dos ceros), esto significa que en el
diagrama de puntos se colocan dos puntos, uno encima del otro, en el valor 0; como hay cuatro unos
(1) en los datos, se colocan cuatro puntos, uno encima del otro, sobre el valor 1, y así sucesivamente,
generándose el gráfico de la Figura 10, el cual corresponde al diagrama de puntos para estos datos.

Figura 10. Diagrama de puntos de la distribución de 15 semanas


según el número de días con lluvia

En IBM SPSS se definen las variables semana y días con lluvia. Se introducen los datos en las
columnas correspondientes. Gráficos>Cuadros de diálogos antiguos>Dispersión/Puntos>Puntos
simple>Definir: Variable del eje X: días_con_lluvia>Aceptar.

Análisis del gráfico:

Se observa que hay una alta concentración, aglomeramiento o tendencia de valores hacia la izquierda
de la distribución (indicando que hay alta concentración de semanas con pocos días lluviosos). En
pocas palabras, se puede decir que predominan las semanas con pocos días con lluvia. También se
observan algunos pocos valores a la derecha de la distribución, indicando posibles datos atípicos o
erráticos, lo cual está indicando que algunas pocas semanas presentaron un mayor número de días
con lluvia. Se debe argumentar porqué se está presentando, desde el punto de vista ambiental
(geográfico, biológico, etc.), el tipo de distribución estadística de los datos que se están revelando en
el gráfico.

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
▪ El Diagrama de barras: Se puede pasar directamente del diagrama de puntos al diagrama de
barras, simplemente contando el número de puntos apilados sobre cada valor, lo cual genera las
respectivas frecuencias absolutas. A partir de allí, se pueden calcular las frecuencias relativas y
proceder a construir la tabla de frecuencias para la variable numérica discreta. De manera similar
para las variables categóricas, la información de una variable numérica discreta se puede resumir
en una tabla de frecuencias que incluye un conteo de las frecuencias absolutas y el cálculo de
las frecuencias relativas asociadas a los 𝒎 valores diferentes de la variable, para el conjunto total
de 𝒏 datos. En lugar de las categorías de la variable cualitativa, se listan los distintos valores o
mediciones numéricas que aparecen en los 𝒏 datos y se cuentan sus frecuencias. A diferencia del
caso con datos categóricos, donde las categorías pueden ser colocadas en cualquier orden, los
datos discretos tienen un orden natural que siguen sus distintos valores numéricos.
Para las variables numéricas discretas, se utiliza el símbolo (𝒙𝒊 ) para representar el i-ésimo valor
diferente de la variable 𝑿. El número total de valores diferentes de la variable 𝑿 en la tabla de
frecuencias se denota por la letra 𝒎. La frecuencia relativa ℎ𝑖 se define como ℎ𝑖 = 𝑛𝑖 ⁄𝑛 y se
multiplica por 100%, también se denota por ℎ(𝑥 = 𝑥𝑖 ). Esto da origen a la tabla de frecuencias
que se muestran en el Cuadro 4. Para construir el diagrama de barras se levantan barras o
rectángulos de altura igual a cada frecuencia relativa.
Cuadro 4. Distribución de frecuencias de 15 semanas según el
número de días con lluvia por semana.
Número de
Nro. de Porcentaje de
días con
semanas semanas
lluvia por
(𝒏𝒊 ) (𝒉𝒊 )
semana
0 2 13.3%
1 4 26.7%
2 5 33.3%
3 2 13.3%
4 1 6.7%
5 1 6.7%
𝒎=𝟔 𝒏 = 𝟏𝟓 100.0%
La Figura 10 presenta el diagrama de barras para el porcentaje de días con lluvia por semana.

Figura 10. Diagrama de barras de la distribución porcentual de 15


semanas según el nro. de días con lluvia
Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
 Actividad_4: Mediante las instrucciones siguientes, realizar en casa, mediante Excell, el
diagrama de barras para el Cuadro 4.

En Excell (diagrama de barras): se copian las columnas (1) y (3) del Cuadro 2, desde los títulos y sin incluir
totales, en las columnas A y B. Se señala desde la casilla A1 hasta B7. Se da click en Insertar>Gráfico de
barras>Columna agrupada. Sale el gráfico. Dar click derecho en las barras>Agregar etiquetas de datos>. Dar
click izquierdo en las barras. >Relleno y línea>Relleno de trama>primer plano y fondo para colores.
Borde>Efectos>Formato 3D. Negrilla. Maquillar diagrama de barras. Ver Figura 11(b).

Una de las características a explorar y describir en una distribución de datos es la forma que ésta
puede adoptar. Algunas de estas formas típicas de distribuciones de datos se dan a continuación:

 SIMÉTRICA TIPO CURVA NORMAL (Campana de Gauss):

Figura 11(a). Diagrama de puntos de una distribución simétrica Figura 11(b). Diagrama de barras de una distribución simétrica

El diagrama de puntos de la Figura 11 exhibe una forma simétrica, de campana de Gauss o de Curva
Normal. En este tipo de distribución, la gran mayoría de los valores de la variable tienden al centro
de la misma y muy pocos hacia los extremos.
Ejemplo 3: Para el siguiente conjunto de datos sobre el número de habitantes por vivienda: 1 7 0 1
2 1 2 0 1 3 1 6 2 0 1 5 1 3 0 y 0. Realizar los diagramas de puntos y de barras.
Las Figuras 12(a) y 12(b) muestran los diagramas de puntos y de barras, respectivamente, para los
datos del ejemplo del número de semillas germinadas por matera.

Fig. 12(a). Diagrama de puntos de distribución asimétrica positiva A(+) Fig. 12(b). Diagrama de barras de distribución asimétrica positiva A(+)
Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
 ASIMÉTRICA POSITIVA:
La forma de las Figuras 12(a) y 12(b) se ve que el lado derecho se extiende mucho más que el lado
izquierdo, se dice que se presenta una distribución asimétrica positiva o que tiene sesgo positivo. Ello
significa que la gran mayoría de los datos tienden a concentrarse alrededor de un rango de valores
menores dando forma de “joroba” a la izquierda, y el resto (muy pocos) son datos dispersos de
valores mayores a la derecha (en la “falda” o “cola” superior) de la distribución. Según Quinn y
Keough (2007:62), este tipo de asimetría (positiva) es la más común en datos biológicos para variables
continuas (como el peso) y en la distribución de conteos de individuos. Según Quinn y Keough
(2007:62), este tipo de asimetría (positiva) es la más común en datos biológicos para variables
continuas (como el peso) y en la distribución de conteos de individuos.
Interpretación: predominan materas con un menor número de semillas germinadas.

 ASIMÉTRICA NEGATIVA:

Ejemplo 4: Se observó el número de habitantes por vivienda en una muestra de 15 viviendas rurales.
Los datos recolectados fueron los siguientes: 8 10 7 10 11 9 6 7 10 8 10 9 11 9 y 10. Las
Figuras 13(a) y 13(b) muestran, respectivamente, el diagrama de puntos y de barras para los datos
del ejemplo, dejando ver un tipo de distribución de frecuencias de forma asimétrica negativa.

Figura 13 (a). Diagrama de puntos de una distribución asimétrica negativa Figura 13(b). Diagrama de barras de una distribución asimétrica negativa

En distribuciones con esta forma, la gran mayoría de los datos tienden a concentrarse alrededor de un
rango de valores mayores dando forma de “joroba” a la derecha, y el resto (muy pocos) son datos
dispersos de valores menores a la izquierda, la gran mayoría de los datos tienden a concentrarse
alrededor de un rango de valores mayores dando forma de “joroba” a la derecha, y el resto (muy
pocos) son datos dispersos de valores menores a la izquierda.

Este tipo de distribución asimétrica negativa es muy común en datos económicos, como, por ejemplo,
la distribución de los ingresos de los hogares japoneses adoptaría este tipo de distribución e indicaría
que una gran mayoría de hogares japoneses tienden a tener ingresos mayores y muy pocos hogares
tienden a tener ingresos menores.

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
Interpretación: A partir de las Figuras 13(a) y 13(b), se observa que predominan viviendas con un
mayor número de habitantes. ¿Porque se presenta dicha forma? Habrá que dar cuenta de ello.

 BI-MULTIMODAL:

Ejemplo 5. En un estudio demográfico se observó el número de habitantes por vivienda para una
muestra de 30 viviendas. Los datos recolectados fueron:
4 5 3 10 7 8 1 3 2 8 10 9 1 1 3 6 9 10 2 2 2 11 7 11 2 1 2 9 10 10. Las Figuras 14(a)
y 14(b) muestran, respectivamente, los diagramas de puntos y de barras para los datos del Ejemplo
5.

Las Figuras 14(a) y 14(b) dejan ver claramente dos gráficos bimodales o con dos zonas de alta
concentración o conglomerados de datos o valores. Si se nos advirtiera que unas viviendas están
ubicadas en la zona urbana y otras en la zona rural, la mezcla datos sobre el número de habitantes por
vivienda de las dos zonas, la Urbana y la Rural, se manifiesta en el gráfico al revelarse dos “jorobas”.

Figura 14(a): Diagrama de puntos del Ejemplo 5. Figura 14(b): Diagrama de barras del Ejemplo 5

Interpretación:
La “joroba” de la izquierda conglomera a las viviendas de la zona Urbana y los datos debajo de la
“joroba” de la derecha conglomera a las viviendas de la zona Rural, con mucho mayor número de
habitantes por vivienda que las viviendas de la zona Urbana.

En el caso de las variables numéricas discretas y con relación al Cuadro 2 del Ejemplo 3, se debe
completar la tabla de frecuencias con las llamadas frecuencias acumuladas, tanto absolutas como
relativas. Para ello, se suele insertar dos columnas adicionales a la derecha, que corresponden al
conteo y porcentaje acumulado de unidades cuyo valor en la característica 𝑿 es menor o igual al i-
esimo valor diferente 𝒙𝒊 , respectivamente. Estas frecuencias se conocen como frecuencias absolutas
acumuladas ( 𝑵𝒊 ) y frecuencias relativas acumuladas (representadas por 𝑯𝒊 ). Estas frecuencias
acumuladas se definen de la siguiente manera:

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
𝑵𝒊 = 𝒏𝟏 + 𝒏𝟐 + ⋯ + 𝒏𝒊 = ∑𝒊𝒋=𝟏 𝒏𝒋 : corresponde a la frecuencia absoluta acumulada hasta el i-
ésimo valor diferente de la variable. Se obtiene al ir sumando las frecuencias absolutas hasta el i-
ésimo valor diferente de la variable. 𝑵𝒊 se denomina frecuencia absoluta acumulada.

𝑯𝒊 = 𝒉𝟏 + 𝒉𝟐 + ⋯ + 𝒉𝒊 = ∑𝒊𝒋=𝟏 𝒉𝒋 : corresponde a la frecuencia relativa acumulada hasta el i-ésimo


valor diferente de la variable. Se obtiene al ir sumando las frecuencias relativas hasta el i-ésimo valor
diferente de la variable. 𝑯𝒊 se denomina frecuencia relativa acumulada.

El Cuadro 5 presenta la tabla de frecuencias ampliada del Cuadro 4, incluyendo las frecuencias
acumuladas. Algunas de las frecuencias absolutas acumuladas y frecuencias relativas acumuladas
ascendentes del Cuadro 4, se obtienen de la siguiente manera:
𝑵𝟏 = 𝒏 𝟏 = 𝟐 ;
𝑵𝟐 = 𝒏𝟏 + 𝒏𝟐 =2+4=6=𝑵𝟏 + 𝒏𝟐 ;
𝑵𝟑 = 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 = 𝟐 + 𝟒 + 𝟓 = 𝟏𝟏 = 𝑵𝟐 + 𝒏𝟑 ;
.
.
.
𝑯𝟏 = 𝒉𝟏 = 𝟏𝟑. 𝟑% ;
𝑯𝟐 = 𝒉𝟏 + 𝒉𝟐 =13.3%+26.7%=40%=𝑯𝟏 + 𝒉𝟐 ;
𝑯𝟑 = 𝒉𝟏 + 𝒉𝟐 + 𝒉𝟑 = 𝟏𝟑. 𝟑% + 𝟐𝟔. 𝟕% + 𝟑𝟑. 𝟑% = 𝟕𝟑. 𝟑% = 𝑯𝟐 + 𝒉𝟑
.
.
.
Cuadro 5. Tabla completa de distribución de frecuencias de 15 semanas según el
número de días con lluvia.

Nro. de
días con Porcentaje Número Porcentaje
Nro. Número de
lluvia de acumulado acumulado de
(subíndice) semanas
por semanas de semanas semanas
(𝒊) (𝒏𝒊 )
semana (𝒉𝒊 ) (𝑵𝒊 ) (𝑯𝒊 )
(𝒙𝒊 )
1 𝒙𝟏 =0 2 13.3% 2 13.3%
2 𝒙𝟐 =1 4 26.7% 6 40.0%
3 𝒙𝟑 =2 5 = 𝑛3 33.3%=ℎ3 11=𝑵𝟑 73.3%=𝐻3
4 𝒙𝟒 =3 2 13.3% 13 86.6%
5 𝒙𝟓 =4 1 6.7% 14 93.3%
6 𝒙𝟔 =5 1 6.7% 15 100%
𝒎=𝟔 Totales 𝒏 = 𝟏𝟓 100%
Fuente: elaboración propia.

 Ilustración II: Del Cuadro 5 se pide interpretar las siguientes frecuencias: 𝒏𝟑 ; 𝒉𝟑 ; 𝑵𝟒 y 𝑯𝟒 y


calcular el número total de días con lluvia durante las 15 semanas.
(referirse al diagrama de barras)
Solución:

𝒏𝟑 = 𝟓 : puesto que corresponde a la frecuencia absoluta del tercer valor diferente en la tabla (𝑖 = 3)

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
Interpretación: En 5 de las 15 semanas hubo de a dos días con lluvia, lo cual ocurrió en el 33.3% de
las semanas observadas.
----------
𝒉𝟑 = 𝟑𝟑. 𝟑% , puesto que corresponde a la frecuencia absoluta del tercer valor diferente en la tabla
(𝑖 = 3)

Interpretación: El 33.3% de las semanas tuvieron 2 días con lluvia.


----------
𝑵𝟒 = 𝟏𝟑 puesto que corresponde a la cuarta frecuencia absoluta acumulada, el subíndice 𝑖 es igual
a 4 (𝑖 = 4)

Interpretación: Trece semanas presentaron 3 o menos días con lluvia, lo cual ocurrió el 86.6% de
las veces (las semanas).
----------
𝑯𝟒 = 𝟖𝟔. 𝟔% puesto que corresponde a la cuarta frecuencia relativa acumulada, el subíndice 𝑖 es
igual a 4 (𝑖 = 4)

Interpretación: El 86.6% de las semanas presentaron 3 o menos días con lluvia.

▪ ¿Cuál fue el número total de días con lluvia durante las 15 semanas?

Se debe calcular un total, el cual se obtiene sumando los productos del número de días con lluvia
(𝑥𝑖 ) por el número de semanas con dicho número (𝑛𝑖 ), así:

6
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑖𝑎𝑠 𝑐𝑜𝑛 𝑙𝑙𝑢𝑣𝑖𝑎 = 𝑻 = ∑ 𝑥𝑖 𝑛𝑖 = 0𝑥2 + 1𝑥4 + 2𝑥5 + 3𝑥2 + 4𝑥1 + 5𝑥1 = 29
𝑖=1

◼ Función empírica de distribución acumulativa: Se simboliza por 𝑯(𝒙) e indica el porcentaje de


datos, observaciones o unidades cuyo valor en la característica numérica 𝑿 es menor o igual al valor
particular 𝒙. Se obtiene sumando las frecuencias relativas no acumuladas de los valores menores o
iguales al valor particular 𝒙. De manera simplificada, la función empírica de distribución acumulativa
se define como: 𝑯(𝒙) = 𝑯(𝑿 ≤ 𝒙) = ∑𝒙𝒊 ≤𝒙 𝒉(𝒙) = 𝑯𝒊 .

Con base en esta definición, calcular e interpretar: 𝑯(𝟐) y 𝑯(𝟒)

Solución:

▪ 𝑯(𝟐): indica el % de semanas con 2 o menos días con lluvia, por semana.

Solución:

Recordar la siguiente notación: 𝒉𝒊 = 𝒉(𝑿 = 𝒙𝒊 ) = 𝒉(𝒙𝒊 ), 𝒊 = 𝟏, 𝟐, … , 𝒎

En nuestro caso, se tiene que 𝑥3 = 2. Por tanto,

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
𝑯(𝑿 ≤ 𝟐) = 𝑯(𝑋 ≤ 𝑥3 ) = 𝒉(𝒙𝟏 ) + 𝒉(𝒙𝟐 ) + 𝒉(𝒙𝟑 )
= ∑ 𝒉(𝒙𝒊 ) = 𝒉(𝒙𝟏 = 𝟎) + 𝒉(𝒙𝟐 = 𝟏) + 𝒉(𝒙𝟑 = 𝟐) =
𝒙𝒊 ≤𝟐
= 𝟏𝟑. 𝟑% + 𝟐𝟔. 𝟕% + 𝟑𝟑. 𝟑% = 𝟕𝟑. 𝟑%
Observe que el tercer valor diferente en el Cuadro 5, es decir, 𝑥 = 𝑥3 = 2 y 𝑯(𝟐) = 𝑯𝟑 = 𝟕𝟑. 𝟑%,
de acuerdo a la definición, puesto que 𝑥3 ≤ 2 < 𝑥4
Interpretación: El 73.3% de las semanas presentaron 2 o menos días con lluvia.
-----------------

▪ 𝑯(𝟒) = 𝑯(𝑿 ≤ 𝟒) = ∑𝒙≤𝟒 𝒉(𝒙) = 𝒉(𝒙 = 𝟎) + 𝒉(𝒙 = 𝟏) + ⋯ + 𝒉(𝒙 = 𝟒) = 𝟏𝟑. 𝟑% + 𝟐𝟔. 𝟕% + ⋯ +


𝟔. 𝟕% = 𝟗𝟑. 𝟑%

Observe que el quinto valor diferente en el Cuadro 5, es decir, 𝑥 = 𝑥5 = 4 y 𝑯(𝟒) = 𝑯𝟓 = 𝟗𝟑. 𝟑%,
de acuerdo a la definición, puesto que 𝑥5 ≤ 4 < 𝑥6
Interpretación: El 93.3% de las semanas presentaron 4 o menos días con lluvia. Observe que de aquí
se sigue que sólo el 6.7% de las semanas presentaron más de 4 días con lluvia. En símbolos se tiene
𝒉(𝒙 > 𝟒) = 𝟏𝟎𝟎% − 𝑯(𝟒) = 𝟏𝟎𝟎% − 𝟗𝟑. 𝟑% = 𝟔. 𝟕%
Ley del porcentaje superior: 𝒉(𝒙 > 𝒙𝟎 ) = 𝟏𝟎𝟎% − 𝑯(𝒙𝟎 ) .
Esta ley indica que el porcentaje de datos cuyo valor en 𝑋 es superior a 𝒙𝟎 es igual al 100% menos el
porcentaje de datos cuyo valor en 𝑋 es menor o igual a 𝒙𝟎 .
Por ejemplo, calcular 𝒉(𝒙 > 𝟑). Según la ley del porcentaje superior se tendría: 𝒉(𝒙 > 𝟑) =
𝟏𝟎𝟎% − 𝑯(𝟑) = 𝟏𝟎𝟎% − 𝟖𝟔. 𝟔% = 𝟏𝟑. 𝟒%.
Interpretación: El 13.4% de las semanas presentaron más de 3 días con lluvia.

 Ilustración III: Del Cuadro 5 se pide interpretar las siguientes proposiciones:

i)El porcentaje de semanas durante las cuales se presentaron entre 1 y 4 días con lluvia.

Solución: Observe que la proposición incluye ambos valores 1 y 4. Simbólicamente, esta proposición
se puede representar como 𝒉(𝟏 ≤ 𝒙 ≤ 𝟒), y se calcula así:

𝒉(𝟏 ≤ 𝒙 ≤ 𝟒) = ℎ(𝑥 = 1) + ℎ(𝑥 = 2) + ℎ(𝑥 = 3) + ℎ(𝑥 = 4). Reemplazando los valores del
Cuadro 3, se tiene:

𝒉(𝟏 ≤ 𝒙 ≤ 𝟒) = 𝟐𝟔. 𝟕% + 𝟑𝟑. 𝟑% + 𝟏𝟑. 𝟑% + 𝟔. 𝟕% = 𝟖𝟎%


Interpretación: El 80% de las semanas observadas presentaron entre 1 y 4 días con lluvia.

2i) Calcular el porcentaje de semanas durante las cuales se presentó más de 1 día con lluvia pero no
más de 4.

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
Solución: Observe que la proposición no incluye el valor 1 pero si el valor 4. Simbólicamente, esta
proposición se puede representar como: 𝒉(𝟏 < 𝒙 ≤ 𝟒). Para su cálculo, restamos a la proposición (i)
la frecuencia relativa ℎ(𝑥 = 1), así:
𝒉(𝟏 < 𝒙 ≤ 𝟒) = ℎ(1 ≤ 𝑥 ≤ 4) − ℎ(𝑥 = 1). Reemplazando los valores dados en el Cuadro 5, se
tiene:
𝒉(𝟏 < 𝒙 ≤ 𝟒) = 𝟖𝟎% − 𝟐𝟔. 𝟕% = 𝟓𝟑. 𝟑%; o h(x=2)+h(x=3)+h(x=4)=33.3%+13.3%+6.7%=53.3%

Interpretación: El 53.3% de las semanas observadas presentaron más de 1 día con lluvia pero no
más de 4. Esta proposición es equivalente a afirmar que el 53.3% de las semanas presentaron entre 2
y 4 días con lluvia.
La proposición anterior también se puede calcular utilizando la función empírica acumulativa 𝑯(𝒙)
mediante la siguiente igualdad:
𝒉(𝟏 < 𝒙 ≤ 𝟒) = 𝑯(𝟒) − 𝑯(𝟏) = 𝑯(𝑿 ≤ 𝟒) − 𝑯(𝑿 ≤ 𝟏) = 𝟗𝟑. 𝟑% − 𝟒𝟎. 𝟎% = 𝟓𝟑. 𝟑%.

En general, para una variable discreta 𝑋 se puede establecer la siguiente propiedad:

𝒉(𝒂 < 𝒙 ≤ 𝒃) = 𝑯(𝒃) − 𝑯(𝒂), para 𝒂 < 𝒃.

3i) El porcentaje de semanas durante las cuales se presentó por lo menos 1 día con lluvia, pero menos
de 4.

Solución: Observe que la proposición incluye el valor 1 pero no el valor 4. Simbólicamente, esta
proposición se puede representar como: 𝒉(𝟏 ≤ 𝒙 < 𝟒). Para su cálculo, restamos a la proposición
(2i) la frecuencia relativa del valor correspondiente a ℎ(𝑥 = 4), así:

𝒉(𝟏 ≤ 𝒙 < 𝟒) = ℎ(1 ≤ 𝑥 ≤ 4) − ℎ(𝑥 = 4). Reemplazando los valores correspondientes, se tiene:
𝒉(𝟏 ≤ 𝒙 < 𝟒) = 𝟖𝟎% − 𝟔. 𝟕% = 𝟕𝟑. 𝟑%; h(X=1)+h(X=2)+h(X=3)=26.7%+33.3%+13.3%=73.3%

Interpretación: El 73.3% de las semanas observadas presentaron por lo menos 1 día con lluvia,
pero menos de 4. Esta proposición es equivalente a afirmar que el 73.3% de las semanas presentaron
entre 1 y 3 días con lluvia.

5i) Realice el diagrama de “escalera” para los datos del Cuadro 5.

En forma breve, la función empírica de distribución acumulativa, 𝑯(𝒙), se define como:

0 , si 𝒙 < 𝒙𝟏
𝑯(𝒙)= 𝑯𝒊 , si 𝒙𝒊 ≤ 𝒙 < 𝒙𝒊+𝟏, 𝒊 = 𝟏, 𝟐, … . , 𝒎 − 𝟏
100% , si 𝒙 ≥ 𝒙𝒎

Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2
Siendo 𝑥1 el primer valor de la variable en la tabla y 𝑥𝑚 el último. Si se lleva a porcentaje, la función
termina en 100%. La gráfica de la función empírica de distribución acumulativa se conoce como
diagrama de “escalera”.

Nota: El cálculo de 𝑯(𝒙) para un valor particular 𝒂, se obtiene gráficamente al acercarse por la
derecha al valor 𝒂. En notación matemática se tiene: 𝑯(𝒂) = 𝐥𝐢𝐦+ 𝑯(𝒙):
𝒙→𝒂

 Ilustración IV: Al observar la columna 𝐻𝑖 del Cuadro 5 para el ejemplo planteado, se define 𝐻(𝑥)
como:
0.00% , si 𝒙<𝟎
13.3% , si 𝟎≤𝒙<𝟏
40.0% , si 𝟏≤𝒙<𝟐
𝑯(𝒙) = 73.3% , si 𝟐≤𝒙<𝟑
86.6% , si 𝟑≤𝒙<𝟒
93.3% , si 𝟒≤𝒙<𝟓
100.0% , si 𝒙≥𝟓

La Figura 15 muestra dicha representación para los datos del Cuadro 5.


▪ Representación gráfica de 𝑯(𝒙): diagrama de “escalera”

𝑯(𝒙)

% semanas
Cada “salto” o peldaño en el diagrama de “escalera” es
igual a la frecuencia relativa de cada valor de la variable.
100.0%
La diferencia 𝑯(𝒙𝒊 ) − 𝑯(𝒙𝒊−𝟏 ) = 𝒉(𝒙𝒊 ) equivale al
100% 93.3% tamaño de cada salto o peldaño y representa el “salto”
86.6% o frecuencia del valor 𝒙𝒊 .
80% 73.3%
Ej: 𝑯(𝟐) − 𝑯(𝟏) = 𝟕𝟑. 𝟑% − 𝟒𝟎. 𝟎% = 𝟑𝟑. 𝟑%
60% “salto”=73.3%-40%=33.3% 33.3% es el “salto” o frecuencia relativa del valor 𝑥3 =
40% 2.
40%
Observe que los peldaños son más altos para los valores
20% 13.3% menores y más pequeños para los valores mayores, esto
debido a la asimetría positiva de la distribución. Observe
que la función escalonada crece más rápidamente al
0 1 2 3 4 5 principio que al final, puesto que es más frecuente tener
semanas con menor número de días con lluvia.
Número de días con lluvia por semana
Figura 15. Diagrama de escalera de frecuencias relativas acumuladas para la distribución del número de días con lluvia por semana

Fin material de clase # 2


Prof. Edwin Rengifo C. – Unicauca – Programa de Ing. Ambiental - Curso de Estadística – Oct 25 - Marzo 22 de 2022.
Material de Clase # 2

También podría gustarte