Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4.1. Introduccin
En los cursos bsicos de estadstica, el captulo que corresponde a Estadstica
Descriptiva, aparece como un tema aislado, que puede ir antes o despus de la parte de
probabilidad. En estas condiciones no se aprovechan algunos desarrollos de la Estadstica
Descriptiva que podran ser usados como un puente intuitivo para la comprensin de
resultados ms abstractos de la teora de la probabilidad. En este artculo se har referencia
especfica al concepto de histograma, representacin de la funcin emprica de densidad
para dar sentido a la definicin de variable aleatoria continua.
Una primera contradiccin que podra enfrentar un estudiante, es que cuando
aprendi su concepto de histograma, las ordenadas del grfico representaban la frecuencia
relativa, sin embargo en la extensin de la idea de histograma a la de densidad de
probabilidad, se propone el clculo del rea bajo la curva para calcular la probabilidad y no
las ordenadas. Esta fractura no tiene explicacin alguna, convirtindose posiblemente en un
obstculo para el aprendizaje significativo de la funcin de densidad de probabilidad.
Si se quiere que la funcin de densidad de probabilidad sea una extensin de la idea
de histograma, es conveniente que la definicin de histograma se corresponda con el grfico
de funcin de densidad emprica. De esta manera se garantiza una continuidad en el
concepto y se proporciona una base intuitiva para la comprensin de la definicin de
variable aleatoria continua, que es generalmente es matemtica.
En J. M. Contreras, G. R. Caadas, M. M. Gea y P. Arteaga (Eds.), Actas de las Jornadas Virtuales en
Didctica de la Estadstica, Probabilidad y Combinatoria (pp. 229-235). Granada, Departamento de
Didctica de la Matemtica de la Universidad de Granada, 2013.
Intervalo
(Aos de Antigedad)
(0-2]
(2-3]
(3-5]
(5-10]
(10-20]
Frecuencia Relativa
% (fi)
10
5
40
40
5
100
f*i, del rectngulo construido sobre el i-simo intervalo, deber ser tal que el rea del
rectngulo Ai coincida con su frecuencia fi, es decir que:
Ai
fi
(base).(altura) Ci . f i *
donde Ci es el ancho del intervalo. As, despejando f*i, se obtiene la altura (ordenada
eje vertical) que debe tener cada rectngulo: f i* f i .
Ci
Observe que se divide la frecuencia relativa entre el nmero de unidades que tenga el
intervalo correspondiente, entonces las unidades de f*i son (% de datos por cada unidad de
la variable en dicho intervalo). Veamos por ejemplo para el primer intervalo:
f1 10% C1
as que la altura del primer rectngulo es:
f1*
f1
C1
,
10%
2 aos
5% / ao
Es intuitivamente claro, que si el primer intervalo tiene el 10% de los datos y estos
datos estn distribuidos en un intervalo que tiene una longitud de dos (2) unidades, pues en
promedio hay 5% por cada unidad (f*i=5% /ao=0.05/ao).
El cuarto intervalo, (5; 10], por ejemplo, en sus 5 unidades (5 aos) contiene 40% de
los datos. As que en promedio, hay 8% de los datos en cada unidad o lo que es lo mismo:
f 4*
f4
C4
40%
5 aos
8% / ao 0, 08 / ao
Es decir que las unidades del eje Y en el grfico del histograma es %/unidad de
intervalo, por eso se le conoce como densidad de frecuencia (f*i) y en este caso, para tomar
en consideracin que se calcula con base en los datos de una muestra, se le llama funcin
emprica de densidad de frecuencia. En la siguiente tabla, se registra la densidad emprica
de frecuencia para cada intervalo.
Tabla 2. Densidad emprica de frecuencia para la variable antigedad
Intervalo
Frecuencia Relativa Densidad de Frecuencia
(Aos de Antigedad)
fi %
f*i %/ao
1
(0-2]
10
5
2
(2-3]
5
5
3
(3-5]
40
20
4
(5-10]
40
8
5
(10-20]
5
0,5
Total
100
i
Observe que el rea sombreada se calcula sumando por un lado las reas de los
primeros rectngulos (10%+5%) y por otro lado la parte del tercer rectngulo comprendida
entre 3 y 4, como se conoce su densidad, que es 20% , y se requiere un ao, As que el
porcentaje de trabajadores con antigedad de 4 aos o menos se estima en:
P(X4)=10%+5% +20% .(1 ao) = 35%
Anlogamente, si se desea estimar el porcentaje de obreros con antigedad entre 4 y
7,5 aos, es decir P(4X7,5). La respuesta ser calcular el rea del histograma entre dichos
valores, como se muestra en la Figura 3.
7,5
f3* * 5 4
Pgina 232
f ( x) 0
x .d x
Ya hemos dicho antes que el rea del histograma y ahora el rea bajo la funcin de
densidad, debe ser 100%.
c. Para cualquier a, b se tiene que
P a
f x .dx
a
Figura 4. El grfico sombreado es un histograma y las lneas una aproximacin a una densidad
emprica continua.
En primer lugar se observa que el rango de valores que puede tomar la variable
aleatoria X son los puntos en el intervalo que va de cero (0) a dos (2). Es decir que:
X
/0
Cual deber ser la ecuacin que defina las dos rectas que conforman el tringulo
equiltero y que definen la funcin de densidad de probabilidad estimada?Pues como el rea
debe ser igual a la unidad, esto significa que la altura h del tringulo, debe ser tal que el rea
valga 1.
Area 1
base * altura
2
2* h
1
2
Pgina 233
f x
0 x 1
2 x 1 x 2
1,5
P 0, 5
1, 5
1,0
f x .dx P 0, 5
1, 5
0,5
1, 5
P 0,5
1,5
2 x .dx
P 0,5
2 x .dx
1,0
1,5
x.dx
0,5
x.dx
0,5
1,0
P 0, 5
1,5
1,5
1,0
x2
2
1,0
2x
0,5
x2
2
1,5
1,0
3
4
Observe que el rea, en este caso, se hubiera podido calcular como el rea de dos
trapecios, con base mayor la altura del tringulo.
7. Conclusin
La definicin de variable aleatoria continua, es muy poco intuitiva e introduce la
funcin de densidad de probabilidad de manera muy artificial. Desarrollar la idea de funcin
Pgina 234
Pgina 235