Está en la página 1de 10

5.

1 Distribuciones frecuenciales


El objetivo de la estadstica es estudiar los datos obtenidos de una muestra y a partir
de ellos aprender sobre el comportamiento de una poblacin, respecto a ciertas
caractersticas. El estudio incluye la recopilacin, la descripcin y el anlisis del
conjunto de datos, convirtindolos en informacin objetiva que genera conocimiento.

La parte de la estadstica que describe, analiza y representa al conjunto de datos,
mediante mtodos numricos y grficos que muestran y sintetizan informacin a
partir de los datos, se conoce con el nombre de estadstica descriptiva.


5.1.1 Poblacin y muestra

Poblacin
En general, una poblacin es un grupo de seres vivos de una especie particular, que
vive en un rea o espacio, y cuyo nmero de habitantes se determina normalmente
mediante un censo. En estadstica, la nocin de poblacin es ms amplia; se define
como el conjunto total de elementos sobre los cuales se pueden realizar observaciones
respecto a cierta o ciertas caractersticas comunes, y as obtener conclusiones al
respecto. Es claro que una poblacin estadstica no se restringe a seres vivos, ni a un
rea o espacio.

Tamao de la poblacin
El tamao de la poblacin es el nmero de elementos que la constituyen; segn el
nmero de elementos la poblacin puede ser finita o infinita. Una poblacin finita es,
por ejemplo, el conjunto de estudiantes de la Facultad de Ingeniera de la UNAM. Y
convencionalmente, cuando el nmero de elementos de la poblacin es muy grande,
sta se puede considerar como poblacin infinita; por ejemplo, el nmero de granos
de arena en una playa.

El propsito de un censo de poblacin siempre es determinar el nmero de personas
que constituyen un grupo, generalmente de un pas, cada cierto perodo determinado;
en tal caso, la poblacin estadstica comprende a todos habitantes del grupo o pas.
Por lo general, el censo de poblacin se aprovecha para obtener datos demogrficos,
econmicos y sociales relativos a esos habitantes, expresados en trminos numricos.

Es claro que un censo implica demasiado trabajo, tiempo y costo; resulta imprctico y
absurdo observar a la totalidad de los elementos de una poblacin, sistemticamente.
Muestra
En lugar de examinar la poblacin entera, se estudia solo una parte del grupo, una
coleccin de algunos elementos de la poblacin, no de todos. El subgrupo de poblacin
que ser estudiado experimentalmente en detalle se llama muestra y, para que sea
representativa, debe contener las caractersticas relevantes de esa poblacin. As
mismo, las conclusiones que se obtengan de dicha muestra solo podrn referirse a la
poblacin de donde se obtuvo la muestra.

El estudio de una muestra es ms sencillo que el estudio de la poblacin completa,
cuesta menos y lleva menos tiempo. Ms an, se considera que el estudio exhaustivo
de una poblacin entera es ms susceptible de errores que un estudio muestral, por lo
que, en algunos casos, el muestreo puede elevar el nivel de calidad de la informacin
obtenida. La estadstica descriptiva estudia nicamente muestras, ordenando,
clasificando y describiendo los datos de cada muestra.

Muestra aleatoria
Una muestra aleatoria es una muestra obtenida de una poblacin estadstica, de modo
que todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos
y los elementos elegidos de la muestra son seleccionados de modo independiente.

Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo, de
modo que ambos son conceptos relativos. Los datos recogidos de una muestra son
transformados en informacin sobre la poblacin representada por la muestra.

Se trabaja con una muestra aleatoria de una poblacin cuyo tamao es mayor que el
de la muestra obtenida, de manera que tal muestra aleatoria aislada no es ms que
una de muchas muestras diferentes que se habran podido obtener mediante el
proceso de seleccin. El que la muestra sea representativa de la poblacin no significa
que la distribucin de los elementos de la muestra coincida exactamente con los de la
poblacin total.

Existen otros tipos de muestras no aleatorias, denominadas muestras de juicio, que se
basan en la experiencia que alguien tiene sobre la poblacin y se usan como gua para
decidir como tomar una muestra aleatoria ms adelante.

Tamao de la muestra
El tamao de la muestra es el nmero de elementos que componen la muestra y
necesarios para que los datos obtenidos sean representativos de la poblacin.
Notacin: n


Caractersticas
Las caractersticas de inters en una poblacin pueden ser cualitativas, tales como el
sexo y la nacionalidad de una persona; o pueden ser cuantitativas, como el espesor y
la porosidad de un estrato geolgico. Lo relevante es que todos los elementos de la
poblacin poseen esas caractersticas y son stas las que se estudian en cada elemento
de la muestra, con valores que son comparables entre s y susceptibles de anlisis.

Variables
Las caractersticas cuantitativas se denominan variables y pueden ser expresadas
numricamente, como la presin arterial sistlica o el nmero de hijos varones. Los
diferentes valores numricos que puede tomar una caracterstica cuantitativa
constituyen el dominio de definicin de la variable. Cuando la variable puede tomar
solamente un valor se llama constante, como la aceleracin de la gravedad en
determinado punto de la superficie terrestre.

Los valores de la variable se expresan numricamente y son observados sobre los
elementos de la muestra. Si la caracterstica de inters puede ser medida, se trata de
una variable continua, tal como el peso o la talla de un individuo; para asignar los
valores de la variable, es necesario concretar la escala de medicin que conviene
utilizar en cada caso. Si la caracterstica no es medible, sino solamente numerable, se
trata de una variable discreta, tal como el nmero de veces que ocurre un suceso.

Atributos
Los atributos son las caractersticas cualitativas de una poblacin, cuyas diferentes
modalidades se expresan a travs de nombres, pues no son susceptibles de medicin.
Los atributos clasifican cada observacin en una de varias categoras. La situacin ms
simple es cuando se consideran nicamente dos categoras, como hombre mujer o
fumador - no fumador. En otras ocasiones la dicotoma no es suficiente y se requiere
un mayor nmero de categoras, como es el caso del grupo sanguneo de una persona
o la dureza de un material.

Para clasificar los valores de los atributos, a veces se puede utilizar una escala ordinal,
cuando es factible establecer un orden jerrquico de las categoras, como es el caso del
grado de disnea de un paciente o la escala de Mohs para la dureza. La mayor parte de
las veces, sin embargo, los valores de los atributos no mantienen una relacin de
orden entre s, por lo que se tiene que recurrir a escalas nominales, como en el caso
del color de ojos de un individuo o el su estado civil.


Datos estadsticos
Los datos estadsticos son los valores de alguna caracterstica de inters, observados
sobre los elementos de la muestra, los cuales pueden ser comparados, analizados e
interpretados.

En congruencia con los tipos de variable, los datos pueden ser numricos o nominales.
En ingeniera los datos numricos son los ms frecuentes e importantes, por lo que, en
lo que sigue, se les da prioridad.

Ejemplo 5.1. DURACIN DE LLANTAS. Una fbrica de llantas para automvil ha probado
sus llantas del tipo 225/50R16 91W bajo diferentes condiciones; se ha obtenido una
muestra aleatoria de tamao 30, que han registrado las siguientes duraciones, en
miles de kilmetros.






Tablas estadsticas
Las tablas estadsticas son formas de presentacin tabular utilizadas para organizar
los datos estadsticos. En funcin del nmero de datos y el rango de datos, se pueden
distinguir tres tipos de tablas estadsticas:

Cuando el tamao de la muestra y el rango son pequeos. Los datos se anotan de
manera ordenada en filas o columnas.
Cuando el tamao de la muestra es grande y el rango de datos es pequeo. Existen
valores de la variable que se repiten; es el caso de las variables discretas.
Cuando el tamao de la muestra y el rango de datos, ambos son grandes. Se
requiere agrupar los valores de la variable en intervalos; es el caso de las variables
continuas.

Tabla de datos ordenados
Una tabla de datos ordenados es aquella que simplemente presenta los valores de
menor a mayor.





Diagrama de tallos y hojas
Otra forma de presentar ordenadamente un conjunto de datos de tamao moderado
es el llamado diagrama de tallos y hojas, que consiste en dividir cada valor de dato en
dos partes: su tallo y su hoja; por ejemplo, si los datos son de dos dgitos, el tallo sera
el dgito de las decenas y su hoja el dgito de las unidades. As, el dato 37 tendra por
tallo el 3 y por hoja el 7.












5.1.2 Intervalos de clase
Los intervalos de clase se emplean cuando la variable es continua o cuando el nmero
de valores que toma una variable discreta es grande.

Rango de datos
Es la diferencia entre el dato de mayor valor y el dato de menor valor:

max min
R x x (5.1)


R 52.0 40.1 11.9 12

Nmero de intervalos
El nmero de intervalos de clase en el que se agruparn los datos flucta, en la
prctica, entre 5 y 15. La regla emprica de la raz cuadrada del nmero de datos ha
quedado en desuso y en su lugar se utiliza la regla de Sturges, dada por la expresin:

2
k 1 log n (5.2)

2
ln30
k 1 log 30 1 1 4.9 5.9 6
ln2


Amplitud de clase
Se obtiene dividiendo el rango de datos entre el nmero de intervalos de clase:

i
d R / k

(5.3)
Para evitar ambigedades en la clasificacin de los datos, al calcular la amplitud de
clase conviene considerar un rango de datos ligeramente mayor que el rango de datos
exacto, a fin de garantizar que el dato de menor valor quede incluido en el primer
intervalo de clase y el dato de mayor valor quede incluido en el ltimo intervalo de
clase.
i
12
d 2
6

Lmites reales de clase
Cada intervalo de clase tiene dos lmites reales de clase; el menor de ellos se llama
lmite real inferior y el mayor se llamas lmite real superior. Notacin: Lj, j = 1, 2,..., k+1.

El lmite real superior de un intervalo i debe ser mayor en media unidad, una cifra
significativa ms, que el lmite superior del intervalo i y menor en media unidad que el
lmite inferior del intervalo i + 1, de manera que el lmite superior de un intervalo i, es
tambin el lmite real inferior del siguiente intervalo i + 1. Aqu se debe cumplir que:

i 1 i i
L L d , i 1,2,...,k

(5.4)








Lmites de clase
Los lmites de clase son los nmeros que limitan un intervalo de clase; el menor se
llama lmite inferior de clase y el mayor se llama lmite superior de clase. Notacin:
Ij, Sj, j=1,2,...,k.

Los lmites de clase tienen el mismo nmero de cifras significativas que los datos; el
lmite inferior del primer intervalo de clase debe ser menor o igual al menor de los
datos: I1 m; y el lmite superior del ltimo intervalo de clase debe ser mayor o igual
que el mayor de los datos: Sk M. El lmite superior de clase de un intervalo i no
coincide con el lmite inferior de clase del siguiente intervalo i+1, sino que es menor
en una unidad.





Marca de clase
Es el punto medio del intervalo de clase. Notacin: xi, i = 1, 2,..., k
i i 1
i
L L
x , i 1,2,...,k
2
(5.5)

i i
i
I s
x , i 1,2,...,k
2









Tabla de datos agrupados
Es aquella en la que se anotan los datos bsicos en grupos. El agrupamiento se hace
con base en los intervalos de clase.








5.1.3 Frecuencias

Frecuencia
Es el nmero de veces que ocurre un evento. Si A es un evento y ocurre n(A) veces, la
frecuencia de A es n(A)

Frecuencia relativa
Si un experimento se realiza n veces es el nmero de veces que se presenta el evento
A, la frecuencia relativa del evento A es n(A)/n. La frecuencia relativa solo puede
tomar valores entre cero y uno; 0 n(A)/n 1

Distribucin de frecuencias
Es toda representacin de la relacin entre el conjunto de eventos mutuamente
exclusivos y colectivamente exhaustivos y la frecuencia de cada uno de ellos.

Frecuencia de clase
Es la frecuencia de cada intervalo. Notacin: fi, i =1, 2,, k
La tabla de distribucin de frecuencias es aquella en la que se presentan los eventos
con su correspondiente frecuencia.

Frecuencia relativa de clase
Es la que resulta de dividir la frecuencia de un intervalo entre el nmero total de
datos. Notacin: fri, i = 1, 2,, k
La tabla de distribucin de frecuencias relativas es aquella que presenta los eventos
con su correspondiente frecuencia relativa.

Frecuencia acumulada de clase
Es la suma de las frecuencias de clase del intervalo en consideracin y de los
intervalos anteriores. Notacin: Fi, i = 1, 2,, k
La tabla de distribucin de frecuencias acumuladas es aquella en la que se presentan
los eventos con sus correspondientes frecuencias acumuladas. La frecuencia
acumulada del ltimo intervalo de clase debe ser igual al nmero de observaciones.

Frecuencia relativa acumulada de clase
Es la que resulta de dividir la frecuencia acumulada de un intervalo entre el nmero
total de observaciones. Tambin puede obtenerse sumando a la frecuencia relativa del
intervalo en consideracin, las frecuencias relativas correspondientes a todos los
intervalos anteriores. Notacin: Fri, i = 1, 2,, k
La tabla de distribucin de frecuencias relativas acumuladas es aquella en la que se
presentan los eventos con sus correspondientes frecuencias relativas acumuladas. La
frecuencia relativa acumulada del ltimo intervalo debe ser igual a la unidad.

Tabla de distribuciones de frecuencias



5.1.4 Caso discreto y nominal

Caso discreto
No tiene sentido hablar de intervalos de clase ni de lmites de clase, sino simplemente
de clase; cada clase representa un valor discreto de la variable.

Ejemplo 5.2. FALTAS DE ASISTENCIA A CLASE. En el grupo 21 de Probabilidad y
Estadstica del semestre 2011-2, la lista de asistencia registra las faltas de los 49
alumnos inscritos, conforme se muestra en la siguiente tabla:






















Caso nominal
Adems de lo expuesto para el caso discreto, aqu no se puede hablar de frecuencias
acumuladas.

Ejemplo 5.3. CARRERA QUE ESTUDIAN. En el grupo 21 de Probabilidad y Estadstica del
semestre 2011-2, se tiene registro de que los alumnos inscritos estn estudiando
alguna de las 12 carreras que ofrece la Facultad de Ingeniera, conforme a los
siguientes datos, que ya han sido presentados como tabla de frecuencias: