Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 2
Estadstica Descriptiva.
La Aplicacin del tratamiento estadstico tiene dos fases fundamentales:
1.-Organizacin y anlisis inicial de los datos recogidos. (Estadstica Descriptiva)
2.-Extraccion de conclusiones vlidas y toma de decisiones Razonables a partir de ellos (Estadstica Inferencial).
Los Objetivos de la estadstica descriptiva son los que se abordan en la primera de estas fases. Es decir su misin es
ordenar, describir y sintetizar la informacin recogida, para este proceso es necesario establecer medidas cuantitativas
que reduzcan a un nmero manejable de parmetros el conjunto de datos obtenidos que generalmente dicho conjunto
es grande.
1.-Organizacin de datos.
La informacin para la organizacin de datos est constituida y agrupada en un base de datos que es toda la informacin
que se recolecto, cada fila representa a cada unidad o elemento de investigacin, y cada columna representa a cada
variable, aunque tambin puede existir columnas que representen datos de identificacin. Esta base de datos tambin
es conocida con el nombre de sabana de datos. Y se puede representar de la siguiente manera:
Representacin grfica de una base de datos.
1
Materia Estadstica Aplicada.
Razn.- Es un valor que resulta de dividir cierta cosa por otra de la misma naturaleza y que es la base de comparacin y
que para tal efecto dicha base de comparacin se hace igual a la unidad.
Porcentaje.- Tambin es una razn, con la diferencia de que el consecuente que es la base de comparacin sea el
denominador se hace igual a 100, en estas condiciones la formula estar dada por: ( )
Proporcin.- Tambin se considera como una razn, con la diferencia de que el denominador o consecuente se
considera como un todo, mientras que el numerador o antecedente hace parte de ese todo, en la interpretacin el
denominador se hace a 1 o a 100.
Tasa.- Es una razn de tal forma que el denominador o consecuente se refiere a un conjunto poblacional, mientras que
el numerador se refiere a un suceso que tiene relacin de casualidad con dicha poblacin. Es decir que el consecuente o
denominador es la poblacin expuesta al riesgo. Con mucha frecuencia en algunas estadsticas las tasas se expresan en
funcin de aos, pero pueden referirse a periodos ms cortos o largos. Por otra parte las tasas pueden referirse al
nmero de sucesos por cada mil, pero pueden expresarse como el nmero de sucesos por cada 100, 1000, 10.000 o cada
100.000, etc. Lo importante que el valor de la tasa evite los nmeros decimales a fin de facilitar su interpretacin.
De las 4 medidas citadas anteriormente la ms utilizada es el porcentaje.
Una vez recolectado los datos, estos pueden consolidarse y resumirse para mostrar la siguiente informacin:
Qu valores de la variable han sido medidos?
Con que frecuencia se presentan cada uno de los valores?
Para cumplir lo anterior es necesario construir una tabla estadstica con el fin de mostrar los datos grficamente como
una distribucin de datos, cuando la variable de inters es cualitativa, la tabla estadstica es una lista de las categoras
siendo consideradas junto con la medida de la frecuencia con que se presenta cada valor. Se puede medir la frecuencia
en tres formas diferentes y tambin se puede usar la siguiente tabla u otra de acuerdo a la situacin.
Tabla de Frecuencias para una variable cualitativa.
1.- La frecuencia o frecuencia absoluta, es el nmero de veces que se repite determinada caracterstica o atributo en
cada categora, se lo conoce con ( ), siempre son valores positivo entre 0 y n, siendo n en algunos libros y N en otros el
nmero de unidades de investigacin. La sumatoria de las frecuencias absolutas debe ser igual a n o N.
()
numero de casos
Se lee sumatoria de las x desde i=1 hasta m (n)
Para datos agrupados i es el lmite inferior y m es el lmite superior.
2.- La frecuencia relativa o proporcin de mediciones en cada categora. Es la relacin entre la frecuencia absoluta y el
total de datos, generalmente se usa la letra o fr, tomar en cuenta que la suma de las frecuencias relativas es igual a 1.
Frecuencia Relativa
3.- El porcentaje de mediciones en cada categora, que consiste en multiplicar la frecuencia relativa por 100, cuya
sumatoria debe ser igual a 100.
Porcentaje
Una vez que a las mediciones se les haya dado categoras y se resumieron en una tabla estadstica, se puede usar ya sea
una grfica de pastel (muestra relaciones de las partes con respecto al todo) es la conocida grafica circular que muestra
la forma en que estn distribuidas las medidas entre las categoras. Una grfica de barras muestra la misma distribucin
de medidas en categoras, con la altura de la barra midiendo la frecuencia con la que se observa una categora en
particular. O busca destacar la cantidad real o frecuencia en cada categora.
2
Materia Estadstica Aplicada.
La frecuencia relativa es la frecuencia absoluta dividida entre el nmero de observaciones, indica la proporcin de datos
que muestran un determinado valor de la variable. Se puede expresar tambin en %.
La tabla de frecuencia de la variable X=Nmero de ramas primarias es.
La frecuencia acumulada es el nmero de datos que presentan un valor menor o igual que uno dado de la variable. La
frecuencia acumulada relativa es la proporcin de datos menores o iguales a uno dado.
3
Materia Estadstica Aplicada.
Para determinar la amplitud de cada clase se divide el rango o diferencia entre el mayor y el menor de los valores
observados entre el nmero de clases I.
Para la variable dimetro, la amplitud es:
R 5.3 2.5 2.8
a 0.7
I 4 4
Si el cociente no es exacto se puede redondear por exceso, aunque eso har que la ltima clase termine en un valor
superior al mximo observado.
Cada clase o intervalo se identifica con una cifra llamada marca de clase, que es la media entre ambos extremos.
La tabla de frecuencias de la variable dimetro es:
Clases Marcas frecuencia frecuencia frecuencia frecuencia
de clase relativa acumulada acumulada
relativa
xi ni fi Ni Fi
[2.5 ; 3.2) 2.85 3 0.3 3 0.3
[3.2 ; 3.9) 3.55 3 0.3 6 0.6
[3.9 ; 4.6) 4.25 3 0.3 9 0.9
[4.6 ; 5.3) 4.95 1 0.1 10 1.0
Representaciones grficas:
Diagramas de sectores o de tarta:
Son aplicables a cualquier tipo de variables, pero se utilizan sobre todo para las categricas. Se construyen dividiendo un
crculo en tantos sectores como categoras se vayan a representar. Cada sector abarca un ngulo proporcional a la
frecuencia que se desea representar. El diagrama de sectores de la variable Replantado es:
Diagrama de sectores
S
40%
N
60%
Diagramas de barras:
Son representaciones aplicables a tablas de frecuencias de datos en agrupamiento discreto, se pueden aplicar tanto a
datos cualitativos como cuantitativos discretos. Consisten en un sistema de ejes cartesianos sobre cuyo eje de abcisas se
llevan los valores de la variable y sobre el de ordenadas la frecuencia absoluta o relativa, acumulada o no. Por cada valor
de la variable se levantar una lnea o barra (aunque puede ser un rectngulo) de altura equivalente a la frecuencia que
se desea representar.
Se muestran diagramas de barras de la variable Grado de afeccin y de la variable N de ramas:
4
Materia Estadstica Aplicada.
3,5 1,2
3 1
2,5
0,8
2
0,6
1,5
0,4
1
0,5 0,2
0 0
NA L M G MG 0 1 2 3 4
Los diagramas de barras, al representar sobre el eje de abcisas los valores de la variable, y ser el eje numrico, tienen
mejor aplicacin en variables como mnimo ordinales, pues en las variables nominales no hay una ordenacin de los
valores y se pueden representar en cualquier orden.
Histograma
Aplicables a tablas de frecuencias de datos agrupados en clases. Consiste en llevar sobre un eje horizontal segmentos
consecutivos que representen las amplitudes de cada clase, posteriormente se traza sobre cada clase un rectngulo cuyo
rea sea proporcional a la frecuencia que se desea representar. Si todas las clases tienen igual amplitud, los rectngulos
tienen no solo el rea proporcional a la frecuencia, su altura tambin lo es. Las alturas de los rectngulos representan
frecuencia por cada unidad de amplitud, que tambin se llama densidad de frecuencia. Si se traza un eje vertical, la
escala sobre este es la frecuencia por unidad de amplitud.
A continuacin se muestran histogramas de la variable Dimetro.
3
Frecuencia relativa acumulada por
2,5 1
2 0,8
unidad de amplitud
1,5 0,6
1 0,4
0,5 0,2
0 0
2,85 3,55 4,25 4,95 2,85 3,55 4,25 4,95
En estos dos histogramas se ha tomado la unidad de longitud igual a la amplitud y, como todas las amplitudes son
iguales, la cifra que indica el rea de cada rectngulo coincide con la que indica la altura y ambas con la frecuencia que se
representa.
Polgonos de frecuencias:
Aplicables a variables numricas, aunque tambin se pueden trazar sobre cualitativas ordinales, se construyen uniendo
los extremos de los diagramas de barras o los centros de las bases superiores de los rectngulos del histograma
mediante lneas rectas. Si se desea cerrar la lnea poligonal por sus dos extremos, se podra inventar un valor o intervalo
por delante del primero y otro mayor que el ltimo, cuyas frecuencias sern cero. En el caso de datos agrupados
tambin es frecuente unir el origen de la primera clase con el centro de su base superior y el centro de la base superior
del ltimo rectngulo con el extremo de su base inferior.
5
Materia Estadstica Aplicada.
Polgono de frecuencias
3
frecuencia absoluta 2,5
2
1,5
1
0,5
0
0 1 2 3 4
N de ramas primarias
Existen otros tipos de grficos, como los pictogramas que utilizan smbolos grficos para representar las frecuencias, ya
sea repitiendo un mismo smbolo varias veces para indicar las mayores o menores frecuencias, o aumentando o
disminuyendo el tamao del smbolo segn la frecuencia que se represente.