Está en la página 1de 6

Materia Estadstica Aplicada.

Tema 2
Estadstica Descriptiva.
La Aplicacin del tratamiento estadstico tiene dos fases fundamentales:
1.-Organizacin y anlisis inicial de los datos recogidos. (Estadstica Descriptiva)
2.-Extraccion de conclusiones vlidas y toma de decisiones Razonables a partir de ellos (Estadstica Inferencial).
Los Objetivos de la estadstica descriptiva son los que se abordan en la primera de estas fases. Es decir su misin es
ordenar, describir y sintetizar la informacin recogida, para este proceso es necesario establecer medidas cuantitativas
que reduzcan a un nmero manejable de parmetros el conjunto de datos obtenidos que generalmente dicho conjunto
es grande.
1.-Organizacin de datos.
La informacin para la organizacin de datos est constituida y agrupada en un base de datos que es toda la informacin
que se recolecto, cada fila representa a cada unidad o elemento de investigacin, y cada columna representa a cada
variable, aunque tambin puede existir columnas que representen datos de identificacin. Esta base de datos tambin
es conocida con el nombre de sabana de datos. Y se puede representar de la siguiente manera:
Representacin grfica de una base de datos.

1.1.-Revision y correccin de datos.


La base de datos constituye toda la informacin y por s sola no permite concluir acerca del total de datos, como un todo
no permite tomar decisiones, por tal motivo se necesita procesar la informacin recolectada, iniciando por la
organizacin de los datos a travs de tablas de frecuencia, tanto en datos univariados (una sola variable), como datos
bivariados o multivariadas (dos a mas variables), la elaboracin de grficos respectivos, el clculo de medidas
representativas que sean de utilidad para concluir respecto a la informacin recolectada, y el anlisis e interpretacin de
todos los resultados obtenidos.
Determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de
frecuencias o distribucin de frecuencias, posteriormente podremos visualizar tales frecuencias de forma grfica con el
diagrama estadstico apropiado.
1.2.- Distribucin de Frecuencias.
Una distribucin de frecuencias se puede definir como un cuadro a travs del cual se organiza, resume y presenta el
comportamiento de una o ms variables con el fin de efectuar anlisis rpido que sean soporte para la toma de
decisiones. Tambin es un mtodo apropiado para sintetizar informacin que es numerosa. La idea fundamental en la
creacin de tablas de frecuencia es que las variables se organizan en categoras o clases y se calculan frecuencias para
cada clase, una distribucin de frecuencias ofrece una lista de todos los valores posibles de la variable y del nmero de
veces que se presenta cada uno de los mismos, tanto en valores absolutos como valores relativos, su propsito es
organizar datos recopilados, ya sean estos cualitativos o cuantitativos, en una forma adecuada para su comprensin y
anlisis. Una tabla que presenta la clasificacin de una variable se llama tabla unidimensional de distribucin de
frecuencias.
1.2.1.-Datos de Variables Cualitativas y Representaciones Graficas.
El anlisis estadstica para variables cualitativas es puramente aritmtico, puesto que cada una de ellas se expresa en
forma de razn, sea que se trata de la comparacin entre dos cantidades diferentes, una el numerador (antecedente) y
la otra el denominador (consecuente). El antecedente se expresa en funcin del consecuente que es la base de
comparacin y en ese sentido debe enfocarse su interpretacin.
Las medidas ms utilizadas para el anlisis de datos cualitativos con: Razones, Porcentajes, Proporciones y tasas.

1
Materia Estadstica Aplicada.
Razn.- Es un valor que resulta de dividir cierta cosa por otra de la misma naturaleza y que es la base de comparacin y
que para tal efecto dicha base de comparacin se hace igual a la unidad.
Porcentaje.- Tambin es una razn, con la diferencia de que el consecuente que es la base de comparacin sea el
denominador se hace igual a 100, en estas condiciones la formula estar dada por: ( )
Proporcin.- Tambin se considera como una razn, con la diferencia de que el denominador o consecuente se
considera como un todo, mientras que el numerador o antecedente hace parte de ese todo, en la interpretacin el
denominador se hace a 1 o a 100.
Tasa.- Es una razn de tal forma que el denominador o consecuente se refiere a un conjunto poblacional, mientras que
el numerador se refiere a un suceso que tiene relacin de casualidad con dicha poblacin. Es decir que el consecuente o
denominador es la poblacin expuesta al riesgo. Con mucha frecuencia en algunas estadsticas las tasas se expresan en
funcin de aos, pero pueden referirse a periodos ms cortos o largos. Por otra parte las tasas pueden referirse al
nmero de sucesos por cada mil, pero pueden expresarse como el nmero de sucesos por cada 100, 1000, 10.000 o cada
100.000, etc. Lo importante que el valor de la tasa evite los nmeros decimales a fin de facilitar su interpretacin.
De las 4 medidas citadas anteriormente la ms utilizada es el porcentaje.
Una vez recolectado los datos, estos pueden consolidarse y resumirse para mostrar la siguiente informacin:
Qu valores de la variable han sido medidos?
Con que frecuencia se presentan cada uno de los valores?
Para cumplir lo anterior es necesario construir una tabla estadstica con el fin de mostrar los datos grficamente como
una distribucin de datos, cuando la variable de inters es cualitativa, la tabla estadstica es una lista de las categoras
siendo consideradas junto con la medida de la frecuencia con que se presenta cada valor. Se puede medir la frecuencia
en tres formas diferentes y tambin se puede usar la siguiente tabla u otra de acuerdo a la situacin.
Tabla de Frecuencias para una variable cualitativa.

1.- La frecuencia o frecuencia absoluta, es el nmero de veces que se repite determinada caracterstica o atributo en
cada categora, se lo conoce con ( ), siempre son valores positivo entre 0 y n, siendo n en algunos libros y N en otros el
nmero de unidades de investigacin. La sumatoria de las frecuencias absolutas debe ser igual a n o N.

()

numero de casos
Se lee sumatoria de las x desde i=1 hasta m (n)
Para datos agrupados i es el lmite inferior y m es el lmite superior.
2.- La frecuencia relativa o proporcin de mediciones en cada categora. Es la relacin entre la frecuencia absoluta y el
total de datos, generalmente se usa la letra o fr, tomar en cuenta que la suma de las frecuencias relativas es igual a 1.

Frecuencia Relativa

3.- El porcentaje de mediciones en cada categora, que consiste en multiplicar la frecuencia relativa por 100, cuya
sumatoria debe ser igual a 100.
Porcentaje

Una vez que a las mediciones se les haya dado categoras y se resumieron en una tabla estadstica, se puede usar ya sea
una grfica de pastel (muestra relaciones de las partes con respecto al todo) es la conocida grafica circular que muestra
la forma en que estn distribuidas las medidas entre las categoras. Una grfica de barras muestra la misma distribucin
de medidas en categoras, con la altura de la barra midiendo la frecuencia con la que se observa una categora en
particular. O busca destacar la cantidad real o frecuencia en cada categora.
2
Materia Estadstica Aplicada.

Tablas de frecuencias de datos en agrupamiento discreto:


Realizamos este tipo de agrupamiento cuando el nmero de posibles respuestas a la variable en estudio es reducido. Las
variables cualitativas se prestan muy bien a este sistema de agrupamiento
Para construir una tabla de frecuencias de agrupamiento discreto se anotan en una columna cada uno de los distintos
valores que tome la variable y en la columna siguiente su frecuencia o nmero de veces que se repite.
La tabla de frecuencia de la variable Replantado es:
Replantado frecuencia
S 4
N 6
Total: 10
La tabla de frecuencia de la variable X = Grado de afeccin es:

Grado de frecuencia frecuencia


afeccin relativa
xi ni fi
NA 2 0.2
L 2 0.2
M 3 0.3
G 1 0.1
MG 2 0.2
Total 10 1.0

La frecuencia relativa es la frecuencia absoluta dividida entre el nmero de observaciones, indica la proporcin de datos
que muestran un determinado valor de la variable. Se puede expresar tambin en %.
La tabla de frecuencia de la variable X=Nmero de ramas primarias es.

N ramas frecuencia frecuencia Frecuencia Frecuencia


primarias relativa acumulada acumulada
relativa
xi ni fi Ni Fi
0 2 0.2 2 0.2
1 3 0.3 5 0.5
2 3 0.3 8 0.8
3 1 0.1 9 0.9
4 1 0.1 10 1.0
Total 10 1.0

La frecuencia acumulada es el nmero de datos que presentan un valor menor o igual que uno dado de la variable. La
frecuencia acumulada relativa es la proporcin de datos menores o iguales a uno dado.

Tablas de frecuencias de datos agrupados en clases:


Cuando tenemos una variable continua, o cuando, siendo discreta, el nmero de valores diferentes es muy grande, se
agrupan los datos en clases o intervalos.
El nmero de intervalos o clases I a considerar es una cuestin importante y no hay un criterio fijo para establecerlo. La
frmula de Sturges es una de las que se pueden utilizar para determinarlo, segn ella, I es el exponente de la primera
potencia de dos cuyo resultado supera al nmero de datos, con un mnimo de 4 clases.
Para el ejemplo que estamos comentando, con 10 datos, K= raz cuadrada de 10, se toma I o K =4.

3
Materia Estadstica Aplicada.
Para determinar la amplitud de cada clase se divide el rango o diferencia entre el mayor y el menor de los valores
observados entre el nmero de clases I.
Para la variable dimetro, la amplitud es:
R 5.3 2.5 2.8
a 0.7
I 4 4

a en nuestro caso es igual a c, que es la amplitud del intervalo.

Si el cociente no es exacto se puede redondear por exceso, aunque eso har que la ltima clase termine en un valor
superior al mximo observado.
Cada clase o intervalo se identifica con una cifra llamada marca de clase, que es la media entre ambos extremos.
La tabla de frecuencias de la variable dimetro es:
Clases Marcas frecuencia frecuencia frecuencia frecuencia
de clase relativa acumulada acumulada
relativa
xi ni fi Ni Fi
[2.5 ; 3.2) 2.85 3 0.3 3 0.3
[3.2 ; 3.9) 3.55 3 0.3 6 0.6
[3.9 ; 4.6) 4.25 3 0.3 9 0.9
[4.6 ; 5.3) 4.95 1 0.1 10 1.0

Representaciones grficas:
Diagramas de sectores o de tarta:
Son aplicables a cualquier tipo de variables, pero se utilizan sobre todo para las categricas. Se construyen dividiendo un
crculo en tantos sectores como categoras se vayan a representar. Cada sector abarca un ngulo proporcional a la
frecuencia que se desea representar. El diagrama de sectores de la variable Replantado es:

Diagrama de sectores

S
40%
N
60%

Diagramas de barras:
Son representaciones aplicables a tablas de frecuencias de datos en agrupamiento discreto, se pueden aplicar tanto a
datos cualitativos como cuantitativos discretos. Consisten en un sistema de ejes cartesianos sobre cuyo eje de abcisas se
llevan los valores de la variable y sobre el de ordenadas la frecuencia absoluta o relativa, acumulada o no. Por cada valor
de la variable se levantar una lnea o barra (aunque puede ser un rectngulo) de altura equivalente a la frecuencia que
se desea representar.
Se muestran diagramas de barras de la variable Grado de afeccin y de la variable N de ramas:

4
Materia Estadstica Aplicada.

diagrama de barras Diagrama de barras

3,5 1,2

Frecuencia acumulada relativa


frecuencia absoluta

3 1
2,5
0,8
2
0,6
1,5
0,4
1
0,5 0,2
0 0
NA L M G MG 0 1 2 3 4

Grado de afeccin N de ramas primarias

Los diagramas de barras, al representar sobre el eje de abcisas los valores de la variable, y ser el eje numrico, tienen
mejor aplicacin en variables como mnimo ordinales, pues en las variables nominales no hay una ordenacin de los
valores y se pueden representar en cualquier orden.

Histograma
Aplicables a tablas de frecuencias de datos agrupados en clases. Consiste en llevar sobre un eje horizontal segmentos
consecutivos que representen las amplitudes de cada clase, posteriormente se traza sobre cada clase un rectngulo cuyo
rea sea proporcional a la frecuencia que se desea representar. Si todas las clases tienen igual amplitud, los rectngulos
tienen no solo el rea proporcional a la frecuencia, su altura tambin lo es. Las alturas de los rectngulos representan
frecuencia por cada unidad de amplitud, que tambin se llama densidad de frecuencia. Si se traza un eje vertical, la
escala sobre este es la frecuencia por unidad de amplitud.
A continuacin se muestran histogramas de la variable Dimetro.

Histograma de frecuencias Histograma de frecuencias acumuladas


relativas
Frecuencia por unidad de amplitud

3
Frecuencia relativa acumulada por

2,5 1

2 0,8
unidad de amplitud

1,5 0,6

1 0,4

0,5 0,2
0 0
2,85 3,55 4,25 4,95 2,85 3,55 4,25 4,95

Marcas de clase Marcas de clase

En estos dos histogramas se ha tomado la unidad de longitud igual a la amplitud y, como todas las amplitudes son
iguales, la cifra que indica el rea de cada rectngulo coincide con la que indica la altura y ambas con la frecuencia que se
representa.

Polgonos de frecuencias:
Aplicables a variables numricas, aunque tambin se pueden trazar sobre cualitativas ordinales, se construyen uniendo
los extremos de los diagramas de barras o los centros de las bases superiores de los rectngulos del histograma
mediante lneas rectas. Si se desea cerrar la lnea poligonal por sus dos extremos, se podra inventar un valor o intervalo
por delante del primero y otro mayor que el ltimo, cuyas frecuencias sern cero. En el caso de datos agrupados
tambin es frecuente unir el origen de la primera clase con el centro de su base superior y el centro de la base superior
del ltimo rectngulo con el extremo de su base inferior.

5
Materia Estadstica Aplicada.

Polgono de frecuencias

3
frecuencia absoluta 2,5
2
1,5
1
0,5
0
0 1 2 3 4
N de ramas primarias

Existen otros tipos de grficos, como los pictogramas que utilizan smbolos grficos para representar las frecuencias, ya
sea repitiendo un mismo smbolo varias veces para indicar las mayores o menores frecuencias, o aumentando o
disminuyendo el tamao del smbolo segn la frecuencia que se represente.

También podría gustarte