Está en la página 1de 14

Estadstica descriptiva.

ESTADSTICA DESCRIPTIVA

POBLACIN Y MUESTRA. VARIABLES ESTADSTICAS


DISTRIBUCIN DE FRECUENCIAS DE UNA MUESTRA
AGRUPACIN DE DATOS
REPRESENTACIONES GRFICAS DE LAS MUESTRAS
PRINCIPALES MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN
CLCULO DE LA MEDIA Y LA VARIANZA
OTRAS MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN

Estadstica Aplicada a la Ingeniera Civil

Estadstica descriptiva.

POBLACIN Y MUESTRA. VARIABLES ESTADSTICAS.


Una poblacin es el conjunto de todos los elementos que cumplen una o
varias propiedades prefijadas.
Ejemplos de poblaciones son: el colectivo de todos los consumidores de
un determinado producto, el conjunto de tornillos fabricados en un da por una
empresa, etc.
Llamamos tamao de la poblacin al nmero de elementos que la componen.
Si dicho nmero es finito, la poblacin es finita; si por el contrario es infinito,
la poblacin es infinita. En la prctica las poblaciones son finitas, pero por
consideraciones tericas interesa estudiar poblaciones infinitas.
La Estadstica se interesa por el estudio de las poblaciones. Para estudiar
una poblacin se puede usar:
- Un censo o encuesta exhaustiva, que consiste en observar todos y cada
uno de los elementos de la poblacin.

Estadstica Aplicada a la Ingeniera Civil

- Una muestra,
muestra que es un subconjunto de la poblacin. Llamamos tamao
de la muestra al nmero de elementos que la componen. La inspeccin
de una poblacin por muestreo es rpida y barata. Adems, en algunos
casos, es la nica manera prctica de observar una poblacin; esto
ocurre cuando la observacin de un elemento supone su destruccin,
por ejemplo cuando se intenta estudiar la resistencia de ciertos
materiales.
Se debe plantear la cuestin de si podemos sacar conclusiones sobre la
poblacin a partir de la informacin suministrada por una muestra. Es evidente
que para que la respuesta sea afirmativa el procedimiento mediante el cual
obtenemos la muestra no puede ser cualquiera. De ah que se requiera que las
muestras sean representativas de sus respectivas poblaciones, lo que se consigue
eligiendo sus elementos al azar.
El papel de la Inferencia Estadstica es obtener conclusiones vlidas sobre
la poblacin a partir de una muestra representativa de la misma. El estudio de la
Inferencia Estadstica se fundamenta en la Teora de la Probabilidad.
Los elementos de una poblacin poseen ciertas cualidades que llamamos
caracteres o variables.
variables Ejemplos de caracteres en una poblacin de individuos son la
estatura, el estado civil, la profesin, la edad, etc. Una propiedad fundamental
de los caracteres es que no son constantes en los elementos de la poblacin, sino
que varan de unos a otros. El estudio de la variabilidad de los caracteres de las
poblaciones es el objeto de la estadstica.

10

Estadstica descriptiva.

Los caracteres (que a partir de ahora llamaremos variables) se clasifican


en cualitativos y cuantitativos. Las variables cualitativas se caracterizan porque sus
modalidades no pueden describirse mediante nmeros sino mediante palabras.
Ejemplos de variables cualitativas son el sexo, la nacionalidad, la profesin, etc.
A cada una de estas modalidades las llamaremos clases.
clases Aunque cada una de estas
clases se describen mediante palabras, pueden codificarse mediante nmeros.
En cambio, las variables cuantitativas son medibles pudiendo atribuir a cada
una de sus modalidades un nmero. Ejemplos de dichas variables son el peso, la
estatura, la edad, etc.
Es importante identificar el tipo de variable objeto de estudio porque los
mtodos adecuados de anlisis estadstico son diferentes en cada caso.

11

Estadstica Aplicada a la Ingeniera Civil

DISTRIBUCIN DE FRECUENCIAS DE UNA MUESTRA.


1. Datos cualitativos o categricos.

A continuacin se presenta una tabla donde aparecen los resultados de


una encuesta realizada a 25 alumnos matriculados en cierta asignatura del primer
curso de I. T. O. P., acerca de la calificacin obtenida en dicha asignatura:
Suspenso

Aprobado

Suspenso

Suspenso

Aprobado

Notable

Notable

Suspenso

Aprobado

Suspenso

Sobresaliente

Suspenso

Aprobado

Suspenso

Aprobado

Aprobado

Aprobado

Suspenso

Suspenso

Notable

Suspenso

No Presentado

No Presentado

Suspenso

No Presentado

Tabla 1
Estos datos representan una muestra tomada de la poblacin formada por
todos los alumnos matriculados en dicha asignatura. La variable a la que
corresponden tiene 6 clases distintas: No Presentado (N. P.), Suspenso (SS.),
Aprobado (Ap.), Notable (Nt.), Sobresaliente (Sb.) y Matricula de Honor (M.
H.), cada una de los cuales aparece un nmero de veces en la muestra.
Dada una muestra de n valores de una variable cualitativa, la frecuencia
absoluta de la clase i (que representamos por ni ) es el nmero de veces que
aparece dicha clase en la muestra.
La frecuencia relativa de la clase i (que representamos por f i ) es la
frecuencia absoluta dividida por el tamao de la muestra:

12

Estadstica descriptiva.

fi =

ni
.
n

Multiplicando por 100 el valor de la frecuencia relativa obtenemos el


porcentaje de elementos de la muestra que corresponden a dicha clase.
La distribucin de frecuencias de una variable categrica o cualitativa es
una lista de todos los valores posibles de la variable acompaados de las
frecuencias relativas.
Para la tabla anterior:
Clase

ni

fi

fi %

N.P.

0.12

12

SS.

11

0.44

44

Ap.

0.28

28

Nt.

0.12

12

Sb.

0.04

M.H.

Total

25

100

2. Datos cuantitativos o medibles.

Si en una poblacin extraemos una muestra correspondiente a una


variable medible los datos que obtenemos son numricos. Un ejemplo como ste
se da en la siguiente tabla, en que se muestran los pesos de 50 sobres de correo
areo de cierto tipo, producidos por una fbrica en un solo da, y seleccionados
al azar.

13

Estadstica Aplicada a la Ingeniera Civil

0.098 0.103 0.104 0.100 0.108 0.099 0.105 0.101 0.110 0.095
0.106 0.105 0.096 0.107 0.101 0.115 0.100 0.103 0.097 0.103
0.103 0.098 0.107 0.099 0.105 0.092 0.104 0.106 0.102 0.111
0.108 0.097 0.109 0.110 0.096 0.102 0.101 0.094 0.104 0.100
0.101 0.104 0.094 0.102 0.112 0.103 0.099 0.107 0.098 0.108

Tabla 2
Estos datos representan un ejemplo de una muestra tomada de la
poblacin de los pesos de todos los sobres. La muestra consta de 50 nmeros,
llamados valores de la muestra, por tanto el tamao de la muestra es n = 50 .
Para ver qu informacin est contenida en una tabla, debemos ordenar
los datos. Supongamos que en una muestra hay k valores distintos ( xi ,
i = 1,2,K, k ). En una columna escribimos estos valores ordenados de menor a

mayor. En una segunda columna anotamos el nmero de veces que aparece cada
dato. El nmero de veces que aparece un valor xi en una muestra, se llama
frecuencia absoluta ( ni ) de ese valor xi en la muestra. Dividiendo la frecuencia
absoluta entre el tamao n de la muestra obtenemos la frecuencia relativa
( fi =

ni
), que se anota en una tercera columna.
n

Si para cierto valor xi sumamos todas las frecuencias correspondientes a


todos los valores de la muestra que son menores o iguales que xi , se obtendr la
frecuencia acumulada ( N i ) correspondiente a xi . La divisin de la frecuencia
acumulada entre el tamao n de la muestra, dar la frecuencia relativa acumulada
( Fi ).

14

Estadstica descriptiva.

Obtenemos as una tabla como la que sigue y que llamaremos tabla de


frecuencias:
frecuencias

xi

ni

fi

Ni

Fi

x1

n1

f1

N1

F1

x2

n2

f2

N2

F2

x k 1

n k 1

f k 1

N k 1

Fk 1

xk

nk

fk

Nk = n

Fk = 1

Total

i =1

Ejemplo.

fi = 1

Calculemos la tabla de frecuencias para los datos de la Tabla 2.

xi

ni

fi

fi %

Ni

Fi

0.092

0.02

0.02

0.094

0.04

0.06

0.095

0.02

0.08

0.096

0.04

0.12

0.097

0.04

0.16

0.098

0.06

11

0.22

0.099

0.06

14

0.28

0.100

0.06

17

0.34

0.101

0.08

21

0.42

15

Estadstica Aplicada a la Ingeniera Civil

xi

ni

fi

fi %

Ni

Fi

0.102

0.06

24

0.48

0.103

0.10

10

29

0.58

0.104

0.08

33

0.66

0.105

0.06

36

0.72

0.106

0.04

38

0.76

0.107

0.06

41

0.82

0.108

0.06

44

0.88

0.109

0.02

45

0.90

0.110

0.04

47

0.94

0.111

0.02

48

0.96

0.112

0.02

49

0.98

0.115

0.02

50

Total

50

100

As, si elegimos un dato de la muestra, por ejemplo x18 = 0.110 ,


observamos que:
- Aparece 2 veces en la muestra ( n18 = 2 ).
- Representa el 4% de los datos de la muestra ( f 18 = 0.04 ).
- Hay 47 datos en la muestra que son menores o iguales a x18 = 0.110
( N 18 = 47 ).
- El 94% de los datos en la muestra son menores o iguales a x18 = 0.110
( F18 = 0.94 ).

16

Estadstica descriptiva.

AGRUPACIN DE DATOS.
Si una muestra consta de demasiados valores numricamente diferentes,
las grficas correspondientes, que estudiaremos a continuacin, son muy
complicadas y quizs confusas, por lo que nos podra interesar simplificar los
datos eliminando detalles innecesarios. Esto puede hacerse por medio del
siguiente proceso de agrupacin de datos.
Para una muestra dada, escogemos un intervalo I , determinado por el
menor y el mayor valor de la muestra, que contenga a todos los valores
clase los puntos
Subdividimos I en subintervalos que se llaman intervalos de clase;
medios de estos intervalos se denominan marcas de clase.
clase Al nmero de valores en
cada intervalo de clase se le llama frecuencia de clase;
clase su divisin entre el tamao n
de la muestra es la frecuencia relativa de clase.
clase
En muchas aplicaciones ser posible obedecer las siguientes reglas que
son tiles para evitar complicaciones innecesarias en el uso posterior de una
muestra agrupada.
- Todos los intervalos debern tener la misma amplitud.
- Los intervalos de clase se escogern de manera que las marcas de clase
correspondan a nmeros simples.
- Si un valor de una muestra coincide con el punto extremo comn de
dos intervalos de clases se coloca este valor en el intervalo que se
encuentra a la derecha de dicho valor.

17

Estadstica Aplicada a la Ingeniera Civil

Ejemplo.

Para la tabla 2 podemos hacer la siguiente agrupacin de los datos:

Int. de clase

Marcas de clase

Frec. de clase

Frec. relativas de clase

[0.090,0.095)

0.0925

0.06

[0.095,0.100)

0.0975

11

0.22

[0.100,0.105)

0.1025

19

0.38

[0.105,0.110)

0.1075

12

0.24

[0.110,0.115]

0.1125

0.10

50

Total

Cuantas menos clases escojamos, ser ms simple la muestra agrupada,


pero se perder ms informacin, ya que los valores originales de la muestra no
aparecen explcitamente. El agrupamiento debe hacerse de tal manera que slo se
eliminen los detalles que no son esenciales.
El agrupamiento siempre significar perdida de informacin y en
consecuencia, si la inferencia estadstica se basa en los datos agrupados, se
pueden crear problemas de variedad de grados de exactitud, que dependern de
los mtodos de inferencia empleados. Por lo tanto, si estamos imposibilitados
para juzgar los efectos de la agrupacin, bajo condiciones ordinarias, debemos
considerar la posibilidad de usar los datos originales no agrupados.
Se observa que la muestra agrupada puede cambiar si cambiamos las
marcas de clase, manteniendo las longitudes y el nmero de los intervalos de
clase. De este modo, vemos que hay factores arbitrarios en el proceso de
agrupacin. De hecho si necesitamos comparar una muestra con otra
previamente agrupada, es muy importante que la agrupacin de datos sea
similar.

18

Estadstica descriptiva.

REPRESENTACIONES GRFICAS DE LAS MUESTRAS.


Datos cualitativos.
Diagrama de barras.

Es la representacin grfica de la distribucin de

frecuencia de una variable categrica.


El diagrama de barras para la Tabla 1 es

Frecuencia %

Diagrama de barras Tabla 1


50
40
30
20
10
0
N.P.

SS

Ap

Nt.

Sb.

M.H.

Calificacin

En el eje horizontal se colocan los valores abreviados de las categoras de


la variable y en el eje vertical se miden las frecuencias relativas. Sobre el valor
abreviado de cada categora se dibuja una barra de altura igual a su frecuencia
relativa.
Grfico de sectores.

El grfico de sectores se construye trazando un crculo y

asignando a cada categora un sector de amplitud i (en grados sexagesimales)


proporcional a su frecuencia relativa:
i = 360 f i

19

Estadstica Aplicada a la Ingeniera Civil

Para la Tabla 1 el grfico de sectores es:

Grfico de sectores Tabla 1


N.P.
SS
Ap
Nt.
Sb.
M.H.

Datos cuantitativos.

Estudiaremos slo representaciones para datos agrupados:


Histograma.

Es la representacin grfica de una distribucin de frecuencia de

una variable medible o cuantitativa.


Para la tabla

20

Clase

Marca

ni

fi

fi %

Ni

Fi

[80-90)

85

0.0278

2.78

0.0278

[90-100)

95

0.000

0.00

0.0278

[100-110)

105

0.0556

5.56

0.0833

[110-120)

115

0.1389

13.89

0.2222

[120-130)

125

11

0.3056

30.56

19

0.5278

[130-140)

135

0.1111

11.11

23

0.6389

[140-150)

145

0.0833

8.33

26

0.7222

También podría gustarte