Está en la página 1de 14

Estadística descriptiva.

ESTADÍSTICA DESCRIPTIVA

POBLACIÓN Y MUESTRA. VARIABLES ESTADÍSTICAS

DISTRIBUCIÓN DE FRECUENCIAS DE UNA MUESTRA

AGRUPACIÓN DE DATOS

REPRESENTACIONES GRÁFICAS DE LAS MUESTRAS

PRINCIPALES MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

CÁLCULO DE LA MEDIA Y LA VARIANZA

OTRAS MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

7
Estadística Aplicada a la Ingeniería Civil

8
Estadística descriptiva.

POBLACIÓN Y MUESTRA. VARIABLES ESTADÍSTICAS.

Una población es el conjunto de todos los elementos que cumplen una o


varias propiedades prefijadas.
Ejemplos de poblaciones son: el colectivo de todos los consumidores de
un determinado producto, el conjunto de tornillos fabricados en un día por una
empresa, etc.
Llamamos tamaño de la población al número de elementos que la componen.
Si dicho número es finito, la población es finita; si por el contrario es infinito,
la población es infinita. En la práctica las poblaciones son finitas, pero por
consideraciones teóricas interesa estudiar poblaciones infinitas.
La Estadística se interesa por el estudio de las poblaciones. Para estudiar
una población se puede usar:
- Un censo o encuesta exhaustiva, que consiste en observar todos y cada
uno de los elementos de la población.

9
Estadística Aplicada a la Ingeniería Civil

- Una muestra,
muestra que es un subconjunto de la población. Llamamos tamaño
de la muestra al número de elementos que la componen. La inspección
de una población por muestreo es rápida y barata. Además, en algunos
casos, es la única manera práctica de observar una población; esto
ocurre cuando la observación de un elemento supone su destrucción,
por ejemplo cuando se intenta estudiar la resistencia de ciertos
materiales.
Se debe plantear la cuestión de si podemos sacar conclusiones sobre la
población a partir de la información suministrada por una muestra. Es evidente
que para que la respuesta sea afirmativa el procedimiento mediante el cual
obtenemos la muestra no puede ser cualquiera. De ahí que se requiera que las
muestras sean representativas de sus respectivas poblaciones, lo que se consigue
eligiendo sus elementos al azar.
El papel de la Inferencia Estadística es obtener conclusiones válidas sobre
la población a partir de una muestra representativa de la misma. El estudio de la
Inferencia Estadística se fundamenta en la Teoría de la Probabilidad.
Los elementos de una población poseen ciertas cualidades que llamamos
variables Ejemplos de caracteres en una población de individuos son la
caracteres o variables.
estatura, el estado civil, la profesión, la edad, etc. Una propiedad fundamental
de los caracteres es que no son constantes en los elementos de la población, sino
que varían de unos a otros. El estudio de la variabilidad de los caracteres de las
poblaciones es el objeto de la estadística.

10
Estadística descriptiva.

Los caracteres (que a partir de ahora llamaremos variables) se clasifican


en cualitativos y cuantitativos. Las variables cualitativas se caracterizan porque sus
modalidades no pueden describirse mediante números sino mediante palabras.
Ejemplos de variables cualitativas son el sexo, la nacionalidad, la profesión, etc.
A cada una de estas modalidades las llamaremos clases.
clases Aunque cada una de estas
clases se describen mediante palabras, pueden codificarse mediante números.
En cambio, las variables cuantitativas son medibles pudiendo atribuir a cada
una de sus modalidades un número. Ejemplos de dichas variables son el peso, la
estatura, la edad, etc.
Es importante identificar el tipo de variable objeto de estudio porque los
métodos adecuados de análisis estadístico son diferentes en cada caso.

11
Estadística Aplicada a la Ingeniería Civil

DISTRIBUCIÓN DE FRECUENCIAS DE UNA MUESTRA.

1. Datos cualitativos o categóricos.

A continuación se presenta una tabla donde aparecen los resultados de


una encuesta realizada a 25 alumnos matriculados en cierta asignatura del primer
curso de I. T. O. P., acerca de la calificación obtenida en dicha asignatura:

Suspenso Aprobado Suspenso Suspenso Aprobado


Notable Notable Suspenso Aprobado Suspenso
Sobresaliente Suspenso Aprobado Suspenso Aprobado
Aprobado Aprobado Suspenso Suspenso Notable
Suspenso No Presentado No Presentado Suspenso No Presentado
Tabla 1

Estos datos representan una muestra tomada de la población formada por


todos los alumnos matriculados en dicha asignatura. La variable a la que
corresponden tiene 6 clases distintas: No Presentado (N. P.), Suspenso (SS.),
Aprobado (Ap.), Notable (Nt.), Sobresaliente (Sb.) y Matricula de Honor (M.
H.), cada una de los cuales aparece un número de veces en la muestra.
Dada una muestra de n valores de una variable cualitativa, la frecuencia
absoluta de la clase i (que representamos por ni ) es el número de veces que
aparece dicha clase en la muestra.
La frecuencia relativa de la clase i (que representamos por f i ) es la
frecuencia absoluta dividida por el tamaño de la muestra:

12
Estadística descriptiva.

ni
fi = .
n
Multiplicando por 100 el valor de la frecuencia relativa obtenemos el
porcentaje de elementos de la muestra que corresponden a dicha clase.
La distribución de frecuencias de una variable categórica o cualitativa es
una lista de todos los valores posibles de la variable acompañados de las
frecuencias relativas.
Para la tabla anterior:

Clase ni fi fi %

N.P. 3 0.12 12

SS. 11 0.44 44

Ap. 7 0.28 28

Nt. 3 0.12 12

Sb. 1 0.04 4

M.H. 0 0 0

Total 25 1 100

2. Datos cuantitativos o medibles.

Si en una población extraemos una muestra correspondiente a una


variable medible los datos que obtenemos son numéricos. Un ejemplo como éste
se da en la siguiente tabla, en que se muestran los pesos de 50 sobres de correo
aéreo de cierto tipo, producidos por una fábrica en un solo día, y seleccionados
al azar.

13
Estadística Aplicada a la Ingeniería Civil

0.098 0.103 0.104 0.100 0.108 0.099 0.105 0.101 0.110 0.095
0.106 0.105 0.096 0.107 0.101 0.115 0.100 0.103 0.097 0.103
0.103 0.098 0.107 0.099 0.105 0.092 0.104 0.106 0.102 0.111
0.108 0.097 0.109 0.110 0.096 0.102 0.101 0.094 0.104 0.100
0.101 0.104 0.094 0.102 0.112 0.103 0.099 0.107 0.098 0.108
Tabla 2
Estos datos representan un ejemplo de una muestra tomada de la
población de los pesos de todos los sobres. La muestra consta de 50 números,
llamados valores de la muestra, por tanto el tamaño de la muestra es n = 50 .
Para ver qué información está contenida en una tabla, debemos ordenar
los datos. Supongamos que en una muestra hay k valores distintos ( xi ,
i = 1,2,K, k ). En una columna escribimos estos valores ordenados de menor a

mayor. En una segunda columna anotamos el número de veces que aparece cada
dato. El número de veces que aparece un valor xi en una muestra, se llama
frecuencia absoluta ( ni ) de ese valor xi en la muestra. Dividiendo la frecuencia
absoluta entre el tamaño n de la muestra obtenemos la frecuencia relativa
ni
( fi = ), que se anota en una tercera columna.
n
Si para cierto valor xi sumamos todas las frecuencias correspondientes a
todos los valores de la muestra que son menores o iguales que xi , se obtendrá la
frecuencia acumulada ( N i ) correspondiente a xi . La división de la frecuencia
acumulada entre el tamaño n de la muestra, dará la frecuencia relativa acumulada
( Fi ).

14
Estadística descriptiva.

Obtenemos así una tabla como la que sigue y que llamaremos tabla de
frecuencias:
frecuencias

xi ni fi Ni Fi

x1 n1 f1 N1 F1

x2 n2 f2 N2 F2

M M M M M

x k −1 n k −1 f k −1 N k −1 Fk −1

xk nk fk Nk = n Fk = 1

Total k
n

i =1
fi = 1

Ejemplo. Calculemos la tabla de frecuencias para los datos de la Tabla 2.

xi ni fi fi % Ni Fi

0.092 1 0.02 2 1 0.02


0.094 2 0.04 4 3 0.06
0.095 1 0.02 2 4 0.08
0.096 2 0.04 4 6 0.12
0.097 2 0.04 4 8 0.16
0.098 3 0.06 6 11 0.22
0.099 3 0.06 6 14 0.28
0.100 3 0.06 6 17 0.34
0.101 4 0.08 8 21 0.42

15
Estadística Aplicada a la Ingeniería Civil

xi ni fi fi % Ni Fi

0.102 3 0.06 6 24 0.48


0.103 5 0.10 10 29 0.58
0.104 4 0.08 8 33 0.66
0.105 3 0.06 6 36 0.72
0.106 2 0.04 4 38 0.76
0.107 3 0.06 6 41 0.82
0.108 3 0.06 6 44 0.88
0.109 1 0.02 2 45 0.90
0.110 2 0.04 4 47 0.94
0.111 1 0.02 2 48 0.96
0.112 1 0.02 2 49 0.98
0.115 1 0.02 2 50 1
Total 50 1 100

Así, si elegimos un dato de la muestra, por ejemplo x18 = 0.110 ,


observamos que:
- Aparece 2 veces en la muestra ( n18 = 2 ).
- Representa el 4% de los datos de la muestra ( f 18 = 0.04 ).
- Hay 47 datos en la muestra que son menores o iguales a x18 = 0.110
( N 18 = 47 ).
- El 94% de los datos en la muestra son menores o iguales a x18 = 0.110
( F18 = 0.94 ).

16
Estadística descriptiva.

AGRUPACIÓN DE DATOS.

Si una muestra consta de demasiados valores numéricamente diferentes,


las gráficas correspondientes, que estudiaremos a continuación, son muy
complicadas y quizás confusas, por lo que nos podría interesar simplificar los
datos eliminando detalles innecesarios. Esto puede hacerse por medio del
siguiente proceso de agrupación de datos.
Para una muestra dada, escogemos un intervalo I , determinado por el
menor y el mayor valor de la muestra, que contenga a todos los valores
Subdividimos I en subintervalos que se llaman intervalos de clase;
clase los puntos
medios de estos intervalos se denominan marcas de clase.
clase Al número de valores en
cada intervalo de clase se le llama frecuencia de clase;
clase su división entre el tamaño n
de la muestra es la frecuencia relativa de clase.
clase
En muchas aplicaciones será posible obedecer las siguientes reglas que
son útiles para evitar complicaciones innecesarias en el uso posterior de una
muestra agrupada.
- Todos los intervalos deberán tener la misma amplitud.
- Los intervalos de clase se escogerán de manera que las marcas de clase
correspondan a números simples.
- Si un valor de una muestra coincide con el punto extremo común de
dos intervalos de clases se coloca este valor en el intervalo que se
encuentra a la derecha de dicho valor.

17
Estadística Aplicada a la Ingeniería Civil

Ejemplo. Para la tabla 2 podemos hacer la siguiente agrupación de los datos:

Int. de clase Marcas de clase Frec. de clase Frec. relativas de clase


[0.090,0.095) 0.0925 3 0.06
[0.095,0.100) 0.0975 11 0.22
[0.100,0.105) 0.1025 19 0.38
[0.105,0.110) 0.1075 12 0.24
[0.110,0.115] 0.1125 5 0.10
Total 50 1

Cuantas menos clases escojamos, será más simple la muestra agrupada,


pero se perderá más información, ya que los valores originales de la muestra no
aparecen explícitamente. El agrupamiento debe hacerse de tal manera que sólo se
eliminen los detalles que no son esenciales.
El agrupamiento siempre significará perdida de información y en
consecuencia, si la inferencia estadística se basa en los datos agrupados, se
pueden crear problemas de variedad de grados de exactitud, que dependerán de
los métodos de inferencia empleados. Por lo tanto, si estamos imposibilitados
para juzgar los efectos de la agrupación, bajo condiciones ordinarias, debemos
considerar la posibilidad de usar los datos originales no agrupados.
Se observa que la muestra agrupada puede cambiar si cambiamos las
marcas de clase, manteniendo las longitudes y el número de los intervalos de
clase. De este modo, vemos que hay factores arbitrarios en el proceso de
agrupación. De hecho si necesitamos comparar una muestra con otra
previamente agrupada, es muy importante que la agrupación de datos sea
similar.

18
Estadística descriptiva.

REPRESENTACIONES GRÁFICAS DE LAS MUESTRAS.

Datos cualitativos.

Diagrama de barras. Es la representación gráfica de la distribución de


frecuencia de una variable categórica.
El diagrama de barras para la Tabla 1 es

Diagrama de barras Tabla 1

50
Frecuencia %

40
30
20
10
0
N.P. SS Ap Nt. Sb. M.H.
Calificación

En el eje horizontal se colocan los valores abreviados de las categorías de


la variable y en el eje vertical se miden las frecuencias relativas. Sobre el valor
abreviado de cada categoría se dibuja una barra de altura igual a su frecuencia
relativa.
Gráfico de sectores. El gráfico de sectores se construye trazando un círculo y
asignando a cada categoría un sector de amplitud ω i (en grados sexagesimales)
proporcional a su frecuencia relativa:
ω i = 360 ⋅ f i

19
Estadística Aplicada a la Ingeniería Civil

Para la Tabla 1 el gráfico de sectores es:

Gráfico de sectores Tabla 1

N.P.
SS
Ap
Nt.
Sb.
M.H.

Datos cuantitativos.

Estudiaremos sólo representaciones para datos agrupados:


Histograma. Es la representación gráfica de una distribución de frecuencia de
una variable medible o cuantitativa.
Para la tabla

Clase Marca ni fi fi % Ni Fi

[80-90) 85 1 0.0278 2.78 1 0.0278


[90-100) 95 0 0.000 0.00 1 0.0278
[100-110) 105 2 0.0556 5.56 3 0.0833
[110-120) 115 5 0.1389 13.89 8 0.2222
[120-130) 125 11 0.3056 30.56 19 0.5278
[130-140) 135 4 0.1111 11.11 23 0.6389
[140-150) 145 3 0.0833 8.33 26 0.7222

20

También podría gustarte