Está en la página 1de 11

1

2
Introducción
Los estudiosos de las ciencias biológicas se dieron cuenta que la distribución
de las frecuencias de medidas de individuos de las poblaciones naturales
presentaban una forma acampanada al dibujarla en un plano.
Por otro lado, los matemáticos buscaban modelos que pudieran emular las
distribuciones que estas poblaciones presentaban.
Con el tiempo, se descubrió El Promedio Aritmético de un conjunto de datos.
Casi inmediatamente se descubrió que la suma de las desviaciones de las
medidas de las observaciones con respecto al promedio era cero.

n n

 d   x
i 1
i
i 1
i  x 0

Propiedad muy importante en la Teoría Estadística.


Los Parámetros
3

Inmediatamente se descubrió la Varianza que no es otra cosa


que las desviaciones elevadas al cuadrado y ponderadas por los
grados de libertad.
A medida que se trabajaba con estos parámetros: La Media,
La Varianza y su raíz cuadrada La Desviación Estándar se
dieron cuenta que precisamente, la frecuencia de las
desviaciones con respecto al promedio seguían una curva
característica de campana, esto es, las medidas de los
individuos se agrupaban hacia el centro, situación que se
repetía constantemente.
Los matemáticos se dieron a la tarea de descubrir funcions que
se pareciera a la DISTRIBUCIÓN DE FRECUENCIAS DE
LAS DESVIACIONES.
4
El Modelo Matemático
GAUSS, Carl Friedrich (1.777 –1.855) matemático y astrónomo
ideó la siguiente fórmula antes que la ciencia estadística se
formalizara
 1  1  x     
2
f x;  ,      e   

  2  2  2


En donde  es la media,  la desviación estándar,  = 3,14159...


y la base del logaritmo neperiano e = 2,71828... Que se conoce
como Distribución de Densidad Normal o Campana de Gauss.
Ésta distribución tiene propiedades trascendentales para
simular poblaciones reales, que se irán discutiendo a medida
que se avanza en la lectura y usando un ejemplo.
5
El Histograma
Histograma y Polígono de Frecuencias
El Gráfico hace evidente
25,0
que la distribución de los
20,0
pesos presenta una forma
de campana, en que los
Frecuencia Relativa

15,0 individuos con


características más
10,0
comunes en este caso el
peso, se aglomeran hacia
5,0
el centro, los más raros
0,0 con pesos bajos o
0,06 0,17 0,28 0,39 0,50 0,61 0,72 0,83 0,94 1,05 1,16 1,27 1,38 1,49 1,60
Kilos de Trucha
mayores a los extremos.

El polígono de frecuencias, la línea de color guinda que une las barras


indica que la variable es de tipo continuo y no hace falta ningún ajuste por
continuidad para utilizar en la aproximación que se efectúe a la Distribución
Normal o Normal Estándar.
6
Selección Por Individuos
Cuando se va a determinar un valor que servirá para
elegir individuos y a utilizar La Distribución Normal o La
Normal Estándar para establecer límites que involucran
probabilidades, es indispensable que la distribución de la
variable sea normal.
También, para ciertos casos, es conveniente trabajar
con datos agrupados en los cuadros de frecuencias, por
representar una visión más apropiada de la distribución
observada.
Por esta razón, se efectuarán los cálculos de las
estadísticas descriptivas desde datos agrupados usando el
cuadro de frecuencias.
7
Estadísticos con Datos Agrupados

f i xi  x 
Frecuencias 3 x x
Clase xi Absolutas
f i  xi 2 x x
f i  i  f i  i
 s 

 s 
1 116 0 0,00 0,00 0,0000 0,0000
2 216 7 1.512,00 2.613.821,81 -95,6014 228,5177
3 316 6 1.896,00 1.567.138,06 -47,9385 95,8361
4 416 7 2.912,00 1.182.833,66 -29,1029 46,7967
5 516 13 6.708,00 1.257.916,39 -23,4210 28,4988
6 616 30 18.480,00 1.336.480,81 -16,8843 13,9402
7 716 35 25.060,00 431.757,25 -2,8703 1,2470
8 816 46 37.536,00 5.634,21 -0,0037 0,0002
9 916 38 34.808,00 300.543,67 1,5998 0,5565
10 1.016 31 31.496,00 1.106.563,76 12,5136 9,2482
11 1.116 17 18.972,00 1.419.196,83 24,5436 27,7397
12 1.216 9 10.944,00 1.361.418,55 31,6932 48,2177
13 1.316 9 11.844,00 2.151.497,60 62,9636 120,4218
14 1.416 5 7.080,00 1.734.209,25 61,1317 140,8312
15 1.516 0 0,00 0,00 0,0000 0,0000
Número de Observaciones 253 Suma de Cuadrados 16.469.011,86
Suma Total 209.248 Varianza 65.353,22
Promedio 827,07 Desvío Estándar 255,64
Mediana 879,04 Coeficiente de asimetría -0,0855
Moda 873,89 Curtosis 0,0600
8
2.21 La distribución de datos estandarizados.

Una variable estandarizada está definida, para datos individuales


y agrupados por:
xi  x  xi  x 
z ; za  f i  
s  s 
La media de la variable estandarizada es 0 y la varianza es 1. La
aseveración se probará para datos agrupados. Es promedio será:
15
 xi  x   57  814,83   167  814,83   1.597  843,83 
 f i 
 s


0
 243 ,11


 3
 243 ,11


 ...  0
 243 ,11

 0
z  i 1 
n 253

Y la varianza:
2
15
x x
 fi  i
 s 

z 
2 i 1
n 1
2 2 2
 57  814,83   167  814,83   1.597  843,83 
0  0   3  0   ...  0  0
  243,11   243,11   243,11   252  1
253  1 252
9
La Distribución Normal Estándar
Con los datos estandarizados se descubrió La Distribución Normal
Estándar, con probabilidades idénticas a La Distribución Normal, pero
con la ventaja de usar Números Puros basados en un sistema numérico
definido por Una Desviación Estándar, cuya valor está definido por:
2
1  x μ 
1   i 
f ( z;0;1)  e 2 σ 


Y cuyas probabilidades acumulativas se encuentran resolviendo:
2
1  x μ 
1 z   i 
F ( z;0;1)  e
2 σ 
dz
2π 

Supongamos una media ideal ubicada al centro de la distribución de


promedios de los datos agrupados, esto es:

xmin  x max 167  1.487


X    827
2 2
La Población y Las Muestras 10

Es evidente que en el ejemplo tenemos 10 subpoblaciones de


diferente tamaño de una población de 2.796 pesos de peces. Es
posible obtener datos de dos fuentes sobre el mismo estadístico:
Una obtenida dato a dato y otra que proviene de la información de
los promedios de las muestras, como se muestra en el cuadro:
Nos interesan los promedios y
Estadístico
Toda la
Población
Promedio de
Estadístico
las desviaciones típicas
Media 866,73 867,08 involucradas en el Teorema.
Error típico 5,2756 16,3044
Mediana 864 862 Los promedios son muy
Moda 690 855
Desviación estándar 278,9574 272,5814 parecidos, lo que se explica
Varianza de la muestra
Curtosis
77.817,2120 75.306,2868
-0,1581 -0,2851
por otro teorema que dice: La
Coeficiente de asimetría
Rango
0,0713
1.516
0,0593
1286,70
Esperanza Matemática de los
Mínimo 126 234,80 Promedios es el Promedio
Máximo 1.642 1521,50
Suma 2.423.385 242.338,50 Poblacional.
Cuenta 2.796 279,60

También podría gustarte