Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Variables:
Cualitativas Cuantitativas
Discretas Continuas
DISTRIBUCION DE FRECUENCIAS
Nivel de Colesterol 80 - 119 120 - 159 160 - 199 200 - 239 240 - 279 280 - 319 320 - 359 360 - 399 Total
Edad: 25 - 34 No. de Varones Frec. Relativa (%) 13 1.2 150 14.1 442 41.4 299 28 115 10.8 34 3.2 9 0.8 5 0.5 1067 100
Edad: 55 - 64 No. de Varones Frec. Relativa (%) 5 0.4 48 3.9 265 21.6 458 37.3 281 22.9 128 10.4 35 2.9 7 0.6 1227 100
POLIGONO DE FRECUENCIAS
120
100
80
60
40
20
0 80 - 119 120 - 159 160 - 199 200 - 239 240 - 279 280 - 319 320 - 359 360 - 399
DIAGRAMA DE BARRAS
POLIGONO DE FRECUENCIAS
DIAGRAMA DE CAJAS
DIAGRAMA BIDIMENSIONAL
DIAGRAMAS DE LINEAS
Seleccin de Intervalos
Para agrupar las observaciones, se debe agrupar en intervalos contiguos que no se traslapen (superpongan). Cada valor de las observaciones debe estar en un solo intervalo. Estos intervalos se denominan intervalo de clase No se debe incluir pocos intervalos, porque se pierde informacin, ni tampoco demasiados, por la razn del agrupamiento pierde valor. La mejor gua para esta seleccin de intervalos es el conocimiento de los datos. Una regla emprica, es que el numero de intervalos debe ser entre 6 y 15. Si es menos de 6 los datos fueron resumidos demasiado y si hay mas de 15 los datos no fueron resumidos adecuadamente.
Seleccin de Intervalos
Una gua mas especifica para la seleccin de intervalos se puede utilizar la formula de Sturges.
K= 1+ 3.322 log n,
donde k es el numero de intervalos de clase y n es el numero de valores de los datos de las observaciones. El resultado es una gua solamente. El resultado se puede aumentar o disminuir de acuerdo a la conveniencia del investigador. Ejem. Se tien275 observaciones para agrupar, y el log de base 10 de 275 es 2.4393 y con la aplicacin de la formula de Sturges se tiene K= 1+2.322*2.4393 = 9 Por lo tanto los intervalos pueden ser 8 o 10.
Estadistica Descriptiva
Medidas de tendencia central
Media (promedio) Mediana Moda
Medidas de dispersion
Rango Varianza Desviacion estandar
La media aritmtica
La primera y principal MTC es la media aritmtica. Cuando se habla de media, o promedio, siempre se trata de la media aritmtica. Es la suma de todos los valores dividido por el total de observaciones (n). La media de la poblacin se expresa como mu () y la media de una muestra como X barra.
EL PROMEDIO
Ejemplo: promedio
VEF1 = VOLUMEN ESPIRATORIO FORZADO AL PRIMER SEGUNDO
intervalos (07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]
Punto medio de clase (mi) 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL |||| |
Conteo ||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| |||
fi 18 13 24 17 13 0 4 1 90
fAi 18 31 55 72 85 85 89 90 90
FRi 18/90 13/90 24/90 17/90 13/90 0/90 4/90 1/90 90/90
FRAi 18/90 31/90 55/90 72/90 85/90 85/90 89/90 90/90 90/90
Se tienen las siguientes edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introduccin a los Diseos Experimentales del Colegio de Postgraduados, se desea conocer cual sera su media.
Hallar el promedio
La media grupal
Si n valores de una variable estadstica discreta X se clasifican en i valores distintos , x2.Xi con frecuencias absolutas respectivas f1, f2fi, entonces, la suma total de los n datos es igual a x1*f1 + x2*f2 ++ xi*fi y la media aritmtica es el numero: Sumatoria de dichos productos / n
Nmero x 10 13 14 15
Propiedades de la media
La media es muy sensible a valores extremos La sumatoria de las desviaciones de las observaciones con respecto a la media es siempre cero. No es recomendable usar la media como medida central en distribuciones muy asimtricas.
MTC: mediana
Una medida que no es sensible al valor de cada medicion es la mediana. La mediana puede utilizarse como medida de resumen para las observaciones ordinales asi como para las variables discretas y continuas. La mediana se define como el percentil 50 de un conjunto de mediciones. Si se clasifica en rangos una lista de observaciones de menor a mayor, la mitad de los valores son mayores o iguales que la mediana, mientras que la otra mitad restante es menor o igual a esta.
MTC: mediana
Si un conjunto de datos contiene un total de n observaciones en las que n es impar, la mediana es el valor de la observacion que esta en el medio de la lista ordenada o la [(n+1)/2].
Si n es par, la mediana normalmente se toma como el promedio de los dos valores centrales, es decir, el promedio de las observaciones n/2 y [(n/2) +1]. Los calculos de la mediana toman en cuenta solo el orden y la magnitud relativa de las observaciones de un conjunto de datos.
Propiedades de la mediana
MTC: mediana
1 2 3 4 5 6 7 8 9 10 11 12 13 2.15 2.25 2.3 2.6 2.68 2.75 2.82 2.85 3 3.38 3.5 4.02 4.05
13 + 1 )/ 2= 7
MTC: moda
La tercera medida de tendencia central es la moda, que puede emplearse como media de resumen para toda clase de datos.
Si los datos son simetricos, entonces es una distribucion unimodal, lo que significa que en el histograma o un poligono de frecuencias, entonces existira un solo pico, aqui la media, la mediana y la moda son casi similares.
La distribucion de frecuencias tambien puede ser bimodal, es decir, con dos picos.
Un distribucion bimodal, a menudo indica que la poblacion de la cual se toman los valores en realidad consta de dos diferentes subgrupos que difieren en las caracteristicas que se mide. En este caso seria mejor separ los subgrupos.
Cando los los datos no son simetricos, la mediana es la mejor medida de tendencia central, debido a que la media es sensible a las observaciones extremas.
MTC: moda
{14, 15, 17, 17, 21, 21, 21, 33, 36, 40}
La moda es 21, ya que es mas frecuente. La principal limitacin esta en el hecho de que requiere un nmero suficiente de observaciones para que se manifieste o se defina claramente.
Media vs mediana
La media es un estadstico sensible a valores extremos. Basta que algn dato dentro de la muestra sea muy alto o muy bajo, el promedio se ver alterado. La mediana, en cambio, es un estadstico robusto. Aunque los extremos de los datos se vean alterados, la mediana permanece invariable. El famoso tro - media, mediana y moda representan tres mtodos diferentes para encontrar el valor del centro.
Estos tres valores pueden ser un mismo valor pero a menudo son distintos. Cuando son distintos, pueden servir para diferentes interpretaciones de los datos que queremos resumir.
Media vs Mediana
Considere el ingreso mensual de cinco familias en un barrio: $120 000,$120 000, $300 000, $900 000, $1 000 000 Cul es el ingreso tpico de este grupo? El ingreso mensual promedio es: La mediana del ingreso mensual es: La moda del ingreso mensual es: Si t ests tratando de promover el barrio, Qu medida usaras? Si t ests tratando que bajen las contribuciones, Qu medida usaras?
Estadsticos de posicin
Estadsticos de posicin
Los cuantiles
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. As como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedara dividido en cuatro partes y cada parte se llamara cuartilo.