Está en la página 1de 52

Resumen de clase anterior

Variables:
Cualitativas Cuantitativas
Discretas Continuas

Presentacion de datos: Distribucion de frecuencias


Diagrama de barras Histograma Poligono de frecuencias Diagrama de cajas Diagrama de dispersion binomial Grafico de lineas

DISTRIBUCION DE FRECUENCIAS

Nivel de Colesterol 80 - 119 120 - 159 160 - 199 200 - 239 240 - 279 280 - 319 320 - 359 360 - 399 Total

Edad: 25 - 34 No. de Varones Frec. Relativa (%) 13 1.2 150 14.1 442 41.4 299 28 115 10.8 34 3.2 9 0.8 5 0.5 1067 100

Edad: 55 - 64 No. de Varones Frec. Relativa (%) 5 0.4 48 3.9 265 21.6 458 37.3 281 22.9 128 10.4 35 2.9 7 0.6 1227 100

POLIGONO DE FRECUENCIAS
120

100

80

60

Frec. Relativa (%) Frec. Acumulada

40

20

0 80 - 119 120 - 159 160 - 199 200 - 239 240 - 279 280 - 319 320 - 359 360 - 399

DIAGRAMA DE BARRAS

POLIGONO DE FRECUENCIAS

DIAGRAMA DE CAJAS

DIAGRAMA BIDIMENSIONAL

DIAGRAMAS DE LINEAS

Seleccin de Intervalos
Para agrupar las observaciones, se debe agrupar en intervalos contiguos que no se traslapen (superpongan). Cada valor de las observaciones debe estar en un solo intervalo. Estos intervalos se denominan intervalo de clase No se debe incluir pocos intervalos, porque se pierde informacin, ni tampoco demasiados, por la razn del agrupamiento pierde valor. La mejor gua para esta seleccin de intervalos es el conocimiento de los datos. Una regla emprica, es que el numero de intervalos debe ser entre 6 y 15. Si es menos de 6 los datos fueron resumidos demasiado y si hay mas de 15 los datos no fueron resumidos adecuadamente.

Seleccin de Intervalos
Una gua mas especifica para la seleccin de intervalos se puede utilizar la formula de Sturges.

K= 1+ 3.322 log n,
donde k es el numero de intervalos de clase y n es el numero de valores de los datos de las observaciones. El resultado es una gua solamente. El resultado se puede aumentar o disminuir de acuerdo a la conveniencia del investigador. Ejem. Se tien275 observaciones para agrupar, y el log de base 10 de 275 es 2.4393 y con la aplicacin de la formula de Sturges se tiene K= 1+2.322*2.4393 = 9 Por lo tanto los intervalos pueden ser 8 o 10.

Amplitud del intervalo


Los intervalos de clase deben ser de preferencia de igual amplitud, aunque algunas veces no es posible. La amplitud se determina dividiendo el rango entre k que es el numero de intervalos de clase.

Simblicamente la amplitud de los intervalos de clase esta dado por w = R/k


R es el rango ( dif. entre el mas alto y el menor valor del conjunto de observaciones). A veces con este procedimiento no da resultados adecuados, se debe usar el sentido comn.

Ejemplo de seleccin de intervalo

Ejemplo de seleccin de intervalo

MEDIDAS DE TENDENCIA CENTRAL

Estadistica Descriptiva
Medidas de tendencia central
Media (promedio) Mediana Moda

Medidas de dispersion
Rango Varianza Desviacion estandar

MTC: Media, Promedio


Promedio, media o media aritmetica Se tiene la variable aleatoria X, y n observaciones. La media aritmetica = (se dice X barra)

Sera la suma de las observacion divididas entre n:

Ejmplo: La media aritmetica de la siguiente secuencia de numeros (n observaciones): 3,9,12,5 y 6

La media aritmtica
La primera y principal MTC es la media aritmtica. Cuando se habla de media, o promedio, siempre se trata de la media aritmtica. Es la suma de todos los valores dividido por el total de observaciones (n). La media de la poblacin se expresa como mu () y la media de una muestra como X barra.

EL PROMEDIO

Ejemplo: promedio
VEF1 = VOLUMEN ESPIRATORIO FORZADO AL PRIMER SEGUNDO

(X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12+x13) /13 38.35 / 13 = 2.95 litros


Variable Individuo X1 1 X2 2 X3 3 X4 4 X5 5 X6 6 X7 7 X8 8 X9 9 X10 10 X11 11 X12 12 X13 13 VEF1 2.30 2.15 3.50 2.60 2.75 2.82 4.05 2.25 2.68 3.00 4.02 2.85 3.38

Calcular la media de la siguiente tabla de distribucin de frecuencias:

intervalos (07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]

Punto medio de clase (mi) 9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL |||| |

Conteo ||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| |||

fi 18 13 24 17 13 0 4 1 90

fAi 18 31 55 72 85 85 89 90 90

FRi 18/90 13/90 24/90 17/90 13/90 0/90 4/90 1/90 90/90

FRAi 18/90 31/90 55/90 72/90 85/90 85/90 89/90 90/90 90/90

Se tienen las siguientes edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introduccin a los Diseos Experimentales del Colegio de Postgraduados, se desea conocer cual sera su media.

25, 27, 35, 28, 30, 24, 25, 29, 32, 37

Hallar el promedio

10, 13, 10, 13, 14, 10, 13, 10, 15

La media grupal
Si n valores de una variable estadstica discreta X se clasifican en i valores distintos , x2.Xi con frecuencias absolutas respectivas f1, f2fi, entonces, la suma total de los n datos es igual a x1*f1 + x2*f2 ++ xi*fi y la media aritmtica es el numero: Sumatoria de dichos productos / n

Ejemplo de media grupal

la media es = sumatoria del producto/ n = 44/20 = 2.2 hijos

Media Aritmtica Ponderada


Si los valores que toma x en una serie de datos, no todos tienen la misma importancia, es valido asignar "pesos" o "ponderaciones" de acuerdo a la importancia de cada dato.
En la serie del ejemplo anterior aparecen los nmeros; pero cada uno con diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva frecuencia o ponderacin y se suman estos productos, se obtendr la misma suma que si se hubieran sumado uno por uno.

Sin ponderar Nmero x 10 13 14 15 Suma = 52 52/4 = 13

Nmero x 10 13 14 15

Clculo ponderado Frecuencia Producto (fx) 4 40 3 39 1 14 1 15 9 108 108/9 = 12

Propiedades de la media
La media es muy sensible a valores extremos La sumatoria de las desviaciones de las observaciones con respecto a la media es siempre cero. No es recomendable usar la media como medida central en distribuciones muy asimtricas.

MTC: mediana
Una medida que no es sensible al valor de cada medicion es la mediana. La mediana puede utilizarse como medida de resumen para las observaciones ordinales asi como para las variables discretas y continuas. La mediana se define como el percentil 50 de un conjunto de mediciones. Si se clasifica en rangos una lista de observaciones de menor a mayor, la mitad de los valores son mayores o iguales que la mediana, mientras que la otra mitad restante es menor o igual a esta.

MTC: mediana
Si un conjunto de datos contiene un total de n observaciones en las que n es impar, la mediana es el valor de la observacion que esta en el medio de la lista ordenada o la [(n+1)/2].

Si n es par, la mediana normalmente se toma como el promedio de los dos valores centrales, es decir, el promedio de las observaciones n/2 y [(n/2) +1]. Los calculos de la mediana toman en cuenta solo el orden y la magnitud relativa de las observaciones de un conjunto de datos.

Propiedades de la mediana

MTC: mediana
1 2 3 4 5 6 7 8 9 10 11 12 13 2.15 2.25 2.3 2.6 2.68 2.75 2.82 2.85 3 3.38 3.5 4.02 4.05

13 + 1 )/ 2= 7

Primero se ordenan los datos de menor a mayor:

24, 25, 25, 27, 28, 29, 30, 32, 35, 37


Puesto que n = 10(nmero par), hay dos valores centrales, que son 28 y 29. La mediana es la media aritmtica de estos dos valores. Es decir

Calculo de media y mediana

MTC: moda
La tercera medida de tendencia central es la moda, que puede emplearse como media de resumen para toda clase de datos.

La moda de un conjunto de valores, es la observacion que surge mas a menudo.


La mejor medida de tendencia central de un conjunto de datos a menudo depende de la forma en que se distribuyen los valores.

Si los datos son simetricos, entonces es una distribucion unimodal, lo que significa que en el histograma o un poligono de frecuencias, entonces existira un solo pico, aqui la media, la mediana y la moda son casi similares.
La distribucion de frecuencias tambien puede ser bimodal, es decir, con dos picos.

Un distribucion bimodal, a menudo indica que la poblacion de la cual se toman los valores en realidad consta de dos diferentes subgrupos que difieren en las caracteristicas que se mide. En este caso seria mejor separ los subgrupos.
Cando los los datos no son simetricos, la mediana es la mejor medida de tendencia central, debido a que la media es sensible a las observaciones extremas.

MTC: moda
{14, 15, 17, 17, 21, 21, 21, 33, 36, 40}
La moda es 21, ya que es mas frecuente. La principal limitacin esta en el hecho de que requiere un nmero suficiente de observaciones para que se manifieste o se defina claramente.

Media vs mediana
La media es un estadstico sensible a valores extremos. Basta que algn dato dentro de la muestra sea muy alto o muy bajo, el promedio se ver alterado. La mediana, en cambio, es un estadstico robusto. Aunque los extremos de los datos se vean alterados, la mediana permanece invariable. El famoso tro - media, mediana y moda representan tres mtodos diferentes para encontrar el valor del centro.

Estos tres valores pueden ser un mismo valor pero a menudo son distintos. Cuando son distintos, pueden servir para diferentes interpretaciones de los datos que queremos resumir.

Media vs Mediana
Considere el ingreso mensual de cinco familias en un barrio: $120 000,$120 000, $300 000, $900 000, $1 000 000 Cul es el ingreso tpico de este grupo? El ingreso mensual promedio es: La mediana del ingreso mensual es: La moda del ingreso mensual es: Si t ests tratando de promover el barrio, Qu medida usaras? Si t ests tratando que bajen las contribuciones, Qu medida usaras?

Relacin entre MTC


Si media=moda=mediana, la distribucin es simtrica Si media > mediana, la distribucin es asimtrica con cola a la derecha (sesgada a la derecha). Si media < mediana, la distribucin es asimtrica con cola a la izquierda (sesgada a la izquierda).

Posicin de las MTC

Estadsticos de posicin

Estadsticos de posicin

Los cuantiles
En algunas ocasiones es importante obtener valores que dividan el conjunto de datos en fracciones especificas. As como la mediana divide el conjunto de datos en dos partes iguales, es decir, la mitad de los valores son inferiores a la mediana y la otra mitad son superiores. Si cada una de estas mitades se volviera a dividir por la mitad, el conjunto quedara dividido en cuatro partes y cada parte se llamara cuartilo.

También podría gustarte