Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GRUPO 1
DISTRIBUCIONES EMPIRICAS
PRESENTADO POR:
QUITO SINCHI CHRISTIAN OSWALDO
SAAVEDRA CARRERA CHRISTIAN FERNANDO
PROFESOR:
ING. JUAN PABLO MONTERO
CARRERA:
INGENIERIA MECANICA AUTOMOTRIZ
CICLO:
SEXTO
1. INTRODUCCIN:
Una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar
un conjunto de datos, se revisara diversas formas de realizar las distribuciones adems de
ejercicios resueltos a base de los temas que se revisaran en este documento a continuacin
2. OBJETIVOS
2.1 OBJETIVO GENERAL
-
3. MARCO TEORICO:
Distribuciones Empricas
3.1 Diagrama de Tronco y Hojas
El diagrama "tronco y hojas" (Stem-and-Leaf Diagram) permite obtener simultneamente una
distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta
separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras
restantes (que formar el tronco).
12
tronco
hoja
Los valores de los datos se utilizan para efectuar tal ordenacin.
El tronco se forma con el (los) primer(os) dgito(s) del dato, mientras que la hoja se forma con
los dems dgitos siguientes. Por ejemplo, el valor numrico 458 se dividira en 45-8
El primer dgito de cada valor debe utilizarse como tronco, y el segundo como hoja.
Casi siempre la representacin se construye en disposicin vertical.
Trcese una recta vertical y colquense los tallos a la izquierda, en columna.
Tronco
1
1
1
Hoja
0 0
1 1 1 1
2 2 2
(Granda)
Se determina el nmero de intervalos o clases (K) que se utilizan para agrupar los datos.
En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20 intervalos o clases.
Sin embargo, si no se tiene seguridad del nmero de intervalos a utilizar, se puede aplicar la
regla de STURGES, con la cual se obtiene una aproximacin aceptable sobre el nmero de
intervalos necesarios para agruparlos.
Una vez escogido el nmero de intervalos se determina la amplitud de cada clase o intervalo de
clase (C). Esta amplitud es igual al rango de los datos dividida en el nmero de intervalos. El
primer intervalo debe contener el menor valor de los datos y el ltimo intervalo debe contener el
mayor valor de los datos
Se calcula la marca de clase o punto medio (Xi), que es el valor medio o promedio de cada
intervalo, el cual sirve para facilitar el clculo de algunas medidas de posicin y de dispersin.
Ejemplo:
Se determinaron las ventas en millones de pesos durante el mes de junio, en 34 almacenes de la
ciudad de Bogot, obtenindose los siguientes datos:
(Granda)
Aplicando la frmula de Sturges para el clculo del nmero de intervalos en que se dividen las
observaciones obtenemos:
k = 1 + 3,322 log 34 = 1 + 3,322 1,53148 = 6,08757
Es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(max) = 16.5 y el menor
x(min) = 7.8, la amplitud sugerida es:
Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como intervalos en los que
clasificar los datos [7'5 - 9), [9 - 10'5), [10'5 - 12), [12 - 13'5), [13'5 - 15), [15 - 16'5] Los datos
agrupados en los intervalos obtenidos, proporcionan la siguiente tabla de distribucin de
frecuencia.
(Granda)
3.2.3 Representacin grafica de una distribucin de frecuencias.
En estadstica, un histograma como en la figura 1, es una representacin grfica de una
variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados, ya sea en forma diferencial o acumulada.
Figura 1: Histograma
De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia.
El polgono de frecuencia como se indica en la figura 2, es una grfica poligonal, en el eje de la
"x" va la variable estudiada (estaturas, pesos, longitudes, etc), en el eje de la "y" van las
frecuencias, Si ya se tiene el histograma se construye una clase anterior a la primera clase y se le
pone frecuencia cero, y una clase posterior a la ltima clase y se le pone frecuencia cero. Se
marca un punto en la parte central superior de cada barra del histograma y se unen los puntos.
(Granda)
3.4.2 Asimetra
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme
alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes
como se indica en la figura 4, cada uno de los cuales define de forma concisa como estn
distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la
mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva
es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos
lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se
aglomeran en los valores menores que la media.
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la
media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se
interpretan:
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir
ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir
ms en la parte derecha de la media. (uv.es)
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que
separa la aglomeracin de los valores con respecto a la media. (Spss)
h(y)
=1
3) P(X = x) = g(x)
x, y
=1
P(Y = y) = h(y) (uv.es)
(uv.es)
Por lo tanto si esto se cumple se puede deducir que x , y son estadisticamente independientes.
(Walpole, 1999)
Y = y) =
Donde la sumatoria se extiende a todos los valores de x entre a y b cuando x, y son continuos
evaluamos.
P (a
Y = y) =
(Walpole, 1999)
CONCLUSIONES:
Interpretacin de datos mediante graficas, que pueden ser con el uso del Histograma o el
polgono de frecuencias, con las distribuciones empricas pueden ser aplicadas en otras reas
como en mantenimiento de maquinarias, en donde hacemos el uso de intervalos de tiempo para
encontrar fallos.
OBSERVACIONES:
El uso del diagrama de Tronco y Hojas, puede ser innecesario para algunos aspectos como en el
clculo de medianas, modas o medias, ya que se pueden calculo de otras maneras y mas rpido.
BIBLIOGRAFIA: