Está en la página 1de 10

PROBABILIDAD Y ESTADISTICA

GRUPO 1
DISTRIBUCIONES EMPIRICAS
PRESENTADO POR:
QUITO SINCHI CHRISTIAN OSWALDO
SAAVEDRA CARRERA CHRISTIAN FERNANDO
PROFESOR:
ING. JUAN PABLO MONTERO
CARRERA:
INGENIERIA MECANICA AUTOMOTRIZ
CICLO:
SEXTO

CUENCA, JUNIO 2014

1. INTRODUCCIN:
Una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar
un conjunto de datos, se revisara diversas formas de realizar las distribuciones adems de
ejercicios resueltos a base de los temas que se revisaran en este documento a continuacin

2. OBJETIVOS
2.1 OBJETIVO GENERAL
-

Analizar los distintos tipos de distribuciones de probabilidad con sus respectivas


variables aleatorias.

2.2 OBJETIVOS ESPECIFICOS


-

Determinar las formulas y aplicaciones de las distribuciones empricas.


Relacionar la independencia estadstica con las distribuciones de probabilidad.
Diferenciar los casos discretos o continuos en las distribuciones de probabilidad.

3. MARCO TEORICO:
Distribuciones Empricas
3.1 Diagrama de Tronco y Hojas
El diagrama "tronco y hojas" (Stem-and-Leaf Diagram) permite obtener simultneamente una
distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta
separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras
restantes (que formar el tronco).
12
tronco
hoja
Los valores de los datos se utilizan para efectuar tal ordenacin.
El tronco se forma con el (los) primer(os) dgito(s) del dato, mientras que la hoja se forma con
los dems dgitos siguientes. Por ejemplo, el valor numrico 458 se dividira en 45-8

Ejemplo: Las edades de un grupo de amigos son las siguientes 11 12 10 11 11 10 12 12 11


-

El primer dgito de cada valor debe utilizarse como tronco, y el segundo como hoja.
Casi siempre la representacin se construye en disposicin vertical.
Trcese una recta vertical y colquense los tallos a la izquierda, en columna.
Tronco
1
1
1

(Estadistica para todos)

Hoja
0 0
1 1 1 1
2 2 2

3.2 Distribuciones de frecuencia


Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y
determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia
de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con las frecuencias
correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de
frecuencias. (Cabrera)
3.2.1 Clases de frecuencias.
Frecuencia absoluta.
La frecuencia absoluta de una variable estadstica, es el nmero de veces que aparece en la
muestra dicho valor de la variable, la representaremos por fi
Frecuencia relativa.
Es una medida til para poder comparar. La frecuencia relativa es el cociente entre la frecuencia
absoluta y el tamao de la muestra. Generalmente se expresa en porcentaje. Se denota por fr
Donde n = Tamao de la muestra fi = frecuencia absoluta

Frecuencia Absoluta Acumulada.


Para poder calcular este tipo de frecuencias hay que tener en cuenta que l variable estadstica ha
de ser cuantitativa. La frecuencia absoluta acumulad de un valor de la variable, es el nmero de
veces que ha aparecido en l muestra un valor menor o igual que el de la variable y lo
representaremos por Fi

Frecuencia Relativa Acumulada.


Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta
acumulada dividido por el tamao de la muestra, y la denotaremos por Fr

(Granda)

3.2.2 Pasos para elaborar una distribucin de frecuencias.


Ordenar los datos u observaciones, desde el menor hasta el mayor o viceversa
Se determina el rango o amplitud de la serie de datos, que es la diferencia entre el valor mayor y
el valor menor.

Se determina el nmero de intervalos o clases (K) que se utilizan para agrupar los datos.
En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20 intervalos o clases.
Sin embargo, si no se tiene seguridad del nmero de intervalos a utilizar, se puede aplicar la
regla de STURGES, con la cual se obtiene una aproximacin aceptable sobre el nmero de
intervalos necesarios para agruparlos.

Una vez escogido el nmero de intervalos se determina la amplitud de cada clase o intervalo de
clase (C). Esta amplitud es igual al rango de los datos dividida en el nmero de intervalos. El
primer intervalo debe contener el menor valor de los datos y el ltimo intervalo debe contener el
mayor valor de los datos

Se calcula la marca de clase o punto medio (Xi), que es el valor medio o promedio de cada
intervalo, el cual sirve para facilitar el clculo de algunas medidas de posicin y de dispersin.

Ejemplo:
Se determinaron las ventas en millones de pesos durante el mes de junio, en 34 almacenes de la
ciudad de Bogot, obtenindose los siguientes datos:

(Granda)
Aplicando la frmula de Sturges para el clculo del nmero de intervalos en que se dividen las
observaciones obtenemos:
k = 1 + 3,322 log 34 = 1 + 3,322 1,53148 = 6,08757
Es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(max) = 16.5 y el menor
x(min) = 7.8, la amplitud sugerida es:

Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como intervalos en los que
clasificar los datos [7'5 - 9), [9 - 10'5), [10'5 - 12), [12 - 13'5), [13'5 - 15), [15 - 16'5] Los datos
agrupados en los intervalos obtenidos, proporcionan la siguiente tabla de distribucin de
frecuencia.

(Granda)
3.2.3 Representacin grafica de una distribucin de frecuencias.
En estadstica, un histograma como en la figura 1, es una representacin grfica de una
variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados, ya sea en forma diferencial o acumulada.

Figura 1: Histograma

De esta manera ofrece una visin en grupo permitiendo observar una preferencia, o tendencia.
El polgono de frecuencia como se indica en la figura 2, es una grfica poligonal, en el eje de la
"x" va la variable estudiada (estaturas, pesos, longitudes, etc), en el eje de la "y" van las
frecuencias, Si ya se tiene el histograma se construye una clase anterior a la primera clase y se le
pone frecuencia cero, y una clase posterior a la ltima clase y se le pone frecuencia cero. Se
marca un punto en la parte central superior de cada barra del histograma y se unen los puntos.

Figura 2: Polgono de Frecuencia

(Granda)

3.3 Distribucin de frecuencia relativa


La distribucin de frecuencia relativa es una tcnica estadstica bsica. Para calcular la
frecuencia relativa acumulada, necesitas crear una tabla. Esta tabla enlista rangos de datos
especficos. Luego enumeras cuntas veces tu conjunto de datos cae dentro del rango de datos.
Sumar las cuentas te proporciona la frecuencia relativa acumulada. Los estadsticos necesitan
esta tcnica para determinar cuntas veces algo ha ocurrido en un grupo de datos dado. Esto
luego ayuda con otras estadsticas, como la probabilidad.
Pasos a seguir para obtener la frecuencia relativa
- Se obtiene dividiendo la frecuencia absoluta por el nmero de observaciones
- Denota la importancia de la clase, al expresarse en trminos porcentuales
Facilitan el anlisis de los datos, en especial para comparar distribuciones de frecuencias
basadas en diferente nmero de observaciones.
Cul es la diferencia entre frecuencia absoluta simple y frecuencia relativa simple?
La diferencia radica en que la primera se refiere a la cantidad de valores observados y que la
segunda se refiere a la proporcin de datos que se encuentra en cada intervalo o clase, est en lo
correcto (Granda) (Wolve)

3.4 Simetra y asimetra en una distribucin


3.4.1 Simetra:
En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin
gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms
frecuencia aparece aproximada en fenmenos reales.
La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un
determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el
grfico de una funcin gaussiana.
Cuando una distribucin es simtrica, moda, mediana y media como se indica en la figura 3
coinciden aproximadamente en valores y la forma de un histograma (o polgono de frecuencias)
se parece a la figura I, en donde el lado derecho de la barra central es simtrico a su lado
izquierdo.

Figura 3: Distribucin Simetrica

3.4.2 Asimetra
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme
alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes
como se indica en la figura 4, cada uno de los cuales define de forma concisa como estn

distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la
mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva
es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos
lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se
aglomeran en los valores menores que la media.

Figura 4: Estados de la Asimetria


El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la
media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se
interpretan:

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la


misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir
por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos
( 0.5).

(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir
ms en la parte izquierda que en la derecha de la media.

(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir
ms en la parte derecha de la media. (uv.es)

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que
separa la aglomeracin de los valores con respecto a la media. (Spss)

3.5 Distribuciones de probabilidad marginal


Cuando se estudia ms de una variable aleatoria en forma conjunta puede ser de inters conocer
las distribuciones de probabilidad de las variables aleatorias individualmente, estas funciones se
denominan distribuciones de probabilidad marginales.
Sean x, y

variables aleatorias discretas

f(x, y) funcin de probabilidad conjunta


entonces g(x) =
h(x) =
Las distribuciones marginales g(x), h(x) son funciones de probabilidad de las variables
aleatorias x, y separadamente. Estas funciones deben cumplir las propiedades de una funcin de
probabilidad y pueden ser usadas para calcular la probabilidad para cada variable.
1) g(x) = 0
2)

h(y)
=1

3) P(X = x) = g(x)

x, y

=1
P(Y = y) = h(y) (uv.es)

3.6 Independencia estadstica


Dos variables estadsticas son estadsticamente independientes cuando el comportamiento
estadstico de una de ellas no se ve afectado por los valores que toma la otra, esto es cuando las
relatividad de las distribuciones condicionadas no se ven afectadas por la condicin y coinciden
en todos los casos con las frecuencias relativas marginales.
Esto se puede caracterizar cuando dos variables son estadsticamente independientes cuando
para todos los pares de valores se cumple que la frecuencia relativa conjunta es igual al producto
de las frecuencias relativas marginales.

para todo i,j :

(uv.es)

Por lo tanto si esto se cumple se puede deducir que x , y son estadisticamente independientes.

3.7 Distribucin de probabilidad condicional


Cuando se estudia ms de una variable aleatoria en forma conjunta puede ser de inters conocer
la distribucin de probabilidad de cada variable aleatoria dado que la otra variable tena un valor
especifico, las funciones se denominan condicionales.
P (A/B) =
A=X=x
B=Y=y

Siendo x, y variables aleatorias discretas:


P(X = x / Y = y) =

(Walpole, 1999)

3.8 Distribucin de probabilidad condicional conjunta


Lo que se expresa con la notacin establecida para las distribuciones conjuntas:
f(x/y) =
La funcin f(x + y) tambin satisface las propiedades de las funciones de probabilidad.
Sean (x, y) variables aleatorias discretas
f(x, y) distribucin de probabilidad conjunta
Entonces
f(x/y) =

Es la distribucin condicional de y, dado que X = x


f(x/y) =

Es la distribucin condicional de x, dado que Y = y

Si se desea encontrar la probabilidad de que la variable aleatoria discreta x este entre a y b


cuando se sabe que la variable discreta Y = y evaluamos.
P (a

Y = y) =

Donde la sumatoria se extiende a todos los valores de x entre a y b cuando x, y son continuos
evaluamos.
P (a

Y = y) =

(Walpole, 1999)

CONCLUSIONES:
Interpretacin de datos mediante graficas, que pueden ser con el uso del Histograma o el
polgono de frecuencias, con las distribuciones empricas pueden ser aplicadas en otras reas
como en mantenimiento de maquinarias, en donde hacemos el uso de intervalos de tiempo para
encontrar fallos.

OBSERVACIONES:
El uso del diagrama de Tronco y Hojas, puede ser innecesario para algunos aspectos como en el
clculo de medianas, modas o medias, ya que se pueden calculo de otras maneras y mas rpido.

BIBLIOGRAFIA:

(s.f.). Recuperado el 15 de 06 de 2014, de


http://www.curriculumenlineamineduc.cl/605/articles-27671_recurso_pauta_pdf.pdf
Bioestadistica. (s.f.). Recuperado el 15 de 06 de 2014, de Bioestadistica:
http://www.bioestadistica.uma.es/libro/node25.htm#SECTION00251700000000000000
Cabrera, F. (s.f.). Recuperado el 14 de 06 de 2014, de
http://www.monografias.com/trabajos43/distribucion-frecuencias/distribucionfrecuencias2.shtml
Ditutor. (s.f.). Recuperado el 16 de 06 de 2014, de Ditutor:
http://www.ditutor.com/estadistica/distribuci%C3%B3n_frecuencias.html
Estadistica para todos. (s.f.). Recuperado el 17 de 06 de 2014, de Estadistica para
todos: http://www.estadisticaparatodos.es/taller/graficas/tallos_hojas.html
Granda, E. C. (s.f.). Distribucion de frecuencias. UTPL .
Spss. (s.f.). Spss. Recuperado el 15 de 06 de 2014, de Spss:
http://www.spssfree.com/spss/analisis3.html
uv.es. (s.f.). Recuperado el 17 de 06 de 2014, de uv.es:
http://www.uv.es/ceaces/base/descriptiva/independencia.htm
Walpole. (1999). Probabilidad y Estadistica. Mexico: Pearson.
Wolve, G. (s.f.). Monografias. Recuperado el 17 de 06 de 2014, de Monografias:
http://www.monografias.com/trabajos72/distribucion-frecuencias/distribucionfrecuencias.shtml

También podría gustarte