Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFOME DE LABORATORIO N°
1
Tema: MODELOS PROBABILISTICOS (Binomial, Poisson y Pareto)
Nombres de los Integrantes:
1: Caritas Chá vez Erik Yessir Paralelo Mat- 1135 “ F”
2: Condori laureano Jaime Paralelo Mat- 1135 “ F ”
3: Illanes Zunagua Lisbeth Danna Paralelo Mat - 1135 “ F ”
4: Martínez Gó mez Mauricio Manuel Paralelo Mat- 1135 “ F ”
5: Villca Jorge Luis Paralelo Mat- 1135 “ F ”
1. INTRODUCCION
Binomial.- Una distribución binomial es una distribución de probabilidad discreta que describe el
número de éxitos al realizar n experimentos independientes entre sí, acerca de una variable
aleatoria.
Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados bajo esta
distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el que definimos el
suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y contamos los éxitos (sacar cara)
que obtenemos, nuestra distribución de probabilidades se ajustaría a una distribución binomial.
2
Por lo tanto, la distribución binomial se entiende como una serie de pruebas o ensayos en la que
solo podemos tener 2 resultados (éxito o fracaso), siendo el éxito nuestra variable aleatoria.
Poisoon.- La distribución de Poisson se emplea para describir varios procesos, entre otros la
distribución de las llamadas telefónicas que llagan a un conmutador, la demanda (necesidades) de
servicios en una institución asistencial por parte de los pacientes, los arribos de los camiones y
automóviles a la caseta de cobro y el número de accidentes en un cruce. Los ejemplos citados tienen
un elemento en común, pueden ser descritos por una variable aleatoria discreta que asume valores
enteros (0,1,2,3,4,5 y así sucesivamente). El número de enfermos que llegan a un consultorio en
cierto intervalo de tiempo será de 0,1,2,3,4,5 o algún otro número entero. De manera análoga, si se
cuenta el número de automóviles que llegan a una caseta de cobro durante un periodo de diez
minutos, el número será entero.
Pareto.- En estadística, la distribución Pareto es una distribución de probabilidad continua con dos
parámetros, que tiene aplicación en disciplinas como la sociología, geofísica y economía.[1]. Fue
formulada por el ingeniero civil, economista y sociólogo Vilfredo Pareto, aunque en ciertas áreas de
estudio se hace referencia a la ley de Bradford. la cual en una determinada lengua la frecuencia de
aparición de distintas palabras sigue una distribución que puede aproximarse por: 𝑃𝑛 ∼ 1/𝑛 Donde
Pn representa la frecuencia de la n-ésima palabra más frecuente y el exponente a es un número real
positivo, en general ligeramente superior a 1. Esto significa que el segundo elemento se repetirá
aproximadamente con una frecuencia de 1/2 de la del primero, el tercer elemento con una
frecuencia de 1/3 del primero y así sucesivamente. Una ley no empírica, pero más precisa, derivada
de los trabajos de Claude Shannon fue descubierta por Benoît Mandelbrot. La ley de Zipf se
cumple para la mayoría de las lenguas, inclusive para lenguas no naturales como el esperanto.
Binomial.- La distribución binomial es una distribución de probabilidad discreta que nos dice el
porcentaje en que es probable obtener un resultado entre dos posibles al realizar un número n de
pruebas. La probabilidad de cada posibilidad no puede ser más grande que 1 y no puede ser
negativa. En estas pruebas deberemos tener sólo dos resultados posibles, como al lanzar una
moneda que salga cara o cruz o en una ruleta francesa que salga rojo o negro. Cada experimento es
independiente de los otros que hagamos y no influye en las probabilidades de los siguientes, en cada
uno la probabilidad de que se de uno de los dos resultados será exactamente la misma. ejemplo:
p(X ≥ 3) = 1 − p(X <3) = 1 − p(X ≤ 2) = 1 − (p(X = 0)+p(X = 1)+p(X = 2))
En esas ocasiones, siempre que se cumpla n*p*(1‐p) ≥9, podemos aproximar la distribución
binomial a una distribución normal.
Poisson.- La distribución de Poisson sirve para definir variables aleatorias discretas X, X ~ Ps (λ)
que representan el número promedio de ocurrencias de un fenómeno durante un periodo de tiempo
fijo o une región fija del espacio. Por lo general se asemejan a variables binomiales con un elevado
valor de n y un valor muy bajo de p y vendrán caracterizadas un valor promedio, np, al que se
denomina λ.
Pareto. Pareto utilizado originalmente esta distribución para describir la distribución de la riqueza
entre los individuos, ya que parecía mostrar más bien la forma en que una mayor parte de la riqueza
de cualquier sociedad es propiedad de un porcentaje menor de la población de esa sociedad.
También se utiliza para describir la distribución de los ingresos. Esta idea se expresa a veces más
simplemente como el principio de Pareto o la "regla 80-20", que dice que el 20% de la población
controla el 80% de la riqueza. Sin embargo, la regla 80-20 corresponde a un valor particular de α ,
y de hecho, los datos de Pareto en impuestos sobre la renta británicas en su Cours d'économie
politique indica que alrededor del 30% de la población tenía alrededor del 70% de los ingresos. La
función de densidad de probabilidad gráfico (PDF) al principio de este artículo muestra que la
"probabilidad" o fracción de la población que posee una pequeña cantidad de la riqueza por persona
es bastante alto, y luego disminuye de forma constante a medida que aumenta la riqueza. (Tenga en
cuenta que la distribución de Pareto no es realista para la riqueza para el extremo inferior. De
hecho, el valor neto puede ser incluso negativo.) Esta distribución no se limita a describir la riqueza
o ingresos, pero a muchas situaciones en las que el equilibrio se encuentra en el la distribución de la
"pequeña" a la "grande".
4
2. FORMULAS DE MODELOS PROBABILISTICOS (Binomial, Poisson y Pareto)
LA DISTRIBUCIÓN BINOMIAL
es el número de pruebas.
es el número de éxitos. es
El número combinatorio
Media
Varianza
Desviación típica
5
LA DISTRIBUCIÓN DE POISSON
La dstribucion de poisson un modelo discreto, pero en el que el conjunto de valores con probabilidad
no nula
también no es finito, sino numerable. Se dice que una variable aleatoria X sigue la distribución
de Poisson
SI SU FUNCIÓN DE DENSIDAD
Como vemos, este modelo se caracteriza por un sólo parámetro λ, que debe ser positivo.
Varianza: V(X) = λ.
La suma de dos variables aleatorias independientes con distribución de Poisson resulta en una
nueva variable aleatoria, también con distribución de Poisson, de parámetro igual a la suma
de parámetros:
Z ~ P(λ = λ1 + λ2)
variable suma de todas ellas sigue una distribución de Poisson de parámetro igual a la suma de
los parámetros.
6
DISTRIBUCION DE PARETO
En la distribución de Pareto afirma que el 20% de las causas vitales originan alrededor del 80% de los
efectos. O visto desde el punto de vista matemático, que el 20% de las categorías representan el 80%
de las observaciones.
Diagrama de Pareto
7
Adicionalmente, se puede representar con una línea el porcentaje acumulado de cada categoría. Gracias
a esta representación se puede observar como las categorías más grandes representan la mayoría de los
sujetos. En este caso, las tres primeras categorías representan un 86,2% de los casos.
Diagrama
Cuando utilizarlo
Si X es una variable aleatoria con una (Tipo I) de distribución de Pareto, entonces la probabilidad de que
X es mayor que un número x , es decir, la función de supervivencia (también llamada función de la
cola), está dada por
8
De ello se deduce (por
diferenciación ) que la función de densidad de probabilidad es
la distribución asume la curva en forma de J familiar que se aproxima a cada uno de los ejes ortogonales
asintóticamente . Todos los segmentos de la curva son auto-similar (sujeto a factores de escala
apropiados). Cuando se trazan en un gráfico log-log , la distribución está representada por una línea
recta.
9
3. METODO DE RESOLUCION DE LOS MODELOS PROBABILISTICOS
MODELOS DE DISTRIBUCIONES
Para acceder a los modelos de probabilidad que proporciona el Statgraphics seleccionamos Plot /
Probability distributions
10
De todos estos modelos, vamos a estudiar en detalle aquellos modelos de probabilidad que más
frecuentemente surgen al analizar fenómenos de Ingeniería.
DISTRIBUCIÓN BINOMIAL, X B(N,P) .-Recordamos que una v.a. binomial con parámetros n y p
representa una variable donde n es el número de repeticiones independientes del experimento (number
of trials) , y p la probabilidad de éxito en cada repetición (event probability).
En la pantalla, se pulsa el botón derecho del ratón y seselecciona Análisis Options. Aparecerá una
pantalla que permite el estudio simultáneo de hasta cincodistribuciones del tipo seleccionado, con
diferentes valores de los parámetros. Introducimos los datos como en la figura adjunta y damos a OK.
En el siguiente cuadro se han introducido los parámetros de las binomiales B(9,0.2), B(9,0.5) y B(9,0.9).
11
Maximizando el panel de gráficos se puede observar en detalle el gráfico adjunto, que representa la
función de probabilidad de cada una de las tres binomiales anteriores.
Para p=0.5, (en nuestro panel, los puntos marcados con cruces) la gráfica es simétrica.
Para p<0.5 (en nuestro panel, los puntos marcados con cuadrados, que corresponden a p=0.2), la gráfica
es asimétrica a la derecha, es decir, la variable aleatoria presenta asimetría positiva
Para p>0.5 (en nuestro panel los puntos marcados con círculos, que corresponden a p=0.9), la gráfica es
asimétrica por la izquierda, es decir, la variable aleatoria presenta asimetría negativa
5. Si también se quisiese mostrar la función de distribución, se hace clic sobre el botón Graphical
Options de la barra de herramientas y en el cuadro de diálogo que aparece se elige la opción
correspondiente, en este caso CDF (CDF= cumulative distribution function) y density/mass function
12
DISTRIBUCIÓN DE POISSON, Recordamos que la v.a. X Poisson (λ) representa el nº de
la distribución, λ,
representa el nº medio de sucesos que ocurren por unidad de tiempo, longitud, superficie, volumen
13
DISTRIBUCIÓN PARETO .-La distribución Pareto es un procedimiento estático que busca descubrir,
a partir de un análisis de informe de defectos o de quejas de cliente, cuales “pocas causas vitales” son
responsables de la mayoría de los problemas reportados. El viejo adagio dice que 80% de los problemas
reportados pueden ser rastreados al 20% de las diversas causas esenciales.
En un análisis no ponderado, se consideran solo la frecuencia de cada problema para determinar las
pocas causas vitales. En un estudio ponderado, también se consideran el costo o el impacto de cada
problema.
EJEMPLO:
DATOS:
14
INGRESO DE DATOS
La caja de dialogo permite al usuario especificar como están estructurados los datos.
15
los datos están sin tabular, cada fila correspondiendo a un solo defecto, entonces debe ingresarse el
nombre de la columna que identifica el tipo de defecto. Si ya se calculó la frecuencia de cada tipo de
defecto, entonces se de ingresar la columna que contiene el recuento para cada tipo.
Etiquetas: Una columna con etiquetas, una para cada tipo de defecto. Ese campo se usa principalmente
para datos tabulados, en cuyo caso el orden de las etiquetas debe corresponder con las frecuencias en el
campo Datos. Para datos no tabulados, las etiquetas generalmente se generan automáticamente a partir
de las entradas de Datos. De manera que este campo puede quedar en blanco. Sin embargo, si se
ingresan etiquetas para datos no tabulados, se asignaran a los tipos de defectos en la columna de Datos
en orden numérico o alfabético, dependiendo del tipo de columna de datos. Ponderaciones: Cuando
se crea un gráfico de Patero ponderado o de
Resumen de análisis
16
En los datos de la muestra, hay n=166 defectos de k=19 diferentes tipos.
Tabla de frecuencias
Esta tabla muestra cada uno de los diferentes tipos de defectos, ordenados de del más al menos
frecuente:
En el ejemplo, los 3 tipos de defectos más comunes fueron dimensiones incorrectas, partes dañadas y
problemas operando la maquinaria. Juntos estos 3 tipos de problemas responden por cerca del 60%de
todos los defectos.
Gráficos de Pareto
17
Los tipos de defectos se han ordenado del más al menos frecuente. Por arriba de las barras, se ha
dibujado una línea representando el número acumulado de defectos de izquierda a derecha. Por ejemplo,
los 3 tipos de defectos de más a la izquierda responden por 99 del total de 166 defectos observados.
Mostrar: el valor que se podrá sobre cada barra. Ya sea el porcentaje del `puntaje total ponderado, el
puntaje o ninguna etiqueta.
Esta forma de gráfico de Pareto usa las barras para crear la curva acumulada.
18
Opciones del análisis de Pareto
Si hay muchos tipos de defecto que ocurren rara vez, los defectos menos frecuentas pueden combinarse
en una sola clase “otros” usando las opciones de análisis.
Combinar clase:
Recuentos Menores Que: Combinar todas las clases con puntajes menores que la especificada.
Porcentaje Menores Que: combinar todas las clases que corresponden por menos que el porcentaje
especificado del puntaje ponderado total.
Clases Más Pequeñas: Combinar el número especificado de clases que tienen los puntajes más
pequeños.
19
Ej. Combinar clases con menos del 2% de todos los defectos
EJEMPLO DE RESOLUCION
Esta ventana evalúa la distribución acumulada de la Distribución Binomial. Calculará las áreas de colas
para hasta 5 valores críticos de la distribución. También calculará la probabilidad de densidad ó la
función de masa. Por ejemplo, el resultado indica que, para la primera distribución especificada, la
probabilidad de obtener un valor menor que 0.0 es 0.0. También, la probabilidad de obtener un valor
mayor que 0.0 es 1.0. La probabilidad de obtener un valor exactamente igual a 0.0 es 1.024E-7.
Fila 1
Fila 2
Fila 3
Fila 4
0 2 4 6 8
frecuencia
los valores críticos para la Distribución Binomial. Pueden especificarse hasta 5 áreas de cola. El valor
crítico se define como el mayor valor para la Binomial tal que la probabilidad de no exceder ese valor
20
no excede el área especificada. Por ejemplo, el resultado indica que, para la primera distribución
especificada, 1.0 es el valor más grande tal que la probabilidad de no exceder 1.0 es menor ó igual a
0.01.
AÑO BODEGA DE
2018 CALCIO
La siguiente tabla:
Distribuciones de Probabilidad
Distribución: Poisson
Parámetros: Media
Dist. 1
Dist. 2
Dist. 3
Dist. 4
Dist. 5
21
Probabilidad de Masa (=)
Variable Dist. 1
0.0000453999
Variable Dist. 1
0.999955
FDA Inversa
Distribución: Poisson
Dist. 1
Esta ventana encuentra los valores críticos para la Distribución Poisson. Pueden especificarse hasta 5 áreas de
cola. El valor crítico se define como el mayor valor para la Poisson tal que la probabilidad de no exceder ese
valor no excede el área especificada. Por ejemplo, el resultado indica que, para la primera distribución
especificada, 3.0 es el valor más grande tal que la probabilidad de no exceder 3.0 es menor ó igual a 0.01.
22
TIEMPO
ESTUDIO
Realiza un ejercicio de MODELOS PROBABILISTICOS Pareto
1. El 80% del tiempo que te pasas estudiando sin haber planificado la sesión de estudio ,
solo eres un 20%produtivo.
NUMERO
Distribución Acumulada
Distribución: Pareto
Variabl Dist. 1
Probabilidad de Densidad
Variabl Dist. 1
23
Área Cola Superior (>)
Variabl Dist. 1
Esta ventana evalúa la distribución acumulada de la Distribución Pareto. Calculará las áreas de colas para hasta
5 valores críticos de la distribución. También calculará la probabilidad de densidad ó la función de masa. Por
ejemplo, el resultado indica que, para la primera distribución especificada, la probabilidad de obtener un valor
menor que 0.0 es 0.0. También, la probabilidad de obtener un valor mayor que 0.0 es 1.0.
FDA Inversa
Distribución: Pareto
Dist. 1
1.001005539
1.010591751
1.071773463
1.258925412
1.584893192
24
Binomial (función de masa y densidad y la de distribuciones acumuladas)
Binomial
Binomial
25
26