Está en la página 1de 51

Especialización Gerencia de

Marketing

Estadística y Modelos de
Decisión
Materia : Estadística

PROBABILIDAD

Docente: Martha Lucía Corrales Bossio


2. PROBABILIDAD Y VARIABLES ALEATORIAS

2.1 Fenómenos determinísticos y aleatorios.


2.2 Enfoques de Probabilidad.
2.3 Definición clásica de probabilidad.
2.4. Probabilidad condicional. Independencia de eventos
• Experimento aleatorio: experimento en el cual
antes de su realización no se conoce con
certeza su resultado.
• Espacio muestral: conjunto de todos los
posibles resultados de un experimento
aleatorio.
• Evento o suceso: subconjunto del espacio
muestral
• Probabilidad de un suceso es el número al que tiende
la frecuencia relativa asociada al suceso a medida que
el número de veces que se realiza el experimento
crece.
Conteo de puntos muestrales

• Principio fundamental del conteo: Si una operación


se puede llevar a cabo en n1 formas, y si para cada
una de estas se puede llevar a cabo una segunda
operación en n2 formas y para cada una de las
primeras dos se puede realizar una tercera
operación en n3 formas y así sucesivamente,
entonces la serie de k operaciones se puede realizar
de
n1 n2 n3… nk formas.
• Sam va a armar un computador y tiene
opciones de chips de 2 marcas, un disco
duro de 4 marcas, memorias de tres
marcas y accesorios de cinco tiendas
locales, ¿de cuántas formas diferentes
puede Sam comprar las partes?
• 2 x 4 x 3 x 5 = 120
Permutaciones

• Una permutación es un arreglo de todo


o parte de un conjunto de objetos.
• El número de permutaciones de n
objetos distintos es n!
• El número de permutaciones de n
objetos distintos tomados de r a la vez es
nPr = (n!)/(n-r)!
• Permutaciones de: a – b- c abc, acb,
bac, bca, cab, cba

• Permutaciones de a, b y c tomando de 2
en 2:
ab,ac,ba,bc,ca,cb
Combinaciones

• El número de combinaciones de n
objetos distintos tomados de r a la vez
es:
𝑛
𝑟
= nCr = (n!) / (r! (n-r)!)
• Un niño le pide a su mamá que le lleve
cinco cartuchos de Game Boy de su
colección de 10 de arcada y 5 de
deportes. De cuantas maneras su mamá
le llevará 3 juegos de arcada y 2 de
deportes?
• 10C3 = 120
• 5C2 = 10
• Total = 120 x 10 = 1200
Fórmulas básicas probabilidad
Probabilidad condicional

EVENTOS INDEPENDIENTES
Variables aleatorias
• Variable aleatoria: función que va del espacio
muestral a los números Reales.

• Tipos de variables:
– Discretas
– Continuas

• Se representan con las letras : X,Y,Z,W, …


• Variables aleatorias discretas
– Ej: número de accidentes por año en una ciudad,
número de huevos que pone mensualmente una
gallina, número de artículos defectuosos en una línea
de producción, …
– f(x) : función de probabilidad
– F(x): función de distribución o acumulada
– P(X = a) = f(a).
– E(X) = σ 𝑥 𝑓(𝑥)
– Var(X) =σ 𝑥 − μ 2 𝑓(𝑥)
Distribución binomial
Supongamos que un experimento aleatorio tiene las
siguientes características:
• En cada prueba del experimento sólo son posibles dos
resultados: el suceso A (éxito) y su contrario A’
(fracaso).
• El resultado obtenido en cada prueba es
independiente de los resultados obtenidos
anteriormente.
• La probabilidad del suceso A es constante, la
representamos por p, y no varía de una prueba a otra.
La probabilidad de `A es 1- p y la representamos
por q .
• El experimento consta de un número n de pruebas.
D. Binomial
Distribución binomial
• De acuerdo a una encuesta a nivel nacional en Estados Unidos de la
universidad de Michigan a estudiantes universitarios de último año
revela que el 70% de los estudiantes desaprueba el consumo diario
de la mariguana. Si se seleccionan doce estudiantes al azar y se les
pide su opinión, encuentre la probabilidad de que el número de los
que desaprueban fumar mariguana todos los días sea:
• a) entre siete y nueve.
• b) a lo más cinco.
• c) no menos de ocho.
• d) Represente esta distribución binomial en un histograma.
• e) Calcule la media y la varianza de esta distribución binomial.
D. Binomial
• La probabilidad de éxito de una determinada vacuna es 0,72. Calcular
la probabilidad de a que una vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
D. Poisson
• Expresa la probabilidad de un número k de eventos ocurriendo en
un tiempo fijo si estos eventos ocurren con una tasa media
conocida, y son independientes del tiempo desde el último
evento.
D. Poisson. Ejemplo
Supóngase que estamos investigando la seguridad de un cruce
muy peligroso. Los archivos de la policía indican una media de
cinco accidentes por mes en él. El número de accidentes está
distribuido conforme a la distribución de Poisson, y la división
de seguridad en carreteras quiere calcular la probabilidad de
exactamente 0,1,2,3 y 4 accidentes en un mes determinado.

X = numero de accidentes por mes en el cruce

P(X=0) = (5)0 (e-5) /0! = 0.00674


P(X=1) = (5)1 (e-5) /1! = 0.03370
P(X=2) = (5)2 (e-5) /2! = 0.08425
P(X=3) = (5)3 (e-5) /3! = 0.14042
P(X=4) = (5)4 (e-5) /4! = 0.17552
Distribución normal
Esta distribución es frecuentemente utilizada en las aplicaciones
estadísticas. Su propio nombre indica su extendida utilización,
justificada por la frecuencia o normalidad con la que ciertos
fenómenos tienden a parecerse en su comportamiento a esta
distribución.
D. Normal
D. Normal
D. Normal estándar
Ejemplo 1
Supongamos que cierto fenómeno pueda ser representado
mediante una v.a. X Normal con media 45 y desviación
estándar 9 , y queremos calcular la probabilidad de que X
tome un valor entre 39 y 48
Ejemplo 3

• El consumo medio bimestral de energía eléctrica en una ciudad es


de 59 Kwh., con una desviación típica de 6 Kwh. Se supone que se
distribuye según una distribución normal. a) ¿Cuántos Kwh. tendría
que consumir bimestralmente para pertenecer al 5% de la
población que más consume?. b) Si usted consume 45 Kwh. ¿qué %
de la población consume menos que usted?
• A) Buscamos el valor de la variable X cuya probabilidad acumulada
es el 0,95= 68,87. Por lo tanto tendría usted que consumir más de
67,87 Kwh. bimestralmente para pertenecer al 5% de la población
que más consume.
• B) P (X ≤ 45) = 0,0099
• C) P(X>62) = 1 – P(X<=62) = 1 – 0,6915 = 0,3085
• D) P(50<X<60) = P(X<60) – P(X<50) = 0,5662-0,0668 = 0,4994
INFERENCIA ESTADISTICA
Y
REGRESIÓN LINEAL
INTERVALOS DE CONFIANZA

• Una media
• Una proporción
• Ejemplo 1: si los resultados de una encuesta dicen que 100
personas comprarían un producto y tenemos un error
muestral del 5% comprarán entre 95 y 105 personas.
• Ejemplo 2: si hacemos una encuesta de satisfacción a los
empleados con un error muestral del 3% y el 60% de los
encuestados se muestran satisfechos significa que entre el
57% y el 63% (60% +/- 3%) del total de los empleados de la
empresa lo estarán.
• Ejemplo 3:si los resultados de una encuesta electoral
indicaran que un partido iba a obtener el 55% de los votos y el
error estimado fuera del 3%, se estima que el porcentaje real
de votos estará en el intervalo 52-58% (55% +/- 3%).
Una media
• Conocida sigma o tamaños muestrales grandes (mayores o
iguales de 30)

• Desconocida sigma y tamaños de la muestra pequeños (menor a


30) (t distribución de Stdent con n-1 grados de libertad)
En una determinada empresa, se seleccionó al azar una muestra de 100
empleados cuya media de ingresos mensuales resultó igual a 705 euros, con
una desviación típica de 120 euros. Halla un intervalo de confianza al 99%
para la media de los ingresos mensuales de todos los empleados de la
empresa.
Una proporción
Muestras grandes

Donde Pn representa la proporción obtenida en la muestra, y n


es el tamaño de la muestra
Tamaño de la muestra para una proporción

d = margen de error, p generalmente se toma como 0,5 y q = 1-p. También se


pueden asumir valor diferentes para p dependiendo de valores históricos o
estimados con anterioridad.
Tamaño de la muestra para una media

d=margen de error, s= varianza de una muestra piloto


REGRESION Y CORRELACIÓN
• Técnica estadística para determinar la relación entre
dos variables
• Covarianza:
Cov(X,Y) = E(XY) – E(X)E(Y)
• Coeficiente de correlación
ρ= cov(X.Y)/σxσy
• El coeficiente de correlación puede variar entre -1 y 1
• No existe relación entre las variables cuando el
coeficiente es cero.
Correlaciones
Correlación. Ejemplo

Masa 60 65 70 75 80 85 90 95 100

Fuerza 100 105 102 135 95 125 140 130 148


Si sabemos que existe una relación entre una variable denominada
dependiente y otras denominadas independientes (como por ejemplo las
existentes entre: la experiencia profesional de los trabajadores y sus
respectivos sueldos, las estaturas y pesos de personas, la producción agraria
y la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que
la dependiente asuma múltiples valores para una combinación de valores de
las independientes.
La dependencia a la que hacemos referencia es relacional matemática y no
necesariamente de causalidad. Así, para un mismo número de unidades
producidas, pueden existir niveles de costo, que varían empresa a empresa.
Si se da ese tipo de relaciones, se suele recurrir a los estudios de regresión
en los cuales se obtiene una nueva relación pero de un tipo especial
denominado función, en la cual la variable independiente se asocia con un
indicador de tendencia central de la variable dependiente. Cabe recordar que
en términos generales, una función es un tipo de relación en la cual para cada
valor de la variable independiente le corresponde uno y sólo un valor de la
variable dependiente.
• Ecuación de regresión: Yi = βXi + α + εi

• ESTIMACIÓN DE LA ECUACIÓN DE REGRESIÓN MUESTRAL : Consiste


en determinar los valores de "a" y "b " a partir de la muestra, es
decir, encontrar los valores de α y βcon los datos observados de la
muestra. El método de estimación es el de Mínimos Cuadrados,
mediante el cual se obtiene:
• Luego, la ecuación de regresión muestral
estimada es

• Que se interpreta como:


a es el estimador de α
Es el valor estimado de la variable Y cuando la
variable X = 0
b es el estimador de β , es el coeficiente de
regresión
Supuestos

• Los valores de la variable independiente X son fijos,


medidos sin error.
• La variable Y es aleatoria
• Para cada valor de X, existe una distribución normal de
valores de Y (subpoblaciones Y)
• Las variancias de las subpoblaciones Y son todas
iguales.
• Todas las medias de las subpoblaciones de Y están
sobre la recta.
• Los valores de Y están normalmente distribuidos y son
estadísticamente independientes.
• Los datos de la siguiente tabla representan las estaturas (X, cm) y los
pesos (Y, kg) de una muestra de 12 hombres adultos. Para cada
estatura fijada previamente se observó el peso de una persona
seleccionada de entre el grupo con dicha estatura, resultando:
Resultados

Lo que nos permite obtener los coeficientes a y b.


Luego,
b = 1223 / 1409.667 = 0.8676
a = 65.25 – (0.8676) (162.167) = -75.446

Coeficiente de correlación: R= 0.9379


Coeficiente de determinación: R²=0.8796