Está en la página 1de 57

ghpl@ucema.edu.

ar
germanwiens6@hotmail.com
Clase 1
2/08
integrate(x*3/41*abs(x) dx from -1 to 1)+integrate(x*3/41*sqrt(x) dx from 4 to 9)
https://www.wolframalpha.com/input/?i=integrate%28x*3%2F41*abs%28x%29+dx+from+-1+
to+1%29%2Bintegrate%28x*3%2F41*sqrt%28x%29+dx+from+4+to+9%29

Nociones de análisis combinatorio


1- Variaciones simples: son todos los arreglos de n elementos tomados de a m, donde no
se pueden repetir elementos y el orden importa.

ej: 4 personas y 3 sillas.


¿De cuántas maneras puedo ubicar a esas personas? personas: a, b, c, d y sillas 1, 2, 3

No puedo repetir , cambiar el orden hace la diferencia. Que sea simple tiene que ver con
que no puedo repetir elementos.
¿Cómo saber cuántas alternativas hay?
las variaciones de 4 elementos tomados de a 3 es 24. V4;3 = 24

La cantidad de factores que tengo n ( n-1) (n-20 .. hasta completar y llegar a M. también
esta formula puedo escribirla como n! / (n-m)!
m = sillas
n = personas

2- Combinaciones simples: son todos los arreglos de n elementos tomados de a m, donde


no se pueden repetir elementos y el orden no importa.

ej: 4 personas (n) y grupo de 3 personas (m)

El orden no importa, porque si yo digo "el grupo está conformado por abc o bca" es lo
mismo.
4! /(4-3)! . 3!
Por lo tanto, la combinación de n elementos tomados de a m es : n! / (n-m) ! . m!

3- Permutaciones simples: son todos los arreglos de n elementos de a n, no se pueden


repetir elementos y el orden importa

Pn = Vn, n = n !/ (n-n)! = n!/0 = n!

4- Variaciones con repetición: son todos los arreglos de n elementos tomados de a m,


donde se pueden repetir elementos y el orden importa
nˆm

5- Combinaciones con repetición: son todos los arreglos de n elementos tomados de a


m, donde se pueden repetir elementos y el orden no importa
ejemplo: 4 colores (r, v, a, m) y 3 mesas (iguales)
No debería contabilizar las alternativas iguales

¿Qué lógica usa?


a los que estén en la primer columna sumo 0
a los que estén en la segunda columna sumo 1
a los que estén en la tercer columna sumo 2
la cant máxima que sumo es uno menos de la cantidad de columnas

C'4;3 = C6;3 = 6!/ (6-3)! 3!

Formula general : C'n:m = Cn+m -1 ; m

Ejemplo 2: Calcular la combinación con repetición de 2 colores y 5 objetos (C'2;5)


C2+5 - 1 ; 5 = C 6;5
Usó la fórmula de combinación simple C n;m = n!/ (n - m)! m!
6!/(6-5)! 5! = 720/ 1.120 = 6

6 - Permutaciones con repetición:


Tengo un grupo de elementos que son distintivos y otro que no lo son
ej: Tengo 10 tarjetas de colores: 5 r, 3 a, 2 v
Hay casos donde por más de que cambie una tarjeta de lugar, sigue siendo lo mismo.

Ejemplo: cuántas contraseñas puedo hacer usando 5 veces la letra r , 3 la letra a y 2 la letra
v
V → 2!
A → 3!
R → 5!

P10 ^(2, 3, 5, ) = 10! / 2!. 3!. 5! =


p n elementos es = n! / a! . b! . c!

Probabilidad
¿Cómo aplicamos lo que vimos recién? Se puede aplicar sobre casos favorables sobre
casos posibles
C2)
ejemplo: cuál es la probabilidad de que salga cara o seca
P ( cara) = ½ = 0,5 = 50%

Ejemplo: truco → 3 cartas


Flor → 3 cartas del mismo palo.
Mazo 40 cartas
¿Cómo calculo? Casos favorables sobre los casos posibles

el orden no importa, pero no puedo repetir → combinación simple

= 4, 86%
Es decir, aprox, que cada 20 manos podría tener flor.

Ejemplo:
3 chicos 7 caramelos (iguales)
¿Cuantas alternativas tengo?
Etiqueta y códigos
Una manera, es pensar a los chicos como etiquetas y los códigos, son los caramelos

La otra manera, es pensar a los caramelos como etiquetas y los chicos como códigos
En el primer caso, no podemos pensarlo con todo lo que vimos. Es fundamental la
codificación y el razonamiento. Conviene la segunda manera y podemos pensarlo con
combinación con repetición.

Clase 2
9/08

Número combinatorio:

Cn;m = n!/ (n-m)! m!

Propiedades
1- ( n )
(0) =1

2- ( n )
(1)=n

3- números combinatorios complementarios


(n) (n)
( p ) = ( q ) si p+q = n

4- ( n )
(n)=1

5- ( n )
( n-1) = n

6-

Binomio de Newton
3 3-k k
(a + b)ˆn = ∑ ( 3 ) aˆ bˆ =
(h)
la A va bajando (3, 2, 1,0) y los B van subiendo (0, 1, 2, 3)

Triángulo de Pascal ( o tartaglia)

Ponemos 1 en las diagonales y arriba


y luego, la lógica es, debajo de dos elementos pongo la suma de ellos
En cada renglón obtener los coef de desarrollo de a+b al 2 al 3…
Es un modo de conocer los coef de desarrollo, la desventaja, es con números grandes, con
el binomio de newton hago directamente el coef que quiera.

Probabilidad:
Experimento aleatorio: está identificado por un acontecimiento que se produce con azar y la
observación de un resultado

ej: tiro una piedra y cae en cierto lugar (hay distintas alternativas de tachos)
si yo sé exactamente con qué ángulo lo tire, sabré exactamente, no habría azar.

Resultados posibles: son los distintos valores o estados que pueden obtenerse al realizar el
experimento

espacio muestral: conjunto formado por todos los resultados posibles

eventos unitarios o eventos simples: es


Ei = {1} , E2 = {2}, un evento es cualquier subconjunto del espacio muestral.
Todas las posibilidades de subconjuntos, cualquier subconjunto podría ser un evento
¿Cuál es la probabilidad?
la prob es una función que le asigna a cada evento un número real
existen 4 enfoques:
1. definición clásica o Laplace
el espacio muestral tiene que ser equiprobable
P(a) = cf/cp

Ej: se arrojan dos dados no cargados, y se observa la suma obtenida, hallar dicha suma sea
igual a 7.
el espacio muestral no es equiprobable, ya que para la posibilidad de 2 hay solo 1 caso
favorable, mientras que para 6 hay más.

2. enfoque frecuentista
la probabilidad es :
P(a) = lim n (a) / n
n→∞

Es una forma de entender la probabilidad, muy usada en las inversiones, ej: saber el VAN.

3. Probabilidad subjetiva:
No hay fórmula, es en base a las experiencias. "nosotros creemos que la
rentabilidad puede ser 4000 millones, con una probabilidad del 50%" sale de la
experiencia, de casos parecidos.

4. Enfoque axiomático de la probabilidad:


dado un espacio muestral y un evento A perteneciente a dicho espacio, diremos que
P(A) es una función de probabilidad, si y sólo si, dicha función cumple con los
siguientes axiomas:

- Axioma 1: Para todo A la P(a) >=0


- Axioma 2: P(s) =1 el espacio muestral también es un evento, el evento S
tiene que tener si o si una prob que sea 1
- Axioma 3: Para todo A, B : S: Ay B son eventos disjuntos (A unión B =ø ) →
la probabilidad que ocurra a o b
P(AUB) = P(A) + P(B)
P: …. → ……
f: R → R / f(x) en la probabilidad: quien sería el dominio y el que va en el segundo lugar?
P: ( conjunto de partes o potencia del espacio muestral. es el conjunto de todos los
subconjuntos posibles de S ) P(s) → R (la llegada es un número real, es lo que obtenemos
como conjunto de llegada) y luego sigue la fórmula (ejemplo la de Laplace, es una de las
posibles)

A partir de los axiomas se pueden deducir algunas propiedades:


1- A u Complemento = S → (A u Complemento) son eventos disjuntos = P(s)
A n Complemento = ø podemos pensarlo como → P(a) + P(complemento) = P(s)

Probabilidad complementaria =
ejemplo: la probabilidad de que llueva es del 60%, la de que no llueva es el 40%
2- Axioma 1 → Para todo a P(A) ≥ 0 → P(Complemento)≥ 0
→ 1-P(a) ≥0 → P(a) ≤ 1
siempre la probabilidad va a estar entre 1 y 0 , sea como sea que yo la defina, no puede dar
negativo ni más que 1
3-
La P(AuB) =
Son eventos disjuntos porque no tienen nada en común

La probabilidad de B = Probabilidad de B y no A u la intersección de a y b, y tambien son


disjuntos

si despejamos queda que:

y si lo reemplazó queda la fórmula para la unión de eventos, Ley aditiva de las


probabilidades

4- Probabilidad condicional

P(A/B)=
¿Por qué? si tenemos la situación anterior, cuál es la probabilidad de que ocurra A cuando
ya estoy en el contexto de que ocurre B (estoy dentro de B), osea que chance de que este
en la zona de la intersección, los casos favorables será el cardinal de A intersección B, y los
casos totales es estar en B

podría dividir ambos por el cardenal de S, que es igual a la fórmula de condicional

Podemos despejar y obtener la fórmula de intersección , llamada Ley multiplicativa de las


probabilidades
Dos eventos son independientes si y sólo si, la ocurrencia de uno no afecta la probabilidad
de ocurrencia del otro, saber que ocurriendo que paso B, no me afecta a A. (ejemplo: tengo
un dado y una moneda, sabiendo que salio 6, cuál es la probabilidad de que me toque cara,
no tiene nada que ver, cuando los eventos son independientes las probabilidades se
multiplican)

(caso especial)

Ejercicio: hay dos urnas que tienen bolillas rojas y bolillas azules. La urna "U" tiene 5 rojas y
8 azules, y la urna "V" tiene 9 rojas y 4 azules.
Se toma una bolilla al azar de la urna "U" y se la extrae ( sin mirarla) y se la deja oculta
debajo de una carpeta. Luego, tomó otra bolilla al azar de la urna "U" y la transfiero a la
urna "V". Finalmente, hago una extracción de la urna "V".

a) determinar cuál es la probabilidad de que en esa última extracción, la bolilla sea roja.
(copiado en cuaderno)
b) hallar la probabilidad de que habiendo sacado al final una azul, la que se hubiera
transferido fuera roja. (saco al final una, y se que es una azul)

Clase 3
Teorema de la probabilidad total

Espacio muestral donde dentro del mismo definimos una partición (dividir un conjunto en
subconjuntos) tal que esa subdivisión cumpla que la unión me da el conjunto total, no hay
solapamiento

lo que dice la tesis:

la probabilidad de un evento D (transversal a todas):

d) D = (D n A1) u (D n A2) u … (D n An)


→ se van a sumar las probabilidades
P(D) = P (Dn A1) + …..+ P(D n An)

n
→ P(d) = ∑ p (d n a1)
i=1

n
→ P(d) = ∑ P(D | A1) . P (A1)
i=1

Teorema de Bayes
misma hipótesis que antes

Tesis: n
P ( Ak / D) = P(D| Ak) P(Ak) / ∑ P(D| A i) P(Ai)
i= 1

d) P ( Ak/ D) = P(Ak n D) / P(D) = P(D n Ak)/ P(D)

n
= P (D / Ak) P(Ak) / ∑ P (D | Ai ) P (Ai)
i=1
Ej: en una empresa la producción se realiza con 3 máquinas (A1 , A2, A3)
La máquina A 1 genera el 30% de la producción, la máquina A2 el 50% y la A3 el resto. Las
máquinas A1, A2 y A3 dan un porcentaje de piezas defectuosas en un 9%, 7% y 12%
respectivamente.

a) hallar la probabilidad de que al tomar una pieza al azar, ésta sea defectuosa.
b) Indicar la probabilidad de que una pieza defectuosa haya sido fabricada por A2.

A) P (D) = 2,7% + 3,5% + 2,4% = 8,6%


B) P ( A2 | D) = P (A2 n D ) / p( D ) = 3,5% / 8,6% = 40, 69%

Variable aleatoria:
Definición: una variable aleatoria es una función que le hace corresponder, a cada elemento
del espacio muestral, un número real.

Ej: x: rentabilidad obtenida en un negocio


x: número de caras observadas al tirar 3 monedas
x: cantidad de clientes que llegan a una fila en la caja de un supermercado durante
media hora
x: peso de una persona tomada al azar
x: tiempo que transcurre entre dos fallas de una máquina

pueden ser finitas o infinitas si no tengo un máximo

Clasificación de las variables aleatorias

- continuas : un peso, un tiempo, una longitud

- discretas:
finitas: el número de caras observado al tirar monedas:
infinitas: el número de fallas en tres metros de cable

Ejemplo: se arrojan 3 monedas y se observa el número de caras obtenido

X: "numero de caras:

P(x) = P (X=x)
p(2) = P(X=2)
la probabilidad de que el número de caras sea 2 (es un evento)

Funcion de distribucion:

F(X) = P (X ≤ x)

P(a) es la sumatoria para todos los x correspondientes al evento de la función probabilidad


ej: A = (0,7 ; 2,8)

o lo podemos hacer por diferencia:

P( a ≤ X ≤ b) = F(b) - F(a)
--------------
A

Propiedades de la función de probabilidad y distribución:

El limite tiende a 1 en +∞
El límite tiende a 0 en -∞

La sumatoria P(x) = 1 (osea la tablita si sumo los valores de la derecha me dan 1)

La F(x) es creciente

Esperanza matemática o valor esperado de una variable aleatoria:


E(x) = es la sumatoria de X para todo X por P(x)

ej:

el 1,5 serían caras de la moneda.


¿Qué significa? si yo tirara mil veces, el número que al dividir por las veces que tiramos me
da aproximadamente 1,5
Es el valor que obtiene la variable aleatoria en promedio.

Ejercicio:
¿Cual es la esperanza matemática de la ganancia de un jugador que apuesta $1 a la ruleta
en una jugada "a pleno"?

¿Quién es la variable aleatoria? → X: la ganancia del jugador que apuesta $1


La tabla que armamos, tiene 2 posibilidades: ganar o perder.

-1/37 es la ganancia que obtiene un jugador en una jugada "a pleno"

¿Cual es la esperanza matemática de la ganancia de un jugador que apuesta $1 a la ruleta


en una jugada "a una docena"?

¿Cual es la esperanza matemática de la ganancia de un jugador que apuesta $1 a la


quiniela en una jugada a dos cifras?

Varianza y desvío de una variable aleatoria:

la varianza es la sumatoria para todo ( x -m )ˆ2 P(x)

el desvío es la raíz cuadrada de la varianza

Otra manera de calcular la varianza es la esperanza de los x al cuadrado - la esperanza de


x, al cuadrado
Ej: 3 monedas
E(x) = 1,5
Clase 4:
Variables aleatorias continuas

Lo que me va a dar la probabilidad, es el área debajo de esa curva:

Función de densidad de probabilidad F(x)


def: P ( x < X ≤ x + dx ) = F (x) dx

La probabilidad de que x se encuentre entre un valor a hasta un valor b:

En vez de hacer la sumatoria, hacemos la integral

Función de distribución
x
Def: F(x) = P(X ≤ x) → F(x) = ∫ ƒ(x) dx
-∞

Esperanza matemática:
+∞
Def: E(x) = ∫ x . ƒ(x) dx
-∞

Varianza y desvío:

+∞
Def: ∂ˆ2 (x) = ∫ x . ƒ(x) dx → (análogo al caso discreto)
-∞
∂ˆ2(x) = E(xˆ2) - [E(x)]ˆ2

+∞
siendo: E(xˆ2) = ∫ xˆ2 . ƒ(x) dx
-∞
luego el desvío ∂ (x) = (raiz cuadrada) ( ∂ˆ2(x))

Ej:
El tiempo de fabricación de determinada pieza sigue una ley como la que se indica a
continuación
a) calcular la constante k (constante de normalización)
b) determinar la funcion de distribucion
c) hallar la esperanza matemática del tiempo de fabricación
d) calcular la varianza y desvío de dicho tiempo
e) hallar la probabilidad de que el tiempo sea mayor que 2 y menor que 7

Tiempo de fabricación = X

b)
f(x) ?
La función de distribución es ir caminando por el eje Z=X y ver cuánta area tengo a la
izquierda
(Copiado todo en papel)

Coeficiente de asimetría:
para casos discretos:

En el caso continuo:

(Copiado todo en papel)

Coeficiente de curtosis
∑ ( x - m) ˆ4 p(x) = ∑ (x ˆ4 -4xˆ3m + 6xˆ2 mˆ2 - 4x mˆ3 + mˆ4) p(x)

el coeficiente tanto en el continuo como discreto lo podemos escribir como:

función generatriz de momentos

def Mx (t) = E (eˆxt)

+∞
=∫ d/dt (e^xt) ƒ (x) dx
-∞
copiado en el cuaderno :) esta tambien en la clase de perez lance

Clase 5:
Función generatriz de momentos (continuación)
Cambio de variable aleatoria

hago la inversa por que quiero despejar, hago la operación contraria por que se cancele, me
queda:

ej: tenemos una función de densidad de una variable aleatoria x de tipo Kˆ2 , en el intervalo
(0; 2)
Y = ƒ(x) =

G(y) = P (Y ≤ y ) = P ( ≤y)=

(ver devuelta toda)

Ej: Supongamos que tenemos un negocio para proponer a un inversor. Ese negocio
requiere una determinada inversión y tiene una ganancia cuya esperanza es de 1 millón y el
desvío es igual a 400000. Determinar la máxima probabilidad de perder plata haciendo este
negocio.

Clase 6:

CLASE 6
Distribución binomial (continuación)

La A(x) = 0 , es perfectamente simétrico


cuando en una binomial aumenta la M va a tender a ser simétrico

Distribución Poisson

x: eventos por unidad de tiempo o por unidad de espacio (lineal, superficial, o volumétrico)
La variable aleatoria x puede tomar distintos valores pero no hay un máximo, puede haber
un máximo or disposición de recursos pero es un límite práctico no teórico

Ejemplo: el número promedio de accidentes en un cuatrimestre, en una planta, es igual a


3.5. Hallar la probabilidad de que en el próximo trimestre de que en el proximo trimestre,
ocurran más de 2 accidentes en esa planta. Asumir que Poisson es un modelo adecuado
para esta situación.

X: cantidad de accidentes en el lapso de 3 meses

P(X>2) ?
Copiado en el cuaderno

Mx(t) ?
formula gral de poisson

M'x (t)

M''x (t) =

Distribución geométrica
ejemplo:
Una persona tira al blanco, con la probabilidad de acertar igual a 0,8. Determinar cuál es la
probabilidad de tener que intentar 4 veces hasta conseguir el primer acierto.
x: número de intentos necesarios hasta conseguir el primer éxito
x: 1, 2, 3 …. es una variable aleatoria discreta e infinita
Se trata de repeticiones: idénticas, independientes y dicotómicas, es un proceso "bernoulli"
no miro la cantidad de éxitos, sino que cuantos intentos me costo conseguir el éxito, por eso
no es binomial.

si reemplazo la fórmula en t=0 me queda la esperanza

el ejemplo es importante para que uno lo conecte

Distribución pascal (o binomial negativa):

ejemplo: idem caso anterior, del tirador al blanco, pero queremos saber cual es la
probabilidad de que tenga que intentar 7 veces hasta haber acumulado 3 aciertos
ver última parte (30m)
Clase 7:

copiado en el cuaderno, también disponible clase perez lance pdf

Clase 8:
ver primera parte hasta 12:34
La esperanza en el tiempo de vida útil de determinado equipo es de 1,5 años. suponiendo
que el tiempo de vida útil sigue una ley exponencial, determinar la probabilidad de que un
equipo que funcionó sin problemas durante 2 años, siga funcionando bien a lo sumo por 9
meses más

E(x)=m=1,5

en una exponencial siempre la función de distribución es 1 (copiar)


P( x ≤ 2,75 / X ≥ 2) = P ( X ≤ 2,75 n X ≥2) / p (x ≥ 2)

= P ( 2≤ X ≤ 2,75) / p ( x ≥ 2)

= F (2,75) - F(2) / 1- F(2)=

La probabilidad de que una computadora tenga falla es igual a 0.0012. En un sector en que
hay 20 computadoras determinar cuál es la probabilidad de que más de dos computadoras
tengan falla.

p = 0,012

m = 20

El tiempo que necesita una persona para trasladarse a la empresa es una variable normal
N(46:29) minutos. Suponiendo que sale de su casa a las 7:30 y debería llegar no más tarde
de las 8:30. Indicar qué porcentaje de las veces no llegará tarde. Calcular el percentil 88 e
indicar su significado.
Calcular el percentil:

b) P 88? donde ubico un x que deje hacia la izquierda un área igual a 0,88.
P( X ≤ P88) = 0,88
(me fijo en la app etc)

z = x - m / desvío → x = 1,175 . 29 = 46

EL 88% VA A TARDAR 80,07 MINUTOS

de donde sale z: (de la tabla)

1. Una empresa que se dedica a la venta de granos café posee dos sucursales de
venta ubicadas en distintas ciudades. La cantidad de kilogramos vendidos
semanalmente en la sucursal A tiene una distribución normal con una media de 50
kg y desvío de (15 − 4V + 12W = 7 )kg. Por otro lado, las ventas semanales para la
sucursal B siguen una distribución normal con una media de 90 kg y un desvío de
20kg. Considerando que las ventas de la sucursal A y B son independientes, calcular
la probabilidad de que las ventas totales de la empresa, en dos semanas, superen
los (175V −525W = 350)kg.

V= 5 W= 1

Cantidad

a X ~ N (50; 7)

b Y ~ N (90; 20)

X e Y: indep

W = X + Y → en una semana

en dos semanas está MAL multiplicar por dos, ya que no pasan las mismas cosas 2
veces. → W= x1 + y1 + x2 + y2

E (w) = E(x1) + E(y1) + E(x2) + E(y2)

= 2. 50 + 2.90 = 280
se extraen de un mazo de cuarenta cartas, dos cartas al azar. Considerando no
reposición, indicar la probabilidad de que una de las cartas sea copa o de basto, y la
otra carta sea un oro o mayor que cinco

evento a : una de las cartas sea de copa o de basto. P (A) = 20/40 = 1/2

evento b: la otra carta sea un oro o mayor que cinco

P(A n B) = P( B/ A) . P (A)

= 10/ 39 (sacar una de oro, ya ocurrió A, ya saque 1)

¿Cómo calculamos la probabilidad de sacar una carta mayor que 5 sabiendo que ocurrió el
evento A? Si influye.

calculamos la probabilidad de que la segunda carta sea mayor que cinco dado el evento A

planteó la fórmula de probabilidad condicional:

= P (> 5 n A) / P (A)
( Volver a ver )
Clase 18/10
Teorema central del límite

H) si tengo un conjunto de variables aleatorias Xi, se comportan con cualquier distribución


pero tal que el valor esperado es mu y el desvío es sigma. Además de eso las variables
aleatorias son independientes entre sí.
tenemos además una variable aleatoria Y y una variable denominada media muestral (x

barra) : Es el promedio de las


variables aleatorias.

T) (el teorema dice) el valor esperado de y es n . m ; además el desvío de Y es sigma por


raíz de n , la esperanza matemática de la media muestral es m y el desvío es sigma sobre
raíz de n. Si n tiende a infinito, entonces la media muestral, se comporta o tiende a
comportarse como una normal con una esperanza que es m y un desvío que es sigma
sobre raiz de n. y además, la variable Y también tiende a comportarse como una normal,
con una esperanza que es n por m y un desvío que es sigma por raiz de n. Lo más
importante es el hecho de que bajo estas condiciones, tienden asintóticamente a una
normal.

(n ≥ 30) infinito nunca va a ser n. ¿Cuándo consideramos que va a ser suficientemente


grande para aplicar este teorema? cuando N es mayor o igual a 30.

D) La E(y) =

La varianza de Y =

El desvío de Y =
E(˜x) = m

El desvío de ˜x =

Muestras
tenemos una población: conjuntos de números, pueden ser lo que sea no necesariamente
personas. esta población tiene un tamaño N. si sumo todos lo s(ejemplo; pesos) y dividido
por la cantidad, me da la media → eso es m. también puedo hacer la cuenta del desvío de
todos ellos.
M y sigma son números que no suelo tener, si yo hago un censo los puedo conocer. No
solemos hacer censos.

una muestra se tiene que tomar al azar. no "lo más fácil". De esta muestra voy a tener una
media pero no de todos, sino de la muestra. esto me va a dar la media muestral, la media
muestral va cambiando según la muestra, pero debe andar en un rango similar.

La media muestral es la estimación de la media poblacional.


Nuestro objetivo es conocer valores poblacionales, para eso tomo una muestra, obtengo
estos numeros y tengo una estimación de estos.

Cualquier función que sea dependiente de una muestra, van a ir cambiando (x barra y
sigma 2 ). Son variables aleatorias. Cualquier función que sea dependiente de las muestras
se denomina estadístico muestral.

un estadístico muestral siempre es una variable aleatoria.


Mu es la media poblacional.
Sigma cuadrado es la varianza de la población (estos son números)
Xbarra es la media muestral
S al cuadrado es la varianza muestral o insesgada (estas son VA)
Cualquier función que dependa de los valores de la muestra se denomina estadístico
muestral y es una VA. La media muestral y la varianza muestral son estadísticos
muestrales.
La media muestral se comporta como una curva de Gauss.

Media muestral

H) "muestras grandes"( m ≥ 30) podemos pensar que la media muestral se comporta como
una curva de gaus, cumple con la condición anterior. Cuando no pase que la media sea
mayor o igual a 30, no podemos usar Gauss y hay que usar en su lugar T student.

"población infinita" (N >> m ) (N ≥ 20.m)


bajo esas 2 condiciones, podemos decir que la media se comporta:
según el teorema central del límite

La muestra es sin reposición, no puedo volver a agarrar la misma más de una vez.
1000 N hay falladas 50 y 950 no, la probabilidad va a ir cambiando pq al principio es
50/1000, dependiendo si saque fallada o no va a ser 49/999 , o 50/999. Por eso es que es
independiente (tcl)
Para que pase esto, necesito que la población sea muy grande y que la población debe ser
20 veces mayo que la muestra como mínimo para que no afecte si saco una.

La distribución sería una campana de gauss


donde tengo la media que es mu (valor esperado) es lo q no conozco y pretendo estimar

El punto rojo: para fabricar un intervalo le sumo y le resto el margen de error

Yo puedo preguntarme en cada caso: el intervalo fabricado ¿contiene a mu? Depende del
caso. ¿Cuándo el intervalo que yo fabrique va a contener? → cuando la media muestral me
haya caído entre los extremos.
La probabilidad de que el intervalo contenga a mu , es igual a la probabilidad de que X
barra:

¿Cómo calculo el margen de error? →


La campana tiene un desvío que es sigma sobre la raíz cuadrada de n

El Z que hace que la derecha haya un 2,5% → con la app → 1,96

Por lo tanto, el margen de error:

El 95% = nivel de confianza. si no me lo dicen asumo ese


Nivel de significación = alfa, es 1 - nivel de confianza = 5%

Notación de Z:

El margen de error es = Z sub alfa/2 . el desvío/ raíz cuadrada de n

Intervalo de confianza para la estimación de la media poblacional (mu) a partir de la media


muestral (x barra): sigma aproximó mediante S. Mu está fijo, lo que se mueve es el intervalo
Ejemplo: Se quiere conocer el peso promedio de un determinado segmento de la población.
Para eso se tomó una muestra de 100 personas al azar, y se obtuvo una media muestral
igual a 70kg, con un desvío insesgado de 40 kg.
a) Hallar un intervalo de confianza del 95% para la estimación de la media poblacional.
b) repetir para el caso de 99% de confianza
c) Obtener una cota superior para la media poblacional
d) Indicar cuál debería ser el tamaño muestral para que el margen de error del caso a)
sea la mitad.

X barra = 70 a) NC = 95% → alfa = 0,05

S = 40
n = 100

B) con 99% de confianza:


La única manera de que yo genuinamente tenga algo mejor es si tengo una muestra más
grande.

C) cuando pido una cota superior, no quiero saber el intervalo desde donde y hasta, quiero
saber como es el máximo. Xbarra + Z alfa (quiero todo un lado o todo el otro)
no me dice NC asumo 0,95
Cota sup =

D) cuál debería ser el tamaño muestral para que el margen de error

El margen de error arriba nos dio:

Para que sea la mitad y sacar el tamaño de la muestra:


El intervalo es menor que el de antes:

E) Indicar cómo cambiaría ( o no) la respuesta de punto a) para los casos en que el tamaño
de la población es:
1) N = 10000000
2) N = 1000000000
3) N= 15000
uso el mismo n = 100

Si no me dice la población es porque asumo que es muy grande. Si nos dicen que es de
cien mil, por ejemplo,el intervalo que fabrico no depende del tamaño de la población sigo
usando el mismo n.
Ahora, si n es 15000, no es 20 veces más. para el caso 3 no podemos seguir pensando que
es población infinita ya que 15000 es menos de 20 veces n. Para este caso, dado que la
relación N/n= 15, entonces no puedo considerar que se trate de población infinita, debe
utilizarse el factor de corrección por población finita.

Lo mismo aplica al caso de la cota, debería multiplicar por el factor de corrección.


El intervalo de confianza quedaría:

Aclaración respecto de la varianza insesgada:


si hago S cuadrado , cuando hago la suma y dividir por la cantidad, si me da sigma
cuadrado, tiene esa división para compensar esa cuestión, por eso es insesgada.

Proporción muestral
población dicotómica → dos posibilidades
Tomo al azar una muestra de tamaño n y cuento la cantidad que hay de si / el tamaño de la
muestra. esto me va a dar la proporción , queremos estimar cuánto creemos que puede ser
P, aca el estadístico muestral es la proporción muestral, para poder armar algún intervalo de
confianza.

ej: agarro 200 y veo que hay 10 falladas, el 5% es el porcentaje de falladas en la muestra,
con eso tengo una idea de que porcentaje hay de falla en la población completa.

la cantidad de "si" en una muestra/ n

La proporción muestral se puede pensar como :


La esperanza matemática de la proporción muestral es la proporción poblacional:
¿Cuál es de esta variable aleatoria la varianza?

esperanza:

desvío:

La proporción se comporta como una normal →


el desvío es raíz de pq/n

el intervalo de confianza va a ser para la proporción:

donde Z a/2 . el desvío → Margen de error

Ejemplo: supongamos que somos una consultora, y una persona de cierto partido político
nos pide que hagamos una medición de su candidato. Nos dice que el margen de error
máximo debe ser del 2%. Y que además el nivel de confianza mínimo sea del 90%.
a) determinar el tamaño muestral necesario para evaluar este objetivo que nos estan
pidiendo
¿Como hago para determinar el tamaño de la muestra?
sabemos que el margen de error es:
pero no conozco P, Q ni n.
Sabemos que:

el peor de los casos es que P sea = 0,5 (para que la cuenta de pq sea
como máximo 0,5, voy a lograr que me de el margen de error máximo.

entonces: →
→ arranco pensando en el peor caso.

b) Se realiza la encuesta y se obtiene una proporción muestral igual a 30%. Indicar el


intervalo de confianza del 90%

Aplicamos la fórmula de intervalo de confianza →

Z → en la app 1,64

Yo no tengo p→ aproximación de P → p(rayita) muestral y 1-p(rayita) muestral

Por más que diga los números, debo decir el nivel de confianza.
Decir que va a sacar "más o menos un 30%" es no decir nada. Una estimación en serio son
3 números
c) dar la respuesta, utilizando un intervalo que tenga una confianza tal, que el margen
de error sea 2%.
lo que estoy planteando es:
el margen de error es de 0,02 y no conozco Z.

→ Z a/2 = 1,79

La pregunta es ¿Cuanto es alfa?

Pongo la Z en la app, me da alfa/2

hago → 0,03673 . 2
→ alfa: 0,07346
→ nivel de confianza: 1 - alfa: 92,65%

Intervalo de confianza:

lo que me pedía → era un nivel de confianza mínimo y un margen de error máximo.

d) determinar una cota inferior para la proporción poblacional. )No me dicen nada
asumo nivel de confianza 95%)

Cota superior:

Cota inferior: 0,30 -Z 0.05 (raíz 0,3 . 0,7 / 1681)


e) Calcular nuevamente el punto d) para el caso en que la población fuera N= 20.000
lo mismo, pero multiplicamos por el factor de corrección:

= 28,25%

Clase 25/10:

Test de hipótesis
4 elementos:

Veamos cada uno de ellos a través de un ejemplo concreto.


Supongamos que nos dedicamos a la fabricación y venta de unos cables para ser usados
como tensores para elevadores. Según la especificación técnica, nuestros cables soportan
5000 kg, pero últimamente hemos tenido quejas por parte de algunos clientes, diciendo que
se cortan con menos tensión que esa. Para determinar qué curso de acción tomar,
decidimos realizar un test de hipótesis. De esta manera formulamos para empezar.
- Hipótesis nula: H0 mu = 5000 kg. Aquello que nosotros creemos que es. Lo que
pensamos que es a priori. La hipótesis nula es de una relación de igualdad. A los
fines prácticos, es más claro plantearlo de entrada como un igual.

- Hipótesis alternativa: H1 o HA: mu < 5000


es lo que yo temo que este pasando, lo que me lleva que está haciendo sospechar.
No es la negación de H0, en este caso. Todo depende de lo que este redactado. En
general, la alternativa es lo que me preocupa que esta pasando dada la alternativa
original.

- Un tercer elemento es la zona de aceptación y rechazo. Tomamos una muestra, un


"ensayo", vamos a tener una media. Ejemplo n= 64 me va a dar una media, un s,
etc. Voy a tener a Mu en 5000 hasta tener una evidencia que me demuestre lo
contrario. Si en el ensayo la media muestral me da 2300, es demasiado bajo, podría
caer en la zona de rechazo, mientras que si me da 4999, puede llegar a estar en la
zona de aceptación

- El cuarto elemento es el estadístico de prueba o estadístico de contraste. es la Z del


ensayo. La media muestral menos la media poblacional / sigma/raiz de n
el valor de mu es que que estamos suponiendo. El valor de sigma no lo tenemos,
pero lo aproximamos mediante S
si me cae en la zona de aceptación → no pasa nada, "mala suerte" las fallas ya que
la probabilidad de que sucedan es baja.

a) Se realiza el ensayo y se obtiene una media muestral igual a 4880, con un


desvío insesgado de 480. Indicar qué conclusión se puede obtener.

m = 64
x barra = 4880
s = 480 (desvio insengado)

Saco z test → → corresponde


rechazar por que cae en la zona de rechazo, por lo tanto los datos arrojan
evidencia suficiente para descartar la creencia de que mu es 5000 y
debemos reconocer que es menor que eso y que entonces los clientes tienen
razón y debemos arreglar el tema.

Pueden pasar 2 cosas: que me haya caído en la zona de rechazo teniendo efectivamente
un mu=5000 o que debería correr toda mi campana hacia la izquierda con un mu menor a
5000.

b) ¿Cuál es la probabilidad de que la decisión tomada en el punto anterior, sea


una equivocación? → Cual es la probabilidad de que yo rechace la hn dado
que la hn es verdadera → Creer que está mal algo que está bien → Error
tipo 1
P( rechazar la H0/ la H0 es verdadera) = P(Error tipo 1) = alfa

que probabilidad hay que que yo rechace si la de arriba es la campana


correcta → 0,05 la probabilidad de cometer un error tipo uno es alfa.

c) Repetir el punto a), para el caso en que la media muestral fuera igual a 4950
(mismo desvío).

→ Z test = -,83 → no rechazó la hipótesis nula y no arreglo nada. asumo que


entonces lo que pasó fue por azar, y sigo creyendo que mu es 5000

d) ¿Cuál es la probabilidad de que la decisión tomada en el punto c) sea una


equivocación?
P( aceptar la H0/ la H0 es falsa) = P(Error tipo 2) = beta

Debería calcular la probabilidad de que caiga en la zona de aceptación pero no se cual es la


campana, no podemos calcular el área de algo que no conozco. no hay un error tipo 2, sino
uno específico para cada uno.

Entonces debería decir: considerar un mu alternativo de 4910


Es decir que mu es 5000, alguien dice que es menos, y se la juega por 4910. Sobre esa
base calculo el error tipo 2

Lo que tendríamos es una campana alternativa:


→ calculamos el x barra crítico
xc - 5000/ 480/raiz 64 = -1,64 → despejando → 4901,6
Tenemos una campana con la misma forma, con su centro en 4910

el área debajo de la campana alternativa en zona de aceptación.


¿Cómo calculo beta?

tengo que tener un eje Z alineado con el 4910. Estandarizó el 4901,6:


4901,6 - 4910/ 480/ raiz 64 = - 0,14

En la APP:
B = 0,55 → 55,57%
Podríamos repetir varias veces esto con distintas mu alternativas:
El error tipo dos no es un valor específico, sino una curva. Esa curva se llama curva de
operación, la curva que relaciona el error tipo dos con los diferentes valores de mu
alternativo.

e) determinar para el caso a) el "valor p" del ensayo.


¿Cuál es ese alfa? lo busco en la aplicación sabiendo z y x

Alfa = 0,0228, hace que coincida el x barra crítico con el x del ensayo. Ese es el valor P.
Valor P = 2,28%
Hasta qué nivel de confianza como mucho puedo seguir rechazando? → con un alfa mínimo
de 2,28%

Veamos a continuación, un ejemplo que tenga ue ver con proprcion poblacional.


Supongamos que alguien afirma que determinado candidato va a obtener un 25% en las
elecciones. Pero otros creen que esto no es así.
Se lleva a cabo un test de hipótesis para ver si se puede mantener, o no, la creencia del
25%. Una muestra de tamaño 900 arrojó un total de 252 personas a favor de dicho
candidato.

a) indicar si los datos obtenidos permiten sostener la hipotesis nula.


- H0 : p = 0,25 → siempre relación de igualdad
- Ha: p ≠ 0,25
- Regiones. Voy a mirar la proporción muestral. El centro hasta que pueda
probar que no es cierto, es 0,25. Tengo los bordes, valores críticos, donde
fuera de ellos es la zona de rechazo.

- Estadístico de prueba → z test

Asumo que alfa es 0,05. (por eso -1, 96)

b) ¿Cuál es la probabilidad de error de tipo 1? es alfa.


5%.

c) si la proporción muestra (p pico)hubiera sido 0.27 ¿Qué decisión hubiéramos


tomado?
nos da = 1,38 → vemos en el gráfico que está en la zona de aceptación. no tengo
evidencia suficiente para rechazar la H0.

d) ¿Cuál es la probabilidad de que se esté cometiendo un error tipo 2?


Para un P alternativo de 0.26.
P(pico) crítico → tengo que averiguar. "al revés" de estandarizar.

Yo propongo una campana ubicada en 0,26


Z1= 1,23
Z2 = -2,6

Voy a la app → busco lo que hay a la iz de 1,23

Voy a la app → -2,6

Para sacar beta → tengo que restar pq a la izq tengo algo y quiero lo del centro. Hago
0,89065 - 0,00466 = 88,6% → beta. La probabilidad buscada es beta.

Clase 1/11

Integrales dobles

Integral en una variable:


para un x dado, recorro toda la franja, para ese x. ¿cómo hago ese recorrido? multiplicando.

esta cuenta representa el peso de esa franja: vamos a ir sumando todas


las franjas entonces volvemos a integrar: hacer la integral doble es como hacer dos simples
consecutivas. La integral hace la cuenta de sumar individualmente cuanto pesa cada
columna, y la que está afuera suma los pesos de las columnas, la suma doble me da el total
de lo que tengo en la región sigma.

Ejemplo:
Otra forma:

Puedo identificar desde el eje y el lateral izquierdo y derecho, hacer la integración en filas
en vez de columnas.

el punto más bajo es 0 y mas alto 6

integral de eso es:

la otra posibilidad:
Estadística en dos variables:
1) Caso continuo
Función de densidad de probabilidad conjunta → una fx, y
la probabilidad de que la variable aleatoria x sea menor o igual que x + dx y mayor que x y
además que la VA y sea menor o igual que y+ dy y mayor que Y → es la función de
densidad conjunta por dx . dy.

Representa la probabilidad de que nos encontremos en un elemento de área,

- Probabilidad de un evento B

- Función de distribución
Representa la integración desde menos infinito de ambas variables hasta un valor
específico de coordenadas (x;y)

- Esperanza matemática de una función Phi de x e y


- Covarianza:
por definición: se calcula como el valor esperado de x - la esperanza de x . y -la
esperanza de y

Podemos calcular la covarianza yendo a la definición de esperanza, la esperanza de algo es


la integral doble de x-mx. por la función de densidad

propiedad:

En conclusión: la última fórmula es la que se usa.

Propiedad:
si x e y son independientes → la probabilidad de que X esté entre un valor x y x+dx / dado
que y se encuentre en (lo mismo) va a ser igual a la probabilidad
conclusión: si las va son independientes la función es igual al producto de una funcion que
solo depende de x por una que solo depende de y

→ la covarianza

Si las variables son independientes la covarianza es cero, pero si la covarianza es cero no


significa que sean independientes. Podrían serlo, o no, es poco habitual que se compensen
las cosas.

- Coeficiente de correlación:
def:

- Coeficiente de determinación:
Ejemplo: una función de densidad

ƒ(x;y) = K x yˆ2 o 0

a) ¿cuánto vale k?
dado que tenemos la propiedad de =1

como una parte vale 0, me quedo con lo otro.

k = 15/32

b) calcular la probabilidad de que y sea menor o igual que x → es un evento.


hay que ver cual es la región del evento, el evento es la región donde eso suceda →

yo tengo que hacer la integral doble sobre toda esa zona. (como me doy cuanta de esa
región)

Sigma es donde no vale cero, tengo que integrar en la


zona donde se chocan.
Hago la integral desde 0 hasta el techo y hacemos otra integral que vale desde ese
número que hay que calcular hasta 4 de la integral de cero hasta el techo de 2-1/2x de la
función de densidad
Hacer las dos integrales: nos da la probabilidad de caer en la zona donde se juntan sigma y
b

Clase 8/11
Continuación del ejercicio anterior:
resolución de las integrales →

c) calcular las esperanzas: de x, y , x.y, x cuadrado e y cuadrado

en este caso solo integramos la región sigma:

queda:

de manera similar calculamos las demas esperanzas:


en Y cambia que me queda Y al cubo
en xˆ2 cambia que me queda x al cubo
en el caso de yˆ2 me queda Y a la cuarta

Para la esperanza de x.y seria Xˆ2 e yˆ3


d) la varianza

e) la covarianza, el coeficiente de correlación y el de determinación


la covarianza: esperanza del producto menos el producto de las esperanzas:

el coeficiente de correlación era la covarianza sobre el producto de los desvios


(desvío = raíz de varianza)

el coeficiente de terminación
es el 50% → cuánta dispersión le transfiere x a y (es el -0,707 al cuadrado)
lo que varía la Y la culpa en un 50% la tiene la x

caso discreto:
ahora tenemos la función de probabilidad conjunta P(x;y) → por definición, esta P(X=x n
Y=y)

probabilidad de un evento B

funciones de probabilidad marginales: puedo calcular cual es la probabilidad de un valor de


x sin importar Y

La función de distribución en el caso discreto:

Esperanza de una función phi(X,Y)

con respecto a la covarianza, el coeficiente de correlación y el coeficiente de determinación,


las fórmulas son las mismas que para el caso continuo

Ejemplo: P(X;y)
a) F(x;Y) ? Esta es la tabla que me esta mostrando la funcion de distribucion
cuando tomo 1,4 → todo lo que tengo a la izquierda, así con todos.

B) Funciones de probabilidades marginales.


Partiendo de la tabla original, si yo sumo para cada x todos los Y tendría en cada caso:

Y si sumo por filas:

Las funciones marginales son:


c) calculamos las esperanzas:
multiplicar en cada celda.
La esperanza de una función de x e y, se calcula como la sumatoria doble de la función por
la probabilidad

con la tabla:
E(x) = 2. 0,10 + 4. 0,25 + 5 . 015 + 2.0,2 + 4.015 + 5.015

E(Y) = 1. 0,10 + 1.0,25 + 1.015 + 3.0,20 + 3.015 + 3.020

E (Xˆ2) =

E(Yˆ2) =

E(X.Y) =

E(X)= 3.7
E(Y)= 2
E(Xˆ2)= 15,1
E(Yˆ2)= 5
E(X.Y)= 7,2
D) Varianzas:

e) covarianza, el coeficiente de correlación y de determinación


covarianza= esperanza de producto menos el producto de las esperanzas

f)
P(x + y ≤ 5) ?
mi región sigma= la zona de la tabla, teng que ver cuales cumplen con la condición p (x +y
≤ 5)

sumo esas celdas:


Clase 15/11 VER

Estadística descriptiva
nos metemos adentro de la muestra, focalizamos en eso.
como armamos gráficos de frecuencias, que podemos hacer con los datos de una muestra.

ejemplo:
Los siguientes datos representan el tiempo en minutos que debió esperar un cliente para
ser atendido.

N = 20
a) calcular la media muestral (para datos sin agrupar)

B) calcular la varianza poblacional o varianza sesgada (para datos sin agrupar)


c) Calcular la varianza muestral o varianza insesgada (para los datos sin agrupar)
→ calcular la varianza poblacional
→ y luego multiplicar por el coeficiente
se llama insesgada → porque el promedio de todas se va a aparecer mucho.

en el excel: la función que se utiliza para calcular es la VAR(d)

Muchas veces se quiere → agrupar datos en intervalos ¿Cuántos intervalos agrupar?


Se prueba → algunos toman como criterio la raíz cuadrada de los datos, pero no es así, ir
probando 5/7/10

Hay que buscar donde empieza → el mínimos de los datos


Máximo de los datos → donde termina
El rango → dif entre el mínimo y máximo, 16.
Si tengo una n=5 intervalos, y quiero saber la amplitud de cada intervalo: =rango/n
= 3,2 en este tipo de cosas, redondear al entero o decimal. siempre hay que redondear
hacia arriba. Podemos considerarla en 4.

Clase 15/11
Estadística descriptiva (continuación)
Ejemplo: (mismo de antes) los siguientes datos representan el tiempo…

Si tengo 4 de amplitud de cada intervalo, cuando debería ser 3,2, tengo 20 unidades en vez
de 16. reparto esos 4 sobrantes, 2 de cada lado. entonces arrancó a partir de 10 y tengo
que dividir en 5 partes el tramo.

Armamos una tabla:

marca de clase: el número que está en la mitad para cada intervalo.


frecuencia absoluta → cuál es la cantidad de datos que caen en ese intervalo
lo acumulado hasta ese intervalo → frecuencia acumulada absoluta
limite inferior → 10
limite superior → 30
cantidad de datos que caen en cada intervalo, exclusivamente 10 hasta inclusive 14. ( ]
frecuencia relativa porcentual → qué porcentaje representa de los datos. Hay 20 datos.
frecuencia relativa porcentual acumulada → lo voy sumando

Para calcular la media con la tabla → como ponele que nos dan la tabla sin los números
que hay repetidos en cada intervalo (es decir fi no me dice cuales son dentro del intervalo)

la diferencia que me da, se llama error de agrupamiento.

Mediana → A qué valor que me deja a la izquierda el 50% de los datos.


1.

También podría gustarte