Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentaci N Repaso Estad Stica PDF
Presentaci N Repaso Estad Stica PDF
REPASO DE ESTADÍSTICA
1
ESTADÍSTICA APLICADA
Necesidad de la Estadística.
2
Estadística Descriptiva. Con el estudio de ciertos estadísticos se conocen
magnitudes que representan a la globalidad de los datos disponibles de forma
resumida.
3
Población: conjunto de los objetos (individuos, observaciones, etc.) que se desea
observar. Puede ser finito o infinito.
Notación: Ω
4
Algunos conceptos básicos:
Observación: una observación es un objeto individual que nos sirve como fuente
de datos para la realización de nuestra investigación. Reciben diferentes
denominaciones: Unidades muestrales, Individuos, Observaciones, Casos,
Objetos, Unidades experimentales:
ω∈ Ω
Variable: Es una característica del individuo que puede tomar distintos valores.
Cuando medimos algo representamos por un modelo numérico aquello que
medimos:
X :Ω→Q
(Q es el conjunto de todos los valores posibles que puede tomar X sobre los
elementos de Ω)
5
Ejemplo 1.2: La altura de una persona: asignamos un número a cada persona. Las
medidas físicas, como altura y peso, se miden con un instrumento
físico. Otras propiedades abstractas tales como razonamiento,
inteligencia se miden indirectamente.
Valor: son los distintos estados en los que se puede encontrar una característica de
un individuo. Estos pueden ser cualitativos (masculino, femenino) o cuantitativos
(163 cm):
X ( ω )∈ Q
6
CLASIFICACIÓN DE VARIABLES
Según la Escala:
7
Variables nominales
Podemos usar símbolos (H/M, SI/NO) para representar las dos categorías.
8
Variables Ordinales
En este caso se usan categorías, pero existe un orden conocido entre ellas. Por
ejemplo una escala de niveles de dureza de minerales, un nivel socioeconómico,
etc. Puede usarse cualquier secuencia de números crecientes para su
representación. Para definir una variable ordinal la operación básica es determinar
si una observación es mayor que otra.
Variables de intervalo
Una variable intervalo es una variable ordinal especial, en la que las diferencias
entre dos valores sucesivos es siempre la misma. Por ejemplo, la variable
temperatura en grados Fahrenheit.
Variables de razón
Son variables de intervalo en las que además hay un punto natural representando
el origen: punto cero. Por ejemplo, la altura.
9
Cualitativas y Cuantitativas:
Las variables cuantitativas son aquellas en la que los valores son números.
Cuantifican características que unos poseen en mayor cantidad que otros:
Q ⊂ IR
10
Continuas y Discretas:
Una variable que no es continua es discreta. Puede tomar sólo ciertos valores
específicos. Por ejemplo: número de hijos, sexo, identificación con partido
político. A veces a las variables de este tipo se les denomina también atributos.
11
ENTRADA DE DATOS
NUMERO SEXO EDAD EJERCICIO ALCOHOL TABACO ALIM_GRA COLEST ANT_FAM PROB COR
001 H 67 3 35 0 600 185 1 0
003 M 76 1 56 10 690 210 2 1
004 H 56 2 112 15 -1 195 1 1
005 M 63 4 67 25 650 200 2 0
006 H 55 1 -1 0 750 230 9 -1
Identif CUALI CUANT ORDINAL CUALIT CUALIT
12
PROBLEMAS TÍPICOS
ORGANIZACIÓN MATRICIAL
13
ESTADÍSTICA DESCRIPTIVA
Considere X : Ω → Q
Preguntas:
¿Cómo están repartidos los valores {x1 , x2 ,...xn }?
¿Dónde se concentran?
¿Cómo se dispersan?
14
Distribución de Frecuencias:
f : Q → IN +
Sea con f ( q ) = Card {i ∈ Ω / xi = q}.
q → f(q)
Q
1 cm
15
Por motivos prácticos Q se particiona en p clases (≡ intervalos):
Q = {I 1 ∪ I 2 ∪ ... ∪ I p }
f': Q' → IN +
Si llamamos Q' = {I , I ,..., I } y definimos
1 2 p con
Ij → f(Ij )
f'( I j ) = Card {i ∈ Ω / x ∈ I }.
i j
Observaciones: f'
• f'( I j ) = ∑ f (q )
q∈I j
16
y El nú
úmero de clases
c en una tabla de frecueencias es algo
a arbittrario.
y Por lo
o general una tablaa de frecueencias deb
bería teneer entre 5 y 20 clasees,
dondee se suelee usar la siiguiente regla:
r
2c>=n
y Una vez
v que see estableccen los lím
mites de caada clase,, se puedee calcular el
prom
medio (M) de las observacion nes en cad
da nivel.
y Una vez
v que see cuenta con
c el númmero de cllases deseeadas, se uutiliza la
siguieente fórm
mula para determina
d ar los interrvalos enttre clases::
17
y La distribución de frecuencia acumulada va sumando los ejemplos hasta
considerar el total en el último nivel (Ej. Datos sobre los pasajeros en vuelos
de una aerolínea)
18
y La distribución de frecuencia relativa expresa la frecuencia dentro de una
clase como un porcentaje del número total de observaciones.
19
0.0%
10.0%
20.0%
30.0%
40.0%
50.0%
Básica o Menos
27.5%
20
Formación Técnica Superior
2.4%
(completa e incompleta)
e incompleta)
Universitaria (completa e
12.8%
incompleta)
Ninguno
3.1%
y Notar que en variables categóricas no se tiene la separación en intervalos:
Características de la Distribución de Frecuencias:
a) Características de Posición Central
n
1
i. Media Aritmética: x =
n
∑ xi
i=1
n 1
ii. Media Geométrica: g = ( ∏ xi ) n
i =1
Obs:
• La media geométrica proporciona una medida precisa de un cambio porcentual promedio de una
serie de datos. Es útil en series económicas, por ejemplo la tasa de crecimiento promedio en los
ingresos (para tomar decisiones como campañas publicitarias)
n
1
• ln( g ) = ∑ ln( xi )
n i =1
iii. Media Armónica: n
h= n
1
∑x
i =1 i
Estas tres medias se definen para variables cuantitativas.
21
iv. Mediana: Es el valor M en Q t.q. 50% de Ω toma valores menores
que M y 50% toma valores mayores.
22
b) Valores Extremos
i. Mínimo: xm = Min{xi / i ∈ Ω}
23
Ejemplos:
E
• Q = [0 ,400 ] (US$)
f M d ∈ [12
20 ,160]
15%
C10 ≈ 60
8
8%
5%
4% 4%
3%
2%
• Los deciles
de sepaaran el conjjunto de daatos en 10 subconjun
ntos igualess, y los perrcentiles
en 100
0 partes.
• El lug
gar del p-éssimo perceentil en un conjunto de
d n datos es:
e
24
c) Características de Dispersión
1 n
i. Varianza: S = ∑ ( xi − x )2
2
n i =1
iii. Rango: x M − xm
Obs: Se puede considerar como una desventaja que considera sólo dos observaciones,
ignorando el resto cualquiera sea.
25
d) Momentos
1 n k
Se define el Momento de orden k: mk = k ∑ xi
n i =1
Ejercicio:
Muestre que
• m0 = g
→ −∞
• mk k → xm
• m1 = x
→∞
• m−1 = h • mk k→ xM
26
1 n
Se define el Momento de orden k centrado en a: mk ( a ) = k ∑ ( xi − a )
k
n i =1
Observación:
• m2 ( x ) = S
• Se anota µ k = mk ( x ) al momento de orden k centrado en la media.
27
e) Características de Forma:
µ2 S
i. Coeficiente de Variación: CV = =
x x
µ3
ii. Coeficiente de Asimetría: γ1 = 3
( µ2 ) 2
µ4
iii. Coeficiente de Achatamiento: γ 2 = 2
−3
( µ2 )
28
γ1 < 0 γ1 > 0
γ2 >0
γ2 = 0 (Dist. Normal)
γ2 < 0
29
Ejercicios:
Muestre que
• Si x1 = x2 = ... = xn entonces CV = 0
• S = m2 ( x) ≤ m2 (c), ∀c ≠ x
30
Observaciión:
O
y En ciiertos caso
os se deseea darle un
n mayor peso
p a algunas obseervaciones, por
ejemp plo, una prueba
p con n mayor ponderaci
p ón. Así, por
p ejemplo la fórmmula de
la meedia pondeerada corrresponde a:
de wi es ell peso o po
Dond onderació da a la observaciónn i.
ón asignad
31
Visualizando Datos: Gráficos
• Son muy útiles para describir los datos y “entenderlos” de manera rápida.
32
y El histograma ubica las clases de una distribución de frecuencia en el eje
horizontal y las frecuencias en el eje vertical. Las frecuencias relativas se
ilustran claramente:
33
y El gráfico de barras en su versión más simple muestra categorías o valores
numéricos (sin agrupar en clases) y cantidades de otra variable. Como
ejemplo el desempeño de una empresa:
34
y El diagrama circular es de particular utilidad para mostrar porcentajes de una
variable, donde cada categoría se representa como una porción del círculo.
35
PROBABILIDADES
36
Fenómenos y experimentos aleatorios
37
Espacio Muestral
• El espacio muestral es el conjunto Ω de todos los posibles resultados del
experimento aleatorio.
38
• El evento seguro es el que siempre ocurre al realizar el experimento, Ω.
39
Definición de Probabilidad
Una probabilidad es una función real P : Ω → [0,1] tal que:
1. 0
2. Ω 0
40
a Algun
a) nas propieedades
P(Ac) = 1−
• Propiiedad 1. P −P(A)
• Propiiedad 2. P(
P )=0
• Propiiedad 3. Si
S A B, entonces P(A) ≤ P(B)
P
• Propiiedad 4. P(A\B)
P = P(A)−P(A
A∩B)
• Propiiedad 5. P(A
P B) = P(A)+P((B)−P(A∩
∩B)
b Indepeendencia
b)
• Dos sucesos
s A son in
A,B ndependieentes ssi:
41
c) Nociones de probabilidad…en la práctica
• Noción frecuentista:
42
d) Probabilidad Condicional
P(A/B) = P(A∩B)
P(B)
Ejemplo:
En IN3401
Intuitivamente. Los alumnos que estudiaron fueron el 80%. Ese 80% está formado por
un 70% que aprobó y un 10% que no aprobó. La probabilidad de aprobar es 70/80=0,88
43
y Gráficamente: Ω
44
y Sin embargo, B no es un espacio muestral (probabilidades no suman 1)
y Como las probabilidades en B suman P(B), basta dividir por este factor
45
e Princiipio de Ba
e) ayes
f Proba
f) abilidadess Totales
9
9
Enton
nces
46
g) Regla de Bayes (Probabilidades a Posteriori)
|
|
∑ |
Ejemplo:
El 2% de las unidades producidas por A son defectuosas, mientras que B tiene una tasa
de defectos del 4%.
Se cuenta con una unidad defectuosa, se desea conocer la probabilidad de que venga de
la máquina A.
47
• Árbo
ol de resulttados:
• Ento
onces, por la
l regla de Bayes:
48
VARIABLES ALEATORIAS
Y DISTRIBUCIONES
49
VARIABLES ALEATORIAS
Y DISTRIBUCIONES
Consideremos X : Ω → IR y anotemos [ X ∈ B ] = {ω ∈ Ω / X (ω ) ∈ B}
donde B ⊂ IR .
Observación:
• [X ≤ x ] = {ω ∈ Ω / X (ω ) ≤ x}
• [X = x ] = {ω ∈ Ω / X (ω ) = x}
Variable Aleatoria: una v.a. X es una función real definida en Ω (es decir
X : Ω → IR ) tal que [ X ≤ x ] es un evento aleatorio ∀x ∈ IR .
50
Función Distribución: Se llama función de distribución de una v.a. X a la función
real FX ( x ) = IP ( X ≤ x ) ∀x ∈ IR .
Observación:
• FX es continua sii IP ( X = x ) = PX ( x ) = 0 , ∀x ∈ IR .
51
Tipos de Variables Aleatorias:
• f X ( x) ≥ 0 , ∀x ∈ IR .
x
• FX ( x) = ∫ f X (t )dt , ∀x ∈ IR
−∞
Se llama a f X función densidad (o densidad) de X.
52
Distribución (o Ley) de una v.a.: Se llama distribución de una v.a. X a la
probabilidad definida por PX ( B ) = IP ( X ∈ B ) , ∀B evento aleatorio en IR
53
Ejemplo 1.6:
1 − x2 2
1) X ~ N (0,1) sii f X ( x ) = e , x ∈ IR
2π
2) X ~ Bernoulli ( p ) sii IP ( X = 1) = p; IP ( X = 0) = 1 − p.
n k n−k
3) X ~ Binomial ( n, p ) sii PX (k ) = p (1 − p ) , k = 0,1,..., n.
k
Ejercicio:
Muestre que si X 1 , X 2 ,..., X n son v.a. i.i.d. (variables aleatorias
independientes e idénticamente distribuidas) Bernoulli(p), entonces
n
X = ∑ Xi ~ Binomial (n, p ) .
i =1
54
Valor Esperado de una v.a.: Se llama valor esperado (o esperanza) de una v.a. X
que toma valores en Q, al número
Ejercicio:
λe −λx si x ≥ 0
X ~ Exp (λ ) sii f X ( x) = . Pruebe que IE ( X ) = 1 .
•
0 si no λ
1
• X ~ Cauchy sii f X ( x ) = , x ∈ IR . Pruebe que IE ( X ) no
π (1 + x )
2
existe.
55
Varianza una v.a.: Se llama varianza de una v.a. X que toma valores en Q, al
número
V ( X ) = IE( X − IE( X ))2 = IE( X 2 ) − IE( X )2
La varianza corresponde a una medida de dispersión de la distribución de X con
respecto a su esperanza, por ello se denomina también desviación cuadrática
media.
Observaciones:
• Se nota V ( X ) = Var ( X ) = σ X2 = σ 2 ( X )
• A la raíz cuadrada de la varianza se llama desviación estándar σ X = V (X )
Ejercicio:
• Pruebe que V ( X ) = 0 sii existe una constante c tal que IP ( X = c ) = 1.
56
TEOREMA CENTRAL DEL LÍMITE,
LEY DE LOS GRANDES NÚMEROS Y
DESIGUALDAD DE TCHEBYCHEFF
V ( T ( X 1 , X 2 ,..., X n ))
IP( T ( X 1 , X 2 ,..., X n ) − IE( T ( X 1 , X 2 ,..., X n )) ≥ ε ) ≤
ε2
1 n
En particular si T ( X 1 , X 2 ,..., X n ) = ∑ X i ≡ X n (la media muestral),
n i =1
V (X )
entonces IP( X n − IE ( X ) ≥ ε ) ≤ 2
.
nε
57
Ley de los Grandes Números:
.s.
X n c→ IE ( X ) .
n →∞
La media muestral converge casi seguramente a la media poblacional.
X n − IE ( X n ) n ( X n − IE ( X )) d
= → N (0,1)
V (X n ) V (X )
n →∞
58
PRUEBAS DE HIPÓTESIS
Por ejemplo si tiramos una moneda 100 veces y obtenemos siempre cara podemos
percibir que la hipótesis de que la moneda no está trucada no es aceptable. Sin
embargo es posible obtener este resultado con una moneda no trucada, por
consiguiente no podremos estar completamente seguros de nuestra decisión.
59
Los procedimientos de Inferencia Estadística nos posibilitan, bajo ciertas
condiciones, establecer la probabilidad de aceptar hipótesis falsas o rechazar
hipótesis verdaderas. Es decir permiten calcular la probabilidad de cometer error
con nuestra decisión.
60
Se puede interpretar el p-valor de dos formas:
Por ese motivo se rechaza la hipótesis nula cuando el p-valor es pequeño. El valor
fijo a partir del cual el p-valor se considera pequeño es el nivel de significación a
(0.10, 0.05, 0.01, 0.001).
61