Está en la página 1de 46

Martha Aliaga Argentina

Ph.D. Estadstica, University of Michigan, 1986.


M.A. Estadstica. CIENES. Universidad de Chile. Chile, 1967.
Porqu estudiar Estadstica?
Qu es la Estadstica?
Definiciones:
Diseo
Recoleccin
Anlisis
Interpretacin
Presentacin

La Estadstica es la ciencia de la recoleccin y


anlisis de datos para la toma de decisiones1.

ESTADSTICA: ciencia de los datos

1
Ferreiro, O. y Fernndez de la Reguera, P. (1988) La
estadstica, una ciencia en la controversia. Revista
Universitaria 25: 13-17. http://dta.utalca.cl/estadistica/
Qu es el mtodo cientfico?
METODO CIENTIFICO

La palabra ciencia viene del latn scientia que


significa conocimiento.

El mtodo cientfico: conjunto de principios y


procedimientos para la bsqueda sistemtica del
conocimiento.

El mtodo cientfico est compuesto por los


siguientes pasos:
El mtodo cientfico en conjunto con la
estadstica nos provee de este conjunto
procedimientos para obtener y resumir informacin
para tomar decisiones.
El lenguaje de toma de decisiones en
Estadstica

Definiciones:

Una poblacin es el grupo de objetos o individuos


bajo estudio, acerca de los cuales queremos obtener
informacin.

Una muestra es una parte de la poblacin de la


cual se obtiene informacin.

Inferencia estadstica es el proceso de sacar


conclusiones acerca de una poblacin basados en
informacin de una muestra de esa poblacin.
Debo tomar Aspirina o Migranol para el
dolor de cabeza?

Laboratorios Bayer me dice que tome Aspirina

Existe teora (antigua) de que lo mejor es Aspirina

Laboratorios Migra me dice que tome Migranol

Existe teora (nueva) de que lo mejor es Migranol

Tenemos dos teoras que compiten.

En estadstica las vamos a llamar hiptesis.

Definiciones:
La hiptesis nula, denotada por H , es el status
0

quo, lo convencional, lo que sabemos de la


poblacin, lo aceptado hasta el momento.

La hiptesis alternativa, denotada por H , es una


1

alternativa a la hiptesis nula implica cambio, es


lo que el investigador espera que sea cierto.

H0: El nuevo medicamento es tan efectivo como el


antiguo.

H1: El nuevo medicamento es ms efectivo que el


antiguo.
Formule las hiptesis nula y alternativa:
H0 :

H1 :
Formule las hiptesis nula y alternativa:
H0 :

H1 :
NAIPES

Si tengo un mazo de 52 cartas y eleginos al azar un


nmero de ellas, qu proporcin de cartas rojas
deberan salir?

Hiptesis:

Datos:

Conclusin?
Podemos cometer un error?
Slo sabremos la verdad si
conocemos la poblacin.
Definicin:

Los datos que obtenemos de una muestra sern


estadsticamente significativos, si las
observaciones son poco probables si H fuera
0

verdadera (bajo H ).
0

Cuando rechazamos H decimos que los datos


0

son estadsticamente significativos.

Sea cual sea nuestra decisin va a estar afecta a


errores.
Qu errores podemos cometer?

El sistema de justicia tiene como principio


bsico que el inculpado debe ser considerado
inocente hasta que se pruebe que es culpable.

Cuales sern las hiptesis nula y alternativa en


el contexto de un juicio?

H0 : el inculpado es

H1 : el inculpado es

El abogado defensor y el fiscal presentan sus


casos.

El juez debe ponderar la evidencia presentada y


decidir si es suficiente para declarar culpable al
inculpado.
DIOS

Decisin Inocente Culpable


del juez:

Culpable

Inocente

En trminos estadsticos estos errores


tienen nombres especiales.
Error Tipo I: es el error que se comete cuando
rechazamos la hiptesis nula ( H ) en 0

circunstancia que es verdadera.

Error tipo II: es el error que se comete


cuando no rechazamos la hiptesis nula ( H ) en 0

circunstancia que es falsa

La hiptesis verdadera
Su decisin
basada en los H0 Verdadera H1 Verdadera
datos:

Rechazar H 0

No
Rechazar H0
La verdadera hiptesis
Su decisin
basada en los H0 Verdadera H1 Verdadera
datos:

Rechazar H 0 Error tipo I Decisin


Correcta

No Decisin Error tipo II


Rechazar H 0 correcta

Recuerde que ...

Podemos cometer un Error Tipo I slo si


rechazamos H . 0

Podemos cometer un Error Tipo II slo si no


rechazamos H . 0
Probando un nuevo medicamento
H0: El nuevo medicamento es tan efectivo como
el antiguo.

H1: El nuevo medicamento es ms efectivo que


el antiguo.

Cules son los dos tipos que errores que se


pueden cometer al decidir entre las dos
hiptesis?

Error Tipo I =

Error Tipo II =

Cules son las consecuencias del error tipo I?


Cules son las consecuencias del error tipo II?

Cul error es ms grave desde un punto de


vista tico?
Generalmente queremos proteger lo que ya
conocemos reduciendo la probabilidad de cometer
el Error Tipo I.

Pensemos:

Si el Error Tipo I es considerado grave, porque no


hacerlo cero?
Una posible manera de no cometer el error tipo
I sera no rechazar nunca la hiptesis nula. Pero
si hacemos esto nunca vamos a aceptar una
teora nueva. Tenemos que correr un pequeo
riesgo.
CONCEPTOS CLAVES

= nivel de significancia

= probabilidad de cometer el error tipo I

= probabilidad de rechazar H0 cuando H0 es


verdadera

= probabilidad de cometer el error tipo II


= probabilidad de aceptar H0 cuando H1 es
verdadera
Qu hay en la bolsa?

Se tienen dos bolsas idnticas:


Bolsa A y Bolsa B.

Cada bolsa contiene 20 vales. El contenido de


cada bolsa es:

Bolsa A Bolsa B

A B
Valor Frecuencia Valor Frecuencia - 1,000 1
10 7 10 1
20 6 20 1
30 2 30 2
40 2 40 2
50 1 50 6
60 1 60 7
1,000 1
Grfico de frecuencias para Bolsa A

(MILES DE PESOS)

X
X X
X X
X X
X X
X X X X
X X X X X X X
- 1000 10 20 30 40 50 60 1000

Grfico de frecuencias para Bolsa B

X
X X
X X
X X
X X
X X X X
X X X X X X X
- 1000 10 20 30 40 50 60 1000

BOLSA A TIENE EN TOTAL - $ 560 000

BOLSA B TIENE EN TOTAL + $ 1 890 000


Seleccionemos un vale, n=1

Basndose en una observacin, tiene que


decidir entre:

H0 : La bolsa que me estn mostrando es la


Bolsa A.
H1 : La bolsa que me estn mostrando en la
Bolsa B.

Cul es el Error tipo I?

Cul es el Error tipo II?


Error tipo I = rechazar H0 cuando H0 es V

= quedarse con la bolsa creyendo que


no es A pero es A

= pagar $560.000

Error tipo II = aceptar H0 cuando H1 es V

= rechazar la bolsa ofrecida


creyendo que la bolsa es A,
pero es B

= pierde de ganar $1.890.000

Cmo tomamos la decisin?


Las elecciones obvias:
-$1000 => es la Bolsa A => acepto H0

$1000 => es la Bolsa B => rechazo H0

si el vale es de $60?

si el vale es de $10?
Regla de decisin:

Una regla de decisin es una regla formal que


establece cuando rechazar H , basados en los
0

datos.
Examinemos las probabilidades de cada vale:
Valor Probabilidad Probabilidad
Si la bolsa es A si la bolsa es B
- 1 000 000 1/20 0
10 000 7/20 1/20
20 000 6/20 1/20
30 000 2/20 2/20
40 000 2/20 2/20
50 000 1/20 6/20
60 000 1/20 7/20
1 000 000 0 1/20

La direccin del extremo corresponde a la


posicin de los valores que son ms probables
bajo H .
1

Si los valores ms grandes son ms probables


bajo H , entonces la direccin del extremo es
1

hacia la derecha.
Veremos que no siempre la direccin es hacia la
derecha.

Para determinar la regla de decisin usamos


primero el valor ms extremo.

En nuestro ejemplo es el vale de $60 mil.

Regla de decisin #1:

Rechazar H si el vale seleccionado es de $ 60


0

mil o ms.

Rechazar H0 si el vale seleccionado es $ 60


mil.

A toda regla de decisin le corresponde una


zona de rechazo.
Definicin:

Una regin de rechazo es un conjunto de


valores para los cuales rechazamos H .
0

Una regin de aceptacin es un conjunto de


valores para los cuales aceptamos H .
0
Una regin de rechazo se llama unilateral o de
una cola si el conjunto de valores extremos
estn todos en una direccin, ya sea a la
derecha (cola superior) o a la izquierda (cola
inferior).

Una regin de rechazo se llama bilateral o de


dos colas si el conjunto de valores extremos
estn en las dos direcciones derecha e
izquierda.
= probabilidad de rechazar H0 cuando H0 es
verdadera

= probabilidad de seleccionar un vale de


$60 o $1.000 de la Bolsa A

= 1/20 = 0,05

= probabilidad de aceptar H0 cuando H1 es


verdadera
= prob. de seleccionar vales de -$1,000,
$10, $20, $30, $40 o $50 de la Bolsa B
= 12/20 = 0,60

es muy grande => aumentar la regin de


rechazo.
Regla de decisin #2:
Rechazar H si el vale seleccionado es $50
0

mil.
= probabilidad de rechazar H0 cuando H0 es
verdadera

= probabilidad de seleccionar vales de $50,


$60 o $1,000 de Bolsa A

= 2/20 = 0,10

= probabilidad de aceptar H0 cuando H1 es


verdadera
= probabilidad de seleccionar vales de -
$1,000, $10, $20, $30, $40 de la Bolsa B
= 6/20 = 0,30

es muy grande todava => aumentar la regin


de rechazo.
Regla de decisin #3:
Rechazar H si el vale seleccionado es $40 mil
0
= probabilidad de rechazar H0 cuando H0 es
verdadera

= probabilidad de seleccionar vales de


$40, $50, $60 o $1,000 de la Bolsa A

= 4/20

= 0,20
= probabilidad de aceptar H0 cuando H1 es
verdadera
= probabilidad de seleccionar vales de -
$1,000, $10, $20, o $30 vales de la Bolsa B
= 4/20
= 0,20
Tabla resumen para y resultantes de
las tres reglas de decisin:

Regla de Decisin Regin de


Rechazo

#1: Rechazar H 0 si el vale $60 o ms 0,05 0,60


seleccionado es de $60 mil o
ms

#2: Rechazar H 0 si el vale $50 o ms 0,10 0,30


seleccionado es de $50 mil o
ms

#3: Rechazar H 0 si el vale $40 o ms 0,20 0,20


seleccionado es de $40 mil o
ms
El valor p -- o cun raros son los datos?

Nos vamos a enfocar en lo que los datos


observados nos dicen

Partimos con el supuesto de que H0


es
verdadera

Preguntamos:

si H es verdadera (la Bolsa es la A), cun


0

probable es obtener el valor observado en la


muestra o uno ms extremo?

=> esta probabilidad se llama valor-p.


El valor-p es la probabilidad de obtener el
valor observado o uno ms extremo, bajo
el supuesto que H es verdadera,.
0
Entendemos que a menor valor-p,
mayor es la evidencia de los datos en
contra de la hiptesis nula H0 .
Bolsa A versus Bolsa B:

Suponga que usted selecciona un vale de


$30 mil y la regla de decisin es la #2:

Bolsa A:
X
X X
X X
X X
X X
X X X X
X X X X X X X
______________________________________________________________________________
-$1,000 $10 $20 $30 $40 $50 $60 $1000
====>
<======
regin de aceptacin regin de rechazo

Si observamos un vale de $30, el valor-p = 6/20=0,30,


mayor que =0,1 y lo que observamos est en la regin de
aceptacin
Suponga que usted selecciona un vale de
$60 mil y la regla de decisin es la #2:

Bolsa A:
X
X X
X X
X X
X X
X X X X
X X X X X X X
______________________________________________________________________________
-$1,000 $10 $20 $30 $40 $50 $60 $1000
====>
<======
regin de aceptacin regin de rechazo

Si observamos un vale de $60, el valor-p = 1/20=0,05,


menor que =0,1 y lo que observamos est en la regin de
rechazo
Relacin entre valor-p y en nivel de
significancia

Si el valor-p es ==> rechazamos


H0

Si el valor-p es > ==> no podemos


rechazar H
0
Pensemos:

El nivel de significancia es = 0.05,


probabilidad de cometer el error Tipo I.

La regla de decisin correspondiente es:


Rechazar H si el vale seleccionado es $60 o
0

ms.

Se selecciona un vale y es $60. Su decisin es


rechazar la hiptesis nula y concluir que los
datos son estadsticamente significativos al 5%.

Al rechazar H0 . Puede haber cometido un


error?

Cul es la probabilidad de haber cometido ese


error?
Una vez que tomamos la decisin,
la decisin es la correcta o la
equivocada,
y la probabilidad de haber cometido
un error es 0 o 1.
MAPA CONCEPTUAL de CAPITULO 1
en http://dta.utalca.cl/estadistica

Software Mapas conceptuales: CmapTools:


http://cmap.ihmc.us/