Está en la página 1de 22

Unaintroduccinala

ESTADSTICAINFERENCIAL

JosChacn


EstaobraestbajounalicenciaReconocimientoNocomercialCompartirbajolamismalicencia2.5de
CreativeCommons.Paraverunacopiadeestalicencia,visite
http://creativecommons.org/licenses/byncsa/2.5/
oenvieunacartaaCreativeCommons,559NathanAbbottWay,Stanford,California94305,USA.

Tema1. Introduccin

Estaasignaturahasidoorientadaaentenderlosprincipiosenlosquesebasa
laestadsticainferencial.Entendersignificaqueesposiblesaber,enprimerlugar,qu
razoneshanllevadoaelegirundeterminadoclculoy,nomenosimportante,larele
vanciarealdelosresultadosdeeseclculo.
La estadstica inferencial no es ms que un argumento. Un buen argumento
hacecrebleunaafirmacin.Ennuestrocaso,cualquierestudionecesitar,almenos
dosargumentosslidos:elestadsticoyelrelativoaldiseodeinvestigacin(loque
sepuedeaprenderenMtodosIyII).Desdeestepuntodevista,nuestratareaespo
der entender (y calibrar) los argumentos estadsticos y tambin poder construirlos
nosotrosmismos.
Laestadstica inferencial es necesariacuandoqueremoshaceralgunaafirmacin
sobremselementosdelosquevamosamedir.Laestadsticainferencialhacequeesesal
todelapartealtodosehagadeunamaneracontrolada.Aunquenuncanosofrecer
seguridadabsoluta,snosofrecerunarespuestaprobabilstica.Estoesimportante:
laestadsticanodecide;sloofreceelementosparaqueelinvestigadoroellectordeci
dan. En muchos casos, distintas personas perciben diferentes conclusiones de los
mismosdatos.
Elprocesosersiempresimilar.Laestadsticadisponedemultituddemodelos
que estn a nuestra disposicin. Para poder usarlos hemos de formular, en primer
lugar,unapreguntaentrminosestadsticos.Luegohemosdecomprobarquenues
trasituacinseajustaaalgnmodelo(sinoseajustanotendrasentidousarlo).Pero
siseajusta,elmodelonosofrecerunarespuestaestadsticaanuestrapreguntaesta
dstica.Estareanuestradevolveralapsicologaesarespuesta,llenndoladeconte
nidopsicolgico.

1. Definicioneseideasprevias
Enelmbitocientfico,laestadstica,engeneral,ylaestadsticainferencial,en
particular, es el camino que hay que recorrer para llegar de una pregunta a la res
puesta adecuada. As, la estadstica no es ms que un argumento para defender
nuestrasideas.
Cundo es necesaria la estadstica inferencial? Cuando queremos hacer alguna
afirmacinsobremselementosdelosquevamosamedir.
Laestadsticadescriptiva,comoindicasunombre,tieneporfinalidaddescri
bir.As,siqueremosestudiardiferentesaspectosde,porejemplo,ungrupodeper
sonas,laestadsticadescriptivanospuedeayudar.Loprimerosertomarmedidas,
entodoslosmiembrosdelgrupo,deesosaspectosovariablespara,posteriormente,
indagarenloquenosinterese.Porejemplo,parasaberculeslaedaddelgrupo,
podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice,
aproximadamente, alrededor de qu edad se sitan todos. Ya sabemos, pongamos,
quelaedadmediaes40aos.Peroademspodemosutilizarladesviacintpica,si
1.Introduccin,2
queremossabersielgrupotieneedadesmuydispares(porejemplo,unadesviacin
tpicade12aos)osi,porelcontrario,tienenedadesparecidas(unadesviacintpi
ca de 2 aos). Slo con esos indicadores ya podemos hacernos una idea, podemos
describiraeseconjuntodepersonas,almenosenreferenciaasuedad.
Peroeltamaodelosgruposquesueleninteresaresdemasiadogrande,ave
cestangrandecomotodoelmundo.Yesto,msqueserunarareza,esenmuchos
camposlanorma.Porejemplo,cuandoseafirmaquelaspersonastenemosunaagu
dezavisualmenorqueladeloshalcones,podemosestarsegurosdequeno hemos
medidolaagudezavisualdetodosloshumanosniladetodosloshalcones.
Puesbien,laestadsticainferencialeslaquevaapermitirdaresesaltodelos
resultadosobtenidosparaungrupoalatotalidad.
Planteemos una cuestin concreta: Un profesor de estadstica afirma que se
aprendemejorestadsticainferencialutilizandolosordenadoresparamostrarloque
se estudia. Cmo podemos decidir si esta afirmacin es cierta? Una posible forma
sera seleccionando dos grupos de alumnos (equivalentes) que estudien estadstica
inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idnticos
ejercicios,etc.,exceptoqueunodeellosutilizanlosordenadoresensuaprendizajey
otrono.
Veamos las definiciones en relacin a este ejemplo, suponiendo que realiza
moselestudioconlosalumnosdelosgruposF(conordenador)yG(sinordenador):

GrupoF(conordenador) GrupoG(sinordenador)
Poblacin:unconjuntodeelementos(generalmentepersonas,enpsicologa)que
compartenalmenosunacaractersticabiendefinida.
Estudiantesdeprimerodepsicologaque Estudiantesdeprimerodepsicologaquecur
cursanestadsticainferencialconordenador sanestadsticainferencialsinordenador
Muestra:esunsubconjuntodeelementosextradosdeunapoblacin.
Losestudiantesdeprimerodepsicologadela Losestudiantesdeprimerodepsicologadela
UCM,grupoF UCM,grupoG
Variable:Caractersticadeloselementosdeunapoblacinquepuedetomardiversos
valores(almenos,dos).
NiveldeconocimientosenestadsticaII,me NiveldeconocimientosenestadsticaII,me
didosatravsdeunexamen. didosatravsdeunexamen.
Datos:Valoresobtenidosalmedirunavariableenunamuestra.
Conjuntodenotasobtenidasenelexamende Conjuntodenotasobtenidasenelexamende
estadsticaparalosalumnosdelgrupoF estadsticaparalosalumnosdelgrupoG
Estadstico:Esunvalornumricoqueexpresaunacaractersticadeunamuestra.
Formalmente,unestadsticoesunafuncindefinidasobreunavariable.
Media( X )delasnotasobtenidasenelexa Media( X )delasnotasobtenidasenelexa
mendeestadsticaparaalumnosdelgrupoF mendeestadsticaparaalumnosdelgrupoG


1.Introduccin,3

Parmetro:Esunvalornumricoqueexpresaunacaractersticadeunapoblacin.
Media()delasnotasobtenidasenelexa Media()delasnotasobtenidasenelexamen
mendeestadsticaparatodoslosestudiantes deestadsticaparatodoslosestudiantesde
deprimerodepsicologaquecursanestads primerodepsicologaquecursanestadstica
ticainferencialconordenador. inferencialsinordenador.

2. Elazarylaprobabilidad
La estadstica inferencial resulta de aplicar la probabilidad a los estadsticos
que ya conocemos por la estadstica descriptiva. Los resultados de esa aplicacin
vendrnexpresados,pues,enlenguajeprobabilstico.
Yestonoayudaprecisamenteasentirsecmodoconlaestadsticainferencial.
Adems de ser matemtica, tiene la fea costumbre de no decir s o no. En lugar de
ello,susrespuestassuenanavecesaexcusas,esos,muydiplomticas,comonohay
suficiente evidencia o esa afirmacin es altamente improbable. Pero en lenguaje
matemtico.Elresultadoesquizsextrao,difusoperopreciso; nosedecantapero
nosdacuatrodecimales:apartirdelosdatosquemeofrece,laprobabilidaddeque
ocurraesoqueustedafirmaes0.23811.
Peroaunasnospermiteincrementarnuestroconocimiento.Lasafirmaciones
anteriores pretenden ilustrar algo fundamental: las afirmaciones que nos permite
hacer la estadstica inferencial tienen un riesgo, y quien la usa debe saberlo. No es
difcil, de todas maneras, porque todas estas afirmaciones estn formuladas en tr
minosderiesgo,deseguridadeinseguridad:deprobabilidad.
Elazares,pordefinicin,loimpredecible.Cmoesposibleentoncesutilizar
loimpredecibleparaobtenerinformacin?Laclaveestenqueinclusoloimpredeci
ble,parapoderserlo,hadecumpliralgunasnormas.Elconjuntodeesasnormas,y
lastcnicasparaextraerinformacindelazar,esloquellamamosprobabilidad.
Nohaynadamgicoenelazar;resultadeunasucesindecircunstanciasno
controlablesquellevaanopoderpredecirelresultado.Fijmonosenlamonedade
todalavida.Loquehacequelanzarlaseaunexperimentoaleatorioesqueesimposible
controlarlafuerzaconlaqueselanza,losgirosquedaylosngulosconquegolpea
elsuelounayotravezhastadetenerse2.Bastasituarlamonedadecantoenunamesa
yempujarladeliberadamenteenunadireccinparaquedesaparezcaelazar.Perosi
estando de canto la hacemos girar rpidamente volvemos a disponer de un experi
mentoaleatorio.
Pero,podemosrealmenteutilizarestainformacinparadecidirsobrealgore
al?Supongamosquelanzamoslamonedaalaire.Culessonesasnormasquepo


1 Las respuestas que obtendremos sern ligeramente diferentes, pero esa frase sirve para ilustrar el
estilo.
Estonoescompletamentecierto:hayprestidigitadoresqueseentrenanhastacontrolarellanzamien
2

todelasmonedas.Controlanlafuerza,losgirosyelmomentojustodedetenerelmovimientopara
conseguirciertoresultado.Eltrucoconsiste,portanto,enquenohayazar.


1.Introduccin,4
demosutilizar?Enestecaso,quelamonedatienedoscaras,yquenohaypreferencia
porunauotraalahoradeposarse.Esdecir:lasdosnicasposibilidadessereparten
porigualelderechoaserelresultadofinal.Siaplicamoslosconceptosbsicosde
laprobabilidad,yrecordandoquelaprobabilidadtotales1,tenemosquelasproba
bilidadesdequesalgacaraocruzson:
P(cara) = 0.5

P(cruz ) = 0.5
Lo quesueleser difcildedigerir para nuestro entendimientosoncuestiones
como,porejemplo,queaunqueundeterminadosucesotengaunaprobabilidadnfi
ma,como0.01(un1porciento),tambinpuedeocurrir.
Aunque todo el que lea esto est realmente convencido de que es verdad, la
experienciademuestraquenoaplicamosesteconocimiento.

3. Elmuestreo
Para extraer conclusiones de una poblacin a partir de una muestra, es vital
quelamuestrasearepresentativa.
Hay dos tipos de muestreo: probabilstico (se conoce, o puede calcularse, la
probabilidaddecadaelemento,portanto,decadamuestraposible)ynoprobabilsti
co(sedesconoceonointeresalaprobabilidaddecadaelemento;elinvestigadorse
leccionaaquellamuestraqueconsideramsrepresentativaoqueleresultamsfcil).
Cuidado:noesqueelmuestreonoprobabilsticonopermitagenerarmuestras
representativas;loqueocurreesquenotenemosningunainformacinsobreelgrado
derepresentatividaddelamuestraelegida.
El muestreo probabilstico puede darse de diferentes formas, segn estemos
considerandopoblacionesfinitas (losvotantes delaComunidaddeMadrid,lospa
cientesconinsomnio)oinfinitas(losposiblestiemposdereaccinanteunatareade
bsquedavisual),ysegnconsideremos(enlasfinitas)unmuestreoconosinreposi
cin.
Elmuestreoaleatoriosimplesedacuandosecumplelaigualdaddedistribuciones
(cualquier valor tiene la misma probabilidad de salir en cada extraccin) e indepen
dencia(laprobabilidaddeobtenerundeterminadovalornosemodificaporlosvalo
resyaobtenidos).
Otrostiposdemuestreoprobabilsticosonelm.a.sistemtico,elm.a.estrati
ficadoyelm.a.porconglomerados.

Tema2. Estimacindeparmetros

Cuando queremos estimar el valor de un parmetro, disponemos de dos


aproximaciones:Laestimacinpuntualylaestimacinporintervalos.

1. Estimacinpuntual
Laestimacinpuntualasignadirectamentealparmetroelvalorobtenidopa
raelestadstico.
[La estimacin por intervalos, en cambio, proporciona un intervalo, un rango de
valoresentrelosqueestarsituadoelparmetroconunaciertaprobabilidad.Parapoderco
noceresaprobabilidaddebemosconocerpreviamenteladistribucindeprobabilidaddelesta
dsticoqueestemosusandocomoestimador:ladistribucinmuestraldelestadstico.En
lospuntos2y3veremosestasdoscuestionesconmsdetalle.]
Laestimacinpuntualconstituyelainferenciamssimplequepodemosreali
zar:asignaralparmetroelvalordelestadsticoquemejorsirvaparaestimarlo.Pero
para que un estadstico sea considerado un buen estimador ha de cumplir ciertas
condiciones. Si usamos los smbolos para un parmetro cualquiera, y , para un
posibleestimadorde ,podemosenunciarlaspropiedadesdelasiguienteforma:
Carenciadesesgo:Unestimador, ,serinsesgadosisuvaloresperadocoinci
deconeldelparmetroaestimar, .
E () =
Consistencia:Unestimador, ,serconsistentesi,conformeaumentaeltamao
muestral,n,suvalorsevaaproximandoa .Expresadomsformalmente,in
dicaquedadaunacantidadarbitrariamentepequea, ,cuandontiendeain
finito,
P (| |< ) 1
Eficiencia:Dadosdosposiblesestimadores 1 y 2 ,diremosque 1 esunesti
madormseficienteque sisecumpleque
2

2 < 2
1 2

Suficiencia:Unestimador, ,sersuficientesiutilizatodalainformacinmues
traldisponible.
Latablaacontinuacinmuestralosestimadoresdealgunosparmetros:

Estimadores
Parmetros
Insesgados Consistentes Eficientes
X X X
Sn21 Sn2 Sn21 , Sn2 2
P P P
2.Estimacindeparmetros,6
Yelsiguientegrficopuedeilustrarelsignificadodeesaspropiedades:

2. Distribucinmuestraldelamedia
Ladistribucinmuestral(delamediaodecualquierotroestadstico)esfun
damental: si la conocemos podemos saber con qu probabilidad puede adoptar de
terminados valores. Eso nos permitir responder a ciertas cuestiones, por ejemplo,
obtenerelintervalodeconfianzaparalamedia,haceruncontrastedehiptesisocal
cularlapotenciadeuncontrastedehiptesis.
Conocer la distribucin muestral de un estadstico (de aqu en adelante, la
media)implicaconocersuformaysusparmetros.Porejemplo,sabersisuformaes
ladeladistribucinnormal,ysaberquelosparmetrosson:media,30ydesviacin
tpica,6.5.Afindecuentas,loquenosinteresaesqueladistribucinmuestralcoin
cidaconalgunaconocida,delaquedispongamosdetablas.
La forma en que la estadstica nos permitir conocer la DMM es a travs de
condiciones o supuestos: Si nuestros datos cumplen lo que pide un procedimiento
estadstico, entonces ese procedimiento estadstico nos da alguna informacin til.
Porejemplo,


Si entonces
tenemosunmuestreoaleatorio,
losparmetrosdelaDMMson
ylasobservacionessonindepen X = X
1
dientes,
X =X n
yeltamaodelamuestraesn,
tenemosunmuestreoaleatorio, laDMMesnormal,conindepen
ylasobservacionessonindepen denciadeltamaodelamuestra,n
2 dientes, yconparmetros
yladistribucindelavariableX X = X

esnormal, X =X n


2.Estimacindeparmetros,7

laDMMseaproximaralanormal,
tenemosunmuestreoaleatorio, conformeaumentaeltamaodela
ylasobservacionessonindepen muestra,n
3 dientes, yconparmetros
ynoconocemosladistribucinde X = X
lavariableX,
X =X n
laDMMseaproximaraladistri
estamosencualquieradelosca bucintconn1gradosdelibertad,
sosanteriores,
4
ydesconocemos, yconparmetros
X = X

X Sn1 n

De(1)obtenemoslosparmetrosdelaDMM:lamediayladesviacintpica,
quesueledenominarseerrortpicodelamedia.
De(2)podemosdeducirque,sinuestravariabledeintersesnormalenlapo
blacin,tambinlosernuestraDMM.
De(3)extraemosque,aunqueladistribucindelavariable Xenlapoblacin
noseanormalo,lomsfrecuente,sinosabemossiesononormal,laDMMsser
normalsieltamaodelamuestra, n,eslosuficientementegrande(aproximadamen
temayorque30).

Graciasa(4)solucionamosunproblemabastantecomn:elnoconocerlades
viacintpicapoblacionaldelavariable X.Enestecasousamoscomoestimador Sn1,
peroentonceslaDMMsiguelaformadeladistribucin t.Lasdistribucionesnormal
y tsediferencianvisiblementeslocuandolosgradosdelibertadsonpequeos,co
mo se observa en las grficas siguientes. Cuando aumenta n, y Sn1 se van pare
ciendomsyms,ylasdistribucionesnormalyttambin.Esporestoque,aunnivel
prctico,apartirdeunnmayorque30suelenusarseindistintamente.Enlasdosgr
ficas que siguen se pueden ver las distribuciones normal (azul) y t (rojo) para dos
tamaosdemuestradistinto: niguala5(arriba)y niguala30(debajo).Paraambas
secalculaloslmitesqueabarcanun95%delreatotaldecadacurva.Lasdiscrepan
ciassonevidentesconniguala5,peroinapreciablesparan=30.


2.Estimacindeparmetros,8

conn=5.

conn=30.

A efectos prcticos, todo lo visto supone lo que detallamos a continuacin.
Considresesiemprequeelmuestreoesaleatorio(losdatosprocedendeelementos
representativos)eindependiente(esdecir,queelhaberelegidounelementonoafec
taalaprobabilidaddeelegirotros).Enestascondiciones,puedeocurrirlosiguiente:
Comoesdifcilconocer ,consideraremossiempredepartidaquelaDMMse
distribuir segn tn1, ya sea cuando sepamos que la variable X se distribuye
normalmenteocuando nseaigualomayorque30oambascosas.Comolasta
blasdeladistribucintaparecentipificadas(conmedia=0ydesviacintpica=
1),parahacercualquierusodeelladeberemostipificarelvalordeinters,X:
X
temp = t n 1
Sn1 n

Si,enelcasoanterior,conocemosademsladesviacintpicapoblacional,en
tonceslaDMMsedistribuirsegnla distribucinnormal:Porlamismarazn
deantes,parausarlastablaspreviamentedebemostipificar:
X
zemp = N (0,1)
n
PerosinoconocemoslaformadeladistribucindelavariableX,nielneslo
suficientemente grande como para hacer uso del punto (3), entonces no pode


2.Estimacindeparmetros,9
mos utilizar esta informacin. [Pero no todo est perdido: En ese caso habra
queestudiarlaformadeladistribucindelavariableX,transformarlaspun
tuaciones hasta que adopten una forma normal o, en ltima instancia, usar
pruebasnoparamtricas,quenoimponensupuestossobrelaformadeladis
tribucin.Todoestosonconceptosquesevernmsadelante.]
Comoreglageneralutilizaremossiempreladistribucint(raravezconocere
mos ),aunquepodremosusarlatabladeladistribucinnormal(siemprequensea
suficientementegrande)paralocalizarvaloresquenoaparezcanenlatabladeladis
tribucint.
Quobtenemosdetodoesto?
Lo que afirmbamos anteriormente: que conociendo cmo se comportan las
medias(sudistribucinmuestralodistribucindeprobabilidad),podemosusarestas
probabilidadessiemprequeseanecesario.Unadeellas,queveremosahora,eslaob
tencindeintervalosdeconfianza.Otraaplicacin,msadelante,serutilizadaenel
contrastedehiptesis.

3. Estimacinporintervalos
Supongamosqueconocisemoslapoblacin.PodramosobtenerlaDMMpara
undeterminadotamaodelamuestra,n.UnavezcaracterizadalaDMM,seramos
capacesdedecir,conunadeterminadaseguridad,dndeestarnlasmediasquepo
dremosobtenersimuestreamos.
Invirtiendoelrazonamiento(yyendoalarealidad),dadaunamuestra,pode
moscalcularlaDMMdonde,conunaciertaseguridad,estarlamediapoblacional
quebuscamos.Esterazonamientosemuestraenlafigurasiguiente.


2.Estimacindeparmetros,10
Observandovemosqueapartirdelamuestra(recurdesequelapoblaciny
susparmetrossondesconocidos)elIC,al95%,paralamediapoblacionales[54.03,
65.90].Esoquieredecirquelaprobabilidaddehaberatrapadolamediapoblacio
nales0.95,laprobabilidaddehaberacertado.Odichodeotromodo:laprobabilidad
dehabernosequivocado,denohaberatrapadolamediapoblacionales0.05,el5%.
Enelcasodelafiguraanterior,lamediapoblacional(64.31)caedentrodelin
tervalo, pero esto no siempre es as: si repetimos el proceso, un 5% de las veces la
mediapoblacionalquedarfueradelintervalopropuesto,comoseobservaenlafi
gurasiguiente:



La obtencin de un determinado intervalo es fcil, dado que conocemos la
DMM.Bastacon:
1. Localizarenladistribucindeprobabilidad(normalot)losvaloresquecontie
nenelniveldeconfianza.
2. Traduciresosdosvaloresalaescaladenuestravariable,X.

Enlaprctica,deberemosdefinirunniveldeconfianza(NC),quedeterminar
unnivelderiesgo, =1NC.Apartirdeah,yasumiendoquesesigueladistribu
cint:
1. Obtenerloslmitesinferiorysuperior,esdecir,losvaloresparatn1quedejana
laizquierdayaladerecha/2(lamitaddelnivelderiesgo).Estosvaloressern
tn1, 2 y tn1,1 2 .
2. Traduciresosdosvaloresalaescaladenuestravariable, X.As,yteniendoen
cuentaque tn1,1 2 = tn1, 2 loslmitesseran:


2.Estimacindeparmetros,11

l = X t Sn1
i n 1, 2
n

ls = X + tn1, 2 Sn1
n
Al trmino que es sumado y restado de la media suele denominrsele error
mximo, y se denota por Emax. En estos trminos, los lmites de un intervalo de con
fianzasuelenexpresarsegenricamentecomo
li = X Emax

ls = X + Emax
En resumen, una vez obtenido el intervalo de confianza se puede afirmar lo
siguiente:
P(li < < ls ) = 1

Quesignificaquelaprobabilidaddequelamediapoblacionalestsituadade
ntrodelintervaloobtenidoesigualalniveldeconfianzaespecificado(1).

Tema3. Contrastedehiptesis

1. Contrastedehiptesis
Un contraste de hiptesis es un proceso de decisin en el que una hiptesis
formuladaentrminosestadsticosespuestaenrelacinconlosdatosempricospara
determinarsiesonocompatibleconellos.
Losdatosempricossiempreprovendrndeun muestra,unsubconjuntolimi
tadodelapoblacindereferencia.Lashiptesis,porelcontrario,siemprepregunta
rnacercadela poblacin. Pinsesequeesabsurdopreguntarsiunamediaobtenida
en una muestra, por ejemplo, 58, es mayor que 5. Por supuesto que lo es, y nadie
(exceptuando los que estudian estadstica) puede hacerse semejante pregunta seria
mente.
Loquesesrelevantepreguntaressila mediapoblacional,quenoconocemos,
esmayorque5.Entantonolaconocemos,usaremoslamedia muestralcomounes
timador(unaaproximacin)deesamediapoblacional.
1.1 Lashiptesisestadsticas(lapregunta,formalizada)
Unahiptesisestadsticaesunaafirmacinsobreunaomsdistribucionesde
probabilidad;msconcretamente,sobrelaformadeunadistribucindeprobabilidad
o sobre el valor de un parmetro de esa distribucin de probabilidad. En cuanto a
nuestroejemplo,noscentraremosenunadistribucindeprobabilidadconel parme
tro mediapoblacionaliguala5.Elcontrastedehiptesisnosdirsiesmsomenos
probable, bajo esa distribucin de probabilidad, obtener en una muestra aleatoria
unamediaiguala58.
Todo contraste necesita dos hiptesis: H0 y H1, que sern exhaustivas y mu
tuamenteexclusivas.
H0eslahiptesisnula,yeslaquesesometeacontraste.
H1eslahiptesisalternativaaH0,yeslanegacindeH0.MientrasqueH0es
exacta,H1sueleserinexacta.
Undetalleimportante:elsigno=siemprevaenlaH0,seaexactaoinexacta.
Essobreestesigno=sobreelqueseconstruirelmodeloprobabilstico,comoya
hemosvisto.
1.2 Lossupuestos(nuestrasituacinseparecealadelmodelo?)
Son un conjunto de afirmaciones que necesitamos establecer (sobre la pobla
cindepartidaylamuestrautilizada)paraconseguirdeterminarladistribucinde
probabilidadenlaquesebasarnuestradecisinsobreH0.Sinuestrasituacinnose
ajustaaestascondiciones, necesarias,entoncesnodebemosusarelmodelo.Larazn
es obvia: el modelo no nos sirve, luego cualquier cosa que deduzcamos de l ser
inexactay/oerrnea.
3.Contrastedehiptesis,13
1.3 Elestadsticodecontrasteysudistribucindeprobabilidad
Unestadsticodecontrastenoesmsqueunclculoofuncinquecumplelo
siguiente:(1)expresadeformaadecuadanuestrapreguntapsicolgica,(2)tieneuna
distribucinmuestral(deprobabilidad)conocida,y(3)vienetraducido(oexpresado)
enlaescaladeesadistribucindeprobabilidad.
1.4 Ladecisin(H0soH0no?)
La decisin requiere, en primer lugar, trazar un punto de corte (o dos, en el
contrastebilateral),quedefinirdoszonas,unade rechazo (o crtica)yotrade acepta
cin.Esepuntodecortevendrdadaporelniveldeconfianzayelnivelderiesgo,.
LadecisinconsisteenrechazarlaH0sielestadsticodecontrastecaeenlare
ginderechazo,ymantenerlasicaeenlaregindeaceptacin.
MantenerlaH0significaquelahiptesisescompatibleconlosdatos.
Rechazarla implica que ambos son incompatibles, luego consideramos la H0
falsa.

Casogeneral Ejemploespecfico
1.Hiptesis
H0 : = 0 Hay un nivel de aciertos mayor que el
Contr.Bilateral:
H1 : 0 esperado por azar, en 20 ensayos? NC =
0.95;n=48.
H0 : 0
Contr.Unil.Der.: H 0 : 10
H1 : > 0
H1 : > 10
H0 : 0
Contr.Unil.Izq.:
H1 : < 0
2.Supuestos
Poblacindepartidanormal Tenemosun nsuficientementegrandepa
Muestraaleatoriadetamaon. ragarantizarunaDMMnormal.
3.Estadsticodecontraste
X 10.44 10 0.44
temp = t n 1 temp = = = 1.2558
Sn1 n 2.41 48 0.3484

4.Ladecisin
Primero,lazonaderechazosegn =1NC=10.95=0.05;
tteor_inf = tn1, 2 Contrasteunilateralderecho,luego
Contr.Bilateral:
tteor_sup = tn1,1 2 tteor = tn1,1 = t47 ,0.95 = 1.676

Elestadsticodecontrastecaeenlare
gindeaceptacin:
temp < tteor

Contr.Unil.Der.: tteor = tn1,1


3.Contrastedehiptesis,14


Contr.Unil.Izq.: tteor = tn1, Luego mantenemos la H0: los resulta
dos son compatibles con una media
igual a 10, es decir, son compatibles
conlosaciertosesperadosporazar.

Laregladedecisin
Se rechaza H0 si temp cae en la zona
derechazodeterminadaportteor.

Enlasgrficassiguientesseobservalarepresentacindelaspuntuacionesob
tenidasy,superpuesta,laDMMconlareginderechazodefinidaporun=0.05.En
lagrficainferiorapareceampliadalaDMM.Obsrvesequelosvaloresestnenla
escaladelavariableX,ynotipificada.


3.Contrastedehiptesis,15
2. Estimacinporintervalosycontrastedehiptesis
Esfcildarsecuentadelarelacinqueexisteentreuncontrastedehiptesisy
elintervalodeconfianza.
Porejemplo,calculamosunintervalodeconfianza,al95%,paralamediaespe
rada. Como resultado, si la media obtenida est dentro de ese intervalo, considera
remosquenosealejalosuficientecomoparaconsiderarladistinta.
Esoesjustamenteloquehacemosenuncontrastedehiptesisbilateral:esta
blecemos dos puntos de corte y comprobamos si la media obtenida est dentro del
intervalodefinidoono.Sobreestehechorealizamosladecisin.
Esdiferentesiconsideramosuncontrasteunilateral.Enesecaso,todoelnivel
de riesgo se sita en un lado. En tanto todos los intervalos estn construidos de
formabilateral,laequivalencianoesperfecta.Habraquemultiplicarelalfapordos
paraquefueraequivalente.

3. ErrorestipoIyII.Potenciadeuncontraste.
Hemosaprendidoarealizaruncontratedehiptesis,yahorasabemostomar
unadecisinacercadesirechazamosonolaH0.Adems,conocemoslasprobabili
dadesasociadasacualquieradelasdecisionestomadas.Podemosrepresentargrfi
camenteestasituacin(verfiguraanterior).Perotodasestasdecisionessebasanen
queH0seacierta.Quocurre,entonces,siH0esfalsa?Estopuederesumirseenla
siguientetabla:

SituacindeH0
H0Verdadera H0Falsa
Decisincorrecta
ErrortipoII
MantenerH0 P=1
P=
Niveldeconfianza
Decisin
Decisincorrecta
ErrortipoI
RechazarH0 P=1
P=
Potencia

Cmopodemosrepresentargrficamenteestanuevaperspectiva?Loprimero
serconsiderarque,siH0seconsiderafalsa,adoptaremoscomovalordeH1elobte
nido en nuestra muestra. A partir de ah, podemos plantear una nueva DMM, cen
tradaprecisamenteenH1(donde=10.44):


3.Contrastedehiptesis,16



Ahora podemos ver que ese punto de corte determina otras dos reas en la
DMMparaH1.SianalizamoslaDMMparaH1esfcilsaberloqueindicanesasdos
reas:ladelaizquierda(enverde),laprobabilidaddeque,siendoH0falsa(esdecir,
adoptandoH1comoverdadera),consideremosqueH0escierta(oH1esfalsa),esde
cir,elerrortipoII.
Elreadeladerecha(sinrelleno),porelcontrario,nosindicalaprobabilidad
derechazarH0(y,portanto,considerarciertaH1),1.
Tenemos,portanto,dosreas(probabilidades)deerror: y ,ydosreasde
acierto,1y1.Puesbien,si y sonloserrorestipoIytipoII,respectivamen
te,suscomplementariossonelniveldeconfianza(1 )ylapotencia(1 ).
Hastahacepoco,sloseprestabaatencinalnivelderiesgooerrortipoI, .
Peroahoraescadavezmshabitual(ysiemprerecomendable)verincluidalapoten
ciaenlosestudiospublicados.
Paraqusirve,despusdetodo?Puesparavariascosas:
1. Primero, su valor siempre es informativo. Dmonos cuenta de que tambin es
importanteque,siH1escierta,laprobabilidaddeelegirla(lapotencia)seaalta.
2. Permite,dadounalfa,aumentarlapotenciaatravsdeuntruco.Cul?Au
mentandoeln.
Eshabitualobtenerlapotenciaapartirdeltamaodelefecto(verpuntosiguien
te)utilizandolastablasapropiadas.

4. Nivelcrticoytamaodelefecto
Haydosinformacionesmsquepodemosextraeryquepuedenserextrema
damentetiles.
Por un lado, el nivel crtico, p: es la probabilidad asociada al estadstico de
contrasteo,dichodeotromodo,elniveldesignificacinmspequeoalqueunaH0
puedeserrechazadaconnuestroestadsticodecontraste, temp.As,yenelcasodeun
contraste unilateral derecho, p puede definirse como la probabilidad de encontrar
valoresmayoresquenuestroestadsticodecontraste:
p = P(t > temp )


3.Contrastedehiptesis,17
Conelnivelcrticosepretendesalirdeladecisinbinaria(s/no)yproporcio
narallectorlaprobabilidadasociadaalestadsticodecontrasteobtenido.As,puede
observarselacompatibilidadodiscrepanciaentrelaH0ylaevidenciaobtenidadela
muestra(atravsdelestadsticodecontraste).
El siguiente cuadro muestra cuatro resultados y las diferentes decisiones se
gnseuse(deformamecnica)uncriteriobasadoenun tomadoapriorioaten
diendoalestadsticodecontrasteysunivelcrticoopasociada:

SerechazalaH0?(=0.05)
t p Contr.Hiptesis Decisinenfuncindep
0.1517 0.560 No No
1.6658 0.051 No Repetirelcontrasteconotramuestra
1.6861 0.049 S Repetirelcontrasteconotramuestra
3.0177 0.002 S S

Eltamaodelefectoesotrainformacininteresante.Suutilidadseapreciaan
telasiguientepregunta:Unadiferenciasignificativaimplicaunadiferenciagrande?
Larespuestaesno.
Supongamos el siguiente ejemplo: se pone a prueba si un nuevo mtodo de
enseanzadelinglsesmejorqueelanterior.Trasmedira500alumnosalosquese
leshaaplicadoelnuevomtodoycompararlamediaobtenidaconlaanterior,vemos
que existen diferencias significativas (t500 = 2.02; p < 0.022). Efectivamente, la media
anteriorsesituabaen6.35puntosy,conelmtodoactualsehaalcanzadounamedia
de6.42.Ladiferenciaessignificativapero,esgrande?Oloqueesmsimportante,
esrelevante?Cmoparacambiartodounsistemaeducativo?Parecequeno.
Enestoscasos,eltamaodelefectonosinformadeladiferenciaentreelvalor
propuesto(enlaH0)yelvalorobtenido.Yparaevitardiferenciasaparentesenfun
cindelaescaladelavariablemedida,esadiferenciasedivideporladesviacintpi
cadelosdatosobtenidos:
X 0
d=
Sn1
De esta forma, el tamao del efecto viene expresado en unidades de desvia
cin tpica: un valor de 0.5 significa que la diferencia entre la media obtenida y la
propuestaenlaH0representa0.5veceseltamaodeladesviacintpica.
Cmo interpretar el tamao del efecto? Cohen (1977) propone unos valores
orientativos:
Pequeo:d=0.2;
Moderado:d=0.5;
Grande:d=0.8.


3.Contrastedehiptesis,18
Paraobtenerlapotenciaapartirdeltamaodelefectodebemoscalcularpri
mero:
=d n
Yluegoutilizamoslatabladepotencias,dondeapartirde y podemosob
tener la potencia del contraste. Y de igual forma podramos calcular el n necesario
paraalcanzarunadeterminadapotencia:
2
n=
d2
As,dado dyel delcontraste,podemosbuscarenlatabladepotenciascul
eslaquedesearamosalcanzarylocalizarelvalorDcorrespondiente.Sustituyendo
enlafrmulaanteriorobtendramoseltamaodela muestranecesarioparaconse
guirlo.
Resumiendotodoestoenunatablacomolaanterior:
5.Nivelcrtico pasociadaaltemp= 1.2558
Contr.Bilateral: p = 2 P(t > temp ) p = P(t > 1.2558) = 1 0.8944 = 0.1056

Contr.Unil.Der.: p = P(t > temp ) Loqueindicaquehayun10.56%deprob.de


obtenerresultadosigualesomayoresquelos
Contr.Unil.Izq.: p = P(t < temp )
nuestros.Muysuperioral5%establecido
comopararechazarH0.
6.Intervalodeconfianza ICalniveldeconfianzade0.95
li = X tn1, / 2 Sn1 / n li = 10.44 ( 1.96 ( 2.41/ 48 ) ) = 9.76
IC=
ls = X + tn1, / 2 Sn1 / n ls = 10.44 + ( 1.96 ( 2.41/ 48 ) ) = 11.12
P(9.76 < < 11.12) = 0.95
7.Tamaodelefecto
X 0 10.44 10
d= d= = 0.18
Sn1 2.41
(valorpequeo,segnCohen,1977)
8.Potencia

=d n = 0.18 48 = 1.25
MirarentablaL,paray 1 = 0.35
Clculodenparaunapotenciadada Paraunapotenciade0.75,=2.35
2
2.352 5.52
n= n= = = 170.45 171
d2 0.18 2
0.032

Apndice:SolucinmedianteelSPSS
SiutilizramoselSPSS,loprimeroseraintroducirlosdatos(osiyaestnin
troducidos, cargarlos abriendo el fichero correspondiente). El aspecto sera el si
guiente:


3.Contrastedehiptesis,19


RealizamoselcontrasteelcontrastemedianteelmenAnalizar:



Especificamoslavariableaanalizar(lanicapresente)yelvalordecompara
cin (el definido en la H0) para realizar el contraste. Obsrvese que en ningn mo
mentoseindicaelniveldeconfianzao ,elnivelderiesgootambinllamadonivel
designificacindelcontraste.


3.Contrastedehiptesis,20

Damosaaceptaryobtenemoslossiguientesresultados:

Prueba T
Estadsticos para una muestra

Desviacin Error tp. de


N Media tp. la media
Aciertos 48 10.44 2.414 .348

Prueba para una muestra

Valor de prueba = 10
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
Aciertos 1.256 47 .215 .438 -.26 1.14

Inicialmente, el procedimiento ofrece unos descriptivos bsicos en el primer


recuadro,ylosresultadosdelcontrasteenelsegundo.Enesteltimo,siatendemos
alrecuadroSig.(bilateral)vemoscmoSPSSnosofreceelnivelcrtico,p,deforma
bilateral por defecto. Como nuestro contraste es unilateral, deberemos dividirlo por
dos(p=0.1075)paraconocernuestroverdaderonivelcrtico(tambinllamadoproba
bilidadasociadaalestadsticodecontraste,osignificacindelestadsticodecontraste).
Como se observa, la salida del SPSS no proporciona informacin sobre el ta
maodelefectonilapotencia,peropodemoscalcularlotalcomohemosvisto.
Encuantoalainterpretacindeestosresultados,esidnticaalaquehicimos:
EsteresultadonosllevaraamantenerlaH0aunnivel (tambinllamadonivelde
riesgooniveldesignificacin)de0.05,yaquepessuperior(0.1075;lasignificacin
bilateral,0.215,divididapor2).
Entrminosestadsticos,elnivelcrtico,p,obtenidonosindicaquelaprobabi
lidad de obtener unos resultados como los nuestros, supuesta cierta la H0, es de
0.1075, es decir, algo ms de un 10% de las veces (si repitiramos indefinidamente
esteexperimentosobreunaH0cierta).Portanto,esrazonableconsideraresteresul
tadodemasiadoprobablecomoparallevarnosapensarquelaH0esfalsa.

También podría gustarte