Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I.- El examen consta de tres situaciones, cada una de las cuales comprende un mnimo
de 7 preguntas y un mximo de 10, para un total de 25:
1
TEMA 1: ESTIMACIN DE PARMETROS Y CONTRASTE DE HIPTESIS
En esta asignatura los estadsticos sobre los que se va a trabajar son la media, la
proporcin, la varianza (o su raz cuadrada, la desviacin tpica) y los coeficientes de
regresin, correlacin y determinacin, aunque la inferencia puede realizarse sobre
cualquier otro estadstico (mediana, moda, rango, etc.), existiendo un procedimiento o
frmula diferente para cada estadstico.
En las variables dicotmicas o dicotomizadas (las que slo pueden tomar dos valores),
la proporcin es el porcentaje de elementos que tienen una determinada propiedad (xito)
en relacin con el total. Las probabilidades asociadas a cada valor concreto se distribuyen
segn la distribucin binomial con parmetros n y . Con muestras grandes la binomial
tiende a aproximarse a la normal N (, p), (frmula 3, pgina 9 del cuadernillo). En esta
asignatura para resolver los problemas slo se usa la distribucin normal.
Es muy importante retener que cada estadstico se distribuye con su propia funcin
de distribucin que no cambia con el tamao de la muestra; cuestin diferente es que
por el TCL cuanto mayor sea la muestra, tal distribucin (T de Student, binomial o chi-
cuadrado) se aproxime ms a la normal, pero debe usarse siempre la frmula del
estadstico que corresponda, aunque luego dicho estadstico se use en la tabla normal.
3
5.- ESTIMACIN DE PARMETROS: PUNTUAL Y POR INTERVALOS.
Para un tamao de muestra dado, cuanto mayor sea la amplitud del intervalo, mayor
ser el nivel de confianza (probabilidad de que el valor poblacional est dentro del mismo),
pero menor la precisin (puesto que el intervalo es ms amplio). Cuanto mayor sea la
dispersin muestral (varianza o desviacin tpica, sesgada o insesgada), menor ser el nivel
de confianza. Slo al aumentar el tamao de la muestra, se incrementan la precisin y el
nivel de confianza. En consecuencia, para un nivel de confianza dado, la amplitud del
intervalo de confianza tendr que ser por fuerza mayor cuanto menor sea el tamao
muestral o cuanto mayor sea la dispersin muestral.
N(0,1) t n-1 gl
2 2
Distribucin Normal (Conocida ) Desconocida la (Muestras pequeas)
6
6.- CONTRASTE (o prueba) DE HIPTESIS.
Una hiptesis estadstica es una conjetura que se formula sobre una poblacin y que
puede someterse a prueba o contrastacin emprica a partir de una muestra representativa
de esa poblacin. Una vez que la hiptesis se ha contrastado se pueden tomar decisiones
sobre la misma. El contraste de hiptesis es una parte esencial del mtodo cientfico.
Para el contraste de hiptesis se deben formar una hiptesis nula H0 y otra alternativa
H1. En la hiptesis nula, forzosamente debe estar el signo igual y adems pueden estar el
mayor que o el menor que, pero no ambos a la vez. En la H1 nunca est el signo igual, con
las excepciones que se vern en cada caso.
En general, la hiptesis nula afirma que no existe diferencia entre el valor del
estadstico obtenido en la muestra y el que formulamos como parmetro poblacional,
es decir, que la diferencia observada entre estos dos valores es nula. Sin embargo, como el
valor del estadstico muestral y el del parmetro poblacional rara vez coincidirn, lo que se
afirma es que la diferencia observada entre ambos puede explicarse como resultado del
azar. Esto es, que si se repitiese la investigacin un nmero suficiente de veces con otras
muestras aleatorias del mismo tipo y tamao extradas de la poblacin, la media o esperanza
matemtica de las diferencias observadas entre los valores del estadstico y el parmetro
poblacional formulado en la hiptesis nula tendera a desaparecer (valor cero).
Para cada hiptesis nula se plantea una hiptesis alternativa, representada por H1, que
es la negacin de la hiptesis nula, de tal forma que si la hiptesis nula es falsa la hiptesis
alternativa tiene que ser forzosamente verdadera y viceversa. Por tanto, estas dos hiptesis
tienen que ser exhaustivas y mutuamente excluyentes.
7
Contraste bilateral Unilateral derecho Unilateral izquierdo
H0 : =0 H0 :0 H0 :0
H1 : 0 H1 :>0 H1 :<0
8
d.- Regla de decisin, de acuerdo con el nivel de significacin .
Calculado el valor del estadstico de contraste o discrepancia entre los datos empricos
observados en la muestra y los datos tericos que planteamos en la hiptesis nula se toma
una decisin respecto al rechazo o no de H0, estableciendo previamente el nivel de
significacin que, segn Fisher, representa el mximo riesgo de rechazar una hiptesis
nula verdadera. En puridad, la hiptesis nula no se acepta, sino que no se rechaza (de
forma provisional), por no haber evidencia emprica suficiente de su falsedad.
9
CONTRASTE BILATERAL Valores / 1- / Z ms frecuentes
Valor crtico (Z /2) Valor crtico (Z /2) 005 001 0001
1- 095 99 0999
Z /2 - 196 - 258 - 329
Z 1-/2 196 258 329
Nivel de significacin
1 Nivel de confianza
Z /2 Z (Tabla III negativa)
Z 1-/2 Z (Tabla IV positiva)
10
Por tanto, si el estadstico de contraste se sita en la zona de NO rechazo, la diferencia
observada no es significativa y se debe a errores aleatorios por lo que no podemos
rechazar la hiptesis nula con un determinado nivel de confianza. En caso de situarse en la
zona de rechazo, diremos que el valor del EC es significativo para un determinado nivel
de significacin y se rechazar la hiptesis nula. En definitiva, si el valor absoluto del EC
es mayor que el valor crtico (el correspondiente al nivel de significacin), se rechaza
la hiptesis nula y no se rechazar en caso contrario.
La decisin puede tomarse tambin mediante el clculo del nivel p crtico, que es la
probabilidad de obtener unos resultados como los observados en la muestra bajo el
supuesto de que la H0 es cierta. La regla de decisin a travs del nivel crtico es justo la
inversa: Si p es , rechazaremos H0, y si p > , no la rechazaremos. Esto es:
11
7.- ERRORES EN LA DECISIN EN UN CONTRASTE DE HIPTESIS.
Al decidir entre la hiptesis nula o su alternativa podemos cometer dos tipos de errores:
- Error tipo I (): Es la probabilidad de rechazar una hiptesis nula verdadera.
Coincide con el nivel de significacin , fijado a priori por el investigador. Su
complementario, probabilidad de aceptar una H0 verdadera es el nivel de confianza.
Error tipo II (): Es la probabilidad de aceptar una hiptesis nula falsa. Su
complementario 1-, probabilidad de rechazar una H0 falsa es la potencia del contraste.
Decisin Naturaleza de H0
VERDADERA FALSA
Decisin errnea
Decisin correcta
Se rechaza Error tipo I Potencia del contraste
Nivel de significacin
1-
Para igual tamao muestral la disminucin del error tipo I aumenta el error tipo II. La
opcin por uno u otro depender del tipo de experimento y de sus consecuencias; en un
tratamiento mdico el error de tipo II es peor (no beneficiarse de un tratamiento ms eficaz,
frente al coste de inversin en uno que no lo es). Sin embargo, en un juicio el error de tipo
I es ms grave (condenar a un inocente, frente a dejar libre a un culpable).
13
b) Contraste sobre la media poblacional desconocida la varianza poblacional.
Para poder calcular la potencia de un contraste las hiptesis nula y alternativa deben
ser simples, comparndose en cada una de ellas un nico parmetro poblacional, en
vez de un rango de valores (por ejemplo media = 7 frente a media = 9). Por tanto, por
excepcin, se plantean dos hiptesis en las que figura el signo igual tanto en la hiptesis
nula como en la alternativa. La potencia del contraste variar en funcin del tamao
muestral y la distancia entre el valor de la hiptesis nula y la hiptesis alternativa.
Para un mismo valor del error tipo I y distintos valores de H1, dichas variaciones
se representan mediante las curvas de potencia, que representan la potencia de un
contraste segn los distintos valores que pueda tomar H1 y el tamao de la muestra.
14
Para calcular la potencia del contraste, una vez establecido el nivel de significacin:
Dependiendo del nivel de significacin que se adopte a priori, la decisin que se tome
respecto de la H0 puede variar. Por ejemplo, que una hiptesis nula pueda rechazarse con
un nivel de significacin de 0.05 pero no de 0.01. Para evitar estos inconvenientes, se utiliza
el denominado nivel crtico p, que se define como el nivel de significacin ms pequeo
al que una hiptesis nula puede ser rechazada con la medida de discrepancia obtenida.
Es decir, el nivel crtico p cuantifica la probabilidad de obtener unos datos como los
obtenidos en la muestra bajo el supuesto de que la hiptesis nula es verdadera.
a) Si nos piden el valor p crtico para un determinado valor de la variable, hay que
calcular el estadstico correspondiente y buscar la probabilidad asociada a la tabla. Si el
contraste es unilateral derecho, el nivel p crtico es 1 menos el valor de la tabla. Si es
bilateral ese resultado se multiplica por 2. Y si es unilateral izquierdo, el valor de la tabla
es el nivel p crtico.
16
TEMA 3. ANLISIS DE DATOS PARA DISEOS DE DOS GRUPOS. MUESTRAS
INDEPENDIENTES. (Frmulas pgina 10 del cuadernillo)
1.- INTRODUCCIN.
Las condiciones y supuestos son los mismos, pero no se conocen ni la forma de las
distribuciones poblacionales ni sus varianzas, pero stas ltimas se suponen iguales. Las
frmulas para el estadstico de contraste y el intervalo de confianza son las que figuran en
la fila 2 de la pgina 10 del formulario (distribucin T de Student, con n1+n2-2 grados
de libertad), en la que se utilizan los valores de las cuasivarianzas o varianzas insesgadas
muestrales). Este contraste de hiptesis se conoce como prueba T.
17
3.- CONTRASTE DE HIPTESIS SOBRE DOS VARIANZAS EN MUESTRAS
INDEPENDIENTES.
18
TEMA 4. ANLISIS DE DATOS PARA DISEOS DE DOS GRUPOS. MUESTRAS
RELACIONADAS. (Frmulas pgina 11 del cuadernillo)
19
TEMA 5 DISEOS CON MS DE DOS GRUPOS INDEPENDIENTES.
1.- INTRODUCCIN.
Los diseos en los que los niveles actan como una muestra de los posibles niveles del
factor y cuyas conclusiones se pueden generalizar para todos ellos, se conoce como de
efectos aleatorios o modelo aleatorio. Si las conclusiones estn restringidas a los niveles
establecidos previamente en el diseo, se trata de un diseo de efectos o modelos fijos.
Si los grupos o muestras tienen el mismo nmero de elementos, estaremos ante un modelo
equilibrado; en otro caso, ante un modelo no equilibrado.
20
Para minimizar la influencia de las variables extraas, conocidas o no y evitar
sesgos sistemticos en los resultados que se confunden con los efectos que pudieran deberse
a la variable independiente se procede a la aleatorizacin del muestreo tanto en la
eleccin de los sujetos como en el orden de asignacin a las condiciones experimentales
o niveles (contrabalanceo). Esto reduce aunque no elimina la posibilidad de que las
diferencias observadas entre los niveles no sean fruto del efecto conjunto de la variable
independiente y de factores de azar y por tanto, permite suponer que los errores
experimentales son independientes de los efectos de los distintos niveles de los factores.
SC TOTAL = Y2 {( Y)2 / N}
SC INTRA = SC TOTAL - SC INTER
SC INTER = (Y)2 / n {( Y)2 / N}
El Numerador del estadstico de contraste (MCINTER) contiene la Varianza de error + Efecto real de la VI. El
Denominador (MC INTRA) contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI ms se
acerca el cociente a uno.
Valor Crtico: F (I-1) (N-I) (1-) Zona de Aceptacin: F < F ((I-1) (N-I) (1-)
Decisin:
Zona de Rechazo: F F (I-1) (N-I) (1-) Si F < F crtico Aceptamos H0
Si F F crtico Rechazamos H0
22
Clculos abreviados (Utilizamos el sistema de notacin propuesto por Keppel): El clculo de las Sumas de
cuadrados se realiza sumando y restando las razones bsicas: [Y] (relacionada con las puntuaciones
individuales); [A] con los totales de los niveles y [T] con la suma total.
Estructura de clculo del numerador: Se elevan al cuadrado las cantidades implicadas y posteriormente se
suman.
Estructura de clculo del denominador: Cualquiera que sea el trmino se divide por el nmero de puntuaciones
que contribuyen a su clculo.
Frmulas para las razones bsicas Sumas Cuadrados a partir de razones bsicas
SCS | A = (A)2
En el examen se suelen facilitar los datos de las medias o las sumas cuadrticas
necesarios para calcular los restantes y lo ms importante es saber relacionarlas ambas
mediante las frmulas correspondientes (est todo en el formulario, en el examen hay que
tener paciencia para buscar los datos en la tabla que corresponda):
23
SCtotal = SCInter. + SCintra (SC= suma cuadrtica), mide la variabilidad total y es igual
a la suma de todas las puntuaciones menos la media total al cuadrado.
SCInter mide la variabilidad entre los niveles o variabilidad debida al efecto del
factor y es igual a la suma de la media de cada nivel menos la media del factor al cuadrado.
SCintra mide la variabilidad dentro de cada nivel o variabilidad debida al error
experimental y es la suma de cada puntuacin menos la media de su nivel al cuadrado.
Las medias cuadrticas se obtienen dividiendo las respectivas sumas cuadrticas por
los respectivos grados de libertad (MC=SC/g.l.).
Para resolver el Sudoku, conviene empezar por el final: Los grados de libertad totales
del ANOVA es N-1 y a partir de ah se va completando. Como se explica en el recuadro, si
nos dan las razones bsicas (como en septiembre), las A2 son los cuadrados totales de las
sumas de las A, no las sumas de las A elevadas al cuadrado y las n, el nmero de sujetos de
cada muestra o nivel.
Partiendo del rechazo de la hiptesis nula si slo interesa comparar algunos niveles
del factor elegidos de antemano, hablaremos de comparaciones planificadas o a priori.
En estos casos, los resultados obtenidos de F ni siquiera suelen citarse. Pero si interesa
hacerlas sobre todos los niveles del ANOVA, se tratar de comparaciones no planificadas,
a posteriori o post hoc.
Esta prueba fija la tasa de error de tipo I en el al que estemos trabajando y obtiene
un valor llamado diferencia mnima, rango o valor crtico CR (Critical Range) de
Scheff por encima del cual se considera que hay diferencias entre las medias o grupos de
medias que estemos comparando. La frmula est al final de la pgina 12 del formulario:
24
__________________ ___________________
CR SCHEFF = (k - 1) F (k - 1), gl ERROR MC ERROR [ (c2j / nj)]
Como se ve, la suma de los cj, siempre es 0. Primero se calculan los cj de los que se
combinan conjuntamente y se les pone un 1 con signo negativo (en algn examen sali con
coeficientes como ), con la ponderacin correspondiente. Es decir si comparamos una
media contra dos, estas dos ltimas deben dividirse por 2, o lo que es lo mismo, la que va
sola debe multiplicarse por 2. En el ejemplo 3, las medias 1 y 5 se multiplican por 3 y las
restantes, por 2. Como se elevan al cuadrado, da igual el signo + o que se ponga a cada
coeficiente.
Regla de decisin:
25
TEMA 6. ANLISIS DE DATOS EN DISEOS INTRASUJETOS.
Condiciones y supuestos: Los supuestos que deben cumplirse para poder aplicar
correctamente el ANOVA son los mismos vistos para el ANOVA intersujetos, esto es, VD
medida, a un nivel de intervalo o de razn, puntuaciones de la VD en cada nivel del factor
independientes entre s y distribuidas normalmente y adems, dos condiciones
particulares para reducir el error por la interaccin: Las varianzas de las puntuaciones
para los distintos niveles del factor deben ser iguales entre s y las covarianzas entre
todos los niveles del factor deben ser iguales entre s.
La forma de clculo es muy similar a la del tema anterior, pero utilizando las frmulas
de la pgina 13 del formulario (varan los g.l. y por tanto, las relaciones entre MC y SC).
26
TEMA 7. DISEOS CON MS DE DOS GRUPOS INDEPENDIENTES.
ANLISIS DE VARIANZA CON DOS FACTORES COMPLETAMENTE
ALEATORIZADOS (ANOVA BIFACTORIAL).
En los diseos factoriales se quiere estudiar el efecto que sobre una variable
dependiente ejercen dos factores o variables independientes A y B completamente
aleatorizados, todos ellos con igual nmero de categoras de modo todos los niveles de uno
se combinan con los del otro. Un diseo factorial consiste en un conjunto de diseos
simples de un factor en el cual la misma variable independiente es manipulada en
combinacin con una segunda variable independiente.
1) Los efectos principales de cada una de las VI (factores) sobre la VD. Se consideran
tantos efectos principales como factores hay implicados en el diseo y se analizan mediante
un ANOVA de cada factor sin considerar el otro. Los efectos principales de una variable
independiente o factor se refieren a los efectos promedio totales de una variable y se obtiene
combinando el conjunto completo de componentes experimentales presentes en ese factor.
- Cuando los efectos sobre la VD de un factor cambia ante diferentes niveles de otro.
- Cuando los patrones de diferencias asociados con un factor cambian con los diferentes
niveles de otro.
- Cuando los efectos simples de un factor no son los mismos en todos los niveles de
otro.
- Cuando los efectos principales de un factor no son representativos de los efectos
simples de ese mismo factor.
- Cuando las diferencias entre las medias de las celdas que representan el efecto de un
factor en algn nivel del otro factor no son iguales a las correspondientes diferencias en
otro nivel de este factor.
- Cuando los efectos de un factor estn condicionalmente relacionados a los niveles de
otro.
- Cuando un factor no tiene un efecto constante en todos los niveles de otro.
3) Los efectos simples, o ms focalizados de cada factor con cada nivel del otro
factor. Se pueden considerar tantos efectos simples como la suma de niveles de cada factor.
27
Procedimiento: A partir de la tabla del ANOVA factorial se realiza la prueba mnibus
(efectos principales y efecto interaccin). Si el efecto interaccin es significativo se
concluye que el efecto producido por los niveles de un factor depende de los niveles de otro
factor y rechazaremos H0. Si F no es significativa, se acepta H0, se considera que no existe
efecto interaccin y el modelo se convierte en factorial aditivo (normal), de modo que en
el cuadro del ANOVA la fila de la interaccin se suma al error y se recalcula F.
Los estadsticos de contraste son las razones entre las medias cuadrticas
correspondientes y la media cuadrtica intra grupos, que se distribuye segn F.
Las frmulas para los clculos del ANOVA estn en las pginas 14 y 15 del formulario,
considerando slo diseos equilibrados. El patrn de anlisis es anlogo a los de los otros
modelos, incluyendo dos factores, la interaccin entre ambos y ajustando los grados de
libertad. La SCintra se divide a su vez en tres componentes:
- Entre tratamientos del factor A (SCA), que refleja los efectos principales del factor A.
- Entre tratamientos del factor B (SCB), que refleja los efectos principales del factor B.
- La interaccin entre A y B (SCAxB).
28
A continuacin se presenta un ejemplo del modelo con 2 factores, zona y duracin, as
como la secuencia de anlisis factorial:
29
TEMA 8.- ANLISIS DE REGRESIN LINEAL SIMPLE Y MLTIPLE.
1.- INTRODUCCIN.
El anlisis de regresin es un diseo ex post facto que puede ser usado siempre que una
variable cuantitativa pueda ser estudiada como una funcin de una (ARS, anlisis de
regresin simple) o varias variables (ARM, anlisis de regresin mltiple). Las relaciones
entre la VD y la VI pueden ser muy diversas: lineal, exponencial, logartmica, etc. En este
tema slo se estudia la regresin lineal. El anlisis de regresin tambin se puede aplicar a
situaciones en las que se manipulen condiciones experimentales, de modo que casi
cualquier informacin que tenga inters para el estudio de la VD puede ser objeto de
incorporacin en este tipo de anlisis.
Una baja correlacin entre variables implica que no hay relacin lineal entre ellas, pero
no descarta que pudiera haberla de otro tipo (exponencial, logartmica, etc.). Una alta
correlacin lineal o implica necesariamente que haya relacin causal entre ellas, pues podra
ocurrir que ambas fueran afectadas por una variable ajena al modelo, por ejemplo, C.I. y
altura tienen alta correlacin en los nios pero ambas estn relacionadas con la edad.
Cuando una variable, independiente (VI), aporta informacin sobre otra, dependiente
(VD), decimos que ambas estn correlacionadas. El objeto de la correlacin es analizar el
grado de asociacin entre las variables y el de la regresin, efectuar predicciones acerca
de los valores de la VD para valores dados de la VI. La VI se representa por X, la VD por
Y y los valores estimados por Y.
Imaginemos que en una grfica se representan los puntos (nube de puntos) que indican
los valores de X e Y. La regresin lineal se realiza mediante el mtodo de los mnimos
cuadrados ajustando a dichos datos una lnea recta que minimice los cuadrados de las
diferencias entre los valores reales de Y para un valor cualquiera de X y los valores
estimados de Y (Y) que resultaran de aplicar la ecuacin de regresin resultante.
Ejemplos de regresin lineal y exponencial:
30
El modelo se representa:
- Y el valor estimado de Y,
- B la pendiente de la recta de regresin (coeficiente de regresin) y representa el
aumento de valor que experimenta Y cuando X aumenta en una unidad;
- B0, el intercepto o valor de la ordenada en el origen (valor pronosticado de Y
cuando X es 0). El intercepto, al igual que los dems valores de Y que se encuentren fuera
del rango de valores de la VI, no es objeto de interpretacin, salvo que el valor 0 se
encuentre dentro del rango de valores de la VI.
Las diferencias entre los valores de la variable observados y los estimados son los
errores de estimacin o prediccin. La suma de la media de los valores pronosticados
es igual a la suma de la media de los valores observados.
- SCtotal = nS2Y. En la calculadora Casio, en modo regresin, hay que utilizar 2y. Esta
frmula no viene en ninguna parte y han cado problemas en exmenes antiguos en los que
daban la varianza total de Y (S2Y) pero no la SCtotal.
- SCtotal = SCregresin + SCresidual. Se deduce del cuadro del ANOVA de la regresin en
la pgina 16 del formulario. Aparece de forma explcita y separada en el cuadro de la ARM.
Despejando, SCresidual = SCtotal - SCregresin
- r2 = SCregresin/SCtotal. Despejando, SCregresin = r2SCtotal.
Mientras que el ARS produce la lnea recta que relaciona la VD (Y) con la VI (X), el
ARM con dos variables independientes produce un plano de regresin que relaciona la VD
(Y) con los valores de las dos VI (X1 y X2) (para ms de dos VI sera un hiperplano).
Si calculamos para cada VI su correlacin con la VD segn las tcnicas del ARS,
obtendremos los correspondientes coeficientes de correlacin, que se llaman correlaciones
dos a dos, bivariadas o de orden cero. Con la calculadora Casio, si dieran tablas de
valores, se puede hacer metiendo en la tabla los valores de Y y los valores de X1, calcular
B1 y r1 y luego sustituir los de X1 por los de X2 y calcular B2 y X2.
Sin embargo, estas correlaciones slo ofrecen una indicacin aparente del influjo de
cada VI en la VD y no son puras pues no reflejan la verdadera influencia de cada VI
aisladamente consideradas en la V, al no tener en cuenta ni la influencia entre las distintas
VI, ni su influencia conjunta en la VD. Por eso la suma de los coeficientes de correlacin
bivariados ser siempre mayor que el coeficiente de correlacin mltiple.
34
d
a c
b
X1 X2
La asignacin de una parte de (b) a cada VI, esto es, la contribucin especfica de
cada variable en la variabilidad conjunta depender de su orden de entrada. Para
determinar este orden hay varios mtodos: Forward (hacia adelante) y Backward (hacia
atrs). El ms usado es uno de los primeros llamado (stepwise o step by step) en el que,
partiendo de las correlaciones semiparciales entre las distintas variables, se seleccionan por
orden de mayor a menor correlacin, se calcula la ecuacin de regresin y se van
introduciendo las dems variables una por una hasta que el aumento en el porcentaje de
varianza proporcionado por la VI correspondiente en la VD no sea significativo.
d) Correlacin parcial.
Y
d
a c
b
X1 X2
2
pr1 = a / (a+d) y pr22 = c / (c+d)
36
- El modelo de regresin lineal estima el valor de la VD, mediante una funcin lineal
de una o varias VI (Regresin Lineal Simple y Mltiple, respectivamente). El coeficiente
de correlacin de Pearson (mltiple) mide el grado de asociacin entre la VD y la(s) VI y
oscila entre -1 y 1.
- R expresa la correlacin entre la VD (Y) y la mejor funcin lineal de las VIs (Xis).
37
ADENDA: PERLITAS QUE HAY QUE TENER EN CUENTA PARA NO
FALLAR EN TONTERAS:
1.- Hay que leer e interpretar bien los enunciados. Si piden contrastes sobre varianzas
o sobre proporciones lo dirn expresamente o en el caso de proporciones, hablando de
porcentajes o en el caso de las varianzas, de variabilidades. En todos los dems casos,
siempre es un contraste de medias (incluso si hablan de proporcin media o frecuencia de
aciertos, el contraste es de medias, salvo que se refiera a porcentaje, frecuencia o proporcin
de sujetos). Hay que fijarse bien si es bilateral (H0 es que no hay diferencias, H1, hay
diferencias) o unilateral (derecho, H0 menor o igual, H1, mayor que; izquierdo, HO mayor
o igual, H1, menor que). Cuidado con fijar bien n, cuidado cuando den muchos datos porque
a veces nos preguntan slo sobre una parte. Cuidado con cada pregunta, no todas son sobre
lo mismo. En la situacin 1o normal es que pregunten por medias, proporciones y varianzas.
Si hay dos muestras con diferente nmero de sujetos, son independientes. Slo son
relacionadas si los mismos sujetos (o relacionados por pares, i.e. gemelos) son sometidos a
todos los distintos niveles del factor.
Si no sabemos segura la respuesta de primeras e incluso en tal caso, conviene descartar
las que sean imposibles. El valor crtico se busca en la tabla para 1- o 1-/2.
Para evitar errores o detectarlos, conviene escribir de puo y letra, con claridad, todos
los datos, en lugar separado y destacado de donde hacemos las operaciones. Para la
calculadora, conviene escribir las frmulas tal vienen en el formulario, sin simplificaciones
que nos puedan inducir a error, con los parntesis en su sitio (esto es vital).
2.- Prueba previa del contraste de igualdad de varianzas. Se dividen las
cuasivarianzas o varianzas muestrales insesgadas, poniendo la mayor en el numerador
(arriba). El contraste es bilateral, por tanto hay que acudir a las tablas de la F buscando 1-
/2; tiene que haber mucha diferencia entre las cuasivarianzas para que se considere la
diferencia de varianzas poblacionales significativa. Si el EC > VC, se rechaza la hiptesis
de que las varianzas son iguales. Si es menor, se acepta.
3.- Nivel p crtico: Es el nivel de significacin del estadstico de contraste, es decir, la
probabilidad, siendo H0 cierta, de obtener un valor igual o ms extremo que el del EC que
hemos calculado. La tabla nos da siempre la probabilidad que hay a la izquierda, por eso:
- Si el contraste es unilateral derecho, el nivel p crtico es 1 probabilidad de la
tabla. Buscamos el valor de la probabilidad que hay en la cola derecha del EC y la tabla
nos da la que hay a la izquierda, por eso restamos de 1 el valor de la tabla.
- Si el contraste es unilateral izquierdo, el nivel p crtico es el valor de la tabla, ya
que buscamos el valor que hay en la cola izquierda y es el que nos da la tabla
- Si es bilateral, (1 probabilidad de la tabla) se multiplica por 2.
Cuando no coincide, entonces se establecer el nivel p crtico como mayor o menor que
el de la tabla, dependiendo de si el EC es ms grande o ms pequeo que el VC.
Hazte el esquema de la grfica y raya las zonas de aceptacin y rechazo! En el eje
horizontal estn los valores del estadstico y el rea del eje con la curva es la probabilidad.
Regla infalible: Cuanto MS GRANDE es el valor absoluto del EC (est ms alejado
del centro), MENOR es el nivel p crtico y viceversa. Por tanto el rechazo de H0 es
porque |EC|>|VC| o lo que es lo mismo, porque p< .
38
4.- ANOVAS. Hay que rellenar el Sudoku. Si no se identifica bien el tipo de ANOVA
que es (unifactorial con muestras independientes o relacionadas; bifactorial dem), ayudar
empezar por el ms sencillo y si sobran datos, ser el otro. Se puede hacer al revs: Si faltan
datos, lo normal es que sea el ms fcil. Para los grados de libertad empieza por el final,
pues es fcil identificar N-1. A partir de ah, se ponen los grados de libertad de cada factor,
a la interaccin y la diferencia al error o MC inter. Luego se van calculando lo que falte,
teniendo en cuenta que MC=SC/g.l. y que la suma total de g.l. es N-1, salvo en regresin,
que es N-2. Normalmente los grados de libertad del error o la SCINTER sern mucho mayores
que los de la SCINTRA. Frmula que falta: SC = nS2 (nmero de elementos por la varianza).
5.- Modelo de efectos fijos-aleatorios. Efectos fijos: Slo interesan los datos para los
niveles de los factores manejados. Efectos aleatorios, interesan para cualesquiera niveles
de los factores. En caso de duda, no contestar.
6.- Contrastes en regresin lineal: Son bilaterales (salvo el ANOVA de regresin) y
por tanto hay que funcionar con 1-/2. El grado de libertad de la regresin simple es 1 y el
total de los g.l., n-2.
7.- Distincin entre correlacin semiparcial y parcial. En la semiparcial se elimina
del influjo de una VI en la VD, el influjo de todas las dems VI. En la parcial se elimina
adems el influjo de cualesquiera otras variables no consideradas (incluidas en el error).
Las correlaciones calculadas sin ms, es decir sin eliminar el influjo de otras variables estn
o no en el modelo, no son puras y se llaman bivariadas o de orden cero.
8.- El coeficiente de correlacin mide el grado de asociacin entre las variables. Su
cuadrado es coeficiente de determinacin y mide el porcentaje de variabilidad de la VD
atribuible a la VI. Su complementario es el coeficiente de alienacin y mide el porcentaje
de variabilidad atribuible a variables no consideradas (error).
En el examen, creo que es mejor empezar por las preguntas de teora no asociadas
directamente a los problemas (sern entre 7-10) y luego ir resolviendo las situaciones en
que estemos ms seguros, dejando para el final lo que no salga.
39