Está en la página 1de 37

MODELO DE DISTRIBUCIONES

REPASO MODELOS página 1


Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
REPASO MODELOS página 2
si lees esto me debes un besito
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
CÁLCULO PROBABILIDADES Y PERCENTILES

1.- PASOS
a- Introducir un valor cualquiera en el fichero de datos (para poder usar la calculadora)
b- Seleccionar: Transformar/Calcular variable.
c- Variable objetivo: Nombre de la variable del cálculo.
c.2- Expresión numérica: Realización del cálculo (DECIMALES SIEMPRE CON PUNTO).
Solución: Vista de datos.

2.- GRUPO DE FUNCIONES (GF)

->2.1- Probabilidad puntual (Modelos discontinuos)

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
GF ->2.2- Probabilidad acumulativa (Modelos continuos/discontinuos)
->2.3- Percentiles (Modelos continuos)

2.1- PROBABILIDAD PUNTUAL/EXACTA

MODELOS CONTINUOS:

B- MODELOS DISCONTINUOS: Sirve para Binomial y Poisson.


-Pasos:
a-PDF y PDF no centrada.

Reservados todos los derechos.


b-PDF Binomial / PDF Poisson.
c-Introducir: Valor y parámetros:

Ejemplo 1 (Binomial): Ejemplo 2 (Poisson):

2.2- PROBABILIDAD ACUMULADA (FUNCIÓN DISTRIBUCIÓN)

A- MODELOS DISCRETOS
-Pasos:
a- Grupo de funciones: CDF y CDF no centrada
b- Funciones y variables especiales: Valen todos los modelos en esta probabilidad.

TRANSFORMAR PROBABILIDADES A:

-Complementario
-Transformaciones

-Importante:

PROB Y PERC -BYN página 1


si lees esto me debes un besito
B- MODELOS CONTINUOS (No importan los símbolos de las propiedades, pero se busca ≤)

-Tipos de modelos: Uniforme, exponencial, normal, Chi cuadrado (chiq.), t.student (T), F.Snedecor(F)

-Pueden preguntar

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2.3- PERCENTILES (Continua)
EX: Se preguntarán modo pregunta

-Pasos:
a- GL Inversos
b- Modelo continuo que sea

Reservados todos los derechos.

PROB Y PERC -BYN página 2


si lees esto me debes un besito
TEMA 1: VARIABLES ALEATORIAS INDEPENDIENTES

RESUMEN TEMA 1 - VARIABLES ALEATORIAS INDEPENDIENTES página 1


Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
si lees esto me debes un besito
RESUMEN TEMA 1 - VARIABLES ALEATORIAS INDEPENDIENTES página 2
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
si lees esto me debes un besito
RESUMEN TEMA 1 - VARIABLES ALEATORIAS INDEPENDIENTES página 3
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEMA 2: MUESTRAS Y ESTADÍSTICOS

Se estudiarán las nociones básicas para: Inferencia estadística.

1-INFERENCIA ESTADÍSTICA
Tiene como objetivo estimar una característica de interés (media, varianza, desviación
típica…) de la población de estudio que por su tamaño, es inviable estudiarla por
completa.
Se estudia la población a partir de la información obtenida de una muestra.

1.1-ELEMENTOS INFERENCIA ESTADÍSTICA


A.POBLACIÓN (N)
Conjunto de individuos sobre el que estamos interesados en estudiar una o varias

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
características.
Un parámetro poblacional describe a la población:
-Parámetro media poblacional
-P. desviación típica poblacional
-P. varianza poblacional
-Proporción poblacional

B.MUESTRA (n)
Subconjunto de elementos de la población sobre el que realmente hacemos las
observaciones.
Un estadístico es una función construida exclusivamente con valores muestrales que
describe a la muestra:

Reservados todos los derechos.


-Media muestral
-Desviación típica muestral
-Varianza muestral
-Proporción muestral

Para la inferencia estadística se utilizan

1.2MÉTODOS PARA CALCULAR INFERENCIA ESTADÍSTICA


A.INFERENCIA PARAMÉTRICA
Se conoce el modelo de distribución de la población (normal/binomial) pero se desconocen algunos de
sus parámetros.
Objetivo: Estimar el valor de dichos parámetros con los datos de la muestra.

(!!Solo aplicar estos métodos si se conoce que el modelo es normal o binomial!!)

Modelos paramétricos -------------------(si no se puede)----------> Modelos no paramétricos


(opción más precisa para estimar) (datos menos fiables, alternativa)

B.INFERENCIA NO PARAMÉTRICA
No requieren conocer la forma funcional de la distribución de la población.
Permite:
-Estudiar parámetros poblacionales cuando se incumple que no es modelo de distrib. Normal)
-Estudiar otras características de la población (Ej: Ver si son variables independientes o dependientes…)

TEMA 2 página 1
si lees esto me debes un besito
A.1-TÉCNICAS PARAMÉTRICAS
Queremos estudiar una v.a de una población.

Sabemos que

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Métodos:
a-Estimación puntual (peor estimación): Valor concreto para estimar el parámetro de la población.
b-Intervalos de confianza: Intervalos (rango de valores).
c-Contrastes de hipótesis: Trata de decidir si la muestra apoya o no una afirmación sobre el parámetro
poblacional desconocido. (Permite comprobar si una hipótesis sobre el parámetro es cierta o no).

a- Estimación puntual
Objetivo: Asignar valor concreto a un parámetro poblacional a partir de los datos que obtenemos de una
muestra.
Para poder hacerlo necesitamos:
Un estimador: Es un estadístico de un parámetro poblacional que toma valores admisibles para el
parámetro desconocido, es decir, que cumple buenas propiedades.

Reservados todos los derechos.


Ej estimador: Media=0.5 tendría buenas propiedades si hablamos del modelo binomial ya que esta entre
(0,1).

Estimadores más usuales son:


a- Estimador puntual de la media (media muestral)

b-Estimador puntual de la varianza (varianza muestral)

c-Estimador puntual de una proporción

A- ESTIMADOR PUNTUAL Propiedades


a- ERROR ESTIMACIÓN PUNTUAL: ERROR CUADRÁTICO MEDIO (ECM) media/varianza 1er año
El inconveniente de la estimación puntual es que, si cambias de muestra en una misma población, se
obtiene un valor diferente.
Por tanto necesitamos calcular algo que estime más o menos a cuanta distancia está nuestro valor
estimado del real.

Error cuadrático medio (ECM)


Notación:
: Parámetro poblacional a estudiar de manera general (sin especificar qué parámetro es).

: Estimador del parámetro poblacional.

Fórmula:

TEMA 2 página 2
b- PROPIEDADES DESEABLES BUEN ESTIMADOR

1-Suficiencia: Recoger la máxima información sobre el parámetro de la muestra.


2-Insegadez: Un parámetro es insegado si, a largo plazo, no se desvía del verdadero
valor del parámetro.

Si el sesgo = 0 -> Estimador insegado >

Si el sesgo ≠ 0 -> Estimador sesgado > DESCARTADO.

3-Eficiencia: Entre todos los estimadores insegados, nos interesa el más eficiente.
1· Nos quedamos con el que tenga menos ECM.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2· Si hay varios con =ECM, nos quedamos con el que menor varianza tenga.

Si el estimador es insegado: <- SIEMPRE.

Varianza mínima:

Reservados todos los derechos.


4-Consistencia: Se mejora la estimación contra más datos tengamos.
Es consistente si se cumple estas dos condiciones:

Si es insegado siempre se cumple la 1ra condición.

TEMA 2 página 3
si lees esto me debes un besito
TEMA 3: ESTIMACIÓN POR INTERVALOS DE CONFIANZA Y ESTIMACIÓN DE HIPÓTESIS

Objetivo: Estudiar parámetros


Requisitos: Conocer el modelo de distribución de nuestra variable de interés

Variable de interés

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TÉCNICAS: Intervalos de confianza y contraste de hipótesis
NO se utiliza estimación puntual por las siguientes causas:
a. Cambio de muestra = Estimación diferente
b. No se puede determinar EXACTAMENTE el valor del error

Lo que hacemos en la estimación puntual es quedarnos con el estimador que tiene menor error
cuadrático medio. Por tanto, desconocemos si el valor estimado del error se encuentra cerca (o no) del
verdadero valor del parámetro.

Alternativas: Otras técnicas que nos permitan cuantificar el error cometido en la estimación. Son:

Reservados todos los derechos.


A.- INTERVALOR DE CONFIANZA (I.C)

Se busca un rango de valores admisibles para el parámetro, con un nivel de confianza conocido.
Construiremos, a través de las muestras, un intervalo [a,b] de manera que ofrezca unas garantías.
Además se pretenderá que el intervalo sea de amplitud mínima.

Fórmula:

Nivel de confianza: Garantía de que el verdadero valor esté en ese intervalo.


(Donde normalmente es pequeño)

Se trabaja con

El nivel de confianza va relacionado con la amplitud del intervalo:


-Trabajar a un 99% de confianza = Intervalo + grande.
-A un 95% = Nivel de confianza + preciso = Intervalo +/- grande. (normal).

Interpretación nivel confianza:


Si repetimos el experimento un gran número de veces con muestras distintas, en el ( )% de los
casos se confiará en que el verdadero valor del parámetro está en

TEMA 3-CONCEPTOS BÁSICOS.. página 1


si lees esto me debes un besito
Nivel de significación

MÉTODOS PARA SACAR INTERVALO DE CONFIANZA (2)

(Lo único importante es entender un poco de qué trata)


Método pivote (A MANO): Consiste en obtener un estadístico que dependa de la muestra tomada y del
parámetro desconocido.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Se denotará estadístico pivote:

Requisitos:
a. Intervalo de confianza para
b. Muestra aleatoria normal en la que ambos parámetros son desconocidos
c. Tamaño n
Se utiliza como pivote la función:

Reservados todos los derechos.


Se conoce la distribución de este estadístico: , distrib. T-Student con "n-1" grados
libertad.

Lo que se quiere conseguir es la probabilidad de que el estadístico pivote esté entre esos extremos sea
el nivel de confianza fijado

Obtener I.C. (SPSS)

Pasos:
1. Introducir valores muestrales en el fichero de datos.
2. Comprobar que los datos se ajustan a una distribución normal.
3. Obtener I.C. para con SPPS: Analizar/Comparar medias/Prueba T de una muestra.. :

-Valor de prueba I.C=0


-Opciones: Porcentaje I.C (poner)
-Estimar tamaños de efecto opcional
quitarlo

Aceptar:

TEMA 3-CONCEPTOS BÁSICOS.. página 2


si lees esto me debes un besito
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4. Interpretación del resultado: Si se repitiese el experimento un gran número de
veces con muestras distintas, el (1- % de los casos se confiaría en que la media
está en ese rango.

ANALIZAR/COMPARAR MEDIAS/PRUEBA T DE UNA MUESTRA, sirve también para

Explicación:

-N (n): Tamaño muestral

Reservados todos los derechos.


-Media (muestral ): ESTIMACIÓN PUNTUAL !
-Desviación estándar (típica muestral, S)

-t: Valor estadístico pivote para


(se usará contrastes bilaterales)
-gl: Grados de libertad
-sig.(bilateral): (Se usará contrastes de
hipótesis bilaterales)

B.- CONTRASTES DE HIPÓTESIS


Consiste en confrontar dos posibles hipótesis (una y su contraria) y decidir con los datos muestrales cuál
de esas hipótesis damos por válida. Intervienen:
-Hipótesis nula (Ho): Es la que a priori damos por cierta. Mantendremos por válida hasta que los datos
no indiquen su falsedad.
-Hipótesis alternativa (H1): La que aceptaremos en caso de que los datos proporcionen evidencia de que
la hipótesis nula es falsa.

Tipos de contrastes:
solo puede ser igual y mayor/menor estricto!
Se puede dar

a. Contraste BILATERAL:

SPSS resuelve de manera directa: Sig.bilateral (UNILATERAL NO)

Curiosidad: ¿por qué bilateral?: Se llama así porque genera 2 colas poco probables:

TEMA 3-CONCEPTOS BÁSICOS.. página 3


b. Contrastes UNILATERALES Curiosidad: Unilateral porque solo da una
probabilidad de que sea lo contrario

SPSS No lo resuelve de manera directa, es necesario operar.

Error de contraste:

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tipos de errores:

-Error Tipo I : Rechazar Ho cuando es cierta.

-Error Tipo II: Aceptar Ho cuando es falso.

Observaciones:
-Es idóneo que la probabilidad de cometer estos errores fuesen lo más pequeñas posibles.

Reservados todos los derechos.


-Inconveniente: Cuando un error crece, el otro decrece.

RESOLUCIÓN CONTRASTES DE HIPÓTESIS

Enfoque clásico (no se usa): Calcular, a partir de los datos muestrales un estadístico que determina una
región crítica (regiones con poca probabilidad de que se den si la hipótesis nula es cierta), donde se
rechazaría la hipótesis nula y se aceptaría la alternativa.

Enfoque p-valor (SPSS): Denotación SPSS: Sig.


Se denomina p-valor o nivel crítico de un contraste al valor de más pequeño que haga que la muestra
observada nos indique que debe rechazar Ho.

Proceso:
1. Fijar nivel de significación ( )

2. Plantear correctamente el contraste que se quiere resolver:

3. Comprobar que la variable siga un modelo de distribución normal.

TEMA 3-CONCEPTOS BÁSICOS.. página 4


si lees esto me debes un besito
4. Resolver con SPSS el contraste y fijarnos en el p-valor ("sig") de modo que:

5. Escribir conclusión final: La muestra es compatible (o no) y por tanto se acepta (o no) la hipótesis
nula.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
COMPROBACIÓN DE QUE SIGUE UNA DISTRIBUCIÓN NORMAL

En el examen

IMPORTANTE COMPROBAR SI SIGUE UNA DISTR.NORMAL PARA CALCULAR I.C

Se comprueba resolviendo el siguiente contraste de hipótesis:


-Ho: Datos normales
-H1: Datos no normales

Reservados todos los derechos.


Pasos:
1. Analizar/Estadísticos descriptivos/explorar

2. Elegir el tipo de test que más conviene:


a. Kolmogorov-Smirnov : Muestras grandes (n 30)
b. Shapiro-Wilk: Muestras pequeñas (n 30)

3. Comprobar que:

TEMA 3-CONCEPTOS BÁSICOS.. página 5


si lees esto me debes un besito
OBJETIVOS TEMA 3: MÁS PROFUNDIZADO EN CADA APARTADO

APARTADOS

1. Media ( ) de una población normal:


a. Calcular I.C. (con y sin Prueba para una muestra con valor de prueba=0)
b. Resolver un contraste de hipótesis (unilateral, bilateral).
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)

2. Diferencias de medias de dos poblaciones (muestras) apareadas:


a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral).
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. Diferencia de medias de dos poblaciones normales independientes:
a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral)
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)

4. Proporción de éxito ( ) de una binomial:


a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral)
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)

5. Diferencia de proporciones de dos poblaciones binomiales independientes:

Reservados todos los derechos.


a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral)
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)

OBJETIVOS TEMA 3 página 1


si lees esto me debes un besito
1.- MEDIA DE UNA POBLACIÓN NORMAL P.G: Paso general para todo.

A. INTERVALO DE CONFIANZA

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Pasos:
1. Comprobar de que sigue una distribución normal:
a. Darán la tabla de prueba de normalidad
b. Decidir test a usar
c. Comparar p-valor (sig.) con
d. Se aceptará Ho (datos normales) si:
2. Si los datos son normales, obtener I.C.:
a. Analizar/Comparar medias/Prueba T de una muestra. < Ex.teórico no hace falta
b. Valor de prueba=0
c. Opciones/porcentaje del intervalo de confianza: Introducir (90,95,99..%)
d. En el examen darán la tabla, fijarse: Prueba para una muestra con valor de prueba=0
i. I.C.= (Inferior, superior).
e. EXCEPCIÓN EX.TEÓRICO: Si nos dan Prueba para una muestra con valor de prueba≠0
i. I.C.= (Inferior+ ,superior+ )

Reservados todos los derechos.


3. Interpretación: Si se repitiese el experimento un gran número de veces con muestras
distintas, el (..%) de los casos se confiaría en que la media está en ese rango.

B- CONTRASTE DE HIPÓTESIS BILATERAL


Pasos:
1. Comprobar de que sigue una distribución normal
2. Si los datos son normales, resolver el contraste que nos interesa:
a. Analizar/Comparar medias/Prueba T de una muestra
b. Valor de prueba=
c. Opciones/Porcentaje intervalo confianza: Introducir (90,95,99..%)
3. Prueba para una muestra: Sig.(bilateral)
a. Comparar con p-valor
b. Aceptar Ho si: , rechazar si:
4. Conclusión/interpretación.

C- CONTRASTE DE HIPÓTESIS UNILATERAL


Pasos:
1. Comprobar de que los datos siguen una distribución normal.
2. Si son normales, resolver el contraste de interés:
a. Analizar/Comparar medias/Prueba T de una muestra.
b. Valor de prueba=
c. Opciones/Porcentaje de confianza: Introducir (90,95,99..%)
3. Prueba para una muestra: Sig.(bilateral) <SPSS no resuelve unilateral.
a. Fijarse en t (distribución t-student) y gl (grados de libertad).
b. Como el contraste es unilateral, calculamos p-valor, con una probabilidad:

4. Calcular probabilidad (p-valor): Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T


5. Interpretación/conclusión

D- COMPROBAR UNA HIPÓTESIS SI NO DICEN QUÉ CONTRASTE USAR (CON I.C.)


Los contrastes y el I.C. están relacionados, así que, en vez de usar un contraste de hipótesis, se puede
comprobar también con I.C.
Recordar que había 3 técnicas (estimación puntual, I.C. y contraste de hipótesis).
Que nos digan con qué comprobarlo es para que vean que lo sabemos hacer.
Comprobar con I.C.: Si no se cumple que está en ese intervalo, se rechazará.

OBJETIVOS TEMA 3 página 2


DIFERENCIAS DE MEDIAS DE DOS MUESTRAS NORMALES APAREADAS
Tenemos una población en la que observamos dos variables (X e Y) donde ambas muestras siguen
una distribución normal.

Sus medias son desconocidas y queremos estimarlas para compararlas.


Objetivos:

Para ello tomamos dos muestras apareadas (apareadas: mismos sujetos para hacer mismas mediciones)

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Normalmente, este caso se utiliza para medir los efectos de algo antes y después
(= sujetos, = periodo de tiempo) < No siempre es así

Podemos obtener:
a. I.C. para

b. Contrastes de hipótesis
a. Bilateral:

b. Unilateral, formas:

Reservados todos los derechos.


A- INTERVALO DE CONFIANZA
Pasos:
1. Crear 2 variables en el fichero de datos.
2. Comprobar si ambas variables son normales:
a. Análisis/Estadísticos descriptivos/explorar
b. Lista de dependientes: Las dos variables.
c. Gráficos/activar: gráficos de normalidad con pruebas
d. Decidir tipo de test según el tamaño de la muestra y fijarse en "Sig."
e. Comparar con p-valor (Sig.)
f. Se dará por aceptada Ho si: , se rechazará si:

3. Si los datos son normales, obtener I.C. para


a. Analizar/Comparar medias/Prueba T de muestras emparejadas
b. Variables emparejadas: Añadir variables X e Y.
c. Opciones/Porcentaje intervalo de confianza: (90,95,99..%)
4. Nos fijamos en tabla: Prueba de muestras emparejadas
a. I.C. = (Inferior, superior)
5. Interpretación: Si se repitiese el experimento un gran número de veces con muestras distintas, el
(..%) de los casos se confiaría en que la media está en ese rango.

OBJETIVOS TEMA 3 página 3


si lees esto me debes un besito
B-CONTRASTE DE HIPÓTESIS: BILATERAL

1. Crear 2 variables en el fichero de datos.


2. Comprobar si ambas variables son normales
3. Si los datos son normales, proceder a resolver el contraste de hipótesis que nos interesa:
a. Analizar/Comparar medias/Prueba T de muestras emparejadas
b. Variables emparejadas: Añadir variables X e Y.
c. Opciones/Porcentaje intervalo de confianza: (90,95,99..%)
4. Nos fijamos en Prueba de muestras emparejadas.
a. Fijarnos en sig(bilat) -> p-valor.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
5. Comparar p-valor con

6. Interpretación.

C-CONTRASTE DE HIPÓTESIS: UNILATERAL


1. Crear 2 variables en el fichero de datos.
2. Comprobar si ambas variables son normales
3. Si los datos son normales, proceder a resolver el contraste de hipótesis que nos interesa:
a. Analizar/Comparar medias/Prueba T de muestras emparejadas
b. Variables emparejadas: Añadir variables X e Y.

Reservados todos los derechos.


c. Opciones/Porcentaje intervalo de confianza: (90,95,99..%)
4. Nos fijamos en Prueba de muestras emparejadas.
a. Como es un contraste unilateral, fijarse en t.
5. Obtener p-valor mediante una probabilidad:

Recordar que T sigue un modelo T-student con n-1 grados de libertad (gl).

6. Calcular probabilidad (p-valor): Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T


7. Conclusión/interpretación.

D- COMPROBAR UNA HIPÓTESIS SI NO DICEN QUÉ CONTRASTE USAR (CON I.C.)


Hacer todos los pasos para obtener un I.C.

Mirar el I.C. = (a,b)

Si

Conclusión.

OBJETIVOS TEMA 3 página 4


si lees esto me debes un besito
DIFERENCIA DE MEDIAS DE MUESTRAS APAREADAS
Queremos estudiar una variable en 2 subpoblaciones (muestras) distintas, las cuales pueden tener el
mismo o diferente tamaño muestral.
Tendríamos dos variables (variable de interés observada en 2 subpoblaciones) que siguen
distrib.normal

Queremos obtener:
-I.C. ( )
-contrastes de hipótesis (unilateral, bilateral)

Necesario:

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Comprobar si hay homogeneidad o heterogeneidad entre los sujetos usados.
Es decir: Resolver contraste de hipótesis:

INTERVALO DE CONFIANZA
1. Crear fichero de datos
a. Una variable con todas las observaciones (tanto de X como de Y)
b. Otra variable que nos indique a qué muestra pertenece cada dato (numérica)
c. Ejemplo:
Préstamos de cada entidad Entidad(es)

Reservados todos los derechos.


7000 1
8000 1
9000 2

2. Comprobar si los datos de las muestras son normales:


a. Analizar/estadísticos descriptivos/explorar:
i. Lista dependientes: Variables X e Y (los datos)
ii. Lista de factores (la variable que nos indique a qué muestra pertenece cada dato)
b. Gráficos: Gráficos de normalidad con pruebas.
3. Fijarnos en pruebas de normalidad
a. Depende del tamaño de la muestra, elegir test (puede ocurrir que una muestra haya que
mirarla en un test y la otra en otro)
b. Comparar con el p-valor de cada variable muestral (X e Y)

4. Si los datos son normales: Obtener I.C.:


a. Analizar/Comparar medias/Prueba T de muestras apareadas.
i. Variable de prueba (variable con los datos)
ii. Variable de agrupación (variable que indica a qué muestra pertenece cada dato)
1) Utilizar valores especificados
iii. Opciones: Porcentaje del intervalo de confianza.
5. Necesario resolver un contraste de hipótesis con anterioridad:

Fijarnos en"sig" (p-valor) de la prueba de Levane y comparar con

6. Fijarnos en el I.C. según si las varianzas son iguales o diferentes.


7. Interpretación.

OBJETIVOS TEMA 3 página 5


si lees esto me debes un besito
CONTRASTE DE HIPÓTESIS: BILATERAL
1. Todos los pasos del I.C., pero cuando se comprueba si las varianzas son iguales o diferentes, nos

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
servirá para elegir qué sig. (p-valor) coger.
2. Resolver el contraste:

3. Conclusión

CONTRASTE DE HIPÓTESIS: UNILATERAL


1. Todos los pasos del I.C., pero cuando se comprueba si las varianzas son iguales o diferentes, nos
servirá para elegir qué "t" coger.
2. Hacer una probabilidad según el tipo de contraste:

Reservados todos los derechos.


3. Resolver probabilidad sabiendo que sigue una distribución t-student
Con "n-1" grados de libertad.
4. Resolver probabilidad: Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T
5. Comparar p-valor con
6. Conclusión.

PROPORCIÓN DE ÉXITO EN UNA BINOMIAL (INFERENCIA SOBRE PROPORCIONES)


Tenemos una variable de estudio que sigue un modelo binomial con parámetro "p" desconocido
(proporción éxito desconocida).

Requisitos:
Tamaño muestral grande (puede caer como pregunta): Aunque la verdadera distribución es
binomial, este modelo da muchos problemas a nivel teórico, por lo que usamos el TCL aproximando la
variable de estudio a una normal, por eso se exige un tamaño de la muestra grande.

El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.

INTERVALO DE CONFIANZA
1) Confirmar que la muestra tiene un tamaño grande.
2) Crear fichero
a. Con la variable binaria (numérica), que toma solo los valores
b. Crear fichero con una variable llamada "frecuencia" (numérica): Número de veces que se
repite 0 y 1 en la muestra.
3) Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
a. Datos/Ponderar casos: Ponderar casos mediante (añadir variable frecuencia)
4) Obtener I.C.:
a. Analizar/Comparar medias/Proporciones de una muestra
i. Valores = (Valor éxito) = 1
ii. Intervalos de confianza:
1) Nivel de cobertura (90,95,99..%) <- Nivel de confianza.
2) Seleccionar tipo(s): Wald
5) Observar intervalos de confianza de proporciones de una muestra: I.C.
6) Interpretación.

OBJETIVOS TEMA 3 página 6


CONTRASTE DE HIPÓTESIS: BILATERAL
1. Confirmar que la muestra tiene un tamaño grande.
2. Crear fichero
a. Con la variable binaria (numérica), que toma solo los valores
b. Crear fichero con una variable llamada "frecuencia" (numérica): Número de veces que se
repite 0 y 1 en la muestra.
3. Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
a. Datos/Ponderar casos: Ponderar casos mediante (añadir variable frecuencia)
4. Resolver el contraste de hipótesis:
a. Analizar/Comparar medias/Proporciones de una muestra
i. Valores = (Valor éxito) = 1

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ii. Pruebas:
1) Seleccionar pruebas: Puntuación
2) Valor de prueba: Nivel de significación ( )
5. Observar Pruebas de proporciones de una muestra:
a. P de dos factores (p-valor)
6. Comparar ( ) con p-valor: Si
7. Conclusión.

CONTRASTE DE HIPÓTESIS: UNILATERAL


1. Confirmar que la muestra tiene un tamaño grande.
2. Crear fichero
a. Con la variable binaria (numérica), que toma solo los valores

Reservados todos los derechos.


b. Crear fichero con una variable llamada "frecuencia" (numérica): Número de veces que se
repite 0 y 1 en la muestra.
3. Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
a. Datos/Ponderar casos: Ponderar casos mediante (añadir variable frecuencia)
4. Resolver el contraste de hipótesis que nos interesa:
a. Analizar/Comparar medias/Proporciones de una muestra
i. Valores = (Valor éxito) = 1
ii. Pruebas…
1) Seleccionar pruebas: Puntuación
2) Valor de prueba: Nivel de significación ( )
5. Fijarse Pruebas de proporciones de una muestra (Z).
6. Calcular p-valor haciendo una probabilidad según el contraste:
Recordar que aquí sigue una distribución normal

Donde p sub0 es la probabilidad que queremos comprobar en el contraste (la del enunciado)
7. Resolver probabilidad: Transformar/calcular variable/CDF o CDF no centrada/Cdf.Normal(p, , )

8. Conclusión.

D- COMPROBAR UNA HIPÓTESIS SI NO DICEN QUÉ CONTRASTE USAR (CON I.C.)


1) Hacer todos los pasos para obtener un I.C
2) Comprobar si la probabilidad que nos dan en el enunciado es compatible o no con el contraste (Ho)
Es decir, mirar si la probabilidad es menor, mayor, o está entre ese intervalo.
3) Conclusión:
a. Si la probabilidad está entre ese intervalo: Compatible con Ho.
b. Si la probabilidad no está entre ese intervalo: No compatible con Ho.

OBJETIVOS TEMA 3 página 7


si lees esto me debes un besito
INFERENCIA ENTRE DOS POBLACIONES DE MUESTRAS INDEPENDIENTES
Tenemos 2 variables con ambas proporciones desconocidas y queremos compararlas

Requisito: Muestras grandes (las dos: n≥25)

El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.

A- INTERVALO DE CONFIANZA
1) Crear fichero de datos:
a. Una variable (cualitativa) que nos indique las muestras (grupos, colectivos..) Que hay.
b. Otra variable que sólo tome los valores 0 y 1 (fracaso y éxito).

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
c. La tercera variable: Frecuencia, indica cuántos elementos de cada muestra toman el valor 0 o
el valor 1.
2) Indicar SPSS que reconozca la variable "frecuencia" como las veces que se repite el valor 1 y 0.
a. Datos/Ponderar casos/Ponderar casos mediante: Frecuencia.
3) Antes de resolver I.C., hacer un previo contraste de hipótesis:

a. Analizar/comparar medias/Proporciones de muestras independientes


i. Variable de prueba: Variable que mide las proporciones a contrastar (Éxito, fracaso; 0,1)
ii. Definir éxito/Valores: 1 (éxito).
iii. Variable de agrupación: Variable que define los distintos grupos (Muestras X e Y)

Reservados todos los derechos.


iv. Definir grupos/Valores: Indicar los valores que definen a los distintos grupos.
v. Intervalos de confianza:
1) Nivel de cobertura: 90,95,99%.. ( , nivel de significación)
2) Tipos de intervalo: Wald.
vi. Pruebas/Test Type(s): Wald H0.
4) Fijarse en la tabla intervalos de confianza de proporciones de muestras independientes.
5) Interpretación.

B- CONTRASTE DE HIPÓTESIS: BILATERAL


1) Todos los pasos del intervalo de confianza, pero fijarse pruebas de proporciones de muestras
independientes: P de dos factores (p-valor)
2) Comparar con p-valor.

3) Conclusión.

C- CONTRASTE DE HIPÓTESIS: UNILATERAL


1) Todos los pasos del intervalo de confianza, pero fijarse en pruebas de proporciones de muestras
independientes: Valor Z.
2) Calcular p-valor mediante una probabilidad, recordando que sigue una distribución normal.
a. Según el tipo de contraste que sea:

3) Interpretación

OBJETIVOS TEMA 3 página 8


si lees esto me debes un besito
D- COMPROBAR UNA HIPÓTESIS SI NO DICEN QUÉ CONTRASTE USAR (CON I.C.)
1) Hacer todos los pasos para obtener un I.C
2) Comprobar si la probabilidad que nos dan en el enunciado es compatible o no con el contraste
(Ho)
Es decir, mirar si la probabilidad es menor, mayor, o está entre ese intervalo.
3) Conclusión:
a. Si la probabilidad está entre ese intervalo: Compatible con Ho.
b. Si la probabilidad no está entre ese intervalo: No compatible con Ho.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos.

OBJETIVOS TEMA 3 página 9


si lees esto me debes un besito
TENER EN CUENTA EN EL EXAMEN

Examen teórico: Tablas prueba de normalidad, de una muestra..


Las tablas pueden estar distribuidas por toda la hoja del examen, hay que buscarlas para

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
relacionarlas con el ejercicio o tal vez no están y sólo hay que dejar indicado cómo se haría.

Examen teórico: Comprobación de distribución normal:


-Pueden decirte directamente que es una distribución normal, y no haría falta comprobarlo.
-También pueden no decirte nada y por las hojas tiene que haber una tabla que ponga:
prueba de normalidad que coincida con el ejercicio.
-Si no dan tabla ni dicen nada, explicar cómo se comprobaría.

Examen teórico: Sacar un I.C.


Vamos a suponer que un intervalo de confianza: (X=Extr.inferior, Y=Extr.superior).
Hay dos opciones:
a. Tabla prueba para una muestra con valor de prueba = 0 : I.C.=(X,Y)
b. Tabla prueba para una muestra con valor de prueba = a (distinto 0) : I.C.=(a+X,a+Y)

Examen teórico: Comandos (Analizar/estadísticos descriptivos/explorar.. Etc.

Reservados todos los derechos.


Estos comandos no hay que ponerlos en el examen.

Examen teórico: Muestras apareadas


1) 1-n=gl : En el examen teórico es posible que no nos den n y no sepamos qué test coger.
En muestras independientes sí nos darán los tamaños muestrales.

Recordad: Contrastes unilaterales


<- La probabilidad, para calcularla, tiene que quedar con los símbolos así.

CONTRASTE DE HIPÓTESIS: Si piden contrastar, piden un contraste de hipótesis (NO I.C.)

OBJETIVOS TEMA 3 página 10


TEMA 4: INFERENCIA NO PARAMÉTRICAS
-Contraste de normalidad
Hay 3 tipos: -Test de independencia (Chi-cuadrado)
-Test de rachas

Inferencia no paramétrica: Métodos alternativos a los de inferencia paramétrica que no necesitan


conocer el modelo de distribución.
Se usará cuando sea imposible usar el método de inferencia paramétrica.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEST DE INDEPENDENCIA (CHI-CUADRADO)
Sirve para ver si dos variables están relacionadas o no (si son dependientes o independientes)

¿En qué se basa este test? :


Tenemos 2 variables (X e Y) y tenemos las observaciones de la muestra en una tabla de frecuencias
conjuntas. A partir de esa tabla, se compara el valor de la frecuencia observada con el valor que se
esperaría obtener de la frecuencia en el caso de que X e Y fuesen independientes.

Decisión:
-El estadístico Chi-Chuadrado mide la distancia que hay entre las frecuencias observadas (reales) y las

Reservados todos los derechos.


frecuencias esperadas (si las variables fueran independientes).
Por lo tanto: Aceptaremos Ho si la distancia es pequeña, y rechazaremos Ho si la distancia es grande.

Métodos
1) Chi-cuadrado de Pearson (Si se cumplen las condiciones
2) Test de razón de verosimilitud (Cuando no se cumplan las condiciones)

Condiciones para usar Chi-cuadrado de Pearson


1. N es, al menos, 5 veces superior al número de clases
a. Calculo:
2. Como mucho el 20% de las frecuencias esperadas son menores que 5.
a. Tabla: Pruebas de Chi-cuadrado, fijarse en el porcentaje.
i. "x casillas (…%) han esperado un recuento menor que 5."

Resolver contraste de independencia


1. Añadir datos al fichero (Datos X e Y en columnas del fichero separadas)
2. Obtener tabla Pruebas de Chi-cuadrado:
a. Analizar/ Estadísticos descriptivos/Tablas cruzadas:
i. Una variable (X o Y) pasarla a filas y la otra a columnas (no importa orden).
ii. Estadísticos: Chi-cuadrado
b. Comprobar condiciones para usar Chi-cuadrado de Pearson.
i. Si se cumplen condiciones: Significación asintótica (p-valor) de Pearson.
ii. Si no se cumplen las condiciones: Significación asintótica (p-valor) de Verosimilitud.
3. Comparar p-valor con
4. Conclusión.

RECORDATORIO: Xe Y son estadísticamente independientes si Nsubij era =


=(a la marginal de X* la marginal de Y )/2 <- forma para calcular Esub ij. (Valor que se esperaría)

TEMA 4 página 1
si lees esto me debes un besito
RESIDUOS ESTANDARIZADOS CORREGIDOS
Si se cumple que las variables son dependientes, este método da un indicador sobre la fuerza o potencia
de dicha asociación (dependencia).
-Es la diferencia entre una frecuencia observada y la frecuencia que se esperaba obtener si fuesen
independientes.

Pasos:
1. Nos interesa: Tabla cruzada variable X*variable Y.
a. SPSS: Analizar/estadísticos descriptivos/Tablas cruzadas:
i. Casillas: Residuo estandarizado corregido.
2. Escoger datos de dentro de la tabla según sean mayores que los números dependiendo de

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a. Si
b. Si
c. Si
3. Interpretación.

Interpretación
+ : En esa casilla hay más datos (frecuencia mayor) de los que se esperaban obtener si fuesen
independientes.
- : En esa casilla hay menos datos (frecuencia menor) de los que se esperaban obtener si fuesen
independientes.

El número del residuo según el nivel de significación se calcula con un cuartil:

Reservados todos los derechos.


SPSS: GL. Inversos /Normal.
Idf.Normal(p, media, desv. Típica.) = Idf.Normal (1-
p= 1-

-Estandarizar significa pasar todas las variables a una distribución normal tipificada.

TEMA 4 página 2
si lees esto me debes un besito
CONTRASTE DE ALETORIEDAD
*Si en el examen final nos dice que la muestra es aleatoria, no hace falta comprobarlo.

Nos permite estudiar si las observaciones muestrales son aleatorias o si por el contrario presentan algún patrón o
tendencia no aleatoria. (Hipótesis previa exigida en muchas técnicas estadísticas)

CONCEPTOS PREVIOS (Ex. Final)


-Definición de racha: Secuencia de elementos iguales.
-Definición de longitud: Número de elementos de una racha.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Contraste a resolver:

Se resuelve con el test de rachas:


1.- Crear fichero de datos
2.- Obtener tabla "Resumen de contraste de hipótesis".
SPSS: Analizar/Pruebas no paramétricas/Una muestra
a. Objetivo: Probar la aleatoriedad de una secuencia
b. Campos/Campos de prueba: (Variable que queremos ver si es aleatoria o no)
c. Configuración
a. Probar la aleatoriedad de la muestra/Opciones
i. Variable categórica, por tanto:

Reservados todos los derechos.


1) Sólo hay dos categorías de la muestra.
ii. Variable numérica, por tanto:
1) Definir punto de corte para campos continuos/Punto de corte=(….)
b. Opciones de prueba: Nivel de significación = (….)
3.- Comparar con p-valor. [Decisión: Nos dicen si aceptar o rechazar Ho (hipótesis nula)]
4.- Conclusión

Formas de identificar que te preguntan la aleatoriedad:


a. Que nos pregunten si sigue una tendencia o patrón.
b. Si nos dan un valor de referencia (media) = Punto de corte.
c. Que nos digan comprobar aleatoriedad.

Cosas a tener en cuenta:


a. Si no nos dicen nada con respecto al punto de corte (o valor de referencia) usamos la mediana
(media muestral), que viene marcado por defecto.

TEMA 4 página 3
si lees esto me debes un besito
TEMA 5 - ANÁLISIS DE LA VARIANZA

ANOVA

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tiene como objetivo entender el contraste de igualdad de medias en muestras independientes al caso en
que el factor tiene más de dos niveles o categorías (toma +2valores).

-Necesitamos un método que nos permita resolver el problema en un solo contraste, ya que si hacemos
varios se presentan 2 inconvenientes:
a. Conlleva resolver varios contrastes (mayor número de categorías del factor, mayor número de
contrastes a resolver).
b. Error tipo I, ya que con cada contraste el error va aumentando (es acumulativo).

-3 tipos de variación:
1. Variabilidad dentro del grupo: Variación de los datos dentro de un mismo grupo. No son atribuibles al
factor.
Se estima con un estimador puntual = Varianza residual

Reservados todos los derechos.


2. Varianza entre grupos: Variación de los datos por distintos grupos.
Se estima con un estimador puntual = Varianza explicada

3. Variación total: Variabilidad de todos los datos en total, sin distinguir por grupos.
Se estima con un estimador = Varianza total

Se puede comprobar que:

*Importante: En el examen teórico pueden


pedir rellenar la tabla teórica
(SUELEN HACERLO)

TERMINOLOGÍA ANOVA:
a. Variable dependiente: Variable cuantitativa a la que se le quiere estudiar si su media es igual o no.
b. Factor: Variable cualitativa que queremos ver si influye o no sobre la variable de estudio.
c. Tratamiento/nivel del factor: Distintos valores que puede tomar el factor (grupo)
Para cada tratamiento se utiliza una muestra.
d. Diseño balanceado/equilibrado: Si todas las muestras tienen = tamaño/nivel.
e. Modelo de efectos fijos: Tratamientos se fijan de antemano. (el que vamos a estudiar)
f. Modelo de efectos aleatorios: Muestra aleatoria entre todos los tratamientos posibles.

TEMA 5 página 1
REQUISITOS PARA USAR ANOVA:
ALEATORIEDAD
(Variables aleatorias o no): Se resuelve con el test de rachas.

SPSS: Analizar/Prueba no paramétrica/Una muestra: TABLA: RESUMEN CONTRASTE HIPÓT.


a. Objetivo: Aleatoriedad de 1 secuencia.
b. Campos: La variable a estudiar (residuo* o variable).
c. Configuración: Probar aleatoriedad de una secuencia.
De forma gráfica (examen teórico nos pueden pedir comprobar aleatoriedad con el gráfico)

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo:

<- Como no hay ningún patrón significativo, significa que el


gráfico funciona de manera aleatoria.

NORMALIDAD
(Variables normales o no): Se resuelve con el contraste de normalidad.

Reservados todos los derechos.


SPSS: Analizar/estadísticos descriptivos/Explorar TABLA: PRUEBA DE NORMALIDAD
a. Gráficas: Normalidad con pruebas.

HOMOCEDASTICIDAD
(Varianzas iguales o no): Se resuelve con el test del Edén.

SPSS: Analizar/Comparar medias/ANOVA de 1 factor: TABLA: PRUEBA HOMOGENEIDAD VARIANZAS


a. Dependiente: Cuantitativa.
b. Factor: Cualitativa.
c. Opciones: Prueba homogeneidad de varianzas.

De forma gráfica (en el examen teórico nos puede caer)


Ejemplo:

<- Se tendría que ver si entre los puntos hay una anchura constante o si
se va disminuyendo/aumentando conforme avance la gráfica
(hace forma de embudo o no)

CONSEJO: DEJAR ALEATORIEDAD PARA LO ÚLTIMO, NUNCA SERÁ ACEPTADO H1.

TEMA 5 página 2
si lees esto me debes un besito
OBTENER RESIDUOS:
SPSS: Analizar/Modelo lineal general/Univariable
1. Fijos: Cualitativa.
2. Dependientes: Cuantitativa.
3. Guardar: Residuos no estandarizados

SE PUEDEN USAR EN NORMALIDAD Y ALEATORIEDAD (HOMOCEDASTICIDAD NO)

ANOVA:
Si se cumplen los requisitos se puede usar el método ANOVA.
Nos interesa resolver en el siguiente contraste:

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Con ANOVA al darse que se cumple que siguen una distribución normal podemos ver si hay diferencias
significativas entre las medias o no, ya que si se cumplen significa que las medias son muy representativas.

SPSS: Analizar/Comparar medias/ANOVA de un factor:


a. Dependientes: Cuantitativa.
b. Factor: Cualitativa.
Fijarse en el p-valor.

Si se acepta Ho (Fin del ejercicio).

Reservados todos los derechos.


Si se acepta H1 (Significa que hay un tratamiento que difiere del resto, y se puede saber cuál es)
-Para ello hay que realizar un análisis comparativo múltiple (2 a 2).

ANÁLISIS COMPARATIVO MÚLTIPLE (2 a 2) ANOVA ANÁLISIS POST-HOC.


Métodos:
a. DMS: Diseño no balanceado.
b. Tukey: Diseño balanceado.
c. Dunnett: (Se puede resolver con uno de los otros dos).

SPSS: Analizar/Comparar medias/ANOVA de un factor.


a. Dependiente: Cuantitativa.
b. Factor: Cualitativa.
c. Post-Hoc: Relacionar método que nos interese (DMS o Tukey)

-Nos darán una tabla relacionando los tratamientos (grupos) y con un p-valor.
(Para no ir repitiendo el contraste de ANOVA todo el rato decir:
Compararemos con el contraste que nos interesa los tratamientos 2 a 2.)
a. Con el contraste podremos decir si hay diferencias significativas o no.
b. Con el I.C. podremos decir qué media es mayor/menor de los dos tratamientos.

TEMA 5 página 3
si lees esto me debes un besito
KRUSKALL-WALLIS
Método no paramétrico para resolver un contraste si se incumplen los requisitos para usar ANOVA.

Contraste a resolver:
Ho: Distribuciones similares en su tendencia central.
H1: Alguna distribución difiere del resto
(No se comparan las medias ya que las medias no son representativas. (no sigue distrib.normal)
(Solo copiar el contraste 1 vez, basta con decir que resolveremos este contraste de 2 a 2 para cada apartado.

SPSS: Analizar/Pruebas no paramétricas/Muestras independientes


a. Objetivo: Comparar distribución entre grupos

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
b. Campos: Campo de prueba(Cuantitativo), grupos (cualitativo).
c. Configuración: Personalizar pruebas: ANOVA de 1 factor Kruskall-Wallis.

Si aceptamos Ho: Fin del ejercicio.


Si aceptamos H1: Realizar una comparación múltiple para ver qué tratamiento/s difiere del resto.

Dejar aleatoriedad para el final (no va a ser aceptado H1)

ANÁLISIS COMPARATIVO (2 a 2) KRUSKALL-WALLIS


(Se da junto al método Kruskall-Wallis)
Tabla: Comparaciones por parejas (variable cualitativa).

Se comparan los p-valor para decir si hay diferencias significativas o no entre cada tratamiento.

Reservados todos los derechos.


Tabla: Prueba de Kruskall-Wallis para muestras independientes (DIAGRAMA DE CAJAS Y BIGOTES):
Nos fijaremos en qué tratamiento está más alto que el otro que nos preguntan para responder cuál es
mayor que el otro. (Como el I.C. en ANOVA pero caja y bigotes en Kruskall-Wallis.)

IDENTIFICACIÓN DE VALORES ATÍPICOS


Diagrama de cajas y bigotes:

SPSS: Gráficos/Cuadro de gráficos de diálogo antiguo/Diagrama de cajas (simple).


a. Variable (cuantitativa)
b. Eje de categoría (cualitativa)

Si el valor atípico sale que es el número X, buscar en el fichero de datos cuál es y decir que es la variable
(que le toque en el cuantitativo) y que pertenece al tratamiento (…)

TIP: Si se incumple alguna condición, decid que usaríamos Kruskall-Wallis pero que comprobaremos
todas las hipótesis por si hay algún error, y explicar cómo se haría ANOVA.

TEMA 5 página 4
si lees esto me debes un besito
TEMA 6: MODELO DE REGRESIÓN LINEAL

INTRODUCCIÓN MODELO DE REGRESIÓN LINEAL

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Análisis de regresión: Técnica que pretende explicar o predecir el comportamiento de una variable Y
mediante un conjunto de variables independientes.

Variables:
a. Y: DEPENDIENTE
b. X: INDEPENDIENTE

Tipos de modelos:
a. Regresión simple: Modelo si tenemos una única variable independiente para predecir el
comportamiento de la variable dependiente.
b. Regresión múltiple: Modelo si tenemos +1 variable independiente para predecir el comportamiento
de la variable dependiente.

Regresión simple: Regresión múltiple:

Reservados todos los derechos.


Los modelos económicos son de tipo aleatorio y siempre existe un error ( ) entre los valores estimados y
reales.
----
Ejemplo:
-Consumo de un país:

-Con la perturbación económica:

OBJETIVOS
1. Estimar los parámetros desconocidos del modelo (B0 y B1)
2. Comprobar si el modelo es adecuado

ETAPAS
1. Especificación: Determinar variable dependiente, seleccionar independientes y elegir modelo.
2. Estimación de la mejor función que se ajusta a los datos.
3. Validación: Comprobar si la ecuación ayuda
4. Aplicación: Estudiar las relaciones entre las variables, predecir…

MODELO DE REGRESIÓN LINEAL SIMPLE Función:

1. (e): Perturbación (aleatoria)


2. Y: Variable dependiente (aleatoria)
3. X: Variable independiente (no es aleatoria, se fija por el investigador)
4. Coeficientes de regresión:
a. Bo: Término independiente (constante). -> cuando x=0
b. B1: Pendiente. -> Cambio en la producido por 1ud+ en X.

OBJETIVO
Estimar coeficientes B0 y B1 de modo que nos proporcione el mejor modelo lineal.

TEMA 6 (ex.f página 1


MÉTODO: Mínimos cuadrados

REQUISITOS MÉTODO:
Todo comprobado con residuos.
1. Normalidad de residuos.
2. Linealidad: Relación entre las variables de tipo lineal.
3. Homocedasticidad: Varianza residuos constante.
4. No autocorrelación: Residuos independientes entre sí.

Si se incumplen: Modelo no estable.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
CALCULO DE RESIDUOS, NO AUTOCORRELACIÓN Y HOMOCEDASTICIDAD
Al crear residuos ya podemos obtener datos para comprobar: No autocorrelación y Homocedasticidad

NO AUTOCORRELACIÓN -> Estadístico Durbin-Watson (DW)


TABLA: RESUMEN DEL MODELO ^b
a. Si DW toma valores entre (1.5 , 2.5), se cumple la no autocorrelación (residuos indep.)

HOMOCEDASTICIDAD -> Gráfico de dispersión


TABLA: Gráfico de dispersión

NORMALIDAD

Reservados todos los derechos.


Comprobación gráfica: Gráfico Q.Q -> Datos normales= Nube de puntos cercana a la línea recta.
TABLA: PRUEBA DE NORMALIDAD -> ESTANDARIZED RESIDUAL (P-valor)

LINEALIDAD

Comprobación gráfica: Gráfico residuos estandarizados frente valores estimados estandarizados.


(Nube de puntos paralela al eje horizontal)
TABLA: TABLA DE ANOVA -> ENTRE GRUPOS: DESVIACIÓN DE LA LINEALIDAD: SIG. (P-valor)

INTERPRETACIÓN DE COEFICIENTES (B1) : TANTO SIMPLE COMO MÚLTIPLE


Según el símbolo:
a. B1<0 (-) : Relación lineal inversa (a mayor X, menor Y y viceversa)
b. B1>0 (+) : Relación lineal directa (a mayor X, mayor Y)

Según el número que indique:


a. B1= a: Por cada aumento en un 1% en la tasa de interés, el número medio de Y (desciende si es negativo
o aumenta si es positivo) a.

TEMA 6 (ex.f página 2


si lees esto me debes un besito
¿ES SIGNIFICATIVA LA REGRESIÓN LINEAL?: CONTRASTE DE SIGNIFICACIÓN DE LA REGRESIÓN
Se puede preguntar de más formas:
a. ¿Podemos considerar pendiente nula?
b. ¿Es significativo el modelo?
c. ¿Es significativa la variable Y?

Si B1≠0, la variable dependiente es significativa.


TABLA: COEFICIENTES -> SIG.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
¿PODRÍAMOS CONSIDERAR LA CONSTANTE NULA? (Término independiente)
Resolver contraste:

Sería no nula si fuese significativa (B0≠0) , porque sino podríamos realizar el modelo sin esa variable.

BONDAD DEL AJUSTE


Mide qué fiabilidad tiene el modelo como para hacer predicciones.
Se mide con 2 medidas:
VARIANZA RESIDUAL ( ):
Mide cómo se desvían los valores pronosticados del verdadero valor.

Reservados todos los derechos.


Residuos: Diferencia entre el valor que tenemos y el verdadero valor.

TABLA ANOVA^a : Columna media cuadrática correspondiente al residuo.

Para interpretarla: Error estándar de regresión (desviación típica): Varianza residual al cuadrado ( )

INTERPRETAR BONDAD DEL AJUSTE: Decid:


La varianza residual nos mide la tendencia a desviarnos del verdadero valor de la variable si usamos la recta
para predecir. Si el error estándar es pequeño, significa que la resta tiende a desviarse poco y sería buen
estimador.

COEFICIENTE DE DETERMINACIÓN (R2)


Mide el % de variabilidad en la variable dependiente que queda explicado por la variable independiente.
Toma valores entre (0≤R2≤1), donde:
a. Valor = 0 : 0% Fiable.
b. Valor = 1: 100% Fiable.
(El dato pasarlo a porcentaje)

TABLA: Resumen del modelo -> R^2


Interpretación: La (variable X) explica en un (%) la variabilidad de la variable Y si usamos el modelo obtenido.

TEMA 6 (ex.f página 3


si lees esto me debes un besito
PREDICCIONES
El objetivo que se persigue con la regresión es hacer predicciones cuando concluimos que el modelo es
bueno, por tanto:
Queremos predecir el valor que tomaría la variable dependiente para un determinado valor de la variable
independiente.

TIPOS DE PREDICCIONES:
a. Estimador puntual (valor aproximado)
b. Estimación por intervalos

Denotación:
Estimación puntual: Estimación por intervalos:

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Fichero de datos:
a. PRE_1: Estimación puntual.
b. MCI_1 y UMC_1 : Valores para el intervalo (MCI_1 , UMC_1)

MODELO DE REGRESIÓN LINEAL MÚLTIPLE Función:

Es cuando disponemos de +1 variable independiente (X1, X2,X3..) para explicar la variable dependiente (Y)
(Diferencia entre simple y múltiple: Se puede ver qué variable tiene más peso para Y)

MÉTODO: Mínimos cuadrados


CONDICIONES:
NORMALIDAD

Reservados todos los derechos.


Test de normalidad con residuos.
TABLA: PRUEBA DE NORMALIDAD -> ESTANDARIZED RESIDUAL (P-valor)

ALEATORIEDAD (no autocorrelación)


Con DW: (1.5 , DW , 2.5)
(En el examen podemos poner sólo aleatoriedad en vez de no correlación)
TABLA: RESUMEN DEL MODELO -> DURBIN-WATSON

HOMOCEDASTICIDAD
Comprobar que no tenga forma embudo
TABLA: GRÁFICO DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)

LINEALIDAD
a. Gráfico de dispersión: Que las observaciones sean paralelas al eje X.
TABLA: GRÁFICOS DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)
b. Gráficos de dispersión parcial: Gráficos de dispersión de la variable dependiente con cada una de las
variables independientes. (debe apreciarse relación lineal)
TABLA: GRÁFICOS DE REGRESIÓN PARCIAL (VARIABLE Y/ VARIABLE X1,X2..)

NO MULTICOLINEALIDAD
Que las variables no aporten información parecida entre sí (que no haya una relación fuerte entre las
variables independientes).
a. Se mide con el coeficiente de "inflación de la varianza" (VIF) que debe ser VIF<10 para cada v.indep.
a. Si sale VIF>10: Alguna variable superpone a la otra y significa que estamos metiendo info 2 veces
TABLA: COEFICIENTES -> ESTADÍSTICOS DE COLINEALIDAD -> VIF

TEMA 6 (ex.f página 4


si lees esto me debes un besito
¿VARIABLE CON MAYOR IMPORTANCIA/RELEVANCIA DEL MODELO?
(Interpretar coeficiente de significación de estandarizados)
Buscar qué coeficiente tiene más peso.

No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TABLA: COEFICIENTES ESTANDARIZADOS -> BETA

DE CARA AL EXAMEN FINAL:


- Si no nos piden hipótesis para la regresión no hace falta comprobarlo
- Valores atípicos:
a. Sale una TABLA: DIAGNÓSTICO POR CASO: Numero de caso (si no hay no saldría tabla)
b. Valor atípico cuando el residuo estandarizado es: |a|>3

Reservados todos los derechos.

TEMA 6 (ex.f página 5

También podría gustarte