Wuolah Free RESUMENES ESTADISTICA AV COMPLETOS 1 PDF

MODELO DE DISTRIBUCIONES
REPASO MODELOS página 1

Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
REPASO MODELOS página 2
si lees esto me debes un besito
CÁLCULO PROBABILIDADES Y PERCENTILES
1.- PASOS
a- Introducir un valor cualquiera en el fichero de datos (para poder usar la calculadora)
b- Seleccionar: Transformar/Calcular variable.
c- Variable objetivo: Nombre de la variable del cálculo.
c.2- Expresión numérica: Realización del cálculo (DECIMALES SIEMPRE CON PUNTO).
Solución: Vista de datos.
2.- GRUPO DE FUNCIONES (GF)
->2.1- Probabilidad puntual (Modelos discontinuos)
GF ->2.2- Probabilidad acumulativa (Modelos continuos/discontinuos)
->2.3- Percentiles (Modelos continuos)
2.1- PROBABILIDAD PUNTUAL/EXACTA
MODELOS CONTINUOS:
B- MODELOS DISCONTINUOS: Sirve para Binomial y Poisson.

-Pasos:
a-PDF y PDF no centrada.

b-PDF Binomial / PDF Poisson.
c-Introducir: Valor y parámetros:
Ejemplo 1 (Binomial): Ejemplo 2 (Poisson):
2.2- PROBABILIDAD ACUMULADA (FUNCIÓN DISTRIBUCIÓN)
A- MODELOS DISCRETOS
-Pasos:
a- Grupo de funciones: CDF y CDF no centrada
b- Funciones y variables especiales: Valen todos los modelos en esta probabilidad.
TRANSFORMAR PROBABILIDADES A:
-Complementario
-Transformaciones
-Importante:
PROB Y PERC -BYN página 1

B- MODELOS CONTINUOS (No importan los símbolos de las propiedades, pero se busca ≤)
-Tipos de modelos: Uniforme, exponencial, normal, Chi cuadrado (chiq.), t.student (T), F.Snedecor(F)
-Pueden preguntar
2.3- PERCENTILES (Continua)
EX: Se preguntarán modo pregunta
-Pasos:
a- GL Inversos
b- Modelo continuo que sea
PROB Y PERC -BYN página 2

TEMA 1: VARIABLES ALEATORIAS INDEPENDIENTES
RESUMEN TEMA 1 - VARIABLES ALEATORIAS INDEPENDIENTES página 1

TEMA 2: MUESTRAS Y ESTADÍSTICOS
Se estudiarán las nociones básicas para: Inferencia estadística.
1-INFERENCIA ESTADÍSTICA
Tiene como objetivo estimar una característica de interés (media, varianza, desviación
típica…) de la población de estudio que por su tamaño, es inviable estudiarla por
completa.
Se estudia la población a partir de la información obtenida de una muestra.
1.1-ELEMENTOS INFERENCIA ESTADÍSTICA

A.POBLACIÓN (N)
Conjunto de individuos sobre el que estamos interesados en estudiar una o varias
características.
Un parámetro poblacional describe a la población:
-Parámetro media poblacional
-P. desviación típica poblacional
-P. varianza poblacional
-Proporción poblacional
B.MUESTRA (n)
Subconjunto de elementos de la población sobre el que realmente hacemos las
observaciones.
Un estadístico es una función construida exclusivamente con valores muestrales que
describe a la muestra:

-Media muestral
-Desviación típica muestral
-Varianza muestral
-Proporción muestral
Para la inferencia estadística se utilizan
1.2MÉTODOS PARA CALCULAR INFERENCIA ESTADÍSTICA

A.INFERENCIA PARAMÉTRICA
Se conoce el modelo de distribución de la población (normal/binomial) pero se desconocen algunos de
sus parámetros.
Objetivo: Estimar el valor de dichos parámetros con los datos de la muestra.
(!!Solo aplicar estos métodos si se conoce que el modelo es normal o binomial!!)
Modelos paramétricos -------------------(si no se puede)----------> Modelos no paramétricos

(opción más precisa para estimar) (datos menos fiables, alternativa)
B.INFERENCIA NO PARAMÉTRICA
No requieren conocer la forma funcional de la distribución de la población.
Permite:
-Estudiar parámetros poblacionales cuando se incumple que no es modelo de distrib. Normal)
-Estudiar otras características de la población (Ej: Ver si son variables independientes o dependientes…)
TEMA 2 página 1
A.1-TÉCNICAS PARAMÉTRICAS
Queremos estudiar una v.a de una población.
Sabemos que
Métodos:
a-Estimación puntual (peor estimación): Valor concreto para estimar el parámetro de la población.
b-Intervalos de confianza: Intervalos (rango de valores).
c-Contrastes de hipótesis: Trata de decidir si la muestra apoya o no una afirmación sobre el parámetro
poblacional desconocido. (Permite comprobar si una hipótesis sobre el parámetro es cierta o no).
a- Estimación puntual
Objetivo: Asignar valor concreto a un parámetro poblacional a partir de los datos que obtenemos de una
muestra.
Para poder hacerlo necesitamos:
Un estimador: Es un estadístico de un parámetro poblacional que toma valores admisibles para el
parámetro desconocido, es decir, que cumple buenas propiedades.

Ej estimador: Media=0.5 tendría buenas propiedades si hablamos del modelo binomial ya que esta entre
(0,1).
Estimadores más usuales son:

a- Estimador puntual de la media (media muestral)
b-Estimador puntual de la varianza (varianza muestral)
c-Estimador puntual de una proporción
A- ESTIMADOR PUNTUAL Propiedades

a- ERROR ESTIMACIÓN PUNTUAL: ERROR CUADRÁTICO MEDIO (ECM) media/varianza 1er año
El inconveniente de la estimación puntual es que, si cambias de muestra en una misma población, se
obtiene un valor diferente.
Por tanto necesitamos calcular algo que estime más o menos a cuanta distancia está nuestro valor
estimado del real.
Error cuadrático medio (ECM)

Notación:
: Parámetro poblacional a estudiar de manera general (sin especificar qué parámetro es).
: Estimador del parámetro poblacional.
Fórmula:
TEMA 2 página 2
b- PROPIEDADES DESEABLES BUEN ESTIMADOR
1-Suficiencia: Recoger la máxima información sobre el parámetro de la muestra.

2-Insegadez: Un parámetro es insegado si, a largo plazo, no se desvía del verdadero
valor del parámetro.
Si el sesgo = 0 -> Estimador insegado >
Si el sesgo ≠ 0 -> Estimador sesgado > DESCARTADO.
3-Eficiencia: Entre todos los estimadores insegados, nos interesa el más eficiente.
1· Nos quedamos con el que tenga menos ECM.
2· Si hay varios con =ECM, nos quedamos con el que menor varianza tenga.
Si el estimador es insegado: <- SIEMPRE.
Varianza mínima:

4-Consistencia: Se mejora la estimación contra más datos tengamos.
Es consistente si se cumple estas dos condiciones:
Si es insegado siempre se cumple la 1ra condición.
TEMA 2 página 3
TEMA 3: ESTIMACIÓN POR INTERVALOS DE CONFIANZA Y ESTIMACIÓN DE HIPÓTESIS
Objetivo: Estudiar parámetros

Requisitos: Conocer el modelo de distribución de nuestra variable de interés
Variable de interés
TÉCNICAS: Intervalos de confianza y contraste de hipótesis
NO se utiliza estimación puntual por las siguientes causas:
a. Cambio de muestra = Estimación diferente
b. No se puede determinar EXACTAMENTE el valor del error
Lo que hacemos en la estimación puntual es quedarnos con el estimador que tiene menor error
cuadrático medio. Por tanto, desconocemos si el valor estimado del error se encuentra cerca (o no) del
verdadero valor del parámetro.
Alternativas: Otras técnicas que nos permitan cuantificar el error cometido en la estimación. Son:

A.- INTERVALOR DE CONFIANZA (I.C)
Se busca un rango de valores admisibles para el parámetro, con un nivel de confianza conocido.
Construiremos, a través de las muestras, un intervalo [a,b] de manera que ofrezca unas garantías.
Además se pretenderá que el intervalo sea de amplitud mínima.
Fórmula:
Nivel de confianza: Garantía de que el verdadero valor esté en ese intervalo.

(Donde normalmente es pequeño)
Se trabaja con
El nivel de confianza va relacionado con la amplitud del intervalo:

-Trabajar a un 99% de confianza = Intervalo + grande.
-A un 95% = Nivel de confianza + preciso = Intervalo +/- grande. (normal).
Interpretación nivel confianza:

Si repetimos el experimento un gran número de veces con muestras distintas, en el ( )% de los
casos se confiará en que el verdadero valor del parámetro está en
TEMA 3-CONCEPTOS BÁSICOS.. página 1

Nivel de significación
MÉTODOS PARA SACAR INTERVALO DE CONFIANZA (2)
(Lo único importante es entender un poco de qué trata)

Método pivote (A MANO): Consiste en obtener un estadístico que dependa de la muestra tomada y del
parámetro desconocido.
Se denotará estadístico pivote:
Requisitos:
a. Intervalo de confianza para
b. Muestra aleatoria normal en la que ambos parámetros son desconocidos
c. Tamaño n
Se utiliza como pivote la función:

Se conoce la distribución de este estadístico: , distrib. T-Student con "n-1" grados
libertad.
Lo que se quiere conseguir es la probabilidad de que el estadístico pivote esté entre esos extremos sea
el nivel de confianza fijado
Obtener I.C. (SPSS)
Pasos:
1. Introducir valores muestrales en el fichero de datos.
2. Comprobar que los datos se ajustan a una distribución normal.
3. Obtener I.C. para con SPPS: Analizar/Comparar medias/Prueba T de una muestra.. :
-Valor de prueba I.C=0

-Opciones: Porcentaje I.C (poner)
-Estimar tamaños de efecto opcional
quitarlo
Aceptar:

4. Interpretación del resultado: Si se repitiese el experimento un gran número de
veces con muestras distintas, el (1- % de los casos se confiaría en que la media
está en ese rango.
ANALIZAR/COMPARAR MEDIAS/PRUEBA T DE UNA MUESTRA, sirve también para
Explicación:
-N (n): Tamaño muestral

-Media (muestral ): ESTIMACIÓN PUNTUAL !
-Desviación estándar (típica muestral, S)
-t: Valor estadístico pivote para

(se usará contrastes bilaterales)
-gl: Grados de libertad
-sig.(bilateral): (Se usará contrastes de
hipótesis bilaterales)
B.- CONTRASTES DE HIPÓTESIS

Consiste en confrontar dos posibles hipótesis (una y su contraria) y decidir con los datos muestrales cuál
de esas hipótesis damos por válida. Intervienen:
-Hipótesis nula (Ho): Es la que a priori damos por cierta. Mantendremos por válida hasta que los datos
no indiquen su falsedad.
-Hipótesis alternativa (H1): La que aceptaremos en caso de que los datos proporcionen evidencia de que
la hipótesis nula es falsa.
Tipos de contrastes:
solo puede ser igual y mayor/menor estricto!
Se puede dar
a. Contraste BILATERAL:
SPSS resuelve de manera directa: Sig.bilateral (UNILATERAL NO)
Curiosidad: ¿por qué bilateral?: Se llama así porque genera 2 colas poco probables:

b. Contrastes UNILATERALES Curiosidad: Unilateral porque solo da una
probabilidad de que sea lo contrario
SPSS No lo resuelve de manera directa, es necesario operar.
Error de contraste:
Tipos de errores:
-Error Tipo I : Rechazar Ho cuando es cierta.
-Error Tipo II: Aceptar Ho cuando es falso.
Observaciones:
-Es idóneo que la probabilidad de cometer estos errores fuesen lo más pequeñas posibles.

-Inconveniente: Cuando un error crece, el otro decrece.
RESOLUCIÓN CONTRASTES DE HIPÓTESIS
Enfoque clásico (no se usa): Calcular, a partir de los datos muestrales un estadístico que determina una
región crítica (regiones con poca probabilidad de que se den si la hipótesis nula es cierta), donde se
rechazaría la hipótesis nula y se aceptaría la alternativa.
Enfoque p-valor (SPSS): Denotación SPSS: Sig.

Se denomina p-valor o nivel crítico de un contraste al valor de más pequeño que haga que la muestra
observada nos indique que debe rechazar Ho.
Proceso:
1. Fijar nivel de significación ( )
2. Plantear correctamente el contraste que se quiere resolver:
3. Comprobar que la variable siga un modelo de distribución normal.

4. Resolver con SPSS el contraste y fijarnos en el p-valor ("sig") de modo que:
5. Escribir conclusión final: La muestra es compatible (o no) y por tanto se acepta (o no) la hipótesis
nula.
COMPROBACIÓN DE QUE SIGUE UNA DISTRIBUCIÓN NORMAL
En el examen
IMPORTANTE COMPROBAR SI SIGUE UNA DISTR.NORMAL PARA CALCULAR I.C
Se comprueba resolviendo el siguiente contraste de hipótesis:

-Ho: Datos normales
-H1: Datos no normales

Pasos:
1. Analizar/Estadísticos descriptivos/explorar
2. Elegir el tipo de test que más conviene:

a. Kolmogorov-Smirnov : Muestras grandes (n 30)
b. Shapiro-Wilk: Muestras pequeñas (n 30)
3. Comprobar que:

OBJETIVOS TEMA 3: MÁS PROFUNDIZADO EN CADA APARTADO
APARTADOS
1. Media ( ) de una población normal:

a. Calcular I.C. (con y sin Prueba para una muestra con valor de prueba=0)
b. Resolver un contraste de hipótesis (unilateral, bilateral).
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)
2. Diferencias de medias de dos poblaciones (muestras) apareadas:

a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral).
3. Diferencia de medias de dos poblaciones normales independientes:
a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral)
4. Proporción de éxito ( ) de una binomial:

a. Calcular I.C.
5. Diferencia de proporciones de dos poblaciones binomiales independientes:

a. Calcular I.C.
OBJETIVOS TEMA 3 página 1

1.- MEDIA DE UNA POBLACIÓN NORMAL P.G: Paso general para todo.
A. INTERVALO DE CONFIANZA
Pasos:
1. Comprobar de que sigue una distribución normal:
a. Darán la tabla de prueba de normalidad
b. Decidir test a usar
c. Comparar p-valor (sig.) con
d. Se aceptará Ho (datos normales) si:
2. Si los datos son normales, obtener I.C.:
a. Analizar/Comparar medias/Prueba T de una muestra. < Ex.teórico no hace falta
b. Valor de prueba=0
c. Opciones/porcentaje del intervalo de confianza: Introducir (90,95,99..%)
d. En el examen darán la tabla, fijarse: Prueba para una muestra con valor de prueba=0
i. I.C.= (Inferior, superior).
e. EXCEPCIÓN EX.TEÓRICO: Si nos dan Prueba para una muestra con valor de prueba≠0
i. I.C.= (Inferior+ ,superior+ )

3. Interpretación: Si se repitiese el experimento un gran número de veces con muestras
distintas, el (..%) de los casos se confiaría en que la media está en ese rango.
B- CONTRASTE DE HIPÓTESIS BILATERAL

Pasos:
1. Comprobar de que sigue una distribución normal
2. Si los datos son normales, resolver el contraste que nos interesa:
a. Analizar/Comparar medias/Prueba T de una muestra
b. Valor de prueba=
c. Opciones/Porcentaje intervalo confianza: Introducir (90,95,99..%)
3. Prueba para una muestra: Sig.(bilateral)
a. Comparar con p-valor
b. Aceptar Ho si: , rechazar si:
4. Conclusión/interpretación.
C- CONTRASTE DE HIPÓTESIS UNILATERAL

Pasos:
1. Comprobar de que los datos siguen una distribución normal.
2. Si son normales, resolver el contraste de interés:
a. Analizar/Comparar medias/Prueba T de una muestra.
b. Valor de prueba=
c. Opciones/Porcentaje de confianza: Introducir (90,95,99..%)
3. Prueba para una muestra: Sig.(bilateral) <SPSS no resuelve unilateral.
a. Fijarse en t (distribución t-student) y gl (grados de libertad).
b. Como el contraste es unilateral, calculamos p-valor, con una probabilidad:
4. Calcular probabilidad (p-valor): Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T

5. Interpretación/conclusión
D- COMPROBAR UNA HIPÓTESIS SI NO DICEN QUÉ CONTRASTE USAR (CON I.C.)

Los contrastes y el I.C. están relacionados, así que, en vez de usar un contraste de hipótesis, se puede
comprobar también con I.C.
Recordar que había 3 técnicas (estimación puntual, I.C. y contraste de hipótesis).
Que nos digan con qué comprobarlo es para que vean que lo sabemos hacer.
Comprobar con I.C.: Si no se cumple que está en ese intervalo, se rechazará.

DIFERENCIAS DE MEDIAS DE DOS MUESTRAS NORMALES APAREADAS
Tenemos una población en la que observamos dos variables (X e Y) donde ambas muestras siguen
una distribución normal.
Sus medias son desconocidas y queremos estimarlas para compararlas.

Objetivos:
Para ello tomamos dos muestras apareadas (apareadas: mismos sujetos para hacer mismas mediciones)
Normalmente, este caso se utiliza para medir los efectos de algo antes y después
(= sujetos, = periodo de tiempo) < No siempre es así
Podemos obtener:
a. I.C. para
b. Contrastes de hipótesis
a. Bilateral:
b. Unilateral, formas:

A- INTERVALO DE CONFIANZA
Pasos:
1. Crear 2 variables en el fichero de datos.
2. Comprobar si ambas variables son normales:
a. Análisis/Estadísticos descriptivos/explorar
b. Lista de dependientes: Las dos variables.
c. Gráficos/activar: gráficos de normalidad con pruebas
d. Decidir tipo de test según el tamaño de la muestra y fijarse en "Sig."
e. Comparar con p-valor (Sig.)
f. Se dará por aceptada Ho si: , se rechazará si:
3. Si los datos son normales, obtener I.C. para

a. Analizar/Comparar medias/Prueba T de muestras emparejadas
b. Variables emparejadas: Añadir variables X e Y.
c. Opciones/Porcentaje intervalo de confianza: (90,95,99..%)
4. Nos fijamos en tabla: Prueba de muestras emparejadas
a. I.C. = (Inferior, superior)
5. Interpretación: Si se repitiese el experimento un gran número de veces con muestras distintas, el
(..%) de los casos se confiaría en que la media está en ese rango.

B-CONTRASTE DE HIPÓTESIS: BILATERAL

2. Comprobar si ambas variables son normales
3. Si los datos son normales, proceder a resolver el contraste de hipótesis que nos interesa:
4. Nos fijamos en Prueba de muestras emparejadas.
a. Fijarnos en sig(bilat) -> p-valor.
5. Comparar p-valor con
6. Interpretación.
C-CONTRASTE DE HIPÓTESIS: UNILATERAL

2. Comprobar si ambas variables son normales
3. Si los datos son normales, proceder a resolver el contraste de hipótesis que nos interesa:

4. Nos fijamos en Prueba de muestras emparejadas.
a. Como es un contraste unilateral, fijarse en t.
5. Obtener p-valor mediante una probabilidad:
Recordar que T sigue un modelo T-student con n-1 grados de libertad (gl).
6. Calcular probabilidad (p-valor): Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T

7. Conclusión/interpretación.

Hacer todos los pasos para obtener un I.C.
Mirar el I.C. = (a,b)
Si
Conclusión.

DIFERENCIA DE MEDIAS DE MUESTRAS APAREADAS
Queremos estudiar una variable en 2 subpoblaciones (muestras) distintas, las cuales pueden tener el
mismo o diferente tamaño muestral.
Tendríamos dos variables (variable de interés observada en 2 subpoblaciones) que siguen
distrib.normal
Queremos obtener:
-I.C. ( )
-contrastes de hipótesis (unilateral, bilateral)
Necesario:
Comprobar si hay homogeneidad o heterogeneidad entre los sujetos usados.
Es decir: Resolver contraste de hipótesis:
INTERVALO DE CONFIANZA
1. Crear fichero de datos
a. Una variable con todas las observaciones (tanto de X como de Y)
b. Otra variable que nos indique a qué muestra pertenece cada dato (numérica)
c. Ejemplo:
Préstamos de cada entidad Entidad(es)

7000 1
8000 1
9000 2
2. Comprobar si los datos de las muestras son normales:

a. Analizar/estadísticos descriptivos/explorar:
i. Lista dependientes: Variables X e Y (los datos)
ii. Lista de factores (la variable que nos indique a qué muestra pertenece cada dato)
b. Gráficos: Gráficos de normalidad con pruebas.
3. Fijarnos en pruebas de normalidad
a. Depende del tamaño de la muestra, elegir test (puede ocurrir que una muestra haya que
mirarla en un test y la otra en otro)
b. Comparar con el p-valor de cada variable muestral (X e Y)
4. Si los datos son normales: Obtener I.C.:

a. Analizar/Comparar medias/Prueba T de muestras apareadas.
i. Variable de prueba (variable con los datos)
ii. Variable de agrupación (variable que indica a qué muestra pertenece cada dato)
1) Utilizar valores especificados
iii. Opciones: Porcentaje del intervalo de confianza.
5. Necesario resolver un contraste de hipótesis con anterioridad:
Fijarnos en"sig" (p-valor) de la prueba de Levane y comparar con
6. Fijarnos en el I.C. según si las varianzas son iguales o diferentes.

7. Interpretación.

CONTRASTE DE HIPÓTESIS: BILATERAL
1. Todos los pasos del I.C., pero cuando se comprueba si las varianzas son iguales o diferentes, nos
servirá para elegir qué sig. (p-valor) coger.
2. Resolver el contraste:
3. Conclusión
CONTRASTE DE HIPÓTESIS: UNILATERAL

1. Todos los pasos del I.C., pero cuando se comprueba si las varianzas son iguales o diferentes, nos
servirá para elegir qué "t" coger.
2. Hacer una probabilidad según el tipo de contraste:

3. Resolver probabilidad sabiendo que sigue una distribución t-student
Con "n-1" grados de libertad.
4. Resolver probabilidad: Analizar/calcular variable/CDF y CDF no centrada/ Cdf.T
6. Conclusión.
PROPORCIÓN DE ÉXITO EN UNA BINOMIAL (INFERENCIA SOBRE PROPORCIONES)

Tenemos una variable de estudio que sigue un modelo binomial con parámetro "p" desconocido
(proporción éxito desconocida).
Requisitos:
Tamaño muestral grande (puede caer como pregunta): Aunque la verdadera distribución es
binomial, este modelo da muchos problemas a nivel teórico, por lo que usamos el TCL aproximando la
variable de estudio a una normal, por eso se exige un tamaño de la muestra grande.
El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.
INTERVALO DE CONFIANZA
1) Confirmar que la muestra tiene un tamaño grande.
2) Crear fichero
a. Con la variable binaria (numérica), que toma solo los valores
b. Crear fichero con una variable llamada "frecuencia" (numérica): Número de veces que se
repite 0 y 1 en la muestra.
3) Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
a. Datos/Ponderar casos: Ponderar casos mediante (añadir variable frecuencia)
4) Obtener I.C.:
a. Analizar/Comparar medias/Proporciones de una muestra
i. Valores = (Valor éxito) = 1
ii. Intervalos de confianza:
1) Nivel de cobertura (90,95,99..%) <- Nivel de confianza.
2) Seleccionar tipo(s): Wald
5) Observar intervalos de confianza de proporciones de una muestra: I.C.
6) Interpretación.

CONTRASTE DE HIPÓTESIS: BILATERAL
1. Confirmar que la muestra tiene un tamaño grande.
2. Crear fichero
3. Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
4. Resolver el contraste de hipótesis:
ii. Pruebas:
1) Seleccionar pruebas: Puntuación
2) Valor de prueba: Nivel de significación ( )
5. Observar Pruebas de proporciones de una muestra:
a. P de dos factores (p-valor)
6. Comparar ( ) con p-valor: Si
7. Conclusión.
CONTRASTE DE HIPÓTESIS: UNILATERAL

1. Confirmar que la muestra tiene un tamaño grande.
2. Crear fichero

3. Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
4. Resolver el contraste de hipótesis que nos interesa:
ii. Pruebas…
1) Seleccionar pruebas: Puntuación
2) Valor de prueba: Nivel de significación ( )
5. Fijarse Pruebas de proporciones de una muestra (Z).
6. Calcular p-valor haciendo una probabilidad según el contraste:
Recordar que aquí sigue una distribución normal
Donde p sub0 es la probabilidad que queremos comprobar en el contraste (la del enunciado)
7. Resolver probabilidad: Transformar/calcular variable/CDF o CDF no centrada/Cdf.Normal(p, , )
8. Conclusión.

1) Hacer todos los pasos para obtener un I.C
2) Comprobar si la probabilidad que nos dan en el enunciado es compatible o no con el contraste (Ho)
Es decir, mirar si la probabilidad es menor, mayor, o está entre ese intervalo.
3) Conclusión:
a. Si la probabilidad está entre ese intervalo: Compatible con Ho.
b. Si la probabilidad no está entre ese intervalo: No compatible con Ho.

INFERENCIA ENTRE DOS POBLACIONES DE MUESTRAS INDEPENDIENTES
Tenemos 2 variables con ambas proporciones desconocidas y queremos compararlas
Requisito: Muestras grandes (las dos: n≥25)
El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.
A- INTERVALO DE CONFIANZA
1) Crear fichero de datos:
a. Una variable (cualitativa) que nos indique las muestras (grupos, colectivos..) Que hay.
b. Otra variable que sólo tome los valores 0 y 1 (fracaso y éxito).
c. La tercera variable: Frecuencia, indica cuántos elementos de cada muestra toman el valor 0 o
el valor 1.
2) Indicar SPSS que reconozca la variable "frecuencia" como las veces que se repite el valor 1 y 0.
a. Datos/Ponderar casos/Ponderar casos mediante: Frecuencia.
3) Antes de resolver I.C., hacer un previo contraste de hipótesis:
a. Analizar/comparar medias/Proporciones de muestras independientes

i. Variable de prueba: Variable que mide las proporciones a contrastar (Éxito, fracaso; 0,1)
ii. Definir éxito/Valores: 1 (éxito).
iii. Variable de agrupación: Variable que define los distintos grupos (Muestras X e Y)

iv. Definir grupos/Valores: Indicar los valores que definen a los distintos grupos.
v. Intervalos de confianza:
1) Nivel de cobertura: 90,95,99%.. ( , nivel de significación)
2) Tipos de intervalo: Wald.
vi. Pruebas/Test Type(s): Wald H0.
4) Fijarse en la tabla intervalos de confianza de proporciones de muestras independientes.
5) Interpretación.
B- CONTRASTE DE HIPÓTESIS: BILATERAL

1) Todos los pasos del intervalo de confianza, pero fijarse pruebas de proporciones de muestras
independientes: P de dos factores (p-valor)
2) Comparar con p-valor.
3) Conclusión.
C- CONTRASTE DE HIPÓTESIS: UNILATERAL

1) Todos los pasos del intervalo de confianza, pero fijarse en pruebas de proporciones de muestras
independientes: Valor Z.
2) Calcular p-valor mediante una probabilidad, recordando que sigue una distribución normal.
a. Según el tipo de contraste que sea:
3) Interpretación

1) Hacer todos los pasos para obtener un I.C
2) Comprobar si la probabilidad que nos dan en el enunciado es compatible o no con el contraste
(Ho)
Es decir, mirar si la probabilidad es menor, mayor, o está entre ese intervalo.
3) Conclusión:
a. Si la probabilidad está entre ese intervalo: Compatible con Ho.
b. Si la probabilidad no está entre ese intervalo: No compatible con Ho.

TENER EN CUENTA EN EL EXAMEN
Examen teórico: Tablas prueba de normalidad, de una muestra..

Las tablas pueden estar distribuidas por toda la hoja del examen, hay que buscarlas para
relacionarlas con el ejercicio o tal vez no están y sólo hay que dejar indicado cómo se haría.
Examen teórico: Comprobación de distribución normal:

-Pueden decirte directamente que es una distribución normal, y no haría falta comprobarlo.
-También pueden no decirte nada y por las hojas tiene que haber una tabla que ponga:
prueba de normalidad que coincida con el ejercicio.
-Si no dan tabla ni dicen nada, explicar cómo se comprobaría.
Examen teórico: Sacar un I.C.

Vamos a suponer que un intervalo de confianza: (X=Extr.inferior, Y=Extr.superior).
Hay dos opciones:
a. Tabla prueba para una muestra con valor de prueba = 0 : I.C.=(X,Y)
b. Tabla prueba para una muestra con valor de prueba = a (distinto 0) : I.C.=(a+X,a+Y)
Examen teórico: Comandos (Analizar/estadísticos descriptivos/explorar.. Etc.

Estos comandos no hay que ponerlos en el examen.
Examen teórico: Muestras apareadas

1) 1-n=gl : En el examen teórico es posible que no nos den n y no sepamos qué test coger.
En muestras independientes sí nos darán los tamaños muestrales.
Recordad: Contrastes unilaterales

<- La probabilidad, para calcularla, tiene que quedar con los símbolos así.
CONTRASTE DE HIPÓTESIS: Si piden contrastar, piden un contraste de hipótesis (NO I.C.)

TEMA 4: INFERENCIA NO PARAMÉTRICAS
-Contraste de normalidad
Hay 3 tipos: -Test de independencia (Chi-cuadrado)
-Test de rachas
Inferencia no paramétrica: Métodos alternativos a los de inferencia paramétrica que no necesitan

conocer el modelo de distribución.
Se usará cuando sea imposible usar el método de inferencia paramétrica.
TEST DE INDEPENDENCIA (CHI-CUADRADO)
Sirve para ver si dos variables están relacionadas o no (si son dependientes o independientes)
¿En qué se basa este test? :

Tenemos 2 variables (X e Y) y tenemos las observaciones de la muestra en una tabla de frecuencias
conjuntas. A partir de esa tabla, se compara el valor de la frecuencia observada con el valor que se
esperaría obtener de la frecuencia en el caso de que X e Y fuesen independientes.
Decisión:
-El estadístico Chi-Chuadrado mide la distancia que hay entre las frecuencias observadas (reales) y las

frecuencias esperadas (si las variables fueran independientes).
Por lo tanto: Aceptaremos Ho si la distancia es pequeña, y rechazaremos Ho si la distancia es grande.
Métodos
1) Chi-cuadrado de Pearson (Si se cumplen las condiciones
2) Test de razón de verosimilitud (Cuando no se cumplan las condiciones)
Condiciones para usar Chi-cuadrado de Pearson

1. N es, al menos, 5 veces superior al número de clases
a. Calculo:
2. Como mucho el 20% de las frecuencias esperadas son menores que 5.
a. Tabla: Pruebas de Chi-cuadrado, fijarse en el porcentaje.
i. "x casillas (…%) han esperado un recuento menor que 5."
Resolver contraste de independencia

1. Añadir datos al fichero (Datos X e Y en columnas del fichero separadas)
2. Obtener tabla Pruebas de Chi-cuadrado:
a. Analizar/ Estadísticos descriptivos/Tablas cruzadas:
i. Una variable (X o Y) pasarla a filas y la otra a columnas (no importa orden).
ii. Estadísticos: Chi-cuadrado
b. Comprobar condiciones para usar Chi-cuadrado de Pearson.
i. Si se cumplen condiciones: Significación asintótica (p-valor) de Pearson.
ii. Si no se cumplen las condiciones: Significación asintótica (p-valor) de Verosimilitud.
4. Conclusión.
RECORDATORIO: Xe Y son estadísticamente independientes si Nsubij era =

=(a la marginal de X* la marginal de Y )/2 <- forma para calcular Esub ij. (Valor que se esperaría)
TEMA 4 página 1
RESIDUOS ESTANDARIZADOS CORREGIDOS
Si se cumple que las variables son dependientes, este método da un indicador sobre la fuerza o potencia
de dicha asociación (dependencia).
-Es la diferencia entre una frecuencia observada y la frecuencia que se esperaba obtener si fuesen
independientes.
Pasos:
1. Nos interesa: Tabla cruzada variable X*variable Y.
a. SPSS: Analizar/estadísticos descriptivos/Tablas cruzadas:
i. Casillas: Residuo estandarizado corregido.
2. Escoger datos de dentro de la tabla según sean mayores que los números dependiendo de
a. Si
b. Si
c. Si
3. Interpretación.
Interpretación
+ : En esa casilla hay más datos (frecuencia mayor) de los que se esperaban obtener si fuesen
independientes.
- : En esa casilla hay menos datos (frecuencia menor) de los que se esperaban obtener si fuesen
independientes.
El número del residuo según el nivel de significación se calcula con un cuartil:

SPSS: GL. Inversos /Normal.
Idf.Normal(p, media, desv. Típica.) = Idf.Normal (1-
p= 1-
-Estandarizar significa pasar todas las variables a una distribución normal tipificada.
TEMA 4 página 2
CONTRASTE DE ALETORIEDAD
*Si en el examen final nos dice que la muestra es aleatoria, no hace falta comprobarlo.
Nos permite estudiar si las observaciones muestrales son aleatorias o si por el contrario presentan algún patrón o
tendencia no aleatoria. (Hipótesis previa exigida en muchas técnicas estadísticas)
CONCEPTOS PREVIOS (Ex. Final)

-Definición de racha: Secuencia de elementos iguales.
-Definición de longitud: Número de elementos de una racha.
Contraste a resolver:
Se resuelve con el test de rachas:

1.- Crear fichero de datos
2.- Obtener tabla "Resumen de contraste de hipótesis".
SPSS: Analizar/Pruebas no paramétricas/Una muestra
a. Objetivo: Probar la aleatoriedad de una secuencia
b. Campos/Campos de prueba: (Variable que queremos ver si es aleatoria o no)
c. Configuración
a. Probar la aleatoriedad de la muestra/Opciones
i. Variable categórica, por tanto:

1) Sólo hay dos categorías de la muestra.
ii. Variable numérica, por tanto:
1) Definir punto de corte para campos continuos/Punto de corte=(….)
b. Opciones de prueba: Nivel de significación = (….)
3.- Comparar con p-valor. [Decisión: Nos dicen si aceptar o rechazar Ho (hipótesis nula)]
4.- Conclusión
Formas de identificar que te preguntan la aleatoriedad:

a. Que nos pregunten si sigue una tendencia o patrón.
b. Si nos dan un valor de referencia (media) = Punto de corte.
c. Que nos digan comprobar aleatoriedad.
Cosas a tener en cuenta:

a. Si no nos dicen nada con respecto al punto de corte (o valor de referencia) usamos la mediana
(media muestral), que viene marcado por defecto.
TEMA 4 página 3
TEMA 5 - ANÁLISIS DE LA VARIANZA
ANOVA
Tiene como objetivo entender el contraste de igualdad de medias en muestras independientes al caso en
que el factor tiene más de dos niveles o categorías (toma +2valores).
-Necesitamos un método que nos permita resolver el problema en un solo contraste, ya que si hacemos
varios se presentan 2 inconvenientes:
a. Conlleva resolver varios contrastes (mayor número de categorías del factor, mayor número de
contrastes a resolver).
b. Error tipo I, ya que con cada contraste el error va aumentando (es acumulativo).
-3 tipos de variación:
1. Variabilidad dentro del grupo: Variación de los datos dentro de un mismo grupo. No son atribuibles al
factor.
Se estima con un estimador puntual = Varianza residual

2. Varianza entre grupos: Variación de los datos por distintos grupos.
Se estima con un estimador puntual = Varianza explicada
3. Variación total: Variabilidad de todos los datos en total, sin distinguir por grupos.
Se estima con un estimador = Varianza total
Se puede comprobar que:
*Importante: En el examen teórico pueden

pedir rellenar la tabla teórica
(SUELEN HACERLO)
TERMINOLOGÍA ANOVA:
a. Variable dependiente: Variable cuantitativa a la que se le quiere estudiar si su media es igual o no.
b. Factor: Variable cualitativa que queremos ver si influye o no sobre la variable de estudio.
c. Tratamiento/nivel del factor: Distintos valores que puede tomar el factor (grupo)
Para cada tratamiento se utiliza una muestra.
d. Diseño balanceado/equilibrado: Si todas las muestras tienen = tamaño/nivel.
e. Modelo de efectos fijos: Tratamientos se fijan de antemano. (el que vamos a estudiar)
f. Modelo de efectos aleatorios: Muestra aleatoria entre todos los tratamientos posibles.
TEMA 5 página 1
REQUISITOS PARA USAR ANOVA:
ALEATORIEDAD
(Variables aleatorias o no): Se resuelve con el test de rachas.
SPSS: Analizar/Prueba no paramétrica/Una muestra: TABLA: RESUMEN CONTRASTE HIPÓT.

a. Objetivo: Aleatoriedad de 1 secuencia.
b. Campos: La variable a estudiar (residuo* o variable).
c. Configuración: Probar aleatoriedad de una secuencia.
De forma gráfica (examen teórico nos pueden pedir comprobar aleatoriedad con el gráfico)
Ejemplo:
<- Como no hay ningún patrón significativo, significa que el

gráfico funciona de manera aleatoria.
NORMALIDAD
(Variables normales o no): Se resuelve con el contraste de normalidad.

SPSS: Analizar/estadísticos descriptivos/Explorar TABLA: PRUEBA DE NORMALIDAD
a. Gráficas: Normalidad con pruebas.
HOMOCEDASTICIDAD
(Varianzas iguales o no): Se resuelve con el test del Edén.
SPSS: Analizar/Comparar medias/ANOVA de 1 factor: TABLA: PRUEBA HOMOGENEIDAD VARIANZAS

a. Dependiente: Cuantitativa.
b. Factor: Cualitativa.
c. Opciones: Prueba homogeneidad de varianzas.
De forma gráfica (en el examen teórico nos puede caer)

Ejemplo:
<- Se tendría que ver si entre los puntos hay una anchura constante o si
se va disminuyendo/aumentando conforme avance la gráfica
(hace forma de embudo o no)
CONSEJO: DEJAR ALEATORIEDAD PARA LO ÚLTIMO, NUNCA SERÁ ACEPTADO H1.
TEMA 5 página 2
OBTENER RESIDUOS:
SPSS: Analizar/Modelo lineal general/Univariable
1. Fijos: Cualitativa.
2. Dependientes: Cuantitativa.
3. Guardar: Residuos no estandarizados
SE PUEDEN USAR EN NORMALIDAD Y ALEATORIEDAD (HOMOCEDASTICIDAD NO)
ANOVA:
Si se cumplen los requisitos se puede usar el método ANOVA.
Nos interesa resolver en el siguiente contraste:
Con ANOVA al darse que se cumple que siguen una distribución normal podemos ver si hay diferencias
significativas entre las medias o no, ya que si se cumplen significa que las medias son muy representativas.
SPSS: Analizar/Comparar medias/ANOVA de un factor:

a. Dependientes: Cuantitativa.
Fijarse en el p-valor.
Si se acepta Ho (Fin del ejercicio).

Si se acepta H1 (Significa que hay un tratamiento que difiere del resto, y se puede saber cuál es)
-Para ello hay que realizar un análisis comparativo múltiple (2 a 2).
ANÁLISIS COMPARATIVO MÚLTIPLE (2 a 2) ANOVA ANÁLISIS POST-HOC.

Métodos:
a. DMS: Diseño no balanceado.
b. Tukey: Diseño balanceado.
c. Dunnett: (Se puede resolver con uno de los otros dos).
SPSS: Analizar/Comparar medias/ANOVA de un factor.

a. Dependiente: Cuantitativa.
c. Post-Hoc: Relacionar método que nos interese (DMS o Tukey)
-Nos darán una tabla relacionando los tratamientos (grupos) y con un p-valor.
(Para no ir repitiendo el contraste de ANOVA todo el rato decir:
Compararemos con el contraste que nos interesa los tratamientos 2 a 2.)
a. Con el contraste podremos decir si hay diferencias significativas o no.
b. Con el I.C. podremos decir qué media es mayor/menor de los dos tratamientos.
TEMA 5 página 3
KRUSKALL-WALLIS
Método no paramétrico para resolver un contraste si se incumplen los requisitos para usar ANOVA.
Contraste a resolver:
Ho: Distribuciones similares en su tendencia central.
H1: Alguna distribución difiere del resto
(No se comparan las medias ya que las medias no son representativas. (no sigue distrib.normal)
(Solo copiar el contraste 1 vez, basta con decir que resolveremos este contraste de 2 a 2 para cada apartado.
SPSS: Analizar/Pruebas no paramétricas/Muestras independientes

a. Objetivo: Comparar distribución entre grupos
b. Campos: Campo de prueba(Cuantitativo), grupos (cualitativo).
c. Configuración: Personalizar pruebas: ANOVA de 1 factor Kruskall-Wallis.
Si aceptamos Ho: Fin del ejercicio.

Si aceptamos H1: Realizar una comparación múltiple para ver qué tratamiento/s difiere del resto.
Dejar aleatoriedad para el final (no va a ser aceptado H1)
ANÁLISIS COMPARATIVO (2 a 2) KRUSKALL-WALLIS

(Se da junto al método Kruskall-Wallis)
Tabla: Comparaciones por parejas (variable cualitativa).
Se comparan los p-valor para decir si hay diferencias significativas o no entre cada tratamiento.

Tabla: Prueba de Kruskall-Wallis para muestras independientes (DIAGRAMA DE CAJAS Y BIGOTES):
Nos fijaremos en qué tratamiento está más alto que el otro que nos preguntan para responder cuál es
mayor que el otro. (Como el I.C. en ANOVA pero caja y bigotes en Kruskall-Wallis.)
IDENTIFICACIÓN DE VALORES ATÍPICOS

Diagrama de cajas y bigotes:
SPSS: Gráficos/Cuadro de gráficos de diálogo antiguo/Diagrama de cajas (simple).

a. Variable (cuantitativa)
b. Eje de categoría (cualitativa)
Si el valor atípico sale que es el número X, buscar en el fichero de datos cuál es y decir que es la variable
(que le toque en el cuantitativo) y que pertenece al tratamiento (…)
TIP: Si se incumple alguna condición, decid que usaríamos Kruskall-Wallis pero que comprobaremos
todas las hipótesis por si hay algún error, y explicar cómo se haría ANOVA.
TEMA 5 página 4
TEMA 6: MODELO DE REGRESIÓN LINEAL
INTRODUCCIÓN MODELO DE REGRESIÓN LINEAL
Análisis de regresión: Técnica que pretende explicar o predecir el comportamiento de una variable Y
mediante un conjunto de variables independientes.
Variables:
a. Y: DEPENDIENTE
b. X: INDEPENDIENTE
Tipos de modelos:
a. Regresión simple: Modelo si tenemos una única variable independiente para predecir el
comportamiento de la variable dependiente.
b. Regresión múltiple: Modelo si tenemos +1 variable independiente para predecir el comportamiento
de la variable dependiente.
Regresión simple: Regresión múltiple:

Los modelos económicos son de tipo aleatorio y siempre existe un error ( ) entre los valores estimados y
reales.
----
Ejemplo:
-Consumo de un país:
-Con la perturbación económica:
OBJETIVOS
1. Estimar los parámetros desconocidos del modelo (B0 y B1)
2. Comprobar si el modelo es adecuado
ETAPAS
1. Especificación: Determinar variable dependiente, seleccionar independientes y elegir modelo.
2. Estimación de la mejor función que se ajusta a los datos.
3. Validación: Comprobar si la ecuación ayuda
4. Aplicación: Estudiar las relaciones entre las variables, predecir…
MODELO DE REGRESIÓN LINEAL SIMPLE Función:
1. (e): Perturbación (aleatoria)

2. Y: Variable dependiente (aleatoria)
3. X: Variable independiente (no es aleatoria, se fija por el investigador)
4. Coeficientes de regresión:
a. Bo: Término independiente (constante). -> cuando x=0
b. B1: Pendiente. -> Cambio en la producido por 1ud+ en X.
OBJETIVO
Estimar coeficientes B0 y B1 de modo que nos proporcione el mejor modelo lineal.
TEMA 6 (ex.f página 1

MÉTODO: Mínimos cuadrados
REQUISITOS MÉTODO:
Todo comprobado con residuos.
1. Normalidad de residuos.
2. Linealidad: Relación entre las variables de tipo lineal.
3. Homocedasticidad: Varianza residuos constante.
4. No autocorrelación: Residuos independientes entre sí.
Si se incumplen: Modelo no estable.
CALCULO DE RESIDUOS, NO AUTOCORRELACIÓN Y HOMOCEDASTICIDAD
Al crear residuos ya podemos obtener datos para comprobar: No autocorrelación y Homocedasticidad
NO AUTOCORRELACIÓN -> Estadístico Durbin-Watson (DW)

TABLA: RESUMEN DEL MODELO ^b
a. Si DW toma valores entre (1.5 , 2.5), se cumple la no autocorrelación (residuos indep.)
HOMOCEDASTICIDAD -> Gráfico de dispersión

TABLA: Gráfico de dispersión
NORMALIDAD

Comprobación gráfica: Gráfico Q.Q -> Datos normales= Nube de puntos cercana a la línea recta.
TABLA: PRUEBA DE NORMALIDAD -> ESTANDARIZED RESIDUAL (P-valor)
LINEALIDAD
Comprobación gráfica: Gráfico residuos estandarizados frente valores estimados estandarizados.

(Nube de puntos paralela al eje horizontal)
TABLA: TABLA DE ANOVA -> ENTRE GRUPOS: DESVIACIÓN DE LA LINEALIDAD: SIG. (P-valor)
INTERPRETACIÓN DE COEFICIENTES (B1) : TANTO SIMPLE COMO MÚLTIPLE

Según el símbolo:
a. B1<0 (-) : Relación lineal inversa (a mayor X, menor Y y viceversa)
b. B1>0 (+) : Relación lineal directa (a mayor X, mayor Y)
Según el número que indique:

a. B1= a: Por cada aumento en un 1% en la tasa de interés, el número medio de Y (desciende si es negativo
o aumenta si es positivo) a.

¿ES SIGNIFICATIVA LA REGRESIÓN LINEAL?: CONTRASTE DE SIGNIFICACIÓN DE LA REGRESIÓN
Se puede preguntar de más formas:
a. ¿Podemos considerar pendiente nula?
b. ¿Es significativo el modelo?
c. ¿Es significativa la variable Y?
Si B1≠0, la variable dependiente es significativa.

TABLA: COEFICIENTES -> SIG.
¿PODRÍAMOS CONSIDERAR LA CONSTANTE NULA? (Término independiente)
Resolver contraste:
Sería no nula si fuese significativa (B0≠0) , porque sino podríamos realizar el modelo sin esa variable.
BONDAD DEL AJUSTE

Mide qué fiabilidad tiene el modelo como para hacer predicciones.
Se mide con 2 medidas:
VARIANZA RESIDUAL ( ):
Mide cómo se desvían los valores pronosticados del verdadero valor.

Residuos: Diferencia entre el valor que tenemos y el verdadero valor.
TABLA ANOVA^a : Columna media cuadrática correspondiente al residuo.
Para interpretarla: Error estándar de regresión (desviación típica): Varianza residual al cuadrado ( )
INTERPRETAR BONDAD DEL AJUSTE: Decid:

La varianza residual nos mide la tendencia a desviarnos del verdadero valor de la variable si usamos la recta
para predecir. Si el error estándar es pequeño, significa que la resta tiende a desviarse poco y sería buen
estimador.
COEFICIENTE DE DETERMINACIÓN (R2)

Mide el % de variabilidad en la variable dependiente que queda explicado por la variable independiente.
Toma valores entre (0≤R2≤1), donde:
a. Valor = 0 : 0% Fiable.
b. Valor = 1: 100% Fiable.
(El dato pasarlo a porcentaje)
TABLA: Resumen del modelo -> R^2

Interpretación: La (variable X) explica en un (%) la variabilidad de la variable Y si usamos el modelo obtenido.

PREDICCIONES
El objetivo que se persigue con la regresión es hacer predicciones cuando concluimos que el modelo es
bueno, por tanto:
Queremos predecir el valor que tomaría la variable dependiente para un determinado valor de la variable
independiente.
TIPOS DE PREDICCIONES:
a. Estimador puntual (valor aproximado)
b. Estimación por intervalos
Denotación:
Estimación puntual: Estimación por intervalos:
Fichero de datos:
a. PRE_1: Estimación puntual.
b. MCI_1 y UMC_1 : Valores para el intervalo (MCI_1 , UMC_1)
MODELO DE REGRESIÓN LINEAL MÚLTIPLE Función:
Es cuando disponemos de +1 variable independiente (X1, X2,X3..) para explicar la variable dependiente (Y)
(Diferencia entre simple y múltiple: Se puede ver qué variable tiene más peso para Y)
MÉTODO: Mínimos cuadrados

CONDICIONES:
NORMALIDAD

Test de normalidad con residuos.
TABLA: PRUEBA DE NORMALIDAD -> ESTANDARIZED RESIDUAL (P-valor)
ALEATORIEDAD (no autocorrelación)

Con DW: (1.5 , DW , 2.5)
(En el examen podemos poner sólo aleatoriedad en vez de no correlación)
TABLA: RESUMEN DEL MODELO -> DURBIN-WATSON
HOMOCEDASTICIDAD
Comprobar que no tenga forma embudo
TABLA: GRÁFICO DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)
LINEALIDAD
a. Gráfico de dispersión: Que las observaciones sean paralelas al eje X.
TABLA: GRÁFICOS DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)
b. Gráficos de dispersión parcial: Gráficos de dispersión de la variable dependiente con cada una de las
variables independientes. (debe apreciarse relación lineal)
TABLA: GRÁFICOS DE REGRESIÓN PARCIAL (VARIABLE Y/ VARIABLE X1,X2..)
NO MULTICOLINEALIDAD
Que las variables no aporten información parecida entre sí (que no haya una relación fuerte entre las
variables independientes).
a. Se mide con el coeficiente de "inflación de la varianza" (VIF) que debe ser VIF<10 para cada v.indep.
a. Si sale VIF>10: Alguna variable superpone a la otra y significa que estamos metiendo info 2 veces
TABLA: COEFICIENTES -> ESTADÍSTICOS DE COLINEALIDAD -> VIF

¿VARIABLE CON MAYOR IMPORTANCIA/RELEVANCIA DEL MODELO?
(Interpretar coeficiente de significación de estandarizados)
Buscar qué coeficiente tiene más peso.
TABLA: COEFICIENTES ESTANDARIZADOS -> BETA
DE CARA AL EXAMEN FINAL:

- Si no nos piden hipótesis para la regresión no hace falta comprobarlo
- Valores atípicos:
a. Sale una TABLA: DIAGNÓSTICO POR CASO: Numero de caso (si no hay no saldría tabla)
b. Valor atípico cuando el residuo estandarizado es: |a|>3

Wuolah Free RESUMENES ESTADISTICA AV COMPLETOS 1 PDF

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Wuolah Free RESUMENES ESTADISTICA AV COMPLETOS 1 PDF

Cargado por

Copyright:

Formatos disponibles

MODELO DE DISTRIBUCIONES

REPASO MODELOS página 1

2.- GRUPO DE FUNCIONES (GF)

->2.1- Probabilidad puntual (Modelos discontinuos)

2.1- PROBABILIDAD PUNTUAL/EXACTA

B- MODELOS DISCONTINUOS: Sirve para Binomial y Poisson.

Reservados todos los derechos.

Ejemplo 1 (Binomial): Ejemplo 2 (Poisson):

2.2- PROBABILIDAD ACUMULADA (FUNCIÓN DISTRIBUCIÓN)

PROB Y PERC -BYN página 1

Reservados todos los derechos.

PROB Y PERC -BYN página 2

RESUMEN TEMA 1 - VARIABLES ALEATORIAS INDEPENDIENTES página 1

Se estudiarán las nociones básicas para: Inferencia estadística.

1.1-ELEMENTOS INFERENCIA ESTADÍSTICA

Reservados todos los derechos.

Para la inferencia estadística se utilizan

1.2MÉTODOS PARA CALCULAR INFERENCIA ESTADÍSTICA

(!!Solo aplicar estos métodos si se conoce que el modelo es normal o binomial!!)

Modelos paramétricos -------------------(si no se puede)----------> Modelos no paramétricos

Reservados todos los derechos.

Estimadores más usuales son:

b-Estimador puntual de la varianza (varianza muestral)

c-Estimador puntual de una proporción

A- ESTIMADOR PUNTUAL Propiedades

Error cuadrático medio (ECM)

: Estimador del parámetro poblacional.

1-Suficiencia: Recoger la máxima información sobre el parámetro de la muestra.

Si el sesgo = 0 -> Estimador insegado >

Si el sesgo ≠ 0 -> Estimador sesgado > DESCARTADO.

Si el estimador es insegado: <- SIEMPRE.

Reservados todos los derechos.

Si es insegado siempre se cumple la 1ra condición.

Objetivo: Estudiar parámetros

Reservados todos los derechos.

Nivel de confianza: Garantía de que el verdadero valor esté en ese intervalo.

El nivel de confianza va relacionado con la amplitud del intervalo:

Interpretación nivel confianza:

TEMA 3-CONCEPTOS BÁSICOS.. página 1

MÉTODOS PARA SACAR INTERVALO DE CONFIANZA (2)

(Lo único importante es entender un poco de qué trata)

Reservados todos los derechos.

Obtener I.C. (SPSS)

-Valor de prueba I.C=0

TEMA 3-CONCEPTOS BÁSICOS.. página 2

ANALIZAR/COMPARAR MEDIAS/PRUEBA T DE UNA MUESTRA, sirve también para

-N (n): Tamaño muestral

Reservados todos los derechos.

-t: Valor estadístico pivote para

B.- CONTRASTES DE HIPÓTESIS

SPSS resuelve de manera directa: Sig.bilateral (UNILATERAL NO)

TEMA 3-CONCEPTOS BÁSICOS.. página 3

SPSS No lo resuelve de manera directa, es necesario operar.

-Error Tipo I : Rechazar Ho cuando es cierta.

-Error Tipo II: Aceptar Ho cuando es falso.

Reservados todos los derechos.

RESOLUCIÓN CONTRASTES DE HIPÓTESIS

Enfoque p-valor (SPSS): Denotación SPSS: Sig.

2. Plantear correctamente el contraste que se quiere resolver:

3. Comprobar que la variable siga un modelo de distribución normal.

TEMA 3-CONCEPTOS BÁSICOS.. página 4

IMPORTANTE COMPROBAR SI SIGUE UNA DISTR.NORMAL PARA CALCULAR I.C