Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.- PASOS
a- Introducir un valor cualquiera en el fichero de datos (para poder usar la calculadora)
b- Seleccionar: Transformar/Calcular variable.
c- Variable objetivo: Nombre de la variable del cálculo.
c.2- Expresión numérica: Realización del cálculo (DECIMALES SIEMPRE CON PUNTO).
Solución: Vista de datos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
GF ->2.2- Probabilidad acumulativa (Modelos continuos/discontinuos)
->2.3- Percentiles (Modelos continuos)
MODELOS CONTINUOS:
A- MODELOS DISCRETOS
-Pasos:
a- Grupo de funciones: CDF y CDF no centrada
b- Funciones y variables especiales: Valen todos los modelos en esta probabilidad.
TRANSFORMAR PROBABILIDADES A:
-Complementario
-Transformaciones
-Importante:
-Tipos de modelos: Uniforme, exponencial, normal, Chi cuadrado (chiq.), t.student (T), F.Snedecor(F)
-Pueden preguntar
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2.3- PERCENTILES (Continua)
EX: Se preguntarán modo pregunta
-Pasos:
a- GL Inversos
b- Modelo continuo que sea
1-INFERENCIA ESTADÍSTICA
Tiene como objetivo estimar una característica de interés (media, varianza, desviación
típica…) de la población de estudio que por su tamaño, es inviable estudiarla por
completa.
Se estudia la población a partir de la información obtenida de una muestra.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
características.
Un parámetro poblacional describe a la población:
-Parámetro media poblacional
-P. desviación típica poblacional
-P. varianza poblacional
-Proporción poblacional
B.MUESTRA (n)
Subconjunto de elementos de la población sobre el que realmente hacemos las
observaciones.
Un estadístico es una función construida exclusivamente con valores muestrales que
describe a la muestra:
B.INFERENCIA NO PARAMÉTRICA
No requieren conocer la forma funcional de la distribución de la población.
Permite:
-Estudiar parámetros poblacionales cuando se incumple que no es modelo de distrib. Normal)
-Estudiar otras características de la población (Ej: Ver si son variables independientes o dependientes…)
TEMA 2 página 1
si lees esto me debes un besito
A.1-TÉCNICAS PARAMÉTRICAS
Queremos estudiar una v.a de una población.
Sabemos que
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Métodos:
a-Estimación puntual (peor estimación): Valor concreto para estimar el parámetro de la población.
b-Intervalos de confianza: Intervalos (rango de valores).
c-Contrastes de hipótesis: Trata de decidir si la muestra apoya o no una afirmación sobre el parámetro
poblacional desconocido. (Permite comprobar si una hipótesis sobre el parámetro es cierta o no).
a- Estimación puntual
Objetivo: Asignar valor concreto a un parámetro poblacional a partir de los datos que obtenemos de una
muestra.
Para poder hacerlo necesitamos:
Un estimador: Es un estadístico de un parámetro poblacional que toma valores admisibles para el
parámetro desconocido, es decir, que cumple buenas propiedades.
Fórmula:
TEMA 2 página 2
b- PROPIEDADES DESEABLES BUEN ESTIMADOR
3-Eficiencia: Entre todos los estimadores insegados, nos interesa el más eficiente.
1· Nos quedamos con el que tenga menos ECM.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2· Si hay varios con =ECM, nos quedamos con el que menor varianza tenga.
Varianza mínima:
TEMA 2 página 3
si lees esto me debes un besito
TEMA 3: ESTIMACIÓN POR INTERVALOS DE CONFIANZA Y ESTIMACIÓN DE HIPÓTESIS
Variable de interés
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TÉCNICAS: Intervalos de confianza y contraste de hipótesis
NO se utiliza estimación puntual por las siguientes causas:
a. Cambio de muestra = Estimación diferente
b. No se puede determinar EXACTAMENTE el valor del error
Lo que hacemos en la estimación puntual es quedarnos con el estimador que tiene menor error
cuadrático medio. Por tanto, desconocemos si el valor estimado del error se encuentra cerca (o no) del
verdadero valor del parámetro.
Alternativas: Otras técnicas que nos permitan cuantificar el error cometido en la estimación. Son:
Se busca un rango de valores admisibles para el parámetro, con un nivel de confianza conocido.
Construiremos, a través de las muestras, un intervalo [a,b] de manera que ofrezca unas garantías.
Además se pretenderá que el intervalo sea de amplitud mínima.
Fórmula:
Se trabaja con
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Se denotará estadístico pivote:
Requisitos:
a. Intervalo de confianza para
b. Muestra aleatoria normal en la que ambos parámetros son desconocidos
c. Tamaño n
Se utiliza como pivote la función:
Lo que se quiere conseguir es la probabilidad de que el estadístico pivote esté entre esos extremos sea
el nivel de confianza fijado
Pasos:
1. Introducir valores muestrales en el fichero de datos.
2. Comprobar que los datos se ajustan a una distribución normal.
3. Obtener I.C. para con SPPS: Analizar/Comparar medias/Prueba T de una muestra.. :
Aceptar:
Explicación:
Tipos de contrastes:
solo puede ser igual y mayor/menor estricto!
Se puede dar
a. Contraste BILATERAL:
Curiosidad: ¿por qué bilateral?: Se llama así porque genera 2 colas poco probables:
Error de contraste:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tipos de errores:
Observaciones:
-Es idóneo que la probabilidad de cometer estos errores fuesen lo más pequeñas posibles.
Enfoque clásico (no se usa): Calcular, a partir de los datos muestrales un estadístico que determina una
región crítica (regiones con poca probabilidad de que se den si la hipótesis nula es cierta), donde se
rechazaría la hipótesis nula y se aceptaría la alternativa.
Proceso:
1. Fijar nivel de significación ( )
5. Escribir conclusión final: La muestra es compatible (o no) y por tanto se acepta (o no) la hipótesis
nula.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
COMPROBACIÓN DE QUE SIGUE UNA DISTRIBUCIÓN NORMAL
En el examen
3. Comprobar que:
APARTADOS
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. Diferencia de medias de dos poblaciones normales independientes:
a. Calcular I.C.
b. Resolver contraste de hipótesis (unilateral, bilateral)
c. Resolver hipótesis con I.C. (si no nos dicen una forma concreta)
A. INTERVALO DE CONFIANZA
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Pasos:
1. Comprobar de que sigue una distribución normal:
a. Darán la tabla de prueba de normalidad
b. Decidir test a usar
c. Comparar p-valor (sig.) con
d. Se aceptará Ho (datos normales) si:
2. Si los datos son normales, obtener I.C.:
a. Analizar/Comparar medias/Prueba T de una muestra. < Ex.teórico no hace falta
b. Valor de prueba=0
c. Opciones/porcentaje del intervalo de confianza: Introducir (90,95,99..%)
d. En el examen darán la tabla, fijarse: Prueba para una muestra con valor de prueba=0
i. I.C.= (Inferior, superior).
e. EXCEPCIÓN EX.TEÓRICO: Si nos dan Prueba para una muestra con valor de prueba≠0
i. I.C.= (Inferior+ ,superior+ )
Para ello tomamos dos muestras apareadas (apareadas: mismos sujetos para hacer mismas mediciones)
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Normalmente, este caso se utiliza para medir los efectos de algo antes y después
(= sujetos, = periodo de tiempo) < No siempre es así
Podemos obtener:
a. I.C. para
b. Contrastes de hipótesis
a. Bilateral:
b. Unilateral, formas:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
5. Comparar p-valor con
6. Interpretación.
Recordar que T sigue un modelo T-student con n-1 grados de libertad (gl).
Si
Conclusión.
Queremos obtener:
-I.C. ( )
-contrastes de hipótesis (unilateral, bilateral)
Necesario:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Comprobar si hay homogeneidad o heterogeneidad entre los sujetos usados.
Es decir: Resolver contraste de hipótesis:
INTERVALO DE CONFIANZA
1. Crear fichero de datos
a. Una variable con todas las observaciones (tanto de X como de Y)
b. Otra variable que nos indique a qué muestra pertenece cada dato (numérica)
c. Ejemplo:
Préstamos de cada entidad Entidad(es)
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
servirá para elegir qué sig. (p-valor) coger.
2. Resolver el contraste:
3. Conclusión
Requisitos:
Tamaño muestral grande (puede caer como pregunta): Aunque la verdadera distribución es
binomial, este modelo da muchos problemas a nivel teórico, por lo que usamos el TCL aproximando la
variable de estudio a una normal, por eso se exige un tamaño de la muestra grande.
El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.
INTERVALO DE CONFIANZA
1) Confirmar que la muestra tiene un tamaño grande.
2) Crear fichero
a. Con la variable binaria (numérica), que toma solo los valores
b. Crear fichero con una variable llamada "frecuencia" (numérica): Número de veces que se
repite 0 y 1 en la muestra.
3) Indicar SPSS que la variable frecuencia son las veces que se repite cada valor de la variable binaria:
a. Datos/Ponderar casos: Ponderar casos mediante (añadir variable frecuencia)
4) Obtener I.C.:
a. Analizar/Comparar medias/Proporciones de una muestra
i. Valores = (Valor éxito) = 1
ii. Intervalos de confianza:
1) Nivel de cobertura (90,95,99..%) <- Nivel de confianza.
2) Seleccionar tipo(s): Wald
5) Observar intervalos de confianza de proporciones de una muestra: I.C.
6) Interpretación.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ii. Pruebas:
1) Seleccionar pruebas: Puntuación
2) Valor de prueba: Nivel de significación ( )
5. Observar Pruebas de proporciones de una muestra:
a. P de dos factores (p-valor)
6. Comparar ( ) con p-valor: Si
7. Conclusión.
Donde p sub0 es la probabilidad que queremos comprobar en el contraste (la del enunciado)
7. Resolver probabilidad: Transformar/calcular variable/CDF o CDF no centrada/Cdf.Normal(p, , )
8. Conclusión.
El intervalo es asintótico, es decir es más fiable conforme más se acerque el tamaño muestral a infinito.
A- INTERVALO DE CONFIANZA
1) Crear fichero de datos:
a. Una variable (cualitativa) que nos indique las muestras (grupos, colectivos..) Que hay.
b. Otra variable que sólo tome los valores 0 y 1 (fracaso y éxito).
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
c. La tercera variable: Frecuencia, indica cuántos elementos de cada muestra toman el valor 0 o
el valor 1.
2) Indicar SPSS que reconozca la variable "frecuencia" como las veces que se repite el valor 1 y 0.
a. Datos/Ponderar casos/Ponderar casos mediante: Frecuencia.
3) Antes de resolver I.C., hacer un previo contraste de hipótesis:
3) Conclusión.
3) Interpretación
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
relacionarlas con el ejercicio o tal vez no están y sólo hay que dejar indicado cómo se haría.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEST DE INDEPENDENCIA (CHI-CUADRADO)
Sirve para ver si dos variables están relacionadas o no (si son dependientes o independientes)
Decisión:
-El estadístico Chi-Chuadrado mide la distancia que hay entre las frecuencias observadas (reales) y las
Métodos
1) Chi-cuadrado de Pearson (Si se cumplen las condiciones
2) Test de razón de verosimilitud (Cuando no se cumplan las condiciones)
TEMA 4 página 1
si lees esto me debes un besito
RESIDUOS ESTANDARIZADOS CORREGIDOS
Si se cumple que las variables son dependientes, este método da un indicador sobre la fuerza o potencia
de dicha asociación (dependencia).
-Es la diferencia entre una frecuencia observada y la frecuencia que se esperaba obtener si fuesen
independientes.
Pasos:
1. Nos interesa: Tabla cruzada variable X*variable Y.
a. SPSS: Analizar/estadísticos descriptivos/Tablas cruzadas:
i. Casillas: Residuo estandarizado corregido.
2. Escoger datos de dentro de la tabla según sean mayores que los números dependiendo de
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a. Si
b. Si
c. Si
3. Interpretación.
Interpretación
+ : En esa casilla hay más datos (frecuencia mayor) de los que se esperaban obtener si fuesen
independientes.
- : En esa casilla hay menos datos (frecuencia menor) de los que se esperaban obtener si fuesen
independientes.
-Estandarizar significa pasar todas las variables a una distribución normal tipificada.
TEMA 4 página 2
si lees esto me debes un besito
CONTRASTE DE ALETORIEDAD
*Si en el examen final nos dice que la muestra es aleatoria, no hace falta comprobarlo.
Nos permite estudiar si las observaciones muestrales son aleatorias o si por el contrario presentan algún patrón o
tendencia no aleatoria. (Hipótesis previa exigida en muchas técnicas estadísticas)
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Contraste a resolver:
TEMA 4 página 3
si lees esto me debes un besito
TEMA 5 - ANÁLISIS DE LA VARIANZA
ANOVA
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tiene como objetivo entender el contraste de igualdad de medias en muestras independientes al caso en
que el factor tiene más de dos niveles o categorías (toma +2valores).
-Necesitamos un método que nos permita resolver el problema en un solo contraste, ya que si hacemos
varios se presentan 2 inconvenientes:
a. Conlleva resolver varios contrastes (mayor número de categorías del factor, mayor número de
contrastes a resolver).
b. Error tipo I, ya que con cada contraste el error va aumentando (es acumulativo).
-3 tipos de variación:
1. Variabilidad dentro del grupo: Variación de los datos dentro de un mismo grupo. No son atribuibles al
factor.
Se estima con un estimador puntual = Varianza residual
3. Variación total: Variabilidad de todos los datos en total, sin distinguir por grupos.
Se estima con un estimador = Varianza total
TERMINOLOGÍA ANOVA:
a. Variable dependiente: Variable cuantitativa a la que se le quiere estudiar si su media es igual o no.
b. Factor: Variable cualitativa que queremos ver si influye o no sobre la variable de estudio.
c. Tratamiento/nivel del factor: Distintos valores que puede tomar el factor (grupo)
Para cada tratamiento se utiliza una muestra.
d. Diseño balanceado/equilibrado: Si todas las muestras tienen = tamaño/nivel.
e. Modelo de efectos fijos: Tratamientos se fijan de antemano. (el que vamos a estudiar)
f. Modelo de efectos aleatorios: Muestra aleatoria entre todos los tratamientos posibles.
TEMA 5 página 1
REQUISITOS PARA USAR ANOVA:
ALEATORIEDAD
(Variables aleatorias o no): Se resuelve con el test de rachas.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo:
NORMALIDAD
(Variables normales o no): Se resuelve con el contraste de normalidad.
HOMOCEDASTICIDAD
(Varianzas iguales o no): Se resuelve con el test del Edén.
<- Se tendría que ver si entre los puntos hay una anchura constante o si
se va disminuyendo/aumentando conforme avance la gráfica
(hace forma de embudo o no)
TEMA 5 página 2
si lees esto me debes un besito
OBTENER RESIDUOS:
SPSS: Analizar/Modelo lineal general/Univariable
1. Fijos: Cualitativa.
2. Dependientes: Cuantitativa.
3. Guardar: Residuos no estandarizados
ANOVA:
Si se cumplen los requisitos se puede usar el método ANOVA.
Nos interesa resolver en el siguiente contraste:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Con ANOVA al darse que se cumple que siguen una distribución normal podemos ver si hay diferencias
significativas entre las medias o no, ya que si se cumplen significa que las medias son muy representativas.
-Nos darán una tabla relacionando los tratamientos (grupos) y con un p-valor.
(Para no ir repitiendo el contraste de ANOVA todo el rato decir:
Compararemos con el contraste que nos interesa los tratamientos 2 a 2.)
a. Con el contraste podremos decir si hay diferencias significativas o no.
b. Con el I.C. podremos decir qué media es mayor/menor de los dos tratamientos.
TEMA 5 página 3
si lees esto me debes un besito
KRUSKALL-WALLIS
Método no paramétrico para resolver un contraste si se incumplen los requisitos para usar ANOVA.
Contraste a resolver:
Ho: Distribuciones similares en su tendencia central.
H1: Alguna distribución difiere del resto
(No se comparan las medias ya que las medias no son representativas. (no sigue distrib.normal)
(Solo copiar el contraste 1 vez, basta con decir que resolveremos este contraste de 2 a 2 para cada apartado.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
b. Campos: Campo de prueba(Cuantitativo), grupos (cualitativo).
c. Configuración: Personalizar pruebas: ANOVA de 1 factor Kruskall-Wallis.
Se comparan los p-valor para decir si hay diferencias significativas o no entre cada tratamiento.
Si el valor atípico sale que es el número X, buscar en el fichero de datos cuál es y decir que es la variable
(que le toque en el cuantitativo) y que pertenece al tratamiento (…)
TIP: Si se incumple alguna condición, decid que usaríamos Kruskall-Wallis pero que comprobaremos
todas las hipótesis por si hay algún error, y explicar cómo se haría ANOVA.
TEMA 5 página 4
si lees esto me debes un besito
TEMA 6: MODELO DE REGRESIÓN LINEAL
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Análisis de regresión: Técnica que pretende explicar o predecir el comportamiento de una variable Y
mediante un conjunto de variables independientes.
Variables:
a. Y: DEPENDIENTE
b. X: INDEPENDIENTE
Tipos de modelos:
a. Regresión simple: Modelo si tenemos una única variable independiente para predecir el
comportamiento de la variable dependiente.
b. Regresión múltiple: Modelo si tenemos +1 variable independiente para predecir el comportamiento
de la variable dependiente.
OBJETIVOS
1. Estimar los parámetros desconocidos del modelo (B0 y B1)
2. Comprobar si el modelo es adecuado
ETAPAS
1. Especificación: Determinar variable dependiente, seleccionar independientes y elegir modelo.
2. Estimación de la mejor función que se ajusta a los datos.
3. Validación: Comprobar si la ecuación ayuda
4. Aplicación: Estudiar las relaciones entre las variables, predecir…
OBJETIVO
Estimar coeficientes B0 y B1 de modo que nos proporcione el mejor modelo lineal.
REQUISITOS MÉTODO:
Todo comprobado con residuos.
1. Normalidad de residuos.
2. Linealidad: Relación entre las variables de tipo lineal.
3. Homocedasticidad: Varianza residuos constante.
4. No autocorrelación: Residuos independientes entre sí.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
CALCULO DE RESIDUOS, NO AUTOCORRELACIÓN Y HOMOCEDASTICIDAD
Al crear residuos ya podemos obtener datos para comprobar: No autocorrelación y Homocedasticidad
NORMALIDAD
LINEALIDAD
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
¿PODRÍAMOS CONSIDERAR LA CONSTANTE NULA? (Término independiente)
Resolver contraste:
Sería no nula si fuese significativa (B0≠0) , porque sino podríamos realizar el modelo sin esa variable.
Para interpretarla: Error estándar de regresión (desviación típica): Varianza residual al cuadrado ( )
TIPOS DE PREDICCIONES:
a. Estimador puntual (valor aproximado)
b. Estimación por intervalos
Denotación:
Estimación puntual: Estimación por intervalos:
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Fichero de datos:
a. PRE_1: Estimación puntual.
b. MCI_1 y UMC_1 : Valores para el intervalo (MCI_1 , UMC_1)
Es cuando disponemos de +1 variable independiente (X1, X2,X3..) para explicar la variable dependiente (Y)
(Diferencia entre simple y múltiple: Se puede ver qué variable tiene más peso para Y)
HOMOCEDASTICIDAD
Comprobar que no tenga forma embudo
TABLA: GRÁFICO DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)
LINEALIDAD
a. Gráfico de dispersión: Que las observaciones sean paralelas al eje X.
TABLA: GRÁFICOS DE DISPERSIÓN (RESIDUOS VS VALORES PRONOSTICADOS)
b. Gráficos de dispersión parcial: Gráficos de dispersión de la variable dependiente con cada una de las
variables independientes. (debe apreciarse relación lineal)
TABLA: GRÁFICOS DE REGRESIÓN PARCIAL (VARIABLE Y/ VARIABLE X1,X2..)
NO MULTICOLINEALIDAD
Que las variables no aporten información parecida entre sí (que no haya una relación fuerte entre las
variables independientes).
a. Se mide con el coeficiente de "inflación de la varianza" (VIF) que debe ser VIF<10 para cada v.indep.
a. Si sale VIF>10: Alguna variable superpone a la otra y significa que estamos metiendo info 2 veces
TABLA: COEFICIENTES -> ESTADÍSTICOS DE COLINEALIDAD -> VIF
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TABLA: COEFICIENTES ESTANDARIZADOS -> BETA