Estadística Ejercicios

ESTADÍSTICA
MODELO DE REGRESION
DIAGRAMA DE DISPERSIÓN Y RECTA DE REGRESIÓN
PASOS
-Gráficos
- Cuadro de diálogos antiguos.
-Dispersión /Puntos
Parece que el peso aumenta con la altura. La relación es directa.
OTRA OPCION
-Analizar
- Regresión
- Estimación curvilínea
- Escoger la recta de regresión
COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON (r)
Con el diagrama de dispersión o de puntos se observa cuan relacionados están las dos
variables. R varía entre -1 y 1, mientras más se acerca a 0, la relación de ambas variables es
más débil.
- Incorrelación r=0 (No hay relación entre las variables)

- Relación directa r=0.75 (Hay una fuerte relación entre ambas variables)
- Relación inversa R=-0.2(Hay una débil relación entre ambas variables)
COVARIANZA (Sxy)
Esta nos informa si la nube de puntos es creciente (directa) o decreciente(inversa), pero no nos
muestra el grado de correlación como lo hace el coeficiente de correlación.
- Sxy > 0
- Sxy < 0
- Sxy = 0
HIPÓTESIS
Ho=Hipótesis Nula. (ningún cambio, ninguna diferencia, ningún efecto)

H1=Hipótesis alternativa. (Siempre queremos probar la alternativa y decir que rechazamos
Ho)
-hipótesis alternativa bilateral (dos colas con áreas de rechazo)

-hipótesis alternativa unilateral a la izquierda (<) o derecha (>) ( una cola con área de
rechazo)
ESTRUCTURA DE PRUEBA DE HIPÓTESIS
1. Plantear Ho y H1
2. Establecer el nivel de significancia
3. Escoger el estadístico de prueba = Cálculo del estadístico de contraste
4. Regla de decisión (Toma la decisión)
5. Conclusiones
EJERCICIO 1: HIPÓTESIS PARA LA MEDIA (VARIABLES INDEPENDIENTES)
Se tiene los montos de miles de dólares de la compra de bonos del exterior de 20 empresas del
sector minero, en las cuales 10 de dichas empresas utilizaron la bolsa de valores y las 10 no la
utilizaron.
SUPUESTOS:
- Las variables son Independientes

- Se cumple homocedasticidad
- Los grupos siguen una distribución normal.
MONTO BV
237 SI
289 SI
257 SI
228 SI
303 SI
275 SI
262 SI
304 SI
244 SI
233 SI
194 NO
240 NO
230 NO
186 NO
265 NO
222 NO
242 NO
281 NO
240 NO
212 NO
1. Planteamos hipótesis.
Ho: U1=U2: Las medias de ambos grupos son iguales
Ho: U1≠U2: Las medias de ambos grupos son diferentes.
2. Escogemos significancia
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Prueba T para muestras independientes. )
PASOS T de muestras independientes

Analizar Compare medias  prueba T de muestras independientes
Variable de Prueba: Montos/ Grupo de variable: BV.  Definir grupos:
Valor 1: 1 (si) /Valor 2: 2 (no)
Estadísticas de grupo
BOLSADE Desv. Desv. Error
VALORES N Media Desviación promedio
MONTOS EN SI 10 263,20 28,479 9,006
DÓLARES NO 10 231,20 29,393 9,295
4. Toma de decisión
No importa si asumimos que las varianzas son iguales o desiguales ya que tienen el
mismo valor en ambos casos, sin embargo, si prestamos atención. P-value = 0.862 lo
que significa aceptar la Ho: σ 2 1=σ 2 2
Con la evaluación de medias, prestamos atención a la prueba T con 18 grados de

libertad p- value = 0.024 lo cual indica que rechazamos Ho y aceptamos H1: Las medias
de ambos grupos difieren en 32. Esto quiere decir que las empresas que si utilizaron la
BV tienen mas dinero en promedio que los que no utilizaron la bolsa de valores.
EJERCICIO 2: HIPÓTESIS PARA LA VARIANZA CON DATOS
Un analista de mercados bursátiles está evaluando la variabilidad medida por la desviación

estándar σ=2. Durante su análisis, él registró las mediciones 4.1,5.2 y 10.2 ¿Estos datos
confirman o desaprueban lo dicho por él? Pruebe la hipótesis apropiada y construya un
intervalo de confianza de 90% para estimar el verdadero valor de población.
Ho: σ 2=4
H1: σ 2 ≠ 4
Hallamos s2=10.57
EJERCICIO 3: TABLAS DE CONTINGENCIA
Los empleados de una compañía eligen uno de tres posibles planes de pensión. La
gerencia desea saber con α= 0.05 si la preferencia en la elección es independiente de
la clasificación del contrato (asalariados y por horas) De una muestra aleatoria de 500
empleados se obtiene la siguiente tabla de contingencia.
Tipo de Contrato Plan 1 Plan 2 Plan 3 Total

Asalariados 160 140 40 340
Por Horas 40 60 60 160
Total 200 200 100 500
Ho: Hay independencia de variables. La preferencia de la elección de planes es
independiente de la clasificación del contrato.
H1: Hay dependencia de variables.
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Prueba de ji-cuadrado- Tablas cruzadas)
El ji-cuadrado reconoce el grado de asociación entre dos variables dicotómicas o

politómicas. Para plasmar el cuadro de contingencia primero ponderamos los datos.
PASOS PARA PONDERACÓN

Datos Ponderar casos  ponderar casos mediante: Frecuencia  aceptar
Luego hacemos el análisis de las tablas cruzadas:
PASOS PARA tablas cruzadas

Analizar análisis descriptivo  Tablas cruzadas  Filas: tipo de contrato/
columna: planes  estadísticos: chi cuadrado  casillas(porcentaje columnas)
La variable independiente va en las filas
La variable de consecuencia va en las columnas.
INTERPRETACIÓN DE LA TABLA DE CONTINGENCIA USANDO LOS PORCENTAJES.
Podemos interpretar este cuadro de la siguiente manera.
El 80% de los Asalariados escogen el plan 1 en contraste con los de categoría por horas
que solo el 20% escoge el plan 1. De forma general Los planes 1 y 2 son más atractivos
para los asalariados. Mientras que el Plan 3 parece ser más interesante para los que
trabajan en la categoría por horas.
4. Toma de decisión
Si CHI-cuadrado empírico es mayor que el chi cuadrado teórico entonces rechazamos
la Ho. Por otro lado, p-value = 0.000 lo cual indica que es menos a 0.05. Entonces de
esta manera rechazamos H0: Independencia de variables.
5: Conclusión:
Las preferencias de los planes dependen de la clasificación salarial de los trabajadores
en la empresa.
EJERCICIO 4: TABLAS DE CONTINGENCIA DESDE OTRA PERSPECTIVA
¿Qué tipo de inversión se necesita en las regiones tipificadas como pobres? Determinar el tipo
de inversión necesaria por regiones. (Tomamos en cuenta
Tipos de inversión Ayacucho Huancavelic Apurímac Cajamarca

a
OI 30 60 15 15
APP 15 15 30 30
IED 30 15 15 30
Ho: El tipo de inversión necesaria para salir de la pobreza de las regiones estipuladas
es diferente y de acuerdo a su realidad.
H1: El tipo de inversión necesaria para salir de la pobreza de las regiones estipuladas
es semejante y de acuerdo a su realidad.
1-α=95%
Α=5% = 0.05
3. Prueba estadística (Análisis de correspondencia)
PASOS PARA EL ANÁLISIS DE CORRESPONDENCIA

Analizar Reducción de dimensiones  Análisis de correspondencia  filas:
TI/Columnas: Regiones  chi cuadrado-> Puntos de fila Simétrico Normalización.
EJERCICIO 5: REGRESION LINEAL CON UNA SOLA VARIABLE
Generamos una ecuación modelo para encontrar valores en los puntos de una función lineal.
Existe causa efecto:
- Variable X: Causa, Exógena, Explicativa, Predictiva, independiente

- Variable Y: Efecto, Endógena, Explicada, Predicha, dependiente
PASOS PARA LA REGRESION
Analizar Regresión  Lineales  Variable X (independiente), Variable Y (dependiente)
 Observo en la tabla R y R2
Coeficiente de correlación de Pearson: 0.83
Coeficiente de determinación R cuadrado: 0.703 Explica que el 70% la variabilidad de la

variable Y.
R ajustado para dos variables
Calculo de ANOVA
SCR: Suma de cuadrados de la regresión
SCE: Suma de cuadrados de residuo
SCT: Suma de cuadrados totales.
CORRELACIONES
Expresa hasta que punto dos variables están relacionadas linealmente, también indica la
dirección de la relación.
Ho: B1=0, No hay correlación significativa entre variables: Existe relación

H1: B1≠0, Existe una correlación significativa entre variables: No hay relación
PASOS PARA LA CORRELACIÓN

Analizar Correlacionar  Bivariadas  Aceptar
p-value = 0.000 lo cuál indica que rechazamos la Ho.
Finalmente graficamos el diagrama de dispersión.
Por lo tanto, afirmamos que hay una relación inversa entre la variable X y Y.
EJERCICIO 5: REGRESION LINEAL MULTIPLE (VARIAS VARIABLES EXÓGENAS)
PRUEBAS DE NORMALIDAD A LA VARIABLE DEPENDIENTE
Las regresiones múltiples tienen dos fines: Exploratorio y predictivo (Predecir el

comportamiento)
Variable Endógena: Salarios
Salario = f(Edad, nivel educativo, género, TTP)
1. Observamos si el salario tiene una distribución normal y también hallamos la prueba

KS (Kolmogorov-Smirnov) para ver su normalidad.
PASOS PARA HALLAR NORAMLIDAD CON KS

Analizar Pruebas no paramétricas  cuadro de diálogos antiguos  KS de una
muestra  Lista de variable de prueba (la variable que quiero evaluar que en este
caso es el salario (Y))  Check en Normal  aceptar
Ho: Los datos analizados siguen una distribución normal.

H1: Los datos analizados NO siguen una distribución normal.
P-value = 0.00, indica que rechazamos Ho. Por lo tanto, Los datos analizados no tienen una
distribución normal. Y la variable endógena (salarios ) presenta un sesgo positivo.
2. Por la no normalidad, convertimos el salario en logaritmos.

Generando una nueva variable dependiente Lsalario.
PASOS PARA GENERAR UNA VARIABLE CON LOG.

Transformar  Calcular variable  nuevo nombre en “variable objetivo” 
Grupo de funciones “aritméticas”  Funciones y Variables especiales “Ln” 
Arrastramos la función Ln al cuadro expresión numérica  arrastramos salarios
Volvemos a calcular KS y el histograma para observar si hay normalidad.

p-value = 0.01
OTRA FORMA DE HALLAR LA DISTRIBUCIÓN NORMAL

Analizar  Estadísticos descriptivos  Explorar  Lista de dependientes
(Lsalarios)  Gráficos  Click en Gráficos de normalidad con pruebas Click en
histogramas
La prueba de Shapiro – Wilk es viable cuando usemos muestras con más de 50 datos.
Como seguimos rechazando la normalidad, finalmente, escogemos los datos que más se
asemejan a una normalidad y este el es logaritmo neperiano del salario.
¿Qué modelo deberíamos preferir?
Por lo que evaluamos el test de Levene.

VARIANZAS EN DOS O MÁS GRUPOS (TEST DE LEVENE)
Ho: La varianza de los grupos son iguales
H1: La varianza de los grupos son diferentes
TEST DE LEVENE
Analizar  Estadísticos descriptivos  Explorar  Lista de dependientes (Lsalarios)
 Factor, otra variable como el género.
Aceptamos Ho: La varianza de los grupos son iguales. Por lo tanto elegimos Lsalario como
variable endógena.
REGRESIÓN DE LA EDAD CON EL GÉNERO
Edad =f(género)

 p-value es 0.913 Aceptamos la Ho: No hay correlación significativa.
REGRESIÓN DE LA EDAD CON EL GÉNERO
Nivel Educativo =f(género)

 p-value es 0.00. No hay evidencia significativa para aceptar Ho. Esto indica que
si hay una cierta asociación entre ambas variables.
REGRESIÓN DEL SALARIO CON EL GÉNERO
LSALARIO =f(género)

R2= COEFICIENTE DE DETERMINACIÓN/ BONDAD DE AJUSTE 7.3% de comportamiento con
respecto a los salarios, el genero tiene un 7% de variación con respecto a los salarios.
DISCRIMINACIÓN SALARIAL
Mediante el cuadro de coeficientes podemos establecer la función del salario con respecto al
género.
Lsalario = 4.734 – 0.25G+ e(error de perturbación)

0.25
e −1=0.78−1=0.22=22 %
ESTADISTICA PARA UNA MUESTRA
Vamos a evaluar su promedio, entonces vamos a partir
H0: µ=0
H1: µ≠0
Queremos probar la afirmación de que la media de la poblacion es mayor que 35 (o la

puntuación media de 38.6 es significativamente mayor que 35)
H0: µ= 35 H1: µ˃35
Analizar  Comparar medias  prueba t para una muestra  pasamos Y  opciones

VALOR DE PRUEBA 35
Prueba para una muestra

Valor de prueba = 35
95% de intervalo de confianza de
Diferencia de
t gl Sig. (bilateral) la diferencia
medias
Inferior Superior
Y 1,643 14 ,123 3,600 -1,10 8,30
COMPARAR MEDIAS
Analizar  Comparar medias  prueba t para una muestra  Abrimos la caja de dialogo y
pasamos la variable  click en opciones ingresamos el nivel de confianza  continuar y
Ok
Prueba para una muestra

Valor de prueba = 0
95% de intervalo de confianza de
Diferencia de
t gl Sig. (bilateral) la diferencia
medias
Inferior Superior
Y 17,622 14 ,000 38,600 33,90 43,30
Antes de todo, se tiene que halla el análisis exploratorio
Analizar  Estadísticos descriptivos  explorar  Abrimos la caja de dialogo y pasamos la

variable  click en gráficos check en histpgramas y grafico de normalidad con pruebas 
continuar y aceptar
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
Y ,212 15 ,068 ,881 15 ,049
a. Corrección de significación de Lilliefors
H0: la muestra a sido extraída de población normal

H1: la muestra a sido extraída de población no normal
p-value ˃alfa
0.068 ˃0.05 se acepta la H0
REGLA: P-VALUE <α, SE Rechaza la H0.
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
Datos apareados
Analizar  comparar medias  prueba t para muestras relacionadas  cuadro de dialogo:

Variable1: antes, Variable2: después  click en opciones: elegimos el nivel de confianza.
Estadísticas de muestras emparejadas

Desv. Desv. Error
Media N Desviación promedio
Par 1 PRECIO AA 263,20 10 28,479 9,006
PRECIO DA 231,20 10 29,393 9,295
PARA MUESTRAS INDEPENDIENTE
Analizar  comparar medias  prueba t para muestras independientes  cuadro de

dialogo: Variable1: variable de prueba: montos, Grupo de Variable: BV Definir Grupos 1.
No 2.. si continuar.
Se usa si es tipo una variable damy.

CON BASE DE DATO DEL PROFESOR
EN LA BASE DE DATOS QUE SE ENCUESTO A 500 TRABAJADORES QUE LABORAN EN SECTOR
AGROINDUSTRIAL
Vamos a predecir
Salario de 500 trabajadores empleado en el sector (s/. x dia laborado).
Edada 20-70 años
Nivel educativo: Variable categorica (ordinal) cuyos vaores son 1,2,3 y 4
Genero: variable dammy cuyos valores son 1=mujer, 0= varón
TTP: Trabajo a tiempo parcial. Variable dammy cuyos valores son:
1 = si trabajan menos de tres días a la semana
2 = si trabajan más de tres días a la semana
El salario depende de la edad
El salario depende de nivel educativo
El salario depende del género (ósea puede haber descremación)
Si hay discrinacion salarial, y en que porcentaje?
1. Visualiar la data:
L
SALARIO=F(EDAD, NIVEL EDUCATIVO, GENERO, TTP)
PARA GRAFICAR: GRAFICO*cuadro de dialogo antiguo*histogramas
QUE S UTILIZA PARA TRANSFORMAR (LOGARITO)

Transformar*calcular variable*poner LSALARIO
H0: la distribución d la población
Saphiro wb para muestras pequeñas
Cormorrov: mas de 50
Prueba de Kolmogorov-Smirnov para una muestra

SALARIOS
N 500
Parámetros normalesa,b Media 114,90
Desv. Desviación 55,156
Máximas diferencias Absoluto ,118
extremas Positivo ,118
Negativo -,093
Estadístico de prueba ,118
Sig. asintótica(bilateral) ,000c
a. La distribución de prueba es normal.
b. Se calcula a partir de datos.
c. Corrección de significación de Lilliefors.
Por lo tanto, la variable endógena será variable (lsalario)
Estadístico gl Sig. Estadístico gl Sig.
SALARIOS ,118 500 ,000 ,898 500 ,000
Edad con genero

Las relaciones simples, nos permiten afirmar inicialmente
Resumen del modelo

R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,005a ,000 -,002 10,845
a. Predictores: (Constante), GENERO
ANOVAa
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 1,418 1 1,418 ,012 ,913b
Residuo 58571,532 498 117,614
Total 58572,950 499
a. Variable dependiente: EDAD
b. Predictores: (Constante), GENERO
Regresión*lineal y pasas
Educacion con genrro
Resumen del modelo

R cuadrado Error estándar
Modelo R R cuadrado ajustado de la estimación
1 ,225a ,051 ,049 1,031
a. Predictores: (Constante), GENERO
Existe una relación con la educación
ANOVAa
Suma de Media
1 Regresión 28,285 1 28,285 26,594 ,000b
Residuo 529,673 498 1,064
Total 557,958 499
a. Variable dependiente: NIVEL EDUCATIVO
Lsalario con genero

Coeficientesa
Coeficientes
Coeficientes no estandarizados estandarizados
Modelo B Desv. Error Beta t Sig.
1 (Constante) 4,734 ,024 194,449 ,000
GENERO -,251 ,040 -,270 -6,246 ,000
a. Variable dependiente: LSALARIO
R2 vondad de ajuste es 7% de ajuste esta reacionado con el genero
ANOVAa
Suma de Media
1 Regresión 7,305 1 7,305 39,010 ,000b
Residuo 93,260 498 ,187
Total 100,566 499
REGRESION MULTIPLE
Analizar * Regresión* lineales*
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) 3,053 ,055 55,168 ,000 2,944 3,161
GENERO -,041 ,025 -,044 -1,663 ,097 -,090 ,007
EDAD ,031 ,001 ,739 24,041 ,000 ,028 ,033
NIVEL ,233 ,011 ,549 21,874 ,000 ,212 ,254
EDUCATIVO
TRABAJO A -,365 ,032 -,369 - ,000 -,427 -,303
TIEMPO PARCIAL 11,576
SI LOS trabajadores difieren en un año de edad, el empleado de mayor de edad gana en

promedio 3% mas de salario
Si difiere en un nivel educativo, el empleado con mayor nivel de educación gana en
promedio 26% mas d salario
La persona que trabaja menos de tres días a la semana, gana en promedio 31% menos de
salario.
Por lo tanro, la tabla nos muestra el efecto genero.
Que es una variable dammy? O ficticia: le vamos generar damis para ver que ocurrió en
los puntas de la imagen
Transformar Recodificar en distintas variables  cambio de nombre y agrego valores

antiguos y nuevos luego aceptar
EL EFECTO DE EDUCACCION ES CONSTANTE B5 VA SER COEFICIENTE
Coeficientesa
Coeficientes no Coeficientes 95.0% intervalo de
estandarizados estandarizados confianza para B
Límite Límite
Modelo B Desv. Error Beta t Sig. inferior superior
1 (Constante) 3,609 ,051 70,680 ,000 3,508 3,709
GENERO -,125 ,026 -,134 -4,797 ,000 -,176 -,074
EDAD ,021 ,001 ,517 19,001 ,000 ,019 ,024
DE2 ,166 ,031 ,164 5,416 ,000 ,106 ,226
DE3 ,375 ,033 ,340 11,316 ,000 ,310 ,440
DE4 ,754 ,040 ,565 18,806 ,000 ,675 ,832
LOS EFECTOS DE SOBRE EL SALARIO SON DIFIEREN SIGNIFICATIVAMNETE
Dividimos en grupo los salarios

1. Menor qu 200
2. De 200 a 300
3. Mayor que 300
Y comparamos con niveles educativos
Analizaremos si son independientes o no.
Se tiene que recodificar el variable de grupo separado
Transformar Recodificar en distintas variables  cambio de nombre y agrego valores
antiguos y nuevos luego aceptar
Lo caul se tiene SALARIOREC

Lo mismo ocurre para EDADREC
Para nalaizar se usa lo siguiente
Analizar Estadísticos Descriptivos  tablas cruzadas
En estadísticos  clik Ch2 continuar casillas activo columnas
a. Analizar*estadísticos descriptivos*frecuencia de edadrec
Descriptivos
Error
Edadrec Estadístico estándar
Salarios menos de Media 83,17 2,909
30 95% de intervalo de confianza para la Límite inferior 77,40
media Límite 88,93
superior
Media recortada al 5% 81,08
Mediana 77,00
Varianza 871,531
Desviación estándar 29,522
Mínimo 38
Máximo 182
Rango 144
Rango intercuartil 33
Asimetría 1,233 ,238
Curtosis 1,680 ,472
30-50 Media 113,63 2,971
95% de intervalo de confianza para la Límite inferior 107,78
media Límite 119,48
superior
Mediana 99,00
Varianza 2798,911
Mínimo 32
Máximo 384
Rango 352
Asimetría 1,400 ,137
Curtosis 2,885 ,273
más de 50 Media 160,79 6,560
95% de intervalo de confianza para la Límite inferior 147,73
media Límite 173,85
superior
Mediana 155,00
Varianza 3443,106
Mínimo 68
Máximo 364
Rango 296
Asimetría ,950 ,269
Curtosis 1,276 ,532
Las medias puntales son: 83.165;113.63;160.787

Los intervalos de confianza son [77.39;88.93], [107.78;119.47] y [147.72;173.84], los
cuales los anchos de intervalos de los primeros estratos son casi similares, teniendo el
tercer grupo una mayor amplitud, por lo que es muy probable que el tercer grupo
presente una diferencia con respecto a las demás medias.
b. Prueba de normalidad
Edadrec Estadístico gl Sig. Estadístico gl Sig.
Salarios menos de 30 ,114 103 ,002 ,908 103 ,000
30-50 ,113 317 ,000 ,900 317 ,000
más de 50 ,080 80 ,200* ,944 80 ,002
*. Esto es un límite inferior de la significación verdadera.
Se encuentra la significancia estadística (p-value<α) en los dos primeros grupos

considerando K-S y considerando shapiro-wilk los tres grupos son
significativos, lo que nos lleva a manifestar que estamos frente a distribuciones
por cada grupo normales.
c. Analizar*comparar medias*anova de un factor
Clik en post hoc*activo tukey y Bonferroni* clik en opciones y activo prueba de

homogeneidad y aceptar
ANOVA
Salarios
Suma de Media
cuadrados gl cuadrática F Sig.
Entre grupos 272695,601 2 136347,801 54,414 ,000
Dentro de grupos 1245357,399 497 2505,749
Total 1518053,000 499
Prueba de homogeneidad de varianzas

Estadístico de
Levene gl1 gl2 Sig.
Salarios Se basa en la media 15,271 2 497 ,000
Se basa en la mediana 12,188 2 497 ,000
Se basa en la mediana y con 12,188 2 447,938 ,000
gl ajustado
Se basa en la media 14,249 2 497 ,000
recortada
Comparaciones múltiples
Variable dependiente: Salarios
Intervalo de confianza al
95%
(J) Diferencia de Desv. Límite Límite
(I) Edadrec Edadrec medias (I-J) Error Sig. inferior superior
HSD menos de 30-50 -30,466 *
5,677 ,000 -43,81 -17,12
Tukey 30 más de 50 -77,622* 7,460 ,000 -95,16 -60,09
30-50 menos de 30,466* 5,677 ,000 17,12 43,81
30
más de 50 -47,157* 6,263 ,000 -61,88 -32,43
más de 50 menos de 77,622*
7,460 ,000 60,09 95,16
30
30-50 47,157* 6,263 ,000 32,43 61,88
Bonferroni menos de 30-50 -30,466* 5,677 ,000 -44,10 -16,83
30 más de 50 -77,622 *
7,460 ,000 -95,54 -59,70
30-50 menos de 30,466*
5,677 ,000 16,83 44,10
30
más de 50 -47,157* 6,263 ,000 -62,20 -32,11
más de 50 menos de 77,622* 7,460 ,000 59,70 95,54
30
30-50 47,157* 6,263 ,000 32,11 62,20
*. La diferencia de medias es significativa en el nivel 0.05.

Estadística Ejercicios

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Ejercicios

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA

Parece que el peso aumenta con la altura. La relación es directa.

- Incorrelación r=0 (No hay relación entre las variables)

Ho=Hipótesis Nula. (ningún cambio, ninguna diferencia, ningún efecto)

-hipótesis alternativa bilateral (dos colas con áreas de rechazo)

ESTRUCTURA DE PRUEBA DE HIPÓTESIS

- Las variables son Independientes

PASOS T de muestras independientes

Con la evaluación de medias, prestamos atención a la prueba T con 18 grados de

EJERCICIO 2: HIPÓTESIS PARA LA VARIANZA CON DATOS

Un analista de mercados bursátiles está evaluando la variabilidad medida por la desviación

EJERCICIO 3: TABLAS DE CONTINGENCIA

Tipo de Contrato Plan 1 Plan 2 Plan 3 Total

El ji-cuadrado reconoce el grado de asociación entre dos variables dicotómicas o

PASOS PARA PONDERACÓN

PASOS PARA tablas cruzadas

EJERCICIO 4: TABLAS DE CONTINGENCIA DESDE OTRA PERSPECTIVA

Tipos de inversión Ayacucho Huancavelic Apurímac Cajamarca

PASOS PARA EL ANÁLISIS DE CORRESPONDENCIA

Existe causa efecto:

- Variable X: Causa, Exógena, Explicativa, Predictiva, independiente

Coeficiente de correlación de Pearson: 0.83

Coeficiente de determinación R cuadrado: 0.703 Explica que el 70% la variabilidad de la

R ajustado para dos variables

SCR: Suma de cuadrados de la regresión

SCE: Suma de cuadrados de residuo

SCT: Suma de cuadrados totales.

Ho: B1=0, No hay correlación significativa entre variables: Existe relación

PASOS PARA LA CORRELACIÓN

Finalmente graficamos el diagrama de dispersión.

EJERCICIO 5: REGRESION LINEAL MULTIPLE (VARIAS VARIABLES EXÓGENAS)

PRUEBAS DE NORMALIDAD A LA VARIABLE DEPENDIENTE

Las regresiones múltiples tienen dos fines: Exploratorio y predictivo (Predecir el

Variable Endógena: Salarios

Salario = f(Edad, nivel educativo, género, TTP)

1. Observamos si el salario tiene una distribución normal y también hallamos la prueba

PASOS PARA HALLAR NORAMLIDAD CON KS

Ho: Los datos analizados siguen una distribución normal.

2. Por la no normalidad, convertimos el salario en logaritmos.

PASOS PARA GENERAR UNA VARIABLE CON LOG.

Volvemos a calcular KS y el histograma para observar si hay normalidad.

OTRA FORMA DE HALLAR LA DISTRIBUCIÓN NORMAL

¿Qué modelo deberíamos preferir?

Por lo que evaluamos el test de Levene.

Ho: B1=0, No hay correlación significativa entre variables: Existe relación

 p-value es 0.913 Aceptamos la Ho: No hay correlación significativa.

REGRESIÓN DE LA EDAD CON EL GÉNERO

Nivel Educativo =f(género)

Ho: B1=0, No hay correlación significativa entre variables: Existe relación

REGRESIÓN DEL SALARIO CON EL GÉNERO

Ho: B1=0, No hay correlación significativa entre variables: Existe relación

Lsalario = 4.734 – 0.25G+ e(error de perturbación)

Vamos a evaluar su promedio, entonces vamos a partir

Queremos probar la afirmación de que la media de la poblacion es mayor que 35 (o la

H0: µ= 35 H1: µ˃35

Analizar  Comparar medias  prueba t para una muestra  pasamos Y  opciones

Prueba para una muestra

Prueba para una muestra

Analizar  Estadísticos descriptivos  explorar  Abrimos la caja de dialogo y pasamos la

H0: la muestra a sido extraída de población normal

0.068 ˃0.05 se acepta la H0

REGLA: P-VALUE <α, SE Rechaza la H0.

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS

PARA GRAFICAR: GRAFICOcuadro de dialogo antiguohistogramas

a. Analizarestadísticos descriptivosfrecuencia de edadrec

c. Analizarcomparar mediasanova de un factor

Clik en post hocactivo tukey y Bonferroni clik en opciones y activo prueba de