Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESCUELA DE POST-GRADO
MAESTRIA EN:
PRACTICA N° 02
PREGUNTA N° 01
Los valores sobre las longitudes en micras de 50 filamentos de la producción de una máquina (que se
supone normal), son las siguientes:
SOLUCION:
12
10
8
Frecuencia
Media =108,38
Desviación típica =10,81
N =50
0
80 90 100 110 120 130 140
filamento
A). Hallar el intervalo de confianza para la longitud para la media de la producción basado en la muestra
de los 50 filamentos al 90 % de nivel de confianza.
Estadísticos para una muestra
Valor de prueba = 50
90% Intervalo de
confianza para la
diferencia
Diferencia
t gl Sig. (bilateral) de medias Inferior Superior
filamento 38.156 49 .000 58.360 55.80 60.92
Ho= Se rechaza que las longitudes de los 50 filamentos al 90 % de nivel confianza, donde el intervalo se
ubica entre una diferencia inferior al 50.80 y superior 60.92.
B). Contrastar la hipótesis nula de que la longitud media de los filamentos de la producción es de 100 al
nivel de alfa = 10 basados en la muestra.
Ho= Se rechaza que las longitudes de los 100 filamentos al 10 % de nivel confianza, donde el intervalo se
ubica entre una diferencia inferior al 8.17 y superior 8.55.
PREGUNTA N° 02
SOLUCION.
Estadísticos
CABLE
N Válidos 18
Perdidos 0
CABLE
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 1.97 1 5.6 5.6 5.6
1.99 1 5.6 5.6 11.1
2.01 1 5.6 5.6 16.7
3.12 1 5.6 5.6 22.2
3.24 1 5.6 5.6 27.8
3.41 1 5.6 5.6 33.3
3.56 1 5.6 5.6 38.9
4.01 1 5.6 5.6 44.4
4.15 1 5.6 5.6 50.0
5.05 1 5.6 5.6 55.6
5.98 1 5.6 5.6 61.1
6.13 1 5.6 5.6 66.7
6.87 1 5.6 5.6 72.2
6.92 1 5.6 5.6 77.8
7.37 1 5.6 5.6 83.3
7.86 1 5.6 5.6 88.9
8.04 1 5.6 5.6 94.4
9.00 1 5.6 5.6 100.0
Total 18 100.0 100.0
Histograma
3
Frecuencia
Media =5,04
Desviación típica =2,282
N =18
0
0,00 2,00 4,00 6,00 8,00 10,00
CABLE
A).
a1). Hallar el intervalo de confianza para la longitud media en cm. Para los 18 pedazos de cable al 95 %
de nivel de confianza.
Valor de prueba = 0
95% Intervalo de
confianza para la
diferencia
Diferencia
t gl Sig. (bilateral) de medias Inferior Superior
CABLE 9.365 17 .000 5.03778 3.9028 6.1727
a2). Hallar el intervalo de confianza para la longitud media en cm. Para los 18 pedazos de cable al 98 %
de nivel de confianza.
Valor de prueba = 0
98% Intervalo de
confianza para la
diferencia
Diferencia
t gl Sig. (bilateral) de medias Inferior Superior
CABLE 9.365 17 .000 5.03778 3.6569 6.4187
B). Basados en estos datos, ¿podemos decir que la longitud media de los pedazos de cable es mayor de
4 cm.?
Donde la población normal con una desviación estándar de 2,3 y se toma un nivel de significancia de
0.05 que es igual al 5%
T-TEST
/TESTVAL = 2.3
/MISSING = ANALYSIS
/VARIABLES = CABLE
/CRITERIA = CI(.05).
PREGUNTA N° 03
Los niveles de audiencia (en miles de personas) de un programa de televisión, medidos en 10 emisiones
legidas aleatoriamente, han sido los siguientes: 682, 553, 555,666, 657, 649, 522, 568,700,
52.Suponiendo que los niveles de audiencia siguen una distribución normal, ¿Se podría afirmar,
conun95%deconfianza, que la audiencia media del programa es de 600.000 espectadores por programa?
SOLUCION:
Estadísticos
AUDIENCIA
N Válidos 10
Perdidos 0
AUDIENCIA
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 700 1 10.0 10.0 10.0
682 1 10.0 10.0 20.0
666 1 10.0 10.0 30.0
657 1 10.0 10.0 40.0
649 1 10.0 10.0 50.0
568 1 10.0 10.0 60.0
555 1 10.0 10.0 70.0
553 1 10.0 10.0 80.0
552 1 10.0 10.0 90.0
522 1 10.0 10.0 100.0
Total 10 100.0 100.0
AUDIENCIA
700
682
666
657
649
568
555
553
552
522
Estadísticos
AUDIENCIA
N Válidos 10
Perdidos 0
Media 610.40
Mediana 608.50
Mínimo 522
Máximo 700
AUDIENCIA
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 522 1 10.0 10.0 10.0
552 1 10.0 10.0 20.0
553 1 10.0 10.0 30.0
555 1 10.0 10.0 40.0
568 1 10.0 10.0 50.0
649 1 10.0 10.0 60.0
657 1 10.0 10.0 70.0
666 1 10.0 10.0 80.0
682 1 10.0 10.0 90.0
700 1 10.0 10.0 100.0
Total 10 100.0 100.0
Calculo de Hipostasis
PREGUNTA N° 04
Se seleccionan dos muestras aleatorias e independientes del número de puestos de trabajo creados
en el último mes por diferentes empresas de dos sectores económicos. La información suministrada
por las muestras es la Siguiente:
Con el fin de conocer el impacto de las nuevas modalidades de contratación en ambos sectores y
suponiendo que el número de empleos creados siguiera en ambos sectores distribuciones normales
con varianzas iguales: ¿Podríamos afirmar con un 99%deconfianza, que ambos sectores son similares
en cuanto al número medio de empleos creados en el último mes?
SOLUCION:
Estadísticos
EMPLEO SECTOR
N Válidos 12 12
Perdidos 0 0
Media 19.42 1.50
Mediana 19.00 1.50
Varianza 27.174 .273
EMPLEO
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 13 1 8.3 8.3 8.3
14 1 8.3 8.3 16.7
15 2 16.7 16.7 33.3
18 1 8.3 8.3 41.7
19 2 16.7 16.7 58.3
20 1 8.3 8.3 66.7
21 1 8.3 8.3 75.0
22 1 8.3 8.3 83.3
26 1 8.3 8.3 91.7
31 1 8.3 8.3 100.0
Total 12 100.0 100.0
SECTOR
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos SECTOR A 6 50.0 50.0 50.0
SECTOR B 6 50.0 50.0 100.0
Total 12 100.0 100.0
EMPLEO
Frecuencia
3
Media =19,42
Desviación típica =5,213
N =12
0
10 15 20 25 30 35
EMPLEO
SECTOR
10
8
Frecuencia
Media =1,5
Desviación típica =0,522
N =12
0
0,5 1 1,5 2 2,5
SECTOR
TABLAS DE CONTINGENCIA
PREGUNTA N° 05
En un proceso de producción se registró el número de objetos defectuosos clasificando los por turnos
de producción y por máquinas de producción. Las frecuencias observadas se registran entabla de
contingencia 3x3. Verificar al nivel de significación del 5%, si el número de objetos defectuosos
producidos por las máquinas es independiente de los turnos de producción.
MAQUINA
TURNOS TOTAL
A B C
Mañana 75 90 85 250
Tarde 70 85 70 225
Noche 95 85 75 255
Total 240 260 230 730
SOLUCION:
Ho: El número de objetos producidos por las máquinas no dependen de los turnos.
H1: El número de objetos producidos por las máquinas si depende de los turnos
PROCEDIMIENTO
Una vez creada la base de datos, abrimos Analizar, estadísticos descriptivos, tablas de contingencia. En
filas ponemos variables x, como maquinas dependen de turnos, en filas ponemos turnos y en columnas
máquinas. Seleccionamos mostrar los gráficos de barras agrupadas, exactas, nivel de confianza 95%.
De acuerdo al gráfico se puede concluir que el número de objetos defectuosos producidos por las
máquinas es independiente de los turnos de producción.
PREGUNTA N° 06
Se selecciona una muestra de 800 votantes y se les clasifica de acuerdo a su nivel de ingresos como: bajo,
medio, alto y según su opinión con respecto a una reforma impositiva en: a favor, en contra, sin decisión.
Las frecuencias observadas se dan en la siguiente tabla. Con nivel de significación del 5%. Son
independientes la opinión de los votantes y su nivel de ingresos.
INGRESO
OPINION
BAJO MEDIO ALTO
A Favor 200 130 70
En Contra 60 60 80
Sin Decisión 40 60 100
SOLUCION:
PROCEDIMIENTO
Una vez creada la base de datos, abrimos Analizar, estadísticos descriptivos, tablas de contingencia. En
filas ponemos variables x, como maquinas dependen de turnos, en filas ponemos turnos y en columnas
máquinas. Seleccionamos mostrar los gráficos de barras agrupadas, exactas, nivel de confianza 95%.
De acuerdo al gráfico se puede concluir que la opinión de los votantes no depende de su nivel de ingresos.
PREGUNTA N° 07
El gerente de compras de una empresa está considerando 4 máquinas de marcas diferentes para su
uso en el ensamble de un producto particular. Estas están siendo comparadas con respecto a su
velocidad. En un experimento diseñado para determinar si hay diferencias en la velocidad promedio
de las 4 máquinas se observan los tiempos empleados en producir 6 artículos en forma aleatoria de
cada máquina. Los tiempos registrados en segundos se presentan en la tabla siguiente. Determine
al nivel de significación del 5%, si las maquinas llevan a cabo la tarea a la misma velocidad promedio.
MAQUINA
1 2 3 4
55 60 64 42
46 58 62 45
45 68 51 52
73 58 57 44
50 63 65 42
63 52 68 56
SOLUCION:
PROCEDIMIENTO
Una vez digitalizada la base de datos abrimos analizar, comparar medias, anova de un factor (para
realizar el análisis de varianza para las medias). En lista de dependientes ponemos velocidad y en factor
tipo_maquina. Aceptar.
Como sig (0.013) es menor que 0.05, entonces se rechaza la hipótesis nula, es decir el promedio de
velocidad de las maquinas no son iguales.
PREGUNTA N° 08
Los números que siguen son las pérdidas de peso de ciertas partes de una máquina debidas al a fricción en
mgr, donde se utilizaron con tres lubricantes diferentes. Realice un análisis de varianza para demostrar
con un nivel de significación del 5% si las diferencias entre lastres medias de la muestra se pueden atribuir
a la oportunidad.
SOLUCION:
PROCEDIMIENTO
Una vez digitalizada la base de datos abrimos analizar, comparar medias, anova de un factor (para realizar
el análisis de varianza para las medias). En lista de dependientes ponemos perdida peso y en factor
lubricante. Aceptar.
Como sig (0.000) es menor que 0.05, entonces se rechaza la hipótesis nula, es decir el las diferencias
entre las tres medias no se pueden atribuir a la oportunidad.
PROBLEMA N° 01
Generar una base de datos con la siguiente información:
ETIQUETAS:
DATOS:
SOLUCION:
c) En “Valores” se colocará los valores para cada caso indicado en la descripción del problema:
1) Se abrirá la pestaña vista de datos y a continuación se llenará los datos brindados en el problema 1.
Una vez culminado se mostrara como en la fig 5. Izquierda.
2) También se puede convertir en valores con la opción que se muestra en la fig 5. Derecha.
Figura 5. A. Datos del problema 1 en el spss. B. Cambio de datos por valores del problema 1.
PROBLEMA N°02
GENERAR CON VARIABLES CUALITATIVOS O CATEGORICAS PARA LA VARIABLES CATEGORIA LABORAL
SOLUCION:
Figura 7. Resultado
Iremos a la ventana Analizar del menú principal y entraremos a estadísticos descriptivos, tablas
cruzadas (fig 8). Una vez abierto se seleccionará la variable categoría laboral y se pondrá en filas,
así mismo seleccionaremos la variable edad en columnas. Luego se abrirá la ventana Casillas y
seleccionaremos: fila, columna y total del casillero porcentajes (fig 8, derecha).
PROBLEMA N°03
SOLUCION:
- Número de hermanos
- Edad del encuestado
- Número de años de escolarización
- Número de años de escolarización del padre
- Número de años de escolarización de la madre
- Número de años de escolarización del conyugue
- Puntuación de prestigio profesional (1980)
Una vez realizado este paso, podemos seleccionar una variable, en este caso edad y le podemos
crear puntos de corte y etiquetas así como se muestra en la fig 11.
RESULTADOS:
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
a) Tabla de frecuencias
b) Gráfico
PROBLEMA N°04
Gráfico de sectores
Gráfico de cajas
Genere una base de datos con la información de la ficha, Se encuentra en el digital que se adjunta al
informe.
SOLUCION:
Seleccione el archivo datos de empleados y calcule lo siguiente:
a) Haga un gráfico de dispersión de las variables salario actual y salario inicial de los empleados.
Una vez abierto el archivo: “empleados”, abrimos la pestaña gráficos y seleccionamos el generador
de gráficos (fig. 13). Salario actual jalaremos al eje Y y el salario inicial al eje X. Le damos en Aceptar
RESPUESTA
RESPUESTA:
Para poder determinar los estadígrafos de posición y dispersión, primero debemos abrir la ventana
analizar, estadísticos descriptivos y frecuencias (fig. 15). Seleccionamos las variables que se desean
analizar, luego abrimos Estadisticos y cliqueamos en todos los estadígrafos de posición y dispersión
(fig. 15 derecha).
- Desv. típica: Medida de dispersión en torno a la media. Raíz cuadrada de la varianza. Mide el
grado en que las puntuaciones de la variable se alejan de su media.
- Varianza: Medida de dispersión en torno a la media, igual a la suma de los cuadrados de las
desviaciones respecto a la media dividida por el número de casos menos 1. La varianza se
mide en unas unidades que son el cuadrado de las de la propia variable.
- Amplitud: Diferencia entre los valores mayor y menor de una variable numérica; el máximo
menos el mínimo. También se denomina recorrido o rango de la variable. 2
- Mínimo: Valor más pequeño.
- Máximo: valor más grande.
- E.T. media: Error típico de la media, o sea la desviación típica de la distribución muestral de la
media. Se obtiene dividiendo la desviación típica por la raíz cuadrada del número de casos. Es
una medida de cuánto puede variar el valor de la media de una muestra a otra, extraídas éstas
de la misma distribución.
RESPUESTA
RESPUESTA
PROCEDIMIENTO
RESPUESTA
PROBLEMA N°05
4° trimestre del 2005 presenta para el número de activos por ramas los siguientes datos:
PROBLEMA N°06
El conjunto de datos está conformado por observaciones sobre: la resistencia al corte (en lbs.) de
soldaduras de punto ultrasónico hecho en un cierto tipo de lámina de aluminio. Construya un cuadro de
distribución de frecuencias con 10 categorías y represente adecuadamente:
Estadísticos
Resistencia al corte
Válidos 100
N
Perdidos 0
Media 4967,2800
Mediana 4957,0000
Moda 4222,00a
Asimetría ,085
Error típ. de asimetría ,241
a. Existen varias modas. Se mostrará el menor de los valores.
PROBLEMAS 08
SOLUCION:
a) ¿Cuál es la estatura promedio por alumno en la sección?, ¿Es mayor a 165 cm?
Estadísticos
Estatura
Válidos 30
N
Perdidos 0
Media 167,90
El promedio es mayor a 165cm
Estadísticos
Peso
Válidos 30
N Perdido
0
s
Media 70,33
Estadísticos
Peso
Válidos 30
N
Perdidos 0
Media 70,33
Error típ. de la media 1,357
Desv. típ. 7,434
Varianza 55,264
Rango 27
Mínimo 58
Máximo 85
Los valores se encuentran entre 58kg y 85kg, con una desviación estándar de 7.434kg
Estadísticos
Estatura
Válidos 30
N
Perdidos 0
Media 167,90
Error típ. de la media ,685
Desv. típ. 3,754
Varianza 14,093
Rango 14
Mínimo 161
Máximo 175
Los valores se encuentran entre 161cm y 175cm, con una desviación estándar de
3,754cm
Debido a que la R2, es muy diferente a 1.00, entonces se puede decir que la relación es
débil.
Estadísticos
Gasto
Válidos 30
N
Perdidos 0
Media 8,47
Error típ. de la media ,636
Desv. típ. 3,481
Varianza 12,120
Rango 12
Mínimo 3
Máximo 15
Los valores de gasto esta entre S/. 3 y S/. 15, con una desviación estándar de S/.3.40.
Si es variable.
g) Los estudiantes que tienen menos hermanos son los que más gastan?.
No hay correlación
PROBLEMAS 09
Para estudiar e efecto de las aguas residuales de las alcantarillas que afluyen aun lago, se toman medidas
de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método
manual. Se ha tomado un nuevo método automático. Si se pone de manifiesto una alta correlación
positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del
método automático. Los datos obtenidos son los siguientes:
a) Hallar la ecuación de la recta de regresión lineal de Y sobre X y utilizarla" para predecir la lectura
que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manuales de
100.
SOLUCION:
Coeficientesa
Modelo Coeficientes no Coeficientes t Sig.
estandarizados tipificados
B Error típ. Beta
(Constante) -16,220 23,569 -,688 ,511
1 Lectura
1,026 ,078 ,978 13,195 ,000
automática
a. Variable dependiente: Lectura manual
a) Hallar la ecuación y predecir la lectura automática para una lectura manual de 100
Y=1.026X-16.220
R2= 0.956, 0<R2<1, indica que existe una alta correlación positiva
GRACIAS