Está en la página 1de 9

Cuaderno de prcticas de Estadstica

Nombre .
Grupo.
Titulacin
.

Este cuaderno se entregar al profesor del grupo


reducido (prcticas) el ltimo da de clase. Es
imprescindible entregarlo para poder acceder al
examen de prcticas.
El profesor pasar lista y pedir los cuadernos por orden. No se
recogern cuadernos en otro momento.

El cuaderno se presentar escrito a mano o impreso, salvo por los


grficos o tablas que haya que adjuntar que sern necesariamente
impresos y sacados de Statgraphics. Se puede ir haciendo durante las
prcticas de la asignatura en aula informtica. En las prcticas se
realizarn en ocasiones ejercicios similares pero con otras bases de
datos. En ese caso es preciso realizar el ejercicio tal como se pide en
este cuaderno fuera de las horas de prcticas.

Primera parte Estadstica Descriptiva.


Ficheros altsexo.sf3 y Paises95.sf3
Fichero altsexo.sf3. Contiene datos de peso, altura y sexo de 117
estudiantes. Se pide:
1. Realizar un histograma para las variables Peso y Altura.
2. Realizar un histograma para la variable altura nicamente para
hombres. Seleccionar los hombres (Sexo=0)
3. Realizar un Box-plot simple para Altura
4. Realizar un Box-plot simple para Peso
5. Realizar un Box-plot simple para Altura slo para hombres.
6. Realizar un Box-plot simple para Peso slo para mujeres.
7. Realizar un Box-plot mltiple para Altura separando por sexo
8. Calcular la media, mediana, rangos, desviacin tpica, varianza,
mximo y mnimo de las variables Altura y Peso.
9. Calcular la media, mediana, rangos, desviacin tpica, varianza,
mximo y mnimo de las variables Altura y Peso para hombres y para
mujeres por separado
10.Grfico de dispersin del Peso frente a la Altura.
11.Coeficiente de correlacin entre las dos variables.

Fichero Pases95.
12.Box-plot mltiple de Esperanza de Vida masculina por religiones
13.Grfico de barras de Religiones
14.Grfico de sectores (pie chart) de Religiones.
15.Grfico de dispersin de Esperanza de vida Femenina y masculina.
16.Correlacin entre Esperanza de vida Femenina y masculina.
17.Creacin de la variable DIFESP=Esperanza de vida Femenina-Esp Vida
Masculina
18.Media, mediana, desviacin tpica y rango de DIFESP
19.Box-plot mltiple de DIFESP por religiones.
20.Grfico de dispersin de Esperanza de vida Femenina y masculina
para pases catlicos. Seleccionar Religin=Catlicos.
21.Matriz de correlaciones para las variables PIB, DIFESP, hijos promedio,
natalidad, mortalidad.
22.Crear una nueva variable Cristianos que valga 1 si el pas es
Catlico, Protestante u Ortodoxo y 0 en otro caso.
23.Correlacin entre Esperanza de vida Femenina y Esp Vida Masculina
para pases cristianos.

Segunda Parte: Probabilidad


24. Dibuja la funcin de densidad de una N(2,10) y una N(3,4).
25.Dibuja la funcin de densidad de una Exponencial con media 5.
26.Dibuja tres funciones de densidad diferentes indicando las que has
elegido.
27.Dibuja la funcin de masa de probabilidad para una binomial de n=15
p=0,1
28.Calcula las siguientes probabilidades:
a. X es N(3,4):
i. P(X<5) =
ii. P(X=0)=
iii. P(X>6)=
iv. P(5<X<6)=
b. X es exponencial de media 5
i. P(X<4)=
ii. P(X=0)=
iii. P(X>5)=
iv. P(x<4<5)=
c. X es binomial n=10 p=0.06
i. P(X=1)=
ii. P(X=0)=
iii. P(X=<2)=
iv. P(X>1)=
d. Elige una distribucin de probabilidad continua y calcula tres
probabilidades.
29.Genera 100 nmeros aleatorios de una N(170,10) y calcula la media,
mediana, desviacin tpica, mnimo y mximo. Dibuja el histograma
de los nmeros aleatorios.

Tercera Parte: Inferencia.


Fichero altsexo.sf3
30.Para la variable PESO.
a. Haz el histograma
b. Ajusta una distribucin Normal. Valor de la Normal estimada.
c. Contraste de Bondad de ajuste Chi cuadrado. P-valor del
contraste. Es adecuada una distribucin normal?
d. Calcula la probabilidad de que una persona pese ms de 50kg
e. Calcula la probabilidad de que una persona pese ms de 90kg
f. Calcula la probabilidad de que una persona pese entre 50 y
80kg
g. Ajstale a la variable PESO una distribucin exponencial e
indica Por qu sabemos que no es adecuada?
31.Calcula un intervalo de confianza para la media del peso que has
estimado en el apartado anterior.
32.Una empresa ha puesto en marcha un procedimiento de mejora de
calidad ya que reciba reclamaciones en el 10% de los servicios

prestados. Despus de la actuacin han recibido 2 reclamaciones en


los 40 servicios prestados. Ha disminuido la proporcin
de
reclamaciones? Indica el tipo de contraste que has utilizado, el pvalor obtenido y las conclusiones
33.Se disea un experimento para aumentar la tasa de filtracin de un
compuesto en una planta qumica que es de 5 litros por segundo. Tras
las modificaciones tomamos una muestra de 10 filtrados
obtenindose una velocidad media de 5.8 litros por segundo y una
desviacin tpica estimada de 1 Hemos conseguido aumentar la tasa
de filtracin? Indica el tipo de contraste que has utilizado, el p-valor
obtenido y las conclusiones
34.En dos plantas una misma empresa se emplean tcnicas diferentes
para producir un compuesto qumico. Estamos interesados en la
cantidad de impurezas que se generan por ambas tcnicas. En la
primera planta se toman 30 muestras con una media de 4,5gr/l de
impurezas y una desviacin estimada de 2. En la otra, con 30
muestras se obtiene un promedio de 3.8 y una desviacin estimada
de 1.3. Son equivalentes los procesos? Indica el tipo de contraste
que has utilizado, el p-valor obtenido y las conclusiones
35.En una encuesta sobre la energa nuclear realizada a 500 personas el
60% dice estar en contra. Se realiza esa misma encuesta a 200
estudiantes de ingeniera industrial obtenindose un 40% de
personas en contra. Estn ms a favor de la energa nuclear los
ingenieros industriales que el resto de la poblacin? Indica el tipo de
contraste que has utilizado, el p-valor obtenido y las conclusiones
36.El gasto promedio de las compras en un gran almacn era de 89
Euros antes de la crisis. Se toma una muestra de 200 carritos y se
obtiene una media de 65 euros con una desviacin tpica de 10,6
euros. Se nota el efecto de la crisis?. Indica el tipo de contraste que
has utilizado, el p-valor obtenido y las conclusiones
37.En la sucursal de Majadahonda de esos grandes almacenes se toma
una muestra de 100 carritos con un gasto medio de 70,8 euros y
desviacin tpica de 10,6. En la de Villaverde la muestra es de 150
carritos y el gasto medio resulta ser de 61,1 con una desviacin
tpica de 8 euros. Hay diferencias entre ambos supermercados?.
Indica el tipo de contraste que has utilizado, el p-valor obtenido y las
conclusiones
38.El peso ideal de los hombres de 1.80 es de 75 kg. Tomamos una
muestra de hombres de 135 de 1.80 en Espaa y el peso medio
resulta ser 80.5 kg con una desviacin tpica de 5kg. Podemos decir
que los espaoles estn ms gordos de la cuenta? Indica el tipo de
contraste que has utilizado, el p-valor obtenido y las conclusiones.
39.Con los datos del fichero altsexo.sf3, Contraste si hay diferencia de
altura media entre hombres y mujeres. Indica el tipo de contraste que
has utilizado, el p-valor obtenido y las conclusiones.

40.Lo mismo para PESO

Cuarta parte: Control de Calidad


Ficheros practica_graficos.sf3 y
practica_graficos_atributos.sf3

41.Datos del fichero practica_graficos sf3. La variable llenado


contiene el nivel de llenado de envases en una factora. Se han
tomado 20 muestras de tamao 5 cada una. Un total de 100
observaciones. Calcula la capacidad del proceso mediante
grficos X media y R. Para ello:
41.1 Indica las muestras fuera de control en cada una de
las iteraciones y exclyelas.
41.2 Indica el valor final estimado de la distribucin
Normal que sigue una observacin cuando el proceso
est bajo control.
41.3 Calcula la capacidad del proceso.
41.4 Haz los tres apartados anteriores con un grfico X
media y s.
42.La variable llenado en lnea contiene 50 muestras de tamao 4
(200 observaciones) del llenado de envases. Realiza la
monitorizacin del proceso SABIENDO QUE LAS CONDICIONES
DEL PROCESO BAJO CONTROL SON LAS OBTENIDAS EN 41.2
43.Fichero practica_graficos_atributos.sf3. Las variables Chips
defectuosos y nmero de chips. Indican el nmero de chips
defectuosos en muestras de tamao 50. Realiza un grfico de
control de calidad por atributos para la proporcin de
defectuosos en cada muestra. Indica el valor estimado del
nmero de defectuosos y la capacidad del proceso.
44.Lo mismo para el nmero de defectos.
45.Las variables Bujas def y numBujias son la cantidad de bujas
defectuosos en muestras de tamao nmero de bujas. Realiza
un grfico de control para el nmero de defectos normalizando
por tamao de grupo y sin normalizar por tamao de grupo.
Calcula la capacidad del proceso.

Quinta parte Regresin.


Ficheros practica regresion1.sf3, practica
regresin2.sf3, practica regresin 2.sf3,
practica regresin 4.sf3,altsexo.sf3,
practica regresin 5.sf3

46.Con los datos del fichero practica regresin1.sf3 Rellena la


siguiente tabla
Variabl
e

Variabl
e

X1

Y1

X2

Y2

X3

Y3

X4

Y4

X5

Y5

X6

Y6

Transformac
in
necesaria
para X

Transformaci
n necesaria
para Y

Ecuacin estimada de
regresin

47.Datos practica regresin 2.sf3. Explicar Peso en funcin de


Altura. Se pide
1. Escribir la ecuacin de regresin. Indicar si es preciso
transformar o no,
2. Construir un intervalo de confianza al 95% para la
pendiente.
3. Es significativa la altura para determinar el peso de una
persona?

4. Cuantificar el efecto de un incremento de la altura sobre el


peso.
5. Diagnosis del modelo. El grfico de residuos Es adecuado?
6. Qu peso estimado tendr una persona de 180cm?
48.El mismo ejercicio para explicar el peso del cerebro de
mamferos en funcin del peso del cuerpo. Preguntas 1 a 5
idnticas.
6. Qu tamao de cerebro previsto tendr un mamfero de
80Kg?
49.Regresin Mltiple. Datos practica regresin 3.sf3. Se va a
explicar Y en funcin de las variables X.
1. Grfico de dispersin mltiple. Hay que transformar?
2. Escribir la ecuacin de regresin de Y explicada por las
cuatro variables X.
3. Construir un intervalo de confianza para los coeficientes de
las variables X1 y X2
4. Son significativas estas variables? Por qu?
5. Cunto se incrementa la variable Y cuando cada una de
estas dos variables (manteniendo constantes todas las
dems) se incrementan en un 1%?
6. Calcular el valor de Y cuando cada uno de los regresores Xs
toma un valor de 15.000.
7.
Regresin Mltiple. Datos practica regresin 4.sf3.
El fichero contiene dos conjuntos de datos. El primero de cata
de quesos (Variables Sabor, Actico, Lctico yH2S) est
analizado en el enunciado de la prctica de Multicolinealidad.
Para el segundo se va explicar el Ratio Global de
funcionamiento de sucursales de una empresa en funcin de
Beneficios, Cartera de Clientes y Tasa de Inversin. Se pide:
1. Grfico de los datos para comprobar las hiptesis.
2. Ajuste de las regresiones simples para ver si las variables
son
significativas.
3. Ajuste de las regresiones dobles para ver si hay variables
colineales.
4. Ajuste de la regresin triple.
6. Ajuste de la regresin mltiple utilizando Stepwise en
versin Forward
7. Eleccin del modelo adecuado.

50.Variables cualitativas dicotmicas Fichero de datos


altsexo.sf3. El fichero contiene datos de pesos alturas y sexo
de 117 estudiantes.
1. Ajusta una regresin para explicar el peso en funcin de
altura y el sexo. Esta variable vale 1 para las mujeres y 0
para los hombres. Escribe la regresin y analiza el efecto
de la variable sexo sobre el peso.
2. Analiza la significatividad de la variable sexo. Hay
diferencias de peso para un hombre y una mujer de la
misma altura? Cuantifcala.

51.Variables cualitativas politmicas. Fichero de datos practica


regresin 5.sf3
52.El fichero contiene las variables
coste de produccin: coste por unidad producida
salarios: coste por hora trabajada
energas: costes energticos
materia prima: coste de las materias primas
maquinaria: coste de depreciacin de la maquinaria
utilizada en la produccin.

Se va a explicar el coste de produccin en funcin de las dems


variables.
Se pide:
1. Ajustar un modelo de regresin mltiple para explicar coste
de produccin en funcin de salarios, energas, materia
prima y maquinaria. Indicar si ha habido que transformar y
aspecto del grfico de residuos.
2. Indicar si hay multicolinealidad en el modelo.
La empresa trata de situar sus factoras en emplazamientos
preferenciales en funcin de la disponibilidad y coste de la
materia prima utilizada en la produccin. Las factoras se
dividen en tres grupos (estrella, base, neutra) dependiendo
de su emplazamiento. Estos tres grupos aparecen en la
variable situacin del fichero de datos.
3. Creacin de variables dummies para modelizar la variable
politmica. Debes crear 3 variables dummies -llmalas
Estrella, Base y Neutra- que tomen el valor 1 en caso de que

la ubicacin sea del tipo correspondiente al nombre y cero


en otro caso.
4. Introduce las 3 variables dummies en el modelo ajustado en
el apartado 1. el programa dar error porque ese modelo no
se puede estimar por tener multicolinealidad perfecta.
Introduce nicamente 2 variables dummies y escribe y
analiza la regresin. Quita la variable Neutra.

También podría gustarte