Está en la página 1de 12

Gua Did

actica

M
etodos Avanzados de Estadstica Aplicada

Alfonso Garca P
erez
Universidad Nacional de Educacion a Distancia

c
Copyright 2015
Alfonso Garca Perez
Fotografa de la Portada: 7 llaves de las antiguas 7 puertas de la ciudad. Museo de los Fueros.
Sep
ulveda.

No est
a permitida la reproducci
on total o parcial de este
libro, ni su tratamiento inform
atico, ni la transmisi
on de
ninguna forma o por cualquier medio, ya sea electr
onico,
mec
anico, por fotocopia, por registro u otros medios, sin el
permiso previo y por escrito de los titulares del Copyright.
El contenido de este libro est
a registrado por el autor en el
Registro de la Propiedad Intelectual con el n
umero 16/2005/2564
y protegido por la Ley, que establece penas de prisi
on adem
as
de las correspondientes indemnizaciones para quien lo plagiara

Edita: Universidad Nacional de Educaci


on a Distancia

Captulo 1

Gua Did
actica
1.1.

Introducci
on

La presente Gua Did


actica es un documento que sirve de apoyo y referencia
al curso. En ella se incluye el Programa, las horas y formas de tutoras, las
instrucciones para instalar el software, orientaciones y sugerencias de como
organizar el estudio de los temas (Cronograma) y un Anexo con diez problemas
que servir
an para evaluar al alumno.

1.2.

Contenido

El Programa del curso es el siguiente


M
etodos Cl
asicos:
1. Componentes Principales.
2. Analisis de Correspondencias.
3. Escalado Multidimensional.
4. Analisis de Conglomerados (clusters).
5. Analisis Discriminante.
6. Analisis Factorial.
7. Modelos Log-lineales.
8. Regresion Logstica.
9. Regresion Poisson.
10. Regresion no Lineal y Regresion Suavizada.
11. Analisis de la Varianza con Medidas Repetidas.
12. Series Temporales.
13. Control Estadstico de la Calidad.
14. Data Mining.

Alfonso Garca Perez

M
etodos Robustos:
15. Introducci
on a los Metodos Robustos.
16. Estimacion Puntual Robusta.
17. Intervalos y Tests Robustos para una poblaci
on.
18. Intervalos y Tests Robustos para dos poblaciones.
19. Analisis de la Varianza Robusto.
20. Analisis de la Correlacion y Estimacion Multivariante Robustos.
21. Regresion Robusta.
M
etodos de Remuestreo:
22. El Jackknife.
23. El Bootstrap. Aplicaciones a los Metodos anteriores.
Tratamiento Inform
atico:
24. Tratamiento Informatico de los Metodos anteriores con BMDP, SAS,
SPSS, S-PLUS y R.

1.3.

Metodologa y Organizaci
on del curso

El alumno dispone, adem


as de esta Gua Didactica, de los textos:
M
etodos Avanzados de Estadstica Aplicada. T
ecnicas Avanzadas,
M
etodos Avanzados de Estadstica Aplicada. M
etodos Robustos
y de Remuestreo
dos textos en formato pdf
Tratamiento Inform
atico y
Estadstica Avanzada Aplicada con SPSS,
los cuales puede imprimir si lo desea y que contienen ense
nanzas de como
ejecutar los Metodos del Programa del curso, respectivamente, con R, S-PLUS,
BMDP y SAS, el primero de ellos y, con SPSS el segundo (si no ve bien alg
un
gr
afico, s
olo tiene que aumentar el zoom del mismo).
Ademas de los dos textos anteriores el alumno dispone de software (al que
hemos denominado Rmo ) con el que ejecutar todos los Metodos del Programa
del curso y datos, en el subdirectorio del mismo nombre, que se utilizan en
los dos textos impresos. En estos textos impresos se indica que los datos (por
ejemplo paises) se incorporan al software enviado ejecutando la instruccion
a:\\paises

Captulo 1. Gua Did


actica

el alumno deber
a direccionarlos. Por ejemplo, si los tiene en el dispositivo d:,
deber
a teclear,
d:\\datos\\paises
El alumno tambien dispone de ficheros en BMDP, SAS y SPSS con los que
podr
a realizar ejemplos con dichos paquetes estadsticos. L
ogicamente no se
incluyen estos paquetes estadsticos por dos razones: una es su elevado precio
(puede que m
as de 20.000 euros) y otra, que con ellos b
asicamente s
olo va a
poder ejecutar Metodos Cl
asicos, mientras que con el software que le hemos
enviado va a poder ejecutar todos los Metodos Estadsticos del Programa.
Durante la duracion del curso, el alumno deber
a ir estudiando el Material
Didactico anterior y podr
a realizar consultas sobre el.
Se ofrecer
an unas sesiones presenciales voluntarias, al menos en Madrid,
en donde se ense
nar
a a manejar los paquetes estadsticos antes mencionados.
Aunque ya os lo ofreceremos m
as adelante, si algunos alumnos quieren que
vayamos a su centro de trabajo a realizar estas pr
acticas, puede solicitarlo al
Equipo Docente y, si el n
umero de alumnos de esa zona es suficientemente
grande, all acudiremos.
As mismo, se impartiran conferencias invitadas sobre temas de actualidad
en Estadstica.
En la p
agina Web del curso,
http://www.uned.es/experto-metodos-avanzados/
ir
an apareciendo las u
ltimas novedades.

1.4.

Recomendaciones sobre el estudio del curso.


Cronograma

Aunque la mayora de los alumnos tendra la suficiente experiencia como para organizarse ellos mismos el estudio del Material Didactico, damos a
continuaci
on una serie de recomendaciones:
El curso presupone una serie de conocimientos b
asicos de Estadstica. No
obstante, si necesita apoyo sobre ellos, no dude en utilizar la Atenci
on al
alumno.
Partiendo de ese conocimiento b
asico sobre Estadstica, puede estudiar la
Unidad Did
actica dedicada a los Tecnicas Avanzadas o la Unidad dedicada
a los Metodos Robustos y de Remuestreo, ya que la primera consiste en un
estudio de Metodos Estadsticos Cl
asicos avanzados, por lo que puede considerarse una continuaci
on natural de los conocimientos que el alumno ya posee,

Alfonso Garca Perez

y, por otro, la dedicada a los Metodos Robustos y de Remuestreo, a estudiar


metodos ya conocidos por el alumno, pero utilizando ahora tecnicas insensibles a la posible presencia de datos an
omalos, por lo que puede considerarse,
tambien, una continuaci
on natural de los conocimientos que ya posee. En consecuencia, puede comenzar por una u otra Unidad Didactica, o simultanear,
si as lo desea, ambas lneas de estudio.
Ademas, el uso del software enviado puede ayudar a una mejor comprension
de tales temas, por lo que tambien es interesante iniciar, cuanto antes, el
estudio del texto de Tratamiento Informatico.
No obstante si quiere unas indicaciones m
as precisas, le recomendamos
comenzar por el texto de Tecnicas Avanzadas e ir resolviendo los tres primeros
ejercicios del Anexo de esta Gua Did
actica que servir
an para calificarle. Los
puede enviar hacia Enero-Febrero, de manera que, una vez superada este fase,
comience con m
as tranquilidad con el estudio de los Metodos Robustos. De esta
manera, hacia el mes de Abril que ser
an las sesiones voluntarias en Madrid,
ya tendra unos conocimientos bastante generales de la asignatura.

1.5.

Instalaci
on y ejecuci
on del software Rmo

Aunque existen varias formas de instalar el software Rmo utilizado en el


curso, la idea b
asica consiste en, primero descomprimirlo y, luego, volcar (copiar y pegar) el contenido de la carpeta denominada r en el disco duro del
ordenador.
El software Rmo est
a basado en el paquete de libre distribucion R (la direccion de internet de donde poder obtener versiones actualizadas de el aparece
en la Unidad de Tratamiento Informatico). El equipo docente del curso ha
reducido dicho paquete a la mnima expresi
on y ha incorporado, entre otros,
los programas de Robustez y Remuestreo, por lo que si el alumno baja de
la red la versi
on completa de R, no le funcionar
an algunos de los programas
de robustez y remuestreo as como las innovaciones de los Metodos Cl
asicos
incorporadas. Por tanto, si se baja el paquete R, lo razonable es que utilice dos
subdirectorios, uno para el software enviado y otro para la versi
on completa
de R.
Para ejecutar este software es necesario que primero lo copie en el disco
duro de su ordenador.
El fichero que ejecuta este Paquete estadstico es
c:\r\bin\Rgui
aunque, una vez instalado el software enviado en el disco duro del ordenador,
lo m
as interesante es crearse un Acceso directo a dicho software. Para ello, con
el Explorador de Windows vaya a

Captulo 1. Gua Did


actica

c:\r\bin

y, posicion
andose sobre el archivo Rgui, presione el boton derecho del rat
on y
cree un Acceso Directo. Una vez creado dicho acceso directo (y con el Explorador no maximizado), arr
astrelo hasta el Escritorio.
A partir de aqu ya puede leer la Secci
on 1.1 del texto de Tratamiento Informatico. No obstante, le adelantamos que ejecute como ejecute el programa,
para salir de el, deber
a teclear

q()

desde la lnea de comandos de dicho programa. Cuando le pregunte si quiere


Salvar el espacio imagen (Save workspace image?) al contestar S
, conservar
a los calculos realizados hasta entonces.
En algunas ocasiones (especialmente en relaci
on con la Regresion, aparece el
smbolo de la parte superior de la n
, el cual se corresponde con el smbolo Ascii
n
umero 126 y se obtiene, manteniendo presionada la tecla Alt, tecleando en el
bloque numerico el mencionado n
umero 126 para soltar despues la mencionada
tecla Alt, con lo que aparecer el smbolo

Si duda en alg
un momento, utilice los cauces de las tutoras que aparecen
en el punto 7 de m
as abajo, para que contestemos a sus preguntas.

1.6.

Profesorado

Dr. D. Alfonso Garca Perez

(Director del curso)

Dr. D. Carlos Moreno Gonz


alez
Da. Yolanda Cabrero Ortega
Da. Emilia Carmena Yan
ez

Alfonso Garca Perez

1.7.

Atenci
on al alumno

El alumno puede realizar consultas a


Alfonso Garca Perez
Departamento de Estadstica e I.O. (despacho 104)
Facultad de Ciencias. UNED.
Paseo Senda del Rey, no 9
28040 - MADRID
telefono: 91 398 72 51
fax: 91 398 66 97
e-mail: agar-per@ccia.uned.es
bien por telefono, fax, e-mail, correo ordinario o de forma presencial (para esta
u
ltima modalidad, es imprescindible solicitarlo previamente).

1.8.

Calificaci
on

Para obtener una calificaci


on positiva del curso, el alumno deber
a enviar
resueltos los ejercicios del Anexo de la Gua Didactica a Alfonso Garca Perez,
Departamento de Estadstica, Facultad de Ciencias, UNED, Paseo Senda del
Rey, 9. 28040-Madrid, antes del da 15 de septiembre pr
oximo.
Alternativamente, los puede enviar por e-mail a
agar-per@ccia.uned.es
Se ruega no duplicar el envo de los ejercicios enviandolos tanto por e-mail
y por correo postal.

Captulo 2

ANEXO
Problema 1
Se clasific
o a 177 personas casadas seg
un su estatus de fumador, variable B,
con valores No Fumador, b1 , Poco Fumador, b2 (< 6 cigarrillos/da), Fumador
Moderado, b3 ( 6 y < 15 cigarrillos/da) y Gran Fumador, b4 ( 15 cigarrillos/da), y el de su pareja, variable A, con valores No Fumador, a1 , Poco
Fumador, a2 (< 6 cigarrillos/da), Fumador Moderado, a3 ( 6 y < 15 cigarrillos/da) y Gran Fumador, a4 ( 15 cigarrillos/da). Los resultados aparecen
recogidos en la siguiente tabla:

Pareja (A)
a1
a2
a3
a4

Persona entrevistada
b1
b2
b3
42
18
4
12
22
8
18
6
10
2
8
12

(B)
b4
0
2
6
7

Contrastar primero mediante un test 2 de independencia, si pueden o no


considerarse independientes ambas variables. Realizar despues un Analisis de
Correspondencias entre ellas.
Problema 2
Se eligieron al azar 29 pacientes afectados de hipertension a los que se
clasific
o seg
un fueran varones, A1 , o hembras, A2 , con objeto de investigar las
diferencias entre pacientes jovenes B1 (de edad 45 a
nos) y pacientes viejos
B2 (con edad > 45 a
nos).
Los datos vienen recogidos en las siguientes tablas en donde los pacientes
fueron divididos seg
un se vieran afectados de frecuentes depresiones, C2 , o no
se vieran afectados de frecuentes depresiones, C1
9

10

Alfonso Garca Perez

B1 B2 Total
C1
A1
2
3
5
A2
2
5
7
Total 4
8
12

B1 B2 Total
C2
A1
11 1
12
A2
4
1
5
Total 15 2
17

Analizar, a un nivel de significacion = 0 05, la posible independencia de las


tres variables observadas: Sexo, Edad y Depresi
on, a partir de los datos
anteriores, mediante un modelo Log-Lineal.
Problema 3
Se desea realizar una Regresion no Lineal ajustando una funcion tipo sigmoide a los siguientes pares de datos,
x 19 25 38 47 53 69
y 65 61 56 28 12 10
utilizando la correspondiente funci
on de autoarranque. Determinar la funcion
sigmoide ajustada.
Problema 4
Se desea estudiar el n
umero de hembras de la mosca tropical americana
(Dermatobia hominis) en una determinada regi
on. Dicha mosca se caracteriza
por poner sus huevos en un mosquito, pasando las larvas de la mosca a la piel
de la persona cuya sangre ha chupado el mosquito.
Examinada la regi
on en cuesti
on en 10 das elegidos al azar, se obtuvo el
siguiente n
umero de moscas hembra de la citada especie:
2, 1, 3, 5, 7, 2, 1, 2, 3, 2
Se pide:
a) Determinar la estimaci
on cl
asica y cuatro estimaciones robustas del n
umero medio de moscas hembra en la regi
on en estudio. Con que estimaci
on
concluira?
b) Determinar tambien la estimaci
on cl
asica y cuatro estimaciones robustas de
la desviacion tpica del n
umero de moscas hembra en la citada regi
on. Con
que estimaci
on concluira?
Problema 5
Los tiempos, en minutos, que esperaron, hasta que fueron atendidos en un
determinado banco, diez clientes elegidos al azar fueron los siguientes: 1 5, 2,
2 5, 3, 1, 5, 5 5, 4 5, 3, 3. Determinar un intervalo de confianza de coeficiente
de confianza 0 95, para la media 0 2-recortada del tiempo de espera y otro

11

Captulo 2. ANEXO

intervalo, tambien de coeficiente de confianza 0 95 para el tiempo mediano de


espera.
Problema 6
Se quiere averiguar si, en promedio, existen diferencias significativas entre
los precios de dos restaurantes, A y B. Para ello se eligieron al azar 11 das en
los que se anot
o el precio del men
u del da en el restaurante A y otros 11 das
en los que se anot
o el precio del men
u del da en el restaurante B. Los datos
obtenidos fueron los siguientes:
A 1325 1500 995 1250 1290 1900 1500 1100 1250 1150 1900
B 1100 1400 1000 1300 1300 1700 1250 1200 1150 1200 1700
Puede afirmarse a partir de dichos datos que existen diferencias significativas entre ambos restaurantes a nivel = 0 05?
a) Utilizando las diferencias de medias 0 2-recortadas muestrales.
b) Utilizando la generalizaci
on robusta del test de Wilcoxon-Mann-Whitney.
Problema 7
Se quiere averiguar si tres fertilizantes, A, B y C presentan diferencias
significativas en cuanto a sus efectos sobre el aumento de la cosecha.
Con este proposito se eligieron al azar 15 parcelas a las que se fertilizo aleatoriamente con cada uno de los fertilizantes en cuesti
on. Los aumentos de
cosecha obtenidos fueron los siguientes:
Fertilizante
A
B
C

Aumento de
39 33 39
36 40 35
33 33 36

cosecha
35 32
30 29
26 35

A la vista de estos datos y recortando = 0 1, puede inferirse que existen


diferencias significativas entre los tres fertilizantes?
a) Utilizando la generalizaci
on robusta del test de Welch.
b) Utilizando la generalizaci
on robusta del test de Box.
Problema 8
Se cree que la duracion del revestimiento de un estanque depende de la
cantidad de cal hidraulica que contiene. Para analizar esta relaci
on se midi
o, en
siete revestimientos, el tiempo, Y , hasta la aparici
on de filtraciones, teniendo
cada uno de los revestimientos diferentes porcentajes de cal hidraulica, X. Los
resultados obtenidos fueron los siguientes:

12

Alfonso Garca Perez

X
Y

4
12

10
26

80
180

45
132

25
100

60
200

90
230

Se pide:
a) La recta de M -regresion
optima.
b) La recta de regresion media biponderada.
c) La recta de regresion winsorizada.
Problema 9
Para los datos del Problema 4 anterior, determinar la estimaci
on jackknife
del sesgo de los estimadores del n
umero medio de moscas hembra en la regi
on
en estudio, corregir las estimaciones all obtenidas obteniendo los estimadores
jackknife de sesgo reducido y concluir con una estimaci
on robusta y con menor
sesgo del par
ametro de localizaci
on en estudio.
Problema 10
Para los datos del Problema 5 anterior, utilizando la media 0 2-recortada
muestral, determinar, indicando la expresi
on R a ejecutar: a) el intervalo
bootstrap-t ideal, b) el intervalo bootstrap-t, c) el intervalo percentil y d)
el de sesgo-corregido y acelerado BCa , en todos los casos para un coeficiente
de confianza 0 95.

También podría gustarte