Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 de marzo de 2005
1.
Introducci
on
En esta sesion del curso presentamos las distintas herramientas que se pueden
utilizarcomo un primer pasopara analizar los datos. Las dos formas mas
usuales de empezar un analisis estadstico son las tablas con estadsticas
descriptivas y el analisis grafico.
2.
red29@cam.ac.uk
Mean
Std. Dev.
Min
Max
price
74 6165.25
2949.49
3291
15906
mpg
74
5.78
12
41
21.29
Cuadro 2: tamstat
Variable
mean
N
sum
skewness
p50
price
mpg
trunk
weight
6165.25 21.29
13.75
3019.45
74
74
74
74
456229
1576
1018
223440
1.65
.948
.029
.148
5006.5
20
14
3190
Cuadro 3: tabulate
Repair record
1978
Car type
domestic
foreign
Total
27
30
18
11
Total
48
21
79
2.1.
Estadsticos de Momentos
Toda distribucion puede ser inferida por sus momentos. Los momentos mas
utilizados son el primero (la media) y el segundo (la varianza). En la seccion
anterior vimos como podemos obtenerlos. Para probar estadsticamente la
diferencia entre dos medias provenientes de distribuciones independientes, es
necesario utilizar informacion acerca del segundo momento. Esto se puede
llevar al cabo utilizando el comando ci para formar intervalos de confianza
3
3.
Gr
aficos
vida al nacer (le) a travez del tiempo (year). La base de datos (uslifeexp2)
que usamos para realizar la grafica 1 es una de las que provee el sistema
(integradas en Stata) y es llamada utilizando el programa sysuse. En el
segundo renglon del ejemplo especificamos que queremos una grafica del tipo
scatter que relacione las variables le y year.
sysuse uslifeexp2, clear
scatter le year
40
45
life expectancy
50
55
60
65
1900
1910
1920
Year
1930
1940
40
45
life expectancy
50
55
60
65
1900
1910
1920
Year
1930
1940
60
50
10000
20000
30000
40000
70
80
S.A.
50
60
70
80
10000
20000
30000
40000
Volume (thousands)/x
15,000
10
20
Frequency
30
40
50
60
5,000
2 s.d. 1 s.d.
20,000
25,000
4.
Resumen