Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva I
Estadística Descriptiva I
Qu es la Estadstica?
La Estadstica es una ciencia que proporciona un conjunto de mtodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el comportamiento de los datos con respecto a una caracterstica materia de estudio o investigacin.
La Estadstica es la postulacin de un modelo plausible que explica el mecanismo que genera los datos.
Obtener DATOS
Analizar DATOS
Tipos de DATOS
Datos Nominales Son nmeros o letras que representan categoras donde no interesa el orden (ejm., 0=masculino, 1=fememino)
Datos Ordinales
Son nmeros o letras que representan categoras donde el orden interesa (ejm., lesin fatal=1, lesin severa=2, lesin moderada=3, etc.)
Datos Discretos Son aquellos que surgen por el procedimiento de conteo. Es decir, los datos discretos toman valores enteros (ejm., el nmero de hijos por familia; el nmero de automoviles que pasan por una avenida en una hora, etc.) Datos Continuos Son aquellos que surgen cuando se mide alguna caracterstica. Es decir, toman al menos tericamente cualquier valor dentro de un intervalo (ejm., el peso, la estatura, la tensin arterial de las personas, etc.)
Poblacin y Muestra
Poblacin es la coleccin de todos los individuos, objetos u observaciones que poseen al menos una caracterstica comn (ejm., las edades de los estudiantes de Chile.) Parmetro es una medida resumen que describe una caracterstica de toda la poblacin. Muestra es una parte o un subconjunto representativo de la poblacin. Y al proceso de obtener una muestra se llama muestreo.
mtodos para obtener muestras (continuacin) Muestreo Aleatorio Simple este mtodo o esquema de muestreo, se caracteriza porque todos los elementos de la poblacin tienen la misma probabilidad de ser incluidos en la muestra, o en otros trminos, porque todas las posibles muestras de un tamao fijo son igualmente probables. Muestreo Sistemtico en este procedimiento, se selecciona una muestra, tomando cada k-sima unidad de la poblacin una vez que las unidades de muestreo estn numeradas o arregladas en alguna forma. Muestreo Estratificado este se usa cuando la poblacin no es homognea, sino que pueden en ella identificarse clases definidas por algn atributo o caracterstica relacionada con la variable que se estudia. Este procedimiento implica dividir la poblacin en clases o grupos homogneos relativos a las caractersticas que van a estudiarse, llamados estratos. Despus se toma una submuestra de cada estrato.
Muestreo por Conglomerados se usa en poblaciones grandes y muy dispersos desde el punto de vista geogrfico, y en las cuales el muestreo aleatorio simple sera poco econmico debido a que dara lugar a muestras igualmente dispersas. En este tipo de muestreo, en lugar de seleccionar directamente los elementos de la poblacin se hace una seleccin inicial de grupos o conglomerados, que son agrupaciones de elementos que deben ser lo ms heterogneo posible a diferencia de los estratos.
Grficos
Frecuencias de los niveles del colesterol Nivel de Frecuencia Colesterol Frecuencia Frecuencia Relativa (mg/100 ml) Frecuencia Acumulada Relativa (%) Acumulada (%) _______________________________________________________________ 80-119 13 13 1.2 1.2 120-159 150 163 14.1 15.3 160-199 442 605 41.4 56.7 200-239 299 904 28.0 84.7 240-279 115 1019 10.8 95.5 280-319 34 1053 3.2 98.7 320-360 9 1062 0.8 99.5 360-399 5 1067 0.5 100.0 _______________________________________________________________ Total 1067 100.0 Nota. La eleccin del nmero de intervalos en una tabla de frecuencias es muy importante. Desafortunadamente, no hay reglas establecidas para determinarlos.
10
Consumo de cigarrillos por persona (mayores de 18 aos) en los EE.UU., 1900-1990 Nmero de Cigarillos _______________ 1900 54 1910 151 1920 665 1930 1485 1940 1976 1950 3522 1960 4171 1970 3985 1980 3851 1990 2828 Ao
1. 2. 3. 4. 5. 7. 8. 9. 10. 11.
11
Histograma
Cigarette consumption 4000
3000
2000
1000
1900
1910
1920
1930
1940
1950
1960
1970
1980
1990
12
Una aplicacin Considere el siguiente conjunto de datos. Note que este es un ejemplo de datos nominales: 1531241315 2115312141 4131512112 5115153121 2311215151 1251123411 1121121123 3315235134 1124541515 5115115115 donde: 1. Vehcular 3. Incendio 5. Otros 2. Inmersin 4. Homicidio
13
Tabla resumen
. tab accident acc_lab | Freq. Percent Cum. ------------+----------------------------------Motor Ve | 48 48.00 48.00 Drowning | 14 14.00 62.00 House Fi | 12 12.00 74.00 Homicide | 7 7.00 81.00 Other | 19 19.00 100.00 ------------+----------------------------------Total | 100 100.00
14
(continuacin)
60
40
Frequency
20
'Reasons of death'
15
Otro Ejemplo En cierto distrito de Guatemala, en el ao 1969, se entrevist a un cierto nmero de mujeres casadas nacidas entre los aos 1935 y 1944 y se les pregunt a qu edad contrajeron matrimonio. A continuacin se muestran los datos correspondientes a 50 de estas mujeres: 15 15 16 19 21 17 14 18 14 15 25 16 10 17 13 15 14 18 16 23 16 17 12 16 24 11 13 11 15 10 15 14 20 12 10 13 20 34 24 16 12 29 13 25 14 10 19 22 9 18
Describamos este conjunto de datos graficamente haciendo uso del diagrama de puntos.
16