Está en la página 1de 28

Estadstica y Demografa

Tema 1: Introduccin a la estadstica


Prof. Ofelia Roque Paredes Tema 1: Introducin 1

Para qu sirve la estadstica?


La Ciencia se ocupa en general de fenmenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)

La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza
La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variablidad no es la excepcin sino la regla Carrasco de la Pea (1982)

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de
deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
Prof. Ofelia Roque Paredes

Tema 1: Introducin

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin


Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)

Qu individuos pertenecern al estudio (muestras)


Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?

Qu datos recoger de los mismos (variables)


Recoger los datos (muestreo)

Aleatorio Simple ?Estratificado? Sistemticamente? No Probabilistico: A juicio o intencional

No tenis que entenderlo (an)

Describir (resumir) los datos obtenidos


tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

Cuantificar la confianza en la inferencia


Nivel de confianza del 95% Significacin del contraste: p=2% Tema 1: Introducin 4

Prof. Ofelia Roque Paredes

Mtodo cientfico y estadstica


Plantear hiptesis Disear experimento

Obtener conclusiones

Recoger datos y analizarlos

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Poblacin y muestra

Poblacin (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. La poblacin estadstica es aquella en la que se realizar la investigacin. Nomenclatura P. Puede ser finita o infinita. Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones. (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Variables

Una variable es una caracterstica observable y medible que vara entre las diferentes Unidades Estadsticas (individuos,cosas, etc.) de una poblacin. La informacin que disponemos de cada UE es resumida en variables.

El grupo sanguneo

{A, B, AB, O} Var. Cualitativa {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal {0,1,2,3,...} Var. Numrica discreta {162 ; 174; ...} Var. Numrica continua

Su nivel de felicidad declarado

El nmero de hijos

La altura

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Tipos de variables

Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar

Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

Discretas: Si toma valores enteros

Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, Presin intraocular, Dosis de medicamento administrado, edad


8

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.

Sexo (Cualit: Cdigos arbitrarios)


1 = Hombre 2 = Mujer

Raza (Cualit: Cdigos arbitrarios)

1 = Blanca 2 = Negra,...

Felicidad Ordinal: Respetar un orden al codificar.


1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz

Se pueden asignar cdigos a respuestas especiales como


0 = No sabe 99 = No contesta...

Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)
Prof. Ofelia Roque Paredes

Tema 1: Introducin

Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.

Prof. Ofelia Roque Paredes

Tema 1: Introducin

10

Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos) Edades:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Hijos:

Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningn posible valor de la variable

Mal: Cul es su color del pelo: (Rubio, Moreno)? Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores simultneos de la variable

Estudio sobre el ocio


Mal: De los siguientes, qu le gusta: (deporte, cine) Bien: Le gusta el deporte: (S, No) Bien: Le gusta el cine: (S, No) Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
11

Prof. Ofelia Roque Paredes

Tema 1: Introducin

Presentacin ordenada de datos


7

Gnero Hombre Mujer

Frec. 4 6

6 5 4 3 2 1 0 Hombre Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.
Tema 1: Introducin 12

Prof. Ofelia Roque Paredes

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca). Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas

Muy tiles para calcular cuantiles (ver ms adelante)


Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado Porcentaje vlido 41,9 58,1 100,0

Nmero de hij os Porcentaje vlido 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcentaje acumulado 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

Vlidos

Hombre Mujer Total

Frecuencia 636 881 1517

Porcentaje 41,9 58,1 100,0

Vlidos

Niv el de felicidad Porcentaje vlido 31,1 58,0 11,0 100,0 Porcentaje acumulado 31,1 89,0 100,0

Vlidos

Perdidos Total

Frecuencia Muy feliz 467 Bastante feliz 872 No demasiado feliz 165 Total 1504 No contesta 13 1517

Porcentaje 30,8 57,5 10,9 99,1 ,9 100,0

Perdidos Total

0 1 2 3 4 5 6 7 Ocho o ms Total No contesta

Frecuencia 419 255 375 215 127 54 24 23 17 1509 8 1517

Porcentaje 27,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0

Prof. Ofelia Roque Paredes

Tema 1: Introducin

13

Datos desordenados y ordenados en tablas

Variable: Gnero

Gnero Frec.
Hombre 4 Mujer 6

Modalidades:

Frec. relat. porcentaje


4/10=0,4=40% 6/10=0,6=60%

H = Hombre M = Mujer

10=tamao muestral

Muestra:
MHHMMHMMMH

equivale a HHHH MMMMMM


Tema 1: Introducin 14

Prof. Ofelia Roque Paredes

Ejemplo

Cuntos individuos tienen menos de 2 hijos? frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos Qu porcentaje de individuos tiene 6 hijos o menos? 97,3% Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? 2 hijos

Nmero de hij os Porcent. (vlido) 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0 Porcent. acum. 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

0 1 2 3 4 5 6 7 Ocho+ Total

Frec. 419 255 375 215 127 54 24 23 17 1509

50%

Prof. Ofelia Roque Paredes

Tema 1: Introducin

15

Grficos para v. cualitativas

Diagramas de barras

Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar tambin a variables discretas

Diagramas de sectores (tartas, polares)


No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas

Fciles de entender. El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

Prof. Ofelia Roque Paredes

Tema 1: Introducin

16

Grficos diferenciales para variables numricas


419
400

375

Recuento

Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.

300

255 215
200

127
100

54 24 23 17

Diagramas barras para v. discretas

7 Ocho o ms

Se deja un hueco entre barras para indicar los valores que no son posibles
250 200

Nme ro de hijos

El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

Recuento

Histogramas para v. continuas

150

100

50

20

40

60

80

Edad del encue stado

Prof. Ofelia Roque Paredes

Tema 1: Introducin

17

UNIDAD DE ANALISIS Y VARIABLE

UNIDAD DE ANLISIS La unidad de anlisis corresponde a la entidad mayor o representativa de lo que va a ser objeto especfico de estudio en una medicin y se refiere al qu o quin es objeto de inters en una investigacin. Por ejemplo: Debe estar claramente definida en un protocolo de investigacin y el investigador debe obtener la informacin a partir de la unidad que haya sido definida como tal, aun cuando, para acceder a ella, haya debido recorrer pasos intermedios. Las unidades de anlisis pueden corresponder a las siguientes categoras o entidades: Personas, Grupos humanos, Poblaciones completas, Unidades geogrficas determinadas, Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones intrahospitalarias, etc.), Entidades intangibles, susceptibles de medir (exmenes, das camas) El tipo de anlisis al que se someter la informacin es determinante para elegir la unidad de anlisis. Por ejemplo, si el objetivo es dar cuenta de la satisfaccin del usuario de un servicio mdico, la unidad de anlisis natural es el paciente atendido, o la persona que se atiende en ese servicio mdico.

Prof. Ofelia Roque Paredes

Tema 1: Introducin

18

EJEMPLO DE VARIABLE

Prof. Ofelia Roque Paredes

Tema 1: Introducin

19

VARIABLE CUALITATIVA
Es una caracterstica que expresa una cualidad o un atributo.
Prof. Ofelia Roque Paredes Tema 1: Introducin 20

Direccin electrnica para el Trabajo Prctico No. 01 : Seleccionar un tema de medicina como en el ejemplo para poder aplicar los grficos estadsticos y las tablas de frecuencias. Para esto lea este sitio web http://www.sehlelha.org/graficos.htm Grficos de Variable Cualitativa

Prof. Ofelia Roque Paredes

Tema 1: Introducin

21

Prof. Ofelia Roque Paredes

Tema 1: Introducin

22

Prof. Ofelia Roque Paredes

Tema 1: Introducin

23

RESUMEN DE DATOS

Prof. Ofelia Roque Paredes

Tema 1: Introducin

24

Grficos Estadsticos
Los grficos son un elemento importante en la comunicacin de resultados, ayudando a su interpretacin, y cumpliendo tambin, como el buen lenguaje, una funcin esttica que facilita atraer la atencin del lector y convencerle del mensaje que le trasmitimos. Los programas modernos ponen en nuestras manos una gran capacidad de diseo, pero es bueno que la utilicemos con sentido y al igual que un artculo no es mejor porque utilice ms nmero de palabras o las palabras ms bonitas, o ms de moda, tampoco un grfico ser mejor porque tenga ms colores, ms tipos de letra o est hecho con la versin ms moderna del mejor programa de diseo. Y en ambos casos al final lo verdaderamente importante es el contenido. Citando a un arquitecto: "es correcto decorar las construcciones, pero nunca construir decoracin".
Tema 1: Introducin 25

Prof. Ofelia Roque Paredes

Diagramas integrales

Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)

Prof. Ofelia Roque Paredes

Tema 1: Introducin

26

VARIABLE CUANTITATIVA Expresa una cantidad y se puede establecer la relacin de menor o mayor que, as como es factible realizar operaciones aritmticas.
Puede ser Discretas(se puede enumerar con valores enteros y es finito) o Continuas (cuando es necesario agruparlas en intervalos y cuando toma cada variable valores no enteros).

Prof. Ofelia Roque Paredes

Tema 1: Introducin

27

Qu hemos visto?

Definicin de estadstica Poblacin Muestra Variables


Cualitativas Numricas Tablas de frecuencias


Presentacin ordenada de datos

absolutas relativas acumuladas Cualitativas Numricas


Representaciones grficas

Diferenciales Integrales

Prof. Ofelia Roque Paredes

Tema 1: Introducin

28