Está en la página 1de 16

Estadstica

Tema: Introduccin a la estadstica


Pasos en un estudio estadstico
n Plantear hiptesis sobre una poblacin
n Los fumadores tienen ms bajas laborales que los no fumadores
n En qu sentido? Mayor nmero? Tiempo medio?

n Decidir qu datos recoger (diseo de experimentos)


Qu individuos pertenecern al estudio (muestras)
n Fumadores y no fumadores en edad laboral.
n Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas?
Qu datos recoger de los mismos (variables)
n Nmero de bajas
n Tiempo de duracin de cada baja
n Sexo? Sector laboral? Otros factores?

n Recoger los datos (muestreo)


Estratificado? Sistemticamente?

n Describir (resumir) los datos obtenidos


n tiempo medio de baja en fumadores y no (estadsticos)
n % de bajas por fumadores y sexo (frecuencias), grficos,...

n Realizar una inferencia sobre la poblacin


n Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

n Cuantificar la confianza en la inferencia


Nivel de confianza del 95%
Significacin del contraste: p=2%
Mtodo cientfico y estadstica
Plantear Disear
hiptesis experimento

Obtener Recoger datos


conclusiones y analizarlos
Poblacin y muestra
n Poblacin (population) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.

n Muestra (sample) es un subconjunto suyo al que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
Debera ser representativo
Esta formado por miembros seleccionados de la
poblacin (individuos, unidades experimentales).
Variables
n Una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos
de cada individuo es resumida en variables.

n En los individuos de cierta poblacin , de uno a


otro es variable:

El grupo sanguneo
n {A, B, AB, O} Var. Cualitativa
Su nivel de felicidad declarado
n {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
El nmero de hijos
n {0,1,2,3,...} Var. Numrica discreta
La altura
n {162 ; 174; ...} Var. Numrica continua
Tipos de variables
n Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
nmero (no se pueden hacer operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar


n Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar


n Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

n Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)

Discretas: Si toma valores enteros


n Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


n Altura, Presin intraocular, Dosis de medicamento administrado, edad
n Es buena idea codificar las variables
como nmeros para poder procesarlas
con facilidad en un ordenador.
n Es conveniente asignar etiquetas a
los valores de las variables para
recordar qu significan los cdigos
numricos.
Sexo (Cualit: Cdigos arbitrarios)
n 1 = Hombre
n 2 = Mujer
Raza (Cualit: Cdigos arbitrarios)
n 1 = Blanca
n 2 = Negra,...
Felicidad Ordinal: Respetar un orden al
codificar.
n 1 = Muy feliz
n 2 = Bastante feliz
n 3 = No demasiado feliz
n Se pueden asignar cdigos a
respuestas especiales como
n 0 = No sabe
n 99 = No contesta...
n Estas situaciones debern ser tenidas
en cuentas en el anlisis. Datos
perdidos (missing data)
n Aunque se codifiquen como nmeros, debemos recordar siempre el
verdadero tipo de las variables y su significado cuando vayamos a
usar programas de clculo estadstico.
n No todo est permitido con cualquier tipo de variable.
n Los posibles valores de una variable suelen denominarse modalidades.

n Las modalidades pueden agruparse en clases (intervalos)


Edades:
n Menos de 20 aos, de 20 a 50 aos, ms de 50 aos
Hijos:
n Menos de 3 hijos, De 3 a 5, 6 o ms hijos

n Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?
Excluyente: Nadie puede presentar dos valores
simultneos de la variable
n Estudio sobre el ocio
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
Presentacin ordenada de datos
7
6

5
Gnero Frec.
4
Hombre 4 3
2

1
Mujer 6
0
Hombre Mujer

n Las tablas de frecuencias y las representaciones


grficas son dos maneras equivalentes de presentar la
informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.
Tablas de frecuencia
n Exponen la informacin recogida en la muestra, de forma que no se pierda nada de
informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

Frecuencias relativas (porcentajes): Idem, pero dividido por el total

Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas


n Muy tiles para calcular cuantiles (ver ms adelante)
Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

Sexo del encuestado Nmero de hijos

Porcentaje Porcentaje Porcentaje


Frecuencia Porcentaje vlido Frecuencia Porcentaje vlido acumulado
Vlidos Hombre 636 41,9 41,9 Vlidos 0 419 27,6 27,8 27,8
Mujer 881 58,1 58,1 1 255 16,8 16,9 44,7
Total 1517 100,0 100,0 2 375 24,7 24,9 69,5
Nivel de felicidad 3 215 14,2 14,2 83,8
4 127 8,4 8,4 92,2
Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado 5 54 3,6 3,6 95,8
Vlidos Muy feliz 467 30,8 31,1 31,1 6 24 1,6 1,6 97,3
Bastante feliz 872 57,5 58,0 89,0 7 23 1,5 1,5 98,9
No demasiado feliz 165 10,9 11,0 100,0 Ocho o ms 17 1,1 1,1 100,0
Total 1504 99,1 100,0 Total 1509 99,5 100,0
Perdidos No contesta 13 ,9 Perdidos No contesta 8 ,5
Total 1517 100,0 Total 1517 100,0
Datos desordenados y ordenados en tablas
n Variable: Gnero Gnero Frec. Frec. relat.
porcentaje
Modalidades:
n H = Hombre Hombre 4 4/10=0,4=40%
n M = Mujer Mujer 6 6/10=0,6=60%

10=tamao
muestral
n Muestra:

MHHMMHMMMH

equivale a
HHHH MMMMMM
Nmero de hijos
Ejemplo Porcent. Porcent.
n Cuntos individuos tienen Frec. (vlido) acum.
menos de 2 hijos? 0 419 27,8 27,8
frec. indiv. sin hijos 1 255 16,9 44,7
+ 2 375 24,9 69,5 50%
frec. indiv. con 1 hijo
= 419 + 255 3 215 14,2 83,8
= 674 individuos 4 127 8,4 92,2
5 54 3,6 95,8
n Qu porcentaje de individuos 6 24 1,6 97,3
tiene 6 hijos o menos? 7 23 1,5 98,9
97,3% Ocho+ 17 1,1 100,0
Total 1509 100,0
n Qu cantidad de hijos es tal
que al menos el 50% de la
poblacin tiene una cantidad
inferior o igual?
2 hijos
Grficos para v. cualitativas
n Diagramas de barras
Alturas proporcionales a las frecuencias (abs. o rel.)
Se pueden aplicar tambin a variables discretas

n Diagramas de sectores (tortas, polares)


No usarlo con variables ordinales.
El rea de cada sector es proporcional a su
frecuencia (abs. o rel.)

n Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser proporcional a
la frecuencia. De los dos, cul es incorrecto?.
Grficos diferenciales para variables numricas
419
400 375

n Son diferentes en funcin de que las 300

255

Recuento
variables sean discretas o continuas.
215
200

Valen con frec. absolutas o relativas.


127

100

54

Diagramas barras para v. discretas 24 23 17

0 1 2 3 4 5 6 7 Ocho o ms

n Se deja un hueco entre barras para indicar Nmero de hijos

los valores que no son posibles 250

200

Histogramas para v. continuas

Recuento
150

n El rea que hay bajo el histograma entre


dos puntos cualesquiera indica la cantidad
100

(porcentaje o frecuencia) de individuos en 50

el intervalo.
20 40 60 80

Edad del encuestado


Diagramas integrales
n Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan
a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad
(frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos
en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por
derivacin (en un sentido ms general del que visteis en bachillerato.)

También podría gustarte