Está en la página 1de 33

Estadstica

Tema 1: Introduccin a la estadstica

Estadstica Bsica

Introducin

Para qu sirve la estadstica?

La Ciencia se ocupa en general de fenmenos observables

La Ciencia se desarrolla observando hechos, formulando leyes que los explican y


realizando experimentos para validar o rechazar dichas leyes

Los modelos que crea la ciencia son de tipo determinista o aleatorio

La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad


y la incertidumbre forman parte de su naturaleza

Es la Ciencia que se ocupa del recuento de hechos sociales, cientificos o de cualquier


clase y de la comparacion de las cifras obtenidas.

Estadstica Bsica

Introducin

Historia de la Estadstica

Egipto (3050 a.c): Datos sobre la poblacin y riqueza del pas.


Ramss II realiz un censo de tierras con el objeto de verificar una
nueva reparticin.

Israel: La Biblia da referencias en el libro de los Nmeros de datos


estadsticos obtenidos en dos recuentos de la poblacin hebrea. Por
otra parte el rey David ordeno realizar un censo de Israel para
conocer el nmero de la poblacin.

China: Efectuaron censos hace ms de 40 siglos.

Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
Griegos: Censos con fines tributarios, sociales y militares. La
investigacin histrica revela que realizaron 69 censos para
calcular los impuestos, derecho al voto y ponderar la potencia
guerrera.
Roma: fueron los que mejor emplearon los recursos de la
estadstica. Realizaban censos cada 5 aos y los funcionarios
pblicos tenan la obligacin de llevar un registro de nacimientos,
matrimonios y defunciones, adems un recuento peridico de
ganado y de las riquezas contenidas en las tierras conquistadas.

Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
Edad Media: se realizaron muy pocas operaciones estadsticas con
la excepcin de las relaciones de tierras pertenecientes a la iglesia
compiladas por Pipino el Breve en el 758 y por Carlomagno en el
762 d.c.
En Inglaterra, Guillermo el Conquistador recopilo el Domesday
Book libro del Gran Catastro para el ao 1086, un documento de
la propiedad, extensin y valor de las tierras de Inglaterra. Esta
obra fue el primer compendio estadstico de Inglaterra.

Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
Durante los siglos XV,XVI,XVII, hombres como Da Vinci,
Copernico, Galileo, Neper, Harvey, Sir Francis Bacon y Descartes,
hicieron grandes operaciones al mtodo cientfico, de forma tal que
cuando se crearon los Estados Nacionales y surgi el comercio
internacional ya exista un mtodo capaz de aplicarse a los datos
econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las
defunciones debido a la Peste publicando estadsticas semanales de
los decesos, esta costumbre continuo por muchos aos, y en 1632
estos Bills of mortality (cuentas de mortalidad) contenan
nacimientos y fallecimientos por sexo.
Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
En 1662, John Graunt us documentos que abarcaban treinta aos
y efectu predicciones sobre el nmero de personas que moriran
de varias enfermedades y sobre las proporciones de nacimientos de
varones y mujeres en su obra Natural and Political Observations.
Made upon the Bill of Mortality. Este fue uno de los primeros
esfuerzos innovadores en el anlisis estadstico.
Durante el siglo XVII el alemn Sebastin Muster aport
indicaciones ms concretas de mtodos de observacin y anlisis
cuantitativo y amplio los campos de la inferencia y la teora
estadstica.

Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
Los Eruditos del siglo XVII demostraron especial inters por la
estadstica demogrfica como resultado de la especulacin sobre si la
poblacin aumentaba, decreca o permaneca igual.
En tiempos modernos los mtodos estadsticos fueron utilizados por
algunos reyes que necesitaban conocer las riquezas monetarias y el
potencia humano de sus respectivos reinos.
El primer empleo de datos estadsticos sin fines polticos estuvo a cargo
de Gaspar Neumann el cual demostr que en los aos terminados en
siete no fallecan ms personas que en los dems. Los procedimientos de
Neumann fueron conocidos por Halley quien los aplico al estudio de la
vida humana. Sus clculos sirvieron para base para las tablas de
mortalidad que hoy utilizan todas las compaas de seguros.
Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
Durante el siglo XVII y principios de XVIII, matemticos como
Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la
teora de probabilidades.
Godofredo Achenwall, acuo en 1760 la palabra estadstica, que
extrajo del termino italiano statista (estadista). La raz remota se
halla, por otra parte, en el termino latino status, que significa estado
o situacin.
Jacques Qutelect es quien aplica las estadsticas a las ciencias
sociales. Este interpret la teora de la probabilidad para el uso en las
ciencias sociales y resolver la aplicacin del principio de promedios
y de variabilidad a los fenmenos sociales.

Estadstica Bsica

Historia de la Estadstica

Historia de la Estadstica
En el periodo de 1800 a 1820 se desarrollaron dos conceptos
matemticos fundamentales para la teora de la estadstica; la
teora de errores de observacin, aportada por Laplace y Gauss;
y la teora de los mnimos cuadrados desarrollada por Laplace,
Gauss y Legendre.
A finales del siglo XIX, Sir Francis Gaston ide el mtodo
conocido como correlacin, que tenia por objeto medir la
influencia relativa de los factores sobre las variables. De aqu
parti el desarrollo del coeficiente de correlacin creado por
Karl Pearson y otros investigadores de la ciencia biomtrica
como J. Pease Norton, R. H Hooker y G. Udny Yule que
efectuaron amplio estudios sobre la medida de las relaciones.
Estadstica Bsica

Historia de la Estadstica

10

Historia de la Estadstica
Los progresos ms recientes en el campo de la
estadstica se refieren al desarrollo del clculos de
probabilidades, particularmente en la rama
denominada indeterminismo o relatividad

Estadstica Bsica

Historia de la Estadstica

11

Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de los


datos referentes a un fenmeno que presenta variabilidad o
incertidumbre para su estudio metdico, con objeto de

a
iv
t
rip
c
s
De

i
b
ba

a
il d

deducir las leyes que rigen esos fenmenos,

o
Pr

er
f
In

ia
c
en

y poder de esa forma hacer previsiones sobre los mismos, tomar


decisiones u obtener conclusiones.

Estadstica Bsica

Introducin

12

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin


Los fumadores tienen ms bajas produccin
laboral que los no fumadores
En qu sentido? Mayor nmero? Tiempo
medio?

No tenis que
entenderlo (an)
Estadstica Bsica

Introducin

13

Pasos en un estudio estadstico

Recoger los datos (muestreo)

Estratificado? Sistemticamente?

Describir (resumir) los datos obtenidos

tiempo medio de baja en fumadores y no (estadsticos)

% de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Los fumadores estn de baja al menos 10 das/ao ms de media que los


no fumadores.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95%

Significacin del contraste: p=2%

Estadstica Bsica

Introducin

14

Pasos de un estudio estadstico

Decidir qu datos recoger (diseo de experimentos)

Qu individuos pertenecern al estudio (muestras)

Fumadores y no fumadores en edad laboral.


Criterios de exclusin Cmo se eligen? Descartamos los que
padecen enfermedades crnicas?

Qu datos recoger de los mismos (variables)

Estadstica Bsica

Nmero de bajas
Tiempo de duracin de cada baja
Sexo? Sector laboral? Otros factores?
Introducin

15

Mtodo cientfico y estadstica

Estadstica Bsica

Plantear
hiptesis

Disear
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

Introducin

16

Poblacin y muestra

Poblacin es el conjunto sobre el que estamos


interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder
abarcarlo.

Muestra es un subconjunto de la poblacion al que


tenemos acceso y sobre el que realmente hacemos las
observaciones (mediciones)
Debe ser representativo
Esta formado por miembros seleccionados de la
poblacin (individuos, unidades experimentales).

Estadstica Bsica

Introducin

17

Variables

Una variable es una caracterstica observable que vara entre


los diferentes individuos de una poblacin. La informacin que
disponemos de cada individuo es resumida en variables.

En los individuos de la poblacin colombiana, de uno a


otro es variable:
El grupo sanguneo {A, B, AB, O} Var. Cualitativa
Su nivel de felicidad declarado
{Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal

El nmero de hijos {0,1,2,3,...} Var. Numrica discreta


La altura {162 ; 174; ...} Var. Numrica continua
Estadstica Bsica

Introducin

18

Tipos de variables

Cualitativas
Si sus valores (modalidades) no se pueden asociar
naturalmente a un nmero (no se pueden hacer
operaciones algebraicas con ellos)

Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar

Estadstica Bsica

Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor


Introducin

19

Tipos de Variables

Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)

Discretas: Si toma valores enteros


Nmero de hijos, Nmero de cigarrillos, Num. de
cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores


intermedios.
Altura, Presin intraocular, Dosis de medicamento
administrado, edad

Estadstica Bsica

Introducin

20

Es buena idea codificar las variables


como nmeros para poder procesarlas
con facilidad en un ordenador.
Es conveniente asignar etiquetas a los
valores de las variables para recordar
qu significan los cdigos numricos.

Sexo (Cualit: Cdigos arbitrarios)

Raza (Cualit: Cdigos arbitrarios)

1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz

Se pueden asignar cdigos a respuestas


especiales como

1 = Blanca
2 = Negra,...

Felicidad Ordinal: Respetar un orden al


codificar.

1 = Hombre
2 = Mujer

0 = No sabe
99 = No contesta...

Estas situaciones debern ser tenidas en


cuentas en el anlisis. Datos perdidos
(missing data)
Estadstica Bsica

Introducin

21

Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero


tipo de las variables y su significado cuando vayamos a usar programas de
clculo estadstico.
No todo est permitido con cualquier tipo de variable.

Estadstica Bsica

Introducin

22

Los posibles valores de una variable suelen denominarse modalidades.

Las modalidades pueden agruparse en clases (intervalos)

Edades:

Hijos:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos


Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y excluyente

Exhaustivo: No podemos olvidar ningn posible valor de la variable

Mal: Cul es su color del pelo: (Rubio, Moreno)?


Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores


simultneos de la variable

Estadstica Bsica

Estudio sobre el ocio

Mal: De los siguientes, qu le gusta: (deporte, cine)

Bien: Le gusta el deporte: (S, No)

Bien: Le gusta el cine: (S, No)

Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)


Introducin

23

Presentacin ordenada de datos

7
6
5

Gnero

Frec.

Hombre

4
3
2
1

Mujer

0
Hombre

Mujer

Las tablas de frecuencias y las representaciones grficas son dos


maneras equivalentes de presentar la informacin. Las dos exponen
ordenadamente la informacin recogida en una muestra.

Estadstica Bsica

Introducin

24

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de


informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

Frecuencias relativas (porcentajes): Idem, pero dividido por el total

Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas

Muy tiles para calcular cuantiles (ver ms adelante)

Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8

Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% 83,8% = 13,5%

Estadstica Bsica

Introducin

25

Tablas de Frecuencia

Sexo del encuestado

Vlidos

Hombre
Mujer
Total

Frecuencia
636
881
1517

Porcentaje
41,9
58,1
100,0

Porcentaje
vlido
41,9
58,1
100,0

Nmero de hijos

Vlidos

Nivel de felicidad

Vlidos

Perdidos
Total

Frecuencia Porcentaje
Muy feliz
467
30,8
Bastante feliz
872
57,5
No demasiado feliz
165
10,9
Total
1504
99,1
No contesta
13
,9
1517
100,0

Estadstica Bsica

Porcentaje
vlido
31,1
58,0
11,0
100,0

Porcentaje
acumulado
31,1
89,0
100,0

Perdidos
Total

Introducin

0
1
2
3
4
5
6
7
Ocho o ms
Total
No contesta

Frecuencia
419
255
375
215
127
54
24
23
17
1509
8
1517

Porcentaje
27,6
16,8
24,7
14,2
8,4
3,6
1,6
1,5
1,1
99,5
,5
100,0

Porcentaje
vlido
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcentaje
acumulado
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

26

Datos desordenados y ordenados en tablas

Variable: Gnero

Gnero

Frec.

Frec. relat.
porcentaje

Modalidades:

Hombre

4/10=0,4=40%

Mujer

6/10=0,6=60%

H = Hombre
M = Mujer

10=tamao
muestral

Muestra:
MHHMMHMMMH

equivale a
HHHH MMMMMM

Estadstica Bsica

Introducin

27

Ejemplo

Cuntos individuos tienen menos


de 2 hijos?

Qu porcentaje de individuos
tiene 6 hijos o menos?

frec. indiv. sin hijos


+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

97,3%

Qu cantidad de hijos es tal que al


menos el 50% de la poblacin
tiene una cantidad inferior o igual?

Nmero de hijos

0
1
2
3
4
5
6
7
Ocho+
Total

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(vlido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

50%

2 hijos

Estadstica Bsica

Introducin

28

Grficos para v. cualitativas

Diagramas de barras

Diagramas de sectores (tartas, polares)

Alturas proporcionales a las frecuencias (abs. o rel.)


Se pueden aplicar tambin a variables discretas

No usarlo con variables ordinales.


El rea de cada sector es proporcional a su frecuencia (abs.
o rel.)

Pictogramas

Fciles de entender.
El rea de cada modalidad debe ser proporcional a la
frecuencia. De los dos, cul es incorrecto?.

Estadstica Bsica

Introducin

29

Grficos diferenciales para variables numricas


419

375

400

Son diferentes en funcin de que las variables


sean discretas o continuas. Valen con frec.
absolutas o relativas.

Recuento

300

255
215
200

127
100

54
24

Diagramas barras para v. discretas

23

17

7 Ocho o ms

Nmero de hijos

Se deja un hueco entre barras para indicar los


valores que no son posibles
250

Histogramas para v. continuas

El rea que hay bajo el histograma entre dos puntos


cualesquiera indica la cantidad (porcentaje o
frecuencia) de individuos en el intervalo.

200

Recuento

150

100

50

20

Estadstica Bsica

Introducin

40

60

Edad del encuestado

80

30

Diagramas integrales

Cada uno de los anteriores diagramas tiene su


correspondiente diagrama integral. Se realizan a partir
de las frecuencias acumuladas. Indican, para cada
valor de la variable, la cantidad (frecuencia) de
individuos que poseen un valor inferior o igual al
mismo.

Estadstica Bsica

Introducin

31

Diagramas integrales

Estadstica Bsica

Introducin

32

Diagramas integrales

Estadstica Bsica

Introducin

33

También podría gustarte