Está en la página 1de 28

ESTADSTICA.

1
QU ES LA ESTADSTICA?
Conjunto de mtodos y tcnicas que permiten
recopilar, presentar, analizar y tomar
decisiones respecto de un conjunto de datos.

PARA QU SIRVE LA ESTADSTICA?


La Estadstica se utiliza como tecnologa al servicio de las
ciencias donde la variabilidad y la incertidumbre forman
parte de su naturaleza.
La Bioestadstica ensea y ayuda a investigar en todas las
reas de las Ciencias de la Vida donde la variabilidad no es
la excepcin sino la regla
Carrasco de la Pea (1982)
2
Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y


presentacin de los datos referentes a un
fenmeno que presenta variabilidad o
incertidumbre en su estudio metdico, con
objeto de

deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre


los mismos, tomar decisiones u obtener
conclusiones.
3
METODOS
DESCRIPTIVOS

Estos mtodos permiten conocer,


representar y cuantificar el
comportamiento de un conjunto de
datos.

4
MTODOS
INFERENCIALES

Mtodos empleados para determinar


o estimar alguna caracterstica de
una poblacin, en base a una
muestra.

5
Presentacin de conceptos.
Plantear hiptesis sobre una poblacin
Los fumadores tienen ms licencias laborales que los no fumadores
En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos).


Qu individuos pertenecern al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas?
Qu datos recoger de los mismos (variables)
Nmero de licencias
Tiempo de duracin de cada licencia
Sexo? Sector laboral? Otros factores?

Recoger los datos (muestreo)


Estratificado? Sistemticamente?

Describir (resumir) los datos obtenidos


tiempo medio de baja en fumadores y no (estadsticos)
% de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin.


Los fumadores tienen 10 das/ao ms en promedio, que los no fumadores.

Cuantificar la confianza en la inferencia


Nivel de confianza del 95%
Nivel de significacin del la prueba de hiptesis: p = 0,02

6
ANLISIS DESCRIPTIVO

Datos sin agrupar Datos agrupados


Tablas de frecuencias

Medidas de tendencia central, Medidas de


variabilidad, medidas de posicin y
medidas de forma.
GRFICAS 7
VARIABLE
Caracterstica de inters de los miembros de
una poblacin y que toma distintos valores.

CUALITATIVAS CUANTITATIVAS
Sus valores Sus valores corresponden a
corresponden a nmeros reales.
conceptos, atributos o
cualidades, son DISCRETAS CONTINUAS
observables. Las asociamos con Las asociamos con
contar medir.

8
DEFINICIN DE DATO U OBSERVACIN.

Valor NUMRICO o CATEGRICO asociado a una


variable
EJEMPLO 2. Tipos de variables y sus datos.
VARIABLES TIPO DATOS

Edad (aos) Cuantitativa continua 18; 30; 50

Sexo Cualitativa M; F; M

N de piezas Cuantitativa discreta 1,2,3


en una casa
N de Hijos Cuantitativa discreta 1;2;3

Colores de las Cualitativa Rojo; verde; blanco


casas
Ingreso ($) Cuantitativa continua $550.000;
$650.000;
$800.000 9
Es buena idea codificar las variables como
nmeros para poder procesarlas con
facilidad en un ordenador.
Es conveniente asignar etiquetas a los
valores de las variables para recordar qu
significan los cdigos numricos.
Sexo (Cualit: Cdigos arbitrarios)
1 = Hombre
2 = Mujer
Raza (Cualit: Cdigos arbitrarios)
1 = Blanca
2 = Negra,...
Felicidad Ordinal: Respetar el orden al
codificar.
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
Se pueden asignar cdigos a respuestas
especiales como
0 = No sabe
99 = No contesta...
Estas situaciones deben ser tenidas en
cuentas en el anlisis. Datos perdidos
(missing data)

10
Aunque se codifiquen como nmeros, debemos recordar siempre la
verdadera naturaleza de las variables y su significado, sobretodo
cuando vayamos a usar programas estadstico.
No todo est permitido con cualquier tipo de variable.

Bioestadstica. U. Mlaga. Tema 1: Introducin 11


Los posibles valores de una variable suelen denominarse
modalidades.

Las modalidades pueden agruparse en clases (intervalos)


Edades:
Menos de 20 aos, de 20 a 50 aos, ms de 50 aos
Hijos:
Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y


excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores simultneos de la


variable
Estudio sobre el tiempo para distraerse.
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

12
TABLAS DE FRECUENCIAS

13
Frecuencia
Tabla para datos cualitativos absoluta

Colores de las ni fi %fi


casas i Frecuencia
Rojo 10 0.303 30.3 relativa

Verde 11 0.333 33.3

Blanco 12 0.363 36.3 Frecuencia


relativa
Total 33 1 100 porcentual
Frecuencia
absoluta
acumulada
Tabla para datos cuantitativos discretos
Nmero i de ni fi %fi Ni Fi %Fi Frecuencia
hijos Relativa
acumulada
0 15 0.357 35.7 15 0.357 25.7

1 17 0.404 40.4 32 0.761 76.1


Frecuencia
2 10 0.238 23.8 42 1 100 Relativa
porcentual
Total 42 1 100
acumulada

14
Tabla de frecuencias para datos cuantitativos continuos
Limites Ingreso (m$) ni mi fi %fi Ni Fi %Fi
inferior y
superior 550 - 650 8 60 0.32 32 8 0.32 32

650 750 5 70 0.2 20 13 0.52 52

750 850 7 80 0.28 28 20 0.8 80

850 - 950 5 90 0.2 20 25 1 100


Intervalos Total 25 1 100
de clase
Marcas
de clase

Lsup Linf
Marca de clase m
2

15
n Notas Asig. Ingreso
1 3,8 7 2012 Ejemplo 3. Construccin de una tabla de frecuencias.
2 3,9 4 2010
3 4 7 2010 Se conoce la informacin del promedio final de una
4 4,1 5 2010 asignatura y de el nmero de asignaturas tomados en
5 4,1 8 2012 ese semestre. Se pide presentar los datos de la variable
6 4,2 4 2011 NOTAS en una tabla de frecuencias.
7 4,3 3 2009
8 4,4 4 2011 Cmo construir una tabla de frecuencias para datos
9 4,4 4 2011 cuantitativos continuos?
10 4,4 3 2010
11 4,5 5 2011
1. Definir el nmero de intervalos
12 4,5 4 2012 a) k=1+3.3logn
13 4,5 6 2012
14 4,6 6 2011 b) En la practica se aconseja utilizar entre 5 y 15
15 4,7 6 2012 intervalos.
16 4,8 6 2012
17 4,8 8 2009 2. Determinar el rango de los datos R X mx X mn
18 4,8 8 2010
19 4,8 3 2010
20 5,1 5 2012 3. Obtener la Amplitud del intervalo
21 5,2 7 2012
R
22 5,3 4 2011 a mayor
23 5,3 4 2010 k
24 5,3 4 2012 16
25 5,8 2 2012
Resultados

RANGO Nintervalos Amplitud Mx. Mn.


R=2 K=5 a = (2/5)=0.4 5,8 3,8

RANGO Nintervalos Amplitud Mx. Mn.


R=2 K=5 a = (2/5)=0.41 5,8 3,8

17
Tabla de Frecuencias para la variable NOTAS
Notas ni mi Ni fi Fi
3.80 - 4.21 6 4.0 6 0.24 0.24
4.21 - 4.62 8 4.4 14 0.32 0.56
4.62 - 5.03 5 4.8 19 0.2 0.76
5.03 - 5.44 5 5.2 24 0.2 0.96
5.44 5.85 1 5.6 25 0.04 1.00
TOTAL 25 1

INTERVALOS: a, b
18
Representaciones grficas.
VARIABLES

Cualitativa Discreta Continua

Grfico DE BARRAS Histograma


Polgono de
frecuencias.

OJIVA

GRAFICO CIRCULAR

19
Grficos para variable continua.

1. HISTOGRAMA . Variable NOTAS.

7
6
frecuencia absoluta

3
2

0
3.80 4.21 4.62 5.03 5.44 5.85
intervalos de clase

20
2. OJIVA. Variable
Notas

30
FRECUENCIA ACUMULADA

25
25
24
20
19

15
14

10

5 6

0
4,21 4,62 5.03 5,44 5,85
LIMITE SUPERIOR INTERVALO DE CLASE

21
3. Polgono de frecuencias. Variable Notas

8 4.4

7
Frecuencia absoluta

6 4.0

5 5.2
4.8
4

2
5.6
1

0 0 0
marcas de clase

22
Grficos Variable Cualitativa.

Ao de N de N de alumnos por ao de ingreso


ingreso alumnos %f 12

2009 2 8 10

8
2010 7 28
6
2011 6 24 4

2012 10 40 2

0
n 25 100 2009 2010 2011 2012

N de alumnos
Grfico barras

Grfico circular
23
Grficos variable discreta
35
Ramos n %f N %F
30 Grfico de BARRAS
2 1 4 1 4
3 3 12 4 16 25

4 8 32 12 48 20

%
5 3 12 15 60 15

6 4 16 19 76 10
7 3 12 22 88 5
8 3 12 25 100 0
25 100 2 3 4 5 6 7 8
Ramos

2
8
4% 3
12%
12%

7
12%

Grfico Circular
6 4
16% 32%

5
12%
24
Grfico de tallo y hojas

Consiste en una ordenacin de datos, donde el


nmero utilizado para designar una hilera es el tallo
y la unidad es la hoja.
6 1 6 4
Ejemplo
7 8 0 4 2 3 6 0 7
Construya un diagrama de Tallo y hoja 8 3 8 1 3 6
9 3 7 1
10 0
78 93 61 100 70 83 88 74 97
72 66 73 76 81 64 91 70 86 6 1 4 6
7 0 0 2 3 4 6 7 8
8 1 3 3 6 8
9 1 3 7
10 0

25
Grfico de tiempo

Cuando los datos de una variable se registran a intervalos


regulares de tiempo. Es de inters representarlos en el tiempo
o en el orden en que fueron obtenidos.

Lunes Martes Mircoles Jueves Viernes Sbado Domingo


Ejemplo
semana 1 10 7 6 8 11 9 10
semana 2 14 5 10 8 7 5 7
semana 3 9 3 6 4 6 4 5

16 semana 1
14 semana 2
12 semana 3
10
8
6
4
2
0
Lunes Martes Miercoles Jueves Viernes Sabado Domingo

26
Grfico de tallo y hojas

1-. Construya un grfico de tallo y hoja


1.0 8.3 3.1 1.1 5.1
1.2 1.0 4.1 1.1 4.0
2.0 1.9 6.3 1.4 1.3
3.3 2.2 2.3 2.1 2.1
1.4 2.7 2.4 3.0 4.1
5.0 2.2 1.2 7.7 1.5

2-. Construya un grfico de tallo y hoja

12.5 13.8 13.0 13.5 13.2


12.2 13.4 14.0 13.6 13.3
13.3 14.1 14.6 13.1 12.1
13.7 13.4 12.8 12.6 12.7

27
Qu hemos visto?
Definicin de estadstica
Poblacin
Muestra
Variables
Cualitativas
Cuantitativas
Presentacin ordenada de datos
Tablas de frecuencias
absolutas
relativas
acumuladas
Representaciones grficas
Cualitativas
Cuantitativas
Absolutas
Acumuladas

28

También podría gustarte