Está en la página 1de 30

Estadstica

Ciencia de los datos, implica


la coleccin, clasificacin,
sntesis, organizacin,
anlisis e interpretacin de
los datos

CEPRE UNALM

SUBDIVISIONES DE LA
ESTADSTICA
Estadstica Descriptiva:
Conjunto de mtodos estadsticos que se relacionan con el
resumen y descripcin de datos,
datos como
tablas, grficas y el anlisis mediante algunos clculos.
X
S

CEPRE UNALM

i R X

( X )
n1

Poblacin
Es un conjunto de elementos, (personas,
objetos, etc..), que tienen una o ms
caractersticas observables que se pueden
medir en ellos.

CEPRE UNALM

Muestra
Es un subconjunto de la poblacin en estudio,
seleccionada de acuerdo con un plan o regla,
y a partir de la cual se obtienen conclusiones
sobre las caractersticas de la poblacin.

CEPRE UNALM

Variable
Es una caracterstica definida en la poblacin
y que puede tomar dos o ms valores.
Ejemplos:
El grado acadmico de un profesor
El nmero de hijos de una familia
Velocidad de un automvil
Preferencia por determinada marca de
artefactos.
CEPRE UNALM

Clasificacin de las variables


Las variables se clasifican segn el tipo de
observacin que generan en:
Variables cualitativas y variables
cuantitativas
Variables cualitativas o categricas: Son
aquellas que no aparecen en forma numrica,
sino como categoras o atributos como: sexo,
profesin, color de ojos, etc.
CEPRE UNALM

Variables cuantitativas
Son aquellas que se pueden expresar
numricamente como: temperatura, salario,
nmero de goles en un partido.
Las variables cuantitativas segn el tipo de
valores que pueda tomar pueden ser discretas
o continuas

CEPRE UNALM

Variables cuantitativas discretas


Son aquellas que se obtienen de un nmero de
posibles valores que puede contarse.
Ejemplo:
Numero de clientes que llegan a una oficina
de un banco en un lapso de 10 minutos.
Nmero de artculos defectuosos producidos
por una mquina en un periodo de dos horas

CEPRE UNALM

Variables cuantitativas
continuas
Son aquellas que tienen un nmero infinito de
valores y son expresados mediante nmeros
de una escala continua (intervalos de nmeros
reales). Son el resultado de medir, y pueden
contener decimales.
Ejemplo:
El peso del contenido de un paquete de
cereales.
El ingreso familiar.
CEPRE UNALM

Presentacin y Ordenamiento de Datos


Tabla de Distribucin frecuencias
Intervalos de
clase

Frecuencia Absoluta
Simple
fi

Acumulada
Fi

Frecuencia Relativa
Simple
hi

Acumulada
Hi

Total

CEPRE UNALM

10

Frecuencias Absoluta
Frecuencia absoluta simple (fi)
Representa el nmero de observaciones que caen en
la categora respectiva i

Frecuencia absoluta acumulada (Fi):


Representa el nmero de observaciones que caen
hasta esa categora
Fi

i 1

fi

F1 f 1
F2 f 1 f 2
F3 f 1 f 2 f 3
CEPRE UNALM

11

Frecuencia Relativa
Frecuencia relativa simple ( hi )
Es la proporcin del nmero total de
observaciones que caen en esa categora.
Se obtiene estableciendo un cociente entre
la frecuencia absoluta simple y el total de
datos.
Frecuencia relativa acumulada (Hi) : Es la
proporcin del nmero total de observaciones
que caen hasta esa categora. Se obtiene
sumando las frecuencias relativas simples
correspondientes a los i primeros intervalos.
CEPRE UNALM

fi
hi
n

H i hi
i 1

H 1 h1
H 2 h1 h2

12

PROCEDIMIENTO
Para encontrar la distribucin de frecuencias de una
variable cuantitativa continua, se deben seguir los
siguientes pasos:

Calcular el rango R de variacin de datos:


R=Xmax Xmin

Determinar el nmero de intervalos k:


k = 1 +3.3 log (n) (Regla de Sturges)
Por razones prcticas se escoge entre 5 y 20
intervalos o clases.
Determinar la amplitud del intervalo A:
A= R/k

CEPRE UNALM

13

31

17

27

20

10

34

25

28

24

15

39

18

30

26

12

46

41

18

23

36

19

29

37

27

27

24

33

26

31

25

28

33

28

23

31

29

22

35

21

1. Para hallar el Rango : n = 40


xmax= 46
2.

xmin= 4

Rango = 46 4 = 42

Nmero de intervalos k = 7

3. Amplitud = 42/7 = 6
Ahora se formarn los intervalos y el cuadro
de distribucin de frecuencias
CEPRE UNALM

14

Intervalos de
clase

31

17

27

20

10

34

25

28

24

15

39

18

30

26

12

46

41

18

23

36

19

29

37

27

27

24

33

26

31

25

28

33

28

23

31

29

22

35

21

Frecuencia Absoluta

Frecuencia Relativa

Simple
fi

Acumulada
Fi

Simple
hi

Acumulada
Hi

[4; 10

0,025

0,025

[10; 16

0,075

0,100

[16; 22

10

0,15

0,250

[22; 28

12

22

0,3

0,550

[28; 34

11

33

0,275

0,825

[34; 40

38

0,125

[40; 46]

40

0,05

Total

40

0,950
1

CEPRE UNALM

15

PROBLEMA 02.
Intervalos de
clase

Frecuencia Absoluta
Simple
fi

[1,55 ; 1,60

h1=h5 ; h2=h4

Acumulada
Fi

Frecuencia Relativa
Simple
hi

Acumulada
Hi

0,04

[1,60 ; 1,65

[1,65 ; 1,70

43

[1,70 ; 1,75

48

[1,75 ; 1,80

2
50

50

Total

0,96
0,04

CEPRE UNALM

16

Problema 04

Hallar f3 + f5

Tabla de Distribucin frecuencias


Edad

Frecuencia Absoluta
Simple
fi

16

Acumulada
Fi

17
18

13
6

19

23

20
Total

25

CEPRE UNALM

17

06.El siguiente histograma fue el resultado de un estudio


realizado en una escuela de mecnica automotriz, sobre el
tiempo, en horas, que toma la reparacin de un motor.
I. Cuntas reparaciones
se incluyen en este
estudio?
II. Cuntas reparaciones
se terminaron en un
tiempo
mayor a 9,5 horas?
III. Qu porcentaje de
reparaciones se hicieron
en un tiempo mayor a 7,5
horas?
A) 36 ; 18 ; 58,3%
B) 30 ; 18 ; 90%
C) 36 ; 18 ; 75%
D) 36 ; 12 ; 75%
E) 36 ; 18 ; 50%

N de reparaciones
12
9

3,5
5,5
7,5
9,5 11,5 13,5
Tiempo para terminar una reparacin

CEPRE UNALM

18

MEDIDAS DE TENDENCIA
CENTRAL

Sea la distribucin de datos:

Menor valor

Mayor valor

X : media o promedio o promedio aritmtico


Me : mediana
Mo : moda

CEPRE UNALM

19

MEDIA ARITMTICA
DEFINICIN: Datos no tabulados
Si x1 ; x2 ;...; xn son los valores de una
variable estadstica X, entonces la media o el
promedio

x1 x2 ... xn
X
n
n

xi

X i =1
n

CEPRE UNALM

20

MEDIA ARITMTICA

DEFINICIN: Datos tabulados


Variable
fi

x1
x2

f1
f2

...

...

x1 ( f1 ) x2 ( f 2 ) ... xn ( f n )
X
n
n

xn

fn

TOTAL

xi ( f i )

X i =1

CEPRE UNALM

21

MEDIANA (Me)

Definicin.- Si X es una variable estadstica


cuyos valores ordenados en forma
ascendente (o descendente) son :

x1; x2 ;...; xn

entonces la mediana es el valor que ocupa el


punto medio de la distribucin, es decir no
es superado ni supera a ms de la mitad de
las n observaciones

CEPRE UNALM

22

Clculo de la mediana
Datos no tabulados
si el nmero de datos es impar, entonces la
mediana es el igual al valor de la
observacin que ocupa la posicin central

si el nmero de datos es par, entonces la


mediana es el igual a la semisuma de los dos
valores centrales
CEPRE UNALM

23

Problema 12
43;44;44;45;45;46;46;46;47;48;49;49;49;50;50;51;51;51;52;52
TRMINOS
CENTRALES
Me = (48+49)/2 = 48,5

CEPRE UNALM

24

Problema 19
Edad Frecuencia
17

18

19

20

21

22

35

Total

25

n = 25 trmino centralt13
Suma = 17

Me = 19

CEPRE UNALM

25

MODA (Mo)

La moda es un concepto muy simple, con el


mismo sentido que se da en el lenguaje comn.
Definicin.- La moda de una muestra

x1 ; x2 ;...; xn
es aquel valor de la variable que se presenta con
mayor frecuencia; es decir es el valor que ms
se repite.

CEPRE UNALM

26

Ejemplos:

CEPRE UNALM

xj

fj

xj

fj

27

Problema 14

3;4;4;5;6;6;6;6;7;7;7;7;7;8;8;8;9;9,10;10

Mo = 7

CEPRE UNALM

28

Problema 18
Estatura (m)

Frecuencia

1,60

1,65

1,70

1,71

1,85

1,87

1,93

1
CEPRE UNALM

Mo = 1,70

29

CEPRE UNALM

30

También podría gustarte