Está en la página 1de 51

INTRODUCCIN

CONCEPTOS BASICOS
ORGANIZACIN DE DATOS
Profesor del curso: Ing. Celso Gonzales
INTRODUCCIN
CONCEPTOS BASICOS
ORGANIZACIN DE DATOS
Profesor del curso: Ing. Celso Gonzales
ESTADISTICA GENERAL
ESTADISTICA GENERAL
INTRODUCCION
INTRODUCCION
OBJETIVOS
Comprender qu es y porqu se estudia la estadstica.
Comprender los conceptos bsicos de la estadstica.
Explicar lo que significan estadstica descriptiva y
estadstica inferencial.
Diferenciar entre una variable cualitativa y cuantitativa.

Qu
Qu

es estad
es estad

stica?
stica?
Recolecta
Organiza
Presenta
Analiza
interpreta

Para qu
Para qu

sirve la estad
sirve la estad

stica?
stica?
La Estadstica se utiliza como tecnologa al servicio de
las ciencias.......
TIPOS DE ESTADISTICA
TIPOS DE ESTADISTICA
Estadstica Descriptiva
Estadstica Inferencial
Estadstica Descriptiva
Estadstica Inferencial
RAMAS DE LA ESTADSTICA
ESTADSTICA DESCRIPTIVA ESTADSTICA INFERENCIAL
SE OCUPA DE LA COLECCIN
Y CLASIFICACIN DE
INFORMACIN, DE SU RESUMEN
EN CUADROS Y GRFICOS
ADECUADOS QUE RESUMAN
EN FORMA APROPIADA
LA INFORMACIN CAPTADA.
SE OCUPA DE LOS PROCESOS
DE ESTIMACIN, ANLISIS Y
PRUEBA DE HIPTESIS, CON
ELPROPSITO DE LLEGAR A
CONCLUSIONES QUE BRINDEN
UNA ADECUADA BASE
CIENTFICA PARA LA TOMA
DE DECISIONES TOMANDO
COMO BASE LA INFORMACIN
CAPTADA POR LA MUESTRA.
Pasos en un estudio estad Pasos en un estudio estad stico stico
Plantear hiptesis sobre una poblacin
Decidir qu datos recoger (diseo de experimentos)
Qu individuos pertenecern al estudio (muestras)
Qu datos recoger de los mismos (variables)
Recoger los datos (muestreo)
Estratificado? Sistemticamente?
Describir (resumir) los datos obtenidos
Realizar una inferencia sobre la poblacin
Cuantificar la confianza en la inferencia
Nivel de confianza
Margen de error:
CONCEPTOS B
CONCEPTOS B

SICOS
SICOS
Poblacin
Muestra
Individuo o unidad elemental
Observacin
Variable
Parmetro
Estadstico
POBLACI
POBLACI

N Y MUESTRA
N Y MUESTRA
Poblacin Conjunto de observaciones o datos
obtenidos de una medicin, conteo o cualidad de
ciertos caracteres de los mismos.
Muestra
Deber ser representativo
Unidad elemental
Unidad elemental
Todo elemento que est afectado por la
caracterstica o factor que se desea estudiar.
Ejemplo: Se desea hacer un estudio sobre el
ingreso familiar de Lima Metropolitana
Identifique: Poblacin, una posible muestra, la
caracterstica en estudio y la unidad elemental.
Observaci
Observaci

n
n
Dato o registro realizado, producto de la
apreciacin de una caracterstica en una unidad
elemental.
De una observacin para el ejemplo anterior.
EJ EMPLO1 EJ EMPLO1
Se ha hecho un estudio para determinar la preferencia
de una marca especial de detergente por parte de las
amas de casa. Entre las 50 amas de casa
entrevistadas, 30 dijeron que preferan esta marca.
a. Qu constituye la muestra?.
b. Qu constituye la poblacin?.
c. Cul es la proporcin, dentro de la muestra, de las
amas de casa que prefieren la marca del detergente?
Variables
Variables
Son las caractersticas que se desea apreciar de los
elementos de la poblacin.
CLASIFICACIN
DE VARIABLES
CUALITATIVAS CUANTITATIVAS
Discreto Nominal Ordinal Continuo
Atributos
Numrico
Cualitativas
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)
Ordinales: Si sus valores se pueden ordenar
Grado de satisfaccin, Intensidad del color
Cuantitativas o Numricas
Discretas: Si toma valores enteros
Nmero de hijos, Nmero de desempleados
Continuas: Si entre dos valores, son posibles infinitos valores
intermedios.
Altura, ingreso mensual,
TIPOS DE VARIABLES
EJ EMPLO2 EJ EMPLO2
Clasificar cada una de las siguientes variables:
a. Distancia diaria recorrida por cada estudiante para ir de su
casa a la universidad.
b. Tiempo que requiere un estudiante para responder a un
examen.
c. Llamadas que llegan a la central telefnica de la USB en un
da.
d. Preferencia por cierta marca de refresco.
e. Sexo de las estudiantes que toman el curso de estadstica
en el semestre.
f. Nmero de acciones vendidas en un da en la Bolsa de
Valores.
Par
Par

metro
metro
Es una funcin de todas las observaciones de una
poblacin ( )
MEDIDA USADA PARA DESCRIBIR UNA VARIABLE DE
UNA POBLACION
El parmetro resume la informacin contenida en las
observaciones que comprenden a una poblacin, por lo que
su valor es nico y generalmente desconocido y por tato
debe ser ESTIMADO.
Par
Par

metro
metro
La media
La varianza
2
Proporcin p
N
x x x
N
+ + +
=
...
2 1

Estad
Estad

stico o estimador
stico o estimador
Es una funcin de los valores
muestrales y que no depende de
parmetro alguno. Se
caracterizan porque pueden
tomar valores diferentes de
muestra a muestra.
) ,..., , (

2 1 n
x x x f =
n
x x x
X
n
+ + +
=
...
2 1
Por ejemplo, la media muestral
ORGANIZACI ORGANIZACI N DE DATOS N DE DATOS
OBJETIVOS
Organizar los datos en una distribucin de frecuencias
Presentar una distribucin de frecuencias en un histograma,
un polgono de frecuencias y una ojiva.
Elaborar e interpretar una representacin de tallo y hoja.
ORGANIZACI
ORGANIZACI

N DE DATOS
N DE DATOS
VARIABLE CUALITATIVA
Para representar grficamente la distribucin de
frecuencias de una variable cualitativa se utilizan las
barras y los sectores circulares.
Nota
Si trabajamos con variables nominales las categoras
pueden ser colocadas en cualquier orden. En el caso
de escala ordinal las categoras debern ser
colocadas en orden
EJEMPLO:
En una planta embotelladora se registraron
54 accidentes y de acuerdo con la parte
del cuerpo lesionada, dedos (D), ojos (O),
brazo (B), y piernas (P); se registraron los
datos (cuadro 1). Se pide organizar los
datos.
D D O B P B
P O B D D D
B P D D P D
P D D P B P
B O D B B D
D B O B B O
P D O D P D
O D P D D D
B B P B D D
CUADRO 1:
54 Total
11 PIERNA
7 OJ O
22 DEDOS
14 BRAZOS
NMERO DE
ACCIDENTES
PARTE
LESIONADA
Pierna Ojos Dedos Brazo
20
10
0
Parte Lesionada
N

m
e
r
o

d
e

a
c
c
i
d
e
n
t
e
s
Ac c i dent es oc ur r i dos en l a
pl ant a segn l a par t e l esi onada
Fuente: Elaborado por el Departamento de Personal.
J ulio del 2005
BRAZO (14, 25.9%)
PIERNA (11, 20.4%)
OJ O ( 7, 13.0%)
DEDO (22, 40.7%)
ACCI DENTES OCURRI DOS EN LA
PLANTA SEGN LA PARTE LESI ONADA
Si adems de registrar la parte lesionada se
registra el sexo de los trabajadores se podra
tener un grfico de este tipo.
P O D B
15
10
5
0
LESION
N

m
e
r
o

d
e

t
r
a
b
a
j
a
d
o
r
e
s
Hombre
Mujer
el t i po de l esi n y sex o
Regi st r o de ac c i dent es segn
Fuente: Departamento Mdico
J ulio del 2005
ORGANIZACI
ORGANIZACI

N DE DATOS
N DE DATOS
VARIABLE CUANTITATIVA
DISCRETA
Variable Cuantitativa Discreta Variable Cuantitativa Discreta
(Pocos valores diferentes de la variable) (Pocos valores diferentes de la variable)
(f
n
/n)x100 f
n
X
n

1 n
(f
2
/n)x100 f
2
X
2
(f
1
/n)x100 f
1
X
1
Porcentaje Frecuencia Variable
Ejemplo
Construir la distribucin de frecuencias del nmero de
trabajadores que se ausentaron en 20 das laborales:
4 2 1 3 3
2 3 1 2 3
0 2 3 2 3
1 4 2 1 2
0.10x100=10% 2 4
0.30x100=30% 6 3
0.35x100=35% 7 2
100% 20
0.20x100=20% 4 1
0.05x100=5% 1 0
Porcentajes N de das Ausencias de
Trabajadores
4 3 2 1 0
7
6
5
4
3
2
1
0
Nmero de Ausencias por da
N

m
e
r
o

d
e

t
r
a
j
a
d
o
r
e
s
t r abaj ador es que sea ausent ar on por da.
Di st r i buc i n de Fr ec uenc i a del nmer o de
Nmero de hijos
419 27,8 27,8
255 16,9 44,7
375 24,9 69,5
215 14,2 83,8
127 8,4 92,2
54 3,6 95,8
24 1,6 97,3
23 1,5 98,9
17 1,1 100,0
1509 100,0
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
Porcent.
(vlido)
Porcent.
acum.
Tablas de frecuencias: Tablas de frecuencias: Ejemplo Ejemplo
Cuntos individuos tienen menos
de 2 hijos?
674 individuos
Qu porcentaje de individuos
tiene 6 hijos o menos?
97,3%
Qu cantidad de hijos es tal que
al menos el 50% de la poblacin
tiene una cantidad inferior o igual?
2 hijos
50%
MEDIDAS DE VARIABILIDAD
MEDIDAS DE VARIABILIDAD
Rango
Rango intercuartil
Variancia
Desviacin estndar
Coeficiente de variabilidad
ORGANIZACI
ORGANIZACI

N DE DATOS
N DE DATOS
VARIABLE CUANTITATIVA CONTINUA
En la oficina de un diario, el tiempo que se tardan en
imprimir la primera plana fue registrado durante 50 das. A
continuacin se transcriben los datos, aproximados a
dcimas de minuto:
22,7 21,6 20,9 21,1 24,3 23,8 20,7 23,8 24,2 19,7
23,9 22,8 23,9 19,8 24,1 24,2 19,9 23,1 21,5 21,3
21,8 24,2 24,1 19,5 25,0 25,1 19,0 23,6 20,3 23,7
19,5 23,5 22,9 20,9 23.3 23,8 21,2 22,5 20,7 25,3
20,1 22,8 22,2 25,0 20,9 20,7 22,0 21,9 22,8 20,8
a. Construya con los datos una tabla de distribucin de
frecuencia, usando la regla de sturges.
b. Construya un polgono de frecuencias.
c. Construya una ojiva.
d. Por medio de la ojiva estime que porcentaje de las veces
la primera plana del peridico puede imprimirse en
menos de 24 minutos.
PROCEDIMIENTO
Calcular el rango (R) o recorrido, el cual se define de
la siguiente manera:
R = Obs. mxima Obs. Mnima
R = 25.3 - 19.0 = 6.3
Determine el nmero de intervalos (k)
K = 1 + 3.3 log (n) (Frmula de Sturges)
K = 1 + 3.3 log (50) = 6.607 = 7 (entero)
(Redondeo simple)
Elabore la tabla de frecuencia segn la informacin anterior
donde:
f
i
= Frecuencia absoluta
F
i
= Frecuencia acumulada absoluta
fri= Frecuencia relativa=f
i
/n
Fr
i
= Frecuencia acumulada relativa
n f
k
i
i
=
=
1
1
1

=
=
k
i
i
fr

=
=
i
j
j i
f F
1
n F fr Fr
i
i
j
j i
/
1
= =

=
2
i i
i
LS LI
X
+
=

Marca de clase
Determinar del tama Determinar del tama o del intervalo TIC o del intervalo TIC
(Redondeado por exceso) (Redondeado por exceso)
Se redondea Se redondea sug sug n n el n el n mero de mero de
decimales que se tiene en la muestra decimales que se tiene en la muestra
9 . 0
7
3 . 6
= =
=
TIC
K
R
TIC
1.00
0.92
0.64
0.50
0.40
0.22
0.10
Fri
1 50
24.85 50 0.08 4 [24.4-25.3]
23.95 46 0.28 14 [23.5-24.4>
23.05 32 0.14 7 [22.6-23.5>
22.15 25 0.10 5 [21.7-22.6>
21.25 20 0.18 9 [20.8-21.7>
20.35 11 0.12 6 [19.9-20.8>
19.45 5 0.10 5 [19.0-19.9>
X
i
Fi fri fi Tiempo (minutos)
Distribucin de frecuencias del tiempo que tardan en
imprimir la primera plana de un diario
Grficos para datos cuantitativos Agrupados en
intervalos de clase
HISTOGRAMA DE FRECUENCIA
POLIGONO DE FRECUENCIA
OJ IVA
Grfico de Tallos y hojas
Grfico para datos cuantitativos seriados en el tiempo
HISTOGRAMA DE FRECUENCIA
Tiempo
N

m
e
r
o

d
e

d

a
s
25.3 24.4 23.5 22.6 21.7 20.8 19.9 19.0
14
12
10
8
6
4
2
0
Distribucin del tiempo que se tardan en imprimir la primera plana del diario
POLIGONO DE FRECUENCIAS
Tiempo
N

m
e
r
o

d
e

d

a
s
24.85 23.95 23.05 22.15 21.25 20.35 19.45
14
12
10
8
6
4
2
0
Distribucin del tiempo que se tardan en imprimir la primera plana del diario
POLIGONO
OJ IVA
0
10
20
30
40
50
60
19 19.9 20.8 21.7 22.6 23.5 24.4 25.3
Tiempo(en minutos)
N


A
c
u
m
u
l
a
d
o

d
e

d
i
a
s
OJIVA
Para evaluar la viabilidad de un proyecto de
reforestacin de una zona sometidas a estrs turstico,
para el que se ha solicitado una subvencin publica, se
analiz la composicin en mg/cm3 de desechos
orgnicos del territorio. Los datos obtenidos fueron:
25.8 20.7 18.6 15.1 11.9
23.2 20.4 18.4 15.1 11.1
22.5 20.3 18.2 14.4 10.8
22.2 20.3 16.9 14.3 10.8
21.4 20.3 15.9 14 9.4
21 19.7 15.8 12.9 9.2
20.8 18.8 15.3 12.9 8.2
Composicin (mg/cm3)
EJERCICIO
A. Construir la tabla de frecuencias y representar la
informacin grficamente.
B. A partir de la tabla de frecuencias interprete: f
3
y 1-Fr
2
C. Entre qu niveles de composicin se encuentra
aproximadamente el 51,4% de las observaciones con
menores niveles registrados?.
1 0.05714286 35 2 [23.6 - 26.2>
0.94285714 0.28571429 33 10 [20.2 - 23.2>
0.65714286 0.14285714 23 5 [17.2 - 20.2>
0.51428571 0.22857143 18 8 [14.2 - 17.2>
0.28571429 0.11428571 10 4 [11.2 - 14.2>
0.17142857 0.17142857 6 6 [8.2 - 11.2>
Fri fri Fi
Nmero de
observaciones Composicin
Para los artculos anteriores se tienen las siguientes
distribuciones de los precios (en dlares) en la primera
semana de agosto y en la primera semana de setiembre
del 2005.
0 3 79
1 4 76
2 6 73
4 4 70
6 2 67
4 1 64
3 0 61
SETIEMBRE AGOSTO PUNTOS MEDIOS
CANTIDAD DE ARTICULOS
EJERCICIO
a) Grafique las dos distribuciones anteriores en un slo
grfico donde se aprecien el comportamiento de las
mismas y calcule el promedio y la desviacin estndar
de la distribucin de agosto
b) Realice un comentario segn lo observado en el
grfico anterior
Stem-and-Leaf Display: Tiempo
Stem-and-leaf of Tiempo N = 50
Leaf Unit = 0.10
1 19 0
6 19 55789
8 20 13
15 20 7778999
18 21 123
22 21 5689
24 22 02
(6) 22 578889
20 23 13
18 23 56788899
10 24 112223
4 24
4 25 0013
DI AGRAMA DE TALLOS Y HOJ AS
Los datos tienen un
decimal
tallo
hojas
Terminacin de dgitos del 0 al 4
Terminacin de dgitos del 5 al 9
15 datos menores e
iguales que 20.9
6 datos entre 22.5 y
22.9 y uno de ellos
es la mediana
10 datos mayores e
iguales que 24.1

También podría gustarte