Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 1: INTRODUCCIN A LA
ESTADISTICA DESCRIPTIVA
Definicin de
Estadstica
Edad
Estudiantes
regulares del Rendimiento
Instituto de Carrera
Estudios Ingresos
Universitarios.
Etc.
Estadstico y Parmetro
Escala de Razn
Escala Nominal
1. Se clasifica a los sujetos en categoras, mutuamente
excluyentes y totalmente exhaustivas, tal que todos los
sujetos clasificados en la misma categora son equivalentes
respecto a la variable que se est midiendo.
2. Slo tiene sentido la relacin de igualdad-desigualdad.
3. Se pueden usar nmeros, letras o smbolos para identificar a
cada categora de la variable.
4. No se puede realizar ninguna operacin aritmtica en esta
escala.
Escala Nominal
Algunos ejemplos de variables medidas en la escala nominal:
Masculino M
Gnero
Femenino F
Soltero 1
Estado Casado 2
civil Divorciado 3
Viudo 4
Escala Ordinal
Preescolar 1
Mala D
Calidad de Regular C
un servicio Buena B
Excelente A
Escala de Intervalo.
DISTRIBUCIONES DE
FRECUENCIAS Y
REPRESENTACIONES
GRFICAS
DISTRIBUCIN DE FRECUENCIAS
Agrupamiento de datos en categoras
mutuamente excluyentes que indican el
nmero de observaciones en cada
categoria
Estadstica I 20
EJEMPLO
Estadstica I 21
Pasos
1.Determinar el nmero de clases k
k
2 n
El nmero de clases es la menor potencia a la que se eleva 2 de tal
manera que el resultado sea igual o prximo mayor que el nmero de
datos n
Ejemplo:
5 6
2 32 2 64
64 45
6 clases
Estadstica I 22
Pasos
2. Determinar el intervalo o amplitud de
clase
i = ancho del intervalo de clase
HL
i H = mayor valor observado
k L = menor valor observado
k = nmero de clases
Ejemplo:
271 363 159 76 227 337 295 319 250
279 205 279 266 199 177 162 232 L 303
192 181 321 309 246 278 50 41 335
116 100 151 240 474 297 170 188 320
429 294 570 342 279 235 434 123 325
H
23
Pasos
2. Determinar el intervalo o amplitud de clase
Ejemplo:
570 41
i 88,17 90
6
En la prctica este valor se redondea hacia arriba o algn
mltiplo de 10 o 100
El ancho de cada
clase ser de 90
Estadstica I
Pasos
3. Establecer los lmites de cada clase
Lmites nominales: indican valores incluidos en la clase
Lmites exactos: puntos especficos para separar clases adyacentes en una escala de
medicin continua
Gatos en
comestibles
(USD)
{40, 130) Ls Li i 40 + 90
{130, 220)
{220, 310)
{310, 400) i Ls Li
{400, 490)
{490, 580)
Pasos
4. Distribuir los datos en cada clase
Ejemplo:
Gatos en
comestibles Hogares en cada clase
(USD)
{40, 130) IIIII I
{130, 220) IIIII IIIII
{220, 310) IIIII IIIII IIIII II
{310, 400) IIIII III
{400, 490) III
{490, 580) I
Estadstica I
Pasos
5. Contar el nmero de elementos en cada clase
Gatos en
Ejemplo: comestibles Hogares en cada clase FRECUENCIA
(USD)
{40, 130) IIIII I 6
{130, 220) IIIII IIIII 10
{220, 310) IIIII IIIII IIIII II 17
{310, 400) IIIII III 8
{400, 490) III 3
{490, 580) I 1
45
Estadstica I
Cuntos hogares
gastan semanalmente en
comestibles entre 220 y 310
Gatos en USD?
comestibles FRECUENCIA
(USD)
{40, 130) 6
{130, 220) 10 Nos valemos de la
{220, 310) 17
{310, 400) 8
frecuencia absoluta:
{400, 490) 3 Son 17 hogares
{490, 580) 1
45
Marcas de Clase
Ejemplo: 2
Gatos en
MARCA DE
comestibles FRECUENCIA
CLASE
(USD)
{40, 130) 6 85
{130, 220) 10 175
220 310 530
{220, 310) 17 265 Xm 265
2 2
{310, 400) 8 355
{400, 490) 3 445
{490, 580) 1 535
45
Estadstica I
Distribucin de frecuencias relativas
Se convierte la frecuencia en porcentaje
Cada frecuencia de clase se divide entre el
nmero total de observaciones f
fr
n
Ejemplo:
Gatos en
FRECUENCIA
comestibles FRECUENCIA
RELATIVA
(USD)
{40, 130) 6 0,13
{130, 220) 10 0,22 17
{220, 310) 17 0,38 fr 0,38
45
{310, 400) 8 0,18
{400, 490) 3 0,07
{490, 580) 1 0,02
45 1,00
Estadstica I 30
Gatos en
FRECUENCIA
comestibles FRECUENCIA
RELATIVA Qu
(USD)
porcentaje de hogares
{40, 130) 6 0,13 gastan semanalmente
{130, 220) 10 0,22 en comestibles entre
{220, 310) 17 0,38 310 y 400 USD?
Estadstica I 31
Frecuencias acumuladas y relativas acumuladas
Se basa en el principio de o ms o y menor que
Es la suma de frecuencias a partir del menor valor de la variable
f
Ejemplo: fr
n
Gatos en FRECUENCIA
FRECUENCIA FRECUENCIA
comestibles FRECUENCIA RELATIVA
ACUMULADA RELATIVA
(USD) ACUMULADA
{40, 130) 6 6 0,13 0,13
0,13 0,22
{130, 220) 10 16 0,22 0,35
{220, 310) 17 33 0,38 0,73 0,35 0,38
{310, 400) 8 41 0,18 0,91 0,73 0,18
{400, 490) 3 44 0,07 0,98 0,91 0,07
{490, 580) 1 45 0,02 1 0,98 0,02
45 1,00
Estadstica I 32
Gatos en FRECUENCIA Cuntos hogares gastan
FRECUENCIA FRECUENCIA semanalmente en comestibles
comestibles FRECUENCIA RELATIVA
ACUMULADA RELATIVA menos de 220 USD?
(USD) ACUMULADA
Estadstica I 34
Representacin grfica de distribuciones de
frecuencias
POLGONO DE FRECUENCIAS: relaciona marcas de
clase y frecuencias
Estadstica I
Grficas de lneas
Estadstica I 36
Grficas de barras horizontales o
verticales
Representa cualquiera de los niveles de
medicin.
37
Grficas Circulares
Estadstica I 38
MEDIDAS DE TENDENCIA
CENTRAL
Las medidas de tendencia central son valores que
representan un conjunto de datos.
-Media
-Mediana
-Moda
DATOS NO AGRUPADOS
MEDIA X
X
Ejemplo: n
Estadstica I 40
MEDIANA
Cuando hay valores extremos (muy grandes
o pequeos) la media puede no ser
representativa
Mediana corresponde al punto medio de
los datos despus de ordenarlos
50% de las observaciones son mayores que
la mediana y 50% son menores
Estadstica I 41
MEDIANA
Si el nmero de datos es par, la mediana es la media
aritmtica de los datos situados en la mitad
n
Pos med
2
Estadstica I 42
MEDIANA
Ejemplo:
Edades de una muestra de 8 Edades de una muestra de 9
estudiantes de Estadstica I estudiantes de Estadstica I
(PAR) (IMPAR)
8 9 1
Pos med 4 Pos med 5
2 2
23 23
23 23
24 Mediana 24
28 28 30 25
29 Mediana
30 2 28
32 30
34 32
41 34
41
Estadstica I 43
MODA
Valor que aparece con mayor frecuencia
Ejemplo:
12 8 17 21 11 17 14 8 17
21 28
Moda
Estadstica I 44
DATOS AGRUPADOS
Media: X
fX m
Mediana:
CLASE MEDIANA: clase cuya frecuencia
acumulada es igual o prxima mayor a la mitad de
los datos Li: lmite inferior de la clase mediana
n: nro. de datos de la muestra
n FAa: frecuencia acumulada de la
FAa
Me Li 2 i
clase que antecede a la clase
mediana
f f: frecuencia clase mediana
i: ancho intervalo de clase mediana
Estadstica I 45
Moda:
CLASE MODAL: es la clase que contiene la
mayor frecuencia
Estadstica I 46
Ejemplo:
En una muestra de 50 ciudades de EEUU con poblaciones que se encuentran
entre 100.000 y 1000.000 habitantes, se encontr la siguiente distribucin de
frecuencias para el costo diario de una habitacin de hospital.
Costo de una
habitacin de hospital FRECUENCIA
(USD)
{100, 200) 1
{200, 300) 9
{300, 400) 20
{400, 500) 15
{500, 600) 5
50
Estadstica I 47
Media
Costo de una
habitacin de hospital FRECUENCIA Xm f*Xm
(USD)
{100, 200) 1 150 150
{200, 300) 9 250 2250
{300, 400) 20 350 7000
{400, 500) 15 450 6750
{500, 600) 5 550 2750
50 18900
X
fX m
18900
378
El costo medio de una habitacin de
hospital en las 50 ciudades de la
n 50 muestra es de 378 USD
Estadstica I 48
Mediana CLASE MEDIANA:
Costo de una Frecuencia acumulada
FRECUENCIA
habitacin de FRECUENCIA es igual o prxima
ACUMULADA
hospital (USD) mayor a la mitad de los
{100, 200) 1 1 datos
{200, 300) 9 10
{300, 400) 20 30
{400, 500) 15 45
{500, 600) 5 50
50
n 50
FAa 10
Me Li 2 i 300 2 100
f 20
El costo mediano de una habitacin de
Me 375 USD hospital en las 50 ciudades de la muestra es
de 375 USD
49
Moda
Costo de una
habitacin de FRECUENCIA
CLASE MODAL
hospital (USD)
Mayor frecuencia
{100, 200) 1
{200, 300) 9 1
{300, 400) 20
{400, 500) 15 2
{500, 600) 5
50
Mo Li
1
i 300 20 9
100
1 2 20 9 20 15
El costo modal de una habitacin doble en las
Me 369 USD 50 ciudades de la muestra es de 369 USD
50
Medidas de dispersin, variacin o
variabilidad.
Medidas de
dispersin,
variacin o Coeficiente
Rango variabilidad. de
variacin
Desviacin Tpica.
Medidas de dispersin: Rango
Rango (amplitud o recorrido):
Est determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la mayor y
menor observacin.
Es una medida de dispersin absoluta, ya
que depende solamente de los datos y
permite conocer la mxima dispersin.
Medidas de dispersin: Rango
x x
n
2
i
s2 i 1
n
n
i
x 2
2
s
2 i 1
x
n
Medidas de dispersin: Desviacin Tpica
s s 2
Medidas de dispersin: Coeficiente de
Variacin
s
CV 100%
x
Ventajas y Desventajas del Rango
Ventajas:
til cuando se quiere conocer la extensin de
las variaciones extremas (valor mximo de la
dispersin).
Fcil de calcular.
Desventajas:
No es una MD con respecto al centro de la distribucin.
Solo emplea dos valores en su clculo.
No se puede calcular en distribuciones de lmite de
clase abierto.
Propiedades, Ventajas y Desventajas de la
Varianza
Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y ser Var(Y) =
b2Var(X)
Propiedades, Ventajas y Desventajas de la
Varianza
Ventajas:
Es til cuando se compara la variabilidad de dos o
ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se estudia
la dispersin de un solo conjunto de datos.
Difcil de interpretar por tener sus unidades elevadas
al cuadrado.
Ventajas y Desventajas de la Desviacin
Tpica (Estndar)
Ventajas:
Esta expresada en las mismas unidades que la
variable en estudio.
Utiliza todas las observaciones en su clculo.
Fcil de interpretar.
Desventajas:
No tiene.
Ventajas y Desventajas del Coeficiente de
Variacin
Ventajas:
Es la nica MD que permite comparar el nivel de
dispersin de dos muestras de variables diferentes.
Emplea toda la informacin disponible en su clculo.
Fcil de calcular.
Desventaja:
No es una MD con respecto al centro de la distribucin
de los datos.
GRACIAS POR SU ATENCION!!!
Estadstica I 64