Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Bsicos y
Estadstica Descriptiva
Tecnologas de la Informacin y
Comunicacin
Concepto de Estadstica
Tema 1. Introduccin
Se refiere a un conjunto de
mtodos para manejar la
obtencin, presentacin y
anlisis de observaciones
numricas.
Concepto de Estadstica
Tema 1. Introduccin
DESCRIBIR
Tema 1. Introduccin
INFERIR
Tema 1. Introduccin
Tema 1. Introduccin
Gobierno
Negocios
Ciencias Sociales
Ingeniera
Ciencias Fsica y Naturales
Control de Calidad
Procesos de Manufactura
Muchos otros campos de la actividad intelectual.
Tema 1. Introduccin
Tema 1. Introduccin
Muestra:
es
un conjunto de mediciones u
observaciones tomadas a partir de una
poblacin.
es un subconjunto de la poblacin.
Tema 1. Introduccin
Tema 1. Introduccin
Variables:
son
Datos:
son
Tema 1. Introduccin
Tipos de datos
Sexo: f/m.
Hbito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrn,
Religin: catlica, evanglica,
Estado civil: soltero, casado, divorciado,
Tema 1. Introduccin
Tipos de datos
Tema 1. Introduccin
Peso
Edad
Estatura
Presin
Humedad
Intensidad de un sismo
Cantidad de hermanos
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Nominal.
Variables Cualitativas
Ordinal.
de Intervalos.
Variables
de Razn o Proporcin. Cuantitativas
Absoluta.
Tema 1. Introduccin
Escala
Escala
Escala
Escala
Escala
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Tema 1. Introduccin
Escalas de medida
Tema 1. Introduccin
Tema 1. Introduccin
Univariantes o unidimensionales:
slo recogen informacin sobre una
caracterstica (Ej: edad de los
alumnos de una clase).
Bivariantes o bidimensionales:
recogen informacin sobre dos
caractersticas de la poblacin. (Ej:
edad y estatura de los alumnos de
una clase).
Tema 1. Introduccin
Multivariantes o pluridimensionales:
recogen informacin sobre tres
ms caractersticas. (Ej: edad,
estatura y peso de los alumnos de
una clase).
Tema 1. Introduccin
Clase
Pto.
Medio
fi
Fi
fri
FRi
La Distribucin de Frecuencias:
Se
Determinar:
Punto
Frecuencia
Frecuencia
fri = fi/n
Frecuencia
clase (FRi).
relativa acumulada de la
medio = (Li+Ls)/2.
Frecuencia absoluta de la clase (fi).
Ejemplos de Distribucin de
Frecuencias
A continuacin se presentan
las calificaciones de 60
estudiantes que
presentaron la PINA en el
ao 2009:
Ejemplos de Distribucin de
Frecuencias
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
Histogramas.
Polgono de frecuencias.
Ojiva o Polgono de frecuencias acumuladas.
Histograma
Ojiva
Barras
Barras
Curvas
Ejemplos de construccin
de grficos
Media:
Media Aritmtica
i 1
m f
i i
i 1
Mediana
Clculo de la mediana
Clculo de la mediana
n 1
F ( xm 1 )
Md Lm 2
Cm
f ( xm )
Donde:
Moda
Clculo de la moda
1
Mo Lim
Cm
1 2
Donde:
Propiedades:
La suma de las diferencias entre las
media muestral y el valor de cada
observacin es cero.
La media de una constante es la
constante.
Si todas las observaciones xi se
multiplican por una constante a, la X
tambin se debe multiplicar por ese
mismo valor constante.
Ventajas:
Emplea en su clculo toda la
informacin disponible.
Se expresa en las mismas unidades
que la variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos
los valores observados.
Es una valor nico.
Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande
puede ser tedioso su clculo manual.
No se puede calcular para datos
cualitativos.
No se puede calcular para datos que
tengan clases de extremo abierto, tanto
superior como inferior.
Ventajas:
Fcil de calcular si el nmero de
observaciones no es muy grande.
No se ve influenciada por valores
extremos, ya que solo influyen los
valores centrales.
Fcil de entender.
Desventajas:
No utiliza en su clculo toda la
informacin disponible.
No pondera cada valor por el
nmero de veces que se ha
repetido.
Hay que ordenar los datos antes de
determinarla.
Ventajas:
No requiere clculos.
Puede usarse para datos tanto
cuantitativos como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores
extremos.
Se puede calcular en clases de
extremo abierto.
Desventajas:
Para conjuntos pequeos de datos su
valor no tiene casi utilidad, si es que
de hecho existe. Solo tiene significado
en el caso de una gran cantidad de
datos.
No utiliza toda la informacin
disponible.
No siempre existe, si los datos no se
repiten.
Rango.
Varianza.
Desviacin Tpica.
Coeficiente de variacin.
x x
n
Para datos NO
agrupados:
s2
i 1
n
n
s
2
2
x
i
i 1
Si la varianza de un conjunto de
observaciones es grande se dice que los
datos tiene una mayor variabilidad que
un conjunto de datos que tenga un
varianza menor.
s2
x
fi
i
i 1
n
k
s2
2
m
i fi
i 1
s s
s
CV 100%
x
Ventajas:
til cuando se quiere conocer la
extensin de las variaciones
extremas (valor mximo de la
dispersin).
Fcil de calcular.
Desventajas:
No es una MD con respecto al
centro de la distribucin.
Solo emplea dos valores en su
clculo.
No se puede calcular en
distribuciones de lmite de clase
abierto.
Propiedades:
1. Siempre es mayor o igual a cero y
menor que infinito.
2. La varianza de una constante es
cero.
3. Si a una variable X la sometemos a
Y=a+bX, la varianza de Y ser
Var(Y) = b2Var(X)
Ventajas:
Es til cuando se compara la variabilidad
de dos o ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando
se estudia la dispersin de un solo
conjunto de datos.
Difcil de interpretar por tener sus
unidades elevadas al cuadrado.
Ventajas y Desventajas de la
Desviacin Tpica
Ventajas:
Esta expresada en las mismas
unidades que la variable en estudio.
Utiliza todas las observaciones en
su clculo.
Fcil de interpretar.
Desventajas:
No tiene.
Ventajas:
Es la nica MD que permite
comparar el nivel de dispersin de
dos muestras de variables
diferentes.
Emplea toda la informacin
disponible en su clculo.
Fcil de calcular.
Desventaja:
No es una MD con respecto al
centro de la distribucin de los
datos.
Medidas de Forma
Medidas
de forma
-Asimetra
-Kurtosis
Coeficiente de Pearson
Coeficiente de Fisher
o apuntamiento
3 X Md
ASP
s
Interpretacin:
= 0, X=Md Simtrica
ASP
x X
n
ASF
i 1
ns
M
k
ASF
i 1
Datos NO agrupados
x fi
ns 3
Datos Agrupados
Interpretacin:
= 0, Simtrica
> 0, Asimtrica Positiva
< 0, Asimtrica Negativa
ASF
CK
i 1
M
i 1
X fi
ns
Datos No Agrupados
Datos Agrupados
Interpretacin:
=0 Mesocrtica
CK
>0 Leptocrtica
<0 Platicrtica
ns
k
CK
Referencias:
Wikipedia(
http://es.wikipedia.org/wiki/Wikipe
dia:Portada
)
Walpole y Myers. Probabilidad y
Estadstica. Mc Graw-Hill.
Triola, Mario F. Estadstica. Pearson.