Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica
Estadistica
c
Juan C. Gutierrez Matus
IPN UPIICSA
2004
Estadstica Descriptiva
Estadstica Descriptiva
Estadstica Descriptiva
Desde la segunda mitad del siglo anterior, el milagro
industrial sucedido en Japon, hizo posible su exito sobre
potencias como los Estados Unidos.
Este exito puede ser atribuido a la capacidad
los japoneses, en aplicar metodos estadsticos, tanto
procesos de manufactura como las demas actividades
las organizaciones, y de esta manera generar productos
alta calidad.
Estadstica Descriptiva
de
en
de
de
Estadstica Descriptiva
Estadstica Descriptiva
Los metodos estadsticos se aplican en infinidad areas en las
que se desea describir y conocer las variaciones presentes
entre individuos, programas, ensambles, productos
terminados, etc.
Por ejemplo, en el control de calidad de un farmaco, se
pueden hacer un muestreo de los lotes producidos, para
saber si seran
o no enviados a los distribuidores.
Estadstica Descriptiva
Estadstica Descriptiva
Estadstica Descriptiva
La aplicaci
on de un metodo estadstico conlleva el recopilar
datos y el hacer inferencias con base a sus variaciones.
Los datos se pueden recopilar en forma de muestras, u
observaciones.
En estadstica, existen m
ultiples herramientas analticas
que permiten comprender y describir el fen
omeno o sistema
que generan dichos datos.
Estadstica Descriptiva
Descripci
on Grafica
Descripci
on Gr
afica
Una de las formas mas usadas para entender y visualizar un
conjunto de observaciones, es a traves de una distribuci
on
de frecuencia
o tambien llamada histograma de frecuencias.
Para su construcci
on, el conjunto de observaciones se
agrupan en intervalos o clases de igual longitud.
El n
umero de intervalos, as como su longitud, son
arbitrarios y dependeran de las conveniencias de quien
construyera el histograma.
Estadstica Descriptiva
Histograma de frecuencias.
Histograma de frecuencias.
Cada observaci
on debe de caer en un solo intervalo, por
lo cual se recomienda que los extremos de los intervalo no
coincidan con ninguna observaci
on.
Para construir el histograma; en un eje se marcan
los extremos de los intervalos, entre cada par de
marcas se dibuja una barra cuya altura correspondera
al n
umero de observaciones presentes dentro del intervalo
correspondiente.
Estadstica Descriptiva
Histograma de frecuencias.
Histograma de frecuencias.
Ejemplo: Considere el siguiente conjunto de datos, que
representa las observaciones del largo en centmetros de
50 conexiones de aluminio.
46.9816
47.1761
47.0014
46.9585
46.8652
47.0056
47.4112
47.1610
47.0899
47.0917
47.3203
47.2183
47.0898
46.8245
46.9581
47.3565
47.0155
47.2536
47.0196
46.8950
47.3975
47.0919
46.9555
47.3436
47.1328
47.4529
47.3584
47.0994
47.2405
47.2262
47.0140
47.3832
46.9281
47.4517
46.9353
47.3557
47.2820
47.0145
47.3599
47.1830
47.2518
47.2429
47.3538
47.2643
47.1433
47.0871
47.2627
47.0055
47.3909
47.2913
Estadstica Descriptiva
Histograma de frecuencias.
Histograma de frecuencias.
Podemos generar siete intervalos, cada uno con una
longitud de 0.09cm.
Intervalo
Frecuencia
46.824 - 46.914
3
46.914 - 47.004
7
47.004 - 47.094
11
47.094 - 47.184
6
47.184 - 47.274
8
47.274 - 47.364
9
47.364 - 47.454
6
Total
50
Estadstica Descriptiva
Histograma de frecuencias.
Estadstica Descriptiva
Estadstica Descriptiva
9944100
73320
5533
87422
tallo : decenas
52
hoja : unidades
0
763
3
81
Estadstica Descriptiva
10
Descripci
on Numerica
Descripci
on Num
erica
Los histogramas proporcionan informaci
on importante
sobre el conjunto de observaciones, pero no son suficientes
para efectuar alguna inferencia.
Son necesarias mediciones rigurosas que nos permitan
analizar la informaci
on de la muestra.
Dentro de todas las posibles mediciones, existen dos
grupos importantes, las medidas de tendencia central y las
medidas de dispersi
on.
11
Estadstica Descriptiva
Media de la Muestra.
Media de la Muestra.
Es la medida de tendencia central mas com
un y u
til. La
es simplemente el promedio del
media de la muestra x
valor de las observaciones x1, x2, . . . , xn que pertenecen
a la muestra.
n
1X
x
=
xi
n i=1
12
Estadstica Descriptiva
Mediana de la Muestra
Mediana de la Muestra
Es otra medida, cuyo prop
osito es el reflejar la tendencia
central de la muestra sin que intervengan los valores
extremos. La palabra mediana es sin
onimo de medio, as
la mediana de la muestra es el observaci
on de en medio. Si
x1, x2, . . . , xn representan las observaciones acomodadas
en orden creciente , entonces la mediana de la muestra es
X(n+1)/2
si n es impar.
x
=
(Xn/2 + X(n/2)+1)/2 si n es par.
Estadstica Descriptiva
13
14
Estadstica Descriptiva
s =
1
n1
n
X
(xi x
)2
i=1
El u
nico problema con la varianza, es que arroja unidades
cuadradas.
15
Estadstica Descriptiva
16
Estadstica Descriptiva
Sesgo y Curtosis
Sesgo y Curtosis
El sesgo y la curtosis son otros parametros importates que
miden el grado de simetra y de curvatura de un conjunto
de datos.
n
1X
(x x
)3
sesgo =
n i=1
curtosis =
n
1X
(x x
)4
i=1
17
Estadstica Descriptiva
Diagrama de Caja
Diagrama de Caja
Este resumen grafico describe varias de las ma destacadas
caractersticas de un conjunto de datos, tales como:
centro
dispersi
on
naturaleza y magnitud los sesgos
identificacion de puntos inusuales
Para evitar el efecto de puntos inusuales este diagrama
esta basado en una medida de dispersi
on llamada rango
intercuartlico.
c 2004 Juan C. Gutierrez Matus
IPN UPIICSA
Estadstica Descriptiva
18
Diagrama de Caja
Diagrama de Caja
Al ordenar n observaciones en forma ascendente:
Cuarto Inferior: mediana de las mnimas l observaciones;
donde l = n/2 si n es par y
l = (n + 1)/2 si n es impar.
Cuarto Superior: mediana de las maximas h observaciones;
donde h = n/2 si n es par y
h = (n + 1)/2 si n es impar.
Cuarta Dispersi
on ds: cuarto superior menos cuarto
inferior.
c 2004 Juan C. Gutierrez Matus
IPN UPIICSA
Estadstica Descriptiva
19
Dibujar eje.
Marcar una caja del cuarto superior al inferior.
Dividir la caja en la mediana.
Marcar lineas desde los extremos de la caja, hasta la
observaci
on que este a un maximo de 1.5ds de la caja.
5. Dibujar un circulo abierto para identificar cada
observaci
on que caiga entre 1.5ds y 3ds, estos seran
puntos insulares suaves.
6. Dibujar un circulo relleno para identificar cada
observaci
on que caiga a mas de 3ds, puntos insulares
extremos.
c 2004 Juan C. Gutierrez Matus
IPN UPIICSA
20
Estadstica Descriptiva
21
Estadstica Descriptiva
22
Estadstica Descriptiva
Uso de Frecuencias
Uso de Frecuencias
Suponga que los datos toman p valores diferentes
x1, . . . , xp con frecuencias f1, . . . , fp respectivamente.
Como calcular x y s2 rapidamente?
x =
s2 =
p
1X
fixi
i=1
n1
p
X
i=1
fix2i nx2
23
Estadstica Descriptiva
Datos Agrupados
Datos Agrupados
Si las observaciones individuales no pueden ser
determinadas en la distribuci
on de frecuencias, entonces
se tendra que agrupar las observaciones en c intervalos
intervalo xi mi fi
100 150 125 4
150 200 175 6
..
..
..
c
1X
fi mi
s2
i=1
1
n1
c
X
i=1
fim2i nx2
!
24