Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadsticadescriptivaeinferencial 130129201728 Phpapp02
Estadsticadescriptivaeinferencial 130129201728 Phpapp02
DESCRIPTIVA
E INFERENCIAL
Ing. Pedro Lpez Eiro
soportedelconocimiento.blogspot.mx
origensobrehumano.blogspot.mx 1
ciudadanosdelreinodeloscielos.blogspot.mx
Qu es la estadstica ?
La estadstica se ocupa de los
mtodos cientficos para : recolectar
, organizar , resumir , presentar y
analizar datos ; as como de sacar
conclusiones vlidas y tomar
decisiones con base a este anlisis
Murray R. Spiegel & Larry J. Stephens
2
Uso de la estadstica
No existe actividad humana donde no se involucre :
3
Importancia de la estadstica
De qu sirve tener datos si no son representativos?
Qu pasa si tomo decisiones con informacin incorrecta?
Es bueno suponer informacin para su anlisis?
Hay una forma objetiva de mejorar una situacin o proceso?
Hay una forma clara de reducir riesgos y tener certidumbre ?
Puedo controlar variables sin tener su medicin?
4
Ventajas de la estadstica
El empleo correcto de la estadstica nos permite :
Visualizacin de los datos Eliminacin de incertidumbre
Medicin de las variables Integracin de comunicacin
Apoyo en las decisiones Optimizacin de uso de tiempo
Reduccin de riesgos Mejora de la eleccin
Organizacin de informacin Eficacia de manejo de
informacin
Certeza
Estmulo enfocado a resultados
Reconocimiento
Documentacin de procesos y
de alternativas
decisiones
Aceptacin de soluciones
Visualizacin y control de
tendencias
Toma de decisiones racional y
objetiva 5
Definiciones bsicas
Poblacin: Conjunto de elementos que se quiere estudiar.
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.
7
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de
los datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de parmetros.
Cualitativas
(Cualidades ,
Colores
categoras o Lugares
atributos) Nominales
Profesiones
Variables Discretas Nmero de hijos
(Unidades Pginas de un libro
Cuantitati vas completas )
(Aquellas
medibles Edad
numricamente) Continuas Peso
(Cualquier Talla
valor en un Tiempo
rango) 9
Tipos de Variables Cualitativas
Dicotmicas: Slo hay dos categora, que son
excluyentes una de la otra
Ejemplo: enfermo-sano, muerto-vivo, mujer-hombre
Naranja 18 0,36
Limn 12 0,24
Pia 10 0,20
Manzana 10 0,20
Sumas 50 1
Sabores de refescos
20
18
Manzana
16
20%
14 Naranja Naranja
Frecuencias
12 36%
Limn
10
Pia
8 Pia
Manzana
6 20%
4
Limn
2
24%
0
Naranja Limn Pia Manzana
14
Variables cuantitativas:
Representacin grfica
Frecuencia por Volmen de Ventas
Ventas Mensuales por Zona
$120,000.00
$80,000
$70,000 $100,000.00
Venta Total
$60,000
$80,000.00
$50,000
$40,000 Venta $60,000.00
$30,000
$20,000 $40,000.00
$10,000 $20,000.00
$-
$0.00
9
99
9
9
99
to
e
ril
zo
e
o
lio
e
o
99
99
99
99
99
99
99
99
br
br
ay
br
er
er
ni
r
,9
Ab
os
ub
Ju
ar
4,
1,
2,
3,
5,
6,
7,
8,
9,
Ju
m
m
En
br
M
10
Ag
M
ct
ie
ie
ie
Fe
O
a
ov
ic
pt
a
D
a
Se
N
0
00
0
0
00
00
00
00
00
00
00
00
00
Mes
,0
4,
1,
2,
3,
5,
6,
7,
8,
9,
10
$60,000
$50,000
$40,000
Venta
$30,000
$20,000
$10,000
$0
o
e
zo
o
to
e
Fe o
ril
O re
lio
o
e
ay
br
er
br
er
ni
N ubr
Se os
Ab
b
ar
Ju
Ju
m
En
br
m
m
M
Ag
M
ct
ie
ie
ie
ov
ic
pt
Mes
16
Medidas de Tendencia Central
17
Media Aritmtica
x 1 x 2 ... x n
x
i 1
i
X
n n
18
Caractersticas de la media
Ventajas :
Fcil de calcular e interpretar.
En su clculo intervienen todos los datos disponibles.
Su valor es nico para una serie de datos.
Es el punto de equilibrio de la informacin.
Desventajas :
No es representativa con pocos datos
Se ve afectada por el grado de dispersin
Es poco til con datos muy heterogneos
No todos los valores contribuyen de igual forma ,los
mayores tienen ms peso
19
Mediana
x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
20
Caractersticas de la mediana
Ventajas :
Valor nico que no se ve afectado por los extremos por ser
equidistante de ellos.
Se localiza a la mitad de los datos , dejando el 50 % por arriba y
el 50 % por debajo de su valor.
Es menos sensible a las variaciones de los datos.
No se ve afectada por la dispersin de los datos.
Desventajas :
No se emplea para hacer clculos
Utiliza muy poca informacin de los datos
Cuanto ms grande es la serie de datos , ms complicado se
vuelve su determinacin.
21
Moda
La moda de un conjunto de observaciones es el
valor que ms se repite, aquel cuya frecuencia
absoluta es mxima.
Puede ser nica, que haya ms de una, o que
no exista.
Cuando hay ms de una , la distribucin de los
datos se denomina acorde : bimodal , trimodal,
polimodal, etc.
22
Uso de : Media , Mediana y Moda
Nos brindan una idea muy clara de la posicin de los
parmetros dentro de una distribucin de datos.
25
Rango
El rango de la muestra es la medida de
variabilidad ms sencilla entre todas las
mencionadas
Como valor se define como la diferencia entre la
observacin ms grande y la ms pequea :
r xmax xmin
Indica el ancho, recorrido o amplitud de valores .
Tiene como sus lmites el valor mayor y el menor
en la distribucin de datos.
26
Caractersticas del rango
Ventajas :
Fcil de determinar e interpretar.
Nos indica los lmites de nuestra informacin.
Nos permite visualizar la amplitud de dispersin
de los valores de forma sencilla.
Desventajas :
Ignora toda la informacin de la muestra
No mide el grado de dispersin , solo su ancho
No nos da una idea detallada de la informacin
de las observaciones.
27
Varianza
(x x)
i
2
s
2 i 1
n
28
Caractersticas de la Varianza
Ventajas :
Fcil de calcular mediante su frmula.
Indica el grado y forma de dispersin de los
datos con respecto a la media.
Depende de todas las mediciones.
Desventajas :
Es imprctica por ser un trmino cuadrtico de
poco sentido en la realidad.
Es un nmero muy grande de referencia
matemtica , pero sin valor concreto y de difcil
manejo comparativo.
29
Desviacin estndar
(x x)
i
2
i 1
n
30
Caractersticas de la Desviacin Estndar
Ventajas :
Fcil de calcular mediante su frmula y particularmente en
hojas de clculo como Excel que lo hacen de forma
automtica.
Indica el grado y forma de dispersin de los datos con
respecto a la media.
Depende de todas las mediciones.
Muy prctica por usar los mismos valores de las unidades
que se analizan.
Un valor grande indica que los datos se alejan mucho de la
media y un valor pequeo indica que se acercan a la media.
Desventajas :
Si hacemos el clculo manual , es complicado.
31
Utilidad de las medidas de dispersin
Las medidas centrales solo nos indican el valor medio
alrededor del cual se agrupan nuestros datos , pero
las de dispersin nos detallan la variacin de las
observaciones en cuanto a forma y extensin.
32
Medidas de Distribucin
g1 i 1
s3
34
Simetra y Asimetra
Los resultados pueden ser los siguientes:
g1 = 0 (distribucin simtrica;
existe la misma concentracin de
valores a la derecha y a la
izquierda de la media)
35
Curtosis
El Coeficiente de Curtosis analiza el grado de
concentracin que presentan los valores
alrededor de la zona central de la distribucin.
36
Curtosis
37
Tipos de Curtosis
38
Ejemplo prctico de Alfredo Casas
Se tiene informacin del consumo promedio de agua de
los huspedes de un hotel segn la temporada :
CONSUMO($)
MES PROMEDIO
POR HUESPED
ENERO 30
FEBRERO 45
MARZO 50
ABRIL 58
MAYO 65
JUNIO 110
JULIO 100
AGOSTO 120
SEPTIEMBRE 50
OCTUBRE 60
NOVIEMBRE 45
DICIEMBRE 35
TOTAL 768
39
Ejemplo prctico de Alfredo Casas
Ordenando los datos y con base
a las frmulas y funciones de la CONSUMO PROMEDIO
hoja de Excel obtenemos los POR HUESPED
MES
Media : 64 45 NOVIEMBRE
Mediana : 54 50 MARZO
Moda : 45
50 SEPTIEMBRE
Rango : 30 120
58 ABRIL
60 OCTUBRE
Varianza : 809.33 65 MAYO
Desviacin Estndar : 28.45 100 JULIO
Simetra : 0.98 110 JUNIO
Curtosis : -0.32 120 AGOSTO
768 TOTAL
40
Ejemplo prctico de Alfredo Casas
Interpretacin :
Cada huesped consume $ 64 en promedio por mes
Los datos NO son simtricos , se desplazan ligeramente
hacia la derecha con un sesgo positivo , solo con ver que la
mediana es inferior a la media.
Aunque la frmula solo indica un dato de moda, tenemos dos
nmeros que se repiten dos veces : 45 y 50 , por lo que la
distribucin es de tipo bimodal.
El rango de consumo es de 90 unidades , entre el lmite
inferior de 30 y el superior de 120
La desviacin estndar no es grande comparativamente ,
lo que indica que los datos no se alejan tanto de la media.
El valor de simetra g1 > 0 , nos indica una distribucin
asimtrica positiva porque existe mayor concentracin de
valores a la derecha de la media que a su izquierda.
En cuanto a la curtosis con valor de de -0.32 (g2 < 0 ) nos
confirma una distribucin platicrtica porque presenta un
reducido grado de concentracin alrededor de los
valores centrales de la variable.
41
Grfico del ejemplo de Alfredo
DISPERSION DE CONSUMO
140
120
100
CONSUMIDO
Desviacin
MONTO
Estndar
80
Rango
Media
60 Mediana
40 Moda
20
0
1 2 3 4 5 6 7 8 9 10 11 12
MES
42
BIBLIOGRAFA
43