Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadsticadescriptivaeinferencial 130129201728 Phpapp02
Estadsticadescriptivaeinferencial 130129201728 Phpapp02
DESCRIPTIVA
E INFERENCIAL
Ing. Pedro Lpez Eiro
soportedelconocimiento.blogspot.mx
origensobrehumano.blogspot.mx
ciudadanosdelreinodeloscielos.blogspot.mx
Qu es la estadstica ?
La estadstica se ocupa de los
mtodos cientficos para : recolectar
, organizar , resumir , presentar y
analizar datos ; as como de sacar
conclusiones
vlidas
y
tomar
decisiones con base a este anlisis
Murray R. Spiegel & Larry J. Stephens
Uso de la estadstica
No existe actividad humana donde no se involucre :
Personalmente : comparacin de alternativas ,
evaluacin de servicios , ingresos vs. Pagos, etc.
Cotidianamente : Censos , indices de precios ,
ajustes de tarifas , frecuencia de enfermedades,
preferencia de candidatos polticos.
Empresarialmente : control de proceso y calidad ,
evaluacin de productividad, estudios de costos,
nivel de satisfaccin de clientes , proyectos de
inversin,etc.
Importancia de la estadstica
De qu sirve tener datos si no son representativos?
Qu pasa si tomo decisiones con informacin incorrecta?
Es bueno suponer informacin para su anlisis?
Hay una forma objetiva de mejorar una situacin o proceso?
Hay una forma clara de reducir riesgos y tener certidumbre ?
Puedo controlar variables sin tener su medicin?
Si podemos observar y recolectar informacin precisa y
relevante , para organizarla de la mejor forma y analizarla de
tal forma que nos permita tener un panorama completo de la
situacin u objeto de estudio estamos entonces haciendo
Estadstica .
4
Ventajas de la estadstica
El empleo correcto de la estadstica nos permite :
Eliminacin de incertidumbre
Integracin de comunicacin
Optimizacin de uso de tiempo
Mejora de la eleccin
Eficacia
de
manejo
de
informacin
Estmulo enfocado a resultados
Documentacin de procesos y
decisiones
Visualizacin y control de
tendencias
Toma de decisiones racional y
objetiva
5
Definiciones bsicas
Poblacin: Conjunto de elementos que se quiere estudiar.
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.
Definiciones bsicas
Individuo: Cada uno de los elementos que componen una
poblacin y/o muestra .
Es sinnimo de unidad bsica o ltima del muestreo
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de
los datos obtenidos de las observaciones:
Variables
Cuantitativas
(Aquellas
medibles
numricamente)
Nominales
Escalas
Etapas
Colores
Lugares
Profesiones
Discretas
(Unidades
completas )
Continuas
(Cualquier
valor en un
rango)
Nmero de hijos
Pginas de un libro
Edad
Peso
Talla
Tiempo
9
Presentaciones estadsticas y
representaciones grficas
Son los mtodos empleados para organizar y presentar las
observaciones , con el objeto de mostrar la mxima
informacin con una rpida visualizacin , manejo de
esttica y sencillz operativa . Pueden ser de dos tipos:
Tablas:
12
Volumen
Ventas
Norte
Volmen
Ventas
Centro
Volmen
Ventas Sur
Volmen
Ventas
Forneo
Total
%
Mensual
Enero
$8,691.89
$19,156.00
$57,793.83
$28,688.78
$114,330.50
18.7%
Febrero
$1,617.88
$1,076.03
$19,437.13
$19,321.98
$41,453.02
6.8%
Marzo
$1,223.00
$6,677.00
$33,278.32
$20,249.31
$61,427.63
10.1%
Abril
$9,645.62
$0.00
$21,343.71
$14,846.76
$45,836.09
7.5%
Mayo
$1,051.57
$4,354.00
$19,174.22
$16,886.01
$41,465.80
6.8%
Junio
$4,387.45
$0.00
$20,529.59
$22,709.82
$47,626.86
7.8%
Julio
$3,362.64
$8,899.00
$26,405.06
$21,065.89
$59,732.59
9.8%
Agosto
$0.00
$0.00
$0.00
$0.00
$0.00
0.0%
Septiembre
$1,681.32
$1,036.16
$26,598.83
$30,541.29
$59,857.60
9.8%
Octubre
$7,132.00
$0.00
$25,738.73
$21,813.00
$54,683.73
9.0%
Noviembre
$1,051.57
$2,345.00
$18,477.38
$22,846.24
$44,720.19
7.3%
Diciembre
$2,334.00
$6,487.00
$14,802.09
$15,639.72
$39,262.81
6.4%
$42,178.94
$50,030.19
$283,578.89
$234,608.80
$610,396.82
6.9%
8.2%
46.5%
38.4%
Total
% por Zona
13
Variables cualitativas:
Representacin grfica
Sabores de refrescos preferidos por 50 personas
Clases
Refrescos
Frecuencias
absolutas: fi
Frecuencias
relativas: hi
Naranja
Limn
Pia
Manzana
Sumas
18
12
10
10
50
0,36
0,24
0,20
0,20
1
Sabores de refescos
20
18
Manzana
20%
Frecuencias
16
14
Naranja
36%
12
10
8
Limn
Pia
Pia
20%
Naranja
Manzana
4
Limn
24%
2
0
Naranja
Limn
Pia
Manzana
14
Variables cuantitativas:
Representacin grfica
Ventas Mensuales por Zona
$120,000.00
$80,000
$70,000
$60,000
$50,000
$40,000
$30,000
$20,000
$10,000
$-
$100,000.00
$80,000.00
Venta $60,000.00
$40,000.00
$20,000.00
Ju
lio
Ag
os
Se
to
pt
ie
m
br
e
O
ct
ub
r
N
e
ov
ie
m
br
e
D
ic
ie
m
br
e
ay
o
Ju
ni
o
En
er
o
Fe
br
er
o
M
ar
zo
Ab
ril
$0.00
1,
00
0
a
2,
00
1,
99
0
9
a
3,
00
2,
99
0
9
a
4,
3,
00
99
0
9
a
5,
00
4,
99
0
9
a
6,
00
5,
99
0
9
a
7,
00
6,
99
0
9
a
8,
7,
00
99
0
9
a
9,
00
8,
99
0
9
a
10
,0
9,
00
99
9
a
10
,9
99
Mes
Volmen de Ventas
Norte
Centro
Sur
Forneo
Ab
ril
M
ay
o
Ju
ni
o
Ju
lio
Ag
Se os
to
pt
ie
m
b
O re
ct
N ubr
ov
e
ie
m
br
D
e
ic
ie
m
br
e
$60,000
$50,000
$40,000
$30,000
$20,000
$10,000
$0
En
er
Fe o
br
er
o
M
ar
zo
Venta
Venta Total
Mes
Josefina Romero Garca
15
x1 , x2 ,....., xn
17
Media Aritmtica
La media aritmtica es simplemente el
promedio (tambin llamada media muestral
ya que generalmente se calcula en relacin a
una muestra).
Se calcula de la siguiente forma: si las
observaciones de una muestra de tamao n
son x1, x2,,xn entonces:
n
x 1 x 2 ... x n
X
i 1
n
18
Caractersticas de la media
Ventajas :
Fcil de calcular e interpretar.
En su clculo intervienen todos los datos disponibles.
Su valor es nico para una serie de datos.
Es el punto de equilibrio de la informacin.
Desventajas :
No es representativa con pocos datos
Se ve afectada por el grado de dispersin
Es poco til con datos muy heterogneos
No todos los valores contribuyen de igual forma ,los
mayores tienen ms peso
19
Mediana
La mediana se suele definir como el valor
ms intermedio o central una vez que los
datos han sido ordenados en forma creciente.
Se suele denotar por Me. La forma ms
general de calcular la mediana es la siguiente:
x n 1 2
Me x
n 2 x ( n 2) 1
si n es impar
si n es par
20
Caractersticas de la mediana
Ventajas :
Valor nico que no se ve afectado por los extremos por ser
equidistante de ellos.
Se localiza a la mitad de los datos , dejando el 50 % por arriba y
el 50 % por debajo de su valor.
Es menos sensible a las variaciones de los datos.
No se ve afectada por la dispersin de los datos.
Desventajas :
No se emplea para hacer clculos
Utiliza muy poca informacin de los datos
Cuanto ms grande es la serie de datos , ms complicado se
vuelve su determinacin.
21
Moda
La moda de un conjunto de observaciones es el
valor que ms se repite, aquel cuya frecuencia
absoluta es mxima.
Puede ser nica, que haya ms de una, o que
no exista.
Cuando hay ms de una , la distribucin de los
datos se denomina acorde : bimodal , trimodal,
polimodal, etc.
22
Medidas de Dispersin
Las medidas descriptivas ms comunes de
dispersin son: el rango, la varianza y la
desviacin estndar .
Existen otras medidas de dispersin que en
ocasiones pueden resultar de inters tales
como : rango semi-intercuartilar , rango
percentilar y coeficiente de variacin.
25
Rango
El rango de la muestra es la medida de
variabilidad ms sencilla entre todas las
mencionadas
Como valor se define como la diferencia entre la
observacin ms grande y la ms pequea :
r xm ax xm in
Indica el ancho, recorrido o amplitud de valores .
Tiene como sus lmites el valor mayor y el menor
en la distribucin de datos.
26
27
Varianza
Es una medida significativa de la dispersin de
las observaciones alrededor de la media.
Se define como el promedio de las desviaciones
respecto a su media , elevadas al cuadrado :
n
s
2
(x x)
i 1
28
Caractersticas de la Varianza
Ventajas :
Fcil de calcular mediante su frmula.
Indica el grado y forma de dispersin de los
datos con respecto a la media.
Depende de todas las mediciones.
Desventajas :
Es imprctica por ser un trmino cuadrtico de
poco sentido en la realidad.
Es un nmero muy grande de referencia
matemtica , pero sin valor concreto y de difcil
manejo comparativo.
29
Desviacin estndar
Es una medida significativa de la dispersin de
las observaciones alrededor de la media.
Se define como la raz cuadrada del promedio de
las desviaciones respecto a su media , elevadas al
cuadrado ; es decir la raz cuadrada de la
varianza :
n
(x x)
i 1
n
30
Medidas de Distribucin
Las medidas de distribucin nos permiten
identificar la forma en que se separan o
aglomeran los valores de acuerdo a su
representacin grfica. Son : la simetra y la
curtosis.
Estas medidas describen la manera como los
datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la
informacin.
Su utilidad radica en la posibilidad de
identificar las caractersticas de la
distribucin sin necesidad de generar el
grfico.
33
Simetra y Asimetra
Si los valores de la serie de datos presentan
la misma tendencia (forma) a izquierda y
derecha de un valor central como la media
aritmtica, se dice que es simtrica de lo
contrario ser asimtrica.
Para medir el nivel de asimetra se utiliza el
llamado Coeficiente de Asimetra de Fisher,
que viene definido:
n
g1
(1 / n)( ( xi x )3
i 1
3
34
Simetra y Asimetra
Los resultados pueden ser los siguientes:
g1 < 0 (distribucin asimtrica
negativa; existe mayor
concentracin de valores a la
izquierda de la media que a su
derecha)
g1 = 0 (distribucin simtrica;
existe la misma concentracin de
valores a la derecha y a la
izquierda de la media)
g1 > 0 (distribucin asimtrica
positiva; existe mayor
concentracin de valores a la
derecha de la media que a su
izquierda)
35
Curtosis
El Coeficiente de Curtosis analiza el grado de
concentracin que presentan los valores
alrededor de la zona central de la distribucin.
Se calcula con la siguiente frmula :
n
g2
(1 / n)( ( xi x ) 4
i 1
Curtosis
Existen 3 tipos de distribuciones segn su grado
de curtosis se observar de la siguiente forma :
37
Tipos de Curtosis
Distribucin mesocrtica: presenta un grado de
concentracin medio alrededor de los valores
centrales de la variable (el mismo que presenta
una distribucin normal).
Distribucin leptocrtica: presenta un elevado
grado de concentracin alrededor de los valores
centrales de la variable.
38
CONSUMO($)
PROMEDIO
POR HUESPED
ENERO
30
FEBRERO
45
MARZO
50
ABRIL
58
MAYO
65
JUNIO
110
JULIO
100
AGOSTO
120
SEPTIEMBRE
50
OCTUBRE
60
NOVIEMBRE
45
DICIEMBRE
35
TOTAL
768
39
CONSUMO PROMEDIO
POR HUESPED
MES
30
ENERO
35
DICIEMBRE
45
FEBRERO
45
NOVIEMBRE
50
MARZO
50
SEPTIEMBRE
58
ABRIL
60
OCTUBRE
65
MAYO
100
JULIO
110
JUNIO
120
AGOSTO
768
TOTAL
40
41
80
60
Media
Mediana
40
Moda
20
0
1
10
11
12
MES
CONSUMO PROMEDIO POR HUESPED
Polinmica (CONSUMO PROMEDIO POR HUESPED)
42
Estndar
100
Desviacin
MONTO
CONSUMIDO
Rango
120
BIBLIOGRAFA
1) Spiegel, Murray R. y Stephens, Larry J. (2001).
Estadstica serie Schaum. Mxico: McGraw-Hill, pp. 1
124
2) Domnguez, Jorge. (2009). Estadstica y probabilidad. El
Mundo de los datos y el azar. Mxico: Oxford University
Press. Unidad 3: Resumen y organizacin de datos, pp. 76
a 129.
43