Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo 1..
Trabajo 1..
ESTADSTICA
ESTADSTICA DESCRIPTIVA
INFERENCIA DESCRIPTIVA
La estadstica descriptiva nos
puede ayudar mediante resmenes
numricos, que son medidas:
Medidas de dispersin
TENDENCIA CENTRAL
x 1 x 2 ... x n i 1
x i
X
n n
Caractersticas
MEDIANA
La mediana se suele definir como el valor
ms intermedio una vez que los datos han
sido ordenados en forma creciente. Se suele
denotar por Me. La forma ms general de
calcular la mediana es la siguiente:
x n 1 2 si n es impar
Me x x
( n 2) 1
n 2
si n es par
2
Otras caractersticas a tomar en cuenta
MODA
Es una medida de tendencia central que se
puede utilizar sea cual sea el tipo de variable a
estudiar. La moda de un conjunto de
observaciones es el valor que ms se repite,
aquel cuya frecuencia absoluta es mxima.
Puede ser nica, que haya ms de una, o que
no exista.
La localizacin o tendencia central de un conjunto de
datos no necesariamente proporciona informacin
SUFICIENTE para describirlos adecuadamente.
Debido a que no todos los valores son semejantes, la
variacin entre ellos se considera importante.
Las medidas descriptivas ms comunes de
dispersin son:
1. El rango
2. La varianza
3. La desviacin estndar
4. Rango intercuartlico.
Rango
El rango de la muestra es la medida de variabilidad
ms sencilla entre todas las mencionadas, y se
define como la diferencia entre la observacin ms
grande y la ms pequea.
r xmax xmin
Aunque es una medida muy fcil de calcular,
ignora toda la informacin de la muestra entre las
observaciones ms grande y ms pequea.
i
( x x ) 2
s
2 i 1
n
Esta medida de variabilidad se denomina varianza.
Como S2 no tiene las mismas unidades que los datos,
se define la DESVIACIN ESTNDAR como la raz
cuadrada (positiva) de la varianza a fin de tener una
medida en las mismas unidades de los datos
8+8+8+8+8+8+8+8+8 72
= =8
9 9
10 cms
6 cms
8 cms.
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 72
= =8
9 9
6 cms
8 cms.
0+0+0+0+2+0+02+0 =0
Este valor nos parece indicar que no ha habido variabilidad! Y sin embargo, ante
nuestros ojos, sabemos que hay variacin.
10 cms
6 cms
8 cms.
Una forma de eliminar los signos menos de aquellas diferencias que sean negativas,
esto es de aquellos mediciones que estn bajo el promedio, es elevar al cuadrado
todas las diferencias, y luego sumar...
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo dividimos por el
nmero de rectngulos que es 9
02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8
= 0,89
9 9
10 cms
6 cms
8 cms.
0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar
10 cms
6 cms
8 cms.
Que la desviacin estndar haya sido de 0,943 significa que en promedio la altura de los
rectngulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centmetros.
Es claro que esta situacin es en promedio, puesto que sabemos que los
causantes de la variacin fueron los rectngulos quinto y octavo. Esta variacin hace
repartir la culpa a todos los dems rectngulos que no cambiaron su longitud.
8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8
= 7,44
9
7,44
Promedio
0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 22,2224
=
9 9
7,44
Promedio
2, 469 1,57
Lo que significa que, en promedio, los rectngulos se desviaron ms o menos (ms
arriba o ms abajo) en 1,57 centmetros.
Si los valores de la serie de datos presenta la misma
forma a izquierda y derecha de un valor central
(media aritmtica) se dice que es simtrica de lo
contrario ser asimtrica.
Para medir el nivel de asimetra se utiliza el llamado
Coeficiente de Asimetra de Fisher, que viene
definido:
n
(1 / n)( ( xi x )3
g1 i 1
3
s
Los resultados pueden ser los siguientes:
n
(1 / n)( ( xi x ) 4
g2 i 1
4
3
s
60
75%
50
Q3 Frecuencia
40 relativa
50%
acumulada
30
Q2
20
25%
10 Q1
0 0%
0.3 1.3 2.3 3.3 4.3 5.3 6.3 7.3 8.3 9.3
Primer cuartil
El primer cuartil es el valor correspondiente al
punto debajo del cual se encuentra el 25% de
las observaciones en un conjunto ordenado de
datos. n
CF
Q1 L 4 (i )
f
donde L = lmite de las clases que contienen Q1,
CF = frecuencia acumula que precede a la clase que
contiene a Q1, f = frecuencia de la clase que contiene Q1,
i= tamao de la clase que contiene Q1.
4-21
Tercer cuartil
El tercer cuartil es el valor correspondiente al
punto debajo del cual se encuentra 75% de las
observaciones en un conjunto ordenado de
datos:
3n
CF
Q3 = L + 4 (i )
f
donde L = lmite inferior de la clase que contiene a Q3, CF =
frecuencia acumulada precedente a la clase que contiene a
Q3, f = frecuencia de la clase que contiene a Q3, i = tamao
de la clase que contiene a Q3.
Para datos no agrupados:
A.- ordenar los datos de mayor a menor
B.- encontrar la posicion con: pQx= [x(n)* M/2]/M
C.- Calcular el valor con : vQx= Vpqx* ID
n 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Xi 3 4 4 6 7 8 9 10 10 11 12 13 16 18
pQ3: [3(14)+2]/4= 11
VQ3: 12 + 0(12-11)
Para datos agrupados
xi fi Fi
21
Hallar cuartil 1:
Tericas
Intermedias
Empricas
Por su relacin causal:
Independiente
Dependiente
Interviniente:
Por su naturaleza:
Cualitativa:
Nominal
Ordinal
Cuantitativa:
Discreta
Continua
ESCALAS DE MEDICIN
De Razn:
ejemplos: edad, peso, glicemia, altura, distancia, salario, costo por atencin, la
velocidad