Está en la página 1de 25

Gua de ejercicios.

Clasificar las siguientes variables y de ejemplos:



Marcas de cerveza.
Velocidad en Km/h.
El peso en Kg.
Nivel educativo (bsica, media, superior).
Aos de estudios completados.
Tipo de enseanza (privada o pblica).
Nmero de empleados de una empresa.
La temperatura de un enfermo en grados Celsius.
La clase social (baja, media o alta).
La presin arterial de una persona mm/Hg.
Estado civil (Soltero, Casado, Separado, Divorciado, Viudo).

1
Probabilidad e Inferencia
Estadstica
Tema 2: Estadstica Descriptiva
2
3
Luego de realizar la recoleccin de los datos,
se obtienen datos en bruto, los cuales rara
vez son significativos sin una organizacin y
tabulacin.
Media Aritmtica
Es la suma de todas las observaciones
dividida entre el nmero total de
observaciones.

Expresada de forma ms intuitiva, podemos
decir que la media aritmtica es la cantidad
total de la variable distribuida a partes
iguales entre cada observacin.
4
Media aritmtica


Para datos no agrupados:


5
n
x
X
n
i
i

1

Mediana
Es el valor que ocupa la posicin central de un
conjunto de observaciones, una vez que han sido
ordenados en forma ascendente o descendente.

Divide al conjunto de datos en dos partes iguales.
6
Para datos no agrupados:

Si n es impar: posicin donde se ubica la mediana es
igual a (n+1)/2.

Si n es par: (n+1)/2 no es entero, por lo tanto la
mediana ser igual al promedio de las dos posiciones
centrales.

7
Clculo de la mediana
Moda
Observacin o clase que tiene la mayor
frecuencia en un conjunto de observaciones.

Un conjunto de datos puede ser unimodal,
bimodal o multimodal.

Es la nica medida de tendencia central que se
puede determinar para datos de tipo cualitativo.

8
Relacin entre la media, la mediana y
la moda
9
Cuando los datos son sesgados es mejor emplear la Md
Medidas de posicin
10
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos estn
ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64.
Medidas de dispersin
11
-Rango
-Varianza
-Desviacin Estndar
Rango
Varianza
x
1
x
2
x


n
x


Datos Cuantitativos
Coeficiente de Variacin
Comparacin entre Variables
Se refiere al comportamiento de las variables cuantitativas en un grupo.
Por ejemplo: Si se tiene un conjunto de personas a las que se les mide
Estatura, Peso, Edad: Entre estas variables cul presenta mayor
variacin?
) min( ) max(
i i
x x R
Desviacin Tpica o Estndar
2
1
2 1 1
2 2
1
2
2
1
) (
1
) (
x x
n n
x
n
x
n
x x
s
n
i
i
n
i
n
i
i i
n
i
i


2
s s
x
s
cv
Otras medidas o Coeficientes
12
-Asimetra
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias es la
simetra y el apuntamiento o kurtosis.
Coeficiente de Asimetra
3
1
3
) (
s n
x x
CA
n
i
i

Si CA=0 si la distribucin es simtrica alrededor de la media.


Si CA<0 si la distribucin es asimtrica a la izquierda
Si CA>0 si la distribucin es asimtrica a la derecha
Coeficiente de Apuntamiento
4
1
4
) (
s n
x x
CAp
n
i
i

- Si CAp=0 la distribucin se dice normal (similar


a la distribucin normal de Gauss) y recibe el
nombre de mesocrtica.
- Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se llama
platicrtica.
13
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetra y apuntamiento
V2
7,0 6,0 5,0 4,0 3,0 2,0 1,0
14
12
10
8
6
4
2
0
Desv. tp. = 1,67
Media = 3,9
N = 30,00
V4
2,0 1,0 0,0 -1,0
30
20
10
0
Desv. tp. = ,64
Media = 0,0
N = 30,00
V5
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
6
5
4
3
2
1
0
Desv. tp. = 2,42
Media = 5,2
N = 28,00
14
Ejercicios
Media 3,9
Mediana 4
Moda 4
Desviacin estndar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetra -0,02
Rango 6
Mnimo 1
Mximo 7
Cuenta 30
V1
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
16
14
12
10
8
6
4
2
0
Desv. tp. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos Histograma Medidas descriptivas
Ejercicios
15
1. Un estudiante preocupado por su presupuesto, desea calcular la media de los
gastos semanales en fotocopias que ha tenido durante las ltimas 6 semanas. Los
montos en pesos fueron:
1500 - 3200 - 7650 - 1600 - 10000 - 1350
Calcular la media o promedio de los gastos en fotocopias del perodo indicado.

2. En una consulta de fonoaudiologa se registr el n de pacientes que se atendi
por problemas de dislalia durante dos semanas, los resultados fueron los
siguientes:
3-5-2-2-2-3-3-3-4-1-1-1-1-2-2-3-3
Calcule la moda del n de pacientes que acuden por dislalia.

3.- En una empresa se consult cuntas cargas familiares tenan dos grupos de
trabajadores de cierta planta. Se muestran las respuestas en lo que sigue:
3-3-2-2-1-3-2-2-0-0-3-2-1-2-3-1-0-0-2-1-1-4-2
Determinar el nmero mediana o mediano de cargas familiares.
Ejercicio:
Imagina que hemos preguntado a 25 personas por su provincia de
nacimiento, obteniendo los siguientes resultados:

La Serena, Coquimbo, Valparaso, La Ligua, La Ligua, La Calera,
Valparaso, Quintero, La Serena, Los Andes, Puerto Montt, Valparaso,
Quintero, La Serena, Coquimbo, Quintero, Los Andes, Coquimbo, Los
Andes, Quintero, Los Andes, La Serena, La Calera, Puerto Montt, La Calera

Construir la tabla de frecuencias correspondiente

16
Tablas de frecuencia
Exponen la informacin recogida en la muestra, de modo que no se
pierda nada de informacin (o poca)

Frecuencia absoluta: Nmero de veces que se presenta un valor o
categora de una variable. Contabilizan el nmero de individuos de
cada modalidad.

Frecuencia relativa (porcentaje) :contabilizan el nmero de individuos
de cada modalidad, pero dividido por el total.

Frecuencias acumuladas: Slo tienen sentido para variables ordinales y
numericas.



TABLAS DE FRECUENCIA

SEGUN EL TIPO DE VARIABLES
Unidad ni
fi

Administracin 31 28,18
Informatica 28 25,45
Gerencia 22 20,00
Marketing 29 26,36
TOTAL 110 100
Tabla de frecuencia para Variables Cualitativas Nominales
ATENCIN ni fi Ni Fi
Nios 38 43.7 38 43.7
jovenes 26 29.9 64 73.6
adultos 17 19.5 81 93.1
seniles 6 6.9 87 100
TOTAL 87 100
Tabla de frecuencia para Variables Cualitativas Ordinales
N de
Accidentes
Frec.
absoluta
ni
Frec.
Absoluta
Acumulada
Ni
Frec relativa
fi
Frec relativa
Acumulada
Fi
0 45 45 66,2 66,2
1 12 57 17,6 83,8
2 7 64 10,3 94,1
3 3 67 4,4 98,5
4 1 68 1,5 100
TOTAL 68 100
Tabla de frecuencia para Variables cuantitativas discretas
N de accidentes en terreno que sufrieron los trabajadores de una empresa
durante 2005
Cuntos trabajadores tuvieron a lo ms dos accidentes durante el ao?
Qu porcentaje de trabajadores tuvo a lo ms tres accidentes durante el ao?
N de hijos frecuencia % % acum
0 419 27,8 27,8
1 255 16,9 44,7
2 375 24,9 69,5
3 215 14,2 83,8
4 127 8,4 92,2
5 54 3,6 95,8
6 24 1,6 97,3
7 23 1,5 98,9
8 o ms 17 1,1 100,0
TOTAL 1509 100
Cuntos individuos tienen menos de 2 hijos?
Qu porcentaje de individuos tiene 6 hijos o menos?
T
Tabla de frecuencia para Variables cuantitativas discretas
38 36 43 35 43
33 43 39 43 38
39 44 38 47 36
41 44 45 36 38
44 41 36 42 39
Largo cms
frecuencia
ni
33 1
34 0
35 1
36 4
37 0
38 4
39 3
40 0
41 2
42 1
43 4
44 3
45 1
46 0
47 1
25
Largo (cms) de 25 varas
Clase
Intervalos de
clase
marcas de
clase
frecuencia
1 33 36 34,5 2
2 36 39 37,5 8
3 39 42 40,5 5
4 42 - 45 43,5 8
5 45 48 46,5 2
TOTAL 25
Tabla de frecuencia para Variables cuantitativas continuas
Tamao muestral N de clases (k)
menos de 16 datos insuficientes
16-31 5
32-63 6
64-127 7
128-255 8
256-511 9
512-1023 10
1024-2047 11
2048-4095 12
4096-8190 13
Reglas para agrupar datos en categoras o clases (Milton, 2001)
1.- Decidir el nmero de clases (Sturges, 1926)
k =1+3,322 log10 n

k = n de clases
n = n de muestras
amplitud
a= Li - Li-1
Clase
Intervalos
de clase
marcas de
clase
frecuencia
1 33 36 34,5 2
2 36 39 37,5 8
3 39 42 40,5 5
4 42 - 45 43,5 8
5 45 48 46,5 2
TOTAL 25
2.- Determinar el rango de los datos
rango= Valor mayor - valor menor

Ej.: 47-33= 14
3.- Determinar la amplitud mnima y la amplitud real de clase (intervalo)
a= rango = Xmax - Xmin
n clases k
amplitud real de la clase= redondear en exceso el ancho mnimo hasta la misma cantidad de
decimales que los datos
a= 47-33 = 2.8
5
a=3
a= 47-33 = 2.8
5
Si a= 2.2
a=?
4.- Establecer el lmite inferior para la primera clase
38 36 43 35 43
33 43 39 43 38
39 44 38 47 36
41 44 45 36 38
44 41 36 42 39
Clase
Intervalos de
clase
frecuencia
marcas de
clase
1
2
3
4
5
TOTAL
valor mnimo= ?

También podría gustarte