Está en la página 1de 24

Estadística: Ciencia que utiliza una serie de herramienta especializadas para

recoger información, analizarla y proponer conclusiones que lleven a la toma de


decisiones útiles en un conglomerado específico.
Ciencia:
1. Porque tiene un leguaje propio
2. Porque usa en su desarrollo un proceso metodológico.
Proceso metodológico.
1. Identificar un problema: situaciones a resolver (necesidad, falla, situación
fortuita o no, fuera de control, condición, dificultad, obstáculo, restricción,
inicio)
2. Asignar tareas = quien hace que
3. Recolección de información =
4. Análisis de la información = comparación
5. Conclusiones para poder TD =
Ramas De la estadística
1. Estadística descriptiva: Describe los fenómenos sin detallarlos para lograr
identificación de los mismos a partir de las diferentes herramientas

2. Estadística inferencial: Detalla los fenómenos a partir de la información


descrita (supuesto lógico de la información descrita)

Ejemplo
100
Marca
Color
Estilo
Placa
Cilindraje 80 de 100 son de alto cilindraje ( 200 cc) Genero
Tipo de llanta cultura
Lujos
Que se puede decir de los estudiantes dueños de las motos a partir del hallazgo
1. Presupuesto para sostenimiento
2. Gusto por la velocidad
3. Genero ( + masc que fem)
4. Preferencia para viaje
5. Al menos 16 años
6. Lejos de la Universidad
7. Poder adquisitivo
8. Accidentalidad

Areas donde está presente


1. Salud = Registro de ocupamiento de ucis
2. Deporte = Nro numero de hinchas, Nro de amonestados, la cantidad de
deportistas de alto rendimiento en las universidades
3. Mercadeo = Registros de nuevos productos
4. Educación = Registros del nro de matriculados, deserción
5. Sicología = % pacientes en las casas de reposo
Donde se encuentran estadísticas para estudiar
1. Cámaras de comercio: Comerciales
2. Bolsas de valores: Financieras
3. DANE: Departamento Administrativo Nacional de Estadística: Demográfica
Quien hace la estadística: Estadígrafo o Estadista., Estadístico

Por el publico al que es dirigida la información


1. Primarias= son las que provienen directamente de la fuente
2. Secundarias= son resúmenes, ediciones totales o parciales de la
información primeria
3. Series de tiempo= pueden ser temporales cuando tienen ciclo fijo de
presentación o pueden ser atemporales cuando no lo tienen
Clasificación por volumen de información
1. Parciales = usan parte de los elementos objeto de estudio
2. Exhaustivas = usan todos los elementos objeto de estudio en su proceso
(censo)
Finalidades de la estadística
1. Identificar un fenómeno
2. Estudiar causas y consecuencias del fenómeno
3. Comparar con otros fenómenos
4. Establecer frecuencia de ocurrencia del fenómeno
5. Análisis del fenómeno
6. Pronosticar su comportamiento o aparición en el futuro
7. Conclusiones del fenómeno para TD

Población= Recuento de todos los elementos que tienen una característica común
a ser estudiada
Marco de referencia= lista actualizada para el control de la información
Muestra= Recuento de una parte de los elementos de la población pero con su
misma característica

Población (itm) 23000

marco de referencia (fraternidad)

1200 (muestra)
Muestra valida=
1. Sea representativa de la población (técnica, tablas estadísticas)

Pobla % error 1 2%
100000 25000 15000
200000 35000 20000
23000 9500 1200

2. De manera aleatoria= Todos tienen la misma posibilidad de ser elegidos

Característica = Un rasgo con el que se identifican los elementos de la población o


muestra, pueden ser cualitativas ( no son medibles) o pueden ser cuantitativas ( se
pueden contar)
Cualitativas: sentimientos, religión, profesión (atributos)
Cuantitativas: salario, cantidad de hijos, numero de sillas, edad, estatura
No si
Elemento caracteristica
Hogar Nro de hijos
Ganado razas
Político programas

T B
Oligarca democracia
Odia los inmig viejo
Tiene peluca 2 veces vice

$X $Y

Tablas de frecuencias = arreglo matricial (f y c) donde esta la variable y su


frecuencia de ocurrencia
Variable= símbolo que representa una característica a en una población o muestra
(y) las hay de dos tipos, la variable mide lo que la característica no puede
1. Discretas = no admite valores intermedios es puntual ( N hijos, n sillas, N
aparatos, N materias)
2. Continuas = puede tomar un valor en un rango, admite valores intermedios
( edad salario, peso, estatura, velocidad, espacio)
19 – 26 – 20 – 18 – 17 edad Continua
Numero de hombres para ejecutar un trabajo en 4 dias
2 – 5 – 11 – 4 en promedio necesito 5,5 hombres (discreta)
parámetros= valor de verdad que reúne el comportamiento de una variable en una
distribución
ejemplos ( media, mediana, moda)
Datos estadísticos = Es una representación numérica con especificación en el
tiempo y el espacio
2–9–6–7–5 es una fila de números
2 – 9 – 6 – 7 – 5 son las edades de los niños del país vecino en condición de
mendicidad en las calles de Medellín
Unidad de investigación = Es de donde sale la información puede ser PAC varia
entre 1 y la muestra o población ( 1 y N o 1 y n)

Terminología
Población N
Muestra n
Frecuencia absoluta= numero de veces que se repite la variable ni
Frecuencia relativa fi = ni/n
Frecuencia relativa acumulada Fi
Frecuencia absoluta acumulada Ni
Variable yi
Unidad de investigación Xi ( 1---- n)
Intervalo de clase ( Yi-1 ----- Yi ] = (Li --------Ls] los usaremos cuando las variables
sean continuas
Marca de clase = punto medio del intervalo de clase Yi = ( Y i-1 + Yi ] / 2
Numero de intervalos de clase K = [1 + 3,3 ( log n)] regla de sturges
Rango R = Xmax – Xmin
Amplitud a = R/K es constante para todos los intervalos de clase
La información que se presenta a continuación corresponde a los estudiantes de la
universidad P y de ellos elegidos de manera representativa y aleatoria a 25 para
estudiar el número de materias tomadas por ellos en el semestre 1 de 2021: la
información es la siguiente:

X1 2 X2 3 X3 3 X4 2 X5 6
X6 3 X7 6 X8 3 X9 4 X10 3
X11 5 X12 7 X13 4 X14 5 X15 5
X16 4 X17 7 X18 3 X19 3 X20 7
X21 2 X22 4 X23 3 X24 4 X25 2

Población N = Todos los estudiantes de la Universidad P 23000


Muestra n = 25 estudiantes de la Universidad P matriculados en 2021 – 1
Característica = Materias tomadas
Variable= # de materias tomadas
Tipo de variable = discreta
Tipo de característica = cuantitativa
Unidad de investigación = cada estudiante (1 – 25)

Tabla de conteo
Variable Cantidad de Cuenta 1 TOTAL
materias
2 IIII 4
3 IIIIIIII 8
4 IIIII 5
5 III 3
6 II 2
7 III 3
TOTAL 25

TABL DE FRECUENCIAS
yi ni fi Ni Fi
2 4 0,16 4 0,16
3 8 0,32 12 0,48
4 5 0,20 17 0,68
5 3 0,12 20 0,80
6 2 0,08 22 0,88
7 3 0,12 25 1,00
total 25 xxxxxx Xxxxx
1.00
n2 = 8 estudiantes tomaron 3 materias
f2 = un 32% de los estudiantes tomaron 3 materias
N2 = 12 estudiantes tomaron entre 2 y tres materias= 12 estudiantes tomaron a lo
sumo 3 materias.
F2 = El 48% de los estudiantes tomaron hasta 3 materias
Cuantos estudiantes tomaron el mayor numero de materias ( 3)
Cuantos estudiantes tomaron ´por lo menos 3 materias ( 21)
Cuantos estudiantes tomaron menos de tres materias ( 4)
Cuantos estudiantes tomaron mas de tres materias ( 13)
Un 12% de las materias esta concentrado en 5 estudiantes ( F ) ( v ) la
tabla no muestra % de materias.
Cuantos estudiantes y a que porcentaje de la población representan los que
tomaron mas de 6 materias ( % 12 ) ( # 2760 = 23000 * 0,12 )
La información que se presenta a continuación corresponde a los estudiantes de la
Universidad P y de ellos elegidos de manera representativa y aleatoria a 25 para
estudiar el tiempo que tardan en ir de la casa a la universidad : la información es la
siguiente:
X1 X2 X3 18 X4 X5
25 20 16 37
X6 X7 X8 X9 X10
48 24 19 15 35
X11 X12 X13 X14 X15
55 38 24 20 45
X16 X17 X18 X19 X20
18 40 28 25 60
X21 X22 X23 X24 X25
22 45 29 40 65

Población Todos los estudiantes de la universidad P 6500


Muestra n = 25 estudiantes de la universidad P matriculados en 2021 – 1
Característica = tiempo para ir de la casa a la universidad
Variable = Tiempo en minuto para ir de la casa a la universidad
Unidad de investigación = cada estudiante entre 1 y 25
Tipo de característica = cuantitativa
Tipo de variable = continua
Xmax = 65
Xmin = 15
Rango = 65 – 15 = 50
Numero de intervalos K = 1 + 3,3 * log (n) = 5,61 siempre el entero siguiente 6
intervalos
Amplitud a= R/K = 50/ 5,61 = 8,9
(Yi – 1 --- Yi ] ni fi Ni Fi Yi N i+
[15 --- 8 0,32 8 0,32 19,45 25
23,9]
(23,9 --- 6 0,24 14 0,56 28,35 17
32,8]
(32,8 --- 5 0,20 19 0,76 37,25 11
41,7]
(41,7 --- 3 0,12 22 0,88 46,15 6
50,6]
(50,6 --- 1 0,04 23 0,92 55,05 3
59,5]
(59,5 --- 2 0,08 25 1,0 63,95 2
68,4]
Total 25 1,0 …. …..

1. Cuantos estudiantes Tardan el máximo tiempo para ir de la casa a la U ( 2)


2. n4 = 3 estudiantes tardan entre 41,7 y 50,6 minutos para ir de la casa a la U
3. Cuantos estudiantes tardan hasta 32,8 minutos para ir de la casa a la U
( 14)
4. N2 = 14 estudiantes tardan a lo sumo 32,8 minutos para ir de la casa a la U
5. F5 = El 92% de los estudiantes tardan a lo sumo 59,5 minutos en ir de la
casa a la U
6. f5 = un 4% de los estudiantes tardan 50,6 y 59,5 minutos en ir de la casa a
la U
7. Y3 = 5 estudiantes tardan en promedio 37,25 minutos para ir de la casa a la
U
Medidas de resumen = resumen el comportamiento de la variable en la
distribución
Medidas de tendencia central = son parámetros para resumir el comportamiento
de la variable
MTC ( Media, Mediana, la moda)

Media= promedio X
1. Es sensible a los cambios en los valores de la distribución
2. Se calcula cuando los datos son razonablemente homogéneos
3. Se comporta como un dato algebraico
4. No se debe calcular si los datos se presentan como índices o como
porcentajes
5. No se puede calcular cuando falta un dato en el extremo de una distribución
de una variable continua
Calculo de la media
Datos no agrupados ∑ Xi /n
Datos agrupados ∑ Yini /n
3 – 9 – 8 – 7 – 4 – 2 – 5 – 6 – 150 salarios de nueve colombiano por hora en
miles de pesos
[3 + 9 + + 8 +------------- + 6 ]/ 8 = 5,5 miles de pesos hora
Media aritmética ponderada = se calcula cuando los datos tienen pesos
específicos diferentes entre si X
Materia crédito nota nc
Estadística 4 3,8 15,2
Calculo 4 1,6 6,4
Ingles 2 4,2 8,4
Electiva 2 3,5 7,0
Física 4 0,5 2,0
16 créditos ∑ [xi Wi ]
= 39
Media ponderada = ∑ [xi Wi ]/ ∑ Wi = 39 / 16
Nota crédito promedio = 2,43
Variable discreta
2–3–5–8–4–2–8–7–3–4–8–7–8–5 datos no agrupados
∑ Xi /n = 2 + 3 + 5 + ----------------- + 5 = 5,28 promedio de sillas malas en 14
aulas

Datos agrupados
Yi ni Yini
2 2 4
3 2 6
4 2 8
5 2 10
6 0 0
7 2 14
8 4 32
total 14 74

∑ Yini /n = 74/14 = 5,28


Si la variable es discreta, el valor de la media para los datos no agrupados y
agrupados es igual aunque no se calculen de la misma manera.
Variable continua
34 – 30 – 22,8 – 21,9 – 20 – 18,6 – 32 – 31,4 – 16 – 17 – 14 – 20,3 – 35 – 30,8 –
32
Media = ∑ Xi /n = [34 + 30 + 22,8 + ---------------------------------------------------------+
32 ] /15
= ∑ Xi /n = 25,05 promedio del consumo en KW de energía en 15
apartamentos
Agrupar los datos
X max = 35
X min = 14
Rango = Xmax – X min = 35 – 14 = 21
K = 1 + 3,3 (log (15)] = 4,88 siempre el entero siguiente 5 intervalos
Amplitud a = R/K = 21/ 4,88 = 4,3
Yi-1 yi ni Yi yini
14 18,3 3 16,15 48,45
18,3 22,6 4 20,45 81,80
22,6 26,9 1 24,75 24,75
26,9 31,2 2 29,05 58,10
31,2 35,5 5 33,35 166,75
total 15 379,85

Media = ∑ Yini /n = 379,85/ 15 = 25,32 consumo promedio en KW de los


apartamentos
Si la variable es continua, el valor de la media para los datos no agrupados y
agrupados no es igual debido a la construcción de los intervalos
Nota= El valor de referencia es el de los datos agrupados.

La Mediana
Es centro de la distribución, no es sensible a los cambios en los valores de la
distribución mientras no se hagan en un valor central, se puede usar cuando los
datos son muy dispersos. Siempre se deben organizar los datos para su cálculo.
Si el numero de observación es impar la mediana es el valor del centro y si es par
la mediana será la semisuma de los dos valores centrales.
Se puede calcular aun si falta un dato en el extremo de una distribución de una
variable continua
Datos no agrupados y variables discretas o continuas
Ejemplo
12 – 15 – 17 – 10 – 9 – 8 – 6 – 14 – 15 – 20 – 250 – 24 – 15
6 – 8 – 9 – 10 – 12 – 14 – 15 – 15 – 15 – 17 – 20 – 24 – 550
Me = 15 el 50 % de los niños tiene 15 cuadernos o menos

30 – 15 – 20 – 25 – 18 – 20 – 35 – 40
15 – 18 – 20 – 20 – 25 – 30 – 35 – 40
Me = [20 + 25 ]/2 = 22,5 la mitad de las vueltas el vehículo va a 22,5 M/S 0 menos

21- 20 – 11 -14 – 13 – 15 – 12 – 10 – 9 – 180 – 16


9 – 10 – 11 – 12 – 13 – 14 – 15 – 16 – 20 – 21 – 280
Me = 14 la mitad de los salones tiene 14 sillas malas o menos
5 – 9 – 6 – 4 – 2 – 7 – 8 – 10
2 – 4 – 5 – 6 – 7 – 8 – 9 – 10
Me = [6+7]/2 = 6,5 El 50% de los niños tiene 6,5 años o menos

12 – 18 – 20 – 7 – 8 – 5 – 25 – 200 – 14
5 – 7 – 8 – 12 – 14 – 18 – 20 – 25 – 500
Me = 14 El 50% de las haciendas tiene 14 reses o menos
1 – 0 – 3 – 8 – 7 – 12 – 12 – 16 – 19 – 25
0 – 1 – 3 – 7 – 8 – 12 – 12 – 16 – 19 – 25
Me = [8 + 12 ]/2 = 10 El 50% de los salones tiene 10 sillas o menos
Datos Agrupados
1. Variable discreta
a. Acumular las frecuencias absolutas
b. Calcular n/2
c. Buscar n/2 en Ni, si está se llama Ni-1 y al siguiente Ni
d. Frente a Ni Localizar Yi
e. Frente a Ni-1 localizar Yi-1
f. Aplicar Me = [Yi-1 + Yi]/2
g. Si n/2 no esta en Ni entonces al inmediatamente menor llamar Ni-1 y al
siguiente Ni
h. Aplicar Me = Yi

Ejemplo:
Yi ni Ni
12 4 4
18 3 7
Yi-1 24 2 9 Ni-1
Yi 30 8 17 Ni
38 1 18
total 18

n/2 = 18/2 = 9
Me = = [Yi-1 + Yi]/2 = (24 + 30)/2 = 27 La mitad de los salones tiene 27 sillas
malas o menos
Yi ni Ni
Yi-1 4 7 7 Ni-1
Yi 18 6 13 Ni
20 3 16
25 8 24
30 1 25
total 25

n/2 = 25/2 = 12,5


Me = 18 El 50% de los hospitales tiene 12,5 camas o menos (13 camas)

Yi ni Ni
3 2 2
8 6 8
Yi-1 11 7 15 Ni-1
Yi 18 11 26 Ni
24 4 30
Total 30

n/2 = 30/2 = 15
Me = [11 + 18] /2 = 29/ 2 = 14,5 El 50% de los estudiantes lleva 14,5 cuadernos o
menos (15)
A partir de los datos calcule e interprete la mediana Me =

Yi ni Ni
11 2 2
14 6 8
Yi-1 16 8 16 Ni-1
Yi 18 13 29 Ni
24 3 32
Total 32

n/2 = 32/2 = 16
Me = = [Yi-1 + Yi]/2 = [16 + 18]/2 = 17 El 50% de los hospitales tiene 17 camas
disponibles o menos
Yi ni Ni
4 5 5
Yi-1 8 6 11 Ni-1
Yi 10 17 28 Ni
12 13 41
14 3 44
Total 44
n/2 = 44/2 = 22
Me= 10 la mitad de los salones tiene 10 sillas malas o menos
A parir de los siguientes datos calcule e interprete la mediana
Yi ni Ni
5 2 2
Yi-1 8 9 11 Ni-1
Yi 16 7 18 Ni
20 6 24
25 1 25
v Total 25

n/2 = 25/2 = 12,5


Me = 16 El 50% de las haciendas tiene 16 reses o menos
2. La variable es continua

a. Acumular las frecuencias absolutas


b. Calcular n/2
c. Buscar n/2 en Ni, si está se llama Ni-1 y al siguiente Ni
d. Frente a Ni Localizar Yi-1
e. Frente a Ni-1 localizar Yi
f. Aplicar Me = Yi-1
g. Si n/2 no esta en Ni entonces al inmediatamente menor llamar Ni-1 y al
siguiente Ni
h. Aplicar Me = Yi-1 + [a ( n/2- Ni-1)/ni]

Yi-1 --- ni Ni Yi yini


Yi
[20 ----- 4 4 22 No se
24] puede
Yi (24 ----- 12 16 27 Calcular Ni-1
30]
Yi-1 (30 ---- 3 19 32,5 La Ni
35]
(35 ----38] 10 29 36,5 Media
(38 ---- 3 32 No
mas se
sab
e
total 32
n/2 = 32/2 = 16
Me = 30 El 50% de los semáforos se demoran 30 segundos o menos en cambiar
Yi-1 --- ni Ni
Yi
[10 ----- 9 9
24]
Yi (24 ----- 12 2 Ni-1
30] 1
Yi-1 (30 ---- 6 2 Ni
40] 7
(40 ----45]
11 3
8
(45 ---- 50 5 4
3
total 43
n/2 = 43/2 = 21,5
El intervalo donde esta Ni se llama intervalo mediano donde debe estar la mediana
Me = Yi-1 + [a ( n/2- Ni-1)/ni]
Me = 30 + [ 10 (21,5 – 21)/6] = 30,83 El 50% de los hombres se demoran 30,83
segundos o menos en afeitarse
Ni-1 = 0
Yi-1 --- ni Ni
Yi
Yi-1 [10 ----- 14 1 Ni
24] 4
(24 ----- 3 1
30] 7
(30 ---- 5 2
40] 2
(40 ----45] 2 2
4
(45 ---- 50 1 2
5
total 25

n/2= 25/2 = 12,5


Me = Yi-1 + [a ( n/2- Ni-1)/ni]
Me = 10 + [ 14( 12,5 – 0) / 14]
Me = 22,5 El 50% de las mascotas consume 22,5 Kg o menos de concentrado

Yi-1 --- Yi ni Ni
2 ----- 4 5 5
4 ----- 10 3 8
Yi 10 ----13 4 12 Ni-1
Yi-1 13 ----14 1 22 Ni
0
14 ----18 2 24
total 2
4

n/2 = 12
Me = 13 El 50 % de las mascotas consume 13 Klg o menos

Yi-1 --- Yi ni Ni
12 ----- 14 3 3
Yi 14 ----- 16 6 9 Ni-1
Yi-1 16 ---- 20 5 14 Ni
20 ---- 24 2 16
24 ---- 30 2 18
total 1
8

n/2 = 18/2 = 9
Me = 16 El 50% de los jóvenes tiene 16 años o menos
Yi-1 --- Yi ni Ni
2 ----- 4 4 4
Yi 4 ----- 6 9 13 Ni-1
Yi-1 (6 ---- 10] 5 18 Ni
10 ---- 12 7 25
12 ---- 14 6 31
total 3
1

n/2 = 31/2 = 15,5


Me = Yi-1 + [a ( n/2- Ni-1)/ni]
Me = 6 + [ 4 ( 15,5 – 13)/5] = 8 El 50% de las vueltas lleva una velocidad de 8
M/seg o menos
El intervalo donde está la mediana se llama intervalo mediano

Yi-1 --- Yi ni Ni
2 ----- 4 5 5
Yi 4 ----- 10 4 9 Ni-1
Yi-1 10 ----13 1 20 Ni
1
13 ----14 1 36
6
14 ----18 3 39
total 3
9

n/2 = 39/2 = 19,5


Me = Yi-1 + [a ( n/2- Ni-1)/ni]
Me = 10 + [ 3 ( 19,5 – 9) /11] = 12,86 El 50% de los trabajadores se gana 12,86
dólares o menos

Moda = Md = Es aquel valor de la variable que tiene la mayor frecuencia de


repetición, valor alrededor del cual está la variable en la distribución.
Una distribución puede tener:
Una sola moda = Unimodal…. 3 – 2 – 5 – 7 – 2 – 8 Md = 2
Dos modas = Bimodal ….. 3 – 2 – 5 – 7 – 3 – 2 – 8 – 9 = Md = 3 y 2
Mas de dos modas Multimodal … 3 – 2 – 5 -5 – 7 – 3 – 2 – 8 – 9 Md = 3, 2 y 5
No tener moda = Amodal …… 3 – 2 – 5 – 8 – 9 – 7
Datos son agrupados y la variable es discreta

Yi ni
3 1
5 3
6 6
8 8
10 10
tota 28
l

Md = 10 El numero de niños más frecuente es 10

Yi ni
4 3
5 3
6 3
8 3
9 3
tota 15
l
Md = Amodal
Yi ni
4 4
5 4
6 7
8 2
9 1
tota
l

Md= 6 las haciendas tienen alrededor de 6 reses


Calculo de la moda para la variable continua si la amplitud es constante
1. Buscar la mayor frecuencia ahí esta el intervalo modal
2. Calcular delta 1 = frecuencia modal menos la premodal
3. Calcular delta 2 = frecuencia modal menos la posmodal
4. Md = Yi-1 + [ a ( delta1 / delta 1 + delta 2)]
El intervalo donde esta la moda se llama intervalo modal
Ejemplo

Yi-1 --- Yi ni
2 ----- 4 5
4 ----- 6 4
6 ……..8 1
1
8 ------10 1
6
10 ----12 3
total 3
9

Delta 1 = 16 – 11 = 5
Delta 2 = 16 – 3 = 13

5. Md = Yi-1 + [ a ( delta1 / delta 1 + delta 2)]

Md = 8 + [ 2 ( 5 / 5+13)] = 8,55 El salario esta alrededor de 8,55 dólares la


hora

Calculo de la moda si la amplitud no es constante


Se debe calcular la densidad en los intervalos d = ni/A
Buscar el mayor di y acá esta el intervalo modal
Aplica Md = Yi-1 + [ A ( di+1 / di+1 + di-1)]

Yi-1 --- Yi ni di = ni/A


2 ----- 4 5 5/2 = 2,5 di-1
4 ----- 5 4 4/1 = 4 ------- di
5 ----10 11 11/5 = 2,2-----di+1
di-1
10 ----14 16 16/4 = 4
di
14 ----18 3 3/4 = 0,75
di+1
total 39
Md = Yi-1 + [ A ( di+1 / di+1 + di-1)]
Md1 = 4 + [ 1 ( 2,2 / 2,2 + 2,5)] = 4,46

Md2 = 10 + [ 4 ( 0,75 / 0,75 + 2,2)] = 11,01

SIMETRÍA O SESGO DE UNA DISTRIBUCIÓN


El cálculo de las tres medidas de tendencia central en una distribución permite
determinar el sesgo o simetría de la misma, de tal manera que si los valores de las
tres medidas son iguales la distribución es simétrica o normal, de lo contrario es
asimétrica positiva o negativa; positiva si la media es mayor que las otras dos
medidas y negativa si la media es menor que las otras dos medidas, se dispones
de izquierda a derecha de menor a mayor, la media siempre estará en el centro de
la distribución o sea que las ,medidas que determinan el sesgo son la media y la
moda.
Si la mediana no esta en el centro, se debe calcular un coeficiente de asimetría.

Simétrica

X – Me – Md

Asimétrica positiva ( cola derecha )

Md – Me – X

Asimétrica negativa
X – Me - Md

Medidas de dispersión
Varianza S2 = variabilidad de los datos con respecto a una medida de tendencia
central, es siempre un valor positivo, la varianza de una constante es cero, la
varianza de una constante mas o menos una variable es la varianza de la variable.
1. S2 K = 0
2. S2 ≥ 0
3. S2 (K +- X) = S2 X
S2 K +- S2 X = S2 X
0 +- S2 X = S2 X ---------- S2 X = S2 X

Para los datos no agrupados (D o C)


S2 = ∑ (Xi – X )2 / n

1. Ventas en un periodo 2–7–9–4–5–6 X = ∑ Xi / n 33/


6 = 5,5
2. Ventas en un mismo periodo de otro 8 – 10 – 10 – 2 – 1 – 2 = ∑ Xi / n
= 33 / 6 = 5,5

S2 = ∑ (Xi – X )2 / n = [ (2 – 5,5)2 + (7 – 5,5)2 + ……….. + (6 – 5,5)2] / 6 = 4,9


Es mas estable
S2 = ∑ (Xi – X )2 / n = [ (8 – 5,5) 2 + (10 – 5,5)2 + ……….. + ( 2 – 5,5) 2] / 6 =
15,25

Desviación típica o estándar S= Es la raíz de la varianza con ella y la regla


empírica se pueden establecer los limites de tolerancia de un proceso
cualquiera.
S = Raiz ( 4,9) = 2,21 Es mas estable
S = Raiz ( 15,25) = 3,9
Según la regla empírica el 68% de las observaciones deberán estar a una
desviación de la media, 95% a dos desviaciones de la media y 99,73% de
las observaciones deberán estar a tres desviaciones de la media.
68 % ----------- X +- S = 5,5 +- 2,21 ---- ( 3,29 -----7,71)
95% ------------X +- 2 S = 5,5 +- 2(2,21)---( 1,08 -----9,92)
99,73% -------- X +- 3 S = 5,5 +- 3( 2,21) --- ( -1,13 --- 12,13)

68 % ----------- X +- S = 5,5 +- 3,9 ---- ( 1,6 ----- 9,4)


95% ------------X +- 2 S = 5,5 +- 2(3,9)---( -2,3----- 13,3)
99,73% -------- X +- 3 S = 5,5 +- 3( 3,9) --- ( -6,2 --- 17,2 )

Coeficiente de variación = d = S/X se da en porcentaje, también se llama


variabilidad relativa
d = 2,21/ 5,5 = 40% Es mas estable
d = 3,9 / 5,5 = 70,9 %

Para los datos agrupados (D ó C)


S2 = ∑ (Yi – X )2ni / n

Yi-1 -- ni Yi Yini [∑ (Yi – X )2ni ] /n


Yi
3 ------ 6 6 4,5 27 (4,5 – 9,02)26 =
122,58
6 ------9 5 7,5 37,5 (7,5 – 9,02)25 =
11,55
9 ------ 2 10,5 21 (10,5 – 9,02)22=
12 4,38
12 ----- 1 13 13 (13 – 9,02)21 =
14 15,84
14 ------ 4 16 64 (16 – 9,02)24 =
18 194,88
Total 18 162,5 349,23 ---- S2 =
19,4

Pasos para el calculo con la calculadora

1. Resetee Shiff 9 3 =
2. Shiff mode flecha abajo y del menú escoger stat
3. Prender la frecuencia 1 =
4. Mode y del menú escoger stat ( 3 =)
5. Del menú escoger 1 _ var ( 1 =)
6. Aparecen dos tablas; en x entrar los valores de Yi y en la Frec entrar los
valores de ni ( se entran con la tecla =
7. Una vez adentro los datos de las dos columnas teclee AC
8. Shiff 1 y del menu elegir Var (4 =)
9. Y del menú elegir donde este la media ( 2 =)
10. Para la desviación elegir donde esta sigma X ( 3 = )
11. Elevar ese valor al cuadrado para la varianza

Consumo de combustible en 18 días de un vehículo


X = ∑ yini/ n = 162,5/18 = 9,02 media
S2 = 19,40 varianza
S = 4,40 desviacion tipica
d = 4,40 / 9,02 = 48,8% coeficiente de variación

Si otro vehículo en el mismo tiempo tiene un consumo promedio de 10


galones pero con una variación de 19 galones, cual de los dos vehículos
tiene mas regularidad relativa en sus consumos.
S2 = 19 X = 10
S = 4,35
d = 4,35 / 10 = 43,58% es mas estable

Apuntamiento o curtosis

Es el comportamiento de la curva respecto del eje Y; la curva puede ser


Aguda o leptocúrtica, normal o mesocúrtica y puede ser achatada o
platicúrtica, tiene que ver con la concentración de los datos en el centro de
la distribución, se calcula con los momentos respecto de la media los cuales
se calculan para determinar un numero que indique la altura de la curva
respecto del eje Y.

1- El momento de orden cuatro respecto de la meda y el parámetro g 2, Si


dicho parámetro es 3 la curva es normal, si es mayor que 3 es aguda y
si es menor que 3 la curva es achatada.
Aguda o Lepto

Nor
mal o meso

Ac
hatada o Plati
g2 = m4 / S4 = 3 la curva es Meso
> 3 La curva es lepto
< 3 La curva es Plati

m4 = ∑ ( Xi – X )4 ]/ n para los datos no agrupados ( D o C)


m4 = ∑ ( yi – X )4 ni ]/n para los datos agrupados ( D o C )

A partir de los datos dibuje la curva respecto del eje Y

También podría gustarte