Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística TEXTO Corregido PDF
Estadística TEXTO Corregido PDF
ESTADISTICA
POBLACION
Se entiende por población o universo la totalidad de individuos ó elementos que pueden
presentar determinadas características susceptibles de ser estudiada.
Ejm: a) Población de ventas anuales de explosivos de FAMESA, SEMEXA, EXSA, etc.
b) Población de puntajes de rendimiento en exámenes de alumnos del 3er. nivel de
estudios de la FIM en la UNA – Puno.
La población puede ser finita o infinita:
Población finita.- Es aquella que tiene un número determinado de elementos.
Población Infinita.- Es aquella que tiene un número infinito de elementos.
MUESTRA
Al conjunto de medidas de conteos obtenidos de alguna población con el propósito de
obtener información acerca de ella. Se suelen tomar muestras cuando es difícil o costoso la
observación de todos los elementos de la población estadística.
DATOS ESTADISTICO- Son números o medidas que han sido recopilados como
resultado de las observaciones, pudiendo ser comparados, analizados e interpretados.
1
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
I. Variable Cualitativa.
Cuyos valores consisten en categoría de clasificación. Ejm: La variable “Estado
Civil” adopta las modalidades: soltero, casado, divorciado, viudo, etc.
Esta variable puede clasificarse en: Nominal y Ordinal.
Parámetro.- Es una medida usada para describir una característica de una población,
utilizando la información de la población conjunta, decisión certezas.
Las más usadas:
i) Media población (μ)
ii) Varianza poblacional (σ2)
iii) Proporción poblacional (p).
2
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
3
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
4
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
TIPOS DE MUESTRAS
Segundo. Se elige al azar, sin permitir la intervención de ningún factor que favorezca la
elección de unos en detrimento de los otros.
5
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n1 + n2 + ... + nk =
n
4. Muestreo de conglomerado
Consiste en dividir la población en subgrupos heterogéneos representativos de la población
global cada conglomerado debe ser encarado como una mini-población.
En el muestreo por conglomerados es eficiente tener:
a. Diferencia en las unidades elementales del mismo grupo lo más grande posible.
b. Diferencia entre grupos lo mas pequeño posible.
Hay un total de 400 escuelas con 20,000 alumnos y la elección de los 2,000 a ser
estudiados podrá hacerse por cualquiera de los procedimientos anteriores.
Para el caso “Muestreo por procedimiento combinado”; una muestra estratificada por
conglomerados se obtendría escogiendo separadamente 10 colegios de cada una de las
cuatro regiones (4 x 10 x 50 = 2,000).
Para elegir los 2,000 alumnos, cualesquiera de las siguientes combinaciones serán
posibles:
6
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
F
∑f
I =I
j
Hi = i =
n n
13
(Ejm. 01 pág. 9): Frecuencia relativa acumulada de 68 es: = 0.65
20
7
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
1) f1 + f 2 + ... + f k = ∑f
i =1
i =n (Suma se frecuencia absoluta de datos).
2) h1 + h2 + ... + hk = ∑h i =1
i =1 (Suma de frecuencia relativa de datos).
8
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
XK fK Fk = n hK Hk = 1
k k
Total ∑ i =1
fi = n ∑h =1
i =1
i
Ejm. 01: Sea las alturas de los taladros (Cm.) en una obra de drenaje (cuneta) de mina:
64 73 68 68 76 70 62 67 71 69
68 60 65 68 66 68 67 71 66 72
Solución: n = 20 datos. Orden ascendentemente: 60 62 64 65 66 66 67 67 68 68
68 68 68 69 70 71 71 72 73 76
Rango de datos: R = 76 - 60 = 16
FRECUENCIA Y PORCENTAJE DE TALADROS: CUNETA SEGÚN SUS ALTURAS
Frecuencia Frecuencia f
taladros (Cm). hi = i F Porcentaje
Conteo # Taladros acumulada n Hi = i
Xi n (100 x h i )
fi Fi
60 / 1 1 0.05 0.05 5%
62 / 1 2 0.05 0.1 5%
64 / 1 3 0.05 0.15 5%
65 / 1 4 0.05 0.20 5%
66 // 2 6 0.10 0.30 10 %
67 // 2 8 0.10 0.40 10 %
68 ///// 5 13 0.25 0.65 25 %
69 / 1 14 0.05 0.70 5%
70 / 1 15 0.05 0.75 5%
71 // 2 17 0.10 0.85 10 %
72 / 1 18 0.05 0.9 5%
73 / 1 19 0.05 0.95 5%
76 / 1 20 0.05 1.00 5%
TOTAL n = 20 1 100%
9
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Rango de datos: R=
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
TOTAL
10
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm.: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30
Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59. Entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.
11
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 03: Los límites reales de los intervalos de clase de la tabla se obtendrá restando y
sumando 0.5 al límite inferior y superior, respectivamente.
TABLA: Individuos de acuerdo a su peso
Pesos en kilos fi .
[ 49.5 , 54.5 > 4
[ 54.5 , 59.5 > 8
[ 59.5 , 64.5 > 12
[ 64.5 , 69.5 > 4
[ 69.5 , 74.5 > 2
TOTAL 30
Si la unidad de medida utilizada en la recolección de datos es 0.01, para los límites reales
de clase será resta o suma de 0.005 (mitad de 0.01) a los límites aparentes.
Ejemplo, Si el intervalo de clase con límite aparente: 55.57 – 59.59, entonces el intervalo
de clase con límites reales será [ 55.565 , 59.595 >.
4. Determinación de los límites de clase.- Tomar el resultado mas bajo de los datos
originales como el límite inferior del 1er. intervalo de clase. Agregar C para obtener
el límite superior de dicha clase; R = máx {x} – mín {x} (agregar C = 1 para límite
superior de clase). Se añaden los demás intervalos.
12
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Los gráficos dan una idea mucho más sintética de los cuadros estadísticos, su finalidad es
mostrar la evolución de determinado fenómeno. En los gráficos se considerará:
1. El Título
2. El gráfico propiamente dicho
3. La notas explicativas
f(x) hi
fi
hi
Xi Ci
Fig. 1 Fig. 2
1) Diagrama de barras
Es propia de las distribuciones que tienen muchas observaciones pero pocos valores
distintos de la variable. (Fig. 1)
2) Histograma
Es una representación grafica de una distribución de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectángulos contiguos (Fig. 2) que tienen:
a) Sus bases sobre un eje horizontal “X” con centros en las marcas de clase y longitud
igual al tamaño de los intervalos de clase.
13
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Fig. 3
h’
Polígono de frecuencias
Fig. 4
1.4
3. Polígono de frecuencias.
a) Si la variable es discreta, se obtiene uniendo los dos extremos superiores de las barras
en el diagrama de barras (Fig. 3).
b) Si la variable es agrupada por intervalo de clase, el polígono de frecuencia se obtiene
uniendo los puntos medios de las bases superiores de cada rectángulo en el
histograma (Fig.4).
F Ojiva
Fi
Fig. 5
X
Xi-1 Xi Intervalos
14
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
TOTAL 360º
PARTE Xº
Solución:
Para 2007:
1.070 ________360º 200
320 1
200 ________ Xº
2
Xº = 67º 3
250 4
Para 2008: Xº = 84º 300
15
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 05: Los siguientes datos proporcionan las remuneraciones (miles de soles) de 50
obreros de mina.
73, 47, 67, 82, 67, 70, 60, 67, 61, 80,
65, 70, 57, 85, 59, 70, 57, 73, 77, 58,
69, 58, 76, 67, 52, 68, 69, 66, 72, 86,
76, 79, 77, 88, 94, 67, 77, 54, 93, 56,
73, 64, 70, 46, 68, 63, 72, 84, 63, 74.
Se pide:
1) Elaborar una tabla de frecuencias con intervalos de amplitud constante.
2) Construir Histograma y Polígono de frecuencias.
3) Polígono de frecuencia acumulada.
Solución:
Orden ascendente de datos en forma horizontal en 5 filas y 10 columnas.
46, 47, 52, 54, 56, 57, 57, 58, 58, 59,
60, 61, 63, 63, 64, 65, 66, 67, 67, 67,
67, 67, 68, 68, 69, 69, 70, 70, 70, 70,
72, 72, 73, 73, 73, 74, 76, 76, 77, 77,
77, 79, 80, 82, 84, 85, 86, 88, 93, 94.
i) Rango : R = 94 – 46, R = 48
ii) Numero de clase : K = 50 , K = 7.07, K≈8
iii) Tamaño/Amplitud de intervalo de clase: C = R/K = 48/8 = 6,
C=6
iv) Remuneraciones de 50 obreros en miles de soles.
TOTAL n = 50 1 0.0233 94
16
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
17
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
18
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
EJERCICIOS PROPUESTOS:
Ejercicio: Construir el gráfico de la siguiente distribución de frecuencias. (N° Defunciones Vs. Xi)
Tabla: Defunciones por accidente en Mina Rinconada - Puno, por causas y sexos, 2009.
Causas del accidente SEXO
TOTAL
Xi Hombres Mujeres
Accidente de transporte 1145 232 1377
Sumersión accidental 346 92 438
Caídas 242 101 347
Envenenamientos 58 43 101
Otros accidentes 653 311 964
TOTAL 2444 779 3223
19
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
CAPITULO II
SUMATORIAS
Definido mediante la notación ∑ , suma de elementos i = 1 hasta “n”.
n
∑ Xi = X + X + ... + X
i =1
1 2 n
Ejm. 06: Supóngase que se selecciona n = 5 compañías mineras del total del país. Sus
tasas de ganancias, como porcentaje de precio de venta de sus concentrados son
respectivamente: 12.2, 10.8, 10.4, 12.1, y 11.3. Represente simbólicamente estas
cantidades como: X 1 , X 2 , X 3 , X 4 , X 5 respectivamente.
Hallar:
5
a) ∑ Xi = 12.2 + 10.8 + 10.4 + 12.1 + 11.3 = 56.8
i =1
5
20
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
∑ Xi ∑ Xi
X = i =1
, µ= i =1
; Xi = X 1 , X 2 , …, X n . Valores de la variable X
n N
n = número de elementos u observaciones.
µ = Media poblacional.
N = Tamaño de la población.
Ejemplo: Hallar la media aritmética de las observaciones: 3, 4, 7, 8, 2.
n
∑ Xi 3+ 4+ 7 +8+ 2
Solución =X =
i =1
= 4.8
n 5
∑fX i i k
=X =
i =1
n
; ó X ∑h X
i =1
i i ; Xi = X 1 , X 2 , …, X k ; Valores de X ponderados
f i = f 1 , f 2 , f 3 , …, f k ; Frecuencias absolutas
k
n = ∑ fi
i =1
h i = h 1 , h 2 , h 3 , …, h k; Frec. relativas
respectivas
∑fX i i k
La media aritmética de estos datos será: X = i =1
; n = ∑ fi
n i =1
37
=
X = 3.08
12
21
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución: Los intervalos de clase son representados por sus marcas de clase.
MARCA DE CLASE
CLASES fi Xi fi Xi
[2, 4> 5 3 15
[4, 6> 10 5 50
[6, 8> 14 7 98
[ 8 , 10 > 8 9 72
[10 , 12 > 3 11 33
TOTAL 40 268
k
∑fX i i
268
Tenemos:=
X i =1
= = 6.7; Rpta. Ingreso familiar en miles de soles S/. 6,700.00
n 40
2)
3)
4)
5)
6)
22
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n1 X 1 + n2 X 2 + ... + nr X r
∑n X j J r
=XP =
n1 + n2 + ... + nr
=
=
j 1
n
; donde : n ∑n
i =1
j
∑PX i i
XP = i =1
r
; Si : P1 , P2 ,...; Pr , Pesos asociados. X : X 1 , X 2 ,..., X r , Valores de la var iable X
∑P i =1
i
Ejm. 10: Determinar la evaluación final del alumno Juan Pérez en el curso de Estadística
quién tiene: 08 en examen parcial y 12 en el final; el examen parcial tiene peso 1 y el final
peso 2.
Solución:
CALIFICACIONES PESOS
EXAMENES XiPi
Xi Pi
Parcial 08 1 08
Final 12 2 24
TOTALES 20 3 32
2
∑PX i i
32
X=
P
i =1
2
= = 10.67; La evaluación de Juan Perez es 10.67
∑ Pi
3
i =1
2.3. MEDIANA X ( )
La mediana es un valor que divide a un conjunto de observaciones ordenadas en forma
ascendente ó descendente en dos grupos de igual número de observaciones.
X = Med ( X ) mediana
23
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
X 1 X 2 X 3 X 4 X 5; → n es impar (n = 5)
El valor que ocupa el rango:
( =
n + 1) ( 5 +=1)
3=
ro. 3
2 2
Existen dos observaciones mayores que 3 y dos observaciones menores que 3 (el número
de observaciones mayores que la mediana es igual al número de observaciones menores
que ella).
Caso 2.- La variable es discreta, n es par, la mediana es el promedio aritmético de los dos
valores centrales que equidistan de los extremos.
Xn + Xn
n n +1
y +1: X = 2 2
2 2 2
Ejm.12: Considere las observaciones muestrales: 24, 37, 41, 82, 68, 63
(=
41 + 63)
=
La mediana es entre 41 y 63, el cuál es: X Med
= (X ) 2
52 .
Caso 3.- La variable es continua, el problema consiste en determinar un punto dentro del
intervalo en que está comprendida la mediana.
n
1er. Paso: Calcular , Variable continua para “n” es par ó impar.
2
n
2do. Paso: F k-1 < < Fk; F k , Frecuencia acumulada.
2
n
2 − Fk −1
X
= lmed + * Cmed ;
Fk − Fk −1
Donde:
l med = Límite inferior del intervalo de clase que contiene mediana
n = Tamaño de la muestra
C med = Amplitud de clase que contiene a la mediana.
Fk = Frecuencia acumulada de la clase q´ contiene a la mediana
F k-1 = Frecuencia acumulada de la clase inmediata anterior a la
clase que contiene a la mediana.
24
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución: Tenemos
CLASES fi Fi
[ 35 , 45 > 5 5
[ 45 , 55 > 12 17
[ 55 , 65 > 18 35 ← clase que contiene a la mediana
[ 65 , 75 > 14 49
[ 75 , 85 > 6 55
[ 55 , 95 > 3 58
TOTAL n = 58
n 58
Paso 1): = ≈ 29vo → está en la 29va. Posición.
2 2
Paso 2): Identificación de la clase q’ contiene a la mediana por la frecuencia
acumulada (F i ):
n
F k-1 < < F k
2
F 3-1 = 17 < 29 < F 3 = 35
F 2 = 17 < 29 < F 3 = 35; La clase q’ contiene a la mediana es el 3ro.
n
− Fk −1
Paso3): =X lmed + 2
* Cmed
Fk − Fk −1
29 − 17
= 55 + * 10
35 − 17
= 61.67
n
− Fk −1
2) La fórmula: =X lmed + 2 * Cmed ;
F
k − F k −1
En términos de las frecuencias relativas acumuladas será:
25
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
1
− H k −1
=X lmed + 2 * Cmed ;
H k − H k −1
Completar las propiedades de la Mediana:
3)
4)
5)
6)
7)
2.4. CUARTILES ( Qi )
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales.
0% 25% 50% 75% 100%
________________________________________________________________
Q1 Q2 Q3
Determinación de Q 1 :
1er. Paso.- Calculamos n/4
2do. Paso.- Identificación de la clase que contiene a Q1, por la siguiente
n
desigualdad: F k-1 ≤ < F k
4
3er. Paso.- Aplicamos la siguiente fórmula:
n 1
4 − Fk −1 4 − H k −1
Q1 = lQ1 + * CQ1 ó Q1 = lQ1 + * CQ1 ; en frecuencias relativas
Fk − Fk −1 H k − H k −1
Donde:
l Q1 = Límite inferior de la clase que contiene a Q 1
n = Tamaño de la muestra
C Q1 = Amplitud de clase que contiene a Q 1 .
26
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución: Tenemos
CLASES fi Fi
[ 4 , 14 > 6 6
[ 14 , 24 > 18 24 ← Clase que contiene a Q 1
[ 24 , 34 > 23 47 ← Clase que contiene a Q 2 , Q 3
[ 34 , 44 > 8 55
[ 44 , 54 > 3 58
TOTAL n = 58
Para Q 1 :
Paso 1): n/4 = 58/4 = 14.5 → está en la 14.5va. Posición.
Paso 2): Identificamos la clase q´ contienen a Q 1 por medio de frecuencia
acumulada (F i )
n
F 1 < = 14.5 < 24 = F 2 ; el intervalo de clase q’ contiene a Q 1 es [14, 24 >
4
27
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n
4 − Fk −1 14.5 − 6
Paso3): Q1 =
lQ1 + * CQ1 =
14 + * 10 =
18.72
Fk − Fk −1 24 − 6
Para Q 3 :
3n 3*58
Paso 1): = = 43.5 → está en la 43.5va. Posición.
4 4
Paso 2): Identificamos la clase q’ contienen a Q 3 por medio de frecuencia
acumulada (F i )
3n
F 2 = 24 < = 43.5 < 47 = F 3 ; el intervalo clase q’ contiene a Q 3 es
4
[24,34>
3n
4 − Fk −1 43.5 − 24
Paso 3): Q3 = lQ3 + * CQ3 = 24 + * 10 =
32.48
Fk − Fk −1 47 − 24
Para Q 2 :
El cálculo del 2do. cuartil será igual al procedimiento de la mediana, pasos de la
mediana:
1ro.- n/2; n/2 = 58/2 = 29 → está en la 29va. Posición.
2do.- F k-1 ≤ n/2 < F k
F 2 =24 < n/2=29 < F 3 =47; El intervalo de clase q’ contiene a Q 2 :
[24, 34 >
n
2 − Fk −1
3er.- Por definición de la mediana: Q= lQ2 + * CQ2
−
2
Fk Fk −1
29 − 24
= 24 + *10 = 26.17
47 − 24
2.5. DECILES (D i )
Valores que dividen a un conjunto de datos ordenados en forma ascendente ó descendente
en 10 partes iguales.
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
D1 D2 D3 D4 D5 D6 D7 D8 D9
28
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
.
.
D9 = 9no. Decil, deja 90% de las observaciones menores o iguales a él y el 10%
superiores a él.
PASOS:
i xn
1ro.) Calculamos ; i = 1, 2,...,9
10
2do.) Identificamos la clase que contiene los Di por medio de la frecuencia acumulada:
i xn
10 − Fk −1
3ro.) Se aplica: D= lDi + * CDi
Fk − Fk −1
i
Donde: l Di = Límite inferior de la clase que contiene a D i, i = 1, 2, . . ., 9
n = Tamaño de la muestra
C Di = Amplitud de clase que contiene a D i .
F k = Frecuencia acumulada de la clase que contiene al i-ésimo decil.
F k-1 = Frecuencia acumulada de la clase inmediata anterior a la clase que contiene
a D i.
2.6. PERCENTILES (P i )
Son valores que dividen la muestra ordenada en forma ascendente ó descendente en 100
partes iguales.
P1 P2 P 50 P 98 P 99
Cálculo de percentiles:
ixn
1ro.) Calculamos ; i = 1, 2, ..., 98, 99.
100
29
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
i xn
100 − Fk −1
3ro.) Se aplica: P= lPi + * CPi
−
i
kF Fk −1
Donde: l Pi = Límite inferior de la clase que contiene a P i, i = 1, 2, 3, . . ., 99
n = Tamaño de la muestra
C Pi = Amplitud de clase que contiene a P i .
F k = Frecuencia acumulada de la clase que contiene a Pi.
F k-1 = Frecuencia acumulada de la clase inmediata anterior a la clase
que contiene a P i.
Solución:
Cálculo de D 4 : Cálculo de P 72 :
i x n 4 x 110 i x n 72 x 110
1er. Paso.- = = 44 = = 79.2
10 10 100 100
Para P 72:
30
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
72 n
100 − Fk −1 79.2 − 58
P72 = lP72 + * CP72 = 70 + *10 = 70 + 5.3 = 75.3
Fk − Fk −1 98 − 58
Rpta. D 4 : El valor 65.33 divide la muestra en dos partes: una con 40% de los elementos y
la otra con 60% de elementos.
P 72 : El valor 75.3 indica que 72% de la distribución está debajo de él y 28% superior a él.
(
2.7. La Moda X = Mo )
Es un valor de la variable que tiene la más alta frecuencia, el valor más frecuente de la
distribución. La moda no siempre existe y no siempre es única. Se tiene:
i) La distribución que tiene una sola moda: “unimodal”
ii) La distribución que tiene dos modas: “bimodal”
iii) La distribución que tiene más de dos modas: “multimodal”
Solución: 63 y 71 ocurren 3 veces, y el resto una vez. La moda de estas muestras es:
X = 63 grs. y X = 71 grs. (distribución bimodal)
Ejemplo: Considere los pesos (Kgr) de Slurrex en 9 taladros de una “X” mina.
82, 65, 59, 74, 60, 67, 71, 73, 70
Solución: No definen una moda.
31
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
[0, 1> 3
[1, 2> 10
[2, 3> 17
[3, 4> 8
[ 4,5> 5
TOTAL n = 43
Solución:
1ro) Intervalo de Clase de mayor frecuencia absoluta (17), es [ 2, 3 >
2do) Por Czuber:
∆1
=
X M= lMo + * CMo , Δ 1 = 17 – 10 = 7; Δ 2 = 17 – 8 = 9;
∆1 + ∆ 2
0
7
= 2 + *1
7+9 C Mo = 1
= 2.44
fi
Clase
32
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
∑f 1 log10 X i
= i =1
n
7
∑ fi log10 X i
=
Anti =
log. X G Anti log. G Anti log i =1
n
Ejm. 18: Los datos en la tabla corresponden al análisis ambiental de la empresa minera
“X”, de hidroxiprolina absorbidos por un gramo de masa intestinal analizados en distintos
trabajadores:
Mgr hidroxiprolina 77.3 61.2 82.4 75.9 61 70.2 65
Número de trabajadores 3 10 15 13 8 5 2
Se pide: a) Cuantos trabajadores son analizados
b) Calcular la X G de la distribución
c) Cuál es la moda.
33
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
7
a) Número de trabajadores analizados: n = ∑ fi = 56
i =1
7
∑ fi log10 X i
b) X=G = Anti log i =1
G
n
103.850
X=G = Anti log
G = 71.53
56
c) =
X M =
o 82.4 (se identifica de la mayor frecuencia absoluta).
2.9. MEDIA ARMÓNICA. ( X H )
Sean “X 1 , X 2 , …., X K, ”; valores de la variable X, asociados a las frecuencias absolutas f 1,
f 2, ..., f k ; respectivamente. La media armónica de X es:
k
n n
X=H =
H
f 1 + f 2 + ... + f k
= k
; n = ∑ fi .
x1 x2 xk
i =1
∑fixi
i =1
Ejm. 19: Un equipo liviano de mina recorre los 10 kilómetros a razón de 30 km/h, y los 10
km, siguientes a razón de 60 km/h. Determinar la velocidad media durante todo el
recorrido.
30 + 60
Solución: Si X = = 45 km/h.
2
Pero la velocidad media es: la distancia total recorrida por el tiempo durante el proyecto.
A razón de 30 km/ h, gasta 20 minutos en 10 kilómetros iniciales, y a razón de 60 km/h,
gastó 10 minutos. Por tanto la unidad equipo liviano recorrió un total de 20 km en 20 + 10
= 30 min. ≅ 0.5 horas a velocidad media de:
20
= 40 km/h
0.5
n n
ie) Media Armónica entre dos velocidades: X = H= = k
f 1 + f 2 + ... + f k
H
x1 x2 xk ∑fi i =1 xi
2 2 120
=
XH = =
(1/ 30) + (1/ 60) (3 / 60) 3
= 40 km / h
34
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
∑ ∑
2
f X
i i fi X i2
f1 X 1 + f 2 X 2 + ...=
+ fk X k
= = = i 1 =i 1
k
XC
n n n ;n= ∑f
i =1
1
Observación.- la relación entre las medias es: H ≤ G ≤ X
Ejm. 20: En una distribución de frecuencias se multiplican los valores de la variable por 3
y se obtiene una media aritmética de 54; sí se suma 5 a los valores de la variable, se
obtiene una media cuadrática de 24. Calcule la media cuadrática de la variable original.
∑ ∑
2
fi X i fi X i2
f1 X 1 + f 2 X 2 + ...=
+ fk X k
=XC = = i 1 =i 1
n n n
i) 3xi = yi → =
Y 3= X 54
54
X =
3
X = 18
ii) Sí: xi + 5 = Zi
k
∑ fi Z i2
→ Z C = Media cuadrática original= Z C = i =1
n
k
∑
fi Z i2
=ZC =
i =1
24
n
n
∑ fi Z i2
( ) ( 24 )
2
= =
i =1 2
ZC
n
∑ f (x + 10 xi + 25 ) ∑ ( fi xi2 + 10 fi xi + fi 25 )
n n n
∑ f ( x + 5)
2 2
( )
2 i i i i
=Z=i 1 =i 1
C = =
=i 1
= 576
n n n
∑(fx
+ 10 fi xi + fi 25 )
n
2
( )
2 i i
=ZC = 576
i =1
35
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
( Z ) =∑ n
2 f X 2
∑ fi xi ∑ fi
C
i i
+ 10 + 25 =576
n n
( )
ZC =
2 ∑f i X i2
) 576
+ 10 (18 ) + 25 (1=
n
=
ZC ( )
2 ∑ fi X i2
= 371
n
=ZC
∑f X
=
371 i i
2
n
Z C = 19.26
MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN
∑f i XI − p k
D M (p) = i =1
n
; donde n = ∑f
i =1
i
La desviación:
Respecto a la media aritmética es:
k
∑f i Xi − X k
DM ( X ) = i =1
n
; ó DM ( X ) = ∑h
i =1
i Xi − X
~ ∑f i X i − X
~ k
DM ( X ) = i =1
n
; ó DM ( X ) = ∑h i =1
i X i − X
1.
36
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
2.
Ejm. 21: La siguiente distribución muestra las notas finales en Estadística, obtenida por 50
estudiantes de la facultad de ing. de Minas de la UNA.
Intervalos [0, 2 > [2, 4 > [4, 6 > [6, 8 > [8,10> [10, 12> [12, 14> [14, 16> [16, 18> [18, 20>
N° Estud. 1 2 2 3 6 12 10 8 4 2
Hallar la desviación media con respecto a la media aritmética.
Solución:
Completando la distribución de frecuencias:
Intérvalos Marca de
fi f i xi xi − X fi xi − X
de clase clase
[ 0, 2 > 1 1 1 10.6 10.6
[ 2, 4 > 2 3 6 8.6 17.2
[ 4, 6 > 2 5 10 6.6 13.2
[ 6, 8 > 3 7 21 4.6 13.8
[ 8, 10 > 6 9 54 2.6 15.6
[10, 12 > 12 11 132 0.6 7.2
[12, 14 > 10 13 130 1.4 14.0
∑f i Xi − X
DM ( X ) = i =1
;
n
10
Se tiene: =n ∑
= f
i =1
i 50
37
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
10
∑ fi X i
580
Se tiene: X = i =1
= = 11.6
n 50
155.2
DM ( X ) = = 3.104
50
D M ( X ) = 3.104
∑ f (X i − X )2
i
hi ( X i − X )
n
Var.[ X=
] S= ∑
2
2 t =1
=
n −1 n −1
k
Donde: n = ∑f
i =1
i ; y h1 , h2 , ... , hk = frecuencias relativas.
∑ f (X i i − µ )2 k
σ2 = i =1
N
; N= ∑f
i =1
i es el tamaño de la población.
∑ fi ( Xi − X ) 2
S2 = i =1
;
n
∑ f (X i i − X )2
S2 =
+ var( x) =
+ i =1
n −1
38
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
L L
∑ (ni − 1) Si2 ∑ ni ( X i − X p ) 2
= =
La propiedad. S2 i 1 =i 1
+ ……………………… (*)
n −1 n −1
El primer y segundo término de (*) se llaman intravarianza e intervarianza respectivamente.
(Complete las propiedades propuestas)
6) .
7) .
68.27%
x
X-S X X+S
95.45%
x
X- -2S X X +2S
39
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
99.73%
1 k 1 k 2
=S2 ∑
n − 1 i =1
fi X i2 − nX 2
y S = ∑
n − 1 i =1
fiX i2 − n X
1 k 2
∑ fi X i k
=
Solución: S 2
∑ fi X i − nX ; X = n ;
n − 1 i =1
2 i =1
también n = ∑ f i
i =1
129
X = ≅ 8.1 ⇒ X 2 = 65.61
16
1
∴=
S2 (1083 − 16(65.61) )
15
= 2.216 → S = 1.49
40
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Luego: X =
Ot +
∑fd i i
=
Ot + d
n
1 k 1 k
=S ∑
n − 1 i =1
2
− X )2
fi ( X i =
n −1
∑ f (d
i =1
i i + Ot − Ot − d ) 2
1 k 1 k
=S2 ∑
n − 1 i =1
f i (=X i − X ) 2
= ∑
n − 1 i =1
fi di2 − nd 2
1 k
=S ∑
n − 1 i =1
fi di2 − nd 2
C) Tercer método abreviado.- Para calcular la varianza se siguen los siguientes pasos:
X i − Ot
Ui = ; Donde: i = 1, 2, …, k
C
O t = Origen de trabajo entre los puntos
medios de las clases.
C = Amplitud de clase
U i = Valores transformados
X i = Valores originales de la variable
1 k C2 k
=
∑ f
n −1 i 1=
i=(CU i − =
CU ) 2
∑
n −1 i 1
fi (U i − U ) 2
C2 k 2
=S ∑ 2
n − 1 i =1
f iU i
2
− n U y
( )
1 k 2
=S C ∑ i i
n − 1 i =1
f U 2
− n( )
U
Ejm. 23: Dada la distribución de frecuencias de 147 estudiantes según su edad. Calcule la
desviación estándar “S”.
41
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Edad [ 20, 30 > [ 30, 40 > [ 40, 50 > [ 50, 60 > [ 60, 70 >
N° Estudiantes 15 22 45 40 25
1er. Paso:
Sean: O t = 45 (marca de clase de intervalo que tiene la más alta frecuencia)
di = Xi – Ot,
Marca de
Intervalo fi di fi di fi di2
Clase X i
[ 20, 30 > 15 25 -20 -300 6,000
[ 30, 40 > 22 35 -10 -220 2,200
-520
[ 40, 50 > 45 45 0 0
900
[ 50, 60 > 40 55 10 400 4,000
[ 60, 70 > 25 65 20 500 10,000
TOTAL n = 147 380 22,200
2do. Paso:
Por el 2do. Método Abreviado:
S =
1 k
∑
fi di2 − n d 2 ;
∑ fi di =
d= 2.585
n − 1 i =1 n
1
S = 22, 200 − 147(2.585) 2 = 12.055
146
3er. Paso:
Por el 3er. Método Abreviado:
X − Ot
Ui = i ; C = 10
C
Marca de
Intervalo fi Ui fi Ui fiU i2
Clase X i
[ 20, 30 > 15 25 -2 -30 60
[ 30, 40 > 22 35 -1 -22 22
-52
[ 40, 50 > 45 45 0 0
90
[ 50, 60 > 40 55 1 40 40
[ 60, 70 > 25 65 2 50 100
TOTAL n = 147 38 222
42
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
S =
C
1 k
∑ f 2
− n
2
( ) ∑ fi i =
=
n − 1 i =1
i i ; 0.2585
n
1 38
2
S = 12.055
2.13. MEDIDAS DE DISPERSIÓN RELATIVA
Coeficiente de Variación ó Coeficiente de Dispersión, expresado como un porcentaje.
S
C.V . =
X
Ejm. 24: El C.V. de ingreso de 200 personas de una empresa minera es 57% al reajustar
según ley, todos los sueldos en S/. 1,100.00, éste C.V. es ahora de 50% sin embargo la
empresa fija un mínimo de S/. 7,100.00. Antes del reajuste habían 35 personas que tenían
un sueldo promedio de S/.4,000 y todos ganaban menos de S/. 6,000; con la nueva política
de la empresa, sus sueldos serán elevados a S/. 7,100. Determinar la cantidad de dinero que
necesitará mensualmente la empresa, para pago después de hacer los reajustes.
S
Solución: Datos: C.V. =
X
S
i) = 0.57 S = 0.57 X …………….. (1)
X
S
ii) = 0.50 →=
S 0.50( X + 1,100) ……… (2)
( X + 1,100)
(1) en (2):
0.57 X = 0.50 ( X + 1,100)
550
X = = 7,857.14 (salario promedio antes del reajuste).
0.07
35(4,000) + 165 X 2
7,857.14 = X p , =
200
luego:
(7857.14)(200) = 35(4000) + 165 X 2
1'571428 − 140000
X 2 =
165
43
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
X 2 = 8,675.32
DISTRIBUCIONES BIDIMENSIONALES
Total f. 1 f. 2 .… f. j .… f. e n=∑ ∑f ij
=i 1 =j 1
Donde:
f ij = Veces q´ se repite el par (x i , yj ), frec. absoluta del par (x i , y j ); ∀ i = 1, …, k; j = 1, …,
e.
e
fi. = ∑f
j =1
ij = Total de pares con primera componente x i (i = 1, …, k)
k
f. j = ∑f
i =1
ij = Total de pares con segunda componente y j (j = 1, …, e)
k e
n=∑ ∑f ij = Número total de pares observados
=i 1 =j 1
44
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Total n = ∑ fi . Total n = ∑ f. j
i =1 j =1
Ejm. 25: Analizar el comportamiento conjunto de las variables: (X) grado de instrucción;
(Y) de procedencia de los empleados del Ministerio de Energía y Minas (datos Tabla 3.2).
45
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 26: La distribución conjunta de las proporciones (frecuencias relativas) de los datos
de la tabla 3.2 con relación al total de las observaciones (n = 200) es:
TABLA 3.3
X Primaria Secundaria Superior Total
Y completa completa
Lima 20% 15% 10% 45%
Provincia 17.5% 7.5% 5% 30%
Otros 15% 7.5% 2.5% 25%
Total 52.5% 30% 17.5% 100%
40
Afirmamos: h 11 x 100 = x 100 = 20% de los empleados son de Lima con primaria
200
completa.
35
h 21 x 100 = x 100 = 17.5% de empleados son de provincias con primaria
200
completa, etc.
Porcentaje marginal = % totales de las filas y columnas de cada una de las variables X e Y.
Así: 45% son de Lima, 30% son de provincia, 25% son de otros.
Ejm. 27: La distribución de las proporciones de los datos de tabla 3.2 con relación al total
fi j
de cada columna:
f.i
x 100
Tabla 3.4: Distribución en porcentaje con relación a los totales de cada columna de las
variables X e Y de la tabla 3.2
X Primaria Secundaria Superior Total
Y completa completa
Lima 38.1% 50% 57.1% 45%
Provincia 33.3% 25% 28.6% 30%
Otros 28.6% 25% 14.3% 25%
Total 100% 100% 100% 100%
f11 40
ie): x 100 = x 100 = 38.1% de empleados con primaria completa son de Lima.
f. 1 105
f 21 35
x 100 = x 100 = 33.3% de provincias.
f. 1 105
f31 30
x 100 = x 100 = 28.6% de otros (extranjero, etc.).
f. 1 105
46
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
k e
1) La suma de frecuencia absoluta es igual al número de pares observados. ∑ ∑ f ij = n
i =1 j =1
k e
∑ fi . xi ∑
j =1
f. j y j
X = i =1
; Y =
n n
k e
∑ fi . ( xi − X ) 2 ∑
j =1
f. j ( y j − Y ) 2
S x2 = i =1
; S y2 =
n −1 n −1
k e
∑ fi . ( xi − X ) 2
∑ j =1
f. j ( y j − Y ) 2
Sx = i =1
; SY =
n −1 n −1
k e
∑∑ f i j ( xi − X )( y j − Y ) k e
S xy = Cov [ X , Y ] = =i 1 =j 1
; n=∑ ∑ fi j
n =i 1 =j 1
47
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
1 k e
S xy = Cov [ X , Y ] = ∑ ∑ f i j xi y j − X .Y
n i 1 =j 1
=
Ejm. 28: En una encuesta realizada en una población se obtuvo la siguiente información,
con relación al # de habitantes (X) y dormitorios (Y) en una muestra de 50 viviendas.
(X) (Y) (X) (Y) (X) (Y) (X) (Y)
Vivienda Habitan. Dormit. Vivienda Habitan. Dormit. Vivienda Habitan. Dormit. Vivienda Habitan. Dormit.
1 6 2 14 2 1 27 3 1 40 4 1
2 3 2 15 3 1 28 6 3 41 4 2
3 5 2 16 3 2 29 4 1 42 6 1
4 5 2 17 3 1 30 2 1 43 3 2
5 8 3 18 5 2 31 6 3 44 4 1
6 5 2 19 3 1 32 4 1 45 4 2
7 6 2 20 3 1 33 4 2 46 5 2
8 5 2 21 5 2 34 4 1 47 5 2
9 4 1 22 3 2 35 4 1 48 4 2
10 2 1 23 5 2 36 4 1 49 8 4
11 8 4 24 2 1 37 3 1 50 2 1
12 4 3 25 3 1 38 4 1
13 2 1 26 4 2 39 4 1
Se pide:
a) Construir una tabla bidimensional
b) Hallar las frecuencias marginales
c) Hallar las frecuencias acumuladas
d) Hallar medias y varianzas marginales
Solución:
a) Tabla Bidimen. frec. Absoluta y marginal. b) c) Frecuencias acumuladas
Dormit. (Y) Frecuencia Marg. Y
1 2 3 4 de “X i ” 1 2 3 4
Habit. (X) Totales (f i. ) X
2 6 6 2 6 6 6 6
3 7 4 11 3 13 17 17 17
4 10 5 1 16 4 23 32 33 33
5 9 9 5 23 41 42 42
6 1 2 2 5 6 24 44 47 47
48
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
8 1 2 3 8 24 44 48 50
Frec. Marg. de “Y j ”
total (f .J )
24 20 4 2 50 = n
d) Medias:
k e
∑ fi . xi
208
∑ j =1
f. j y j
84
=
X i =1
= = 4.16 ; =
Y = = 1.68
n 50 n 50
Varianzas Marginales:
1 k 1
=
Var X = S 2 ∑
n − 1 i =1
fi. xi2 − n( X ) 2 =
49
976 − 50(4.16) 2 =
2.26
1 e 2 1
=Var Y = S 2 ∑ f. j y j − n(Y ) = 172 − 50(1.68) 2 =
2
0.63
n − 1 j =1 49
Cuadro de desarrollo: Para aplicar las fórmulas (anterior); construir la siguiente tabla:
Y
1 2 3 4 f i. f i. X i f i. X i 2
X
2 6 6 12 24
3 7 4 11 33 99
4 10 5 1 16 64 256
5 9 9 45 225
6 1 2 2 5 30 180
8 1 2 3 24 192
f .j 24 20 4 2 50 = n Σf i. X i = 208 Σf i. X i 2 = 976
(f .j ) (Y j ) 24 40 12 8 Σf .j Y j = 84
(f .j ) (Y j 2) 24 80 36 32 Σf .j Y j 2 = 172
49
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Total k e
Frecuencia relativa de y
condicionada
a X = x i h y/x = x i f i1 f i2 .… f ij .… f ie 1
f i. f i. .… f .i.. .…
f i.
Frecuencia relativa de x
condicionada a
Y = yj
h x/y = yj f 1j f 2j .… f ij .… 1
f kj
f. j f. j f. j f.
j
Ejm. 29: En la región Puno, se observó el precio del Oro y la cantidad de producción
durante algunos años, obteniéndose la siguiente tabla.
X 35 30 40 45 48 60 50 44 54 56 42 46
y 100 150 120 200 160 200 150 200 120 150 100 120
Solución:
50
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
R 30
a) Rango de la variable X: R = 60-30 = 30; Amplitud de clase (C): C = ,=
C = 6
k 5
Tabla bidimensional.
Y
100 120 150 160 200 Total
X
[30, 36> 1 - 1 - - 2
[36, 42> - 1 - - - 1
[42, 48> 1 1 - - 2 4
[48, 54> - - 1 1 - 2
[54, 60> - 1 1 - 1 3
Total 2 3 3 1 3 n = 12
b) Distribuciones Marginales de X e Y:
X f i. Y f .j
[30, 36> 2 100 2
[36, 42> 1 120 3
[42, 48> 4 150 3
[48, 54> 2 160 1
[54, 60> 3 200 3
Total 12 Total 12
c) Dist. de X condicionada a; y = 150 es:
Intervalo
[30, 36> [36, 42> [42, 48> [48, 54> [54, 60> Total
para X
1 0 0 1 1 3
f x/y = 150
h x/y = 150 1/3 0 0 1/3 1/3 1
51
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
. f i1 f i2 .… f ij .… f ie .
xk . . . . . . f k.
. . . . . .
f k1 f k2 .… f kj .…
f ke
Total
f. 1 f. 2 .…
e
f. j .… f. n= ∑ ∑f ij
K x e se verifica la igualdad:
f i . x f. j
fi j = (para i = 1, …, k y j = 1, …, e)
n
Caso contrario, las variables X e Y son dependientes ó están asociadas.
Ejm. 30: Verificar si existe o no dependencia entre el sexo y carrera profesional escogida
por 400 alumnos de economía y administración de la UNA, los datos en la siguiente tabla:
Tabla 3.9: Distribución conjunta de los alumnos según el sexo (Y) y carrera (X)
Y
Masculino Femenino Total
X
Economía f 11 = 169 f 12 = 71 f 1. = 240
Administración f 21 = 111 f 22 = 49 f 2. = 160
Total f .1 = 280 f .2 = 120 400 = n
f1 . x f. 1 (240)(280)
Solución: f 11 = = = 168 ≠ a f11 = 169
n 400
f1 . x f. 2 (240)(120)
f 12 = = = 72 ≠ 71 = f12
n 400
f 2 . x f. 1 (160(280)
f 21 = = = 112 ≠ 111 = f 21
n 400
f 2 . x f. 2 (160)(120)
f 22 = = = 48 ≠ 49 = f 22
n 400
Por tanto: Según los resultados no hay dependencia entre las dos variables.
52
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
yi (x i yi )
X
xi
Ejm. 31: Se tiene 5 agentes de una compañía “X” números de clientes (Y), números de
años de servicio (X), según la tabla. Trazar el diagrama de dispersión de estos datos.
Agente Años de servicio (X) Número clientes (Y)
A 4 58
B 6 66
C 7 74
D 8 70
E 10 82
Total 35 350
90
80
Nº cleintes
70
60
50
0 1 2 3 4 5 6 7 8 9 10
Años de servicio
Ejm. 32: Ocho individuos fueron sometidos a una prueba sobre el conocimiento de un
idioma extranjero tomándose el tiempo para cada uno de ellos en aprender a operar una
máquina. Así las variables en estudio son:
X: resultado obtenido en la prueba (máximo, 100 puntos)
Y: tiempo en minutos necesarios para aprender a operar satisfactoriamente una máquina.
Trazar el diagrama de dispersión con los siguientes datos:
53
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Indiv. X Y
50 353
2 57 378
3 66 365
4 75 344
5 79 347
6 81 391
7 85 355
8 95 358
400
390
380
370
360
350
340
. 50 60 70 80 90 100
Se observa que no hay ningún tipo de dependencia entre las dos variables
3.5.1 CORRELACIÓN
Determina el grado de reracionamiento entre las variables que se estudian.
1) Correlación directa o positiva: Las variables x e y, varían en un mismo sentido.
2) Correlación inversa o negativa: Las variables x e y, son en sentidos contrarios.
y y y
0 x 0 x 0 x
Las 3.5.2
variablesCOEFICIENT
x, y presentan Dependencia lineal Las variables no presentan
una asociación lineal positiva. negativa correlación
54
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Corr [ x, y ] = r = Sxy =
∑ f ( x − X )( y − Y )
i =1
i i i
,
SxSy k k
=i 1 =i 1
∑ ( f i ( xi − X ) 2 ) ∑ f i ( yi − Y ) 2
∑ fi xi yi − n X Y
r = i =1
, ó
k k
2
i 1
=i 1 =i 1
2
∑ f x − nX ∑ f i y − nY2
i
2
n ∑ fi xi yi − ( ∑ fi xi )( ∑ fi yi )
k
r = i =1
,,
2 2
∑ i 1 ( ∑ i i ) ∑ fi yi − ( ∑ fi yi )
k
n f x 2
− f x n 2
i =1
-1 0 1
correlación no hay correlación
perfecta (-) correlación perfecta (+)
COEFICIENTE DE CORRELACION:
Ejm. 32: La tabla presenta la información obtenida sobre 20 estudiantes, a cada uno de ellos se les tomó su peso y altura
Peso (Kgr.)
Xi 20.4 21.4 21.4 22 22.6 24.6 24.8 25.2 25.8 26 26.6 26.6 27.2 27.2 27.8 28 28 31.6 33.4
Altura (cm)
Yi 111 111 114 118 119 121 123 124 122 122 121 127 124 131 128 116 120 133 140
fi 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Se pide:
a) Representar la información en un diagrama de dispersión.
b) Hallar el coeficiente de correlación entre X e Y.
Solución: a) Diagrama de dispersión de los datos: Altura Vs Peso
55
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
128
126
124
122
120
118
116
114
112
110
108
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
Peso Kg.
n ∑ fi xi yi − ( ∑ fi xi )( ∑ fi yi )
k
k 2 2
∑ i 1 ∑ i i ∑ fi yi − ( ∑ fi yi )
( )
k
n f x 2
− f x n 2
= i 1= i 1
Kgr. Altura Cm. fi fi Xi fi yi fi Xi fi yi fi Xi yi
Xi Yi
20.4 111 2 40.8 222 832.32 24642 4528.8
21.4 111 1 21.4 111 457.96 12321 2375.4
21.4 114 1 21.4 114 457.96 12996 2439.6
22.0 118 1 22.0 118 484.00 13924 2596.0
22.6 119 1 22.6 119 510.76 14161 2689.4
24.6 121 1 24.6 121 605.16 14641 2976.6
24.8 123 1 24.8 123 615.04 15129 3050.4
25.2 124 1 25.2 124 635.04 15376 3124.8
25.8 122 1 25.8 122 665.64 14884 3147.6
26.0 122 1 26.0 122 676.00 14884 3172.0
26.6 121 1 26.6 121 707.56 14641 3218.6
26.6 127 1 26.6 127 707.56 16129 3378.2
27.2 124 1 27.2 124 739.84 15376 3372.8
27.2 131 1 27.2 131 739.84 17161 3563.2
27.8 128 1 27.8 128 772.84 16384 3558.4
28.0 116 1 28.0 116 784.00 13456 3248.0
28.0 120 1 28.0 120 784.00 14400 3360.0
31.6 133 1 31.6 133 998.56 17689 4202.8
33.4 140 1 33.4 140 1115.56 19600 4676.0
Total 2325 20 511 2436 13289.64 297794 62678.6
20*(62678.6) − (511)(2436) 8776
=r = = 0.87
{20(13289.64) − (511) }{20(297794) − (2436) } 10086.136
2 2
3.5.3 REGRESION
Regresión es un método empleado para encontrar una función que se ajusta a una nube de
puntos (dispersión) para obtener una predicción aprox. De una variable apartir de la otra.
56
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ŷ = f(x)
ŷ= α + β x
y = a0 + a2x
Ajuste por mínimos cuadrados de una línea recta
57
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
n n
Sr = Sr = ∑ ei2 ⇔ Sr = ∑ ( yi − a0 − a1 x) 2 ….. (*)
i =1 i =1
Para determinar los valores de a 0 y a 1 la ecuación (*) es diferenciada con respecto a cada
coeficiente.
∂Sr d n
I. i) = ∑
∂a0 ∂a0 i =1
( yi − a0 − a1 x) 2
∂Sr d n
ii) = ∑
∂a1 ∂a1 i =1
( yi − a0 − a1 x) 2
∂Sr
II. =0⇔
∂a0
∂Sr
=0⇔
∂a1
n n
III. na0 + (∑ xi )a1 = ∑ yi
i =1 i =1
n
(∑ xi )a0 + (∑ xi2 )a1 + ∑ xi yi
i =1
n∑ xi yi − ∑ xi .∑ yi
a1 =
n∑ xi2 − (∑ xi ) 2
a1 = y − a1 x
Ejm. 34.- En una encuesta efectuada en una población se obtuvo la siguiente información,
relativo al número de habitantes (X) y número de dormitorios (Y) en una muestra de 50
viviendas. Los datos en la tabla: Número de habitantes (X) que viven en las casas con
número de dormitorios (Y).
58
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
6 1 1
3 2 4
4 2 5
5 2 9
6 2 2
4 3 1
6 3 2
8 3 1
8 4 2
a) Hallar el coeficiente de correlación entre X e Y
b) Hallar la recta de regresión mínima cuadrática Y en X.
Total
∑ fi X iYi − nXY
S xy
β =
ˆ i =1
k
= ; Y − βˆ X ............. ( ∗)
αˆ =
S x2
∑ fi X i − nX
i =1
2 2
59
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Luego en (*) =
: αˆ 1.68 − ( 0.393)( 4.16 )
αˆ = 0.045
∴ La ecuación de la recta de regresión es : Yˆ =
0.045 + 0.393 X
Ejm. 35.- Se han estudiado las calificaciones de 200 alumnos en dos asignaturas:
=
Matemática I y Estadística, obteniéndose los siguientes resultados: =
X 13; Y 15
∑ f (X − X )
2
= = S y2 = 2.25
2 i i
S 4
n −1
X
Solución:
∑ f (X − X )
2
=Sí , S X2 =
i i
4 Sí , S y2 = 2.25
n −1
⇒ S=
y 2.25= 1.5
⇒ Sx = 4= 2
60
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
b) Como r = 0.90 podemos decir que al aumentar las notas en matemática I (X);
aumentan también las notas en probabilidad y estadística (Y). Por consiguiente los
alumnos con mayor nota en matemática I, son los mismos que obtienen mayor
calificación en probabilidades y estadística.
Xˆ − =
X
S XY
S y2
(y − Y )
2.7
Se tiene : Xˆ −=
13 ( y − 15)
2.25
Xˆ = 1.2 y − 5
CAPÍTULO IV
61
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
ANALISIS COMBINATORIO
4.1. INTRODUCCION
Nociones básicas de la teoría matemática que estudia las diferentes técnicas de
conteo, conocido como análisis combinatorio.
aj
………………..
am
Ejm. 36.- Un conductor de un automóvil puede tomar cualquiera de las 5 rutas para ir de la
ciudad A a la ciudad B; y para ir de la ciudad B a la ciudad C puede tomar cualquiera de
las 4 rutas y finalmente para ir de la ciudad C a la ciudad D tiene 6 rutas posibles. Si para ir
desde A a D debe ir de A a B, de B a C y de C a D, ¿Cuántas rutas posibles tiene para ir
de A a D?
Solución: Sean: n1 = número de rutas de A a B = 5
n2 = número de rutas de B a C = 4
n3 = número de rutas de C a D = 6
El número total de maneras en que se puede construir una ruta completa, escogiendo una
ruta de A a B, otra de B a C y la última de C a D es :
n = n 1 . n 2 . n 3 = (5) (4) (6) = 120
62
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
4.3. ARREGLOS
Ejm. 37.- ¿De cuantas maneras diferentes se pueden sentar 8 personas en una banca, con
capacidad para 5 personas?.
Solución: Se tiene n = 8 y k = 5, el número total de maneras diferentes que pueden
sentarse 8 personas en la banca, con capacidad para 5 personas es:
8! 8!
A58 = = =8 ( 8 − 1)( 8 − 2 )( 8 − 3)( 8 − 4 )
(8 − 5)! 3!
= 8 ( 7 )( 6 )( 5 )( 4 )
= 6720
4.3.2 Arreglos con Repetición
Son aquellos arreglos en que un elemento cualquiera de los dados, puede repetirse
en el mismo grupo, el número de veces que se indique.
El número de todos los arreglos con repetición a formarse con n objetos tomados de k en k
es obtenido por la fórmula.
( AR )k = nk
n
Ejm. 38.- Un ómnibus parte de su paradero inicial con 6 personas a bordo y se detiene en
10 paraderos diferentes. ¿De cuántas maneras pueden bajar las 6 personas en los 10
paraderos, sí en un paradero pueden bajar cualquier número de personas?
Solución: La 1ra. Persona puede bajar en cualquiera de los 10 paraderos.
La 2da., 3ra. Lo mismo y la 6ta. De igual forma, entonces el número total de
maneras es:
( AR=
)6 =
10 6
10 1'000, 000
4.4. PERMUTACIONES
63
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Solución:
a) Sí un miembro puede sentarse en cualquier parte al rededor de la mesa, entonces
los 11 miembros restantes, pueden sentarse de P 11 = 11! Maneras
Pnc = 11!
= 11(11 − 1)(11 − 2 )(11 − 3)(11 − 4 )(11 − 5 )(11 − 6 )(11 − 7 )(11 − 8 )(11 − 9 )(11 − 10 )
= 39 '916,800
b) Considerando las dos personas que han de ir juntas como una sola. Entonces hay 11
personas para sentarse en círculo, que le pueden hacer de 10! Maneras. Las dos
personas consideradas como una sola pueden a su vez ordenarse entre sí de 2!
Maneras. Por tanto, el número de ordenaciones de 12 miembros del consejo de
facultad alrededor de una mesa circular con 2 miembros determinados sentados
juntos es:
(10!)(2!) = 3’628,800
64
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 41: ¿De cuántas maneras diferentes se pueden ordenar 3 bolas blancas, 4 rojas y 4
negras en una fila, si las bolas de igual color no se distinguen entre sí?
4.5. COMBINACIONES
C=
n
K (=) n
k
n!
k !( n − k ) !
( n − 1)! k !
Ejm. 42: Una estación total de topografía se puede adquirir en 7 fábricas ¿de cuántas
maneras se puede escoger 4 de las siete fábricas?.
7! 7!
=C47 =
4!( 7 − 4 ) ! 4!*3!
5, 040
= = 35
( 24 )( 6 )
65
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
ii) Las reglas de los arreglos y permutaciones puede ser aplicable si los objetos se
toman de un solo conjunto y de cada reordenamiento diferente de los k objetos
de un grupo conduce a un suceso simple diferente.
iii) La regla de las combinaciones puede ser aplicable si los objetos se toman de un
solo conjunto y el reordenamiento de los objetos no produce un nuevo suceso
simple.
66
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
CAPITULO V
PROBABILIDADES
5.1. EXPERIMENTO
Un experimento es toda acción sobre la cuál vamos a realizar una medición u
observación, es decir cualquier proceso que genera un resultado definido.
67
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
5.4. EVENTO
Es todo subconjunto de un espacio muestral.
Los eventos se denotan con letras mayúsculas: A, B, etc.
En particular S y Φ (conjunto vacio) son eventos. Al espacio muestral S se le llama evento
seguro y a Φ evento imposible.
5.5.3 Combinación
Es una selección de objetos si el orden no es importante, cada uno de los resultados
se denominan combinación. Por ejemplo sea el conjunto de elementos Z = {A, B, C}, las
combinaciones de 2 elementos que se pueden seleccionar son: AB, AC, BC.
El número de combinaciones de n objetos tomados de k en k es igual a:
n!
Ckn =
k !( n − k ) !
Ejm. 43: Un inversionista desea seleccionar tres inversiones de total 10 inversiones. ¿De
cuántas maneras diferentes puede invertir el inversionista?.
5.5.4 Permutación
El número de permutaciones de n objetos tomados de k en k es igual a:
n!
Pkn =
( n − k )!
Ejm. 44: Un inversionista tiene la intención de invertir $ 5000 en un proyecto, $ 10000 en
segundo proyecto y $ 20,000 en un tercer proyecto. Sí existen en total 10 posibilidades de
inversión. ¿De cuántas maneras diferentes puede invertir el inversionista?.
Solución: n = 10 y k = 3, por lo que el número de inversiones que puede realizar el
inversionista:
10!
=P310 = 720 maneras.
(10 − 3)!
68
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 47: Sea el espacio muestral S = {CC, CS, SC, SS}. Se lanzan dos monedas al aire
¿Cuál es la probabilidad de que salga 1 cara?.
69
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Ejm. 48: Se tiene información acerca de los ingresos mensuales por venta de concentrado
de Oro en la minera Picos blancos en los últimos 30 meses:
Las probabilidades en este caso se asignan mediante las frecuencias relativas.
Ingresos Frecuencia Probabilidad
5000 4 4/30 = 0.1333
6000 7 7/30 = 0.2333
7000 10 10/30 = 0.333
8000 6 6/30 = 0.2
9000 3 3/30 = 0.1
Total 30 1
Ejm. 49: Cierta familia tiene 3 hijos, y sabemos que al menos dos de ellos son niñas.
Suponiendo que los nacientes de niños y niñas son igualmente probables, además que el
sexo del hijo mayor no afecta en ningún modo al sexo del hijo menor, calcule la
probabilidad de que la familia tenga tres niñas.
Solución:
El espacio muestral, S = { MMM, MMH, MHM, HMM, MHH, HMH, HHM, HHH }
Donde: M = mujer y H = hombre
Sean los eventos A: la familia tiene 3 niñas B: la familia tiene por lo menos dos niñas
70
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Es decir: P( B) = ∑ P( A ) P( B / A )
i =1
i i
• f ( x) > 0
• ∑ f ( x) =
1
71
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
El espacio muestral asociado a este experimento es: S = { ccc, ccs, csc, scc, css, scs, ssc, sss }
La probabilidad de cada punto muestral es 1/8, es decir P(ccc) = P(ccs) = … = P(sss) = 1/8
Definimos la v.a. X: número de caras, que puede tomar los valores Rx = {0, 1, 2, 3}
X Eventos f(x)
0 { sss } 1/8
1 { css, scs, ssc } 3/8
2 { ccs, csc, scc } 3/8
3 { ccc } 1/8
X f(x) F(x)
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 8/8
5.12.5 Valor esperado o esperanza matemática de una función de una variable aleatoria
Sea X variable con función probabilidad f(x), y sea Y = g(X) una función real de la
variable X; esperanza matemática de g(X) se define:
= ( g ( X ) )
E (Y ) E= ∑ g(x ) f (x ) i i
x∈Rx
72
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
Una variable aleatoria continua es aquella variable cuyos valores pueden ser cualquier
número real dentro de un intervalo cualquiera.
Función de densidad
Una función se dice que es de densidad si cumple las dos propiedades siguientes:
f ( x) ≥ 0
+∞
∫ f ( x ) dx = 1
−∞
P [ a ≤ x ≤ b ] =∫ f ( x ) dx
b
La probabilidad entre dos valores dados a y b, es el área bajo la curva entre los puntos a y
b.
y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto
o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad
nula:
P [ a ≤ x ≤ b=
] P [ a < x ≤ b=] P [ A ≤ x < b=] P [ a < x < b]
73
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
F: IR → [0, 1]
∞
x → F ( x )= P [ X ≤ x ]= ∫ f ( t ) dt
−∞
74
TEXTO UNIVERSITARIO F.I.M.-UNA Estadística aplicado a la minería
BIBLIOGRAFIA
75