Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROFESOR TITULAR
(PRIMERA PARTE)
Dado que el objetivo perseguido en la elaboración de las presentes
NOTAS de PROBABILIDAD Y ESTADÍSTICA, para alumnos de las
distintas Carreras que se dictan en esta FRC – UTN, no es la formación
de estadísticos, se omiten en los distintos temas, desarrollos
matemáticos de la Estadística Matemática, que el alumno olvida
fácilmente, y que en nada contribuyen, para lograr un aprendizaje
significativo de la materia.
2
UNIDAD Nº I
“METODOLOGÍA ESTADÍSTICA”
SIGNIFICADO DE ESTADÍSTICA
Podemos decir que la ESTADÍSTICA, está dada por “El conjunto de métodos y
procedimientos, utilizados en la recopilación, organización, presentación, análisis e
interpretación de datos, para extraer conclusiones y tomar decisiones razonables en base a
las mismas, en situaciones de incertidumbre”. También se dice, que es: “La tecnología del
método científico que proporciona instrumentos útiles para la toma de decisiones, en
situaciones de incertidumbre”.
Se la clasifica en:
POBLACIÓN ESTADÍSTICA
Está formada por la totalidad de los elementos, acerca de los cuales se realiza una
cierta investigación estadística. Por ejemplo: el total de empresas de una cierta rama de
actividad, o el agua contenida en un cierto dique.
Se la clasifica en:
3
DATO ESTADÍSTICO
Es toda información susceptible se ser sometida al análisis estadístico. Es decir, que
debe poder ser comparada, analizada e interpretada, razón por la cual se dice que los datos
estadísticos, presentan relaciones significativas. De lo expuesto, se deduce que un valor
aislado, no constituye dato estadístico.
RECOPILACIÓN DE DATOS
Los datos estadísticos, pueden ser generados por el investigador mismo, o bien
haber sido recopilados por un tercero. En el primer caso, se dice que la FUENTE DE
DATOS es PRIMARIA, mientras que en el segundo caso, se dice que es SECUNDARIA.
4
4) DISEÑO DE EXPERIMENTO: es el proceso que se presenta cuando el
investigador genera sus propios datos, diseñando un experimento, a la medida de
sus necesidades. Por ejemplo, probar la eficiencia de determinadas drogas para
tratar una determinada enfermedad.
Primaria
Según la Fuente
Secundaria
Recopilación de datos
Censo
Diseño de experimento
Cabe destacar que, existen situaciones en las que ambas unidades coinciden. Así
por ejemplo, si queremos saber las edades de los alumnos de este curso y le consultamos a
cada uno de los alumnos su edad, son coincidentes, mientras que si se obtiene el dato de los
legajos de los alumnos, no son coincidentes.
Observacionales.
Experimentales.
5
Se dice que se realizan estudios observacionales cuando los datos se generan a partir
de un censo, muestra o registro exhaustivo, y consisten en medir u observar las unidades
elementales de una cierta población midiendo, observando y registrando las características
bajo estudio.
Según la intervención
del investigador
Experimentales
Estudios estadísticos
Exploratorios
Según el objetivo
del estudio
Confirmatorios
6
VARIABLES
7
De acuerdo a la forma de medición las variables Cuantitativas pueden ser
clasificadas en escalas dadas por:
a) Escala de Intervalos: representa un nivel superior
de medición respecto a la escala ordinal,
permitiendo establecer relaciones del tipo A > B, A
= B, o A < B. De la misma forma, es posible
comparar intervalos de valores como consecuencia
de que, a lo largo de toda la escala, dos valores
adyacentes representan siempre la misma diferencia
de magnitud, siendo posible realizar comparaciones
tal como, A > B. Una característica de esta escala,
es que el valor cero es arbitrario. Un ejemplo de
una variable en esta escala de medición, puede
estar dado por el horario de ingreso de los
empleados a su trabajo en una fábrica. Entre las 8 y
las 9 de la mañana existe la misma diferencia
horaria que entre las 4 y 5 de la tarde, pero no es
posible afirmar que quien ingresó a las 8 de la
noche, ha ingresado el doble de tarde, de aquel
que ingresó a las 8 de la mañana. Cabe destacar
que, la hora cero no indica particularmente nada.
Cualitativas
Continuas
Medición
8
Nominal
Cualitativas
Ordinal
Escalas de medición de las VARIABLES
Intervalo
Cuantitativas
Cualitativas
Razón
Univariados
Multivariados
PARÁMETROS Y ESTADÍGRAFOS
9
UNIDAD Nº II
“ORGANIZACIÓN Y PRESENTACIÓN
DE DATOS ESTADÍSTICOS”
DISTRIBUCIONES UNIDIMENSIONALES
Cuando de las unidades estadísticas de una población bajo estudio, se considera
una sola variable, se dice que se está en presencia de una investigación unidimensional. Si
son dos las variables, bidimensional, y así sucesivamente.
SERIE SIMPLE
Se denomina de esta forma, al conjunto de datos obtenidos en bruto, luego de
realizado el relevamiento pertinente. En forma genérica, se denota con xi a cada
observación, variando el subíndice i desde 1 hasta n, siendo n el total de observaciones.
En consecuencia, simbólicamente una Serie Simple de n elementos, en una investigación
unidimensional, adoptará la forma:
x1 , x2 , x3 , …….., xn xi / i = 1 , n
x1=3; x2=2; x3=3 ; x4=2; x5=1; x6=0; x7=5; x8=2; x9=3; x10=3; x11=1; x12=0; x13=1; x14=3
DISTRIBUCIONES DE FRECUENCIAS
(Datos agrupados)
Pueden presentarse dos situaciones:
1) Variable Discreta
2) Variable Continua
10
DISTRIBUCIÓN DE FRECUENCIA DE
VARIABLE DISCRETA
Si los datos de una serie simple se corresponden con una variable discreta, y sus
valores son homogéneos, pueden agruparse los que son iguales, definiendo una nueva
variable, que la denotaremos con yi , variando el subíndice i, desde 1 hasta k, siendo k el
número de valores distintos de la variable observados en la serie simple. Con los valores
de la nueva variable, y el número de veces que ese valor aparece repetido, en la serie
simple, denominada frecuencia absoluta, que la denotaremos con ni, se construye una
tabla, denominada Distribución de Frecuencia o Datos Agrupados de Variable Discreta.
Absoluta Relativa
0 2 0,15 2 0,15
1 3 0,21 5 0,36
2 3 0,21 8 0,57
3 5 0,36 13 0,93
5 1 0,07 14 1,00
14 1,00
b) ni = n, (Nº de observaciones).
Frecuencias relativas
Se las denota con hi, y se obtienen del cociente entre las frecuencias absolutas
asociadas a cada valor de la variable, y el total de observaciones. Es decir:
hi = ni / n
11
Las frecuencias relativas, indican la importancia relativa, de cada valor de la
variable en relación al total de observaciones, pudiéndoselas interpretar en términos
porcentuales. Verifican las siguientes propiedades:
b) hi = 1
Frecuencias Acumuladas
Son representativas del total acumulado de frecuencias absolutas o relativas, hasta
un determinado valor de la variable. Se las denota con Ni , a las absolutas acumuladas, y
con Hi , a las relativas acumuladas.
Nk = n (Total de observaciones)
Hk = 1
yi ni hi Ni Hi
y1 n1 h1 N1 H1
y2 n2 h2 N2 H2
. . . . .
. . . . .
. . . . .
yk nk hk Nk Hk
n 1
12
Representación gráfica de una Distribución de Frecuencias de Variable
Discreta
a) Frecuencias Simples ( ni y hi )
b) Frecuencias Acumuladas ( Ni y Hi )
hi = ni / n hi = ni . 1/n
5 5/14 hi
Nº de Empleados 4 4/14
ni 3 3/14
2 2/14
1 1/14
0 1 2 3 5
Nº de hijos
13
b) Frecuencias Absolutas y Relativas Acumuladas ( Ni y Hi )
Nº de empleados
14 1
Ni Hi
12 12/14
10 10/14
8 8/14
6 6/14
4 4/14
2 2/14
0 1 2 3 5
Nº de hijos
Los intervalos de clase, no necesitan ser del mismo tamaño, pero para facilitar la
interpretación de la representación gráfica de la distribución de frecuencia, así como para
el cálculo de las distintas medidas estadísticas, es conveniente que sean del mismo tamaño.
14
Cabe destacar que los intervalos se consideran “semiabiertos por la derecha”, es
decir “desde el extremo izquierdo……hasta menos el extremo derecho”, con excepción
del último intervalo, que es “cerrado” en ambos extremos, es decir “desde…….hasta”.
R = 93 – 43 = 50
ci = y´i - y´i–1
Amplitud = 50/5 = 10
Nº de intervalos = 50/10 = 5
Ejemplo:
Se clasificó al personal de una empresa de acuerdo a sus edades, obteniéndose la
siguiente Distribución de Frecuencia de Variable Continua:
18 26 20 0,10 20 0,10 22
26 34 30 0,15 50 0,25 30
34 42 40 0,20 90 0,45 38
42 50 50 0,25 140 0,70 46
50 58 40 0,20 180 0,90 54
58 66 20 0,10 200 1,00 62
200 1,00
16
La “marca de clase” (yi ) está dada por el punto medio de cada intervalo de clase y se
calcula a los efectos de determinar un valor representativo de la variable de cada intervalo
de clase, para obtener las distintas medidas estadísticas. Su valor surge del cociente:
y´i - 1 y´i
yi
2
Inter. de clase Marca de clase Frec. Abs. Frec. Rel. Frec.Abs.Ac. Frec.Rel.Ac.
y´i–1 y´i yi ni hi Ni Hi
y´0 y´1 y1 n1 h1 N1 H1
y´1 y´2 y2 n2 h2 N2 H2
y´k-1 y´k yk nk hk Nk Hk
n 1
17
La representación gráfica de las frecuencias absolutas y relativas simples, da lugar
al denominado “Histograma de Frecuencias”, que adopta la forma, considerando los datos
del problema dado:
Poligonal
60 60/200
ni hi
40 40/200
20 20/200
0 0
18 26 34 42 50 58 66
Intervalos de clase
Uniendo los puntos medios de cada rectángulo del Histograma, que se corresponden
con los valores de las marcas de clase de cada intervalo, queda determinada la
“Poligonal de frecuencias absolutas o relativas Simples”, la que sirve para caracterizar
gráficamente a una distribución de frecuencias de variable continua, siendo el área entre la
poligonal, y el eje de las abscisas, igual a la suma de las superficies de los rectángulos del
histograma, que da lugar a la “densidad de frecuencias”. Cabe destacar que anteriormente,
se planteó la conveniencia de que la amplitud de los intervalos de clase sea la misma, para
facilitar la interpretación gráfica de una distribución de frecuencias.
18
210 210/200
Poligonal 200/200
180 180/200
Ni Hi
150 150/200
120 120/200
90 90/200
60 60/200
35
30 30/200
0 0
18 26 30 34 42 50 58 66
Intervalos de clase
Ejemplo:
Los siguientes valores se corresponden con las calificaciones obtenidas por 35
aspirantes a un puesto de trabajo:
19
86 77 91 60 55
76 92 47 88 67
23 59 72 75 83
77 68 82 97 89
81 75 74 39 67
79 83 70 78 91
68 49 56 94 81
Solución:
Tallo Hoja
2 3
3 9
4 7 9
5 5 6 9
6 0 7 7 8 8
7 0 2 4 5 5 6 7 7 8 9
8 1 1 2 3 3 6 8 9
9 1 1 2 4 7
Como se observa, podemos decir que un Diagrama de Tallos y Hojas presenta las
siguientes ventajas:
20
UNIDAD Nº III
“PARÁMETROS Y ESTADÍSTICOS”
CONSIDERACIONES
En las unidades anteriores, se desarrollaron conceptos básicos de Estadística, así
como distintas formas de presentar en forma organizada y resumida, los datos relevados
en una investigación estadística.
1) Medidas de Posición.
2) Medidas de Dispersión.
3) Medidas de Forma, Asimetría o Sesgo.
4) Medidas de Puntiagudez o Curtosis.
1) MEDIDAS DE POSICIÓN
Son medidas descriptivas de resumen, representativas del valor de la variable, en
torno a la cual se concentran las observaciones. Así por ejemplo, si se tiene a las
distribuciones A y B:
A B
XA XB
21
Se observa que ambas tienen la misma forma, concentrándose los datos en torno al
valor de la variable XA, en la distribución A, y en torno a XB, en la distribución B, siendo
XA y XB valores de una medida de posición.
1) MEDIA ARITMÉTICA
a) Serie Simple:
x1 x2 x3 .... xn xi
i 1
M(x) x
n n
Media Simple Muestral
22
N
xi
x1 x2 x3 .... xN i 1
M(x) μ
N N
Media Simple Poblacional
b) Datos Agrupados:
En el caso de una Distribución de Frecuencias, tanto de variable discreta como de
variable continua, la Media Aritmética denotada con M(y) o y , surge: de la
suma de los productos entre cada valor de la variable o marca de clase, (según
sea distribución de frecuencia de variable discreta o de variable continua,
respectivamente), y las respectivas frecuencias absolutas, dando lugar a la
denominada “Fórmula de la Media Ponderada”, pudiendo ser muestral o
poblacional según se considere los datos de una muestra o de toda la población,
respectivamente. Es decir:
n
y1.n1 y2.n2 y3.n3 .... yn.nn yi.ni
i 1
M(y) y
n n
Media Ponderada Muestral
N
yi.ni
y1.n1 y2.n2 y3.n3 .... yN.nN i 1
M(y) μ
N N
Media Ponderada Poblacional
valor de la variable (DISCRETA)
yi
marca de clase (CONTINUA)
23
Ejemplo 1:
El número de empleados que faltaron por día en una empresa, en los últimos 20
días laborables, está dado por:
4;5;2;2;0;1;1;1;6;2;2;2;2;2;5;4;4;1;1;2
a) Serie Simple.
b) Distribución de frecuencia de variable discreta.
Solución:
x i
a) M(x) x i
Serie Simple
n
49
M (x) x 2,45 empleados por día
20
y n i. i
b) M( y) y i
y valor de la variable Datos Agrupados
n
0 1 0
1 5 5
2 8 16
4 3 12
5 2 10
6 1 6
∑ 20 49
24
49
Operando se obtiene M (y) y 2,45 empleados por día
20
Ejemplo 2:
La antigüedad en sus empleos (en años), de los empleados de un Hipermercado
está dada por:
Solución:
y n i. i
M ( y) y i
y marca de clase
n
25
Antigüedad (en años) Nº de empleados Marca de clase
y´i -1 y´i ni yi yi ni
3 5 50 4 200
5 7 70 6 420
7 9 90 8 720
9 11 40 10 400
11 13 30 12 360
13 15 20 14 280
∑ 300 2.380
Aplicando la fórmula, resulta:
yi.ni 2.380
M (y) y 7,93 años de antiguedad
n 300
II. “La media aritmética del producto entre una constante y una variable es igual al
producto de la constante por la media aritmética de la variable”.
M(k.x) = k.M(x) ; k constante
III. “La media aritmética de la suma de una constante y una variable es igual a la
suma de la constante y la media aritmética de la variable”.
M(k + x) = k + M(x) ; k constante
26
IV. “La media aritmética de una suma de variables expresadas en igual unidad de
medida es igual a la suma de las medias aritméticas de cada una de las variables
consideradas”.
V. “La suma de los desvíos o diferencias entre cada valor de la variable y su media
aritmética, ponderadas en el caso de datos agrupados, es igual a cero”.
a) Serie Simple ∑ (xi - x ) = 0
VI. “La suma de los desvíos o diferencias entre cada valor de la variable y su media
aritmética elevadas al cuadrado y ponderadas en el caso de datos agrupados, es
un mínimo”.
a) Serie Simple ∑ (xi - x )2 < ∑ (xi - k)2 ; k ≠ x
Grupo yi ni
1 y1 n1
2 y2 n2
27
k
yi.ni
3 y3 n3 Media General o Total M( y ) y i 1
n
. . . .
. . . .
k yk nk
Ejemplo:
Se clasificó al personal de una empresa en dos grupos y se calculó el sueldo medio
mensual (en dólares) en cada grupo, obteniéndose los siguientes valores:
y A = 700 y B = 8.200
Empleados ; Directivos
(A) n A = 450 (B) nB = 15
Solución:
k
yini yA.nA yB.nB 700.450 8200.15 438.000
M ( y ) y i 1 M(y) y 941,94 U$S
n nA nB 450 15 465
No tomar en consideración a las Ponderaciones
28
2) MEDIANA
La Media Aritmética como medida de posición resulta útil, siempre que los valores
de la variable observada, sean homogéneos. En caso contrario, resulta más adecuada
como Medida de Posición la MEDIANA, dada por el valor de la variable que supera a no
más de la mitad de las observaciones y es superada por no más de la mitad de las mismas,
siendo menos sensible que la media aritmética ante la presencia de valores extremos. Es
decir, la MEDIANA es el valor de la variable ubicado en el medio de un conjunto de
valores ordenados de la variable, o sea el valor central. Para que un valor de la mediana
tenga sentido, el nivel de medida de los datos, debe ser por lo menos ordinal, para poder
efectuar el ordenamiento. Se la denota con Me o X.5.
Me
½
CÁLCULO DE LA MEDIANA
a) Serie Simple:
1) Se ordenan los datos en sentido creciente o decreciente.
2) Se determina la Mediana, que se corresponde con el valor de la variable
ubicado en el valor central. Es decir:
Me = x. 5 = x n+1 º
2
Observaciones:
29
Ejemplo 1:
Las temperaturas observadas en un cierto lugar en grados centígrados (ºC), están
dadas por:
-10 ; 2 ; 1 ; 0 ; -1 ; -3 ; -4 ; 1 ; -1 ; 0 ; 3
Calcular:
1) Temperatura media.
2) Temperatura mediana.
Solución:
n
x i
10 2 1 ...... 3 12
1) Media M(x) x i 1
M( x ) - 1,09 º C
n 11 11
2) Mediana:
1. Ordenar los datos
-10
- 4
- 3
- 1
- 1
x6º 0 Me = 0 ºC
0
1
1
2
3
2. Me x.5 x n + 1º n = 11 Me = x 11 + 1º = x6º = 0 ºC
2 2
30
Ejemplo 2:
-10 ; 2 ; 1 ; 0 ; -1 ; -3 ; -4 ; 1 ; -1 ; 0 ; 3 ; 45
Calcular:
1) Temperatura media.
2) Temperatura mediana.
Solución:
n
x i
10 2 1 ...... 3 45 33
1) Media M(x) x i 1
M( x ) 2,75 º C
n 12 12
2) Mediana:
-10
- 4
- 3
- 1
- 1
x6º 0 Me = 0 ºC
x7º 0
1
1
2
3
45
2. n 12 Me x n 2 1 º x x
12 1
2
º x
6,5 º x6º x7º
2
0 2 0 0 º C
31
Observación:
a) Nj-1 = n/2
y j - 1 y j
Me Promedio aritmético de los valores de las variables
2
relacionadas con Nj-1 y Nj respectivamente.
32
Ejemplo 1:
yi ni Ni
1 9 9
3 12 21 Nj-1
Me = yj 7 15 36 Nj
9 10 46
20 5 51
100 3 54
∑ 54
Solución:
2. Nj = Nj = 36
yi ni Ni
1 8 8
3 12 20
yj-1 7 7 27 Nj-1
yj 9 13 40 Nj
20 8 48
100 6 54
∑ 54
Solución:
33
Procediendo en forma análoga al problema anterior:
2. Nj = Nj = 40
yj - 1 yj 79
3. Nj-1 = 27 Nj-1 = n/2 Me Me 8
2 2
n/2 Nj 1
Me y j - 1 cj
nj
Siendo:
34
cj amplitud del intervalo mediano.
n/2 mitad de las observaciones.
Nj-1 frecuencia absoluta acumulada, inmediata anterior a Nj.
nj frecuencia absoluta, correspondiente al intervalo mediano.
Observación:
Si: Nj-1 = n/2 Me= y’j-1 extremo izquierdo del intervalo de clase
mediano.
Ejemplo 1:
Calcular la mediana, de la siguiente distribución de frecuencia de variable
continua:
y´i-1 y´i ni Ni
4 8 5 5
8 12 9 14 Nj-1
y´j-1 12 16 20 34 Nj
16 20 6 40
20 24 10 50
∑ 50
Solución:
1. n/2 = n/2 = 50/2 = 25
2. Nj = Nj = 34 Nj-1 = 14
n/2 Nj 1
3. Relacionar Nj-1 con n/2 14 < 25 Me y j - 1 cj
nj
35
Reemplazando en la fórmula por sus iguales, resulta:
25 - 14
Me 12 4 14,2
20
Ejemplo 2:
y´i-1 y´i ni Ni
4 8 5 5
8 12 9 14
12 16 20 25 Nj-1
Me = y´j-1 16 20 16 41 Nj
20 24 10 50
∑ 50
Solución:
1. n/2 = n/2 = 50/2 = 25
2. Nj = Nj = 41 Nj-1 = 25
PROPIEDAD DE LA MEDIANA
Se demuestra que: “La suma de los desvíos tomados en valores absolutos, entre
cada valor de la variable y la mediana, ponderados en el caso de una distribución de
frecuencia, es un mínimo”.
36
∑ yi - Me ni < ∑ yi - k ni ; siendo k ≠ Me
Mo Mo Mo No existe Modo
Unimodal
Bimodal
37
CÁLCULO DEL MODO
Ejemplos:
Calcular en cada caso, si existe, el Modo:
6 ; 8 ; 10 ; 8 ; 8 ; 6 ; 5 ; 3.
3 ; 1 ; 1 ; 1 ; 2 ; 2 ; 2 ; 2 ; 1 ; 4 ; 5 ; 3.
Soluciones:
1. Mo = 8 Unimodal
2. Mo = 1 y Mo = 2 Bimodal
3. Mo = soltero Unimodal
4. Mo No existe
5. Mo No existe
38
4) PERCENTILES o CENTILES
Son medidas de posición o tendencia central, que dividen a un grupo de datos en
100 partes. Hay 99 Percentiles, porque se necesita 99 divisores para separar un grupo de
datos en 100 partes. El n-ésimo Percentil es el valor de la variable tal que “al menos n por
ciento de los datos están bajo de ese valor, y a lo sumo (100 – n ) por ciento superan a ese
valor”. Así por ejemplo, el percentil 67 es un valor de la variable tal que, al menos el 67%
de los datos están por debajo de ese valor, y no más del 33% están sobre ese valor.
5) CUARTILES
Los cuartiles son medidas de posición o tendencia central, que dividen a un
conjunto de datos en cuatro partes iguales, teniendo por lo tanto 3 cuartiles:
Q1 = P25
Q2 = P50 = Me
39
Q3 Tercer Cuartil: representativo del valor de la variable que supera a no más del
75% de las observaciones y es superado por no más del 25% de las mismas. Es decir,
separa los tres cuartos más bajos del cuarto más alto, siendo igual al Percentil 75.
Q3 = P75
Esquemáticamente:
Q1 = P25 Q2 = P50 = Me Q3 = P75
6) DECILES
Son medidas de posición o tendencia central, que dividen a un grupo de datos en
10 partes iguales. Hay 9 Deciles, porque se necesita 9 divisores, para separar un grupo de
datos en 10 partes iguales. El n-ésimo Decil, es el valor de la variable tal que “al menos n
por ciento de los datos están bajo de ese valor, y a lo sumo (100 – n ) por ciento,
superan a ese valor”. Así por ejemplo, el decil 6, es un valor de la variable tal que, al
menos el 60% de los datos están por debajo de ese valor, y no más del 40% están sobre ese
valor.
D1 = P10
D2 = P20
:
:
D5 = P50 Mediana
:
:
D9 = P90
40
2) MEDIDAS DE DISPERSIÓN
Las medidas de posición o tendencia central, dan información acerca del valor de la
variable en torno al cual se concentran los datos, pero nada dicen de qué forma, los
mismos se distribuyen. Es por ello, que es necesario para describir a un conjunto de valores
de una variable, de otras herramientas analíticas que son las medidas de dispersión o
variabilidad, representativas de la dispersión de un conjunto de datos, de forma tal
que, conjuntamente con las medidas de posición, es posible obtener una descripción
numérica más completa.
Medida de Posición
R = xmáx – xmín
ym valor mayor
Variable Discreta R = ym – y0
y0 valor menor
Observaciones:
42
3) Un uso importante del Recorrido como medida de variabilidad, es en Control de
Calidad, donde se lo utiliza para elaborar los “Gráficos de Control”, que permiten
determinar si un proceso opera “bajo control”.
- - - ------ -- ---
Valor menor Valor mayor
o también:
- - - - -- - - - - - -
Valor menor Valor mayor
Ejemplo:
A 0 ; 25 ; 75 ; 100
B 48 ; 49 ; 51 ; 52
Solución:
43
RA = 100 – 0 = 100
RA > RB “datos más dispersos en Serie A”
RB = 52 – 48 = 4
MA = MB = 50
Q1 Q2 Q3
Observaciones:
Ejemplo:
Si de un conjunto de datos se obtiene que:
Q3 = 36,4
Q1 = 15,1
44
Calcular el Recorrido Intercuartílico, e interpretar.
Solución:
“Existe una amplitud de 21,3 entre los extremos de los valores de la
variable ubicados en el 50% de los valores centrales”.
3) DESVIACIÓN MEDIA
Es otra medida de dispersión, y está dada por la “Media aritmética de los valores
absolutos, de los desvíos existentes entre cada valor de la variable, y la media
aritmética”.
a) Serie Simple:
N
x -μ i
1. Poblacional DM(x) i 1
x -x i
2. Muestral DM(x) i 1
b) Datos Agrupados:
Valor de variable (D)
N
y i - μ ni
1. Poblacional DM(y) i 1
; yi =
N
Marca de clase (C )
45
Valor de variable (D)
n
y i - y ni
2. Muestral DM(y) i 1 ; yi =
n
Marca de clase (C )
Observación:
Día Nº de vehículos
Lunes 5
Martes 9
Miércoles 16
Jueves 17
Viernes 18
Solución:
Nº de vehículos
xi xi - xi -
5 -8 8
9 -4 4
16 3 3
17 4 4
18 5 5
65 0 24
46
N N
x i x i -μ
μ μ
i 1 65
13 DM(x) i 1
24
4,8
N 5 N 5
4) VARIANZA
Es una de la más importante medida de dispersión, y está dada por “La media
aritmética del cuadrado de los desvíos entre, cada valor de la variable y la respectiva
media aritmética”. Suponiendo una variable x, se la denota de la forma: V(x) o 2(x).
a) Serie Simple:
n
(x - x)
2
2
V(x) σ 2 x M x - x i 1
n
b) Datos Agrupados:
n
(y - y )
2
V(y) = y M(y - y ) i 1
2
yi =
47
FÓRMULA DE CÁLCULO DE LA VARIANZA
Partiendo de la fórmula de Varianza según la definición, y suponiendo una Serie
Simple, sabemos que:
V(x) = M ( x - x )2
xi
2 2
2
yi 2 ni yi ni
V(y) M( y) - My 2 Vy
2
-
N N
valor de la variable Variable Discreta
yi =
marca de clase Variable Continua
48
PROPIEDADES DE LA VARIANZA
V(x) ≥ 0
V(k) = 0 ; k = constante
3) “La Varianza del producto entre, una constante y una variable, es igual al
producto entre, la constante elevada al cuadrado, por la Varianza de la
variable”.
V( k + x ) = V(x) ; k = constante
V( x + y ) ≠ V(x) + V(y)
49
5) DESVIACIÓN ESTÁNDAR
El valor de la Varianza, viene expresado en la unidad de medida de la variable
elevada al cuadrado, mientras que las medidas de posición vienen expresadas en la unidad
de medida original de la variable, lo que no permite una comparación directa. Es por
ello que, a los fines prácticos, se utiliza como medida de dispersión a la Desviación
Estándar o Típica, dada por “La raíz cuadrada positiva de la varianza”. De esta forma,
el valor de la variable asociado a la tendencia central, así como el correspondiente a la
dispersión, se corresponderán con la unidad de medida original de la variable, permitiendo
con ello, su comparación. Se la denota con , de modo tal que:
n 2
(xi - x )
Desviación Estándar σ σy 2 i 1
Ejemplo 1:
De las10 piezas producidas en una hora en una fábrica, se verificó si alguna de ellas
presentaba algún defecto, obteniéndose los siguientes valores:
Obtener:
a) Varianza
b) Desviación Estándar
50
Considerando:
I. Serie Simple.
II. Datos Agrupados de Variable Discreta.
Solución:
I. Serie Simple:
x x2
0 0
1 1
3 9
0 0
1 1
0 0
1 1
1 1
1 1
0 0
8 14
x xi
2 2
a) V(x) = = M(x ) – [M(x)]
2 2 2
V(x) -
i
N N
10 2 2
xi 10 2
xi
V(x) 1
i - i 1 -
10
14
10
8
1,4 - 0,64 0,76 defectos 2
10
10
51
II. Datos agrupados de variable discreta
Defectos Nº de piezas
2
yi ni yi ni yi ni
0 4 0 0
1 5 5 5
3 1 3 9
10 8 14
2
yi 2 ni yi ni
V(y) M( y) - My 2 Vy
2
a) -
n n
2
14 8
V(y) - 1,4 - 0,8 2 1,4 - 0,64 0,76 (defectos)2
10 10
Ejemplo 2:
43 53 5 48 240 11.520
53 63 7 58 406 23.548
63 73 13 68 884 60.112
73 83 9 78 702 54.756
83 93 6 88 528 46.464
40 2.760 196.400
52
Obtener:
a) Media aritmética.
b) Varianza.
c) Desviación estándar
d) En qué intervalo se encuentra el “valor modal”?. Cómo interpreta al mismo?.
Solución:
n
yini
a) M(y) i 1 2.760 69 dólares
n 40
2
yi 2 ni yi ni
b) V(y) M y - M(y) Vy
2 2 -
n n
V(y)
40
-
196.400 2.760 2
40
149 dólares
2
6) COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa, dada por “el cociente entre la desviación
estándar y la media aritmética”, siendo una magnitud a-dimensional, es decir sin unidad
de medida, razón por la cual puede ser aplicado para comparar distribuciones, con igual o
distinta unidad de medida, pudiéndoselo expresar en porcentajes.
53
Desviación estándar σ σ
CV(x) = CV(x) % . 100
Media aritmética μ μ
Observación:
“Un menor valor del Coeficiente de Variación, significa una Media aritmética
más representativa como medida de posición, de un conjunto de datos”.
Si se tiene a dos distribuciones I y II, y sus respectivos Coeficientes de Variación:
CVI y CVII Si: CVI < CVII “MI es más representativa que MII”.
“datos más uniformes en distribución I”
“datos más parejos en distribución I”
“datos más uniformes en distribución I”
“datos más homogéneos en distribución I”
“datos menos dispersos en distribución I”
“datos con menor variabilidad en distribución I”
Ejemplo 1:
54
Solución:
Un indicador del riesgo de una Acción, es la variabilidad en los precios de su
cotización, es decir, de la dispersión en los precios.
La decisión es INCORRECTA, dado que los valores de los Precios Medios son
distintos, siendo por lo tanto necesario, el cálculo de una medida de dispersión relativa,
que considere no sólo la desviación estándar en forma aislada, sino que también, el
respectivo valor de la media aritmética.
Ejemplo 2:
La gerencia de Recursos Humanos de una empresa, desea realizar una investigación
sobre sus empleados, para lo cual se consideraron dos variables: edad y peso, deseando
55
realizar el estudio tomando aquella variable, que presente valores más homogéneos.
Relevando los datos se obtuvo que:
Solución:
Para poder determinar qué variable presenta valores más homogéneos, debemos
calcular el Coeficiente de Variación:
σy 289 kg 2 17 kg 17
Peso CVy CVy 0,227 22,7%
μy 75 kg 75 kg 75
“La desviación estándar es de 22,7% a partir de la media”
CVy < CVx M(y) “es más representativa” valores “más HOMOGÉNEOS”.
Se trabajará con la variable PESO
56
I. REGLA EMPÍRICA.
II. TEOREMA O DESIGUALDAD DE
CHEBYSHEV.
I. REGLA EMPÍRICA
Es una importante regla práctica, que se usa para expresar el porcentaje
aproximado de datos, que están dentro de un número dado de desviaciones estándar desde
la media aritmética: “En toda distribución aproximadamente simétrica, (forma de
campana), con media aritmética igual a y desviación estándar igual a , se verifica que:
- 3 - 2 - + + 2 + 3
57
Ejemplo:
Las longitudes de las piezas derivadas de un cierto proceso productivo A, se
distribuyen en forma simétrica, con una media de 12 cm, y una desviación estándar de
0,4 cm.
Solución:
= 12 cm
X = longitud de las piezas / X simétrica
= 0,4 cm
“Entre 11,6 cm y 12,4 cm, se encuentran aproximadamente el 68% de las piezas”.
“Entre 11,2 cm y 12,8 cm, se encuentran aproximadamente el 95% de las piezas”.
58
3) X = 12,6 cm “PUEDE pertenecer al proceso A, siendo ALTAMENTE
PROBABLE”.
“Se encuentra comprendido dentro de los valores habituales de las mediciones”.
4) X = 10,7 cm
99% [ ± 3] [12 ± 3. 0,4] [10,8 ; 13,2]
“Entre 10,8 cm y 13,2 cm se encuentran aproximadamente el 99% de las piezas”.
“Un 1% de las piezas tienen longitudes menores a 10,8 cm o mayores a 13,2 cm”.
X = 10,7 cm
“PUEDE pertenecer al proceso A, siendo POCO PROBABLE”.
= 230 gramos
5) Y = peso de las piezas
2 = 36 gramos2
Longitud CV ( X )
σ X
0,4 cm 0,4
0,033
μ X 12 cm 12
Peso CV ( Y )
σ Y
36 gramos 2
6 gramos
6
0,0261
μ Y 230 gramos 230 gramos 230
CV(Y) CV(X) Proceso más estable, en el Peso de las piezas
59
II. TEOREMA O DESIGUALDAD DE CHEBYSHEV
(Tchebyccheff)
La REGLA EMPÍRICA, es una regla práctica, que resulta aplicable cuando los
datos, están distribuidos en forma aproximadamente simétrica. En los casos en los que los
datos no estén distribuidos en forma simétrica, o bien la forma de la distribución es
desconocida, resulta aplicable el “Teorema o Desigualdad de Chebyshev (o
Tchebyccheff)”.
“Dentro de k desviaciones estándar de la media aritmética, ± k, existe por lo
1
menos (1 - 2 ) proporción de valores”.
k
1
x - k ≥ 1 - 2
; k>1
k
≥ 1 – 1/k2
-k +k
1
1) k = 2 1 - 2
= 0,75 “Dentro de ± 2 de la media, se encuentran por lo
k
menos el 75% de los datos”.
60
1
2) k = 3 1 - 2
= 0,8889 “Dentro de ± 3 de la media, se encuentran por lo
k
menos el 88,89% de los datos”.
1
3) k = 4 1 - 2
= 0,9375 “Dentro de ± 4 de la media, se encuentra por lo
k
menos el 93,75% de los datos”.
1
4) k = 2,5 1 - 2
= 0,84 “Dentro de ± 2,5 de la media, se encuentran por lo
k
menos el 84 % de los datos”.
Observación:
Ejemplo:
En una cierta rama de la industria dedicada a la electrónica, la edad promedio de los
empleados profesionales tiende a ser menor que en otras actividades. Un estudio realizado
determinó que el promedio de las edades de los empleados profesionales es de 36 años con
una desviación estándar de 5 años, no existiendo un comportamiento definido en la
distribución de las edades. Aplicar la Desigualdad de Chebyshev para determinar dentro de
qué rango de edades se encuentran al menos el 85% de las edades de los trabajadores.
Solución:
= 36 años
x = edades de los empleados / x
= 5 años
61
Dado que se desconoce cómo es la distribución de las edades, no podemos aplicar
la “Regla Empírica”, debiendo aplicar la “Desigualdad de Chebyshev”.
1
x - k ≥ 1 - 2
; k>1
k
Proporción de valores
= 36
Siendo: x - 36 2,58. 5 ≥ 0,85
= 5
x 36 ± 12,9
[23,1 ; 48,9]
“Al menos el 85% de las edades de los empleados, se encuentran entre 23,1 y 48,9 años”.
1) Distribución simétrica:
M = Me = Mo
Distribución simétrica M = Me = Mo
Mo Me M
63
3) Distribución asimétrica negativa, lateral izquierda o sesgada
negativa:
M Me Mo
Ejemplo:
64
Una distribución, tiene una Media Aritmética igual a 40, una Mediana igual a 36
y una desviación estándar igual a 17. ¿Cómo es la distribución, en cuanto a su forma?.
Solución:
Observación:
Se demuestra que en toda distribución levemente asimétrica se verifica que:
Mo = M – 3 ( M – Me )
65
Gráficamente:
1) Leptocúrtica:
M
2) Mesocúrtica o Normal:
M
3) Platicúrtica:
M
DISTRIBUCIONES BIDIMENSIONALES
Se denomina de esta forma, “Al conjunto de pares de valores, resultantes de
estudiar simultáneamente, de cada una de las unidades estadísticas de una determinada
población estadística, dos variables”.
66
SERIE SIMPLE
De la misma forma que en el caso de distribuciones unidimensionales, en el caso
de una distribución bidimensional, una serie simple va a estar dada por el conjunto de
pares de valores de las variables estudiadas, obtenidos en bruto.
Ejemplo:
Dados los siguientes datos referidos a horas trabajadas y número de artículos
producidos en 10 máquinas de una empresa:
Máquinas 1 2 3 4 5 6 7 8 9 10
Horas
trabajadas 6 6 6 7 7 7 8 8 8 8
(x1)
Artículos
producidos 70 70 70 80 80 90 90 90 100 100
(x2)
COVARIANZA
67
Dadas dos variables x e y, la Covarianza, por definición, va a estar dada por:
(x - x ) (y - y )
i 1
i i
SIGNO DE LA COVARIANZA:
La Covarianza asume valores, en el intervalo: - cov (x , y) , con el
siguiente significado:
Cov(x,y) = M[Zx . Zy] = M[(x - x ).(y - y )]. Efectuando el producto de los binomios:
Cov(x,y) = M (x y ) - x y - y x + x y
1) V(x + y) =
2) V(x - y) =
1) V(x + y) =
Por lo tanto:
69
V(x + y) = V(x) + V(y) x e y variables independientes ( I )
“La varianza de una suma de dos variable independientes es igual a la suma de las
varianzas de cada una de las variables dadas”.
2) V(x - y) =
Por lo tanto:
70
OBSERVACIÓN
Si x e y son variables independientes V(x ± y) = V(x) + V(y)
71
UNIVERSIDAD TECNOLÓGICA NACIONAL
FACULTAD REGIONAL CÓRDOBA
PROFESOR TITULAR
(SEGUNDA PARTE)
UNIDAD Nº IV
“ÁLGEBRA DE PROBABILIDADES”
FENÓMENOS ALEATORIOS
En la vida real, se plantean situaciones o experimentos tales que a iguales causas y
en condiciones uniformes, siempre se producen los mismos efectos, dando lugar a los
denominados “Fenómenos Determinísticos”, de naturaleza “causística”. Por ejemplo, la
Ley de Newton, expresa que la relación entre la fuerza F de un cuerpo en movimiento, de
masa m con aceleración a, está dada por:
F=m.a
Fenómenos
ESPACIO MUESTRAL
Se denomina de esta forma al conjunto formado por todos los resultados posibles
asociados a un “fenómeno aleatorio”, denotándoselo con S.
Se lo clasifica en:
1) Discreto, y
2) Continuo.
S = { 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9, 10 }
S = {1 , 2 , 3 , 4 , 5 , 6 , 7 , ………………}
Finito
Discreto
Infinito
ESPACIO MUESTRAL
Continuo Infinito
EVENTOS o SUCESOS ELEMENTALES o SIMPLES
Cada componente de un Espacio Muestral, recibe el nombre de “Evento Elemental
o Simple” y tienen las características de ser:
1) Mutuamente Excluyentes, y
2) Exhaustivos.
S = {C, S}
eventos elementales
EVENTOS o SUCESOS
Espacio Muestral S = {1 ; 2 ; 3 ; 4 ; 5 ; 6}
B = “Salida de múltiplo de 3” B = { 3 ; 6 }
EVENTO SEGURO o CIERTO
Es aquel evento, en el que todos los eventos elementales le son favorables, siendo
por lo tanto el espacio muestral. Esto es así puesto que, con toda certeza podemos afirmar
que alguno de sus componentes, se va a presentar en una prueba.
EVENTO IMPOSIBLE
Es aquel evento, en el cual ningún evento elemental le es favorable. Es decir, con
toda certeza, podemos afirmar que no se va a presentar en una prueba. Se lo denota con
. Por ejemplo, que en la tirada una vez de un dado perfecto, salga el 7.
A B
A B
A B
A B
Observación:
Unión de eventos = o = + =
Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definidos los eventos:
Solución:
1. A o B A B = { 2, 3 , 4 , 6 }
INTERSECCIÓN DE EVENTOS
Dados los eventos A y B, la “Intersección” denotada de la forma: A B, es otro
evento formado por los eventos elementales que están simultáneamente en A y B.
Gráficamente:
A B
A B
A B
A B
=
Observación:
Intersección de eventos = y = x =
Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definidos los eventos:
B = “Salida de múltiplo de 3” B = { 3 , 6 }
Solución:
1. A y B A B = { 6 }
2. A y C A C = Evento Imposible.
COMPLEMENTO DE UN EVENTO
Dado un evento A, su complemento, denotado con A o A´ es otro evento,
formado por todos los eventos elementales que están en el Espacio Muestral ( S ), y no
están en el evento A.
Gráficamente:
A
A S
Ejemplo
Considerando el experimento del lanzamiento de un dado perfecto una vez, y
definido el evento:
A = “Salida de de 3” A = { 3 , 6 }
múltiplo A = {1 , 2 , 4 , 5 }
TEORÍAS PROBABILÍSTICAS
I. Teoría Clásica, Principio de la Razón Insuficiente o Enfoque
de Laplace
Acorde a esta teoría, todos los eventos elementales que conforman un espacio
muestral tienen la misma probabilidad de aparecer en un experimento cualquiera,
determinándose la probabilidad de ocurrencia de un evento A mediante el cociente:
Casos Favorables
P(A)
Casos igualmenteposibles
La aplicación de esta fórmula de cálculo, está supeditada a que se conozca el
número de eventos elementales que conforman el numerador y el denominador, debiendo
ser estos últimos “igualmente posibles”. Lo expuesto, no siempre es factible conocerlo en
la práctica, motivo por el cual, su aplicación es limitada.
Ejemplos
1. La probabilidad que salga el 17 en una ruleta (con un solo cero):
P(salida 17) = 1/37
Así por ejemplo, si se tira al aire una moneda perfecta un número grande de veces,
( n ), y se cuenta el número de caras salidas ( m ), el comportamiento gráfico de las
frecuencias relativas hi = m/n responderá a la forma:
1/2
n (número de lanzamientos)
1. Existencial:
“Todo evento A, tiene asociado un número real que es su probabilidad”.
A : P ( A) / P ( A )
2. No Negatividad:
“La probabilidad de un evento A, es un número real no negativo”.
A : P ( A) 0
3. Certeza:
“La probabilidad del Evento Seguro o Cierto, es igual a 1”.
S Evento Seguro o Cierto P ( S ) = 1
Observaciones:
a) “La probabilidad del evento imposible, es igual a cero”.
P()=0
P ( A’ ) = 1 – P ( A )
LEY DE PROBABILIDAD TOTAL o TEOREMA DE
LA SUMA
Unión A B A o B
P (A B ) = P ( A ) + P ( B ) – P ( A B )
Gráficamente:
A B
A B
A B
P (A B ) = P ( A ) + P ( B )
Gráficamente:
A)(B A B = A B
A B
Ejemplo
Si de un mazo de 40 cartas españolas, se escoge una al azar, calcular la probabilidad
que sea:
1) As o Espada.
2) Oro o Copa.
Solución:
Si definimos los eventos de la forma:
A = “Salida de As” P(A) = 4/40
B = “Salida de Espada” P(B) = 10/40
C = “Salida de Oro” P(C) = 10/40
D = “Salida de Copa” P(D) = 10/40
1) P(sea As o Espada) P (A o B ) = P (A B )
P (A B ) = P (A) + P( B ) – P (A B ) P (A B ) = 4/40 + 10/40 - 1/40 = 13/40
as de espada
S n: eventos elementales
a c b A a: eventos elementales
B b: eventos elementales
A A B B n A B c: eventos elementales
S
c
c P(A B) P(A B)
P(A/B) n P(A/B) ; P(B) 0 ( II )
b b P(B) P(B)
n
Análogamente:
c
c P(A B) P(A B)
P(B/A) n P(B/A) ; P(A) 0 ( II )
a a P(A) P(A)
n
Ejemplo
De un mazo de 40 cartas españolas se escoge una al azar:
Solución:
Definiendo los eventos:
1
P(A B) 1
1) P(A/B) ; P(B) 0 P(A/B) 40
P(B) 10 10
40
1
P(A B) 1
2) P(B/A) ; P(A) 0 P(B/A) 40
P(A) 4 4
40
Número de eventos elementales favorables a A B 1
P(B/A )
Número de eventos elementales favorables a A 4
PROBABILIDAD COMPUESTA
I. Eventos Dependientes:
Se dice que dos eventos A y B son dependientes, cuando la ocurrencia de uno de
ellos en una prueba, afecta a la probabilidad de presentación del otro en una prueba
siguiente, lo que significa que si el experimento consiste en extracciones sucesivas, se
trabaja sin reposición o sin reemplazo.
P(A B)
P(A/B) P(A B) P(B) x P(A/B)
P(B)
P(A B)
P(B/A) P(A B) P(A) x P(B/A)
P(A)
Solución:
Definidos los eventos:
B2
5
B1
4
6 D2
O
4
6 B2
D1
3
D2
6 5 30 1
= x
10 9 90 3
= P(B1) x P(D2/B1) + P(D1) x P(B2/D1)
6 4 4 6 48 8
= x x
10 9 10 9 90 15
P(A/B) = P(A)
Si A y B son eventos independientes
P(B/A) = P(B)
Por lo tanto:
P(A B) P(A) x P(B/A) P(A B) P(A) x P(B)
o
P(A B) P(B) x P(A/B) P(A B) P(B) x P(A)
Observación:
Ejemplo
Calcular las probabilidades del problema anterior, pero suponiendo que el
experimento se efectúa, reponiendo el primer repuesto escogido, antes de extraer el
siguiente.
Solución:
Definidos los eventos:
B2
6
B1
4
6 D2
O
4
6 B2
D1
4
D2
6 6 36
= x 0,36
10 10 100
= P(B1) x P(D2/B1) + P(D1) x P(B2/D1)
= P(B1) x P(D2) P(D1) x P(B2)
6 4 4 6 48
= x x 0,48
10 10 10 10 100
A2
A1 A2 A3
A4 A5
B
Habiéndose presentado B ( a posteriori ), interesa calcular la probabilidad de que el
mismo, haya sido generado, por ejemplo por A1. Es decir, debemos calcular la
probabilidad condicionada:
P(A1 B)
P(A1/B) (1)
P(B)
P(A1) y P(B/A1)
B P(A1 B )
A1
B
B
A2
B
O
: :
: :
B
AK
B
Se observa que:
Dado que P(Ai B ) P(Ai) x P(B/A i), segundo miembro resulta igual a:
k
P(B) = P(A ) x P(B/A )
i 1
i i (3)
Generalizando:
Observación:
a) A1
b) A2
c) A3
Solución:
Siendo:
D = “Artículo Defectuoso”
D = “Artículo No defectuoso”
0,03 D
A1 0,97
D
0 ,50
0,30 0,04 D
O A2 0,96
D
0,20
0,05 D
A3 0,95
D
P(A1 D) P(A1)xP(D/A1)
a) P(A1/D) = 3
P(Ai) x P(D/Ai)
P(D)
i 1
0,50 x 0,03 0,015
P(A1/D) = 0,41
0,50 x 0,03 0,30 x 0,04 0,20 x 0,05 0,037
P(A2 D) P(A2)xP(D/A2)
b) P(A2/D) = 3
P(Ai) x P(D/Ai)
P(D)
i 1
0,30 x 0,04 0,012
P(A2/D) = 0,32
0,50 x 0,03 0,30 x 0,04 0,20 x 0,05 0,037
P(A3 D) P(A3)xP(D/A3)
c) P(A3/D) = 3
P(Ai) x P(D/Ai)
P(D)
i 1
0,20 x 0,05 0,01
P(A3/D) = 0,27
0,50 x 0,03 0,30 x 0,04 0,20 x 0,05 0,037
Ejemplo 2
Un empleado puede ir a su lugar de trabajo por dos caminos alternativos: A o B,
escogiendo el primer camino, 7 de cada 10 días de trabajo. De 5 veces que toma el camino
A, llega tarde a su lugar de trabajo una vez, mientras que, de 6 veces que toma el camino
B, llega tarde 4 veces. Hoy llegó tarde. Calcular la probabilidad de que, haya tomado el
camino B.
Solución:
Considerando a los eventos:
A = “Tomar el camino A”
B = “Tomar el camino B”
T = “Llegar tarde”
T = “Llegar a horario”
1/5 T
A 4/5
7/10 T
O 3/10
4/6 T
B 2/6
T
P(B T)
P(B/T) =
P(T)
P(B) x P(T/B)
P(B/T) =
P(A) x P(T/A) P(B) x P(T/B)
3 4
x
10 6 0,20
P(B/T) = 0,5882
7 1 3 4 0,34
x x
10 5 10 6
Ejemplo 3
P(A B) =
Solución:
a) P(A B) P(A) P(B) - P(A B)
Si A y B son eventos independientes P(A B) P(A) x P(B)
P(A B) 0,30 0,40 - 0,30 x 0,40
P(A B) 0,70 - 0,12 0,58
P(A B) 0,70
Ejemplo 4
c) P(A B) Intersectado
Solución:
1) Suponiendo que los eventos sean Independientes:
P(A B) = 0,20 + 0,40 – 0,20 x 0,40
P(A B) = 0,52
c) P(A B) = P()
P(A B) = 0
Ejemplo 5
En una gran ciudad, se seleccionó una muestra aleatoria de 500 encuestados a los
efectos de obtener información diversa respecto al comportamiento de los consumidores.
Entre las preguntas formuladas, estaba: “Disfruta comprar ropa?”. De 240 hombres, 136
respondieron que sí. De las 260 mujeres, 244 respondieron que sí.
1. Sea hombre.
2. Disfrute comprar ropa.
3. Sea mujer.
4. No disfrute comprar ropa.
5. Sea mujer y disfrute comprar ropa.
6. Sea hombre y no disfrute comprar ropa.
7. Sea un hombre y disfrute comprar ropa.
8. Sea mujer o disfrute comprar ropa.
9. Sea hombre o no disfrute comprar ropa.
10. Disfrute o no disfrute comprar ropa.
11. Si el encuestado elegido es mujer, cuál es la probabilidad que no disfrute
comprar ropa?.
12. Si el encuestado elegido disfruta comprar ropa, cuál es la probabilidad que
sea hombre?.
13. Si el encuestado elegido no disfruta comprar ropa, cuál es la probabilidad
que sea mujer?.
14. Si el encuestado elegido es hombre, cuál es la probabilidad que disfrute
comprar ropa?.
15. Disfrutar comprar ropa y el género del individuo, son estadísticamente
independientes?. Fundamentar.
Solución:
A = “Ser hombre”.
B = “Ser mujer”.
C = “Sí disfruta”.
D = “No disfruta”.
b) “Sí disfruta”. C
c) “Disfruta y es mujer”. C B
d) “No disfruta comprar ropa” C’ = D
e)
240
1. P( A ) = 0,48
500
380
2. P( C ) = 0,76
500
260
3. P( B ) = 0,52
500
120
4. P( D ) = 0,24
500
244
5. P( B y C ) P( B C ) 0,488
500
104
6. P( A y D ) = P(A D) = 0,208
500
136
7. P( A y C ) = P(A C) = 0,272
500
16
P ( D B ) 500 16
11. P ( D/B ) = 0,062
P(B) 260 260
500
136
P ( A C ) 500 136
12. P( A/C ) = 0,358
P(C) 380 380
500
136
136 A P (A/C) = 0,358
380
C 244
380 B
O
120 104 A
D 16
B
16
P ( B D ) 500 16
13. P (B/D ) = 0,133
P(D) 120 120
500
136
P ( C A ) 500 136
14. P (C/A ) = 0,567
P(A) 240 240
500
15. A y C son independientes P(C/A) = P(C)
136
P(C/A) = 0,57
240
380
P(C ) = 0,76
500
Ejemplo 6
A D E
P(A) = 0,96 ; P(B ) = 0,95 ; P(C) = 0,94 ; P(D) = 0,97 ; P(E ) = 0.95
Solución:
Sistema funciona ( F ) A y (B o C) y D y E
y multiplicación
o suma
F = { A (B C) D E} (I)
P(F) = 0,8820