Está en la página 1de 23

Universidad de Oriente

Núcleo Bolívar
Escuela de Ciencias de la Tierra
Departamento de Ingeniería de Minas
Asignatura: Estadística
Bachiller: Selena Ramírez Cedula: 21.579.807
Sección: 02

Tema 4 Probabilidades

Ejercicio de Probabilidad clásica, ley aditiva, ley de multiplicación y


probabilidad condicional

Supongamos, por ejemplo, que queremos estudiar la incidencia del


hecho de ser fumador como factor de riesgo en el desarrollo de una
enfermedad en una determinada población. Para ello se diseñó un estudio
prospectivo y, tras seleccionar una muestra de 180 sujetos. Considerando
toda la muestra, la probabilidad de desarrollar la enfermedad (E) en la
población de estudio es:

Mientras que la probabilidad de padecer la enfermedad un fumador (F) es:

Y un no fumador:

Teniendo en cuenta que:


Podría haberse aplicado la fórmula (4) para obtener cualquiera de
las dos probabilidades condicionadas anteriores, resultando idénticos
valores:

En el ejemplo, se constata por lo tanto que la incidencia de la


enfermedad es diferente en la población fumadora que en la no fumadora
(85,7% vs 18,2%). Así pues, la probabilidad de desarrollar la enfermedad
depende de si se es o no fumador. En otras ocasiones, sin embargo,
sucede que la ocurrencia o no de un determinado fenómeno B no influye
en la ocurrencia de otro suceso A. Se dice entonces que los sucesos A y
B son independientes y se verificará que:

(5)

Sustituyendo (5) en (3) se obtiene entonces que:

Es decir, en caso de independencia, la probabilidad de que ocurran


dos sucesos de forma simultánea es igual al producto de las
probabilidades individuales de ambos sucesos. Así, dos sucesos son
independientes, si el resultado de uno no tiene efecto en el otro; o si el
que ocurra el primero de ellos no hace variar la probabilidad de que se dé
segundo.

Obviamente, en la práctica, y debido a las variaciones en el muestreo,


será extremadamente difícil encontrar una muestra que reproduzca de
forma exacta las condiciones de independencia anteriores. El determinar
si las diferencias observadas son o no compatibles con la hipótesis de
independencia constituye uno de los principales problemas que aborda la
estadística inferencial.

Si se considera un fenómeno con k resultados posibles,


mutuamente excluyentes, B1, B2,..., Bk y se conoce la probabilidad de
cada uno de ellos, el llamado Teorema de las Probabilidades
Totales permite calcular la probabilidad de un suceso A a partir de las
probabilidades condicionadas:

Utilizando la expresión para el cálculo de la probabilidad de la intersección

de dos sucesos se tiene que   y, por lo tanto:

En el ejemplo anterior, podría aplicarse este resultado para el


cálculo de la incidencia de la enfermedad en la población de estudio:

Ejercicio de Probabilidad con Teorema de Bayes

El diagnóstico médico constituye un problema típico de aplicación


del Teorema de Bayes en el campo médico, puesto que permite el cálculo
de la probabilidad de que un paciente padezca una determinada
enfermedad una vez dados unos síntomas concretos. La capacidad
predictiva de un test o de una prueba diagnóstica suele venir dada en
términos de su sensibilidad y especificidad. Tanto la sensibilidad como la
especificidad son propiedades intrínsecas a la prueba diagnóstica, y
definen su validez independientemente de cuál sea la prevalencia de la
enfermedad en la población a la cual se aplica. Sin embargo, carecen de
utilidad en la práctica clínica, ya que sólo proporcionan información acerca
de la probabilidad de obtener un resultado concreto (positivo o negativo)
en función de si un paciente está realmente enfermo o no. Por el
contrario, el concepto de valores predictivos, a pesar de ser de enorme
utilidad a la hora de tomar decisiones clínicas y transmitir información
sobre el diagnóstico, presenta la limitación de que dependen en gran
medida de lo frecuente que sea la enfermedad a diagnosticar en la
población objeto de estudio. El Teorema de Bayes permite obtener el
valor predictivo asociado a un test al aplicarlo en poblaciones con índices
de prevalencia muy diferentes.

Consideremos como ejemplo un caso clínico en el que una


gestante se somete a la prueba de sobrecarga oral con 50 gramos de
glucosa para explorar la presencia de diabetes gestacional, obteniéndose
un resultado positivo. Es sabido que dicho test presenta unos valores
aproximados de sensibilidad y especificidad en torno al 80% y al 87%,
respectivamente. Si se conoce además que la prevalencia de diabetes
gestacional en la población de procedencia es aproximadamente de un
3%, por medio del teorema de Bayes podemos conocer la probabilidad de
que el diagnóstico sea correcto o, equivalentemente, el valor predictivo
positivo:

Se puede concluir por lo tanto que, a pesar de obtener un resultado


positivo en la prueba, existe sólo una probabilidad de un 15,9% de que la
paciente padezca diabetes gestacional.
Supongamos que además dicha paciente tiene más de 40 años de
edad. Se sabe que en grupos de edad más avanzada la prevalencia de
diabetes gestacional entre las gestantes llega a aumentar hasta
aproximadamente un 8%. En este caso, el valor predicativo positivo
asociado vendrá dado por:

En este caso las posibilidades de un diagnóstico de diabetes


gestacional aumentan hasta un 34,86%.

En un caso como este, en que se realiza una prueba para obtener


información sobre un diagnóstico, suele hablarse de probabilidad a priori,
que es la disponible antes de realizar la prueba (la prevalencia, en este
caso) y probabilidad a posteriori, que es la obtenida después de realizarla
(los valores predictivos). A su vez, se suele denominar verosimilitudes a
las probabilidades de un suceso bajo distintas hipótesis. El teorema de
Bayes permite así obtener los valores de las probabilidades a posteriori a
partir de las probabilidades a priori mediante una multiplicación
proporcional a las verosimilitudes.

Tal y como se indicó al inicio del presente artículo, la teoría de la


probabilidad constituye la base matemática para la aplicación de la
estadística inferencial en medicina. El cálculo de probabilidades
constituye una herramienta que permitirá hacer inferencia sobre distintos
parámetros poblacionales a partir de los resultados obtenidos en una
muestra, y después tomar decisiones con el mínimo riesgo de
equivocación en situaciones de incertidumbre.
Tema 5 Distribución de Probabilidades

Ejercicio de Distribución Binomial

La última novela de un autor ha tenido un gran éxito, hasta el punto


de que el 80% de los lectores ya la han leído.

Un grupo de 4 amigos son aficionados a la lectura:


 
1 ¿Cuál es la probabilidad de que en el grupo hayan leído la novela 2
personas?

 
2 ¿Y cómo máximo 2?
 

Ejercicio de Distribución de Poisson

Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles


son las probabilidades de que reciba, a) cuatro cheques sin fondo en un
día dado, b) 10 cheques sin fondos en cualquiera de dos días
consecutivos?
 
 

Solución:

a) x = variable que nos define el número de cheques sin fondo que


llegan al banco en un día cualquiera = 0, 1, 2, 3, …, etc, etc.
l = 6 cheques sin fondo por día
e = 2.718

                 
  
b) x= variable que nos define el número de cheques sin fondo que
llegan al banco en dos días consecutivos = 0, 1, 2, 3, ......, etc., etc.

l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en


dos días consecutivos

Nota: l siempre debe de estar en función de x siempre o, dicho de


otra forma, debe “hablar” de lo mismo que x.
 
                       

Ejercicio de Distribución Normal

Si   es una variable aleatoria de una distribución  ,

hallar:  .
 
En este caso, se está trabajando con una distribución normal estándar,
para resolverlo utilizaremos la formula siguiente:
 

 
Ahora, tenemos que localizar en nuestra tabla de distribución

normal, localizamos el valor cuando  , pero

necesitamos el valor para cuando  , entonces se

utiliza   entonces obtenemos

que  . Además, como la


distribución normal es simétrica, tenemos

que  .
 

 
Es decir, que aproximadamente el 99.74% de los valores de   
están a menos de tres desviaciones típicas de la media.
Tema 6 Estimación Puntual y estimación por intervalos

Ejercicio de estimación puntual para proporción poblacional

Ejercicio de estimación puntual para media poblacional σ con


conocida

Si el contenido en gr. de un determinado medicamento X sigue una


distribución N (7.5,0.3), calcular la probabilidad de que para una muestra
de tamaño n=5, se obtenga medio menor que 7, Pr (X ≤ 7).
SOLUCIÓN:
A partir de una muestra de tamaño n=5 de una población normal N
(µ=7.5, σ=0.3), tenemos que:

Ejercicio de estimación puntual para media poblacional σ con


desconocida

Ejercicio de estimación puntual para proporción poblacional

Calcular un intervalo de confianza al nivel α = 0.001 para el peso


exacto mediante los resultados obtenidos con 10 básculas: 7.20, 7.01,
7.36, 6.91, 7.22, 7.03, 7.11, 7.12, 7.03, 7.05
SOLUCIÓN: Suponiendo que las medidas del peso de las básculas
siguen una distribución normal) 2 N (µ, σ)2 con media el peso exacto,
estamos interesados en encontrar un intervalo de confianza que contenga
a la media de esta distribución, que a un nivel α = 0.001 y desviación
típica desconocida, está determinado por:

Y representa que la media del peso estará en dicho intervalo con


una probabilidad de acierto del 99,9%.

Ejercicio de sobre intervalo de confianza para media poblacional


con varianza conocida.
Ejercicio de sobre intervalo de confianza para media poblacional
con varianza desconocida
Ejercicio de sobre intervalo de confianza para media de dos
poblaciones independientes con variable conocidas

Se utilizan dos máquinas para llenar botellas de plástico con


detergente para máquinas lavaplatos. Se sabe que las desviaciones
estándar de volumen de llenado son 1  0.10 onzas de líquido y  2 
0.15 onzas de líquido para las dos máquinas respectivamente. Se toman
dos muestras aleatorias, n1 12 botellas de la máquina 1 y n2 10
botellas de la máquina 2. Los volúmenes promedio de llenado son x1 
30.87 onzas de líquido y x2  30.68 onzas de líquido. Asumiendo que
ambas muestras provienen de distribuciones normales Construya un
intervalo de confianza de nivel 90% para la diferencia entre las medias del
volumen de llenado.

Solución:
Como 1  0.90 entonces   0.10
Ejercicio de sobre intervalo de confianza para media de dos
poblaciones independientes con variable desconocidas

Se piensa que la concentración del ingrediente activo de un


detergente líquido para ropa, es afectada por el tipo de catalizador
utilizado en el proceso de fabricación. Se realizan 10 observaciones con
cada catalizador, y se obtienen los datos siguientes: Catalizador 1: 57.9,
66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0 Catalizador 2: 66.4,
71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 68.8 a) Encuentre un
intervalo de confianza del 95% para la diferencia entre las medias de las
concentraciones activas para los dos catalizadores. Asumir que ambas
muestras fueron extraídas de poblaciones normales con varianzas
iguales. b) ¿Existe alguna evidencia que indique que las concentraciones
activas medias dependen del catalizador utilizado?

Solución: Sean las variables aleatorias


X1 “concentración del ingrediente activo con catalizador 1”:

X2 “concentración del ingrediente activo con catalizador 2”

Asumimos que ambas variables tienen distribución normal con


varianzas iguales Estamos en las condiciones para usar
Tema 7 Estimación por prueba de hipótesis

Ejercicio de estimación por prueba hipótesis para proporción


poblacional

Un fabricante de componentes compra un lote de dispositivos de segunda


mano y desea saber la proporción de la población que están fallados. Con
ese fin experimenta con 140 dispositivos elegidos al azar y encuentra que
35 de ellos están fallados. a) Calcular un intervalo de confianza del 99%
para la proporción poblacional p. b) ¿De qué tamaño deberá extraerse la
muestra a fin de que la proporción muestral no difiera de la proporción
poblacional en más de 0,03 con un 95% de confianza?

Solución:

a) El tamaño de la muestra es n 140 (muestra grande)


Ejercicio de estimación por prueba hipótesis para proporción
poblacional con variable conocida

Solución
Ejercicio de estimación por prueba hipótesis para proporción
poblacional con variable desconocida

También podría gustarte