Está en la página 1de 108

1

UNIDAD 1:
TEORÍA DE LA PROBABILIDAD.
OBJETIVO DE APRENDIZAJE: Interpretar los conceptos estadísticos para el análisis y representación gráfica de datos.
CONTENIDO:
1.1. Terminología: Teoría de la Probabilidad. Sucesos. Tipos de Sucesos: incompatibles, contrarios, compatibles,
dependientes, independientes y condicionados.
1.2. Propiedades Básicas de la Probabilidad: Reglas y condiciones de la probabilidad.
1.3. Métodos de Resolución de Problemas de Probabilidad: Por enumeración de casos, por el Teorema de
Probabilidad Completa, por el Teorema de Probabilidad Compuesta, por el Teorema de Bayes.

“La probabilidad es la parte de las matemáticas que trata de manejar con números la incertidumbre”

Del latín probabilitas, la probabilidad es la cualidad de probable (que puede suceder o que resulta verosímil).
También conocida como Teoría de la Probabilidad, es la rama de las matemáticas que se ocupa de medir o
determinar cuantitativamente la posibilidad (frecuencia) de que un suceso o experimento, sujeto a la
incertidumbre o la aleatoriedad, produzca un determinado resultado. La probabilidad, por lo tanto, como
veremos más adelante, es la razón entre el número de casos favorables y el número de casos posibles.
En la cotidianidad de nuestra vida escuchamos expresiones que hacen referencia a la probabilidad: “qué
probabilidad hay de que la vinotinto asista al mundial”, “es muy probable que apruebe el curso de estadística II”,
“existe una alta probabilidad de que tal o cual candidato gane las elecciones”, etc. En el presente curso haremos
un estudio riguroso de esta ciencia.
La teoría de la probabilidad tuvo su origen en el Siglo XVII en Francia, iniciándose con una sencilla teoría
matemática de los juegos de azar. Los juegos de cartas, dados, etc., constituían un entretenimiento corriente de
la época, de allí que muchos personajes apasionados por estos juegos buscasen algún método que les permitiera
ganar. Entre estos destaca el caballero De Meré, quien hacia 1650 le planteó su experiencia de juego al
matemático y filósofo Blaise Pascal (1623–1662), quien a su vez mantuvo correspondencia sobre el tema con su
amigo el matemático Pierre Fermat (1601–1665). Estos se percataron de que de los resultados posibles al lanzar
una moneda, un dado, etc., no se podían predecir de antemano. Esta imposibilidad de predicción constituye la
aleatoriedad, el elemento que caracteriza la falta de certeza, es decir, el azar del juego. De Meré había
encontrado, de acuerdo a sus propios cálculos, cierta discordancia entre las frecuencias relativas de las veces que
ganaba y el valor de la correspondiente probabilidad de ganar. Pascal y Fermat demostraron que los cálculos de
De Meré eran erróneos y que la probabilidad calculada correctamente estaba en concordancia con las frecuencias
relativas realmente observadas, no existiendo contradicción.
2
Hacia comienzos del siglo XVIII, James Bernoullí y Abraham de Moivre,
continúan con el desarrollo de la teoría de los juegos de azar, sobre la base de la
definición clásica de probabilidad, aplicando varios métodos de análisis combinatorio
y otras técnicas matemáticas. Con el tiempo, esta teoría que sólo se aplicaba a los
juegos de azar, sirvió de plataforma a algunos métodos para el estudio de poblaciones
humanas y su relación con los seguros de vida, tales como el método para el cálculo
de las tablas de supervivencia, valores de renta, primas de seguro, etc. Pierre Laplace,
publica en 1812 la “Theorie analytique desprobabilités”, tratado clásico sobre la
materia, con una exposición completa y sistemática sobre la teoría matemática de los
juegos de azar y un gran número de aplicaciones a cuestiones científicas y prácticas.
Karl Gauss, estudió las observaciones de medidas físicas y astronómicas mediante la
aplicación de la teoría de la probabilidad matemática, llegando a perfeccionar una
teoría de errores sistemática. Es famosa su curva normal de error o campana de
Pierre Simon Laplace
(1749 - 1827)
Gauss, de gran aplicación teórica y práctica.

El campo de aplicación de la teoría de la probabilidad se extendió rápidamente y sin interrupciones a lo largo


de todo el siglo XIX. El desarrollo de las matemáticas actuariales, que está basada en la aplicación de la
probabilidad a las estadísticas de mortalidad, constituyó la base del desarrollo de la institución de los seguros
de vida. En física corresponde mencionar el desarrollo de las difusiones y el movimiento browniano, en las
finanzas destaca el modelo de Black y Scholes para la valuación de acciones. La estadística es, también, una de
las áreas que permite obtener conclusiones respecto de la probabilidad de sucesos potenciales. Igualmente la
biología, la psicología, la economía y en general las ciencias naturales y sociales encontraron en la teoría de la
probabilidad un instrumento eficaz para desarrollar sus métodos de investigación científica. Por ejemplo; los
bienes de consumo ofrecen un certificado de garantía de acuerdo a las probabilidades de avería o fallo; si los
estudios y experimentos reflejan que resulta poco probable que el producto se dañe en los primeros meses de
uso, las empresas ofrecerán una cobertura por dicho periodo. Por otro lado, supóngase que se desea realizar una
investigación para contrastar alguna hipótesis; se examinan los datos para ver si tal o cual hipótesis se verifica o
no. El método seguido en estos casos implica el empleo del concepto de probabilidad, de manera que el resultado
que se obtiene se enuncia en términos probabilísticos.

Así pues, la teoría de la probabilidad modela los fenómenos aleatorios, aquellos que no ofrecen un resultado
único o previsible bajo condiciones determinadas. El lanzamiento de un dado, por ejemplo, es un fenómeno
aleatorio ya que puede arrojar diferentes resultados más allá de que se realice en las mismas condiciones. Como
veremos más adelante, la probabilidad mide la mayor o menor posibilidad de que se dé un determinado resultado
(suceso) cuando se realiza un experimento aleatorio. La probabilidad toma valores entre 0 y 1 (o expresados en
tanto por ciento, entre 0% y 100%): si un suceso no ocurre nunca, su probabilidad asociada es cero (suceso
imposible), mientras que si ocurriese siempre su probabilidad sería igual a uno (suceso seguro). El resto de los
sucesos tendrá probabilidades entre cero y uno, que será tanto mayor cuanto más probable sea que dicho suceso
tenga lugar. Así, las probabilidades suelen venir expresadas como decimales, fracciones o porcentajes.

El hombre siempre tuvo interés en cuantificar la probabilidad ya que dicha cuantificación ayuda a predecir
acontecimientos futuros. Por ejemplo: si todos los días martes, desde hace tres meses, se corta la luz, existirá una
gran probabilidad (aunque no una certeza) de que el próximo martes también se produzca el corte. Así, como ya
dijimos, las probabilidades aparecen asociadas a los fenómenos aleatorios o estocásticos. Un fenómeno aleatorio
es aquel en el cual la verificación de un cierto conjunto de condiciones determinadas conduce a un resultado
entre una serie de resultados posibles. Llamaremos experimento aleatorio a ese conjunto de condiciones
determinadas. Por contraposición, los fenómenos determinísticos o no aleatorios, son aquellos en los que la
verificación de un cierto conjunto de condiciones determinadas conduce, en forma inevitable, a un resultado fijo.
Por ejemplo, lanzar una moneda al aire y observar la cara que presenta al caer al piso es un experimento
aleatorio (tenemos dos resultados posibles: cara y sello), mientras que enfriar agua hasta cero grados centígrados
bajo presión atmosférica normal es un fenómeno determinístico (conduce inequívocamente a la formación de
hielo).
3
CONCEPTUALIZACIÓN DE LA PROBABILIDAD.
Antes de profundizar en la forma cómo se utilizan y determinar
valores de probabilidad, es necesario conocer en cierta manera de
donde provienen estos valores. Hay cuatro enfoques conceptuales,
(formas de calcular o estimar la probabilidad). El enfoque clásico
o “a priori” proveniente de los juegos de azar, se emplea cuando
los espacios muestrales son finitos y tienen resultados mutuamente
excluyentes e igualmente probables. El enfoque empírico, “a
posteriori” o frecuencial, que se basa en la frecuencia relativa de
ocurrencia de un evento con respecto a un gran número de ensayos
repetidos.

El enfoque subjetivo de la probabilidad, donde las probabilidades son grados personales de creencias acerca de
sucesos con incertidumbre, y por último, el enfoque estructural o axiomático, para el cual la probabilidad formal
es un concepto que se define por un sistema de axiomas y el conjunto de definiciones y teoremas que se pueden
deducir de esos axiomas. Seleccionar uno de los cuatro enfoques dependerá de la naturaleza del problema.

A. ENFOQUE CLÁSICO (a priori o Laplaciano).


Esta definición es de uso limitado puesto que descansa sobre la base de las siguientes dos condiciones:

1. El espacio muestral de todos los resultados posibles (S) es finito.


2. Los resultados del espacio muestral deben ser mutuamente excluyentes e igualmente probables.

Este enfoque permite determinar valores de probabilidad antes de ser observado el experimento por lo que se le
denomina enfoque a priori. También es conocido como definición de Laplace, quien define la probabilidad de
un suceso como el cociente entre casos favorables y casos posibles. Este enfoque asume la equiprobabilidad de
todos los resultados simples del espacio muestral. Los matemáticos llaman a esta asignación de probabilidades una
distribución de probabilidad uniforme.

Imaginemos un evento o suceso E, que de un total de n(S) casos posibles, todos igualmente probables, puede
presentarse en n(E) de los casos, entonces, la probabilidad de aparición del suceso E (conocida como su
ocurrencia) está dada por:

n E  n(E): Cantidad de casos favorables al evento E


p  P E   Donde
n S  n (S): Número de casos posibles.

La probabilidad de que no ocurra el suceso E, viene expresada así:

n S   n E  n S  n E 
q = P (no E)   
n S  n S  n S 

n E 
1  1  p  1  P E 
n S 

De la ecuación anterior se deduce que: P (E) + P (no E) = p + q = 1

4
Observaciones:
1. De la definición dada se obtiene que cada suceso elemental tiene probabilidad 1/n. Decimos en este caso
que los sucesos son equiprobables.
2. La probabilidad de un suceso es un número no negativo, y menor o igual que 1, es decir, para cualquier
suceso (E) tenemos que 0  PE   1

3. Si el suceso es imposible (no puede ocurrir) su probabilidad es cero (0). Como el conjunto vacío () es
un subconjunto del espacio muestral sin elementos, tenemos que su probabilidad es nula, es decir, P() = 0. Es
por esto que lo llamaremos suceso imposible, tal como veremos más adelante.

4. Si el suceso es cierto (tiene que ocurrir), su probabilidad es 1. Es decir, P(E) = 1, por lo que llamamos
suceso seguro al espacio de sucesos elementales o muestral (Ω), como veremos más adelante.

5. El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar
la regla casos favorables / casos posibles el cociente siempre sería cero.
6. Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran
mayor probabilidad de salir que otras, no podríamos aplicar esta regla.

Nótese que decimos resultados mutuamente excluyentes e igualmente posibles. Dos resultados son
mutuamente excluyentes si la realización de uno implica la imposibilidad de la realización del otro. El concepto
de resultados igualmente posibles implica que no hay nada que haga pensar que alguno de los resultados tiene
más posibilidades de darse que los otros.

En el momento de la aplicación de este enfoque a un experimento aleatorio real, nos enfrentamos con
el problema de decidir cuáles son los resultados simples que son igualmente probables. La existencia
de simetría en el experimento físico, que permite aplicar el principio de razón insuficiente de Laplace,
es una guía poco firme para ayudar en este problema, entre otras cosas, porque el mismo experimento
físico puede revelar diferentes simetrías lo que supone el problema de decidir entre ellas. Recordemos,
por ejemplo, que en la experiencia aleatoria del lanzamiento de dos dados se proponen tres modelos:
Maxwell-Boltzmann, Bose-Einstein y Fermi-Dirac. No cabe duda de que debe encerrar mucha
enjundia psicológica el enfoque de la equiprobabilidad porque una de nuestras principales industrias se
construye sobre esta idea: toda forma popular de juego, excepto apuestas en contextos de fuerza o
destreza, depende de aparatos aleatorios tales como cartas perfectamente barajadas, dados
perfectamente cúbicos o ruletas simétricamente divididas. Tales aparatos utilizan una simetría visible
para soportar la hipótesis de que los elementos simétricos son igualmente probables.

Ejemplos
1ro. Sea A el suceso de que aparezcan los números 1 ó 5 en una sola tirada de un dado.
Solución:
n (A): Número de casos favorables 1, 5 Dos casos.
n (S): Número de casos posibles 1, 2, 3, 4, 5, 6 Seis casos.
Si el dado está bien construido, podemos suponer que los seis casos son igualmente posibles.
n  A 2 1
Puesto que A puede presentarse con dos de estos seis casos, se tiene: p  P  A   
n S  6 3
1 2
La probabilidad de no obtener un 1 ó 5, es decir, de obtener 2, 3, 4 ó 6 es; q  P no A  1  
3 3
5
2do. El experimento es lanzar un dado. ¿Cuál es la probabilidad de que caiga un dos hacia arriba? ¿Cuál la
probabilidad de obtener un número par?
1 3
Solución: S = {1, 2, 3, 4, 5, 6}, Pcaiga 2    0,166 ; y hay tres pares, luego, P par    0,50
6 6

3ro. ¿Cuál es la probabilidad de que en una familia que tiene tres hijos, hayan dos niñas y un niño, si se
considera igualmente probable el nacimiento de un niño o niña?

Solución: Usando "a" para niña y "o" para niño, el espacio muestral es:
S = {aaa, aao, aoa, aoo, oaa, oao, ooa, ooo} : n(S) = 8
El evento E de que hayan dos niñas y un niño es E = {aao, aoa, oaa} ; n(E) = 3
n E  3
p  P E     0,3750 Se sugiere la construcción de un diagrama de árbol
n S  8

Obsérvese que siempre 0  PE   1 , puesto que 0  n E   n S 

Un diagrama de árbol es una herramienta que se utiliza para determinar los posibles resultados de un
experimento aleatorio. Consiste en una representación gráfica de esos posibles resultados y consta de una serie
de pasos, cada uno con un número finito de maneras de ser llevado a cabo. En la construcción de un diagrama
de árbol se partirá colocando una rama para cada una de las posibilidades, acompañada de su probabilidad.
Cada una de estas ramas se conoce como rama de primera generación. El final de cada rama de primera
generación se constituye a su vez en un nudo del cual parten nuevas ramas, conocidas como ramas de segunda
generación, según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final). Hay que tener en cuenta que la construcción de un árbol no depende de tener el
mismo número de ramas de segunda generación que salen de cada rama de primera generación y que la suma
de las probabilidades de los nudos de cada rama debe dar 1.

4to. Calcular la probabilidad de que al lanzar un dado dos veces consecutivas, la suma de los puntos
obtenidos sea no menor que 8.

Solución: Designemos por (i, j) al resultado del experimento consistente en lanzar un dado dos veces
consecutivas y obtener i puntos en el primer lanzamiento y j puntos en el segundo (i, j = 1, 2, 3, 4, 5, 6).
El conjunto de sucesos elementales que describe los resultados de un experimento de este tipo se compone de
6x6 = 36 puntos de la forma (i, j), y puede ser representado en la siguiente tabla

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

El suceso A consiste en que la suma de los puntos obtenidos es no menor que 8. Es claro que los casos
favorables para la ocurrencia del suceso A son los indicados en la tabla, es decir, 15. Considerando que los 36
resultados posibles son equiprobables, y aplicando la definición de probabilidad, obtenemos:
15 5
p  P ( A)    0,4166
36 12
6
B. ENFOQUE DE FRECUENCIAS RELATIVAS (a posteriori o empírico).
Cuando se realiza un experimento aleatorio un número muy elevado de veces, las probabilidades de los
diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas
probabilidades. En este modelo ya no será necesario que el número de soluciones sea finito, ni que todos los
sucesos tengan la misma probabilidad. La idea intuitiva de probabilidad se basa en la llamada ley de los grandes
números, enunciada por Bernoulli: “La frecuencia relativa de un suceso tiende a estabilizarse en torno a un
número, a medida que el número de pruebas del experimento crece indefinidamente”. Así, la probabilidad de un
suceso se obtiene o, más bien, se estima a partir de la frecuencia relativa observada de ese suceso en ensayos
repetidos.
Este es pues un enfoque a posteriori, experimental, basado en información obtenida después de realizar ensayos
reales. La probabilidad es el límite hacia el que tiende la frecuencia relativa, de este modo, el enfoque frecuencialista
implica la teoría de límites y la convergencia. Al aplicar esta definición, hay dificultades obvias para definir lo que
significa “similar” o '”aleatoriedad” ya que aparece la circularidad. Incluso la noción de estabilización de las
frecuencias relativas a largo plazo presenta dificultades en relación al número de ensayos necesarios para lograr
dicha estabilidad. El concepto de probabilidad a priori tiene la desventaja de que no es aplicable cuando el
número de resultados posibles es infinito. Más aun, este concepto es válido solamente cuando los resultados son
igualmente posibles. Por desgracia, hay situaciones prácticas que no son de este tipo y la definición de Laplace
no se puede aplicar. Por ejemplo, si se pregunta por la probabilidad de que un paciente se cure mediante cierto
tratamiento médico, o la probabilidad de que una determinada máquina produzca artículos defectuosos, entonces
no hay forma de introducir resultados igualmente probables. Por ello se necesita un concepto más general de
probabilidad. Una forma de dar respuesta a estas preguntas es obtener algunos datos empíricos en un intento por
estimar las probabilidades.
El concepto es muy simple; si realizamos un experimento aleatorio un número grande de veces, digamos, n
veces, y una determinada modalidad de A se da nA veces, como sabemos que la frecuencia relativa de la
modalidad A es f A = nA/n. Según el concepto de probabilidad a posteriori la probabilidad de la modalidad A
sería el límite de la frecuencia relativa de A cuando n tiende a infinito; es decir: n
P  A  Lím f A  Lím A
n n  n
Si continuamos calculando esta frecuencia relativa cada cierto número de ensayos, a medida que aumentamos
n, las frecuencias relativas correspondientes serán más estables; es decir; tienden a ser casi las mismas; en este
caso decimos que el experimento muestra regularidad estadística o estabilidad de las frecuencias relativas. Esto
se ilustra en la siguiente tabla que muestra los resultados de una moneda lanzada al aire 1.000 veces.

Número de Número Frecuencia Frecuencia Frecuencia


lanzamientos de caras relativa acumulada acumulada relativa
1 - 100 52 0,52 52 0,520
100 - 200 53 0,53 105 0,525
200 - 300 52 0,52 157 0,523
300 - 400 47 0,47 204 0,510
400 - 500 51 0,51 255 0,510
500 - 600 53 0,53 308 0,513
600 - 700 48 0,48 356 0,509
700 - 800 46 0,46 402 0,503
800 - 900 52 0,52 454 0,504
900 -1000 54 0,54 508 0,508
Total: 1000 508 0,508

7
En un total de 1.000 lanzamientos ocurrieron 508 caras, es decir la frecuencia relativa es aproximadamente
igual a 0.50.
Tres investigadores realizaron experimentos y obtuvieron los siguientes resultados

Número de Número Frecuencia


Investigador
lanzamientos de caras relativa

Buffon 4.040 2.048 0,5069

K. Pearson 12.000 6.019 0,5016

K. Pearson 24.000 12.012 0,5005

La mayoría de los experimentos aleatorios de importancia práctica tienen estabilidad, por esto podemos
sospechar que prácticamente será cierto que la frecuencia relativa de un evento E en un gran número de ensayos
es aproximadamente igual a un determinado número P(E). Obsérvese que este número es una propiedad que no
depende solamente de E, sino que se refiere a un cierto espacio muestral S y a un experimento aleatorio.
Entonces, decir que el evento E tiene probabilidad P(E) significa que si efectuamos el experimento muchas
veces, es prácticamente cierto que la frecuencia relativa de E, fr(E) es aproximadamente igual a P(E). En la
práctica la probabilidad se aproxima por la frecuencia relativa al repetir el experimento un número grande de
veces, es decir: n
P (E )  f E  E
n
Cuando se usa la definición frecuencial, es importante tomar en cuenta los siguientes aspectos:
1) La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
2) Cuanto mayor sea el número de ensayos, tanto mejor será la estimación de la probabilidad; es decir, a mayor
número de ensayos mejor será la estimación.
3) La probabilidad es propia de sólo un conjunto de condiciones idénticas a aquéllas en las que se obtuvieron
los datos, o sea, la validez de emplear esta definición depende de que las condiciones en que se realizó el
experimento sean repetidas idénticamente.

En resumen, este enfoque permite determinar la probabilidad con base en la proporción de veces que ocurre
un resultado favorable en cierto número experimentos. No implica ningún supuesto previo de igualdad de
probabilidades. La probabilidad se define como el límite de la frecuencia relativa bajo el supuesto de que el
número de observaciones o casos posibles, crezca indefinidamente. A este enfoque se le denomina también
enfoque empírico debido a que para determinar los valores de probabilidad se requiere de la observación y de la
recopilación de datos. También se le denomina a posteriori, ya que el resultado se obtiene después de realizar el
experimento un cierto número de veces.

Con esta concepción de la probabilidad, la mayoría de incertidumbres que experimentan los seres humanos no se
pueden describir por medio de probabilidades; por ejemplo, "el 100.000 dígito decimal de π es un 7", "hay más de
1.000.000 teléfonos en Aragua (Venezuela)", etc. Además, puede ser bastante difícil determinar si una particular
frecuencia relativa es un estimador apropiado de una probabilidad. El lanzamiento de la moneda es el ejemplo de
frecuencias relativas que viene en los libros de texto, pero ¿cómo se debería lanzarla? Los sucesivos lanzamientos se
deberían realizar bajo condiciones "substancialmente idénticas" pero no pueden ser absolutamente idénticas porque la
moneda caería siempre del mismo lado. ¿Cuánta variación es permisible en el procedimiento de lanzamiento de una
moneda, de una tirada a la siguiente? La posición frecuencialista casi nunca llevaría a estimar que la probabilidad de
conseguir caras es 1/2. En efecto, en cualquier secuencia de lanzamientos razonablemente larga pero finita, la frecuencia
relativa de caras casi nunca será 1/2; además, variará de una ocasión a otra. La mejor estimación frecuencialista de una
probabilidad es la frecuencia relativa observada, por tanto los frecuencialistas deben admitir estimaciones como
515/1.000 o 5200/10.000, al menos que sean bastante sensatos para no recurrir a frecuencias relativas cuando tengan una
base mejor para el juicio probabilístico, por ejemplo, la simetría de la moneda.
8
Ejemplos
1) Antes de incluir la cobertura para cierto tipo de problemas dentales en
pólizas de seguros médicos para adultos con empleo, una compañía de seguros
desea determinar la probabilidad de ocurrencia de esa clase de problemas, para
que pueda fijarse la prima de seguros de acuerdo con esas cifras. Por ello, un
especialista en estadística recopila datos para 10.000 adultos que se encuentran en
las categorías de edad apropiadas y descubre que 100 de ellos han experimentado
el problema dental específico durante el año anterior. Por ello, la probabilidad de
ocurrencia es:
100
P (A )   0,01  1%
10 .000

2) Se sabe que una moneda está cargada. Para determinar la probabilidad de que caiga
cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cayó cara. Si aplicamos
la fórmula:
25
P(cae cara )   0,41
60

3) Si en 2.000 lanzamientos de una moneda resultan 1.080 caras, la frecuencia relativa de caras es:

1.080
 0,54
2 .000

4) Si en otros 1.200 lanzamientos de la misma moneda resultan 560 caras, la frecuencia relativa para el total
de los 3.200 lanzamientos es:
1.080  560  0,5125
3.200

De acuerdo con la definición en términos de frecuencia relativa, si se continúa de esa forma, nos estaríamos
acercando más y más al resultado que puede llamarse “probabilidad de cara en el lanzamiento de la moneda”.
De los resultados se puede concluir que este límite sería 0,50.

Otro ejemplo:

5) Se ha observado que de 50 vehículos que pasan por una intersección, 9 de


ellos no tienen cinturón de seguridad. Si un fiscal de tránsito se para en esa
intersección un día cualquiera, ¿cuál será la probabilidad de que detenga al
conductor de un vehículo sin cinturón de seguridad?

9
P  A   0,18  18%
50

Tanto el enfoque clásico como el enfoque empírico conducen a valores de probabilidad, en el sentido de que
los valores de probabilidad indican a largo plazo la tasa relativa de ocurrencia del evento.
9
C. ENFOQUE SUBJETIVO DE LA PROBABILIDAD (personalista o Bayesiano).
Representa el tipo de probabilidad que en el Renacimiento se calificaba como opinión o grado de creencia. En este
enfoque, las probabilidades son evaluaciones de situaciones que son inherentes a la mente del sujeto y no a las
características del mundo real que nos rodea tal como se asume implícitamente en los dos primeros enfoques. "Las
probabilidades son grados personales de creencia acerca de sucesos con incertidumbre". El enfoque señala que la
probabilidad de un evento es el grado de confianza que una persona tiene en que el evento ocurra, con base en
toda la evidencia que tiene disponible, fundamentado en la intuición, opiniones, creencias personales y otra
información indirecta. Este enfoque no depende de la repetitividad de ningún evento y permite calcular la
probabilidad de sucesos únicos y se da el caso de que ocurra o no esa única vez. Debido a que el valor de la
probabilidad es un juicio personal, al enfoque subjetivo se le denomina también enfoque personalista. Se
diferencia de lo dos enfoques anteriores, debido a que tanto el enfoque clásico como el de frecuencia relativa
producen valores de probabilidad objetivos.

Desde este enfoque, todas las incertidumbres se pueden medir apropiadamente utilizando probabilidades. Sin
embargo, no todas las opiniones numéricas acerca de resultados inciertos son probabilidades; las opiniones, para
ser tratadas como probabilidades deben ser consistentes. Por ejemplo, sería tonto hacer una apuesta de 3 a 2 en cada
uno de los dos caballos que participan en una carrera porque se pierde dinero en cuanto que la ganancia de 2 en un
caballo no compensa la pérdida de 3 en el otro. La coherencia formaliza esta idea básica de la que se pueden deducir
las leyes básicas de la probabilidad. El enfoque subjetivo de la probabilidad no supone relativismo cultural o
científico en el sentido de que no implica que "tu conjetura es tan buena como la mía". Aunque tu opinión inicial
sobre la futura conducta de una moneda o sobre cualquier otra hipótesis incierta, puede diferir radicalmente de la
de tus vecinos (de ahí viene el nombre de probabilidades personales), tu opinión y la suya se verán tan transformadas
por una serie de observaciones relevantes que llegarán a ser casi indistinguibles. Esta aproximación que surge de
opiniones inicialmente divergentes es una razón para considerar "objetivas" las inferencias desde las frecuencias
relativas.

Todas las probabilidades son condicionadas para el enfoque personalista. Formalmente, se puede establecer una
partición en cualquier conjunto de sucesos y una probabilidad es una medida asignada a cada uno de los
subconjuntos de la partición. Algunas veces la proposición a la que se asigna una probabilidad define completamente
el conjunto de partida; por ejemplo: "esta bolsa contiene 50 bolas rojas y 50 azules, completamente mezcladas.
Uno de nosotros selecciona una, metiendo la mano en la bolsa a ciegas y cogiendo la primera que encuentra.
¿Será roja?". Sin embargo, con mayor frecuencia, la proposición omite la mayor parte de la información que
especifica el conjunto de partida; por ejemplo: "la siguiente persona que veré medirá al menos 1,70 cm". La
posibilidad de que el enunciado sea verdad depende de cuestiones tales como dónde estoy en este momento y cuál
es la secuencia probable de sucesos que me llevará a ver a alguna persona: puedo estar en casa con mi mujer e hijos,
ninguno de los cuales llega a 1,70; puedo estar en un partido de baloncesto Toros-Guaiqueríes, en el primer caso
la probabilidad de que se cumpla el enunciado será muy baja, en el segundo caso aumenta esta probabilidad.
La información condicionante siempre existe, independientemente de que sea explícita o implícita. Puesto que las
probabilidades modelan creencias u opiniones, el tipo más importante de condicionamiento tiene que ver con la
información disponible en el momento en que se evalúa la probabilidad. La regla fundamental para cambiar las
probabilidades cuando se dispone de nueva información es el teorema de Bayes, que es una formalización
matemática del proceso de aprendizaje desde la experiencia. Razón por la que este enfoque personalista de la
probabilidad se llama con frecuencia Bayesiano.

El enfoque subjetivista de la probabilidad no ha formado parte de la enseñanza tradicional de la teoría de


probabilidades. La mayoría de los libros de texto enseñan las probabilidades que tienen que ver con experiencias
aleatorias repetibles y que describen sucesos más que opiniones acerca de proposiciones o enunciados.

Ejemplos
1) Hay una probabilidad del 90% de que las ventas mejoren el año próximo.
2) Hay una alta probabilidad de sacarme un 20 en esta materia.
10
D. ENFOQUE ESTRUCTURAL O AXIOMÁTICO (Definición Axiomática de Kolmogorov).
Después de establecer una forma de determinar la probabilidad experimentalmente, se pueden deducir leyes o
propiedades de la probabilidad en forma lógica o computacional bajo ciertas suposiciones llamados axiomas de
la probabilidad. Estos axiomas corresponden a la definición axiomática de la probabilidad de Kolmogorov.

La probabilidad formal es un concepto que se define por un sistema de axiomas y el conjunto de definiciones
y teoremas que se pueden deducir de esos axiomas. Unas probabilidades se deducen de otras probabilidades de
acuerdo a teoremas matemáticos, sin justificación para sus valores numéricos en ninguna aplicación. Para
Kolmogorov, la teoría de la probabilidad, como disciplina matemática que es, puede y debe ser desarrollada desde
los axiomas, exactamente igual que la geometría y el álgebra. Según Barnett, este enfoque estructural no clarifica
la naturaleza de la probabilidad aunque los teoremas deducidos son un indicador de posibles interpretaciones.
Sin embargo, puede servir como una estructura teórica para las dos principales concepciones de la probabilidad, la
objetivista y la subjetivista. La posición objetivista abarca los enfoques clásico y frecuencialista; según esta
perspectiva, la probabilidad es un tipo de disposición de ciertos sistemas físicos que se relaciona con frecuencias
empíricas. Algunos teoremas como las leyes de los grandes números, confirman esta relación. La posición
subjetivista trata la probabilidad como un grado de confianza en proposiciones que expresan incertidumbre.
Los axiomas que se basan en una conducta de apuestas "racional", como los de coherencia y consistencia,
proporcionan reglas para asignar probabilidades.

Es notable que las teorías estructurales construidas sobre varios sistemas de axiomas son idénticas para
objetivistas y subjetivistas si se apartan las variantes subjetivistas más radicales como la de De Finetti. Esto
significa que posiciones competitivas utilizan el mismo lenguaje axiomático con respecto a la sintaxis;
naturalmente, la semántica es diferente.

A pesar de la equivalencia formal de los enfoques, se considera que los axiomas de Kolmogorov son una
justificación de la posición objetivista, especialmente del modelo frecuencialista. El modelo estructural no
ayuda a determinar un valor para la probabilidad.

En una aplicación determinada hay que elegir una interpretación específica subjetiva u objetiva para
determinar el modelo y las probabilidades inherentes. Filosóficamente, para el estructuralista no hay forma
de decidir qué modelo es mejor.

Un ejemplo estándar de lanzar un dado azul determinado puede ayudar a ilustrar las diferentes posiciones
teóricas. El modelo clásico asigna una probabilidad de 1/6 al suceso de conseguir un seis, porque se puede
asumir que hay seis caras todas ellas igualmente probables. El modelo frecuencialista asigna una
probabilidad realizando ensayos repetidos o asignando el mismo valor para el dado azul cuando
experiencias con otro dado han producido un resultado de 1/6. En ambos modelos la probabilidad es una
característica inherente del dado y del procedimiento de lanzamiento. El modelo subjetivista afirma que la
probabilidad es un constructo mental que se puede alterar si se dispone de nueva información acerca del
dado. Por ejemplo, se puede asignar un valor diferente de 1/6 si el dado es negro o más pesado o más
pequeño o está suavemente cincelado; por supuesto que se necesita alguna base para tomar la decisión pero
dado que no se considera la probabilidad como inherente al objeto, no implica ningún problema lógico que
haya valores en conflicto.

De hecho, la concepción subjetivista no rechaza consideraciones de simetría o de frecuencias relativas,


ambas son importantes para evaluar probabilidades, pero insiste en que las ideas de simetría o frecuencia
hay que hacerlas explícitas y usarlas con cuidado.

11
AXIOMAS DE PROBABILIDAD.
La probabilidad de un evento E en un experimento aleatorio, es el valor numérico P(E) que satisface los
siguientes axiomas:
- Si E es un evento definitivo del espacio muestral S, entonces: 0 ≤ P (E) ≤ 1.

- Si S representa el conjunto de todos los resultados posibles de un experimento aleatorio, entonces: P (S) = 1.

Si A y B son dos eventos cualesquiera definidos en el mismo espacio muestral y, si A  B =  , entonces A y B


se dice que son mutuamente excluyentes y, la probabilidad de que ocurra A ó B es la suma de probabilidad de sus
probabilidades: P (A  B) = P (A) + P (B). (Ver suceso incompatible o mutuamente excluyentes).

Si A y B son dos eventos cualesquiera definidos en el mismo espacio muestral y, si A  B ≠ , entonces A y B


se dice que son no mutuamente excluyentes y, la probabilidad de que ocurra A ó B es la suma de sus
probabilidades menos la probabilidad de ocurrencia de ambos eventos: P (A  B) = P (A) + P (B) – P (A  B).
(Ver sucesos compatibles, solapados o no mutuamente excluyentes).
- Evento complementario, de un evento A es el evento que consiste en todos los resultados que no contiene el
evento A. Su probabilidad se calcula con la fórmula: P ( A ) = 1 – P (A).
Toda la teoría elemental de la probabilidad está construida sobre las bases de estos simples axiomas.

DEFINICIÓN OPERACIONAL DE TÉRMINOS.

En el certamen de belleza Miss Venezuela, el nombre de las cinco finalistas no se sabrá con certeza hasta tanto
no se realicen las pruebas correspondientes para elegirlas. Se puede conocer la lista de todas las participantes
inscritas, pero no la lista de las escogidas. El certamen constituye el experimento aleatorio, mientras que el
conjunto de todos los posibles resultados al realizar el experimento es lo que llamaremos espacio muestral.

EXPERIMENTO ALEATORIO.
Es el conjunto de pruebas aleatorias realizadas en las mismas condiciones. El resultado no se conoce a priori,
pero si se conocen todos los resultado posibles. Si se realiza una sola prueba, la misma constituye un
experimento aleatorio. Estos experimentos también se llaman estocásticos. El lanzamiento de una moneda una o
varias veces, la extracción de una baraja de un juego, etc., son ejemplos de ello. Nótese que si lanzamos un
dado, tampoco podemos determinar el resultado que vamos a obtener, aunque si conocemos todos los resultados
posibles.
12
COMPROBACIÓN DE LOS APRENDIZAJES
1) Sea el experimento lanzar dos monedas simultáneamente, describa su espacio muestral.
Solución: Nuestro espacio muestral sería los cuatro posibles resultados de este experimento.
Estos resultados podemos obtenerlos mediante dos procedimientos:
a) A través de un producto cartesiano. b) A través de un diagrama de árbol
Segunda 1ra 2da (moneda)
Primera
moneda
moneda C
C S
C CC CS C
S SC SS S
C
S
Luego el espacio muestral de estas dos monedas sería S
S   CC, CS, SC, SS

2) Se lanzan juntos una moneda y un dado. Localizar el espacio muestral.


Solución:
a) Se puede resolver a través del producto cartesiano de los dos espacios muestrales simples:
Espacio muestral para la moneda: E1 = cara, sello = C, S
Espacio muestral para el dado: E2 = 1, 2, 3, 4, 5, 6
Espacio muestral de la moneda y el dado al ser lanzados juntos; E = E1 . E2
(Producto cartesiano) E = 1C, 2C, 3C, 4C, 5C, 6C, 1S, 2S, 3S, 4S, 5S, 6S
b) La otra forma de obtener el espacio muestral para este tipo de ejemplos es, representando
gráficamente el producto cartesiano en un sistema de ejes rectangulares. Para lograr la
representación gráfica, se construye la parte positiva (primer cuadrante) del sistema de
ejes rectangulares. Se coloca en el eje Y (ordenadas), los puntos muestrales de la moneda
y en el eje X (abscisas), los puntos muestrales del dado. Finalmente se coloca en cada
intersección el evento compuesto correspondiente:
Y
(Moneda)
S (1,S) (2,S) (3,S) (4,S) (5,S) (6,S)
C (1,C) (2,C) (3,C) (4,C) (5,C) (6,C)
X
1 2 3 4 5 6 Dado

3) Sea el experimento lanzar tres monedas simultáneamente, construya su espacio muestral


a través de los procedimientos mostrados.

4) Se lanzan dos dados; uno rojo y otro verde. Determine:


a) El espacio muestral. b) E1 = (X = suma de las caras) tal que X > 12
c) E2 = (X = suma de las caras) tal que X  3 sea entero
d) E3 = (Sx = suma de las caras) tal que 2  X  12.

5) Un experimento aleatorio consiste en seleccionar 200 unidades de la producción de cierto


artículo, y observar cuántas son defectuosas. Los posibles resultados son el número posible
de unidades defectuosas. ¿Cuántos puntos muestrales contiene el espacio muestral?

13
ESPACIO MUESTRAL O DE SUCESOS.
También llamado espacio de sucesos elementales. Es el conjunto de todos los resultados posibles de un
experimento aleatorio. Se simboliza por la letra S o bien con la letra griega mayúscula Ω -omega-. Ejemplo: En
el lanzamiento de un dado, el espacio muestral es S = 1, 2, 3, 4, 5, 6.

SUCESOS ELEMENTALES.
Es cada uno de los elementos que forman parte del espacio muestral; posibles resultado de un experimento
aleatorio y se simboliza con la letra “E”. También se conoce como punto muestral o suceso aleatorio. Un
suceso elemental es un suceso unitario y constituyen un subconjunto del espacio muestral. Por ejemplo, en el
lanzamiento de una moneda, los puntos muestrales son E1 = cara y E 2 = sello. Cada uno de ellos es un suceso o
caso posible. Otro ejemplo sería el lanzar un dado, un suceso elemental sería obtener 5, otro suceso sería que
saliera par y otro obtener un múltiplo de 3.

SUCESO SEGURO O CIERTO.


Es el que siempre se realiza. Está formado por todos los posibles resultados del experimento, es decir, coincide
con el espacio muestral y por eso lo representaremos también por la letra S. Por ejemplo, al lanzar un dado
obtener una puntuación que sea menor que 7.

SUCESO IMPOSIBLE.
Es el que no se verifica nunca por no tener ningún elemento. Se representa por . Ejemplo, al lanzar un dado
obtener una puntuación igual a 7.

SUCESO COMPATIBLE (Solapados o no mutuamente excluyentes).


Dos sucesos, A y B, son compatibles cuando tienen algún suceso elemental común. Por ejemplo, si A es sacar
puntuación par al lanzar un dado y B es obtener múltiplo de 3, A y B son compatibles porque 6 es un suceso
elemental común. P (A  B) = P (A) + P (B) – P (A  B).

SUCESO INCOMPATIBLE (disjuntos o mutuamente excluyentes).


Dos sucesos, A y B, son incompatibles cuando no se pueden dar al mismo tiempo ya que no tienen elementos
comunes (su intersección es el conjunto vacío). Por ejemplo, si A es sacar puntuación par al lanzar un dado y B
es obtener múltiplo de 5, A y B son incompatibles. La probabilidad de la unión de dos sucesos incompatibles
será igual a la suma de las probabilidades de cada uno de los sucesos, ya que su intersección es el conjunto vacío
y por lo tanto no hay que restarle nada. P (A  B) = P (A) + P (B).

SUCESO INDEPENDIENTE (o sucesos no relacionados).


Dos sucesos, A y B, son independientes cuando la probabilidad de que ocurra A no se ve afectada porque haya
o no ocurrido B. Ejemplo, al lanzar dos dados los resultados son independientes.

SUCESO DEPENDIENTE (o sucesos relacionados).


Dos sucesos, A y B, son dependientes cuando la probabilidad de que ocurra A se ve afectada porque haya o no
ocurrido B. Por ejemplo, extraer dos cartas de una baraja, sin reposición, son sucesos dependientes. (¿Por qué?)
Los eventos mutuamente excluyentes deben ser dependientes.

SUCESO CONTRARIO O COMPLEMENTARIO.


Dado un suceso cualquiera A del espacio de sucesos S, se llama suceso contrario del suceso A, a un suceso

que se realiza cuando no se realiza A, y viceversa. Se denota por A (también por A’). P A  1  PA  . Es decir,
si no se da uno, obligatoriamente se tiene que dar el otro. La probabilidad de la unión de dos sucesos
complementarios es igual a 1.

Ejemplo. Consideremos el espacio muestral asociado al lanzamiento del dado, S = (1, 2, 3, 4, 5, 6), y los
siguientes sucesos A: "salir número impar" = (1, 3, 5), Ā: "salir número par" = (2, 4, 6). Los sucesos A y Ā son
complementarios, ya que si se realiza A no se realiza Ā y si se realiza Ā no se realiza A.
14
SUCESO COMPUESTO. Es una combinación de eventos elementales que se forman a partir de dos o más
eventos simples, tomando en cuenta las operaciones entre conjuntos.
Ejemplo: Experimento que consiste en arrojar un dado.
Espacio Muestral S = {1, 2, 3, 4, 5, 6}
Sucesos o eventos simples: E1 = {1}, E2 = {2}, E3 = {3}, E4 = {4}, E5 = {5}, E6 = {6}
Sucesos o eventos compuestos: E1 = {1, 3, 5}, E2 = {2, 4, 6}

La unión de sucesos, A  B, es el suceso formado por todos los elementos de A y de B.


Observe que la unión se relaciona con el operador lógico disyunción V (O).
A  B   X  S / X  A  X  B

La intersección de sucesos, A  B, es el suceso formado por todos los elementos que


son, a la vez, de A y de B. Observe que la intersección se relación con el operador lógico
conjunción Λ (Y). A  B   X  S / X  A  X  B

Ejemplo:
Sea el experimento lanzar un dado y observar el número que sale en la cara superior, es decir,
E = 1, 2, 3, 4, 5, 6
Algunos sucesos simples de E, serían: A = Sale un número par = 2, 4, 6
B = Sale un número impar = 1, 3, 5
C = Sale un número menor que cinco = 1, 2, 3, 4
Definamos algunos sucesos compuestos;
1.- B  C = Sale un número impar o un número menor que cinco  B  C = 1, 3, 5, 2, 4
2.- A  C = Sale un número par o un número menor que cinco  A  C = 2, 4, 6, 1, 3
3.- A = No sale un número par  A = 1, 3, 5

SELECCIÓN CON REEMPLAZO.


Es cuando cada elemento o punto muestral elegido de la población se devuelve a ésta antes de seleccionar otro,
por lo que, el mismo elemento puede ser tomado más de una vez. Si tenemos n elementos y seleccionamos r al
azar procedemos de la siguiente forma: seleccionamos un primer elemento al azar, anotamos su identificación y
lo volvemos a colocar entre los demás, luego seleccionamos un segundo elemento al azar, anotamos su
identificación y volvemos a colocarlo con los demás y así sucesivamente hasta haber registrado los r elementos,
Así el número de maneras diferentes de seleccionar los r elementos es: n r

Ejemplo:
Sean 4 elementos a, b, c, d y seleccionemos 2 al azar. Si el muestreo se hace con remplazo el número de
maneras diferentes de seleccionar 2 elementos es 4 2 = 16, los cuales serían
(a,a), (a,b), (a,c), (a,d), (b,a), (b,b), (b,c), (b,d), (c,a), (c,b), (c,c), (c,d), (d,a), (d,b), (d,c), (d,d)
Cada resultado indica cuales elementos fueron seleccionados y en qué orden.

Ejercicio:
Sea un juego de barajas de 52 cartas (26 rojas y 26 negras, de ellas 13 son picas , 13 corazones ,
13 tréboles y 13 diamantes ). Si extraemos dos cartas del juego de baraja y el muestreo se hace con
reemplazo. ¿Cuál es la probabilidad de que la primera carta extraída sea negra y cuál la probabilidad de que la
segunda carta extraída también lo sea?

Solución: Como se trata de un experimento con reemplazo, la probabilidad de que la primera carta sea negra es 26/52 y
la probabilidad de que la segunda carta extraída también sea negra continua siendo 26/52.
15
SELECCIÓN SIN REEMPLAZO.
Si tenemos n elementos y seleccionamos r al azar procedemos de la siguiente forma: escogemos al azar un
elemento, anotamos su identificación y lo separamos de los demás y luego seleccionamos un segundo elemento
al azar, entre los (n – 1) elementos restantes y así sucesivamente hasta obtener los r elementos, Así el número de
 n
maneras diferentes de seleccionar los r elementos será:  
r  
Ejemplo:
Sean 4 elementos a, b, c, d y seleccionemos 2 al azar. Si el muestreo es hecho sin reemplazo el número de
maneras diferentes de seleccionar 2 elementos es
4 4!
    6 los cuales serían (a,b), (a,c), (a,d), (b,c), (b,d), (c,d)
2
  2 ! 4  2!

TIPOS DE EVENTOS O SUCESOS.


SUCESO INCOMPATIBLE (disjuntos o mutuamente excluyentes).
Como ya dijimos en la definición operacional de términos, dos o más sucesos son mutuamente excluyentes si
ellos no ocurren simultáneamente o si su intersección es vacía, es decir, si la ocurrencia de uno cualquiera de
ellos imposibilita la ocurrencia de los otros. De la teoría de conjuntos se sabe que dos o más conjuntos que no
tengan puntos muestrales en común su intersección es vacía o nula. Por ejemplo, sean lo sucesos E1 y E2
señalados en la figura, su intersección es nula, (E 1  E2 = ) porque no tienen puntos muestrales en común, por
lo tanto, E1 y E2 son sucesos mutuamente excluyentes y la P(E1  E 2) = 0
La probabilidad de ocurrencia de E1 o E2, es la suma de las
S
probabilidades de cada uno.
E1 E2 P (E1 ó E2) = P (E1  E 2) = P (E1) + P (E2)
Si E1, E2, … , En son mutuamente excluyentes dos a dos, entonces
P(E1  E2  …  En) = P(E1) + P(E2) + … + P(En)

Ejemplos:
1) En el lanzamiento de una moneda. La probabilidad de obtener una cara y un sello simultáneamente es
imposible, es decir, si A = sale cara y B = sale sello, entonces A  B = . Por lo que A y B son
mutuamente excluyentes. Mientras que si en el experimento lanzar dos monedas simultáneamente definimos los
sucesos A = sale cara = CC, CS, SC y B = sale sello = CS, SC, SS e intersectemos A y B, resultaría
A  B ≠ . Lo que significa que A y B no son mutuamente excluyentes. Como puedes ver se puede obtener
cara y sello al mismo tiempo al lanzar dos monedas.

2) En una caja hay 3 bolas rojas, 4 negras y 3 verdes. En cada ensayo se saca una bola y se devuelve a la caja.
Calcular la probabilidad de extraer: a) una bola roja o negra, b) rojas o verde.
Solución.
Procedimiento:
a. Se calculan las probabilidades de cada evento:
fr 3 fn 4 fv 3
P rojas =  P negras =  P verdes = 
n 10 n 10 n 10

3 4 7
b. La probabilidad de extraer una bola roja o negra es: Proja ó negra = Proja + Pnegra     0,7
10 10 10

3 3 6
c. La probabilidad de extraer una bola roja o verde es: Proja ó verde = Proja + Pverde     0,6
10 10 10
16
3) De un grupo de profesionales recién graduados 125 son licenciados en Educación, 120 en Relaciones
Industriales, 80 en Bioanálisis y 75 en Economía. Si se elige una persona al azar de este grupo, ¿qué
probabilidad existe de que la persona elegida, sea graduado en Educación ó Bioanálisis?

Solución.
Procedimiento:
a. Se calcula, por separado, la probabilidad de que la persona elegida sea o Licenciado en Educación o
Bioanalista.
f L.E = 125; f R.I = 120; f Bioan = 80; f EC = 75
n = 125 + 120 + 80 + 75 = 400

f LE 125 80
P L.E =  ; P L. Bioanalista =
n 400 400

b. Como los eventos son mutuamente excluyentes (no existe para este ejemplo ninguna persona graduada en
ambas profesiones), se aplica la fórmula respectiva.
125 80 205
P L.E ó Bioanalista =    0,5125
400 400 400

c. Interpretación: Si del grupo de recién graduados se selecciona una persona al azar, existe una probabilidad
de 0,5125 de que la persona seleccionada sea licenciado en Educación o Bioanálisis.

4) De unas barajas compuestas por 52 cartas, se extrae aleatoriamente una carta. ¿Cuál es la probabilidad de
que la carta extraída sea un as o un rey?

Solución.
Procedimiento:
a. La extracción de un as es el evento E 1
b. La extracción de un rey es el evento E2
c. Los eventos son mutuamente excluyentes, ya que no existen puntos muestrales comunes, es decir, no
existe as de rey.
d. En un juego de 52 cartas, existen 4 ases y 4 reyes.
e. Se calcula la probabilidad de cada evento por separado

4 1
P E1 = P as = 
52 13

4 1
P E2 = P rey = 
52 13

f. Se sustituye en la fórmula para eventos mutuamente excluyentes

1 1 2
P E1 ó E2 =  
13 13 13

g. Interpretación: En un juego de barajas de 52 cartas, al extraer una baraja al azar, existe la probabilidad de
que de 13 extracciones en 2 ocasiones sea un as o un rey.
17
SUCESO COMPATIBLE (Solapados o no mutuamente excluyentes).
Dos eventos E1 y E2, son compatibles si tienen puntos muestrales comunes. Los puntos muestrales comunes a
E1 y E 2, forman un subconjunto llamado Intersección de E1 y E2, y se representa por E1  E2.

S La zona coloreada representa la intersección de E1 y E2: E1  E2.


La fórmula para calcular la probabilidad de dos eventos solapados es:
E1 E2
P E1  E 2 = P E1 ó E2 = P E1 + P E2 – P E1  E2
Donde: P E1  E 2 = P E1 . P E2

La fórmula para tres eventos solapados:


PE1  E2  E3 = PE1 + PE2 + PE3 – PE1  E2 – PE1  E 3 – PE2  E3 + PE1  E2  E3

S E1  E2

E1 E2
E1  E2  E3

E3
E1  E 3 E2  E3

Ejemplos
1. De un juego de 52 barajas, se extrae una carta al azar ¿Cuál es la probabilidad de extraer un as o una espada
(pica ) o ambas cosas, en una sola extracción?
Solución.
Procedimiento:
a. Los dos eventos son:
E1: Extracción de un as (existen 4)
E2: Extracción de una espada (existen 13)

b. Los dos eventos son compatibles ya que existe un as de espada.


c. Se calcula la probabilidad de cada evento
4 13
P E1 = P as = ; P E2 = P espada =
52 52

d. Se consigue la probabilidad: P E1  E2


4 13 4  13 1
P E1  E2 = P E1 . P E2    
52 52 52  52 52

e. Se sustituye en la fórmula para eventos compatibles o solapados:


4 13 1 4
P E1  E2 = P E1 + P E2 – P E1  E2    
52 52 52 13
18
2. En un liceo de Cagua se conoce la siguiente distribución de estudiantes clasificados por años y sexo.
Varones (V) Hembras (H) Total
Primer año (E1) 100 80 180
Segundo año (E2) 70 50 120
Tercer año (E3) 50 40 90
Total 220 170 390
Determina la probabilidad de que al seleccionar un estudiante al azar, sea de segundo año o hembra.
Solución.
Procedimiento:
a. Los eventos son; E 2: Que el estudiante elegido sea de 2do año ; H: Que el estudiante elegido sea hembra
b. Los dos eventos son solapados ya que el estudiante seleccionado puede ser de segundo año y a la vez hembra.
c. Se calculan las probabilidades de ambos eventos
f 120 12 f 170 17
P  E2 =    0,31 P H =    0,44
n t 390 39 n t 390 39

d. Se halla la probabilidad de que el estudiante elegido sea de segundo año y a la vez hembra:
P  E2  H = P  E2 . P H
12 17 68
    0,13
39 39 507
e. Se sustituye en la fórmula para eventos solapados: P  E2  H = P  E2 + P  H – P  E2  H
 0,31  0,44  0,13  0,62
f. Interpretación: Si del liceo en referencia se elige un estudiante al azar, existe una probabilidad de 0,62 de que
sea de segundo año y hembra.

SUCESOS IGUALMENTE PROBABLES O EQUIPROBABLES.


Dos sucesos son equiprobables si tiene igual probabilidad de ocurrir y el espacio muestral de donde provienen
estos sucesos lo llamamos espacio muestral equiprobable.
Si A es un suceso cualquiera definido en un espacio muestral S, formado por r sucesos elementales, es decir,
E = e1, e2, e3, … , er y, además, sabemos que,
P(E) = P(e1) + P(e2) + P(e3) + … + P(er) y como
P(e1) = P(e2) = P(e3) = … = P(er) entonces
1 1 1 1
P E      r veces 
n n n n

Nota: Selección al azar o aleatoria: Es el procedimiento mediante el cual cada uno de los elementos de la
población posee la misma oportunidad de ser elegido o extraído para formar parte de una muestra. La expresión
“seleccionar un elemento al azar de un conjunto E” significa que E es un espacio muestral equiprobable, donde
cada elemento o suceso elemental tiene la misma probabilidad de ser seleccionado o de ocurrir. Por lo que
1
PE   ; si E tiene n elementos.
n

Ejemplo: En el experimento lanzar dos monedas simultáneamente, el espacio muestral está definido como
E = CC, CS, SC, SS, veamos algunos sucesos equiprobables:
A = CC y B = CS, ya que P(A) = P(B) = ¼
19
EVENTOS COMPLEMENTARIOS.
Dos eventos E1 y E2, son complementarios si el segundo es un subconjunto que contiene todos los puntos
muestrales del espacio muestral que no están en el primero. Los eventos complementarios son a su vez
mutuamente excluyentes:
E1  E2 = S y E1  E2 = 

S
E E'

En el gráfico, S representa el espacio muestral (el rectángulo), E’ es el complementario de E, es decir, E’ es lo


que le falta a E para ser igual a S.
E’ se lee “complementario de E” o “no E”
La probabilidad del espacio muestral es 1; P S = 1, por lo que se tiene
P S = P E + P E’ = 1
P E’ = P S – P E’ = 1 – P E

En general: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 – P(A)


y la probabilidad de la unión de dos sucesos complementarios es igual a 1.

Ejemplo:
¿Cuál es la probabilidad de que la suma de los números que salgan al lanzar dos dados no sea 6?

Solución.
Procedimiento:
a. Se determina para la prueba aleatoria, la cantidad de puntos muestral. Para ello se multiplica el número de
puntos muestrales de cada dado: 6. 6 = 36.
b. Se halla la probabilidad de los casos favorables, es decir, la probabilidad de que la suma sea 6.

Casos favorables
Dado 1 Dado 2
1 5
2 4
3 3
4 2
5 1

Total de casos favorables: 5  P E = 5/36

c. Se aplica la fórmula de eventos complementarios


5 31
P E’ = 1 – P E = 1 – 
36 36

d. Interpretación: Si se lanzan dos dados simultáneamente existe una probabilidad de 31/36 de que la suma de las
caras no sea 6.
20
COMPROBACIÓN DE LOS APRENDIZAJES
Si A y B son dos sucesos no mutuamente excluyentes definidos en S, entonces P(AB) = P(A) + P(B) – P(A  B)
Si A y B son dos sucesos cualesquiera definidos en S, entonces P(A  B)  PA  B  PA  PA  B

Ejemplo: Sean A y B eventos con P(A) = 3/8, P(B) = 1/2 y P(AB) = 1/4. Hallar:
a) P(AB) b) P A  c) P(A  B) d) P(A  B) e) P(A  B) f) P(B  A)
Respuesta:
a) P(AB) = ? Como A  B ≠ . A y B son no mutuamente excluyentes. Luego,
3 1 1 3 4  2 5
P(AB) = P(A) + P(B) – P(A  B)       0,625
8 2 4 8 8


b) P A = ?  3 83 5
P A  1  PA   1 
8

8
  0,625
8

  5 85 3
c) P(A  B) = ? P(A  B)  P A  B  1  PA  B  1  
8 8
  0,375
8

d) P(A  B)   1 3
P(A  B)  P A  B  1  PA  B  1    0,75
4 4
(*)

Los otros dos quedan como ejercicios.

Dualidad de Morgan (i)  


P AB  P AB   (ii)  
P A  B  P(A  B) La barra se lee “complemento”

(iii) P( A )  P A  ; P( A ) se lee “probabilidad del complemento del complemento de A”


Nota: Algunos textos denotan el complemento con un apóstrofe (’). Así, P(A' ) que se lee “Probabilidad del complemento de A”

Ejercicio: Sean A y B eventos con P(AB) = 3/4, P(A) = 2/3 y P(AB) = 1/4. Hallar:
a) P(A) b) P(B) c) P(A  B)

Probabilidad de un suceso Sea A un suceso definido en S. La probabilidad de un suceso A, designada por


P(A), es la suma de las probabilidades de todos los puntos muestrales de A. Ejemplo: Determinemos la
probabilidad de obtener exactamente dos sellos al lanzar tres monedas.
Solución: Definamos su espacio muestral, S = CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS
Como; n = 3 (número de monedas) y r = 2 (resultados posibles). Entonces, rn = 23 = 8 (resultados posibles)
Sea el suceso A = Obtener exactamente dos sellos; A = CSS, SCS, SSC
1 1 1 3
Luego, P(A)      0,375
8 8 8 8
Como podrás observar la probabilidad de ocurrencia de cada punto muestral es 1/8.
Ejercicios:
1) George Gamow y Marvin Stern, en su estimulante librito, Puzzle-Math, cuentan acerca de un sultán que pensó en
aumentar el número de mujeres de su país, con respecto al número de hombres, para que los hombres pudieran tener
harenes más grandes. Para lograr su propósito, formuló la siguiente ley: en cuanto una madre dé a luz su primer hijo
varón, se le prohibirá tener más niños. De esta manera, argumentaba el sultán, algunas familias tendrían varias mujeres y
sólo un varón, pero ninguna familia podría tener más de un varón. No pasaría mucho tiempo sin que el número de mujeres
fuera mayor que el de varones. ¿Crees que la ley del sultán dará resultados?
2) Tres caballos T, H, B, intervienen en una carrera. El caballo T tiene el doble de probabilidad de ganar que H
y este tiene el doble de B. ¿Cuáles son las probabilidades de ganar de cada caballo?

3) Se lanzan dos dados simultáneamente. Determinar la probabilidad de: a) Obtener un uno y un dos.
b) Que la suma de sus resultados de 7. c) Que el producto de sus resultados sea múltiplo de 3.

21
PROBABILIDAD CONDICIONAL.
A menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otro y es de frecuente interés
obtener la probabilidad de un evento, donde dicho evento está condicionado a la ocurrencia de un subconjunto
del espacio muestral (otro evento).
Si los sucesos E1 y E2 pertenecen al mismo espacio muestral S y si PE2 ≠ 0, entonces la probabilidad
condicional de que ocurra el evento E1, dado que el evento E2 haya ocurrido, se llama probabilidad condicional
del evento E1, y se representa por P E1 / E2, que se lee “probabilidad de E1 dado E2” y se determina a través de
la expresión:
P  E1  E 2 
P E1 / E2 = ; PE2 ≠ 0
P E2

n  E1  E 2 
También P E1 / E2 =
n E2
n  E1  E 2  = Es la cantidad de puntos muestrales de la intersección entre E 1 y E2
n  E 2  = Es la cantidad de puntos muestrales del evento E2.

La probabilidad condicional es una probabilidad calculada en un espacio muestral reducido, E 2; pues a partir
de la información se sabe con probabilidad 1 que el evento E2 ya ocurrió. En la práctica se puede resolver este
problema usando la fórmula de la definición, esto es calculando P E1  E2 y P E2 con respecto al espacio
muestral reducido E2, es decir, del evento que condiciona.
El termino probabilidad condicional toma en cuenta la posibilidad de que la probabilidad de E2 pueda
depender del hecho de que el suceso E1 haya o no ocurrido.

Ejemplo 1: Con los datos del ejemplo 2 (página 19), calcular la probabilidad de que una alumna sea
seleccionada dado que la persona seleccionada estudie segundo año en el referido liceo.

Solución.
Procedimiento:
a. H: Es el evento “ser alumna”
b. E2: Es el evento ser estudiante de segundo año
c. Se pide la probabilidad de H dado E2, es decir, P H / E2
d. Se aplica la fórmula para probabilidad condicional.
P H  E 2  50 5
P H/E 2    
P E 2  120 12
Varones Hembras Total
Primer año E1 100 80 180 n  E 1  E 2  50 5
Segundo año E2 70 50 120 P E1 / E2 =  
n E2 120 12
Tercer año E 3 50 40 90
Total 220 170 390

e. Interpretación: La probabilidad de que una alumna sea seleccionada dado que sea de segundo año es igual a
5/12.

Ejemplo 2: De la aplicación de una encuesta en una empresa de la Región Central, se sabe que el 40 % de los
obreros son mujeres y que el 20 % de todas las obreras han iniciado estudios medios. ¿Qué probabilidad existe
de que al seleccionar un obrero de forma aleatoria, haya iniciado estudios medios, si se sabe que se seleccionó
una mujer?
22
Solución. (Procedimiento):
a. E1: Es el evento “ser mujer”
b. E2: Es el evento haber iniciado estudios medios
c. La probabilidad de que la persona seleccionada haya iniciado estudios medios dado que es mujer, es:
P E2  E1 = P E2 y E 1 = 20/100 = 1/5
d. La probabilidad de que la persona sea mujer, es: P E1 = P es mujer = 40% = 40/100 = 2/5
e. La probabilidad de que el obrero seleccionado haya iniciado estudios medios dado que es mujer, es:
P E 2  E 1  1 / 5
P E2 / E1 =   0,5
P E 1  2/5
f. Interpretación: La probabilidad de que al seleccionar al azar un obrero que haya iniciado estudios medios dado
que es mujer, es de 0,5.

Ejemplo 3:
Una empresa tiene 300 trabajadores de los cuales 100 son casados y 30 son divorciados. En dicha empresa
trabajan 200 hombres, 85 de los cuales son casados y 95 son solteros. Se toma un trabajador al azar.
a) Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad de que sea mujer?
b) Si el trabajador seleccionado es mujer, ¿cuál es la probabilidad de que sea soltera?
c) ¿Cuál es la probabilidad de que sea mujer o su estado civil sea casado (a)?
Solución. (Procedimiento):
Lo primero es extraer la información que proporciona el problema y ver cómo se puede completar la siguiente.
Partamos del hecho de que la información proporcionada se puede clasificar de acuerdo a dos criterios. El sexo
de los trabajadores y el estado civil de los mismos. El siguiente cuadro muestra la información dada y la
deducida utilizando el concepto de complemento de un evento
Sexo Estado civil Total
Casado (C) Soltero (D) Divorciado (E)
Femenino (A) 15 75 10 100
Masculino (B) 85 95 20 200
Total 100 170 30 300

Como se puede observar se está totalizando tanto por filas como por columnas, es decir, de acuerdo a los dos
criterios de clasificación de la información. A esto se le llama probabilidades marginales y a la información del
interior del cuadro se le llama probabilidad conjunta de los dos eventos (criterios de clasificación). Resolviendo
el problema se tiene:
a) Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad de que sea mujer? En este caso el evento
condicionante es que el trabajador sea soltero y el evento dependiente es que sea mujer
Los problemas de probabilidad de eventos dependientes se pueden resolver de dos maneras: respecto del
espacio muestral original y respecto al espacio muestral restringido del evento que condiciona. Para el primer
caso
P A  D  75 / 300 75 75 170
P A / D     ; P A  D   y P D  
P D  170 / 300 170 300 300

Para el segundo caso, es decir, respecto al espacio muestral restringido del evento condicionante se tendría que
ver cuántas veces se repite el evento trabajador de sexo femenino y cuántas veces se repite el evento trabajador
soltero. De acuerdo a esto se tiene que:
P A  D  75
P A / D    Como podemos observar ambos resultados coinciden.
P D  170

Las situaciones b) y c) quedan como ejercicios para el estudiante.

23
EVENTOS INDEPENDIENTES (no relacionados).
Dos sucesos o eventos aleatorios E1 y E2, son independientes entre sí cuando la ocurrencia o no ocurrencia de
uno de ellos en una prueba, no afecta la probabilidad del otro en cualquier otra prueba. Es decir, si el suceso A
no depende del suceso B y viceversa, entonces A y B son sucesos independientes o no correlacionados.
En el lanzamiento de una moneda la probabilidad de obtener cara es ½ y la probabilidad de obtener cara en
otra prueba, es también ½. Por lo que, los dos eventos E1 y E2, son independientes.

La probabilidad de que ocurran ambos simultáneamente


es igual al producto de las probabilidades de que ocurra cada uno de ellos.

La fórmula para buscar la probabilidad de que E1 y E2, aparezcan cuando sean independientes es:

P E1  E2 = P E1 y E2 = P E1 . E2 = P E1 . P E2

n  E1  E 2 
También P E1 y E 2  
n S

n  E1  E 2  Es la cantidad de puntos muestrales de la intersección entre E 1 y E2


n  S Es la cantidad de puntos muestrales del espacio muestral

Dos eventos E1 y E2 son independientes si se cumple cualquiera de las siguientes condiciones:

 P E1 / E 2   PE1 E2 no tiene ningún efecto sobre E1

 P E 2 / E1  PE 2  E1 no tiene ningún efecto sobre E2

 P E1  E 2   PE1 PE 2 

Motivación de la definición:
Sean E1 y E2, dos sucesos tales que P(E2) > 0, intuitivamente E1 es independiente de E 2 si la probabilidad de E1
condicionada por E2 es igual a la probabilidad de E1. Es decir si:

P E1 / E 2   PE1 
P E1  E 2 
Nótese que de la propia definición de probabilidad condicional P E1 / E 2  
P E 2 

Se deduce que P E1  E2 = P E1 / E2 P E2 (despejando)

Y dado que P E1 / E2 = PE1 deducimos trivialmente que P E1  E2 = P E1 P E2

Nótese, finalmente, que si el suceso E1 es independiente del suceso E 2, automáticamente el suceso E 2 es


independiente del suceso E1.

Ejemplo.
Se lanzan dos dados simultáneamente. Uno verde y otro rojo. ¿Cuál es la probabilidad de que V  4 y R  2?

Solución. (Procedimiento)
a. Se construye el espacio muestral (en un diagrama cartesiano), señalando los puntos muestrales para cada dado
24
Dado (V) b. Para el dado rojo existen 12 puntos muestrales,
E2 = R  2 que resultan de la combinación de los puntos 1 y 2
6 º º º º º º con los puntos 1, 2, 3, 4, 5 y 6 del dado verde.

5 º º º º º º E1 = V  4 c. Para el dado verde existen 18 puntos muestrales


que resultan de combinar los puntos 4, 5 y 6 con
4 º º º º º º los puntos 1, 2, 3, 4, 5 y 6 del dado rojo.
3 º º º º º º
d. Se calcula la probabilidad para cada evento:
2 º º º º º º 18 1
P E1 = P V  4 = 
1 º º º º º º 36 2
12 1
1 2 3 4 5 6 Dado (R) P E2 = P R  2 = 
36 3

e. Se sustituye en la fórmula para eventos independientes


1 1 1
P E1 y E2 = P  V  4 y R  2 = P E1 . P E2   
2 3 6
f. También se obtiene el mismo resultado dividiendo los puntos muestrales de la intersección de los dos eventos,
por la cantidad de puntos muestrales del espacio muestral.
n E 1  E 2  6 1
P E1 y E2 =  
n S 36 6

g. Interpretación: Si se lanzan dos dados simultáneamente, uno rojo y otro verde, la probabilidad de que el verde
muestra una cara con números mayores o iguales a 4 y que el rojo muestra una cara con números menores o
iguales a dos es de 1/6.

Propiedades:
La independencia de sucesos es algo muy importante para la estadística y es condición necesaria en multitud
de teoremas. Por ejemplo, una de las primeras propiedades que se derivan de la definición de sucesos
independientes es que si dos sucesos son independientes entre sí, la probabilidad de la intersección es igual al
producto de las probabilidades.

Ejercicios:
1.- Sea el experimento lanzar un dado dos veces y anotar el número que sale en el mismo orden de
lanzamiento. Determinemos la probabilidad de que en el primer lanzamiento sale un número impar y en el
segundo sale un 5 ó un 6.
2.- Un impulso eléctrico debe pasar del punto I al punto II para producir una señal. Para llegar al punto II debe
pasar por dos componentes electrónicos E1 y E2. La trayectoria del impulso se interrumpe si falla cualquiera de
los dos componentes. La probabilidad de que el componente E1 no falle es 0,7 y la probabilidad de que el
componente E2 no falle es de 0,8. Además, la probabilidad de que al menos uno no falle es de 0,94. ¿Cuál es la
probabilidad de que la señal se produzca?

3- Para designar al asistente de curso de la sección CP401 de estadística II, se presentaron cuatro candidatos:
Luisa, María, Carlos y Edgar. Se decidió que se haría la primera votación entre los estudiantes postulados y
quien ganara sería el principal. Luego se haría una nueva votación entre los tres postulados que quedaran y el
mayor votado sería el suplente.
a) Si se sabe que el asistente principal electo fue Carlos, ¿cuál es la probabilidad de que María sea la
suplente?
b) Si se sabe que el suplente fue una mujer, ¿cuál es la probabilidad de que el asistente sea una mujer
también?
25
EVENTOS DEPENDIENTES (o relacionados).
Dos o más eventos son dependientes cuando el conocimiento de la verificación de uno de ellos altera la
probabilidad de verificación del o de los otros. La fórmula para calcular la probabilidad de eventos dependientes
es, si los eventos son E1 y E2:
PE1  E2 = PE1 . PE2 / E1 ó PE2  E1 = PE2 . PE1 / E2
(Regla de la multiplicación sin reemplazamiento)
Los eventos mutuamente excluyentes deben ser dependientes.

Ejemplo 1: Si voy para la marcha no puedo asistir a clase. Como observarás estos sucesos están relacionados,
son dependientes, ya que ir a la marcha (ocurrencia del suceso) afecta la ocurrencia del suceso “asistir a clases”
puesto que la ausencia a clase depende de que vaya para la marcha.
Ejemplo 2: Una caja contiene 5 bolas blancas y 3 negras. Se hace una primera extracción y sale una bola
blanca. ¿Cuál es la probabilidad de que en una segunda extracción sin reemplazo salga una bola blanca?
Solución.
Procedimiento:
a. E1: Es el evento primera extracción de una bola blanca.
b. E2: Es el evento segunda extracción de una bola blanca.
c. Se calcula la probabilidad de extraer una bola blanca
5 5
P E1 = P B. blanca 
53 8
d. Se halla la probabilidad de sacar una bola blanca en una segunda extracción dado que en la primera extracción
salió blanca y no hubo remplazamiento. P E2 / E1= 4/7

B B B B B B B B B
N N N N N N

1ra Extracción 2da Extracción

e. Se sustituye en la fórmula de eventos dependientes


5 4 5
PE1  E 2 = PE1 . PE2 / E1   
8 7 14

f. Interpretación: 5/14 es la probabilidad de sacar en una segunda extracción sin remplazo una bola blanca si en
la primera extracción salió una blanca.

Ejemplo 3: En un juego de barajas españolas (40) cartas), seleccionamos dos cartas al azar y determinamos la
probabilidad de que la primera carta tenga una figura de espada y la segunda carta no tenga una figura de espada.

Solución.
Procedimiento:
Sean los sucesos
A = la primera carta tenga una figura de espada
B = la segunda carta no tenga una figura de espada
Luego,
PA y B = PA  B = PA . PB / A
10 30
   0,1923
40 39
26
REGLAS DE LA PROBABILIDAD.
REGLA DE LA ADICIÓN.
Regla de la adición para sucesos no mutuamente excluyentes.
La regla de la adición expresa que la probabilidad de que ocurra el suceso A o B o ambos, es igual a la
probabilidad de A más la probabilidad de B menos la probabilidad de que ocurran ambos.

Simbólicamente: PA ó B = PA  B = PA + PB  – PA  B

Ejemplo: Se lanza un dado no cargado. Usted gana 100 Bs si el resultado es menor que 5 o divisible por 2.
¿Cuál es la probabilidad de ganar?
Solución.
Procedimiento:
- Definamos el espacio muestral S = 1, 2, 3, 4, 5 6
Los sucesos definidos son los siguientes
- A = resultado es menor que 5  A = 1, 2, 3, 4  P(A) = 4/6 (1)
- B = resultado es divisible por 2  B = 2, 4, 6  P(B) = 3/6 (2)
A  B =  resultado es menor que 5 o resultado es divisible por 2
Luego, PA  B = PA + PB  – PA  B (3)
- A  B =  resultado es menor que 5 y resultado es divisible por 2
A y B son no mutuamente excluyentes, es decir, A  B ≠ 
- A  B = 2, 4  P(A  B) = 2/6 (4)
Sustituyendo (1), (2) y (4) en (3), tenemos:

4 3 2 43 2 5
- PA  B       0,8333
6 6 6 6 6

Así, la probabilidad de ganar 100 Bs, es 0,83 ó 83,33%

Regla de la adición para sucesos mutuamente excluyentes.


Si A y B son mutuamente excluyentes (en el sentido de que no pueden ocurrir ambos al mismo tiempo),
entonces:
PA  B = PA + PB 

Ejemplo: Si se extrae una carta de un juego de baraja española (40 cartas). ¿Cuál es la probabilidad de que la
carta sea un as o un seis de basto?
Solución.
Procedimiento:
- Sea el espacio muestral S = C1, C2, … , C40
Los sucesos definidos son los siguientes:
- A = extraer un as = 1, 2, 3, 4  P(A) = 4/40
- B = extraer un seis de basto = 1  P(B) = 1/40
A  B =  extraer un as o un seis de basto
Luego, PA  B = PA + PB  – PA  B; pero A  B = 
Nótese que al extraer una carta del juego de baraja, esta no puede ser simultáneamente un as y un seis de basto PA  B = P  = 0
Por lo tanto, PA  B = PA + PB 
4 1 5
    0,125 ó 12,5%
40 40 40
27
REGLA DE LA MULTIPLICACIÓN.
La regla de la multiplicación expresa que la probabilidad de que ocurran A y B es igual a la probabilidad de A,
multiplicada por la probabilidad de que ocurra B, dado que A ha ocurrido.
Simbólicamente:
PA y B = PA  B = PA . PB/A

Demostración:
Partiendo de la definición de probabilidad condicional (página 21)

P A  B
PB A  multiplicando ambos miembros por PA, resulta P A  B  PA  PB A
PA

Nota: Si los sucesos A y B son independientes, la probabilidad PB/A es igual a la probabilidad incondicional de B, es decir,
PB/A = PB. Este es el caso de la regla de la multiplicación con restitución: PA  B = PA . PB regla de la multiplicación

Ejemplo: Se lanzan dos dados una sola vez. ¿Cuál es la probabilidad de que la suma sea un número par y que
aparezca seis (6) en al menos uno de los dados?

Solución.
Procedimiento:
- Determinemos su espacio muestral S 1;1 1;2 1;3 1;4 1;5 1;6
2;1 2;2 2;3 3;4 2;5 2;6
- Los sucesos definidos son 3;1 3;2 3;3 3;4 3;5 3;6
A = que la suma sea un número par 4;1 4;2 4;3 4;4 4;5 4;6
B = que aparezca un seis en al menos uno de los dados 5;1 5;2 5;3 5;4 5;5 5;6
6;1 6;2 6;3 6;4 6;5 6;6
- A  B = que la suma sea un número par y
que aparezca un seis en al menos uno de los dados
Aplicando la regla de la multiplicación
- PA  B = PA . PB/A determinemos las probabilidades de cada suceso.
- PA = 18/36; puesto que de un total de 36 resultados 18 dan como suma un número par
- PB/A = 5/18; probabilidad de que aparezca un 6 en al menos un dado, siempre que la suma sea par
- PB = 11/36; puesto que 11 de los 36 resultados contiene un 6 en por lo memos uno de los dados
Como puedes observar PB/A ≠ PB por lo que A y B son dependientes. (Ver nota en esta misma página)

- Los sucesos son dependientes, empleando la definición obtenemos:


18 5 5
PA  B = PA . PB / A     0,14
36 18 36

5
También PB  A = PB . PA / B pero PA / B  que es la probabilidad de que la suma sea un
11
número par, si sabemos que el 6 aparece en al menos uno de los dados. Luego, sustituyendo

11 5 5
PB  A  .   0,14
36 11 36
28
COMPROBACIÓN DE LOS APRENDIZAJES
COMPROBACIÓN DE INDEPENDENCIA.
Dos eventos A y B son independientes si y sólo si P(AB) = P(A) P(B) o P(B/A) = P(B).
De lo contrario se dice que son dependientes.

Ejercicio 1:
Lance dos monedas y observe el resultado. Defina estos eventos:
A = cara en la primera moneda; B = cruz en la segunda moneda
¿Son independientes los eventos A y B?

Ejercicio 2:
Se lanzan dos dados, uno verde y otro rojo, y se observan los números orientados hacia arriba.
Decida cuales de los siguientes pares de sucesos son independientes. Razone su respuesta.
A = la suma es 5 y B = ambos dados muestran el mismo número
A = la suma es 7 y B = el dado rojo es par
A = la suma es par y B = el dado rojo es par
A = la suma es impar y B = la suma es 12
A = la suma es 4 y B = ambos dados muestran el mismo número
A = la suma es 6 y B = el dado rojo es par

¿Cuál es la diferencia entre eventos mutuamente excluyentes e independientes?


Muchos estudiantes encuentran difícil indicar la diferencia entre eventos mutuamente excluyentes y eventos
independientes.
 Cuando dos eventos son mutuamente excluyentes o disjuntos, no pueden suceder ambos simultáneamente cuando se
realiza el experimento. Una vez que ha ocurrido el evento B, el evento A no es posible, así que P(A/B) = 0, o
viceversa. La ocurrencia del evento B afecta la probabilidad de que ocurra el evento A.
 Un par de eventos A y B no pueden ser mutuamente excluyentes e independientes a la vez.
Pruebe que si P(A) > 0 y P(B) > 0, entontes si A y B son mutuamente excluyentes no pueden ser independientes.
Supongamos que A y B son independientes, luego P(AB) = P(A) P(B). Por hipótesis A y B son mutuamente
excluyentes, entonces A  B = , es decir, P(A  B) = 0. Pero si P(A  B) = 0, entonces P(A) = 0 ó P(B) = 0 y
esto contradice la hipótesis. Luego, si A y B son mutuamente excluyentes no pueden ser independientes.
 Por tanto, los eventos mutuamente excluyentes deben ser dependientes.
 Cuando dos eventos son mutuamente excluyentes o disjuntos P(AB) = 0 y P(AB) = P(A) + P(B).
 Cuando dos eventos son independientes P(AB) = P(A) P(B) y P(AB) = P(A) + P(B) – P (A) P(B).

Ejercicio 3: Use las relaciones anteriores para hallar las probabilidades en la siguiente tabla.
P(A) P(B) Condiciones para los eventos A y B P(AB) P(AB) P(A/B)
0,3 0,4 Mutuamente excluyentes
0,3 0,4 Independientes
0,1 0,5 0,1
0,2 0,5 0

Ejercicio 4: En el siguiente cuadro se señalan las probabilidades correspondientes a un grupo de personas


relacionando su ocupación y su C.I. ¿Cuál es la probabilidad de que al elegir una persona del grupo esta tenga un C.I
por encima de 110 y sea licenciado?
Resultados Probabilidad
Lic., sobre 110 0,3
0,4
Lic., con menos de 110 0,1
No Lic., sobre 110 0,2
0,6
No Lic., con menos de 110 0,4

29
TEOREMA DE PROBABILIDAD TOTAL o Teorema de Eliminación.
Existen situaciones en que nos interesa conocer la probabilidad de un evento final que sea dependiente de la
aparición o no aparición de eventos en las etapas intermedias de un experimento. Estos casos se resuelven
mediante el Teorema de la Probabilidad Total.
Sea A1, A2, … , An, una partición del espacio muestral. An son los n eventos mutuamente excluyentes, su
unión es el espacio muestral, cada uno con probabilidades positiva. La fórmula para calcular la probabilidad de
un evento E cualquiera del que se conocen las probabilidades condicionales P(E/Ai), llamada probabilidad total
y que debe aparecer con cada uno de esos eventos mutuamente excluyentes, es:
n
P(E) = P(A1) . P(E/A1) + P(A2) . P(E/A2) + … + P(An) . P(E/An) equivalente a PE   PAi  P E/Ai
i 1

Vamos de deducir el teorema de la Probabilidad Total e introducir el teorema de Bayes.


Como paso previo desarrollaremos los conceptos que tales teoremas involucran.
1ra consideración:
Supongamos que tenemos n sucesos: A1, A2, … , An de un experimento aleatorio tal que son incompatibles dos a
dos, es decir, Ai  Aj =  ; i  j (que ocurran a la vez Ai y Aj es imposible)
Sabemos que P(A1  A2  …  An) = P(A1) + P(A 2) + … + P(An)
Por ejemplo, supongamos que tenemos una caja que contiene 5 bolas rojas, 2 amarillas, 3 verdes y 4 azules.
Calculemos la probabilidad de extraer al azar una bola roja o verde. P(R v V) = ?
Consideremos los sucesos: R = Obtener una bola roja, V = Obtener una bola verde

Nótese que la probabilidad de obtener una bola roja y verde a la vez (R  V) =  es


imposible, pues no hay bolas rojas/verdes, por lo que estos sucesos son incompatibles.

5 3 8 4
PR  V   PR   PV    
14 14 14 7
2da consideración
Supongamos ahora que A y B son sucesos de un experimento aleatorio y definamos el suceso B/A.
B/A = B si previamente ha ocurrido A. (Probabilidad condicional).
PB  A
Sabemos que el suceso A ocurrió, pero qué pasa con la probabilidad del suceso B: PB/A 
PA
Ejemplo: Consideremos el experimento aleatorio de lanzar un dado al aire, cuyo espacio muestral es
S = 1, 2, 3, 4, 5, 6. Sean los sucesos A = obtener un 4 y B = obtener un número par.
Calculemos la probabilidad de A si previamente ha ocurrido B de dos formas

1 Es claro que el espacio muestral de la condición es 2, 4 y 6, es decir 3 casos posibles,


PA/B 
3 luego la probabilidad de obtener 4 en estas condiciones es 1 de 3.

PA  B 1 6 1
También podemos valernos de la fórmula anterior PA/B   
PB 36 3

P(AB) la probabilidad de obtener 4 y par es la probabilidad de A = 1/6


Mientras que la probabilidad de B es tres casos favorables de 6 casos posibles: 3/6
(Acá consideramos el espacio muestral del experimento y no el de la condición).

30
A esta altura de nuestro desarrollo, ya estamos en condición de deducir el teorema de la Probabilidad Total
Supongamos, como ya dijimos que A1 , A 2 , … , An, son los n eventos mutuamente excluyentes de un
experimento aleatorio y constituyen una partición del espacio muestral S.

S En el dibujo podemos ver que los n-ésimos sucesos


A2 A1, A2, … , An, son incompatibles dos a dos, es decir,
E Ai  Aj =  ; i  j (que ocurran a la vez Ai y Aj es imposible).
A1 An
Además, S = A1 A2 , … ,  An 
. .. E, sería un suceso cualquiera que pudiera tener o no
parte de los An sucesos destacados en colores en el dibujo.
La unión de n sucesos incompatibles dos a dos es E.
A3 Es fácil ver que, en efecto, cada una de las regiones
coloreadas son trozos incompatibles.

E = (E  A 1)  (E  A2)  …  (E  An)  P(E) = P(E  A1) + P(E  A2) + … + P(E  An)

PE  Ai 
Nótese que PE/Ai    PE  Ai   PAi   PE/Ai  Válido para cualquier Ai, con i desde 1 hasta n.
PAi 

Si sustituimos PE  A i   PAi   PE/A i  por cada uno de los sumandos en P(E), tendremos

P(E) = P(A1) P(E/A1) + P(A2) P(E/A2) + … + P(An) P(E/An)

Teorema de la Probabilidad Total

Ejemplo 1: En un aula de dibujo hay 40 sillas, 30 con respaldo y 10 sin respaldo. Entre las sillas sin respaldo
hay 3 nuevas y entre las sillas con respaldo hay 7 nuevas. Elegida al azar una silla, ¿cuál es la probabilidad de
que esta sea nueva?
Solución:
3 7
7
N/R P NR     0,175
30 4 30
3
30
R
 
PN  PN/R  P N/R  0,175  0,075  0,25
4
40 3
N/ R  
P NR 
1 3

4 10
 0,075
sillas 10
1 R
4 10

Ejemplo 2: En un club deportivo, el 52% de los socios son hombres. Entre los socios el 35% de los hombres
practican la natación, así como el 60% de las mujeres. Si elegimos un socio al azar:
a) ¿Cuál es la probabilidad de que practique la natación?
b) Sabiendo que practica la natación, ¿cuál es la probabilidad de que sea una mujer?
31
Solución:
Sabemos que la Probabilidad de que sea hombre: PH   0,52

Probabilidad de que sea mujer: P H  1  0,52  0,48
Probabilidad de que nade dado que es hombre: PN/H   0,35
 
Probabilidad de que nade dado que es mujer: P N/ H  0,60

Aplicamos el teorema de la probabilidad total: Probabilidad de que nade  PN   PN  H   P N  H   (1)

Evaluemos la probabilidad condicional: PN/H    PNPH H 


P N  H 
PH 
y P N/ H 

Sustituyendo en (1) Probabilidad de que nade  PN   PH   PN/H   PH  P N/ H 

PN   0,52  0,35  0,48  0,60  0,47

a) La probabilidad de que un socio escogido al azar practique la natación es de 0,47  47%

b) Sabiendo que practica la natación, ¿cuál es la probabilidad de que sea una mujer?

  PHPN N   PN/PHN PH   0,600,47


P H/N 
  0,48  0,613
 61,3%

Ejemplo 3: Se lanza un dado una sola vez. Si aparece un 1, se selecciona una tarjeta de la caja 1. Si aparece un
3 ó un 5, se selecciona una tarjeta de la caja II y si sale un número par, se selecciona una tarjeta de la caja III.
¿Cuál es la probabilidad de seleccionar al azar 2 tarjetas verdes, sin remplazo?

Caja I Caja II

1 2 3 4 5 6

Caja III

Caja I: H1 Caja II: H2


B B B B B B B B
V V V V V
R R R R R R R

Caja III: H3
B
V V V V V V
R R R

32
Solución.
Procedimiento:
1. El diagrama correspondiente a la intersección del evento (aparición de 2 tarjetas verdes, sin remplazo) con
cada caja es el siguiente:

H1
H1  E
I H2  E H2

H3  E II

H3 III

2. El evento E (las dos tarjetas seleccionadas sean verdes), aparece con cada uno de los eventos H 1, H2 y H3, es
decir: H1  E, H2  E, H3  E.
3. Se calcula la probabilidad de aparición del evento E, con cada uno de los eventos H 1, H2 y H3.
4. La probabilidad de seleccionar la caja I ((H 1), es la probabilidad de que aparezca el número 1, al lanzar el
dado: P  H1 = 1/6.
5. La probabilidad de seleccionar la caja II ((H2), es la probabilidad de que aparezca un 3 ó un 5, al lanzar el
dado: P  H2 = 2/6.
6. La probabilidad de seleccionar la caja III ((H3), es la probabilidad de que aparezca un número par, al lanzar el
dado: P  H3 = 3/6.
7. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja I, es:

B B B B B B B B B B
V V V V V
R R R R

1ra extracción 2da extracción


P V = 3/10 P V  = 2/9

3 2 6 1
PE / H1 = P V . P V/V    
10 9 90 15

8. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja II, es:

B B B B B B
V V V
R R R R R R R R R R

1ra extracción 2da extracción


P V = 2/10 P V  = 1/9

2 1 2 1
PE / H2 = P V . P V/V    
10 9 90 45

33
9. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja III, es:

B B
V V V V V V V V V V V
R R R R R R

1ra extracción 2da extracción


P V = 6/10 P V  = 5/9

6 5 30 1
PE/H3 = P V . P V/V    
10 9 90 3

10. La probabilidad de seleccionar dos tarjetas verdes es:


P E = PH1. PE/H1 + PH2. P E/H2 + PH3. P E/H3
1 1 1 1 3 1 1 1 1
P E =        
6 15 3 45 6 3 90 135 6

1,5  1  22,5 25 5
P E =  
135 135 27

Actividades de comprobación del aprendizaje

Ejercicios:
1.- En una fábrica de enlatados se producen 5000 envases diarios. La máquina A produce 3.000 de estos envases,
de los que el 2% son defectuosos y la máquina B produce los 2.000 restantes de los que sabe que el 4% son
defectuosos. Determinar la probabilidad de que un envase elegido sea defectuoso.

2.- En un colectivo de inversores bursátiles, el 20% realizan operaciones vía internet. De los inversores que
realizan operaciones vía internet, un 80% consulta Infobolsaweb. De los inversores bursátiles que no realizan
operaciones vía internet sólo el 20% consulta InfoBolsaWeb. ¿Cuál es la probabilidad de que un inversor bursátil
elegido al azar en este colectivo consulte InfoBolsaWeb?

3.- Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada equipo
es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades de
error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía y observa que tiene un
error. Determine la probabilidad de que se ha usado el primer aparato.

34
TEOREMA DE BAYES.
La interpretación más aceptada del teorema de Bayes, es que su estructura permite el cálculo de probabilidades
después de haber sido realizado un experimento (probabilidades a posteriori), basándose en el conocimiento de
la ocurrencia de ciertos eventos que dependan del evento estudiado. Es decir, se parte de probabilidades
conocidas antes de efectuar el experimento (probabilidades a priori), las cuales son afectadas por las
probabilidades propias del experimento (las que aparecen durante la ocurrencia del evento).
PA i  E 
Partiendo de la probabilidad condicional de Ai dado E, para cualquier i, PA i /E  y aplicando en el
PE 
numerador la Regla de Multiplicación y en el denominador el Teorema de Probabilidad Total, obtenemos la
ecuación que representa al Teorema de Bayes

PA i  PE/Ai 
PA i /E  n
Los Ai son eventos mutuamente excluyentes, cuya unión es el espacio
muestral y E es el evento definido en ese espacio muestral tal que P E > 0.
 PA  PE/A 
i 1
i i

PA i  son las probabilidades a priori (causas)


PE/Ai  es la probabilidad de E en la hipótesis A i
PA i /E  son las probabilidades a posteriori (efectos)

En términos generales el teorema de Bayes es de enorme relevancia puesto que vincula la probabilidad de A
dado B con la probabilidad de B dado A. Es decir que sabiendo la probabilidad de tener un dolor de cabeza dado
que se tiene gripe, se podría saber -si se tiene algún dato más-, la probabilidad de tener gripe si se tiene un dolor
de cabeza, muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en todas sus
ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de aspectos causales dados los
efectos observados.
Se utiliza cuando dado un evento final, se desea conocer su origen o procedencia. Este teorema es el inverso
del Teorema de Probabilidad Total.

Ejemplo 1: (Vea página 34. Ejercicio N° 1)


En una fábrica de enlatados se producen 5.000 envases diarios. La máquina A produce 3.000 de estos envases,
de los que el 2% son defectuosos y la máquina B produce los 2.000 restantes de los que sabe que el 4% son
defectuosos.

a) Determinar la probabilidad de que un envase elegido sea defectuoso.


b) ¿Si el envase seleccionado es defectuoso, que probabilidad hay de que proceda de la máquina A?
¿Y de la B?

Solución:
La probabilidad de que un envase elegido sea defectuoso.
Llamemos D al suceso seleccionar un envase defectuoso y D al suceso seleccionar un envase no defectuoso.
El diagrama de árbol muestra la situación.

a) Se trata de calcular la probabilidad total de que el envase elegido sea defectuoso


Sumamos las ramas donde al final aparezca un envase defectuoso

35
3
- Máquina A envase defectuoso  P(AD) = P(A) P(D/A)  P(AD) =   0,02  0,012
5

 2
- Máquina B envase defectuoso  P(BD) = P(B) P(D/B)  P(BD) =   0,04  0,016
5

- PD   PA  D   PB  D   PA   PD/A   PB  PD/B  0,012  0,016  0,028

3
D P A/D    0,02  0,012
0,02 5

3 A
5 0,96 D P D   P A/D   PB/D   0,012  0,016  0,028

5000
envases
2
0,04 D P B/D    0,04  0,016
2 5
5 B
0,98 D

b) Teorema de Bayes. Sabiendo que el envase seleccionado ha sido defectuoso…


Relacionamos la rama que nos piden respecto de la probabilidad total.

PA  D  0,012
Probabilidad de que provenga de la máquina A: PA/D    0,4286
PD  0,028

P B  D  0,016
Probabilidad de que provenga de la máquina B: PB/D     0,5714
P D  0,028

Ejemplo 2: (Vea página 34. Ejercicio N° 2)


En un colectivo de inversores bursátiles, el 20% realizan operaciones vía internet. De los inversores que
realizan operaciones vía internet, un 80% consulta Infobolsaweb. De los inversores bursátiles que no realizan
operaciones vía internet sólo el 20% consulta InfoBolsaWeb. ¿Cuál es la probabilidad de que un inversor bursátil
elegido al azar en este colectivo consulte InfoBolsaWeb?

Solución:
a) Probabilidad Total: Obtener la probabilidad de que un inversor bursátil elegido al azar en este colectivo
consulte InfoBolsaWeb.
Nombramos los sucesos y hacemos un diagrama
Realiza operaciones vía internet: I  P(I) = 0,20

No realiza operaciones vía internet: I  P I  0,80
Consulta InfoBolsaWeb: IBW
No consulta InfoBolsaWeb: IBW
36
0,80 IBW PIIBW   0,20  0,80  0,16

I
0,20
0,20 IBW PIBW   PIIBW   PIIBW   0,16  0,16  0,32

0,20 IBW  
P IIBW  0,80  0,20  0,16
0,80
I

0,80 IBW

Probabilidad de que consulte InfoBolsaWeb


Sumamos las ramas donde al final aparezca una consulta a InfoBolsaWeb

- Internet y consulta InfoBolsaWeb  P(IIBW) = P(I) P(IBW/I)  P(IIBW) =


0,200,80  0,16

 
- No consulta internet y consulta infoBolsaweb  P I  IBW  0,80 0,20   0,16

 
- PIBW   PI  IBW   P I  IBW  0,16   0,16   0,32

b) Teorema de Bayes. Sabiendo que consulta infoBolsaWeb.

Relacionamos la rama que nos piden con respecto a la probabilidad total


Probabilidad de que consulte infoBolsaWeb y realice operaciones por internet

PI  IBW  0,16


PI/IBW     0,5
PIBW  0,32

Ejemplo 3: En el departamento de historias clínicas de un hospital, tres empleadas procesan los registros de
los pacientes. La primera procesa el 45% de las historias, la segunda el 35% y las tercera el 20%. Los errores
cometidos por las empleadas son 0,04; 0,06 y 0,02 respectivamente Al seleccionar al azar una historia de las
procesadas en una semana, se descubre que tiene un error. Se quiere saber la probabilidad de que la historia
médica haya sido procesada por cada una de las empleadas.

Solución.
Procedimiento:
1. Se recomienda construir un cuadro con los datos e identificar los eventos

Empleadas P Hi PE/ Hi PE  Hi P Hi/E


Proporción Proporción
de registros de error
H1 0,45 0,04 0,018 0,4186
H2 0,35 0,06 0,021 0,4884
H3 0,20 0,02 0,004 0,0930
∑ 1,00 1,000
37
2. Nótese que la suma de las proporciones y probabilidades de los eventos (grupos de empleadas H1, H2 y H3),
es igual a la unidad ∑P H1 = 1

3. La tercera columna del cuadro representa la probabilidad que existe de que cada grupo de empleadas cometa
errores según los resultados conocidos, es decir, P E/H1

4. Para aplicar la fórmula y determinar la probabilidad de que la historia clínica seleccionada provenga de cada
uno de los grupos de empleadas, es necesario calcular
PE  Hi, donde
PE  H1 = PE/H1.PH1 = 0,04 (0,45) = 0,018
PE  H2 = PE/H2.PH2 = 0,06 (0,35) = 0,021
PE  H3 = PE/H3.PH3 = 0,02 (0,20) = 0,004

5. Se aplica la fórmula del Teorema de Bayes para cada uno de los grupos de empleadas.
PH i   PE/H i 
PH i /E  donde
PE

P E = PH1. P E/H1 + PH2. P E/H2 + PH3. P E/H3


P E = 0,018 + 0,021 + 0, 004 = 0,043
Para cada grupo de empleadas
0,450,04
PH i /E   0,4186
0.043
0,350,06
PH i /E   0,4884
0.043
0,200,02 
PH i /E   0,0930
0.043

6. En el Teorema de Bayes la suma de las probabilidades de pertenecer a un grupo dado es siempre igual a la
unidad
∑PHi/E = 0,4186 + 0,4884 + 0,0930 = 1,000 y esto siempre debe cumplirse.

Ejemplo 4: En el ejemplo 3 del Teorema de Probabilidad Total, se halló la probabilidad de seleccionar


aleatoriamente sin remplazo, dos tarjetas verdes. Ahora nos interesa conocer la probabilidad de que las dos
tarjetas verdes provengan de cada una de las cajas.

Solución.
Procedimiento:
1. La probabilidad de que las dos tarjetas verdes provengan de la caja I, es:
1 6 6

PH 1   PE/H 1  6
PH 1 /E   6 90  540  = 0,06
PE 100 100 100
540 540

38
2. La probabilidad de que las dos tarjetas verdes provengan de la caja II, es:
2 1
PH 2  PE/H 2  6  45 2540 4 = 0,04
PH 2 /E    
PE 100 270100 100
540

3. La probabilidad de que las dos tarjetas verdes provengan de la caja III, es:
3 1
PH 3  PE/H 3  
3 / 18  90 = 0,90
PH 3 /E   6 3
PE 100 100 / 540 100
540

Ejercicios:
1. La probabilidad de que Judith estudie para su examen parcial de estadística es 0,30. Si estudia la probabilidad
de que apruebe el parciales de 0, 75; en tanto que si no estudia la probabilidad es de sólo 0,52.
a) ¿Cuál es la probabilidad de que Judith apruebe su examen parcial de estadística?
b) Dado que Judith aprobó su parcial. ¿Cuál es la probabilidad de que haya estudiado?

2. Una empresa tiene 4 fábricas que producen el mismo artículo. La producción de las fábricas se deposita en el
mismo almacén. En un período determinado, la fábrica A produjo el 20% de los artículos, la B el 40%, la C el
25% y la D el 15%. Los porcentajes de artículos defectuosos en las fábricas fueron 1%, 2%, 1,3% y 0,5%
respectivamente. Un artículo fue tomado al azar del almacén y resultó defectuoso. ¿Cuáles son las
probabilidades de que el artículo haya procedido de las fábricas A, B, C o D respectivamente?

3. Una fábrica que produce material para la construcción tiene 3 máquinas, a las que se les denomina A, B y C.
La máquina A produce tabique, la B adoquín y la C losetas. La máquina A produce el 50% de la producción total
de la fábrica, la B el 30% y la C el 20%. Los porcentajes de artículos defectuosos producidos por las máquinas
son, respectivamente, 3%, 4% y 5%. Si se selecciona un artículo al azar y se observa que es defectuoso,
encontrar la probabilidad de que sea un tabique.

4. A un congreso asisten 100 personas, de las cuales 65 son hombres y 35 son mujeres. Se sabe que el 10% de
los hombres y el 6% de las mujeres son especialistas en computación. Si se selecciona al azar a un especialista
en computación ¿Cuál es la probabilidad de que sea mujer?

39
TABLA DE EVENTOS PROBABILÍSTICOS.
Para un suceso E, su ocurrencia f de un total de n casos posibles está dada por: p = P (E) = f/n
La probabilidad de que no ocurra el suceso E, está dada por q = P (no E) = 1 – P (E)
Dos o más sucesos son
mutuamente excluyentes si La probabilidad de ocurrencia de E1 o E2,
SUCESO INCOMPATIBLE es la suma de las probabilidades de cada uno.
la ocurrencia de uno cualquiera
(mutuamente excluyentes).
de ellos imposibilita la ocurrencia
de los otros. P E1 ó E2 = P E1  E2 = P E1 + P E2

P E1  E2 = P E1 ó E2


SUCESO COMPATIBLE. Dos eventos E1 y E2, son solapados
(Solapados o si tienen puntos muestrales = P E1 + P E2 – P E1  E2
no mutuamente excluyentes). comunes.
Donde: P E1  E2 = P E1 . P E2

Dos eventos E1 y E2, son Los eventos complementarios son a su vez


complementarios si el segundo mutuamente excluyentes.
EVENTOS es un subconjunto que contiene
E1  E2 = S y E 1  E2 
COMPLEMENTARIOS todos los puntos muestrales del
espacio muestral que no están La probabilidad del espacio muestral es 1;
en el primero. P S = 1, luego P E’ = 1 – P E

Dos eventos E1 y E2, son


independientes cuando la
EVENTOS
ocurrencia o no de uno de ellos P E1  E2 = P E1 y E2 = P E1 . E2
INDEPENDIENTES = P E1 . P E2
en una prueba, no afecta la
(no correlacionados)
probabilidad del otro en cualquier
otra prueba.

Se representa por P E1/E2, que se lee


“probabilidad de E1 dado E2”
y se determina a través de la expresión:
P E1  E 2 
P E1 / E2 = donde
La probabilidad de que ocurra P E 2 
PROBABILIDAD el evento E1, dado que el evento E 2
CONDICIONAL ha ocurrido, se llama probabilidad P E 1  E 2 
condicional del evento E1. Es la cantidad de puntos muestrales
de la intersección entre E 1 y E2
P E 2 
Es la cantidad de puntos muestrales
del evento E2.

Dos o más eventos son


EVENTOS dependientes cuando el Si los eventos son E1 y E 2:
DEPENDIENTES conocimiento de la verificación de
(relacionados) uno de ellos altera la probabilidad PE1  E2 = PE1 . PE2 / E1
de verificación del o de los otros.

40
PROBABILIDAD. Reglas de Cálculo.
Pierre-Simon Laplace afirmó: "Es notable que una ciencia que comenzó con consideraciones sobre juegos de azar
haya llegado a ser el objeto más importante del conocimiento humano".
Los tres métodos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la
distribución binomial.

P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente.


P(A o B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes.
Siendo: P(A) = probabilidad de ocurrencia del evento A.
Regla de la adición
P(B) = probabilidad de ocurrencia del evento B.
P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B.

P(A y B) = P(A B) = P(A)P(B) si A y B son independientes.


Regla de la multiplicación.
P(A y B) = P(A B) = P(A)P(B|A) si A y B son dependientes.

Distribución Binomial: La probabilidad de ocurrencia de una combinación específica de eventos independientes y


mutuamente excluyentes se determina con la distribución binomial, que es aquella donde hay solo dos posibilidades,
tales como masculino/femenino o si/no.
1. Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación.
2. La serie de ensayos u observaciones constituyen eventos independientes.
3. La probabilidad de éxito permanece constante de ensayo a ensayo, es decir el proceso es estacionario.
Para aplicar esta distribución al cálculo de la probabilidad de obtener un número dado de éxitos en una serie de
experimentos en un proceso de Bernoulli, se requieren tres valores: el número designado de éxitos (m), el número de
ensayos y observaciones (n); y la probabilidad de éxito en cada ensayo (p). Entonces la probabilidad de que ocurran
m éxitos en un experimento de n ensayos es: P (x = m) = (nCm)(P m)(1−P)n − m. Siendo: nCm el número total de
combinaciones posibles de m elementos en un conjunto de n elementos.
En otras palabras P(x = m) = [n!/(m!(n−m)!)](p m)(1−p)n − m
Ejemplo. La probabilidad de que un alumno apruebe la asignatura Cálculo de Probabilidades es de 0,15. Si en un
semestre intensivo se inscriben 15 alumnos ¿Cuál es la probabilidad de que aprueben 10 de ellos?

P(x = 10) = 15C10(0,15)10(0,85)5 = 10!/(10!(15−10)!)(0,15)10(0,85)5 = (7,68) (10−6). Generalmente existe un interés


en la probabilidad acumulada de "m o más " éxitos o "m o menos" éxitos en n ensayos. En tal caso debemos tomar en
cuenta que:
P(x < m) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) +....+ P(x = m − 1)
P(x > m) = P(x = m + 1) + P(x = m + 2) + P(x = m + 3) +....+ P(x = n)
Supongamos que del ejemplo anterior se desea saber la probabilidad de que aprueben: a) Al menos 5. b) Más de 12.
a) La probabilidad de que aprueben al menos 5 es: P(x ≥ 5) es decir, que:
1 – P(x < 5) = 1 - [P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4)] =
1 – [0,0874 + 0,2312 + 0,2856 + 0,2184 + 0,1156] = 0,0618

b) La probabilidad de que aprueben más de 12 es P(x > 12) es decir, que:


P(x > 12) = P(x = 13) + P(x = 14) + P(x = 15)
P(x > 12) = (1,47) (10 −9) + (3,722) (10 −11) + (4,38 (10 −13) = (1,507) (10 −9)
La esperanza matemática en una distribución binomial puede expresarse como: E(x) = np = 15(0,15)=2,25
Y la varianza del número esperado de éxitos: Var(x) = np(1−p)= 15(0,15)(1-0,15)=1,9125

Nota: Al menos, a lo menos y por lo menos son locuciones adverbiales sinónimas.


Ejemplo: La entrada al cine por lo menos tendrá un costo de 35 bolívares
(como mínimo podría costar 35 bolívares o más).

41
EVENTOS EXCLUYENTES Y EVENTOS INDEPENDIENTES.
Giovanni Sanabria y Kyriakos Petakos.
INTRODUCCIÓN: El presente trabajo constituye una propuesta didáctica cuyo abordaje facilitará al
estudiante universitario diferenciar entre eventos excluyentes e independientes. Dicha propuesta surgen de las
dificultades e inquietudes que presentan los estudiantes sobre el tema. El trabajo expone tres ejercicios,
ordenados según su dificultad, cuya resolución sistemática permitirá a los estudiantes explorar la diferencia entre
las dos clases de eventos. Durante los semestres que se enseña la probabilidad básica, destinada a estudiantes de
matemáticas y otras carreras, se hallan continuamente obstáculos que impiden profundizar la teoría, que
generalmente es fundamental para el desarrollo del pensamiento matemático. Entonces se tiene que afrontar este
problema teniendo presente el concepto de asertividad aceptado por la sociología y la teoría pedagógica
contemporánea:
• Sentirse estimulado a participar en la clase como una manera de conseguir la meta propuesta.
• Conseguir un ambiente social en la clase, que aliente el intercambio de opiniones entre los estudiantes y entre
estos y el profesor en un sentido productivo.
• Conservación y si fuera posible aumento de la autoestima.
El proceso de resolver problemas por medio de la utilización sistemática de etapas en tópicos de probabilidad,
parece imprescindible cuando se tiene que diferenciar entre conceptos fundamentales que habitualmente causan
confusión por parte del estudiante. Se habla de confusión en una ciencia como la matemática, la cual se
construye como una cadena aumentada, concepto tras concepto, manteniendo el equilibrio apropiado. Equilibrio
que implica la existencia de la autoestima estudiantil.

RESUMEN DE LA PROPUESTA: La propuesta desarrollada en este artículo tiene dos componentes


conceptuales básicos: los eventos excluyentes y los eventos independientes. Son conceptos que se cubren
durante un curso básico universitario de probabilidad. La teoría de conjuntos, cuyos tópicos se dan aún en la
enseñanza secundaria de ciertos países, desempeña un papel protagonista en este ambiente, en una época cuando
el pensamiento teorético tiende a relegarse ante el uso avanzado del ordenador.
Los ejercicios propuestos se abordan en varias etapas, de lo básico aritmético, casi innato en la naturaleza
humana, al avanzado teorético como justificación del valor de los conceptos descritos arriba. Además, la
propuesta hace uso del modelo de aprendizaje cooperativo.
La clase está dividida en pequeños grupos de 4 estudiantes, demostrando nuestra lealtad a los siguientes
principios:
• Interdependencia positiva: El éxito de cada uno de los participantes se refleja únicamente en el éxito total del
grupo.
• Responsabilidad individual y del equipo: En nuestra propuesta se asigna un estudiante como líder que modera
el funcionamiento del grupo. Esto no significa que los otros miembros no tengan voz durante la clase; de eso nos
aseguramos al examinar oralmente y por azar a algún miembro del grupo durante el proceso de la comprensión
del material.
• Favorecimiento de la habilidad social en la toma de decisiones: Libertad en el sentido de si se tiene que
seguir un proceso de resolución específico, modificarlo o cambiarlo totalmente.

PRESENTACIÓN DEL PLAN DIDÁCTICO: Se proponen algunos ejercicios para internalizar la diferencia
entre eventos mutuamente excluyentes y eventos independientes (en el sentido estocástico). La confusión que se
genera en el aula cuando se presenta el material es una realidad indudable. Frases características por parte de los
estudiantes son las siguientes:
• Sólo el uso de la palabra excluyente significa que el uno no tiene nada que ver con el otro. De esa manera
¿cómo puede haber dependencia?
• Para mí, la representación gráfica de los diagramas de Venn es la respuesta para todo. El uno no corta al otro,
así que no lo influye. En otras palabras la exclusión tiene como consecuencia su independencia.
42
• Lo que me hace distinguir entre los dos conceptos fundamentales es su relación, como lo demuestran las
fórmulas matemáticas correspondientes. De esa manera, mecánicamente me conduzco a la relación apropiada de
calcular las probabilidades que se buscan.
Especialmente el último comentario nos inspiró a escribir este artículo, basado no sólo en la experiencia
cotidiana en el aula, sino también en las discusiones en un sentido platónico, tan popular en los representantes
de las ciencias naturales y de la literatura hispanoamericana, que se elaboraron durante las conferencias
mediterráneas sobre la enseñanza matemática de hoy y el mejoramiento del proceso de aprendizaje.
Usualmente el estudiante, como lo señalan los comentarios, suele buscar una relación de implicación entre
estos dos conceptos. Además, el profesor suele ver estos conceptos en diferentes escenarios, y da explicaciones
como: “por qué te confundes si un concepto es de conjuntos (concepto de excluyentes) y otro es de probabilidad
(concepto de independencia)”.
Explicaciones como las anteriores pueden confundir aún más al estudiante que insiste en hallar el camino
secreto y obscuro que une ambos conceptos. Un mejor camino que puede optar el profesor es, posterior al
estudio de cada concepto, comparar cada uno en un mismo escenario:

Escenario Conjuntos Probabilidad


A y B son excluyentes si: A∩B= P(A ∩ B) = 0
AB
A y B son independientes si: P(A  B)  P(A ∩ B) = P (A) P (B)
S

Donde S es el espacio de probabilidad y se utiliza como ley de probabilidad la ley de Laplace.

Seguidamente se presentan algunos ejemplos especialmente elegidos por enfatizar en los dos conceptos
(eventos excluyentes y eventos independientes) y presentarlos como una cadena desde lo práctico hasta lo más
sofisticado admitiendo así la técnica clásica de resolución de problemas.

Ejercicio 1
Dadas las probabilidades P(A) = 0,45, P(B) = 0,10 y P(A ∩ B) = 0,045 ¿qué conclusión podemos obtener?
Los eventos A, B ¿son independientes? ¿son mutuamente excluyentes?
Solución. Vamos a seguir el tipo de solución paso a paso, en otras palabras dividido en varias etapas
intentando aumentar la atención por parte de los estudiantes y asegurar la comprensión del material diseñado.
Etapa 1. Recordar al estudiante la definición de la independencia como la fórmula siguiente:
P(A ∩ B) = P(A) P(B)
Etapa 2. Verificar sencillamente el resultado aritmético 0,045 = (0,45) (0,10)
Etapa 3. Concluir lo deseado, que son independientes y pasar a la pregunta próxima, siguiendo el pensamiento
de definición observando P(A ∩ B) = 0,045 ≠ 0, así que no son mutuamente excluyentes.
Comentario: Se les puede solicitar a los representantes de dos grupos cooperativos que discutan en sus grupos
lo siguiente:
Para probar que son excluyentes, ¿no tenemos que demostrar que P(A∪B) = P(A) + P(B) ? En la discusión que
se desarrolla dentro del aula se revela una vez más el efecto de las normas y las leyes matemáticas que
habitualmente preceden el material didáctico de los ejercicios. La asertividad que tiene mucho que ver con la
capacidad de resolver problemas parece estar conectada inextricablemente con la presentación de algunas
normas, que atraen tanto al interés del profesor como del estudiante durante el proceso de aprendizaje. La
importancia de la norma de Poincaré: P(A∪B) = P(A) + P(B) − P(A∩B) predomina en la mente de los
estudiantes, haciéndolos olvidar lo obvio y buscar otra manera más complicada de resolver el problema.

43
Ejercicio 2
En este ejercicio introduciremos a nuestros estudiantes en el pensamiento que acompaña la justificación de la
existencia de las fórmulas.
Dado que P(A/B) = 0,2; P(B) = 0,6. Calcular el valor de P(A) para que los eventos A, B sean independientes.
Solución:
Etapa 1. Conceptualizar un poco sobre la interpretación del concepto de independencia. En el caso de que sean
independientes, A no influye en la realización o no de B, así que la condición A/B no tiene sentido, es decir,
P(A/B) = P(A).
Etapa 2. Utilizando la formula de la probabilidad condicional, en cuando a la independencia eventual tenemos
PA  B P A  P B
P(A/B)    PA  . Así que el valor de P(B) no se necesita.
PB PB
Etapa 3. Comparar las dos etapas anteriores para lograr una internalización más profunda de lo enseñado. En
esta fase realizamos una discusión sobre si la primera etapa constituye por sí sola una solución formal del
problema. Podemos observar que los grupos asignados, aún convencidos del pensamiento que se incluye en la
primera etapa, aparecen casi igualmente divididos según la existencia de la solución que no incluirá la segunda
etapa. Lo que destaca en el diálogo generado se bosqueja verdaderamente en las siguientes palabras Aunque
aceptamos entre nosotros la infalibilidad de la solución basada en la primera etapa de arriba, ¿podemos estar
seguros que no se considerará un error durante el proceso de evaluación por algún examinador?
Acá se presenta la coordinada práctica de nuestra vida diaria en la enseñanza en cada etapa, el proceso de la
evaluación con la subjetividad que puede involucrar de caso a caso. Se trata de un tema que por sí mismo pueda
ocupar el contenido de varios artículos.

Ejercicio 3
Lanzamos una moneda dos veces y registramos los resultados. Denotamos los siguientes eventos:
A = {que aparezca C en la primera lanzada}
B = {que aparezca C en la secunda lanzada}
C = {que aparezca C solamente una vez}
¿Podemos decir que los eventos A, B, C son mutuamente excluyentes?
Solución
Etapa 1. Registrar los resultados al obtener el espacio muestral, es decir, {CN, NC, NN, CC} usando C por la
cara y N por el sello.
Comentario: Se ha observado durante la corrección de los exámenes parciales que muchos errores ocurren
como consecuencia de la falta de comprensión sobre lo elementos que componen el espacio muestral. Aquí se
demuestra muy bien que aun en un proceso sencillo, como el de conteo, considerado a veces rudimentario, se
adquiere una dimensión nueva para definir un conjunto necesario, cuya cardinalidad forma el denominador de la
probabilidad según Laplace.
Etapa 2. Escribir cada uno de los eventos A, B, C en su forma analítica
A = {CN, CC}, B = {NC, CC}, C = {CN, NC}
Etapa 3. Enfocar en el concepto de la intersección, dando la equivalencia
Intersección vacía = eventos mutuamente excluyentes
Observamos que A∩B = {CC}, B∩C = {NC}, A∩C = {CN} de manera que la conclusión viene
automáticamente.
Etapa 4. (No obligatoria) Contradecir al concepto de los eventos independientes, aunque no se pregunta en
nuestro ejercicio 3. Subrayaremos que en este caso no quedamos solo en la intersección de los eventos, sino que
damos un paso más calculando la probabilidad de esta intersección
1 11
P(A  B)    PA  PB Así que A, B son independientes.
4 22
44
CONJUNTO DE EJERCICIOS PROPUESTOS N° 1.
1. Un estudiante responde al azar a dos preguntas de verdadero y falso. Escriba el espacio muestral de este
experimento aleatorio.

2. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias o
no de consumir un determinado producto.
a) Escriba el espacio muestral asociado a dicho experimento, utilizando la letra “s” para las respuestas
afirmativas y la letra “n” para las negativas.
b) ¿Qué elementos del espacio muestral anterior constituyen el suceso “al menos dos de las personas son
partidarias de consumir el producto?

3. Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Escriba el espacio muestral
de este experimento aleatorio. Y los siguientes sucesos
a) Suceso A = {extraer tres bolas del mismo color}
b) Suceso B = {extraer al menos una bola blanca}
c) Suceso C = {extraer una sola bola negra}

4. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Si se extrae una bola al azar, calcula la probabilidad de:
a) Sea roja. b) Sea verde. c) Sea amarilla. d) No sea roja. e) No sea amarilla.

5. Una caja contiene 2 bolas rojas, 3 negras, 4 azules y 6 blancas. ¿Cuál es la probabilidad de seleccionar:
a) Una bola blanca. b) Una bola azul. c) Una bola roja o negra.

6. ¿Cuál es la probabilidad de extraer al azar una espada o un trébol de una baraja de 52 cartas?

7. Supóngase que se extrae una carta de la baraja de 52 cartas, cuál es la probabilidad de que esta sea:
a) Un rey o un as. b) Una espada o un as. c) Un trébol o un rey.

8. Si se extraen dos barajas simultáneamente del juego de 52 cartas, cuál es la probabilidad de que:
a) Las dos cartas sean espada.
b) Las dos cartas sean trébol.
c) La primera sea un as y la segunda sea espada, suponiendo que la extracción sea sin remplazo.

9. Resolver el problema anterior si la extracción se hace con remplazo.

10. Sea el experimento lanzar un dado dos veces y anotar el número que sale en el mismo orden de los
lanzamientos. Determinar la posibilidad de que en el primer lanzamiento salga un número par y en el
segundo lanzamiento salga un 5 o un 6.
45
CONJUNTO DE EJERCICIOS PROPUESTOS N° 2.
1.- En el experimento que consiste en extraer una carta de una baraja española consideremos el suceso
A = "Salir figura". ¿Cuándo diremos que se ha realizado el suceso A?

2.- Los tipos de grupos sanguíneos humanos son: A, B, AB y O. Además, cada individuo puede tener un factor
Rh– o Rh+. Un técnico laboratorista anota el tipo de sangre de los pacientes. Elabora una lista del espacio
muestral de este experimento.

3.- Se realiza un experimento aleatorio que consiste en la extracción de una carta de una baraja española. Se pide
hallar las siguientes probabilidades
A = Obtener un oro B = Obtener un as

4.- Consideremos el experimento aleatorio que consiste en lanzar dos datos y anotar la suma de los puntos de las
caras superiores. Hallar la probabilidad de los siguientes sucesos.
A = Obtener una suma igual a 8 B = Obtener una suma menor o igual a 4

5.- Sea el experimento E: lanzar una moneda y un dado (en ese orden).
a) Exprese por extensión el espacio muestral.
b) Exprese por extensión los eventos.
A = {Aparece cara y un número par} B = {Aparece un número primo}
C = {Aparece sello y un número impar} D = {A o B ocurren}.
E = {B y C ocurren} F = {Solamente B ocurre}
G = {No ocurre B}

6.- Sea el experimento E = Lanzar 2 dados simultáneamente Se definen los eventos:


A = {Obtener una suma impar}; B = {Obtener por lo menos un seis}
a) Escriba el espacio muestral
b) Escriba los eventos señalados matemáticamente y por extensión.
c) Escriba A  B por extensión.
d) Escriba A  B
e) Escriba A – B
f) Escriba A’
g) Escriba en palabras los eventos c, d, e y f.

7.- Una bolsa contiene 4 esferas blancas 3 azules y 5 rojas.


A. Si se saca una esfera al azar, calcular las probabilidades:
a) Que sea blanca e) Que no sea blanca
b) Que sea azul f) Que sea negra
c) Que no sea azul g) Que no sea blanca ni azul
d) Sea roja o azul h) Que sea blanca, azul o roja

B. Si se sacan 3 esferas simultáneamente al azar, calcule las siguientes probabilidades:


a) Que sean azules e) A lo más 2 sean azules
b) Que sean blancas f) Como máximo una sea blanca
c) Que sean rojas g) Que sea una de cada color
d) A lo menos una sea roja h) Que 2 sean blancas y una roja.

46
8.- En una facultad el 25 % de los estudiantes reprobó matemáticas, el 15 % reprobó estadística y el 10 %
reprobó ambas materias. Se selecciona un estudiante al azar, calcular las probabilidades siguientes:
a) Que haya reprobado al menos una materia b) Que haya reprobado solo matemáticas
c) Que haya aprobado ambas asignaturas d) Que haya aprobado solo estadística.

9.- En una encuesta realizada a 200 personas adultas se les consultó si tenían hijos y si poseían trabajo,
obteniéndose los siguientes resultados:
- 75 personas respondieron que tenían hijos
- 80 respondieron que tenían solamente trabajo.
- 35 respondieron que no poseían trabajo, pero si tenían hijos.
a) Represente la información en un diagrama de Venn.
b) Cuál es la probabilidad que una persona elegida al azar:
b1) Trabaje y tenga hijos. b2) Tenga trabajo. b3) No tenga hijos ni trabaje.

c) Se escogen personas hasta que una responde que tiene hijos o tiene trabajo, eligiendo hasta un máximo
de 5 personas.
c1) Describa el espacio muestral. c2) Calcule la probabilidad de escoger a lo más a tres personas.

10.- Una empresa produce componentes electrónicos. La probabilidad de que un componente se averíe en un
periodo de tiempo dado es 0,01. Su estado (averiado o funcionando) se comprueba con un ensayo que cumple
que, cuando el componente funciona, la probabilidad de que el ensayo diga lo contrario es 0,05, pero si el
componente está averiado el ensayo no se equivoca. Si el ensayo indica que el componente está averiado, ¿Cuál
es la probabilidad de que realmente lo esté?

11.- Se forman signos que consisten de una figura geométrica (circunferencia, cuadrado, triángulo o hexágono),
una letra y una cifra. ¿Cuántos signos de este tipo pueden formarse?

12.- ¿De cuantas formas se pueden escoger dos fichas de domino, de las 28 que hay, de forma que se puedan
aplicar una a la otra (es decir, de modo que se encuentre el mismo número de tantos en ambas fichas)?

13.- El departamento de préstamos de una institución financiera ha efectuado una encuesta entre sus afiliados,
como parte de un estudio para la determinación de prioridades en la asignación de préstamos. Se obtuvieron
2.600 respuestas con los siguientes resultados:
-800 afiliados son casados.
-1.000 afiliados habitan en casa arrendada.
-950 perciben ingresos inferiores a Bs 4.500 mensuales
-200 son casados no habitan en casa arrendada y perciben ingresos superiores a Bs 4.500 mensuales.
-350 son casados y habitan en casa arrendada.
-230 son solteros, habitan en casa arrendada y tienen ingresos inferiores a Bs 4.500 mensuales
-350 son casados y perciben ingresos inferiores a Bs 4.500 mensuales

Se pide determinar:
a) El número de afiliados casados, que habitan en casa arrendada y perciben ingresos inferiores a Bs 4.500.
b) Si se elige un afiliado al azar. Cuál es la probabilidad de que sea casado, viva en casa arrendada y
perciba ingresos inferiores a Bs 4.500 mensuales.

47
PROBABILIDAD.
APLICACIONES.
Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el
comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabilísticos en
regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando
métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos
de su probable efecto en la población como un conjunto.
No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo
son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad
de otro 11-S".
Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas
elecciones, lo que hace de las medidas probabilísticas un tema político. Un buen ejemplo es el efecto de la
probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio que
producen un efecto dominó en la economía en conjunto.
Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable
seguramente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente,
las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de
las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y
en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos
de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna
importancia para la mayoría de los ciudadanos entender cómo se calculan los pronósticos y las probabilidades, y
cómo contribuyen a la reputación y a las decisiones, especialmente en una democracia.
Otra aplicación significativa de la teoría de la probabilidad en el día a día es en la fiabilidad. Muchos bienes de
consumo, como los automóviles y la electrónica de consumo, utilizan la teoría de la fiabilidad en el diseño del
producto para reducir la probabilidad de avería. La probabilidad de avería también está estrechamente relacionada
con la garantía del producto.
Se puede decir que no existe una cosa llamada probabilidad. También se puede decir que la probabilidad es la
medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por
consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en una baraja sea la J de
diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% ó 0%,
y la elección correcta puede ser hecha con precisión por el que ve la carta. La física moderna proporciona ejemplos
importantes de situaciones determinísticas donde sólo la descripción probabilística es factible debido a información
incompleta y la complejidad de un sistema así como ejemplos de fenómenos realmente aleatorios. En un universo
determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el
caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola
parará será seguro. Naturalmente, esto también supone el conocimiento de la inercia y la fricción de la ruleta, el
peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y así
sucesivamente. Una descripción probabilística puede entonces ser más práctica que la mecánica newtoniana para
analizar el modelo de las salidas de lanzamientos repetidos de la ruleta.
La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a
través de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabilísticas. Hoy
en día no existe un medio mejor para describir la física cuántica si no es a través de la teoría de la probabilidad.
Mucha gente hoy en día confunde el hecho de que la mecánica cuántica se describe a través de distribuciones de
probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabilística
no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisión sus
parámetros fundamentales, lo que imposibilita la creación de un sistema de ecuaciones determinista.
Tomado de: http://es.wikipedia.org/wiki/Probabilidad

Fin de la Unidad I
48
UNIDAD 2:
INTRODUCCIÓN AL MUESTREO
OBJETIVO DE APRENDIZAJE:
Representar las formas de agrupación, categorización y presentación de resultados de datos.
CONTENIDO:
2.1 Terminología: Universo. Población. Población Finita. Población Infinita. Muestra. Muestra Representativa. Muestra
Probabilística. Muestra No Probabilística.
2.2 Métodos de Muestreo: Tipos de muestreo, muestreo aleatorio simple, sistemático, estratificado y conglomerado.
2.3 Distribución Muestral y Estimación: Media Muestral. Función de Distribución y Esperanza Matemática.

INTRODUCCIÓN.
En el proceso de tomar decisiones, tanto en el quehacer diario de las personas como de las empresas, se
requiere disponer de la mayor información posible sobre el tema en cuestión. Generalmente, la información
que se requiere está referida a un universo de unidades de análisis que tiene un tamaño muy grande (N). Si se
desea hacer un relevamiento total, completo y exhaustivo de dicha población (Censo) se ha de insumir mucho
tiempo y recursos en ello. Para resolver estos problemas prácticos surgió la teoría del muestreo, que es un
capítulo de la estadística y de la teoría aplicada de las probabilidades.
Esta teoría trata sobre los fundamentos probabilísticos, las distribuciones estadísticas, los métodos o técnicas
de selección, las fórmulas de cálculo de los errores de muestreo, las fórmulas y tablas de determinación del
tamaño de la muestra, los métodos de estimación de los parámetros poblacionales a partir de los estadísticos
muestrales. Indica, además, los procedimientos o técnicas para extraer una parte o muestra del colectivo o
población que se quiere estudiar, o analizar en ella las características que interesen y del resultado de este
análisis inferir o afirmar algo del universo total.
Así pues, el muestreo estadístico es la herramienta que la matemática utiliza para el estudio de las
características de una población a través de una determinada parte de la misma. La muestra de estudio debe ser
lo más pequeña posible ya que del hecho de que una muestra sea más grande, no se desprende necesariamente
que la información sea más fiable. Además, la muestra elegida debe serlo por un proceso aleatorio para que sea
lo más representativa posible. El muestreo se utiliza con mucha frecuencia en investigaciones de mercados,
medios y opinión, en investigación social, en general, puesto que ofrece algunos importantes beneficios con la
realización de un censo.

UNIVERSO y POBLACIÓN
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se hace
necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigación.
Esta consideración nos conduce a delimitar el ámbito de la investigación definiendo una población y
seleccionando la muestra.

El diccionario de la RAE (2001) define la población, en su acepción sociológica, como “Conjunto de los
individuos o cosas sometido a una evaluación estadística mediante muestreo”.

(Latorre, Rincón y Arnal, 2003) la definen como “el conjunto de todos los individuos (objetos, personas,
eventos, etc.) en los que se desea estudiar el fenómeno. Éstos deben reunir las características de lo que es objeto
de estudio”.
49
Los manuales clásicos de epistemología suelen definir la población como el conjunto de todas las medidas o
personas de un cierto tipo, y la hacen sinónima del concepto más antiguo de universo (Jiménez Fernández, 1983;
Sierra Bravo, 1988; Gil Pascual, 2004). Otros autores distinguen entre universo y población (Fox, 1981; Marín
Ibáñez, 1985; Buendía, Colás y Hernández, 1998; Latorre, Rincón y Arnal, 2003). Estos autores consideran que
el investigador casi nunca, o nunca, tiene acceso a todas las posibles medidas, elementos o personas y, por tanto,
utilizan el término universo para designar “esa entidad que lo incluye todo”, reservando el concepto de población
a la parte del universo de la que se selecciona la muestra y sobre la que deseamos hacer inferencia o aplicación
de las generalizaciones que obtengamos de la investigación.

“El término universo designa a todos los posibles sujetos, elementos, individuos, casos o
medidas de un cierto tipo, que manifiestan las características o hecho que nos interesa
observar, medir y conocer y al cual se van a aplicar las conclusiones del estudio. La parte del
universo a la que el investigador tiene acceso se denomina población”. (Fox, 1981).
“Población es un conjunto definido, limitado y accesible del universo que forma el referente
para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados”.
(Buendía, Colás y Hernández, 1998).

Marín Ibáñez (1985) señala las diferencias entre ‘población’ o ‘universo general’ y ‘universo de trabajo’. El
primero hace referencia a toda la población a la que queremos extender las conclusiones de la muestra, mientras
que el universo de trabajo “son los casos que de alguna manera tenemos consignados y de los que podemos
extraer la muestra”. Sierra Bravo (1988) se refiere al universo de trabajo como ‘base de la muestra’. Latorre,
Rincón y Arnal (2003) también distinguen entre población y universo, haciendo sinónimo a este ultimo de
‘colectivo’ o ‘colectivo hipotético’. Paralelamente, Lohr (1999) habla de “población muestreada” para referirse
a la población de la que se extrae la muestra y de “población objetivo”, entendida como la colección completa
de observaciones que deseamos estudiar.

Hoy se prefiere hablar de “unidad de observación” o “elemento” para referirse al objeto sobre el cual se
realiza una medición. En los estudios con poblaciones humanas, con frecuencia ocurre que la unidad de
observación son los individuos.

La definición de la población es una parte importante, y con frecuencia difícil, del estudio. Lohr, (1999)
advierte: “Por ejemplo, en una encuesta política, ¿la población objetivo deberían ser todos los adultos que
pueden votar? ¿Todos los votantes registrados? ¿Todas las personas que votaron en la última elección?”. En
cualquier caso, la elección de esta ‘población objetivo’ afectará profundamente al resultado de la investigación.

Cualquier característica medible de la población se denomina parámetro, los valores de los parámetros
calculados sobre muestras se conocen como estadísticos o estadígrafos, utilizan letras latinas (0, s2, r..., media,
varianza, coeficiente de correlación) y describen a las citadas muestras.

MUESTREO
En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de
una población. Habitualmente, salvo el caso de poblaciones muy pequeñas, el investigador no trabaja con todos
los elementos de la población que estudia, sino sólo con una parte o fracción de ella; unas veces, porque aquella
es muy grande y no es fácil abarcarla en su totalidad, otras veces, porque el proceso permite ahorrar tiempo y
recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la
población. A veces ni siquiera podemos delimitar exactamente una población, otras veces la población total
“aún no existe” como sucede en los estudios sobre predicción. Estos motivos de tiempo, coste, accesibilidad a
los individuos y complejidad de las operaciones de recogida, clasificación y análisis de los datos hacen que la
gran mayoría de los proyectos de investigación no estudien más que una parte representativa de la población,
denominada muestra.
50
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta
no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas
estimaciones), este debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el
resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con
una probabilidad alta.

La importancia del muestreo radica en que no es necesario trabajar con los ‘N’ elementos de
una población para comprender con un nivel “razonable” de exactitud la naturaleza del
fenómeno estudiado. Este conocimiento se puede obtener a partir de una muestra que se
considere representativa de aquella población.

Muestra estadística
Una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de
casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades
de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta
característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede
obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste. Por otra parte,
en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un
menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de
individuos de la muestra son los sujetos realmente estudiados.

“Muestra es una parte o subconjunto de una población normalmente seleccionada de tal


modo que ponga de manifiesto las propiedades de la población. Su característica más
importante es la representatividad, es decir, que sea una parte típica de la población en la o
las características que son relevantes para la investigación”. (Jiménez Fernández, 1983).

El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para
que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de
la muestra sea idóneo es preciso recurrir a su cálculo.

En el muestreo, se pueden extraer dos o más muestras de la misma población. Al conjunto de muestras que
se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción, sigue la llamada distribución muestral.

Espacio Muestral
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles
muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.

Parámetro o estadístico muestral


Un parámetro estadístico o simplemente un estadístico muestral es cualquier valor calculado a partir de la
muestra, como por ejemplo la media, varianza o una proporción, que describe a una población y puede ser
estimado a partir de una muestra. Valor de la población.

Estimación
Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro referido a la
población, a partir de los estadísticos muestrales calculados desde los elementos de la muestra.

51
Condiciones que ha de cumplir la muestra
Las condiciones fundamentales que ha de cumplir una muestra son, para Sierra Bravo, cuatro:
1. Que comprenda parte del universo y no la totalidad de éste.
2. Que su amplitud sea estadísticamente proporcionada a la magnitud del universo. Esta condición se halla
en relación con el punto práctico de determinación del tamaño de la muestra y sirve para decidir si, según
las unidades que comprende respecto al universo, una muestra es o no admisible.
3. La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna
anomalía, la muestra resultará por este mismo hecho viciada.
4. Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca sus características básicas en
orden a la investigación. Esto quiere decir que si hay sectores diferenciados en la población que se supone
ofrecen características especiales, a efectos de los objetivos de la investigación, la muestra también deberá
comprenderlos y precisamente en la misma proporción, es decir, deberá estar estratificada como el universo.

Para cumplir estas condiciones es necesario aplicar unas determinadas técnicas de selección de la muestra
que garanticen su representatividad, determinar el tamaño óptimo de la muestra y tener en cuenta el ‘error
muestral’.

Ventajas de la elección de una muestra


El estudio de muestras es preferible, en la mayoría de los casos, por las siguientes razones:
1. Con una muestra relativamente reducida en relación a la población, se pueden encuestar grandes
poblaciones y núcleos humanos, que de otra manera sería muy difícil o prácticamente imposible
investigar. Tal es el caso de las poblaciones muy grandes (en ocasiones, infinita, como ocurre en
determinados experimentos aleatorios) que resultan imposibles de analizar en su totalidad.
2. Las características de la población varían si el estudio se prolonga demasiado tiempo.
3. Reducción de costos: al estudiar una pequeña parte de la población, los gastos de recogida y tratamiento
de los datos serán menores que si los obtenemos del total de la población.
4. Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se consigue mayor rapidez.
5. Viabilidad: la elección de una muestra permite la realización de estudios que serían imposible hacerlo
sobre el total de la población.
6. La población es suficientemente homogénea respecto a la característica medida, con lo cual resultaría
inútil malgastar recursos en un análisis exhaustivo (por ejemplo, muestras sanguíneas).
7. El proceso de estudio es destructivo o es necesario consumir un artículo para extraer la muestra
(ejemplos: vida media de una bombilla, carga soportada por una cuerda, precisión de un proyectil, etc.).

“... una muestra puede ofrecer resultados más precisos que una encuesta total, aunque esté
afectada del error que resulta de limitar el todo a una parte”. (Sierra Bravo, 1988). Los
inconvenientes más comunes suelen ser: dificultad de utilización de la técnica de muestreo,
una muestra mal seleccionada o sesgada distorsiona los resultados, las limitaciones propias
del tipo de muestreo y tener que extraer una muestra de poblaciones que poseen pocos
individuos con la característica que hay que estudiar.

52
Descripción matemática de una muestra aleatoria
El uso de muestras para deducir fiablemente características de la población requiere que se trate con muestras
aleatorias. Si la muestra estadística considerada no constituye una muestra aleatoria las conclusiones basadas
en dicha muestra no son fiables y en general estarán sesgadas en algún aspecto.

En términos matemáticos, dada una variable aleatoria X con una distribución de probabilidad F, una muestra
aleatoria de tamaño N es un conjunto finito de N variables independientes, con la misma distribución de
probabilidad F.

Otra forma más intuitiva, de entender una muestra es considerar que una muestra es una sucesión
de N experimentos independientes de una misma cantidad. Es importante diferenciar una muestra de tamaño N, o
más exactamente un muestreo de tamaño N, del resultado concreto de los N experimentos (que como conjunto de
valores fijos, en sí mismo, no es una muestra). El concepto de muestra incluye de alguna manera el
procedimiento escogido para obtener los datos (es decir, si las variables aleatorias consideradas son
independientes entre sí, y si tienen la misma distribución).

En general, resulta muy difícil comprobar si una determinada muestra es o no aleatoria, cosa que sólo puede
hacerse considerando otro tipo de muestreos aleatorios robustos que permitan decir si la primera muestra era
aleatoria o no.

Las muestras tienen un fundamento matemático estadístico. Éste consiste en que obtenidos unos
determinados resultados, de una muestra elegida correctamente y en proporción adecuada, se puede hacer la
inferencia o generalización fundada matemáticamente de que dichos resultados son válidos para la población
de la que se ha extraído la muestra, dentro de unos límites de error y probabilidad, que se pueden determinar
estadísticamente en cada caso.

“Aunque la razón esencial por la que se muestrea es la imposibilidad de estudiar todos los
sujetos, es un proceso lógico, porque en la práctica no es necesario obtener datos de todos los
posibles sujetos para comprender con exactitud la naturaleza del fenómeno que se estudia,
sino que, en general, se puede alcanzar esa comprensión con una parte de los sujetos. El
ahorro de tiempo o dinero y la posibilidad de mayor profundidad y exactitud en los
resultados de la realización de la investigación mediante el muestreo sólo es lógico cuando se
puede justificar el hecho de que los datos obtenidos a partir de la muestra proporcionarán una
base firme para determinar con exactitud las características del fenómeno que se estudia”.
(Fox, 1981)

La selección correcta de la muestra implica crear una que represente a la población con la mayor fidelidad
posible. Esto conlleva utilizar unas técnicas específicas de selección de la muestra, así como la necesidad de
determinar su tamaño óptimo. En este proceso de selección hemos de distinguir entre ‘elemento muestral’,
‘unidad de muestreo’ y ‘marco de muestreo’. El elemento o individuo (muestral) es un objeto en el cual se
toman las mediciones, la unidad más pequeña en que podemos descomponer la muestra. La unidad de muestreo
hace referencia a la unidad donde realizamos la muestra, está constituida por grupos excluyentes de elementos de
la población que completan la misma. Por ejemplo, podríamos desear estudiar a un grupo de personas (una
ciudad, una barriada, un grupo de estudiantes de un determinado nivel educativo, los trabajadores de un sector de
producción, etc.), pero no tenemos una lista de todos los individuos que pertenecen a la población. En su lugar
las familias, los centros educativos, las empresas... podrían servir como unidades de muestreo. Las unidades de
observación o elementos muestrales serían los individuos que viven en una familia o que trabajan en una
determinada empresa... La lista de las ‘unidades de muestreo’ (familias, centros educativos, empresas...)
constituyen el ‘marco de muestreo’.

53
Etapas del proceso de muestreo
Fox (1981: 367-369) señala cinco etapas en el proceso de muestreo:
1) Definición o selección del universo o especificación de los posibles sujetos o elementos de un
determinado tipo.
2) Determinación de la población o parte de ella a la que el investigador tiene acceso.
3) Selección de la muestra invitada o conjunto de elementos de la población a los que se pide que participen
en la investigación.
4) Muestra aceptante o parte de la muestra invitada que acepta participar.
5) Muestra productora de datos; la parte que aceptó y que realmente produce datos.

En el esquema que sigue se diagrama la secuencia de pasos para seleccionar una muestra.

UNIDADES
ELEMENTALES LISTAS

PASO 1 PASO 2
UNIDADES DE
MUESTREO DIRECTORIOS
IDENTIFICAR
DEFINIR LA EL MARCO
POBLACIÓN MUESTRAL
COBERTURA GUÍAS

PERÍODO MAPAS

MUESTRAS
PROBABILISTICAS
 Aleatorio simple
 Aleatorio Sistemático
PASO 3 PASO 4  Estratificado
MUESTRAS  Por conglomerados
PROBABILISTICAS
SELECCIONAR ELEGIR EL
EL TIPO DE MÉTODO DE
MUESTREO MUESTREO
MUESTRAS NO
MUESTRAS NO
PROBABILÍSTICAS
PROBABILISTICAS
 Coincidencial
 Opinático
 Por cuotas
 Elección razonada

PASO 5
 Porcentaje de resultado que se investiga (p = 100 – q)
 Coeficiente de confianza (P z)
DETERMINAR  Error de muestreo (E %)
EL TAMAÑO DE  Error de estimación (e %)
LA MUESTRA  Nivel de significación (P  )
 Intervalo de confianza (± z . E %)
 Universos finitos ( N ≤ 100.000) o infinitos (N > 100.000)

54
TIPOS O TÉCNICAS DE MUESTREO
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio, de juicio o no
probabilístico y el muestreo aleatorio que incorpora el azar como recurso en el proceso de selección y cumple
con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la
muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, el muestreo
aleatorio recibe el nombre de muestreo probabilístico o muestreo de selección aleatoria.

1.- MUESTREO ALEATORIO PROBABILÍSTICO (o de Selección Aleatoria)


Forman parte de este tipo de muestreo todos aquellos métodos que utiliza el azar como instrumento de
selección, pudiéndose calcular de antemano la probabilidad de que cada elemento sea incluido en la muestra.
Para Marín Ibáñez (1985) este tipo de muestreo es el que alcanza mayor rigor científico, y se caracteriza porque
se cumple el principio de la equiprobabilidad, según el cual todos los elementos de la población tienen la misma
probabilidad de salir elegidos en una muestra, aunque en ocasiones no es posible optar por él.
Los individuos que formarán parte de la muestra se elegirán al azar mediante números aleatorios. Existen
varios métodos para obtener números aleatorios, los más frecuentes son la utilización de tablas de números
aleatorios o generarlos por ordenador.

PROPIEDADES DEL MUESTREO PROBABILÍSTICO


a) Existe la posibilidad de definir inequívocamente un conjunto de muestras M1, M2, .... , Mt mediante la
aplicación del procedimiento a una población. Esto significa que podemos indicar cuales unidades de muestreo
pertenecen a M1, M2 y así sucesivamente.
b) A cada posible muestra Mi se le asigna un probabilidad conocida de selección Pi.
c) Seleccionamos una de las Mi por un proceso mediante el cual, cada Mi tiene una probabilidad Pi de ser
seleccionada. El método de estimación se realiza en base a la muestra, siendo único para cualquiera de las posibles
muestras Mi
d) Se puede proceder sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de
las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada. O con reposición
de los elementos: Las observaciones se realizan con reemplazamiento de los individuos, de forma que la
población es idéntica en todas las extracciones.
El muestreo probabilístico o aleatorio puede realizarse de distintas maneras, las más frecuentes son el
muestreo simple, el sistemático, el estratificado, por estadios múltiples y el muestreo por conglomerados.

MUESTREO ALEATORIO SIMPLE (M.A.S)


Es la modalidad conceptualmente más simple de muestreo, la más
conocida y la que alcanza mayor rigor científico. Garantiza la
equiprobabilidad de elección de cualquier elemento y la
independencia de selección de cualquier otro. En este
procedimiento se extraen al azar un número determinado de
elementos, n, del conjunto mayor N ó población, procediendo
según la siguiente secuencia:
a) Definir la población, confeccionar una lista de todos los elementos, asignándoles números consecutivos
desde 1 hasta n. b) La unidad de base de la muestra debe ser la misma. c) Definir el tamaño de la muestra, y d)
Extraer al azar los elementos.
Recuérdese que "al azar" no significa "de cualquier manera", para que el procedimiento de muestreo sea
válido es necesario utilizar correctamente el proceso de generación de números aleatorios.
55
Decimos que hemos extraído una muestra aleatoria simple cuando el proceso de extracción garantice:
 Cada elemento de la población tiene la misma probabilidad de ser elegido.
 Los elementos se seleccionan de uno en uno y con reposición (reemplazamiento), de manera que la
población permanece idéntica en todas las extracciones.
El método se utiliza cuando la población e homogénea respecto a la característica a estudiar. La muestra
quedará formada por los n elementos obtenidos mediante sorteo de la población. Los procedimientos más
comunes de extracción de los elementos en este tipo de muestreo son: las tablas de números aleatorios, incluidas
en los manuales de estadística; los clásicos sistemas de lotería y otros procedimientos de extracción al azar,
incluidos las aplicaciones informáticas.
Entre las ventajas de este procedimiento está la compensación de valores altos y bajos con lo que la muestra
tiene una composición similar a la de la población, además, produce estimadores de los parámetros desconocidos
próximos a los valores reales de los mismos. El principal inconveniente de este tipo de muestreo es que necesita
un marco adecuado y amplio que no siempre es fácil de conseguir y que no contiene información a priori sobre
la población que podría ser útil en la descripción de la misma. En la práctica, a menos que se trate de
poblaciones pequeñas o de estructura muy simple, es difícil llevar a cabo esta técnica de forma eficaz. Con
población muy grande la sencillez del procedimiento se complica y las ayudas mecanizadas no siempre se
pueden o se deben utilizar. Pensemos la dificultad que tendría, por este procedimiento, obtener una muestra de la
población de un país.

Algunos autores exigen que todos los elementos tengan la misma probabilidad de ser
seleccionados. En la práctica real puede haber diversos grados de probabilidad, lo importante
es que la conozcamos. De hecho si de un listado de papeletas con cien personas
seleccionamos uno, éste tiene 1/100 de posibilidad de ser elegido, el segundo 1/99, y así
sucesivamente... Para que esto no hubiera ocurrido tendríamos que haber empleado el
procedimiento de obtención de la muestra con reemplazo, es decir volviendo a colocar los
que salen, para que se mantuviera la proporción del 1/100. Este último caso puede tener
interés en determinadas circunstancias, pero no en el caso de consultar, por ejemplo, varias
veces a un mismo alumno. Lo importante, para Marín Ibáñez (1985) es que conozcamos el
grado de probabilidad y, en lo posible, procurar que sea la misma.

MUESTREO ALEATORIO SISTEMÁTICO


- Se ordenan los individuos de la población y se numeran.
- Se divide la población en tantos grupos como individuos se quieran
tener en la muestra. Se selecciona uno al azar en el primer grupo y se
elige el que ocupa el mismo lugar en todos los grupos.
- La ventaja principal es que es más sencillo y más barato que el
muestreo aleatorio simple, además, se comporta igual si no hay
patrones o periodicidades en los datos.
- La aparición de patrones desconocidos puede llevar a importantes
errores en la estimación de los parámetros.
Este tipo de muestreo puede utilizarse, por ejemplo, en encuestas telefónicas programadas mediante
ordenador ocuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo.
El empleo de muestras sistemáticas consiste en una variante del anterior tipo de muestreo. Primero se calcula
una constante que se denomina coeficiente de elevación K = N/n; donde N es el tamaño del universo y n el
tamaño de la muestra. En algunos textos se usa I como constante, la que en realidad se refiere a la frecuencia de
los casos. Después se elige un número a menor o igual que K, es decir, que cumpla la condición: 1 ≤ a ≤ K. Por
último se seleccionan los números en la tabla de número aleatorios, que serán:
a, a + K, a + 2K, a + 3K, …, a + (n – 1) K
56
También se acostumbra identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego se
calcula la constante, K. Se determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al
azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es
conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la población (N) y queremos
escoger de esa población un número más pequeño el cual es la muestra (n), dividimos el número de la población
por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces
escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los
demás siguiendo el orden.
Si tenemos la población a estudiar, previamente inscrita en unas listas numeradas, obtenida la frecuencia de
los casos iremos eligiendo saltando los números que indique la frecuencia. Si queremos obtener una muestra de
20 sobre una población de 100 (K = 100/20 = 5), podríamos partir el muestreo del nº 5, el 10, el 15; o el 3, 8,
13... El primer elemento a suele elegirse al azar usando las tablas de probabilidad y, a continuación, se le suma la
frecuencia (K). Si el azar hizo que se partiera de un elemento de la lista mayor que K, al llegar a N, se vuelve al
principio de la lista hasta completar ‘n’ casos.
Cuando se trata de poblaciones numerosas, por ejemplo la guía telefónica o los censos electorales, se
seleccionan el primer y/o el último nombre de cada página o columna. Aunque es un procedimiento más
rudimentario, por razón de economía y tiempo suele utilizarse.
La elección sistemática partiendo de listas es válida si el orden no ha sido establecido teniendo en cuenta la
característica que estudiamos. No pueden servir, por ejemplo, listas en orden de calificaciones académicas si ésta
es una de las variables de investigación.
El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al
elegir a los miembros de la muestra con una periodicidad constante (K) podemos introducir una homogeneidad
que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos
en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático
con k = 10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los
dos sexos.
Este método es muy simple de aplicar en la práctica y tiene la ventaja de que no hace falta disponer de un
marco de encuesta elaborado, es más rápido que el anterior, sobre todo si la población es numerosa y está
previamente ordenada. Es muy utilizado en los sondeos de opinión y de “puerta a puerta”. A los entrevistadores
se les indica que paren a cada ‘K’ personas o llamen a cada ‘K’ puertas.

MUESTREO ALEATORIO ESTRATIFICADO


Este muestreo se utiliza cuando la población está
constituida en estratos, grupos o clases, conjuntos de la
población que se suponen homogéneos con respecto a
alguna característica de las que se van a estudiar. Dentro de
cada estrato se suele usar la técnica de muestreo
sistemático, una de las más usadas en la práctica, aunque
también se puede aplicar el muestreo aleatorio simple.

Trata de obviar las dificultades que presentan los anteriores métodos ya que simplifica los procesos y suelen
reducir el error muestral para un tamaño dado de la muestra. A cada uno de estos estratos se le asignaría una
cuota que determinaría el número de miembros del mismo que compondrán la muestra. En ocasiones las
dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).
57
Para la obtención de la muestra estratificada se siguen los siguientes pasos:
a) Se divide la población en grupos considerando categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica a estudiar. Se puede estratificar según la profesión, el
municipio de residencia, el sexo, el estado civil, etc. Por ejemplo, en un estudio de las características
socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen
presentar características diferenciales.
b) Se selecciona una muestra aleatoria de cada estrato con arreglo a algún procedimiento de muestreo,
tratando de que todos los estratos de la población queden representados.
c) El número de individuos de cada estrato se puede decidir por paridad o proporcionalidad; y
d) La suma de las muestras de cada estrato forman la muestra total ’. (Latorre, Rincón y Arnal, 2003)

El método permite utilizar información a priori sobre la estructura de la población en relación con las
variables a estudiar y obtiene representantes de todos los estratos de la población.
El muestreo estratificado tiene interés cuando la característica en cuestión puede estar relacionada con la
variable que queremos estudiar. Cuando se realiza un muestreo, la estratificación se aplica frecuentemente en
relación al tamaño de la muestra.
Se pueden usar diferentes opciones de selección del tamaño de la muestra en los estratos:
-El mismo número en cada estrato. (Muestreo estratificado constante)
-Proporcional (Muestreo estratificado proporcional)
-Optima (Muestreo estratificado óptimo)

Muestreo estratificado constante. En este caso, también conocido como afijación simple, la muestra se
obtiene seleccionando un número igual de individuos de cada estrato en que se ha dividido la población, con
independencia del tamaño y variabilidad de los mismos dentro de la población.
Muestreo estratificado proporcional. En este caso se selecciona de cada estrato un número de elementos
proporcional a su tamaño en el conjunto de la población (afijación proporcional).

Muestreo estratificado óptimo. Jiménez Fernández (1983) considera que un criterio más útil para fijar la
proporción de la muestra es atender a la variabilidad de los estratos en la característica que interesa (afijación
óptima). Para ello es necesario un conocimiento previo de la población.

Si sus varianzas son aproximadamente homogéneas, el muestreo estratificado proporcional es el aconsejado;


si por el contrario difieren mucho entre sí, debe tomarse un porcentaje mayor de elementos de los estratos que
mayor varianza experimentan. Veamos tres ejemplos:
1ro. Para estudiar las actitudes hacia la política de los cursantes universitarios podemos dividir el total de
alumnos en estratos para asegurarnos que estarán representadas las características que nos interesan. Posibles
estratos podrían ser facultades, carreras cursadas, cursos, etc. Suponiendo que se estratifica la población por
carreras cursadas, si del total de alumnos matriculados en las facultades del país seleccionamos a cincuenta de
cada carrera, el muestreo ha sido estratificado constante. Para esa muestra seleccionamos el mismo número, pero
de forma proporcional al número de alumnos matriculados en cada carrera, estamos ante una muestra
estratificada proporcional.

2do. Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones
de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad.
Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que
contenga también esos mismos porcentajes de hombres y mujeres.

58
3ro. Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación de la
reforma educativa ha tenido entre los padres de un determinado país. A tal efecto seleccionamos una muestra de
600 sujetos. Conocemos por los datos del ministerio que de los 10.000 niños escolarizados en las edades que nos
interesan, 6.000 acuden a colegios públicos, 3.000 a colegios privados subsidiados por el gobierno y 1.000 a
colegios privados no subsidiados por el gobierno. Como estamos interesados en que en nuestra muestra estén
representados todos los tipos de colegio, realizamos un muestreo estratificado empleando como variable de
estratificación el tipo de centro.

Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso parece
más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño de los estratos. Por
consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para poder
reflejarlo en la muestra.
Colegios públicos: 6000/10000 = 0.60
Colegios privados subsidiados por el gobierno: 3000/10000 = 0.30
Colegios privados no subsidiados por el gobierno: 1000/10000 = 0.10
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el
tamaño muestral.
Colegios públicos: 0.60 x 600 = 360 sujetos
Colegios privados subsidiados por el gobierno: 0.30 x 600 = 180 sujetos
Colegios privados no subsidiados por el gobierno: 0.10 x 600 = 60 sujetos

Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este
procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos
N1, N2,..., Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La
media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y si2, respectivamente.

MUESTREO ALEATORIO POR ESTADIOS MÚLTIPLES


Esta técnica es la única opción cuando no se dispone de lista completa de la población de referencia o bien
cuando por medio de la técnica de muestreo simple o estratificado se obtiene una muestra con unidades
distribuidas de tal forma que resultan de difícil acceso. En el muestreo a estadios múltiples se subdivide la
población en varios niveles ordenados que se extraen sucesivamente por medio de un procedimiento de embudo.
El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un país determinado, éstos
pueden subdividirse en unidades primarias representadas por circunscripciones didácticas y unidades secundarias
que serían los propios profesores. En primer lugar extraemos una muestra de las unidades primarias (para lo cual
debemos tener la lista completa de estas unidades) y en segundo lugar extraemos aleatoriamente una muestra de
unidades secundarias de cada una de las primarias seleccionadas en la primera extracción.

MUESTREO ALEATORIO POR CONGLOMERADOS (CLUSTERS) O GRUPOS


Técnica similar al muestreo por estadios múltiples, se utiliza
cuando el muestreo individual resulta muchas veces inaplicable y
hay que recurrir no a los elementos, sino a seleccionar por el
sistema del azar determinados colectivos, o cuando la población se
encuentra dividida, de manera natural, en grupos que se supone que
contienen toda la variabilidad de la población, es decir, la
representan fielmente respecto a la característica a elegir, pueden
seleccionarse sólo algunos de estos grupos o conglomerados para la
realización del estudio.

59
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la
población, es decir, que las unidades muestrales son los elementos de la población. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".

En el muestreo por conglomerados se divide la población en grupos de acuerdo con su proximidad geográfica
o de otro tipo (conglomerados) que contienen diversos elementos. Cada grupo ha de ser heterogéneo y tener
representados todas las características de la población. Por ejemplo, los conglomerados en un estudio sobre la
situación de las mujeres en una determinada zona rural pueden ser los municipios de la zona. Se seleccionan
aleatoriamente el número de conglomerados y se trabaja con el total de elementos pertenecientes a los
conglomerados elegidos y en ellos se investigan después todos los elementos pertenecientes a los conglomerados
elegidos.
Podríamos hacer una encuesta, por ejemplo, mediante el sistema de muestreo aleatorio simple, a todos los
alumnos de Bachillerato de una determinada ciudad. Las complicaciones y dificultades serían mucho menores
estableciendo una muestra al azar que tomara como unidades base del muestreo las aulas.
La unidad muestral es el conglomerado (cluster) o grupo y el proceso de selección aleatoria se aplica a la
selección de éstos y no a los elementos menores que componen el conglomerado.
Ventaja de esta técnica de muestreo
a) No es necesario identificar ni tener un listado de todos los elementos de la población para seleccionarlos
aleatoriamente, sino que después de seleccionados los conglomerados, se procede a elaborar dicho
listado sólo para los elementos que componen los conglomerados elegidos.
b) Necesitan menos información previa sobre los individuos particulares.
c) Soluciona el problema de los patrones en los datos.
d) Si el número de bloques no es muy grande se puede incurrir en errores de estimación si se han incluido
conglomerados atípicos.
e) Los conglomerados que se realizan teniendo en cuenta proximidad geográfica pueden no tener un
significado importante en la población (no responden a una característica real).
f) Este tipo de muestreo se utiliza fundamentalmente para reducir los costes de toma de muestras al tomar
grupos de individuos completos
Por ejemplo. En una investigación en la que se trata de conocer el grado de satisfacción laboral de los
profesores de institutos privados, necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder
individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que el número de
profesores por instituto es aproximadamente de 35, los pasos a seguir serían los siguientes:
1. Recoger un listado de todos los institutos.
2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35 = 20) que nos
proporcionarán los 700 profesores que necesitamos.

Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario comentar que ante
lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común
emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas
etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.

60
MUESTREO POR ETAPAS O POLIETÁPICO.
Relacionado con el tipo anterior. Se procede dividiendo la población en varios conglomerados y se selecciona
un número de ellos, que constituyen las unidades muestrales primarias. En una segunda etapa se obtiene una
submuestra a partir de las anteriores, que constituyen las unidades muestrales secundarias, y así sucesivamente.
Se submuestrean las unidades anteriores hasta llegar a la muestra final.

El proceso sigue una secuencia de etapas de selección de unidades muestrales de mayor rango a otras de
menor, hasta llegar a los individuos o elementos que constituyen la muestra: Comunidad Autónoma, distrito
escolar, centros, aulas, alumnos. Este tipo de muestreo sólo necesita conocer los individuos que integran los
conglomerados de la última etapa. En cada etapa puede aplicarse un muestreo aleatorio.

Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para


integrar la muestra, el diseño se llama muestreo bietápico.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las
personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es
decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al
azar. Este método tiene la ventaja de simplificar la recogida de información muestral.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método
funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más
diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

Homogeneidad de las poblaciones o sus subgrupos


Homogéneo significa, en el contexto de la estratificación, que no hay mucha variabilidad. Los estratos
funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la característica a medir. Por ejemplo,
si se estudia la estatura de una población, es bueno distinguir entre los estratos mujeres y hombres porque se
espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no
hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la población total.

Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas diferencias dentro
del estrato que en toda la población, no hay por qué usar este método de muestreo. En los casos en los que
existan grupos que contengan toda la variabilidad de la población, lo que se construyen son conglomerados, que
ahorran algo del trabajo que supondría analizar toda la población. En resumen, los estratos y los conglomerados
funcionan bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto a la
característica a estudiar y los conglomerados, si representan fielmente a la población, esto es, contienen toda su
variabilidad, o sea, son heterogéneos.

2.- MUESTREO NO PROBABILÍSTICO (no aleatorio o de juicio)


A veces, para estudios exploratorios, el muestro probabilístico resulta excesivamente costoso y se acude a
métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se
tiene certeza de quela muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la
misma probabilidad de ser elegidos. Aunque en general se selecciona a los sujetos siguiendo determinados
criterios procurando que la muestra sea representativa

Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población.
Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra
aleatoria más adelante.

61
Es aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra. Se busca
seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por
lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones. En estas
técnicas no se utiliza el muestreo al azar sino que la muestra se obtiene atendiendo al criterio o criterios del
investigador o bien por razones de economía, comodidad, etc. Consecuentemente, estas técnicas no utilizan el
criterio de equiprobabilidad, sino que siguen otros criterios, (la intuición, la documentación histórica o una gran
experiencia de campo) procurando que la muestra obtenida sea lo más representativa posible. Estas muestras, al
no utilizar el muestreo al azar, no tienen la garantía de las muestras probabilísticas, pero en la práctica son a
menudo necesarias e inevitables, en opinión de Kerlinger (1975). Dentro de este tipo de muestreo se suele
distinguir entre muestreo accidental, intencional o deliberado y por cuotas.

MUESTREO ACCIDENTAL, CASUAL o FORTUITO


Este tipo de muestreo se caracteriza por utilizar las muestras que tiene a su alcance. Se denominan
accidentales porque no responden a una planificación previa en cuanto a los sujetos a elegir. De hecho, toma las
muestras disponibles sin introducir selección o modificación alguna. Por ejemplo, empresas, centros completos,
cursos o grupos dentro de un nivel. También es el caso de voluntarios para pruebas de medicamentos de
enfermedades como el corazón, cáncer, etc.

El criterio de selección de los individuos depende de la posibilidad de acceder a ellos. Es frecuente utilizar
sujetos que las condiciones nos permiten (muestras que “proporcionan los amigos”). Por ejemplo, entrevistar a la
salida del metro, o a las personas que pasan por una calle.

Desde el punto de vista de la investigación este tipo de muestreo es más débil. No obstante, puede usarse en
estudios exploratorios cuando no se disponen de otras, cuidando mucho el análisis y la interpretación de
resultados.

MUESTREO INTENCIONAL U OPINATIVO


Consiste en la elección por métodos no aleatorios de una muestra cuyas características sean similares a las de
la población objetivo. En este tipo de muestreos la “representatividad” la determina el investigador de modo
subjetivo, siendo este el mayor inconveniente del método ya que no podemos cuantificar la representatividad de
la muestra. En esta técnica, el investigador selecciona de modo directo los elementos de la muestra que desea
participen en su estudio. Se eligen los individuos o elementos que se estima que son representativos o típicos de
la población. Se sigue un criterio establecido por el experto o investigador. Se suelen seleccionar los sujetos que
se estima que pueden facilitar la información necesaria.

Este método, que Jiménez Fernández (1983) califica de “deliberado”, se justifica cuando se quieren estudiar
elementos excepcionales de cierta población, ya que la forma de asegurarse de que se incluirán en dicho estudio,
es elegirlos intencionalmente. No dudando de su utilidad, se presta a críticas porque las muestras obtenidas
resultan inevitablemente sesgadas en el sentido del criterio que se ha usado para seleccionarla.

En estas muestras opináticas (Latorre, Rincón y Arnal; 2003), buscamos deliberadamente los elementos de la
muestra porque nos parece que pueden facilitarnos una información más válida. Si queremos datos sobre la
población delincuente será interesante recurrir a los servicios policiales, a los centros penitenciarios o de
rehabilitación social o a los propios reclusos, que no son naturalmente toda la población delincuente. Hay que
convenir con Marín (1985) que no todas las opiniones son igualmente cualificadas, y cuando nos interesa una
información más válida, la experiencia y la preparación pueden inducirnos a seleccionar deliberadamente la
muestra de acuerdo con unas características no aleatorias.

Hay muestras intencionadas que parten de ‘elementos típicos’ o ‘representativos’ a los que ya públicamente
se les ha reconocido tal rango. En España, en las Elecciones Generales se sabe que el escrutinio de apenas ocho
decenas de mesas electorales, ya determinadas, tienen un valor extrapolable al resultado global de las citadas
elecciones. Este tipo de muestras han sido ampliamente divulgado por los medios de comunicación:

62
“En la película Magic Town, el investigador de opinión pública interpretado por James
Stwart, descubrió un pueblo que tenía exactamente las mismas características que todo
Estados Unidos. Grandview poseía exactamente la misma proporción de personas que
votaban por los republicanos, la misma proporción de personas bajo la línea de la pobreza,
igual proporción de mecánicos automotrices, etcétera, que Estados Unidos visto como un
todo. El personaje de Stewart sólo tenía que entrevistar a las personas de Grandview para
saber cuál era la opinión pública en la Unión Americana”. (Lohr, 1999)

Presenta casi siempre sesgos y por tanto debe aplicarse únicamente cuando no existe alternativa. En algunos
casos, especialmente cuando se requiere una estrecha colaboración por parte de los ganaderos o veterinarios de
campo, es la única opción para que el estudio sea viable. Supongamos que queremos realizar un estudio
longitudinal consistente en tomar muestras de los animales de la explotación cada mes, o llevar diariamente unos
registros determinados de la granja, la mejor opción será realizar el estudio en granjas de confianza que permitan
las manipulaciones y tengamos garantías de que el trabajo se llevará a cabo correctamente.
También puede ser útil cuando se pretende realizar una primera prospección de la población o cuando no
existe un marco de la encuesta definido. Este tipo de muestreos puede incluir individuos próximos a la media o
no, pero casi nunca representará la variabilidad de la población, que normalmente quedará subestimada.

MUESTREO POR CUOTAS


Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. El sistema de cuotas
consiste en fijar unas “cuotas”. Cada cuota consiste en un número de elementos que reúnen unas determinadas
condiciones. La selección de las “cuotas” suele hacerse mediante “rutas” o “itinerarios”.
En este procedimiento se parte de una muestra estratificada cuyas proporciones debe conservar el
investigador, pero cada uno de los casos queda a su arbitrio elegirlos.
En primer lugar es necesario dividir la población de referencia en varios estratos definidos por algunas
variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso proporcional de
cada estrato, es decir, la parte proporcional de población que representan. Finalmente se multiplica cada peso por
el tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia del muestreo
estratificado en que una vez determinada la cuota, el investigador es libre de elegir a los sujetos de la muestra
dentro de cada estrato.
Supongamos que queremos averiguar el nivel cultural de unos determinados profesionales de un área
geográfica o de un sector productivo. Como el sexo, la edad y el lugar de residencia, parecen factores
condicionantes, deberemos establecer que haya un 50% de varones y de mujeres, un tanto por ciento aproximado
por grupos de edad correspondientes a la población real y así mismo procuraremos que haya el mismo tanto por
ciento en la muestra que en la realidad de quienes viven en poblaciones de menos de 2.000 habitantes, de 2.001 a
5.000 habitantes, etc. El investigador ha fijado ‘n’ para la muestra y elige libremente los individuos hasta
alcanzar esa cifra.
El riesgo radica en que seleccione a personas a quienes resulta más fácil, por razones de localización. De
hecho, cuando se trabaja con entrevistas, hay una resistencia a consultar a población dispersa en caseríos
distantes o a la que está en pisos elevados sin ascensor.
Por último, Marín (1985) señala un riesgo muy generalizado, común al muestreo probabilístico y no
probabilístico, y es el del rechazo a participar en la investigación. En este caso no hay más remedio que sustituir
la población que no desea colaborar o a la que no tenemos acceso por otra de condiciones similares, pero hay
que tener mucho cuidado para evitar el sesgo de la muestra, porque puede ocurrir que precisamente la población
no participante tenga alguna característica por la que no desee contestar, con lo cual queda excluida de la
muestra y comprensiblemente mantendrá su rechazo en los nuevos casos que los sustituyan.

63
Otros tipos de muestreo.
Sierra Bravo (1988) presenta otros métodos menos utilizados.

MUESTREO DE BOLA DE NIEVE


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero en contacto entre sí.
Consiste en identificar sujetos que se incluirán en la muestra a partir de los propios entrevistados. Partiendo de
una pequeña cantidad de individuos que cumplen los requisitos necesarios estos sirven como localizadores de
otros con características análogas.

MUESTREO SUBJETIVO POR DECISIÓN RAZONADA


En este caso las unidades de la muestra se eligen en función de algunas de sus características de manera
racional y no casual. Una variante de esta técnica es el muestreo compensado o equilibrado, en el que se
seleccionan las unidades de tal forma que la media de la muestra para determinadas variables se acerque a la
media de la población.

MUESTRAS SUPERPUESTAS
Se seleccionan dos muestras distintas obtenidas de la misma base de la muestra mediante la realización de dos
sorteos o dos sistemas de muestreo distintos. Es un procedimiento muy útil cuando se quiere lograr una valiosa
corroboración o verificación de los resultados obtenidos en una encuesta.

MUESTRAS SUCESIVAS
Cuando interesa conocer la evolución del fenómeno estudiado con el paso del tiempo (estudios de mercado,
electorales...), la solución es repetir la encuesta a nuevas muestras cada cierto período de tiempo.

MUESTRAS COMPUESTAS
Se conoce con este nombre al sistema de muestreo que comprenden dos o más muestras distintas, según las
diferentes partes del fenómeno estudiado. En un estudio que abarque población de hábitats urbanos y rurales, se
podría aplicar un muestreo aleatorio simple para el primero y el de clusters para zonas rurales.

MUESTRAS COMPENSADAS
Esta técnica es aplicable cuando se conoce el valor medio que alcanza una de las características estudiadas en
el universo, por ejemplo, la talla, el peso, etc. Una vez obtenida la muestra, sería poco probable que su media
coincidiera con la de la población. La compensación consiste en sustituir unidades de la muestra por otras nuevas
elegidas también al azar, en el caso de que sus valores acerquen más la media de la muestra a la del universo.

MUESTRAS DE VOLUNTARIOS
En algunas investigaciones el autor se ve obligado a pedir voluntarios que quieran participar en su estudio,
dado que por razones éticas o morales no pueden utilizar ninguno de los demás procedimientos. Estas muestras
presentan ciertos sesgos y suelen presentar determinadas características, como por ejemplo: son sujetos con un
mayor nivel cultural, tienen mejor estatus social, suelen ser más inteligentes, son más sociables, son menos
convencionales, son menos conformistas, etc.

REPRESENTATIVIDAD DE LA MUESTRA
Uno de los problemas fundamentales que se le plantea al investigador en relación con el muestreo consiste en
saber si el grupo elegido es verdaderamente representativo del conjunto; para que lo sea, los rasgos de los
elementos o individuos elegidos para la muestra deben ser similares a los de toda la población (Marín Ibáñez,
1985).
La representatividad es la característica más importante de una muestra. El muestreo adquiere todo su sentido
en cuanto que garantiza que las características que se quieren observar en la población quedan reflejadas
adecuadamente en la muestra. Generalizar a la población a partir de la muestra sólo está justificado si ésta
representa realmente a la población.
64
“Preservar la representatividad es el atributo más importante que debe reunir el muestreo, lo
que nos permitirá generalizar a la población los resultados obtenidos en la muestra”.
(Latorre, Rincón y Arnal, 2003)

Fox (1981) señala que para lograr la representatividad se requiere: 1. Conocer qué características (variables)
están relacionadas con el problema que se estudia; 2. Capacidad para medir esas variables, y 3. Poseer datos de
la población sobre estas características o variables para usarlos como variable de comparación. El mismo autor
señala que si no se cumple alguna de estas condiciones, para algunas de las características, se pierde la capacidad
de buscar deliberadamente la representatividad en cuanto a ella.
La selección aleatoria de la muestra garantiza la ausencia de sesgo en el proceso de selección de la misma,
ayuda a garantizar su representatividad, pero esta circunstancia no es garantía total para que estemos seguros de
que la muestra al azar es representativa de la población de la que se ha extraído. Para Fox (1981) otra forma de
analizar el problema de la representatividad de la muestra consiste en distinguir entre la muestra invitada, la
muestra aceptante y la muestra productora de datos. La primera corresponde al conjunto de individuos
“invitados” del conjunto de la población, la segunda hace referencia al grupo de individuos que aceptan
participar y la muestra productora de datos coincide con la muestra real del estudio.
Si se poseen datos sobre la población se pueden comparar con ellos la muestra invitada y/o la aceptante y,
mediante algún contraste de significación adecuado (por ejemplo chi-cuadrado), determinar si difieren de ella en
las características que interesa en una investigación dada. Si el contraste indica que no hay diferencias
significativas en las variables consideradas, se puede admitir la representatividad de la muestra para las
características en cuestión, pero nada se puede afirmar sobre la representatividad de la muestra respecto de
cualquier otra variable
Si, por el contrario, no se ha logrado representatividad en una o varias variables, el investigador tiene dos
opciones: a) trabajar con la muestra no representativa y contar con ese límite; b) seleccionar más elementos de la
población, con la esperanza de que una muestra mayor sí sea representativa, aunque el estudio tenga una muestra
mayor que la buscada inicialmente.
Para realizar el contraste de representatividad de las muestras respecto de la población, hemos supuesto que
se tienen datos sobre ella. Si no se tuvieran datos de la población, no se puede realizar el contraste de la muestra
invitada y/o aceptante con respecto a la población. Entonces se recurre a contrastar la muestra aceptante con la
invitada. Sobre la muestra productora de datos siempre posee valores el investigador, ya que su referente
comparativo es la muestra aceptante. Un informe sobre los elementos que se negaron a participar, de los que
aceptaron participar pero luego no pudieron y de los que aceptando, en un primer momento, se negaron a hacerlo
al conocer más profundamente la investigación; orientará al investigador y al destinatario de la investigación
sobre la posibilidades de sesgo en esta etapa del muestreo. Una prueba de significación adecuada entre estas dos
muestras (aceptante y final) serviría para ver si difieren significativamente en algunas de las variables básicas o
si, por el contrario, la muestra productora de datos sigue siendo representativa de la muestra aceptante, lo que
demuestra que esa/s característica/s no han sido consideradas para no participar.
Por último, es necesario preguntarse qué pérdida puede tolerarse desde la selección de la muestra inicial hasta
llegar a la que proporcionan los datos. Al mismo tiempo, hay que tener en cuenta que se tiene constancia
probada de que las personas que no responden tienen opiniones o patrones de conducta distintos de las que
responden; y que el porcentaje de la pérdida también depende, para su representatividad, de cómo se distribuyan
las respuestas en la diferentes categorías de la variable. No es igual un 48% de “sí” y un “52% de “no” ante
determinada pregunta que un 16% y un 84% (Jiménez Fernández, 1983). En cualquier caso, no existe una única
respuesta cuantitativa. Se suele considerar que una pérdida del 25% debe preocupar, aún cuando no existan
diferencias estadísticamente significativas; “cuando sea inferior al 50% «se debe leer y escribir con cuidado»; y
cuando la proporción es menor del 40% no se deberían dar a conocer los datos, ni considerarlos como
conclusiones válidas. Son útiles como estudios pilotos, pero no se pueden aceptar sin hacer un estudio posterior
más exhaustivo” (Latorre, Rincón y Arnal, 2003).
65
DISTRIBUCIONES TEÓRICAS DE LA PROBABILIDAD
Variables aleatorias y Función de probabilidad.
En toda la teoría de la probabilidad es muy importante conocer e indagar las características de las
distribuciones de probabilidad para el conjunto de todos los resultados posibles (espacio muestral) de un
experimento aleatorio. Veamos dos conceptos importantes.
Supongamos que se realiza el experimento de lanzar al aire 2 monedas, sabemos que el espacio muestral de
este experimento contiene 4 puntos muestrales:
S = e1 = (CC), e2 = (CS), e3 = (SC), e4 = (SS)
donde el primer elemento de cada par indica si se obtuvo cara (c) o sello (s) en la primera moneda, y el segundo
indica lo mismo pero con respecto a la segunda moneda. La probabilidad de cada moneda es ¼. Ahora bien,
normalmente nosotros no estaremos interesados en los puntos muestrales, sino en alguna magnitud asociada con
los puntos muestrales. Por ejemplo, podríamos estar interesados en el número de caras que hay en cada punto
muestral ei, en tal caso x 1 = 2, x2 = 1, x3 = 1 y x4 = 0. Pues bien, Xi es una variable aleatoria.
Una variable X es una variable aleatoria si es una magnitud susceptible de tomar diversos valores con
determinadas probabilidad.
En el ejemplo, (eliminando el subíndice) x = 0 con probabilidad ¼ , x = 1 con probabilidad ½ , x = 2 con
probabilidad ¼ y escribiremos:
P(X = 0) (Léase probabilidad de que la variable aleatoria X sea igual a cero) = 1/4
Otra definición más precisa de variable aleatoria sería la siguiente: sea S un espacio muestral; sea X una
función real definida en S (es decir, X transforma los puntos muestrales de S en puntos en el eje de las abscisas).
Entonces X se llama variable aleatoria.

e1 = (CC) e3 = (SC)

e2 = (CS) e4 = (SS)

0 1 2 x

Variable Aleatoria (estocástica o de azar):


En probabilidad y estadística, una variable aleatoria es una variable cuyos valores se obtienen de
mediciones en algún tipo de experimento aleatorio. Formalmente es toda función que permite asignar un
número real y sólo uno, a todos y cada uno de los eventos elementales de un espacio muestral.
Por ejemplo, los posibles resultados de lanzar un dado dos veces (1, 1), (1, 2),…,
Asociados a un número real, digamos, su suma.
En tal sentido, una variable aleatoria es una función que cuantifica los resultados de un experimento
aleatorio. Se acostumbra representarlas, por lo general, con las letras mayúsculas X, Y, Z, y los posibles
valores que pueden tomar por las letras minúsculas x, y, z.
Estas pueden ser discretas o continuas, pudiendo incluso ser ambas, en cuyo caso se llamarán
polidimensionales.

66
La variable aleatoria X es discreta o discontinua cuando la cantidad de valores que puede asumir es
contable, sea finita o infinita, es decir, cuando únicamente puede tomar un determinado número de valores
enteros en un intervalo, (valores susceptibles de ser contados). Por ejemplo, la variable aleatoria “número de
caras obtenidas al lanzar 2 monedas”, es una variable aleatoria discreta en el intervalo (0, 2). Sólo puede tomar
los valores 0, 1 y 2. El número de hijos de una familia, también es un ejemplo de variable aleatoria discreta. De
esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una función matemática que
asigne una probabilidad a cada realización x de la variable aleatoria. Esta función recibe el nombre de función
de probabilidad.

Se dice que una variable aleatoria discreta tiene un conjunto definido de valores posibles x1, x2, x3, … , xn con
sus probabilidades respectivas p1, p 2, p3, …, p n. Es decir, solo puede tomar ciertos valores dentro de un campo
de variación dado. Como X ha de tomar uno de los valores de este conjunto, entonces p 1 + p2 + p3 + … + pn = 1

Como veremos en la siguiente unidad


Una variable aleatoria es continua cuando los valores asumidos por la variable forman un conjunto infinito, y
por tanto no contable, bien sea un intervalo o varios intervalos, es decir, cuando puede tomar cualquier valor
dentro de ese intervalo. Supongamos el experimento de lanzar una moneda hacia una línea marcada en el
suelo. Supongamos que la distancia máxima a la que puede caer la moneda de la raya es 1 metro (entendiendo
como distancia la del centro de la moneda a la línea). Si definimos una variable aleatoria X que representa esa
distancia, X puede tomar cualquier valor en el intervalo 0, 1. La altura de los estudiantes de una clase, las
horas de duración de una pila, también son ejemplos de variables aleatorias discretas.

Función de probabilidad.
Los pares ordenados formados por los valores de la variable y sus probabilidades, se conoce como función de
probabilidad o distribución de probabilidades.

Notación. El par Xi, f (xi) denota una función de probabilidad, donde Xi representa los valores que asumirá
la variable y f (xi) representa la probabilidad de que la variable aleatoria X tome el valor x, es decir, que:
f (x) = P (X = x)

Con esa expresión es posible determinar probabilidades mediante igualdades o desigualdades e intervalos,
como por ejemplo P (X < x), P (X  x), P (X > x), P (X  x), P (x  X  x).

Una función de probabilidad es aquella función f (x) que mide la probabilidad


de que la variable aleatoria X tome determinados valores.

Cuando la variable aleatoria es discreta, la función de probabilidad toma el nombre de función de probabilidad
masa; si la variable aleatoria es continua toma el nombre de función de densidad. Nosotros no haremos
distinción, y en ambos casos la llamaremos función de densidad.

Sea X una variable aleatoria de un espacio muestral S, a saber, X(S) = x1, x2, x3, … , xn. Convertimos X(S)
en un espacio de probabilidad definiendo la probabilidad de x1 como P(X = x1) que se escribe como f (xi). Esta
función f de X(S), definida como f (xi) = (X = xi) se llama Distribución o Probabilidad de X y se expresa
generalmente en forma de tabla

X1 X2 ... Xn
f (x1) f (x2) … f (xn)
67
Ejemplo 1: Se lanzan tres monedas al aire. Al definir como variable aleatoria X al número de caras obtenidas
en el experimento aleatorio, el espacio muestral tendrá 2 3 = 8 resultados posibles:
S = CCC, CCS, CSS, SSS, SSC, SCC, SCS, CSC
La función de probabilidad o distribución de probabilidad está dada por:
 Cuando aparece el punto muestral o evento elemental SSS, su probabilidad es: P (X = 0) = 1/8
 Cuando aparecen los eventos elementales CSS, SSC, SCS, su probabilidad es: P (X = 1) = 3/8
 Para los eventos elementales CCS, SCC, CSC, su probabilidad es: P (X = 2) = 3/8
 Para el evento elemental CCC, su probabilidad es: P (X = 3) = 1/8
Resumiendo en un cuadro
N° de caras Prob. Acum.
X P (Xi) F (x)
0 1/8 1/8 Obsérvese que la suma de las probabilidades para el
1 3/8 4/8 espacio muestral es igual a la unidad, condición que
2 3/8 7/8 debe cumplirse para el evento completo.
3 1/8 8/8
 1

Ejemplo 2: Si lanzamos 2 dados bien balanceados, y definimos la variable aleatoria X como la suma de los 2
resultados, los posibles valores de X con sus respectivas probabilidades serán:
f (x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
x 2 3 4 5 6 7 8 9 10 11 12

Una función matemática de la variable aleatoria Xi puede ser considerada


una función de densidad, si cumple las siguientes condiciones:

a) Si Xi es una variable discreta f  xi   0 i y  f X   1


i
i


b) Si Xi es una variable continua f xi   0 i y  f X   1
i


Función de probabilidad Acumulada.


La probabilidad de que la variable aleatoria X, tome valores menores o iguales a x, se conoce como función de
distribución acumulada y se designa por F(x), donde F(x) = P (X  x), lo cual indica, la probabilidad de que X
asuma valores menores o iguales a un determinado valor. Por ejemplo, para un valor a:
F(a) = P (X  a) =  f (x) =  P(X = x)

Observaciones:
1. Si la probabilidad es un número comprendido entre 0 y +1, es decir, 0  PE  1, entonces 0  F(x)  1.
2. Sean a y b, dos números reales cualesquiera tales que a < b, luego, los sucesos x  a y a < X  b, serán
mutuamente excluyentes; y su suma será el suceso X  b. Al aplicar la regla de la adición, se tiene:
P (X = b) = P (X  a) + P (a < X  b) por lo tanto P (a < X  b) = F(b)
Lo cual implica que F(x) es una función no decreciente en la medida en que el desplazamiento sea de
izquierda a derecha.
68
3. La probabilidad de que la variable aleatoria tome cualquier valor finito es igual a 1.
F     Lím F x   P  X      1
x  
De forma análoga resulta: F     Lím F x   P  X      0
x - 

En conclusión: P(X > x) =1 – P (X  x)

Ejemplo
Se lanzan simultáneamente cuatro monedas. ¿Cuál será la distribución de probabilidad para el número de
caras?

Solución:
1. El espacio muestral lo obtenemos mediante un diagrama de árbol; siendo M = Moneda, C = Cara y S = Sello

M1 M2 M3 M4
Espacio muestral Probab.
C CCCC 1/16
C CCCS 1/16
CCSC 1/16
S
CCSS 1/16
C
CSCC 1/16
C CSCS 1/16
S CSSC 1/16
S CSSS 1/16
C SCCC 1/16
C SCCS 1/16
C SCSC 1/16
S SCSS 1/16
S SSCC 1/16
C SSCS 1/16
S SSSC 1/16
S SSSS 1/16
 1,00

M1 M2 M3 M4

C
C
S
C
C
S
S
S
C
C
S
S
C
S
S

Al lanzar cuatro monedas al aire simultáneamente, se obtienen 2 4 = 16 puntos muestrales.


69
2. Se levanta la distribución de probabilidad para el número de caras
Valores de (Xi) para el número Probabilidad:
de caras de 4 monedas P (X = x)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16
1,00

3. Para conseguir la probabilidad para el número de caras, se cuenta en el diagrama de árbol (espacio muestral),
en cuántos puntos muestrales aparece la C y se divide por el número de puntos muestrales. Por ejemplo, la cara
(C), no aparece en el punto muestral (SSSS), por lo que P (X = 0) = 0, y así sucesivamente.
Para calcular las probabilidades del número de caras en el lanzamiento de las cuatro monedas en forma
simultánea, también se puede usar el Binomio de Newton:
x 4 x
 4  1   1 
f x   P  X  x        
 x  2   2 

C  S 4  C 4  4C 3 S  6C 2 S 2  4CS 3  S 4 y las probabilidades son:

1 4 6 4 1
P x  4   ; P x  3  ; P x  2   ; P x  1  ; Px  0  
16 16 16 16 16

La probabilidad de cara es el cociente entre el coeficiente de cada término del desarrollo y el número de puntos
muestrales. (24 = 16 puntos muestrales).
Por ejemplo: El término 4C 3S , significa que existen cuatro puntos muestrales donde la cara (C) aparece tres
4
veces y el sello (S) una vez, entonces P X  3  ; y así sucesivamente.
16

Vamos a construir el diagrama de barras para la distribución de probabilidad señalada en el paso 2:

P (X = x)
f (0) = P (X = 0) = 1/16
6/16 f (3) = P (X = 3) = 4/16
f (  4) = P (X  4) = 1/16
5/16
f ( > 4) = P (X > 4) = 0

4/16
f ( 2) = P (X  2) = 6/16 + 4/16 + 1/16 = 11/16
2 caras 1 cara 0 caras
3/16
f ( 1  X  3) = P (1  X  3) = 4/16 + 6/16 + 4/16 = 14/16
2/16 1 cara 2 caras 3 caras

1/16

X
0 1 2 3 4

70
Ejemplo 2.
Para el caso anterior (lanzamiento de las cuatro monedas). ¿Cuál será la función de distribución acumulada
para el número de caras?
Solución:
1. Una vez conocida la distribución de probabilidad, se levanta otra columna llamada de probabilidad
acumulada: F x   P X  x 
2. Esta columna se obtiene sumando sucesivamente las probabilidades desde X = 0, hasta X = 4. El último
resultado acumulado debe ser igual a 1.
X f (x) = P (X = x) F(x) = P (X  x)
4 1/16 16/16 = 1
3 4/16 15/16
2 6/16 11/16
1 4/16 5/16
0 1/16 1/16
1,00

ESPERANZA MATEMÁTICA
Las dos características fundamentales de la distribución de una variable aleatoria, lo mismo que para la
distribución muestral de frecuencias, son su tendencia central y su variabilidad. La esperanza matemática
(también llamada “valor esperado” o “valor promedio”) es una medida de tendencia central de una variable
aleatoria. Tiene su origen en los juegos de azar, debido a que los jugadores deseaban saber cuál era su esperanza
de ganar o perder en un juego determinado. Como a cada resultado particular del juego le corresponde una
probabilidad determinada, esto equivale a una función de probabilidad de una variable aleatoria y el conjunto de
todos los resultados posibles del juego estará representado por la distribución de probabilidad de la variable
aleatoria. La esperanza es uno de los parámetros que describen a una variable aleatoria.

Para calcular la esperanza matemática de una variable aleatoria, se suman los productos de todos los posibles
valores de la variable aleatoria por sus correspondientes probabilidades.

Si X es una variable aleatoria (v.a.) discreta con valores posibles x1, x2, … , xn y sus probabilidades
representadas por la función de probabilidad P(xi), entonces la media, valor esperado, esperanza
matemática o expectativa matemática de una v.a. X, denotada por  X  E X  o simplemente  , se
define como la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Y
viene dada por:
n
E(X) =  x = x1 f (x1) + x2 f (x2) + x3 f (x3) + .... + xn f ( xn ) = x
i 1
i f ( xi )

Valores de X f(x)
x1 f  x1 
x2 f x 2 
x3 f x 3 
 
xn f x n 

71
Lo anterior significa que para calcular E(X) se multiplica cada valor que puede tomar la variable aleatoria por
la probabilidad que le corresponde y después se suman esos productos, cada valor ponderado por su
probabilidad, esto es, E(X), la esperanza de una distribución de probabilidad discreta, es la media aritmética
ponderada (el promedio ponderado) de todos los valores (resultados) posibles de X, en los cuales los pesos son
las probabilidades respectivas de tales resultados.
El valor esperado representa el valor promedio que se espera suceda, al repetir el experimento en forma
independiente una gran cantidad de veces. El valor esperado se interpreta físicamente como el centro de masa o
centro de gravedad de la distribución de probabilidad, por lo que es igual a la media o promedio aritmético. Si
todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y
la función de densidad f (x) sería:


 X  E X    xf x dx o E X    XdP
 

El concepto de esperanza se asocia comúnmente en los juegos de azar al de beneficio medio o beneficio
esperado a largo plazo.

Ejemplo 1.
Se lanza un dado al aire. ¿Cuál es la esperanza matemática con respecto al número de puntos de la cara superior,
si el dado es lanzado varias veces?
Solución:
Procedimiento:
1. Se halla el espacio muestral: S = 1, 2, 3, 4, 5, 6 X 1 2 3 4 5 6 
2. Se construye la distribución de probabilidad.
f (x) 1/6 1/6 1/6 1/6 1/6 1/6 1,00
3. Se multiplica la columna X y la columna f (x)
4. Se suman los productos: X . f (x) X . f (x) 1/6 2/6 3/6 4/6 5/6 6/6 21/6
5. se aplica la fórmula de la esperanza matemática
 X  E X   x i  f xi   21 / 6  3,5
6. Interpretación: Al lazar un dado varias veces, el promedio de los puntos de la cara superior es
aproximadamente 3,5

Ejemplo 2.
Si se lanzan dos dados legales, y se suman los puntos que aparecen en las caras superiores. Encontrar el valor
esperado.
Solución.
Definamos la variable aleatoria X como la suma de los números que aparecen al lanzar dos dados legales. Como
vimos en el problema anterior, la distribución de probabilidad es:  xi f(xi)

xi 2 3 4 5 6 7 8 9 10 11 12
f(xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

En particular, si la distribución de probabilidades es simétrica como en el ejemplo anterior, el valor esperado


coincide con el valor de la variable que tiene la mayor probabilidad en la distribución.

Una aplicación del valor esperado puede ser la siguiente.


72
Ejemplo 3.
Un casino le permite a un jugador que lance un dado legal y que reciba tantos bolívares como puntos aparezcan
en la cara superior del dado. El jugador debe pagar una cantidad k de bolívares cada vez que juegue. Calcular
cuánto debe valer k para que el jugador ni gane ni pierda.

Solución.
Sea X la variable aleatoria que representa el resultado al lanzar un dado. Su distribución de probabilidad es la
siguiente:

1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6

En este caso el valor esperado debe ser igual al valor k, con lo que se espera que el jugador ni gane ni pierda.
Aplicando la fórmula del valor esperado tenemos:

 xi f(xi) = 1(1/6) + 2(1/6) + 3(1/6) + 4(1/6) + 5(1/6) + 6(1/6) = 3.5

El jugador debe pagar 3,5 bolívares cada vez que participa en el juego. Si la cuota k fuera de 4 bolívares por
juego, la ganancia neta esperada del casino sería de 050 bolívares por juego, ya que k = 4,00 – 3,50 = 0,50
bolívares. Como lo que recibe el jugador en un solo juego no puede ser igual a 3,5 bolívares (debe ser un número
entero entre 1 y 6), entonces la E(X) no necesariamente coincide con el resultado de un solo juego. El significado
de E(X) = 3,5 bolívares, es que si el juego se realiza un gran número de veces, el cociente Ingreso total /
Número de juegos realizados debe ser aproximadamente igual a 3,5 bolívares.

Ejemplo 4.
Consideremos una lotería con mil números. Cada número cuesta 25 centavos y el premio es de 100 pesos.
Calcular cuánto se espera ganar o perder cada vez que se participa en esta lotería.

Solución.
Sea X la variable aleatoria “utilidad que obtiene la persona que participa en la lotería” y los valores que puede
tomar son:
Cuando gana = 99,75 pesos (100 que gana del premio, menos 0,25 del costo del número).
Cuando pierde: – 0,25 pesos (costo del número)
Por su parte, la probabilidad de ganar es 1/1000 y de perder 999/1000.
De acuerdo a los datos anteriores, la distribución de probabilidad es:

X = xi 99,75 – 0,25
f(xi) 1/1000 999/1000

Por lo tanto, el valor esperado es:  xi f(xi) = (99,75) (1/1000) + (– 0,25) (999/1000) = – 0,15

Es decir que la persona que participe en la lotería espera perder 15 centavos en cada juego.

PROPIEDADES DE LA ESPERANZA MATEMÁTICA:


1. Si a una variable aleatoria X, se le suma una constante K, la nueva variable aleatoria (X + K), tiene la
misma esperanza matemática que X más la constante. E = (X + K) = E(X) + K

Ejemplo: Sea la variable aleatoria X, con la siguiente función de probabilidad:

73
X f(x) X . f(x)
Donde  x  1,5
0 0,1 0
Si K = 2, se tendrá. E (X + K) = E(X) + K = 1,5 + 2 = 3,5
1 0,3 0,3
Comprobación:
2 0,6 1,2
E (X + K) = (0 + 2) (0,1) + (1 + 2) (0,3) + (2 + 2) (0,6)
1,0 1,5 = 0,2 + 0,9 + 2,4 = 3,5

2. Si multiplicamos cada valor de una variable aleatoria X, por una constante K, la esperanza matemática
quedará multiplicada por ese valor:

Del ejemplo anterior: E(X) = 1,5 y K = 2. Luego, E (X . K) = K . E (X) = 2 (1,5) = 3

Comprobación: E (X . K) = (0) (2) (0,1) + (1) (2) (0,3) + (2) (2) (0,6)

= 0 + 0,6 + 2,4 = 3,0

3. Cuando una variable aleatoria X se multiplica por una constante a y después se le suma una constante b,
la esperanza matemática quedará multiplicada e incrementada por esa constante.

Del ejemplo 1: E (X) = 1,5 y si tomamos: a = 2 y b = 3.


E = (a . X + b) = a . E(X) + b = 2 (1,5) + 3 = 3 + 3 = 6

Comprobación: E (a . X + b) = (2 . 0 + 3) (0,1) + (2 . 1 + 3) (0,3) + (2 . 2 + 3) (0,6)


= 0,3 + 1,5 + 4,2 = 6

4. Cuando una variable aleatoria es capaz de asumir solamente un valor K, se denomina variable aleatoria
constante y la esperanza matemática de esa variable aleatoria K: E (K) = K.

VARIANZA
Existen dos aspectos que caracterizan de forma simple el comportamiento de la distribución de probabilidad,
porque proporcionan una descripción completa de la forma en que se comporta: la medida de tendencia central y
las de dispersión. La primera está representada por la media o valor esperado, ya vista en el punto anterior, y la
segunda por la variancia y/o por la desviación estándar, que evalúan la dispersión de la distribución de
probabilidad o grado en que se separan del promedio los valores de la variable aleatoria X.

Por ejemplo, en un espacio muestral equiprobable vemos que los valores 5, 10 y 15 tienen una media igual a
10 y que en los valores 9.9, 10 y 10.1 la media también es 10. Sin embargo, advertimos que los dos conjuntos
de valores difieren notablemente en la dispersión de los valores respecto a su media y que tal dispersión es de
gran importancia. Por lo tanto, para tener un conocimiento claro y completo del comportamiento de los valores
que puede tomar la variable aleatoria, es indispensable conocer tanto la media como la variancia y/o la
desviación estándar de la distribución de probabilidad.

En teoría de probabilidad, la varianza de una variable aleatoria, que suele representarse como σ x2 , también
V(X) o simplemente 2, es una medida de dispersión o variabilidad definida como la esperanza del cuadrado de
la desviación de dicha variable respecto a su media. Es decir, mide la dispersión (mayor o menor concentración)
de los resultados alrededor de la media (esperanza matemática) y se halla calculando las diferencias entre cada
uno de los resultados y su media, luego tales diferencias se elevan al cuadrado y se multiplican por sus

74
respectivas probabilidad, finalmente se suman los resultados. Entre mayor sea la varianza, mayor será la
dispersión entre los valores de la variable aleatoria o viceversa.

Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en
metros, la varianza se expresa en metros al cuadrado.

Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su
uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso
de otras medidas de dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en 1918.

Las desviaciones (X –  ) toman valores: (x1 – ), (x2 – ), … , (xi – ), con probabilidades respectivas:
f(x1), f(x2), . . . , f(xi). Sin embargo, al tomar el valor esperado de estas desviaciones nos encontramos con que:

E(X –  ) = (xi –  ) f(x1) =  x i f(x1) –   f(x1) =  xi f(x1) –  =  – = 0

Esto se debe a que las desviaciones positivas se compensan con las desviaciones negativas. Para determinar
una medida de dispersión, necesitamos considerar únicamente la magnitud de las desviaciones sin sus signos.
Una manera de eliminar el signo de las desviaciones, es considerar el cuadrado de las mismas, es decir, (xi – )2

Formalmente, si a partir de una variable aleatoria X con media μ = E(X) dada, obtenemos el valor
esperado de las desviaciones elevadas al cuadrado, conseguiremos una medida de la dispersión de la
distribución de probabilidad, la cual es conocida como variancia o varianza y se simboliza por
2 ó Var (X) ó V(X).

 2
 V ( X )  E X   .2

 E X 2  2 X   2 
 E X   2 E  X   
2 2

 E X   2   
2 2 2

 E X   μ con E X    X
2 2 2 2
 f x 


 x    f x  , si X es discreta
2
2
i i
  2

  x    f x  dx , si X es continua

Si en las fórmulas anteriores desarrollamos el cuadrado del binomio y aplicamos propiedades de las sumatorias
(integrales) se llega a una expresión más conveniente para realizar los cálculos.


2

x i2 f x i    2 , si X es discreta
  2
 X f  X  dX   2 , si X es continua

Claramente  2  0 porque  X   2  0 , para todo X, y f  X   0 , para todo X.


A la raíz cuadrada positiva de la varianza la llamaremos desviación estándar y se denota por .

75
Ejemplo 1:
En el lanzamiento de un dado repetidas veces, la esperanza matemática de los diversos números de la cara
superior es, E (X) = 3,5. Se desea conocer el valor de la varianza.
Solución.
Procedimiento:
1. Se halla el espacio muestral. S = 1,2, 3, 4, 5, 6
2. Se consigue la función de probabilidad: (1, 1/6) ; (2, 1/6) ; (3, 1/6) ; (4, 1/6) ; (5 , 1/6) ; (6, 1/6).
3. Se efectúa el producto del cuadrado de X por su correspondiente probabilidad
E(X 2) =  X 2 . f (x) = 12 (1/6) + 22 (1/6) + 32 (1/6) + 42 (1/6) + 52 (1/6) + 62 (1/6)
= (1/6) + 4/6 + 9/6 + 16/6 + 25/6 + 36/6) = 91/6
4. Se eleva al cuadrado la esperanza matemática: (x) 2 = (3,5) 2 = 12,25
5. Se sustituye en la fórmula de la varianza: V(X)
V(X) = E(X 2) – (x) 2 = 91/6 – 12,25 = 15,17 – 12,25 = 2,92

Ejemplo 2.
Consideremos la distribución de probabilidad de las ventas semanales de unidades de alta fidelidad de la marca
A, dada en la siguiente tabla:
X = xi 0 1 2 3 4 5
f (x) 0,1 0,1 0,2 0,3 0,2 0,1
Encontrar la varianza y la desviación estándar.
Solución.
Basándonos en la distribución de probabilidad podemos construir la tabla siguiente, en la cual obtenemos todos
los valores que se necesitan para el cálculo.
X = xi 0 1 2 3 4 5 Total
f(x) 0.1 0,1 0,2 0,3 0,2 0,1 1
x f(x) 0 0,1 0,4 0,9 0,8 0,5 2,7
x2 f(x) 0 0,1 0,8 2,7 3,2 2,5 9,3

Podemos observar que: E(X) =  xi f (x1) = 2,7 y que E(X2) =  x2 f (x) = 9,3
por lo tanto, la variancia es: 2 = V(X) = E(X2) – 2 = 9,3 – (2,7) 2 = 2,01
y la desviación estándar: σ  2,01  1,42

0 para x  1
0,25 para 1  x  3
Ejemplo 3. 
Sea la función de distribución acumulada: F  x   0,50 para 3  x  5
0,75 para 5  x  7

1,0 para x  7

Calcular: a) La media, b) La variancia, c) La desviación estándar.


Solución.
El primer paso para resolver el problema es obtener la distribución de probabilidad, ya que es indispensable para
la solución.
Xi 1 3 5 7
f(xi) 0,25 0,25 0,25 0,25
76
a) Para obtener la media o valor esperado vimos que se debe utilizamos la expresión:
 = E(X) =  xi f (x1) = 1(0,25) + 3(0,25) + 5(0,25) + 7(0,25) = 4

b) El modelo matemático para calcular la variancia señala que: 2 = V(X) = E(X2) – 2


donde E( X2) =  xi2 f(xi) = 12(0,25) + 3 2(0,25) + 52(0,25) + 72(0,25) = 21, y sustituyendo obtenemos:

2 = V(X) = E(X2) – 2 = 21 – 4 2 = 5

c) Por definición, la desviación estándar es la raíz cuadrada de la variancia, por lo que:


σ 2  5  2,3361

PROPIEDADES DE LA VARIANZA
1. Si una variable aleatoria es siempre igual a una constante K, su promedio o esperanza será K y la varianza
será cero: V(X) = E(X 2) – (x) 2 = 0

Valores de K f(x) X . f(x)


2 0,1 0,2

2 0,3 0,6

2 0,6 1,2

1,0 2

2. Si a una variable aleatoria X, se le suma una constante K, E(X) queda aumentada en K. Sin embargo, la
diferencia X – E(K) permanece igual y, por lo tanto, V(X) no queda afectada por la constante.

Ejemplo:
X f(x) X . f(x)
0 0,1 0 V(X) = 0 2 (0,1) + 1 2 (0,3) + 2 2 (0,6) – (1,5) 2
= 0 + 0,3 + 2,4 – 2,25
1 0,3 0,3
= 2,7 – 2,25 = 0,45 por lo que
2 0,6 1,2 E(X) + K = (1,5) + 2 = 3,5 y V(X + K) = 0,45
1,0 1,5 = E(X)

3. Al multiplicar todos los valores de una variable aleatoria X por un número positivo K, la varianza queda
multiplicada por K.

Tomando el ejemplo anterior


E(X) = 1,5
V(X) = 0,45
K=2
Entonces; V(X . K) = V(X) . K2
= 0,45 (22) = (0,45) (4)
= 1,8
77
DESVIACIÓN ESTÁNDAR
Al usar la varianza como medida de dispersión o variabilidad se presenta una dificultad. Las unidades con que
se miden los valores que toma la variable aleatoria X son lineales, por ejemplo kilogramos, metros, litros, etc.,
por lo que  = E(X) también será lineal, pero la varianza 2 está en unidades cuadráticas, como kilogramos
elevados al cuadrado, metros elevados al cuadrado, litros elevados al cuadrado, etc. En vista de lo anterior, si
queremos expresar la medida de dispersión en las mismas unidades en que se miden los valores de la variable
aleatoria X, debemos tomar la raíz cuadrada positiva de la varianza. A esta cantidad se le conoce con el nombre
de desviación estándar y se representa con .

La desviación estándar de una variable aleatoria X se define y simboliza como:

 
n
σ V X   σ2  x
i 1
2
i f xi   μ 2  E X2  μ2

La desviación estándar nos señala el grado de concentración de los valores alrededor del valor esperado o
esperanza matemática. Tiene como valor mínimo 0.

Ejemplo:
Se lanzan un par de dados al aire de manera simultánea. Se le da al jugador en bolívares, la suma de los valores
que aparezcan. Determinar
a) La esperanza matemática
b) La varianza
c) La desviación típica o estándar.

Solución.
Procedimiento:
1. Se determina el espacio muestral. S
S = (1,1) , (1,2) , (1,3) , (1,4) , (1,5) , (1,6) , (2,1) , (2,2) , (2,3) , (2,4) , (2,5) , (2,6)
(3,1) , (3,2) , (3,3) , (3,4) , (3,5) , (3,6) , (4,1) , (4,2) , (4,3) , (4,4) , (4,5) , (4,6)
(5,1) , (5,2) , (5,3) , (5,4) , (5,5) , (5,6) , (6,1) , (6,2) , (6,3) , (6,4) , (6,5) , (6,6)

2. Se construye la distribución de probabilidad, sabiendo que X es la suma de los números que muestren las
caras superiores de los dados y es 2  X  12. Puntos muestrales: 62 = 36

X f f(x) X . f(x) X2. f(x)


2 1 1/36 2/36 4/36
3 2 2/36 6/36 18/36
4 3 3/36 12/36 48/36
5 4 4/36 20/36 100/36
6 5 5/36 30/36 180/36
7 6 6/36 42/36 294/36
8 7 5/36 40/36 320/36
9 8 4/36 36/36 324/36
10 9 3/36 30/36 300/36
11 10 2/36 22/36 242/36
12 11 1/36 12/36 144/36
36 36/36 252/36 1974/36
78
3. La primera columna representa la suma de las caras superiores de los dados: X
4. La probabilidad de cada suma es el cociente entre su frecuencia y la cantidad de puntos muestrales 62 = 36
5. Se levanta la columna X . f(X) y se obtiene la sumatoria X . f (X) = 252/36 = 7
6. Se aplica la fórmula para calcular la esperanza matemática promedio esperado
E (X) = X . f(x) = 252/36 = 7
7. Interpretación: Al lanzar dos dados simultánea y repetidamente en las mismas condiciones, ha de esperarse
que el promedio de las sumas de los números que salgan en las caras superiores de los dados sea igual a 7.
8. Aplicamos la fórmula para calcular la varianza: V(X) = 6 2x  E(X 2) – (x) 2 =  X 2 . f (x) – (x) 2
Desarrollando X 2 . f (X) en la distribución de probabilidad, construyendo una columna, para lo cual cada
valor de ‘X’ se eleva al cuadrado y se multiplica por la probabilidad de X, es decir, por f (X).
9. Se sustituyen los valores en la ecuación anterior:
6 2x   X 2 . f (x) – (x) 2 = 1974/36 – (7) 2 = 54,83 – 49 = 5,83

10. Se calcula la desviación estándar:  x   x2  5,83  2,41


11. Interpretación:  x2  2,41 representa el grado de dispersión de los puntos muestrales (2, 3, 4, 5, 6, 7, 8, 9, 10,
11, 12) con respecto al valor esperado E(X) = 7

Ejemplo 1.
Se lanza un par de dados corrientes. Obtenemos el espacio finito equiprobable S que consta de las 36 parejas
ordenadas de números entre 1 y 6. Sea X que hace corresponder a cada punto (a, b) de S el máximo de sus
números, es decir X(a, b) = máx (a, b). Entonces X es una variable aleatoria cuyo conjunto está dado por X(S)
= { 1, 2, 3, 4, 5, 6 }
Calculemos la distribución f de X:
Solución:
xi 1 2 3 4 5 6
f  xi  1/36 3/36 5/36 7/36 9/36 11/36
X  f xi  1/36 6/36 15/36 28/36 45/36 66/36
x i    1 – (161/36) 2 – (161/36) 3 – (161/36) 4 – (161/36) 5 – (161/36) 6 – (161/36)
xi   2 (–125/36)2 (–89/36)2 (–53/36)2 (–17/36)2 (19/36)2 (55/36)2
f x i   x i   2 0,334898 0,509323 0,301033 0,04335991 0,0696373 0,713199
x i 2 1 4 9 16 25 36
x i 2  f  x i  1/36 12/36 45/36 112/36 225/36 396/36

Calculemos la media, valor esperado, esperanza matemática o expectativa matemática de la variable


aleatoria X:
n
E(X) =  X = X
i 1
f ( xi ) = 161/36 = 4,47

 n 

V(X)    X i  
 i 1
2 f ( X i )


V(X) = 0,334898 + 0,509323 + 0,301033 + 0,04335991 + 0,0696373 + 0,713199


V(X) = 1,9714  x  V(X) = 1,9714  1,404

79
 n 
O también: 
V ( X )   ( X i ) 2 f ( X i )   2
 i 1 
V(X) = [( 1 / 36) +( 12/36 ) +( 45 / 36 ) + 112/ 36 ) + ( 225 / 36 ) +( 396 / 36 )] –(161/36 )2
V(X) = (791/ 36) – (161/36) 2 = 1,9714

Ejemplo 2: Supóngase que la variable aleatoria X es el número que queda hacia arriba al lanzar un dado legal.
 
La función de probabilidad correspondiente es f X  1 6 para X = 1, 2, 3, 4, 5, 6

1 1 1 1 1 1


Por consiguiente    x f x   1  6   2 6   3 6   4 6   5 6   6 6   3,5
i i

que quiere decir que 3.5 es el valor esperado, lo que significa que 3.5 es el valor central de la distribución.
Obsérvese que no es necesario que el valor esperado sea un valor posible de la variable aleatoria. También se
interpreta en el sentido de que en 10 ejecuciones del experimento, por ejemplo, se espera que la suma de los
números obtenidos sea de (10)(3.5) = 35.

s 2 = [(1 – 3.5)2 + (2 – 3.5)2 + (3 – 3.5)2 + (4 – 3.5)2 + (5 – 3.5)2 + (6 – 3.5)2](1/6) = 2,9167

σ   2  2,9167  1,7078

Ejemplo 3: Hallar la esperanza matemática, la varianza y la desviación estándar del número de caras al lanzar
tres monedas al aire.

Solución:
El espacio muestral es S = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
La probabilidad de cada punto muestral es de 1/8
Se elabora las distribuciones de probabilidad y se realiza los cálculos respectivos. Estos resultados se presentan
en la siguiente tabla:
xi P xi  x i  P xi  xi   2  Pxi 
0 1/8 0·1/8 = 0 (0 – 1,5)2 ·1/8 = 0,281
1 3/8 1·3/8 = 3/8 (1 – 1,5)2 ·3/8 = 0,094
2 3/8 2·3/8 = 3/4 (2 – 1,5)2 ·3/8 = 0,094
3 1/8 3·1/8 = 3/8 (3 – 1,5)2 ·1/8 = 0,281
Total 1 1,5 0,750

Observando la tabla se tiene:  = E(X) = 1,5 significa que si se promedian los resultados del lanzamiento de
las tres monedas (teóricamente, un número infinito de lanzamientos), se obtendrá 1,5.
 2 = 0,75 y σ   2  0,75  0 ,866 miden la dispersión de los resultados de lanzar las tres monedas
alrededor de su media.

Fin de la Unidad II

80
UNIDAD 3:
VARIABLES ALEATORIAS DISCRETAS.
OBJETIVO DE APRENDIZAJE: Calcular las medidas de tendencia central para el análisis descriptivo de una población
o muestra.
CONTENIDO:
3.1 Terminología: Variables Aleatorias. Aleatorias Discretas. Aleatorias Continuas. Función de Distribución.
3.2 Variable Aleatoria Discreta: Distribución Bernoulli. Distribución Binomial. Distribución Muestral de proporciones.

INTRODUCCIÓN.
Uno de los objetivos de la estadística es el conocimiento cuantitativo de una determinada parcela de la
realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la
premisa de que lo real es siempre más complejo y multiforme que cualquier modelo que se pueda construir. De
todas formas, la formulación de modelos aceptados por las instituciones responsables y por los usuarios, permite
obviar la existencia del error o distancia entre la realidad y el modelo.

Los modelos teóricos a los que se hace referencia se reducen en muchos casos a (o incluyen en su formulación)
funciones de probabilidad. La teoría de la probabilidad tiene su origen en el estudio de los juegos de azar, que
impulsaron los primeros estudios sobre cálculo de probabilidades en el siglo XVI, aunque no es hasta el siglo
XVIII cuando se aborda la probabilidad desde una perspectiva matemática con la demostración de la “ley débil
de los grandes números” según la cual, al aumentar el número de pruebas, la frecuencia de un suceso tiende a
aproximarse a un número fijo denominado probabilidad. Este enfoque, denominado enfoque frecuentista, se
modela matemáticamente en el siglo XX cuando Kolmogorov formula la teoría axiomática de la probabilidad.
Dicha teoría define la probabilidad como una función que asigna a cada posible resultado de un experimento
aleatorio un valor no negativo, de forma que se cumpla la propiedad aditiva. La definición axiomática establece
las reglas que deben cumplir las probabilidades, aunque no asigna valores concretos. Uno de los conceptos más
importantes de la teoría de probabilidades es el de variable aleatoria que, intuitivamente, puede definirse como
cualquier característica medible que toma diferentes valores con probabilidades determinadas. Toda variable
aleatoria posee una distribución de probabilidad que describe su comportamiento (vale decir, que desagrega el 1
a lo largo de los valores posibles de la variable). Si la variable es discreta, es decir, si toma valores aislados
dentro de un intervalo, su distribución de probabilidad especifica todos los valores posibles de la variable junto
con la probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar
cualquier valor de un intervalo, la distribución de probabilidad permite determinar las probabilidades
correspondientes a la variable con subintervalos de valores. Una forma usual de describir la distribución de
probabilidad de una variable aleatoria es mediante la denominada función de densidad, en tanto que lo que se
conoce como función de distribución representa las probabilidades acumuladas.

Una de las preocupaciones de los científicos ha sido construir modelos de distribuciones de probabilidad que
pudieran representar el comportamiento teórico de diferentes fenómenos aleatorios que aparecían en el mundo
real. La pretensión de modelar lo observable ha constituido siempre una necesidad básica para el científico
empírico, dado que a través de esas construcciones teóricas, los modelos, podía experimentar sobre aquello que
la realidad no le permitía. Por otra parte, un modelo resulta extremadamente útil, siempre que se corresponda con
la realidad que pretende representar o predecir, de manera que ponga de relieve las propiedades más importantes
del mundo que nos rodea, aunque sea a costa de la simplificación que implica todo modelo.

81
En la práctica hay unas cuantas leyes de probabilidad teóricas, como son, por ejemplo, la ley binomial o la de
Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar
las distribuciones empíricas más frecuentes. Así, por ejemplo, la variable “talla de un recién nacido” puede tener
valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma probabilidad, porque las más frecuentes
son las tallas próximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribución de
probabilidad empírica, que se obtendría con una muestra grande de casos. En esta unidad estudiaremos los
procedimientos usuales para calcular probabilidades y sus inversas, para un conjunto bastante amplio de
funciones de distribución, discretas. En la siguiente unidad estudiaremos los procedimientos para tal fin en el
caso de las variables continuas, que son habituales en el proceso de modelación.
En la teoría de probabilidades no siempre es indispensable conocer los elementos del espacio muestral, sino
tener todos los puntos muestrales representados por cantidades que indiquen cierta propiedad del espacio
muestral, de forma que a cada punto muestral le corresponda un valor que lo está representando.

Variable:
A un cirujano le puede interesar el número de operaciones exitosas que realiza; un bioquímico puede estar
interesado en la densidad de glóbulos rojos de una persona; un empresario por el monto de las ventas de su
empresa durante el año; un educador por el número de estudiantes aprobados cuando usa determinado método de
enseñanza; un arquitecto por el número de casas que construirá el próximo semestre; un ingeniero agrónomo por
la producción de maíz por hectárea con una variedad hibrida que está probando; un futbolista por el número de
goles que anotará durante la temporada; un meteorólogo por la precipitación pluvial anual en cierta localidad y
así se pueden mencionar múltiples aspectos de interés. Como cualquiera de los sucesos anteriores puede tomar
valores diferentes, esto es, pueden variar, se les llama variables.

Variable aleatoria:
Si realizamos un experimento aleatorio, es lógico pensar que los resultados que se obtenga también son
aleatorios. Así:

Si los valores numéricos que toma una variable provienen de factores fortuitos y si un determinado
valor no se puede predecir con precisión, esa variable recibe el nombre de variable aleatoria (v. a.)

Variable Aleatoria Discreta:


Las variables aleatorias discretas son útiles en muchas aplicaciones prácticas. Tres variables aleatorias
discretas importantes: la binomial, la de Poisson y la hipergeométrica, son presentadas en esta unidad. Estas
variables aleatorias se emplean para describir el número de ocurrencias de un evento en un número fijo de
ensayos o una unidad fija de tiempo y espacio.

DIVERSOS USOS DE LAS DISTRIBUCIONES DISCRETAS.

 Distribución de Bernoulli:
Es el modelo más simple y constituye la base para deducir el modelo probabilístico binomial que está ligado
frecuentemente a muchos fenómenos. Es aplicable a cualquier variable aleatoria que pueda asumir sólo dos
valores.
Si ‘1’ y ‘0’, son los valores y ‘p’ y ‘q’, son sus respectivas probabilidades, la función de probabilidad de una
variable de Bernoulli será:
En la variable de Bernoulli, la esperanza matemática y la varianza
2
X f(x) X . f(x) X . f(x) son:
1 p p p E X    X  f X   p
0 q 0 0
 1 p p  x2  V ( X )   X 2  f  X    x 2  p  p 2  p 1  p   p  q

82
Ejemplo:
El 65% de los profesores que dictan matemática en Educación Media del estado Aragua, están de acuerdo con
poner en práctica una nueva metodología de la enseñanza de esta asignatura. Si se selecciona un profesor de
matemática de este nivel en forma aleatoria y sea “X = 1” si está a favor del nuevo método y “X = 0” si está en
contra. ¿Cuál es la esperanza y la varianza de X?

Solución:
La esperanza matemática es  x  p  65 100  0,65

La varianza es:  x2  p  q  0, 65 0,35   0, 2275

 Distribución de Probabilidad Binomial:


El experimento de lanzar una moneda es un ejemplo simple de una importante variable aleatoria discreta
llamada variable aleatoria binomial. Muchos experimentos prácticos arrojan resultados similares a los de cara o
sello en el lanzamiento de una moneda. Por ejemplo, considere las encuestas políticas usadas para predecir las
preferencias de los votantes en las elecciones. Cada votante muestreado es comparable con una moneda porque
el votante está a favor de nuestro candidato, una cara, o no lo está, un sello. En la mayor parte de los casos, la
proporción de votantes que están a favor de nuestro candidato no es igual a ½, es decir, la moneda está cargada.
De hecho, la encuesta está diseñada para medir la proporción de votantes que están a favor de nuestro candidato.

A continuación se mencionan algunas otras situaciones que son similares al experimento de lanzar una
moneda:
 Una socióloga está interesada en conocer la proporción de profesores de primaria que son hombres.
 A un comerciante de bebidas refrescantes le interesa saber la proporción de consumidores de cola que
prefieren su marca.
 Un experto en genética está interesado en la proporción de la población que tiene un gen relacionado
con la enfermedad de Alzheimer

Cada persona muestreada es semejante a lanzar una moneda, pero la probabilidad de una cara no es
necesariamente igual a ½, y aunque estas situaciones tienen distintos objetivos prácticos, todas exhiben las
características del experimento binomial.

Definición: Un experimento binomial tiene las siguientes características


1. El experimento consta de n ensayos todos idénticos.
2. Cada ensayo produce uno de dos resultados. A falta de un mejor nombre, un resultado se llama éxito, E,
y el otro se conoce como fracaso, F.
3. La probabilidad de éxito en un solo ensayo es igual a p y es la misma de un ensayo a otro. La
probabilidad de fracaso es igual a (1 – p) = q (que también es la misma de un ensayo a otro).
4. Los ensayos son eventos independientes.
5. Se está interesado en X, el número de éxitos observados durante los n ensayos para x = 1, 2, 3, … , n.

Ejemplo 1:
Suponga que hay cerca de 1.000.000 de adultos en una ciudad y una proporción desconocida p está a favor de
una determinada propuesta del gobierno. Se elegirá una muestra de 1.000 adultos, de tal manera que cada uno de
los integrantes del millón de adultos tenga igual probabilidad de ser seleccionado, y se le preguntará a cada
adulto si está a favor de la determinada propuesta. ¿Es este un experimento binomial? ¿Tendrá el experimento
las cinco condiciones binomiales?

83
Solución:
1. Un “ensayo” es la selección de un solo adulto del millón de adultos de la ciudad. Esta muestra consta de
n = 1.000 ensayos idénticos.
2. Puesto que cada adulto estará a favor de la propuesta o no, hay dos resultados que representan los
“éxitos” o los “fracasos” en el experimento binomial. (Aunque es común nombrar a los dos resultados
posibles de un ensayo “éxito” o “fracaso”, podrían haber sido llamados “cara” o “sello”, “blanco” o
“rojo”, o cualquier otro par de palabras. En consecuencia, el resultado llamado “éxito” no necesita ser
considerado como un éxito en el sentido ordinario de la palabra).
3. La probabilidad de éxito, p, es la de que un adulto esté a favor de la propuesta. ¿Esta probabilidad será la
misma para cada adulto de la muestra? Para fines prácticos, la respuesta es sí. Por ejemplo, si 500.000
adultos de la población están a favor de la propuesta, entonces la probabilidad de un “éxito” cuando se
elige al primer adulto 500.000/1.000.000 = ½. Cuando se elige al segundo adulto, la probabilidad p
cambia un poco, dependiendo de la primera elección. Es decir, habrá 499.999 o 500.000 éxitos dejados
entre los 999.999 adultos. En cualquier caso, p es aún casi igual a ½.
4. La independencia de los ensayos está garantizada debido al gran grupo de adultos del que se elige la
muestra. La probabilidad de que un adulto esté a favor de la propuesta no cambia en función de las
respuestas de las personas seleccionadas con anterioridad.
5. La variable aleatoria X es el número de adultos de la muestra que están a favor de la propuesta.

Debido a que el estudio satisface las cinco características, para propósitos prácticos se considera un
experimento binomial.

Ejemplo 2:
Un comprador que ha recibido un embarque que contiene 20 computadoras personales (Laptops) desea
muestrear tres de ellas para ver si están funcionando bien antes de aceptar el embarque. Para probar elige las tres
computadoras más cercanas y, después, se decide si son defectuosas o no. El comprador no sabe que dos de las
20 computadoras del embarque están defectuosas. ¿Es este un experimento binomial? De nuevo, compruebe si
el procedimiento satisface las características de un experimento binomial.
Solución:
1. Un “ensayo” es la selección y prueba de una PC del total de 20. Este experimento consta de n = 3
ensayos idénticos.
2. Cada ensayo produce uno de dos resultados, ya sea que una PC esté defectuosa (un “éxito”) o no (un
“fracaso”).
3. Suponga que las PC fueron colocadas al azar en el contenedor, de tal modo que cualquiera de las 20
computadoras pudo ser colocada cerca de la puerta del contenedor. Entonces la probabilidad de sacar
una computadora defectuosa en un ensayo sería 2/20. (Recuerde que dos de las PC están defectuosas).
4. La condición de independencia entre ensayos no se satisface porque la probabilidad de sacar una PC
defectuosa en el segundo y tercer ensayo dependen del resultado del primer ensayo. Por ejemplo, si en el
primer ensayo se obtiene una PC defectuosa, entonces sólo queda una computadora defectuosa entre las
19 restantes del envío. Por tanto,
P (defectuosa en el ensayo 2/defectuosa en el ensayo 1) = 1/19

Si en el primer ensayo no se obtiene una computadora defectuosa, entonces aún hay dos computadoras
defectuosas en el envío y la probabilidad de un “éxito” (una PC defectuosa) cambia a
P (defectuosa en el ensayo 2 / no defectuosa en el ensayo 1) = 2/19

Por tanto, los ensayos son dependientes y el muestreo no representa un experimento binomial.

84
Piense en la diferencia entre estos dos ejemplos. Cuando la muestra (los n ensayos idénticos) provienen de una
población grande, la probabilidad de éxito p es casi la misma de un ensayo a otro. Cuando el tamaño N de la
población es pequeño, la probabilidad de éxito tiene un cambio drástico de un ensayo a otro, y el experimento no
es binomial.

Regla práctica
Si el tamaño de la muestra es grande con respecto al tamaño de la población,
en particular, si n/N  0,05; entonces, el experimento resultante no es binomial.

Características de la distribución binomial:


a) El experimento se puede realizar n veces.
b) La distribución es discreta, dos posibles resultados: ocurrencia o no ocurrencia de un evento.
c) La probabilidad de que un evento ocurra debe ser igual en cada ensayo.
Las probabilidades p y q se mantienen constantes de prueba a prueba
p = probabilidad de que un evento dado ocurra. q = 1 – p = probabilidad de que un evento dado no ocurra.
d) Los ensayos deberán ser independientes.
e) La variable aleatoria X es el número de éxitos durante los n ensayos para cada valor de x.

Nota:
p + q = 1. Si p = 0  q = 1, 0  p  1. Si p = 1  q = 0, 0  q  1.
Los valores de p y q dependen del nombre que se le asigne a la variable X.
La probabilidad de ocurrencia (p) debe estar asociada a la variable aleatoria descrita en el problema.

Un experimento binomial consta de n ensayos idénticos con probabilidad de éxito p en cada ensayo. La
probabilidad de x = k éxitos en n ensayos es;

n!
P x  k   C kn p k q n  k  pk qn  k (DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL )
k ! n  k  !

Donde n es el número de ensayos, X es la variable aleatoria para valores de k = 0, 1, 2, … , n.


n n!
El símbolo C k  n  k  !k ! donde n! = n(n – 1) (n – 2) … (2) (1) y 0! 1

Las fórmulas generales para ,  y 2 vistas en la unidad anterior se pueden usar para obtener las siguientes
fórmulas más simples para la media y la desviación estándar binomiales.

Media y desviación estándar para la variable aleatoria binomial.


La variable aleatoria X, el número de éxitos en n ensayos, tiene una distribución de probabilidad con este
centro y dispersión:
Media:   np
Varianza:  2  npq
Desviación Estándar:   npq

85
Ejemplo 1:
Encuentre P(X = 2) para una variable aleatoria binomial con n = 10 y p = 0,1

Solución:
P(X = 2) es la probabilidad de observar dos éxitos y ocho fracasos en una sucesión de 10 ensayos. Se podrían
observar primero los dos éxitos, seguidos de 8 fracasos E, E, F, F, F, F, F, F, F, F puesto que p es la
probabilidad de éxito y q la de fracaso, esta sucesión tiene probabilidad ppqqqqqqqq = p2q8.

Sin embargo, muchas otras sucesiones producen también x = 2 éxitos. La fórmula binomial usa C 10 2 para
contar el número de sucesiones y da la probabilidad exacta cuando usa la fórmula binomial con k = 2:

P x  2   C 10
2 0,1 0,9 
2 10  2

10 !
 0,12 0,98
2 ! 10 - 2 !
109 
 0,010,430467
21
 0,1937

Ejemplo 2:
Durante un largo período se ha observado que un determinado tirador da en el blanco en un solo intento con
probabilidad de 0,8. Suponga que el tirador hace cuatro tiros al blanco.
a) ¿Cuál es la probabilidad de que dé en el blanco dos veces?
b) ¿Cuál es la probabilidad de que acierte al blanco por lo menos una vez?

Solución:
Un “ensayo” es un solo disparo al blanco, y se define un “éxito” como atinarle y un “fracaso” como fallar, así
que n = 4 y p = 0,8. Si se supone que la probabilidad del tirador de dar en el blanco no cambia de un disparo al
otro, entonces el número x de veces que da en el blanco es una variable aleatoria binomial.

1) Px  2   p 2   C 24 0,82 0,2 4  2


4!
 0,640,04
2! 2!
4 321
 0,640,04 La probabilidad de que acierte en el blanco dos veces es 0,1536
2 1 2 1
 0,1536

2) P (por lo menos una vez) = P(x  1) = p (1) + p (2) + p (3) + p (4)


Aunque se podría calcular P(x = 1), P(x = 2), P(x = 3) y P(x = 4) para hallar esta probabilidad, si se usa el
complemento del evento se facilitaría el trabajo; es decir,
P(x  1) = 1 – P (x < 1) = 1 – P (x = 0)
= 1 – p (0)
 1  C04 0,80 0,24
 1  0,0016  0,9984

¿Encuentra alguna razón por la que su suposición de ensayos independientes pudiera ser errónea? Si el tirador
aprende de sus tiros previos, es decir, observa la ubicación de su disparo previo y ajusta su objetivo, entonces su
probabilidad p de dar en el blanco se puede incrementar de un disparo a otro. Los ensayos no serían
independientes, y el experimento no sería binomial.
86
Ejemplo 3:
Una moneda corriente se lanza seis veces. Cuál es la probabilidad de que salgan:
a) Dos caras. g) Ningún sello.
b) Más de 3 caras. h) Sean 3 caras y 3 sellos.
c) Entre 3 y 5 caras. i) A lo más una cara.
d) Entre 3 y 5 caras (ambas inclusive). j) No más de 3 caras.
e) Más caras que sellos. k) 6 sellos o menos de 2 caras.
f) Todas sean sellos.
Solución:
1) Características del problema.
La variable X = Número de caras
n = 1, 2, 3, 4, 5, 6 (Número de lanzamientos de la moneda)
x = k = 0, 1, 2, 3, 4, 5, 6 (Cantidad de veces que sale cara)
Sea E = 0, 1, 2, 3, 4, 5, 6el espacio muestral asociado a la variable X

2) Determinemos los valores de p y q.


El valor de p depende del nombre que se le asigne a la variable X. Como en el lanzamiento de una
moneda existen dos posibles resultados (cara o sello) la probabilidad de ocurrencia p asociada a la variable X es
½, es decir, P (cara) = ½
Luego, q = 1 – p  q = ½

3) Determinemos la probabilidad de cada suceso indicado (desde ‘a’ hasta ‘k’, probabilidades requeridas en
el problema) mediante la fórmula:
n
P X  x      p x  q n  x ; donde
 x

2 62
6  1   1   1   1   1  15
a) P(dos caras)  P X  2          15  2   4   15  6    0,234375
2  2  2 2  2   2  64

b) P(más de tres caras)  P X  3  P X  4   P X  5  P X  6  ; donde

4 2
6  1   1  1 1 15
P X  4          15  4  2  6
4
   2   2  2 2 2

5
 6 1 1 1 1 6
P X  5          6 5   6
5 2
   2 2 2 2

6 0
6  1   1  1 1
P X  6           1  6  1  6
6  2   2  2 2

15 6 1 15  6  1 22
Luego P(más de tres caras)  P X  3       0,34375
26 26 26 26 64
87
También se puede plantear de la siguiente manera
P(más de tres caras)  P X  3  1  P X  0   P X  1  P X  2   P X  3

Calculamos cada una de las probabilidades indicadas, las sumamos y luego las restamos de 1.

15
c) P(entre tres y cinco caras)  P3  X  5  P X  4   ; (ver parte b).
64

d) P(entre tres y cinco caras, ambas inclusive)  P3  X  5


 P X  3  P X  4   P X  5
20 15 6
 6
 6

2 2 26
41

26
 0,640625

e) P(más caras que s ellos)  P X  4 


 P X  4  P( X  5)  P X  6 
15 6 1
  
64 64 64
22

64
 0,34375

f) P(todas s ean sellos)


Como podrás observar en este caso la variable aleatoria es y, es decir, y = Número de sellos.
1
La probabilidad de ocurrencia p asociada a la variable y es P (sello) = ½, por lo que q 
2
Así: P(todas s ean sellos)  P y  6 
6 0
 6  1   1 
      
 6  2   2 
 1 
 1   6  1
2 
1

64
 0,015625

g) P(ningún sello)  P y  0 
0 6
6  1   1 
      
0  2   2 
 1 
 11   6 
2 
1
  0,015625
64
88
h) P(sean 3 caras y 3 sellos)  P X  3
20
 (Aplicando la fórmula binomial)
64
En este caso podemos determinar P(X = 3) o P (y = 3), ya que en seis lanzamientos existen igual número de
caras (3) que de sellos (3).

i) P(a lo más una cara)  P X  1


 P X  0  P X  1
 1   1 
  
 64   64 
7

64
 0,109375

j) P(no más de 3 caras)  P X  3


 P X  0   P X  1  P X  2  P X  3
1 6 15 20
   
64 64 64 64
42

64
 0,65625

k) P( 6 sellos o menos de 2 caras)  P6 sellos  o Pmenos de 2 caras


 P  y  6  P  X  2
 P  y  6  P  X  0  P  X  1
1 1 6
   (Aplicando fórmula binomial)
64 64 64
8

64
 0,125

Ejercicio 1:
Se realiza un experimento con un lote de 5 ratas, a las cuales se les inoculó un virus que produce la muerte con
un 30% de probabilidad. Si X representa el número de ratas sobrevivientes.
Determinemos:
a) La probabilidad para cada uno de los valores que puede tomar dicha variable.
b) ¿Cuál es la probabilidad de que sobrevivan 3 o más ratas?
c) ¿Cuál es la probabilidad de que mueran entre 1 y 4 ratas (inclusive)?
Solución:
1. Características del problema:
- La variable X = Número de ratas sobrevivientes.
- x = 0, 1, 2, 3, 4, 5 (cantidad de ratas sobrevivientes).
- n = 5 (Número de ensayos).
- E = 0, 1, 2, 3, 4, 5 Espacio muestral asociado a la variable X

89
2. Determinemos los valores de p y q.
Por referencia del problema conocemos que al inocularles el virus a las ratas mueren un 30% del total, lo
que quiere decir que el 70% restante de las ratas sobreviven. Como el valor de p depende del nombre asignado a
la variable X, entonces la probabilidad de ocurrencia (p) asociada a la variable X descrita en el problema es p =
70% = 0,7. Luego, q = 1 – p = 0,3

3. Determines la probabilidad de cada suceso indicado (desde a hasta c) mediante la fórmula:


n
P X  x      p x  q n  x
 x
a) La probabilidad para cada uno de los valores que puede tomar dicha variable.
5
P  X  0     0,7 0  0,35  1 10,00243   0,00243
 0
5
P  X  1    0,7   0,34  5 0,7 0,0081  0,02835
1 
5 
P  X  2     0,7 2  0,33  10 0,490,027  0,1323
2
 5
P  X  3    0,7 3  0,32  10 0,3430,09  0,3087
 3
5 
P  X  4     0,7 4  0,3  5 0,24010,3  0,36015
4
5
P  X  5    0,7 5  0,30  1 0,168071  0,16807
5

b) ¿Cuál es la probabilidad de que sobrevivan 3 o más ratas? P X  3


P X  3  P X  3  P X  4   P X  5  P X  3  0,3087  0,36015  0,16807  0,83692

c) ¿Cuál es la probabilidad de que mueran entre 1 y 4 ratas (inclusive)?


En este caso nuestra variable pasa a ser y = Número de ratas que mueren y los valores p y q son:
p = 0,3 y q = 0,7, ya que p y q dependen de la variable “y”
Luego, la probabilidad de que mueran entre 1 y 4 ratas inclusive = P1  y  4 será:
P1  y  4  P y  1  P y  2   P y  3  P y  4

5
P  y  1    0,3  0,7 4  5 0,30,2401  0,36015
1 
5
P  y  2    0,32  0,7 3  10  0,09 0,343  0,3087
 2
5
P  y  3    0,33  0,7 2  10  0,027 0,49   0,1323
3
5
P  y  4    0,34  0,7   5 0,0810,7   0,02835
 4

Así, P1  y  4  0,36015  0,3087  0,1323  0,02835  0,8295

90
Ejercicio 2:
Se extraen 5 bolitas, con restitución, de una caja que contiene 4 bolitas blancas, 4 verdes y 12 negras. ¿Cuál es
la probabilidad de obtener exactamente 3 bolitas que no sean blancas?
Solución:
La variable X = Número de bolitas que no sean blancas.
n = 5 (Número de veces que ocurre el ensayo o bolitas que se seleccionan)
x = 0, 1, 2, 3, 4, 5
16
p
20
128
Luego, la probabilidad que se busca, es: P X  3   0,2048
625

3 2
 5   16   4   4096   16  128
P X  3          10     0,2048
3
   20   20   8000   400  625

5
P  X  3    0,83  0,2 2  10  0,512 0,04   0,2048
3

Ejercicio 3:
El 60% de las historias clínicas de un hospital corresponden a adolescentes. Si se seleccionan 5 historias
clínicas, ¿cuál es la probabilidad de que 3 de ellas correspondan a adolescentes?
Solución:
1. La ecuación es P k , n , p   C kn p k q n  k
2. k es la cantidad de éxitos esperados: k = 3
3. n es la muestra seleccionada: n = 5
4. p es la probabilidad de éxito: p = 60/100 = 3/5
5. q es la probabilidad de no éxito: q = 1 – p = 1 – 3/5 = 2/5
5! 543 !
6. Se desarrolla el número combinatorio C kn  C 35    10
3 ! 5  3  ! 3!2!
27 4
Se sustituyen los demás valores en la fórmula P 3,5,3 / 5   10 3 / 5  2 / 5   10 
3 2
7.  0,3456
125 25
8. Interpretación: Si el 60% de las historias clínicas de un hospital son de adolescentes y del grupo se eligen 5
al azar, existe una probabilidad de 0,3456 de que 3 de ellas sean de adolescentes.

Ejercicio 4:
Con los datos del ejemplo anterior, qué probabilidad existe de que:
a) Por los menos 2 historias sean adolescentes
b) Ninguna sea de adolescentes
c) Como máximo 3 sean de adolescentes

Solución:
a) Por los menos 2 historias sean adolescentes.
1. La muestra sigue siendo: n = 5
2. La cantidad de éxitos esperados es: k = 2, 3, 4, 5 (ya que la condición es que por lo menos 2 sean adolescentes)
3. La probabilidad de éxito es: p = 60/100 = 3/5
4. La probabilidad de fracaso es: q = 2/5
5. Se calculan las probabilidades para los diversos valores de k, para luego sumarlos
91
5!
Para k = 2  P2, 5, 3 / 5  C 25  3 / 52  2 / 53   9 / 25  8 / 125  10 0,36 0,064   0,2304
2! 3!
Para k = 3  P3, 5, 3 / 5  0,3456 (tomado del ejemplo anterior)

Para k = 4  P4, 5, 3 / 5  C 45  3 / 54  2 / 55  0,2592

Para k = 5  P5, 5, 3 / 5  C55  3 / 55  2 / 5  0,07776

6. Se suman las probabilidades para k = 2, 3, 4, 5


P(k  2, 5, 3/5) = 0,2304 + 0, 3456 + 0, 2592 + 0, 07776 = 0,91296

7. Interpretación: La probabilidad de que por lo menos dos historias clínicas sean de adolescentes es igual a
0,91296

El mismo resultado se obtiene si se aplica el concepto de eventos complementarios:


P(0  k  5, 5, 3/5) = P(k  1, 5, 3/5) + P(k  2, 5, 3/5) = 1
De donde: P(k  2, 5, 3/5) = 1 – P(k  1, 5, 3/5)
5! 32
Para k = 0  P0, 5, 3 / 5  C05  3 / 50  2 / 55  1   0,01024
0! 5! 3125
5!
Para k = 1  P1, 5, 3 / 5  C15  3 / 5  2 / 54   3 / 5  16 / 625   0,0768
1! 4!
Luego, P(k  1, 5, 3/5) = P(k = 0, 5, 3/5) + P(k = 1, 5, 3/5) = 0,08704

Por eventos complementarios: P(k  2, 5, 3/5) = 1 – P(k  1, 5, 3/5) = 1 – 0,08704 = 0,91296

b) Ninguna sea de adolescentes.


1. La muestra es n = 5
2. La cantidad de éxitos es k = 0
3. P(k = 0, 5, 3/5) = 0,01024 (Tomado del ejemplo anterior, parte a)

c) Como máximo 3 sean de adolescentes.


1. Al decir, como máximo 3 sean adolescentes: k = 0, 1, 2, 3
2. La muestra es n = 5
3. La probabilidad de éxito es p = 3/5
4. Aplicando eventos complementarios:

P(k  3, 5, 3/5) = 1 – P(4  k  5, 5, 3/5)


P(4  k  5, 5, 3/5) = P (k = 4, 5, 3/5) + P (k = 5, 5, 3/5)

De la parte a) P (k = 4, 5, 3/5) + P (k = 5, 5, 3/5) = 0,2592 + 0, 07776 = 0,33696


P(k  3, 5, 3/5) = 1 – 0,33696 = 0,66304
92
Ejercicio 5: En una encuesta realizada en los barrios de Caracas, el 70% de los encuestados contestaron
incorrectamente el cuestionario. De una muestra de 4 cuestionarios tomados al azar determine:
a) ¿Cuál es la probabilidad de que 3 cuestionarios estuvieran correctamente contestados?
b) ¿Cuál es la probabilidad de que más de 2 cuestionarios estén contestados correctamente?
Solución: Si designamos por X el número de cuestionarios incorrectamente contestados, X será una variable
aleatoria distribuida binomialmente con parámetros n = 4 y p = 0,7.
a) La probabilidad de que 3 cuestionarios estén correctamente contestados es igual a la probabilidad de que
uno esté incorrectamente contestado, es decir, que X sea igual a 1  4 1 3
P X  1     0, 7   0,3  0,0756
1 
b) La probabilidad de que más de 2 cuestionarios estén contestados correctamente sería:
1
4
P  X  0  P  X  1   1   0,7
x 0
x
 0,34 x  0,0081 0,0756  0,0837

 Distribución de Probabilidad de Poisson:


Otra variable aleatoria discreta que tiene numerosas aplicaciones prácticas es la variable aleatoria de Poisson.
Su distribución de probabilidad aporta un buen modelo para los datos que representan la frecuencia de un evento
específico en una unidad de tiempo o espacio. Los siguientes son algunos ejemplos de experimentos en que la
variable aleatoria X se modela como una variable aleatoria de Poisson.
 El número de llamadas que recibe un conmutador durante cierto tiempo.
 El número de bacterias en un volumen pequeño de líquido.
 El número de llegada de clientes a la caja registradora de un negocio en un tiempo determinado.
 El número de averías de una máquina durante un día.
 La llegada de vehículos a una estación de servicio en un cierto tiempo.
 El movimiento de entrada o salida de buques o aviones en puertos y aeropuertos.
 La cantidad de errores de imprenta por páginas en un determinado libro.
En cada ejemplo, X representa el número de eventos que ocurren en un período de tiempo o espacio durante el
que se puede esperar que ocurra un promedio  de tales eventos. Las únicas suposiciones necesarias cuando se
usa la distribución de Poisson para modelar experimentos como estos, son que los conteos o eventos ocurran al
azar y de manera independiente entre sí. Esta distribución puede ser considerada como una forma límite de la
distribución binomial. El proceso de Poisson tiene aplicación a una gran variedad de eventos físicos; en
consecuencia, esta distribución, al igual que las distribuciones normal y binomial, es una de las más utilizadas.
En estadística, por ejemplo, se emplea para el control de calidad.
Características.
a) En los sucesos podemos definir la variable aleatoria X como el número de veces que ocurre el suceso
durante un intervalo de tiempo dado o en una región determinada.
b) La región determinada puede ser: unidad de longitud, de área o de volumen.
c) El intervalo de tiempo puede ser de cualquier magnitud: 1 segundo, 1 minuto, 1 día, 1 mes, etc.
d) La probabilidad de un único éxito en una subregión es independiente del número de éxitos fuera de la
subregión.
e) La probabilidad de 2 o más éxitos en una subregión es prácticamente cero.
f) Sea  el número promedio de veces que ocurre un evento en cierto período de tiempo o espacio. La
probabilidad de que este evento ocurra x veces es:

k
Px  k   e    , Para x = 0, 1, 2, 3, … (DISTRIBUCIÓN DE POISSON)
k!

93
 =  es el promedio esperado de éxitos en un intervalo de tiempo dado o región determinada.  = n . p Es
un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un
intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos
interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo
de distribución de Poisson con  = (10) (4) = 40
x = k es la cantidad de éxitos esperados. Número de ocurrencias del evento o fenómeno. La función nos da la
probabilidad de que el evento suceda precisamente k veces. A diferencia de la distribución binomial donde el
dominio de la variable discreta x está acotado entre 0 y el número de intentos, en la distribución de Poisson x  0
e = 2,71828… (es la base del logaritmo neperiano), se puede evaluar con la calculadora, que debe tener una
función ex.
Para los valores x = 0, 1, 2, 3, … la media y la desviación estándar de la variable aleatoria de Poisson son:

Media:  x  n  p Varianza =  x2    n  p Desviación Estándar:     n  p

Para cada valor de x, podemos obtener las probabilidades individuales para la variable de Poisson, de la misma
manera como se procedió para la variable aleatoria binomial.

Observación: Cuando  = n . p  5, se recomienda utilizar la distribución de Poisson como una aproximación


a la distribución binomial. En este caso, n deberá ser mayor que 20, lo que implica que p  0,25.
Otros sugieren aplicar el modelo cuando  = n . p < 10 (p < 0,10 y n =100).

Ejemplo 1:
En un proceso de producción de un artículo que se fabrica en grandes cantidades, se sabe que la proporción de
artículos defectuosos es p = 0,01. Se elige una muestra aleatoria de 100 artículos. ¿Cuál es la probabilidad de que
haya 2 artículos defectuosos en esta muestra?
Solución:
1. Se halla el promedio esperado:  = n . p = 100 (0,01) = 1.
2. La cantidad de éxitos esperados es: x = 2
3. Se aplica la fórmula sabiendo que e = 2,71828 = 2,72
x 1 1
PX  x   e       0,184
x! e 2!
4. Interpretación: La probabilidad de que hayan 2 artículos defectuosos en una muestra aleatoria de 100, es
igual a 0,184.

Ejemplo 2:
En un Instituto Educativo existen 1.095 estudiantes, ¿cuál es la probabilidad de que hayan 3 estudiantes que
celebren su cumpleaños un mismo día dado del año?
Solución:
1. Se calcula la probabilidad de que un estudiante cumpla año: p = 1/365
2. Se determina el promedio esperado:  = n . p = 1.095 (1/365) = 3.
3. La cantidad de éxitos esperados es: x = 3
4. Se aplica la fórmula de Poisson, dado que  = 3 < 5
x  1   33 
Px  3,   2  e      3
   0,2236
x!  2,72   3 ! 

Ejemplo 3:
Al cabo de un año, se incendian, como término medio, una casa cada 2.000, en un cierto barrio. Si hay 4.000
casas en ese barrio. ¿Cuál es la probabilidad de que se incendien exactamente 5 casa durante el año?
94
Solución:
1. La muestra es n = 4.000
2. La probabilidad de éxito es: p = 1/2.000
3. La cantidad de éxitos esperados es: x = 5
4. El promedio esperado es:  = n . p = 4.000 (1/2.000) = 2
5. Se aplica la fórmula de Poisson, dado que  = 2 < 5

x  1   25 
Px  5,   2   e         32  0,036
2 
x!  2,72   5 !  7,4 120

Ejemplo 4:
El número promedio de demandas presentadas a una compañía de seguros es de 2 por día. ¿Cuál es la
probabilidad de que un día cualquiera:
a) Se presenten exactamente 3 demandas
b) No se presente ninguna demanda

Solución:
a) Sabemos que:
-  = 2 (es el promedio de demandas por día)
- x = 3 (número de demandas presentadas por día)
x
De acuerdo a la distribución de Poisson: P X  x   e   
x!

2 3 2,71828 2 8
P X  3  
3! 3  2 1! 2,71828 2

4
  0,18045
3  7,38905 

b) Por otro lado;


- X = 0 (número de demandas presentadas por día)
- =2
2 0 2,718282 1 1
- Utilizando Poisson: P  X  0     0,13534
0! 1 2,718282
7,38905

Ejercicio.
Un estudiante comete, en promedio, un error de imprenta en cada página. ¿Cuál es la probabilidad de que haga
exactamente 2 errores en un trabajo de 3 páginas?

Solución:
 = 2 (promedio de errores por cada tres páginas) y X = 2 (Número de errores en tres páginas)

3 2 2,718283
Utilizando Poisson: P X  2    0,22404
2!

Fin de la Unidad III


95
UNIDAD 4:
VARIABLES ALEATORIAS CONTINUAS.
OBJETIVO DE APRENDIZAJE: Interpretar los resultados obtenidos del cálculo de las medidas de dispersión.

CONTENIDO:
4.1 Terminología: Variables Aleatorias Continuas.
4.2 Variables tipificadas: Distribución Normal. Características y Propiedades.

INTRODUCCIÓN
En esta unidad se tratará una de las distribuciones de variable continua más importante y más utilizada en la
estadística aplicada: La distribución Normal o de Gauss. (Curva especial en forma de campana, denominada Gaussiana en
honor del gran científico alemán Karl Friedrick Gauss 1777-1855. Aun cuando la distribución normal fue reconocida por primera vez
por el francés Abraham de Moivre 1667-1754. A conclusiones análogas llegó también, de manera independiente, el astrónomo y
matemático Pierre Simón Laplace 1749-1827, en relación con la teoría de los errores de observación astronómica y física ).

Otras distribuciones de variables aleatorias continuas también representan, exacta o aproximadamente,


fenómenos reales; entre éstas destacan la distribución uniforme, la exponencial, la Beta y la Gamma.
Sin temor a exagerar se podría afirmar que la distribución gaussiana constituye el instrumento más poderoso
y útil de que dispone la ciencia estadística. En primer lugar debido a que una gran cantidad de fenómenos
aleatorios reales en cualquier ciencia: economía, biología, psicología, ingeniería, etc., pueden ser representados
adecuadamente por variables normales; en segundo lugar, como se verá más adelante, porque cualquiera que sea
la distribución original de una población estudiada, los resultados muestrales, sumariados en los estadísticos
muestrales, tienden a seguir la distribución normal o alguna de las distribuciones derivadas de ella.
Variables continuas referidas a la medición de:
Caracteres morfológicos de individuos (personas, animales, plantas, etc.) de una especie (tallas, peso,
diámetros, perímetros, etc.).
Caracteres sociológicos como por el ejemplo el consumo de cierto producto por un mismo grupo de individuos,
puntuaciones en un examen, etc.
Caracteres fisiológicos como por ejemplo el efecto de una misma dosis de un cierto fármaco.
Errores cometidos al medir ciertas magnitudes.
Valores estadísticos muestrales, por ejemplo, la media.
En general, cualquier característica que se obtenga como suma de muchos factores.

Distribución Normal. (El modelo normal general)


Está caracterizada por dos parámetros: la media () y la desviación típica o estándar ().
Su función de densidad es:
1  x   2 Los símbolos e y  son constantes matemáticas cuyos valores
1   
N  ,    P  x   e 2   aproximados son 2,7183 y 3,1416, respectivamente;  y  ( > 0)
son parámetros que representan la media y la desviación estándar de
 2 la población.
  x   F  X   P X  x 
La curva normal adopta un número infinito de formas, determinadas por sus parámetros  y 
96
Propiedades que pueden establecerse a partir de la observación de su gráfica:
- El recorrido de X es todo . Luego, la variable
aleatoria puede tomar cualquier valor entre + y
–. Sin embargo, las tablas dan a conocer que
prácticamente toda el área está comprendida
entre – 3 y +3, de modo que la probabilidad de
que X sea menor que – 3 o mayor de + 3 es muy
pequeña. Es decir, hay más probabilidad para
valores cercanos a la media ().

- La curva de la distribución normal f(X), es asintótica respecto al eje de las abscisas; es decir, f(X) tiende a
cero, cuando X tiende a  . Las colas de la curva se aproximan, pero nunca tocan al eje horizontal.

- La distribución normal es simétrica con respecto a la ordenada máxima.


Es decir, f (X) es simétrica alrededor de , respecto del eje vertical. Por lo tanto, las medidas de tendencia
central (media, mediana y moda) serán iguales entre sí. El máximo valor de f (X) es f ().
Nótese que la curva a la derecha del eje vertical es exactamente igual que a la izquierda del mismo. Dado
que el área total encerrada por una función de densidad es 1, el área a cada lado del eje vertical es ½.
Debido a esa simetría solo es necesario tabular áreas a un lado del eje vertical.

- Los puntos de inflexión de f (X) se dan en x =   .

- La forma de la distribución se determina por , la desviación estándar de la población, parámetro que


determina el apuntamiento de la curva. Valores grandes de  reducen la altura de la curva e incrementan su
amplitud, cuanto mayor sea el valor de , más se dispersarán los datos en torno a la media y la curva será
más plana. Los valores pequeños de  aumentan la altura de la curva y reducen su amplitud. La media
indica la posición de la campana, de modo que para diferentes valores de  la gráfica se desplaza a lo largo
del eje horizontal.

- Para indicar abreviadamente que una variable aleatoria se distribuye normalmente con parámetros  y ,
escribiremos X  N(, ) siendo  la media de la distribución y  su desviación típica.

No importa cuáles sean los valores de µ y ; para un distribución de probabilidad normal, el área total bajo la
curva siempre es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades.

97
Interpretación geométrica: La media es un factor de traslación y la desviación típica un factor de escala.

Interpretar probabilística: Entre la media y la desviación típica tenemos siempre la misma probabilidad.

16% 16%
Aproximadamente el 68% de todos los valores de una
población normalmente distribuida se encuentra dentro
de ± 1 desviación estándar de la media.

5% 5%
Aproximadamente el 95% de todos los
valores de una población normalmente
distribuida se encuentra dentro de ± 2
desviaciones estándar de la media.

Aproximadamente el 99% de todos los valores de una población normalmente distribuida se encuentra dentro de
± 3 desviaciones estándar de la media.

Estas gráficas muestran dos formas diferentes de medir el área bajo la curva normal. Sin embargo, muy pocas
de las aplicaciones que haremos de la distribución normal de probabilidad implican intervalos de exactamente
más o menos 1, 2 ó 3 desviaciones estándar a partir de la media. Para estos casos existen tablas estadísticas que
indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones
estándar () a partir de la media.

98
Cálculo de probabilidades en la distribución normal.
Áreas tabuladas de la distribución de probabilidad normal.
Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad:

1 x  μ 2 x 1 v  μ 2
     
1 1
N  μ,σ   Px   e 2 σ 
 F x  e
2 σ 
dv
σ 2π σ 2π -

De modo que la probabilidad de una variable aleatoria normal X en un intervalo a  x  b es:

b 1 v  μ 2
  
1
Pa  x  b   F b  F a   e
2 σ 
dv
 2 a



v  u 2
1
En particular
 2 e
-
2 2 dv  1

El valor de la integral puede ser calculado por integración usando métodos numéricos de aproximación, pero
obviamente sería un cálculo tedioso. Afortunadamente esta integral, y en consecuencia las probabilidades de
cualquier variable normal, pueden ser calculadas fácilmente mediante una transformación de la variable X en
otra variable Z normal con parámetros 0 y 1. Las probabilidades correspondientes a esta variable z han sido
tabuladas.

Para encontrar la probabilidad de que una variable aleatoria


normal X se encuentre en el intervalo de a a b, se necesita
hallar el área bajo la curva normal entre los puntos a y b.

Sin embargo, hay un número infinitamente grande de distribuciones


normales, una para cada diferente par de media y desviación típica.
Dado que cada uno de estos parámetros puede asumir infinitos
valores, es obvio que resulta impráctico tener una tabla separada de
áreas para cada una de estas curvas. En cambio, se usa una
estandarización que nos permite usar la misma tabla para todas las
distribuciones normales.

Distribución Normal Estándar


La variable Z  N(0, 1) se conoce como variable normal estandarizada o tipificada y el proceso de
transformación de X  N(, ) en Z  N(0, 1) se conoce como tipificación o estandarización de la variable X.
Z se le denomina variable tipificada de X, y a la curva de su función de densidad se le conoce como la curva
normal estándar. Es una distribución normal con promedio 0 y una desviación estándar de 1.
Esta transformación de X a Z tiene el efecto de reducir X a unidades en términos de desviación típica. Es decir,
dado un valor X, el correspondiente valor de Z, nos dice en qué sentido y a qué distancia se encuentra X de su
media aritmética , en términos de desviaciones típicas.
99
Todas las variables normalmente distribuidas se
pueden transformar a la distribución normal estándar
utilizando la fórmula para calcular el valor Z
correspondiente.
x
Z 

Características de la distribución normal estándar.
- No depende de ningún parámetro.
- Su media es 0, su varianza es 1 y su desviación
estándar es 1.
- La curva f (x) es simétrica respecto del eje Y.
- Tiene un máximo en el eje Y.
- Tiene dos puntos de inflexión en z = 1 y z = – 1

La nueva variable Z se distribuye como una variable normal


con media igual a cero ( = 0) y desviación típica igual a uno ( = 1)

Recordemos de nuevo que en


cualquier distribución normal las
probabilidades delimitadas en 1, 2
o 3 desviaciones típicas son:
 = 68%
 = 95%
 = 99%

 Dada una variable de media  y desviación típica , se denomina valor tipificado Z, de una
observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones
típicas.

 En el caso de la variable X Normal, la interpretación es clara: asigna a todo valor de N


(,), un valor de N (0, 1) que deja exactamente la misma probabilidad por debajo.

 Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para
saber cuál de los dos es más extremo

100
A continuación se presentan los diferentes casos que pueden ocurrir en el cálculo de la probabilidad del área
total bajo la curva, para cuya determinación haremos uso de la tabla anexa.

1er Caso: Un límite es 0 y el otro está a la derecha de 0.


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a 0 y Z sea menor o igual a 2,8
Es decir, P(0  Z  2,8)

Solución: P(0  Z  2,8) = 0,4974 (directamente de la tabla)

2,8

2do Caso: Un límite es 0 y el otro está a la izquierda de 0.


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a –2,8 y Z sea menor o igual a 0
Es decir, P(–2,8  Z  0)

Solución: Este caso es simétrico al anterior, el cual se reduce a;


P((–2,8  Z  0) = P((2,8  Z  0)  P(0  Z  2,8) = 0,4974 (directamente de la tabla)

Esta área al igual que la anterior son iguales por ser la curva simétrica.

–2,8

3er Caso: Un límite está a la derecha de 0 y el otro completamente a la izquierda.


Ejemplo: Determinar la probabilidad de que Z sea menor o igual a 1,45
Es decir, P(Z  1,45)

Solución: P(Z  1,45) = P(Z  0) + P(0  Z  1,45)


= 0,5000 + 0,4265 = 0,9265
Media Directo
campana de la tabla

1,45

4to Caso: Un límite está a la izquierda de 0 y el otro completamente a la derecha.


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a –1,45
Es decir, P(Z  –1,45)

Solución: Este caso es simétrico al anterior, el cual se reduce a;


P(Z  –1,45) = P(Z  1,45) = P(Z  0) + P(0  Z  1,45)
= 0,5000 + 0,4265 = 0,9265

–1,45

101
5to Caso: Ambos límites están a la derecha de cero (0).
Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a 1,50 y menor o igual a 2,80
Es decir, P(1,50  Z  2,80)

Solución: P(1,50  Z  2,80) = P(0  Z  2,80) – P(0  Z  1,50)


= 0,4974 – 0,4332
= 0,0642 (Directo de la tabla)

1,5 2,8

6to Caso: Ambos límites están a la izquierda de cero (0).


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a –2,80 y menor o igual a –1,50
Es decir, P(–2,80  Z  –1,50)

Solución: Caso simétrico al anterior, el cual se reduce a:


P(–2,80  Z  –1,50) = P(2,80  Z  1,50)
= P(1,50  Z  2,80)
= P(0  Z  2,80) – P(0  Z  1,50)
= 0,4974 – 0,4332
= 0,0642 (Directo de la tabla) –2,8 –1,5

7mo Caso: Un límite a la derecha de cero y el otro a su izquierda.


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a –1,26 y menor o igual a 2,05
Es decir, P(–1,26  Z  2,05)

Solución: P(–1,26  Z  2,05) = P(–1,26  Z  0) + P(0  Z  2,05)


= P(0  Z  1,26) + P(0  Z  2,05)
Por simetría
= 0,3962 + 0,4798
= 0,876 –1,26 2,05

8vo Caso: Un límite está la derecha de cero y el otro completamente a la derecha.


Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a 1,85
Es decir, P(Z  1,85)

Solución: P(Z  1,85) = P(Z  0) – P(0  Z  1,85)


= 0,5000 – 0,4678
= 0,0322 1,85

1,85

9no Caso: Un límite está la izquierda cero y el otro completamente a la izquierda.


Ejemplo: Determinar la probabilidad de que Z sea menor o igual a –1,85
Es decir, P(Z  –1,85)

Solución: P(Z  –1,85) = P(Z  1,85)


= P(Z  0) – P(0  Z  1,85)
= 0,5000 – 0,4678
= 0,0322
–1,85

102
UNIDAD 4: VARIABLES ALEATORIAS CONTINUAS.
COMPROBACIÓN DE LOS APRENDIZAJES

MODELO NORMAL TIPIFICADO O ESTANDARIZADO


Se dice que una distribución normal es de forma estándar si su media aritmética es 0 y su varianza
es 1, y por lo tanto su desviación típica es la unidad.
Los valores de la función de distribución normal general, no están tabulados, pero sí lo están los de
una variable normar estándar “Z”, cuya expresión es: X 
Z

Distribución normal estandarizada Distribución normal

Z X
=0 z Media = X (Promedio)
El área bajo la curva representa la probabilidad El valor de la media no es necesariamente cero

x
La relación entre las variables X y Z se operacionaliza a través de la fórmula z 

Ejemplo:
Una panificadora elabora piezas de pan cuyas longitudes se distribuyen de forma normal con una media de
15 cm y una varianza de 2,25 cm2. Determine:
a) Probabilidad de que una pieza exceda los 18 cm.
b) Probabilidad de que las piezas de pan estén entre 13 cm y 17 cm.
Solución:
a) Probabilidad de que una pieza exceda los 18 cm.
La variable aleatoria “continua” que estamos estudiando es P(X exceda los 18 cm). Es decir, P(x > 18 cm)
Para calcular esa probabilidad tenemos que relacionarla con z, cuya probabilidad se encuentran en las tablas.
xx
Los valores de z se pueden aproximar por la fórmula z
s
Luego, x = 15 cm y  2 = 2,25 cm2   = 1,5 cm.

15 cm  18 cm
Así, z   2(Nótese que z no tiene unidades) X
1.5cm 15 18
Es claro que x = 18 equivale a z = 2 en las tablas
Obviamente la escala del segundo gráfico que corresponde a la variable
normal ‘tipificada’ no guarda una correcta relación con el primer gráfico de
la variable ‘sin tipificar’. Si la escala de ambos gráficos fuese la misma, la
distancia entre 15 y 18 ciertamente no podrá ser igual a la distancia entre 0
y 2 y esto se debe a que sus varianzas no coinciden.
Z
En la tabla 2,00 = 0,4772 que corresponde al área entre la media y z = 2 0 2
Luego, 0,5000 – 0,4772 = 0,0228  2, 28%

103
b) Probabilidad de que las piezas de pan estén entre 13 cm y 17 cm.

13cm  15 cm 17 cm  15 cm
z1    133 Y z2   1,33
1 .5cm 1.5cm
–1,33 1,33
En la tabla 1,33 = 0,4082 que corresponde al área entre la media y z = 1,33
Luego, por simetría, la probabilidad buscada es 0,8164  81,64%

Finalmente, la probabilidad de que una pieza de pan exceda los 18 cm es de 0,0228  2, 28%
Y la probabilidad de que las piezas de pan estén entre 13 cm y 17 cm es de es 0,8164  81,64%

Ejercicios:
1) Consideremos los coeficientes intelectuales (C.I) de los estudiantes del 5to año de una escuela secundaria.
Estos coeficientes se distribuyen normalmente con una media de 85 y una desviación estándar de 6.
a) ¿Cuál es la probabilidad de escoger a un estudiante al azar que tenga un C.I igual o mayor a 92?
b) ¿Cuál es la probabilidad de que un estudiante tenga un coeficiente intelectual entre 74 y 95, ambos
inclusive?

2) Al aplicar un test de habilidades numéricas a 750 estudiantes, se obtuvo una media aritmética de 48 puntos
y una desviación estándar de 8. Determinar (dibuje la gráfica):
a) Las calificaciones estandarizadas para las calificaciones originales 43, 57 y 78.
b) La probabilidad de obtener una calificación menor o igual a 38.
c) La probabilidad de obtener una calificación mayor o igual a 43.
d) La probabilidad de obtener una calificación menor o igual a 67.
e) La probabilidad de obtener una calificación mayor o igual a 59.
f) La probabilidad de obtener una calificación entre 35 y 47.
g) La probabilidad de obtener una calificación entre 40 y 65.
h) ¿Qué porcentaje y cuántos estudiantes obtuvieron calificaciones inferiores a 61?
i) La calificación correspondiente al percentil 72.
j) La calificación correspondiente al percentil 30.

3) Dada una variable x N(20,3), calcular


i. P(25  x  27)
ii. P(18  x  24)
iii. P(x  23)
iv. P(15  x  17)
v. P(x  12,5)
vi. P(x  12,95)
vii. P(x  14,75)

Fin de la Unidad IV
104
TABLA A
Proporciones de áreas bajo la curva normal (1)
(B) (C ) (B) (C) (B) (C)
(A) (A) (A)
Área entre la Área más Área entre la Área más Área entre la Área más
Z Z Z
media y Z allá de Z media y Z allá de Z media y Z allá de Z

0.00 0.0000 0.5000 0.55 0.2088 0.2912 1.10 0.3643 0.1357


0.01 0.0040 0.4960 0.56 0.2123 0.2877 1.11 0.3665 0.1335
0.02 0.0080 0.4920 0.57 0.2157 0.2843 1.12 0.3686 0.1314
0.03 0.0120 0.4880 0.58 0.2190 0.2810 1.13 0.3708 0.1292
0.04 0.0160 0.4840 0.59 0.2224 0.2776 1.14 0.3729 0.1271
0.05 0.0199 0.4801 0.60 0.2257 0.2743 1.15 0.3749 0.1251
0.06 0.0239 0.4761 0.61 0.2291 0.2709 1.16 0.3770 0.1230
0.07 0.0279 0.4721 0.62 0.2324 0.2676 1.17 0.3790 0.1210
0.08 0.0319 0.4681 0.63 0.2357 0.2643 1.18 0.3810 0.1190
0.09 0.0359 0.4641 0.64 0.2389 0.2611 1.19 0.3830 0.1170
0.10 0.0398 0.4602 0.65 0.2422 0.2578 1.20 0.3849 0.1151
0.11 0.0438 0.4582 0.66 0.2454 0.2546 1.21 0.3869 0.1131
0.12 0.0478 0.4522 0.67 0.2486 0.2514 1.22 0.3888 0.1112
0.13 0.0517 0.4483 0.68 0.2517 0.2483 1.23 0.3907 0.1093
0.14 0.0557 0.4443 0.69 0.2549 0.2451 1.24 0.3925 0.1075
0.15 0.0596 0.4404 0.70 0.2580 0.2420 1.25 0.3944 0.1056
0.16 0.0636 0.4384 0.71 0.2611 0.2389 1.26 0.3962 0.1038
0.17 0.0675 0.4325 0.72 0.2642 0.2358 1.27 0.3980 0.1020
0.18 0.0714 0.4286 0.73 0.2673 0.2327 1.28 0.3997 0.1003
0.19 0.0753 0.4247 0.74 0.2704 0.2296 1.29 0.4015 0.0985
0.20 0.0793 0.4207 0.75 0.2734 0.2266 1.30 0.4032 0.0968
0.21 0.0832 0.4168 0.76 0.2764 0.2236 1.31 0.4049 0.0951
0.22 0.0871 0.4129 0.77 0.2794 0.2206 1.32 0.4066 0.0934
0.23 0.0910 0.4090 0.78 0.2823 0.2177 1.33 0.4082 0.0918
0.24 0.0948 0.4052 0.79 0.2852 0.2148 1.34 0.4099 0.0901
0.25 0.0987 0.4013 0.80 0.2881 0.2119 1.35 0.4115 0.0885
0.26 0.1026 0.3974 0.81 0.2910 0.2090 1.36 0.4131 0.0869
0.27 0.1064 0.3936 0.82 0.2939 0.2061 1.37 0.4147 0.0853
0.28 0.1103 0.3897 0.83 0.2967 0.2033 1.38 0.4162 0.0838
0.29 0.1141 0.3859 0.84 0.2995 0.2005 1.39 0.4177 0.0823
0.30 0.1179 0.3821 0.85 0.3023 0.1977 1.40 0.4192 0.0808
0.31 0.1217 0.3783 0.86 0.3051 0.1949 1.41 0.4207 0.0793
0.32 0.1255 0.3745 0.87 0.3078 0.1922 1.42 0.4222 0.0778
0.33 0.1293 0.3707 0.88 0.3106 0.1894 1.43 0.4236 0.0764
0.34 0.1331 0.3669 0.89 0.3133 0.1867 1.44 0.4251 0.0749
0.35 0.1368 0.3632 0.90 0.3159 0.1841 1.45 0.4265 0.0735
0.36 0.1406 0.3594 0.91 0.3186 0.1814 1.46 0.4279 0.0721
0.37 0.1443 0.3557 0.92 0.3212 0.1788 1.47 0.4292 0.0708
0.38 0.1480 0.3520 0.93 0.3238 0.1762 1.48 0.4306 0.0694

105
0.39 0.1517 0.3483 0.94 0.3264 0.1736 1.49 0.4319 0.0681
0.40 0.1554 0.3446 0.95 0.3289 0.1711 1.50 0.4332 0.0668
0.41 0.1591 0.3409 0.96 0.3315 0.1685 1.51 0.4345 0.0655
0.42 0.1628 0.3372 0.97 0.3340 0.1660 1.52 0.4357 0.0643
0.43 0.1664 0.3336 0.98 0.3385 0.1635 1.53 0.4370 0.0630
0.44 0.1700 0.3300 0.99 0.3389 0.1611 1.54 0.4382 0.0618
0.45 0.1736 0.3264 1.00 0.3413 0.1587 1.55 0.4394 0.0606
0.46 0.1772 0.3228 1.01 0.3438 0.1562 1.56 0.4406 0.0594
0.47 0.1808 0.3192 1.02 0.3461 0.1539 1.57 0.4418 0.0582
0.48 0.1844 0.3156 1.03 0.3485 0.1515 1.58 0.4429 0.0571
0.49 0.1879 0.3121 1.04 0.3508 0.1492 1.59 0.4441 0.0559
0.50 0.1915 0.3085 1.05 0.3531 0.1469 1.60 0.4452 0.0548
0.51 0.1950 0.3050 1.06 0.3554 0.1446 1.61 0.4463 0.0537
0.52 0.1965 0.3015 1.07 0.3577 0.1423 1.62 0.4474 0.0526
0.53 0.2019 0.2961 1.08 0.3599 0.1401 1.63 0.4484 0.0516
0.54 0.2054 0.2946 1.09 0.3621 0.1379 1.64 0.4495 0.0505

TABLA A
Continuación
(B) (C ) (B) (C) (B) (C)
(A) (A) (A)
Área entre la Área más Área entre la Área más Área entre la Área más
Z Z Z
media y Z allá de Z media y Z allá de Z media y Z allá de Z

1.65 0.4505 0.0495 2.22 0.4868 0.0132 2.79 0.4974 0.0026


1.66 0.4515 0.0485 2.23 0.4871 0.0129 2.80 0.4974 0.0026
1.67 0.4525 0.0475 2.24 0.4875 0.0125 2.81 0.4975 0.0025
1.68 0.4535 0.0465 2.25 0.4878 0.0122 2.82 0.4976 0.0024
1.69 0.4545 0.0455 2.26 0.4881 0.0119 2.83 0.4977 0.0023
1.70 0.4554 0.0446 2.27 0.4884 0.0116 2.84 0.4977 0.0023
1.71 0.4564 0.0436 2.28 0.4887 0.0113 2.85 0.4978 0.0022
1.72 0.4573 0.0427 2.29 0.4890 0.0110 2.86 0.4979 0.0021
1.73 0.4582 0.0418 2.30 0.4893 0.0107 2.87 0.4979 0.0021
1.74 0.4591 0.0409 2.31 0.4896 0.0104 2.88 0.4980 0.0020
1.75 0.4599 0.0401 2.32 0.4898 0.0102 2.89 0.4981 0.0019
1.76 0.4608 0.0392 2.33 0.4901 0.0099 2.90 0.4981 0.0019
1.77 0.4616 0.0384 2.34 0.4904 0.0096 2.91 0.4982 0,0018
1.78 0.4625 0.0375 2.35 0.4906 0.0094 2.92 0.4982 0.0018
1.79 0.4633 0.0367 2.36 0.4909 0.0091 2.93 0.4983 0.0017
1.80 0.4641 0.0359 2.37 0.4911 0.0089 2.94 0.4984 0.0016
1.81 0.4649 0.0351 2.38 0.4913 0.0087 2.95 0.4984 0.0016
1.82 0.4656 0.0344 2.39 0.4916 0.0084 2.96 0.4985 0.0015
1.83 0.4664 0.0336 2.40 0.4918 0.0082 2.97 0.4985 0.0015
1.84 0.4671 0.0329 2.41 0.4920 0.0080 2.98 0.4986 0.0014
1.85 0.4678 0.0322 2.42 0.4922 0.0078 2.99 0.4986 0.0014

106
1.86 0.4686 0.0314 2.43 0.4925 0.0075 3.00 0.4987 0.0013
1.87 0.4693 0.0307 2.44 0.4927 0.0073 3.01 0.4987 0.0013
1.88 0.4699 0.0301 2.45 0.4929 0.0071 3.02 0.4987 0.0013
1.89 0.4706 0.0294 2.46 0.4931 0.0069 3.03 0.4988 0.0012
1.90 0.4713 0.0287 2.47 0.4932 0.0068 3.04 0.4988 0.0012
1.91 0.4719 0.0281 2.48 0.4934 0.0066 3.05 0.4989 0.0011
1.92 0.4726 0.0274 2.49 0.4936 0.0064 3.06 0.4989 0.0011
1.93 0.4732 0.0268 2.50 0.4938 0.0062 3.07 0.4989 0.0011
1.94 0.4738 0.0262 2.51 0.4940 0.0060 3.08 0.4990 0.0010
1.95 0.4744 0.0256 2.52 0.4941 0.0059 3.09 0.4990 0.0010
1.96 0.4750 0.0250 2.53 0.4943 0.0057 3.10 0.4990 0.0010
1.97 0.4756 0.0244 2.54 0.4945 0.0055 3.11 0.4991 0.0009
1.98 0.4761 0.0239 2.55 0.4946 0.0054 3.12 0.4991 0.0009
1.99 0.4767 0.0233 2.56 0.4948 0.0052 3.13 0.4991 0.0009
2.00 0.4772 0.0228 2.57 0.4949 0.0051 3.14 0.4992 0.0008
2.01 0.4778 0.0222 2.58 0.4951 0.0049 3.15 0.4992 0.0008
2.02 0.4783 0.0217 2.59 0.4952 0.0048 3.16 0.4992 0.0008
2.03 0.4788 0.0212 2.60 0.4953 0.0047 3.17 0.4992 0.0008
2.04 0.4793 0.0207 2.61 0.4955 0.0045 3.18 0.4993 0.0007
2.05 0.4798 0.0202 2.62 0.4956 0.0044 3.19 0.4993 0.0007
2.06 0.4803 0.0197 2.63 0.4957 0.0043 3.20 0.4993 0.0007
2.07 0.4808 0.0192 2.64 0.4959 0.0041 3.21 0.4993 0.0007
2.08 0.4812 0.0188 2.65 0.4960 0.0040 3.22 0.4994 0.0006
2.09 0.4817 0.0183 2.66 0.4961 0.0039 3.23 0.4994 0.0006
2.10 0.4821 0.0179 2.67 0.4962 0.0038 3.24 0.4994 0.0006
2.11 0.4826 0.0174 2.68 0.4963 0.0037 3.25 0.4994 0.0006
2.12 0.4830 0.0170 2.69 0.4964 0.0036 3.30 0.4995 0.0005
2.13 0.4834 0.0166 2.70 0.4965 0.0035 3.35 0.4996 0.0004
2.14 0.4838 0.0162 2.71 0.4966 0.0034 3.40 0.4997 0.0003
2.15 0.4842 0.0158 2.72 0.4967 0.0033 3.45 0.4997 0.0003
2.16 0.4846 0.0154 2.73 0.4968 0.0032 3.50 0.4998 0.0002
2.17 0.4850 0.0150 2.74 0.4969 0.0031 3.60 0.4998 0.0002
2.18 0.4854 0.0148 2.75 0.4970 0.0030 3.70 0.4999 0.0001
2.19 0.4857 0.0143 2.76 0.4971 0.0029 3.80 0.4999 0.0001
2.20 0.4861 0.0139 2.77 0.4972 0.0028 3.90 0.49995 0.00005
2.21 0.4864 0.0136 2.78 0.4973 0.0027 4.00 0.49997 0.00003

107
BIBLIOGRAFÍA
- Chourio, J. (1997) Estadística I. (1ra. Edición) Caracas - Venezuela. Editorial Biosfera.

- Feller, W. (1996) Introducción a la teoría de Probabilidades y sus aplicaciones. (Volumen I) México.


Editorial Limusa.

- Guenther, W. (1977) Introducción a la Inferencia Estadística. (1ra. Edición) México.


Editorial McGraw.-Hill Book.

- López C., R. (1996) Cálculo de la Probabilidad e Inferencia Estadística con tópicos de Econometría.
(3ra. Edición) Caracas - Venezuela. Publicaciones UCAB.

- Meyer, P. (1992) Probabilidad y Aplicaciones Estadísticas. Estados Unidos. Fondo educativo Interamericano.

- Mendenhall, Beaver R y Beaver B. (2008) Introducción a la probabilidad y estadística. Décimo segunda


edición. Cengage Learning.

- Reyes, A. (1998) Probabilidad y Estadística para el aula. (1ra. Edición) Mérida – Venezuela. ULA.

- Salama, D. (2008) Estadística. Metodología y Aplicaciones. (6ta Edición) Caracas - Venezuela.


Editorial Torino.

- Valera I., R. (1996) Módulo de Probabilidad. (2da. Edición) Maracay – Venezuela. UPEL.

- http://www.slideshare.net/rial08/la-normal

108

También podría gustarte