Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD 1:
TEORÍA DE LA PROBABILIDAD.
OBJETIVO DE APRENDIZAJE: Interpretar los conceptos estadísticos para el análisis y representación gráfica de datos.
CONTENIDO:
1.1. Terminología: Teoría de la Probabilidad. Sucesos. Tipos de Sucesos: incompatibles, contrarios, compatibles,
dependientes, independientes y condicionados.
1.2. Propiedades Básicas de la Probabilidad: Reglas y condiciones de la probabilidad.
1.3. Métodos de Resolución de Problemas de Probabilidad: Por enumeración de casos, por el Teorema de
Probabilidad Completa, por el Teorema de Probabilidad Compuesta, por el Teorema de Bayes.
“La probabilidad es la parte de las matemáticas que trata de manejar con números la incertidumbre”
Del latín probabilitas, la probabilidad es la cualidad de probable (que puede suceder o que resulta verosímil).
También conocida como Teoría de la Probabilidad, es la rama de las matemáticas que se ocupa de medir o
determinar cuantitativamente la posibilidad (frecuencia) de que un suceso o experimento, sujeto a la
incertidumbre o la aleatoriedad, produzca un determinado resultado. La probabilidad, por lo tanto, como
veremos más adelante, es la razón entre el número de casos favorables y el número de casos posibles.
En la cotidianidad de nuestra vida escuchamos expresiones que hacen referencia a la probabilidad: “qué
probabilidad hay de que la vinotinto asista al mundial”, “es muy probable que apruebe el curso de estadística II”,
“existe una alta probabilidad de que tal o cual candidato gane las elecciones”, etc. En el presente curso haremos
un estudio riguroso de esta ciencia.
La teoría de la probabilidad tuvo su origen en el Siglo XVII en Francia, iniciándose con una sencilla teoría
matemática de los juegos de azar. Los juegos de cartas, dados, etc., constituían un entretenimiento corriente de
la época, de allí que muchos personajes apasionados por estos juegos buscasen algún método que les permitiera
ganar. Entre estos destaca el caballero De Meré, quien hacia 1650 le planteó su experiencia de juego al
matemático y filósofo Blaise Pascal (1623–1662), quien a su vez mantuvo correspondencia sobre el tema con su
amigo el matemático Pierre Fermat (1601–1665). Estos se percataron de que de los resultados posibles al lanzar
una moneda, un dado, etc., no se podían predecir de antemano. Esta imposibilidad de predicción constituye la
aleatoriedad, el elemento que caracteriza la falta de certeza, es decir, el azar del juego. De Meré había
encontrado, de acuerdo a sus propios cálculos, cierta discordancia entre las frecuencias relativas de las veces que
ganaba y el valor de la correspondiente probabilidad de ganar. Pascal y Fermat demostraron que los cálculos de
De Meré eran erróneos y que la probabilidad calculada correctamente estaba en concordancia con las frecuencias
relativas realmente observadas, no existiendo contradicción.
2
Hacia comienzos del siglo XVIII, James Bernoullí y Abraham de Moivre,
continúan con el desarrollo de la teoría de los juegos de azar, sobre la base de la
definición clásica de probabilidad, aplicando varios métodos de análisis combinatorio
y otras técnicas matemáticas. Con el tiempo, esta teoría que sólo se aplicaba a los
juegos de azar, sirvió de plataforma a algunos métodos para el estudio de poblaciones
humanas y su relación con los seguros de vida, tales como el método para el cálculo
de las tablas de supervivencia, valores de renta, primas de seguro, etc. Pierre Laplace,
publica en 1812 la “Theorie analytique desprobabilités”, tratado clásico sobre la
materia, con una exposición completa y sistemática sobre la teoría matemática de los
juegos de azar y un gran número de aplicaciones a cuestiones científicas y prácticas.
Karl Gauss, estudió las observaciones de medidas físicas y astronómicas mediante la
aplicación de la teoría de la probabilidad matemática, llegando a perfeccionar una
teoría de errores sistemática. Es famosa su curva normal de error o campana de
Pierre Simon Laplace
(1749 - 1827)
Gauss, de gran aplicación teórica y práctica.
Así pues, la teoría de la probabilidad modela los fenómenos aleatorios, aquellos que no ofrecen un resultado
único o previsible bajo condiciones determinadas. El lanzamiento de un dado, por ejemplo, es un fenómeno
aleatorio ya que puede arrojar diferentes resultados más allá de que se realice en las mismas condiciones. Como
veremos más adelante, la probabilidad mide la mayor o menor posibilidad de que se dé un determinado resultado
(suceso) cuando se realiza un experimento aleatorio. La probabilidad toma valores entre 0 y 1 (o expresados en
tanto por ciento, entre 0% y 100%): si un suceso no ocurre nunca, su probabilidad asociada es cero (suceso
imposible), mientras que si ocurriese siempre su probabilidad sería igual a uno (suceso seguro). El resto de los
sucesos tendrá probabilidades entre cero y uno, que será tanto mayor cuanto más probable sea que dicho suceso
tenga lugar. Así, las probabilidades suelen venir expresadas como decimales, fracciones o porcentajes.
El hombre siempre tuvo interés en cuantificar la probabilidad ya que dicha cuantificación ayuda a predecir
acontecimientos futuros. Por ejemplo: si todos los días martes, desde hace tres meses, se corta la luz, existirá una
gran probabilidad (aunque no una certeza) de que el próximo martes también se produzca el corte. Así, como ya
dijimos, las probabilidades aparecen asociadas a los fenómenos aleatorios o estocásticos. Un fenómeno aleatorio
es aquel en el cual la verificación de un cierto conjunto de condiciones determinadas conduce a un resultado
entre una serie de resultados posibles. Llamaremos experimento aleatorio a ese conjunto de condiciones
determinadas. Por contraposición, los fenómenos determinísticos o no aleatorios, son aquellos en los que la
verificación de un cierto conjunto de condiciones determinadas conduce, en forma inevitable, a un resultado fijo.
Por ejemplo, lanzar una moneda al aire y observar la cara que presenta al caer al piso es un experimento
aleatorio (tenemos dos resultados posibles: cara y sello), mientras que enfriar agua hasta cero grados centígrados
bajo presión atmosférica normal es un fenómeno determinístico (conduce inequívocamente a la formación de
hielo).
3
CONCEPTUALIZACIÓN DE LA PROBABILIDAD.
Antes de profundizar en la forma cómo se utilizan y determinar
valores de probabilidad, es necesario conocer en cierta manera de
donde provienen estos valores. Hay cuatro enfoques conceptuales,
(formas de calcular o estimar la probabilidad). El enfoque clásico
o “a priori” proveniente de los juegos de azar, se emplea cuando
los espacios muestrales son finitos y tienen resultados mutuamente
excluyentes e igualmente probables. El enfoque empírico, “a
posteriori” o frecuencial, que se basa en la frecuencia relativa de
ocurrencia de un evento con respecto a un gran número de ensayos
repetidos.
El enfoque subjetivo de la probabilidad, donde las probabilidades son grados personales de creencias acerca de
sucesos con incertidumbre, y por último, el enfoque estructural o axiomático, para el cual la probabilidad formal
es un concepto que se define por un sistema de axiomas y el conjunto de definiciones y teoremas que se pueden
deducir de esos axiomas. Seleccionar uno de los cuatro enfoques dependerá de la naturaleza del problema.
Este enfoque permite determinar valores de probabilidad antes de ser observado el experimento por lo que se le
denomina enfoque a priori. También es conocido como definición de Laplace, quien define la probabilidad de
un suceso como el cociente entre casos favorables y casos posibles. Este enfoque asume la equiprobabilidad de
todos los resultados simples del espacio muestral. Los matemáticos llaman a esta asignación de probabilidades una
distribución de probabilidad uniforme.
Imaginemos un evento o suceso E, que de un total de n(S) casos posibles, todos igualmente probables, puede
presentarse en n(E) de los casos, entonces, la probabilidad de aparición del suceso E (conocida como su
ocurrencia) está dada por:
n S n E n S n E
q = P (no E)
n S n S n S
n E
1 1 p 1 P E
n S
4
Observaciones:
1. De la definición dada se obtiene que cada suceso elemental tiene probabilidad 1/n. Decimos en este caso
que los sucesos son equiprobables.
2. La probabilidad de un suceso es un número no negativo, y menor o igual que 1, es decir, para cualquier
suceso (E) tenemos que 0 PE 1
3. Si el suceso es imposible (no puede ocurrir) su probabilidad es cero (0). Como el conjunto vacío () es
un subconjunto del espacio muestral sin elementos, tenemos que su probabilidad es nula, es decir, P() = 0. Es
por esto que lo llamaremos suceso imposible, tal como veremos más adelante.
4. Si el suceso es cierto (tiene que ocurrir), su probabilidad es 1. Es decir, P(E) = 1, por lo que llamamos
suceso seguro al espacio de sucesos elementales o muestral (Ω), como veremos más adelante.
5. El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar
la regla casos favorables / casos posibles el cociente siempre sería cero.
6. Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran
mayor probabilidad de salir que otras, no podríamos aplicar esta regla.
Nótese que decimos resultados mutuamente excluyentes e igualmente posibles. Dos resultados son
mutuamente excluyentes si la realización de uno implica la imposibilidad de la realización del otro. El concepto
de resultados igualmente posibles implica que no hay nada que haga pensar que alguno de los resultados tiene
más posibilidades de darse que los otros.
En el momento de la aplicación de este enfoque a un experimento aleatorio real, nos enfrentamos con
el problema de decidir cuáles son los resultados simples que son igualmente probables. La existencia
de simetría en el experimento físico, que permite aplicar el principio de razón insuficiente de Laplace,
es una guía poco firme para ayudar en este problema, entre otras cosas, porque el mismo experimento
físico puede revelar diferentes simetrías lo que supone el problema de decidir entre ellas. Recordemos,
por ejemplo, que en la experiencia aleatoria del lanzamiento de dos dados se proponen tres modelos:
Maxwell-Boltzmann, Bose-Einstein y Fermi-Dirac. No cabe duda de que debe encerrar mucha
enjundia psicológica el enfoque de la equiprobabilidad porque una de nuestras principales industrias se
construye sobre esta idea: toda forma popular de juego, excepto apuestas en contextos de fuerza o
destreza, depende de aparatos aleatorios tales como cartas perfectamente barajadas, dados
perfectamente cúbicos o ruletas simétricamente divididas. Tales aparatos utilizan una simetría visible
para soportar la hipótesis de que los elementos simétricos son igualmente probables.
Ejemplos
1ro. Sea A el suceso de que aparezcan los números 1 ó 5 en una sola tirada de un dado.
Solución:
n (A): Número de casos favorables 1, 5 Dos casos.
n (S): Número de casos posibles 1, 2, 3, 4, 5, 6 Seis casos.
Si el dado está bien construido, podemos suponer que los seis casos son igualmente posibles.
n A 2 1
Puesto que A puede presentarse con dos de estos seis casos, se tiene: p P A
n S 6 3
1 2
La probabilidad de no obtener un 1 ó 5, es decir, de obtener 2, 3, 4 ó 6 es; q P no A 1
3 3
5
2do. El experimento es lanzar un dado. ¿Cuál es la probabilidad de que caiga un dos hacia arriba? ¿Cuál la
probabilidad de obtener un número par?
1 3
Solución: S = {1, 2, 3, 4, 5, 6}, Pcaiga 2 0,166 ; y hay tres pares, luego, P par 0,50
6 6
3ro. ¿Cuál es la probabilidad de que en una familia que tiene tres hijos, hayan dos niñas y un niño, si se
considera igualmente probable el nacimiento de un niño o niña?
Solución: Usando "a" para niña y "o" para niño, el espacio muestral es:
S = {aaa, aao, aoa, aoo, oaa, oao, ooa, ooo} : n(S) = 8
El evento E de que hayan dos niñas y un niño es E = {aao, aoa, oaa} ; n(E) = 3
n E 3
p P E 0,3750 Se sugiere la construcción de un diagrama de árbol
n S 8
Un diagrama de árbol es una herramienta que se utiliza para determinar los posibles resultados de un
experimento aleatorio. Consiste en una representación gráfica de esos posibles resultados y consta de una serie
de pasos, cada uno con un número finito de maneras de ser llevado a cabo. En la construcción de un diagrama
de árbol se partirá colocando una rama para cada una de las posibilidades, acompañada de su probabilidad.
Cada una de estas ramas se conoce como rama de primera generación. El final de cada rama de primera
generación se constituye a su vez en un nudo del cual parten nuevas ramas, conocidas como ramas de segunda
generación, según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final). Hay que tener en cuenta que la construcción de un árbol no depende de tener el
mismo número de ramas de segunda generación que salen de cada rama de primera generación y que la suma
de las probabilidades de los nudos de cada rama debe dar 1.
4to. Calcular la probabilidad de que al lanzar un dado dos veces consecutivas, la suma de los puntos
obtenidos sea no menor que 8.
Solución: Designemos por (i, j) al resultado del experimento consistente en lanzar un dado dos veces
consecutivas y obtener i puntos en el primer lanzamiento y j puntos en el segundo (i, j = 1, 2, 3, 4, 5, 6).
El conjunto de sucesos elementales que describe los resultados de un experimento de este tipo se compone de
6x6 = 36 puntos de la forma (i, j), y puede ser representado en la siguiente tabla
El suceso A consiste en que la suma de los puntos obtenidos es no menor que 8. Es claro que los casos
favorables para la ocurrencia del suceso A son los indicados en la tabla, es decir, 15. Considerando que los 36
resultados posibles son equiprobables, y aplicando la definición de probabilidad, obtenemos:
15 5
p P ( A) 0,4166
36 12
6
B. ENFOQUE DE FRECUENCIAS RELATIVAS (a posteriori o empírico).
Cuando se realiza un experimento aleatorio un número muy elevado de veces, las probabilidades de los
diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas
probabilidades. En este modelo ya no será necesario que el número de soluciones sea finito, ni que todos los
sucesos tengan la misma probabilidad. La idea intuitiva de probabilidad se basa en la llamada ley de los grandes
números, enunciada por Bernoulli: “La frecuencia relativa de un suceso tiende a estabilizarse en torno a un
número, a medida que el número de pruebas del experimento crece indefinidamente”. Así, la probabilidad de un
suceso se obtiene o, más bien, se estima a partir de la frecuencia relativa observada de ese suceso en ensayos
repetidos.
Este es pues un enfoque a posteriori, experimental, basado en información obtenida después de realizar ensayos
reales. La probabilidad es el límite hacia el que tiende la frecuencia relativa, de este modo, el enfoque frecuencialista
implica la teoría de límites y la convergencia. Al aplicar esta definición, hay dificultades obvias para definir lo que
significa “similar” o '”aleatoriedad” ya que aparece la circularidad. Incluso la noción de estabilización de las
frecuencias relativas a largo plazo presenta dificultades en relación al número de ensayos necesarios para lograr
dicha estabilidad. El concepto de probabilidad a priori tiene la desventaja de que no es aplicable cuando el
número de resultados posibles es infinito. Más aun, este concepto es válido solamente cuando los resultados son
igualmente posibles. Por desgracia, hay situaciones prácticas que no son de este tipo y la definición de Laplace
no se puede aplicar. Por ejemplo, si se pregunta por la probabilidad de que un paciente se cure mediante cierto
tratamiento médico, o la probabilidad de que una determinada máquina produzca artículos defectuosos, entonces
no hay forma de introducir resultados igualmente probables. Por ello se necesita un concepto más general de
probabilidad. Una forma de dar respuesta a estas preguntas es obtener algunos datos empíricos en un intento por
estimar las probabilidades.
El concepto es muy simple; si realizamos un experimento aleatorio un número grande de veces, digamos, n
veces, y una determinada modalidad de A se da nA veces, como sabemos que la frecuencia relativa de la
modalidad A es f A = nA/n. Según el concepto de probabilidad a posteriori la probabilidad de la modalidad A
sería el límite de la frecuencia relativa de A cuando n tiende a infinito; es decir: n
P A Lím f A Lím A
n n n
Si continuamos calculando esta frecuencia relativa cada cierto número de ensayos, a medida que aumentamos
n, las frecuencias relativas correspondientes serán más estables; es decir; tienden a ser casi las mismas; en este
caso decimos que el experimento muestra regularidad estadística o estabilidad de las frecuencias relativas. Esto
se ilustra en la siguiente tabla que muestra los resultados de una moneda lanzada al aire 1.000 veces.
7
En un total de 1.000 lanzamientos ocurrieron 508 caras, es decir la frecuencia relativa es aproximadamente
igual a 0.50.
Tres investigadores realizaron experimentos y obtuvieron los siguientes resultados
La mayoría de los experimentos aleatorios de importancia práctica tienen estabilidad, por esto podemos
sospechar que prácticamente será cierto que la frecuencia relativa de un evento E en un gran número de ensayos
es aproximadamente igual a un determinado número P(E). Obsérvese que este número es una propiedad que no
depende solamente de E, sino que se refiere a un cierto espacio muestral S y a un experimento aleatorio.
Entonces, decir que el evento E tiene probabilidad P(E) significa que si efectuamos el experimento muchas
veces, es prácticamente cierto que la frecuencia relativa de E, fr(E) es aproximadamente igual a P(E). En la
práctica la probabilidad se aproxima por la frecuencia relativa al repetir el experimento un número grande de
veces, es decir: n
P (E ) f E E
n
Cuando se usa la definición frecuencial, es importante tomar en cuenta los siguientes aspectos:
1) La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
2) Cuanto mayor sea el número de ensayos, tanto mejor será la estimación de la probabilidad; es decir, a mayor
número de ensayos mejor será la estimación.
3) La probabilidad es propia de sólo un conjunto de condiciones idénticas a aquéllas en las que se obtuvieron
los datos, o sea, la validez de emplear esta definición depende de que las condiciones en que se realizó el
experimento sean repetidas idénticamente.
En resumen, este enfoque permite determinar la probabilidad con base en la proporción de veces que ocurre
un resultado favorable en cierto número experimentos. No implica ningún supuesto previo de igualdad de
probabilidades. La probabilidad se define como el límite de la frecuencia relativa bajo el supuesto de que el
número de observaciones o casos posibles, crezca indefinidamente. A este enfoque se le denomina también
enfoque empírico debido a que para determinar los valores de probabilidad se requiere de la observación y de la
recopilación de datos. También se le denomina a posteriori, ya que el resultado se obtiene después de realizar el
experimento un cierto número de veces.
Con esta concepción de la probabilidad, la mayoría de incertidumbres que experimentan los seres humanos no se
pueden describir por medio de probabilidades; por ejemplo, "el 100.000 dígito decimal de π es un 7", "hay más de
1.000.000 teléfonos en Aragua (Venezuela)", etc. Además, puede ser bastante difícil determinar si una particular
frecuencia relativa es un estimador apropiado de una probabilidad. El lanzamiento de la moneda es el ejemplo de
frecuencias relativas que viene en los libros de texto, pero ¿cómo se debería lanzarla? Los sucesivos lanzamientos se
deberían realizar bajo condiciones "substancialmente idénticas" pero no pueden ser absolutamente idénticas porque la
moneda caería siempre del mismo lado. ¿Cuánta variación es permisible en el procedimiento de lanzamiento de una
moneda, de una tirada a la siguiente? La posición frecuencialista casi nunca llevaría a estimar que la probabilidad de
conseguir caras es 1/2. En efecto, en cualquier secuencia de lanzamientos razonablemente larga pero finita, la frecuencia
relativa de caras casi nunca será 1/2; además, variará de una ocasión a otra. La mejor estimación frecuencialista de una
probabilidad es la frecuencia relativa observada, por tanto los frecuencialistas deben admitir estimaciones como
515/1.000 o 5200/10.000, al menos que sean bastante sensatos para no recurrir a frecuencias relativas cuando tengan una
base mejor para el juicio probabilístico, por ejemplo, la simetría de la moneda.
8
Ejemplos
1) Antes de incluir la cobertura para cierto tipo de problemas dentales en
pólizas de seguros médicos para adultos con empleo, una compañía de seguros
desea determinar la probabilidad de ocurrencia de esa clase de problemas, para
que pueda fijarse la prima de seguros de acuerdo con esas cifras. Por ello, un
especialista en estadística recopila datos para 10.000 adultos que se encuentran en
las categorías de edad apropiadas y descubre que 100 de ellos han experimentado
el problema dental específico durante el año anterior. Por ello, la probabilidad de
ocurrencia es:
100
P (A ) 0,01 1%
10 .000
2) Se sabe que una moneda está cargada. Para determinar la probabilidad de que caiga
cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cayó cara. Si aplicamos
la fórmula:
25
P(cae cara ) 0,41
60
3) Si en 2.000 lanzamientos de una moneda resultan 1.080 caras, la frecuencia relativa de caras es:
1.080
0,54
2 .000
4) Si en otros 1.200 lanzamientos de la misma moneda resultan 560 caras, la frecuencia relativa para el total
de los 3.200 lanzamientos es:
1.080 560 0,5125
3.200
De acuerdo con la definición en términos de frecuencia relativa, si se continúa de esa forma, nos estaríamos
acercando más y más al resultado que puede llamarse “probabilidad de cara en el lanzamiento de la moneda”.
De los resultados se puede concluir que este límite sería 0,50.
Otro ejemplo:
9
P A 0,18 18%
50
Tanto el enfoque clásico como el enfoque empírico conducen a valores de probabilidad, en el sentido de que
los valores de probabilidad indican a largo plazo la tasa relativa de ocurrencia del evento.
9
C. ENFOQUE SUBJETIVO DE LA PROBABILIDAD (personalista o Bayesiano).
Representa el tipo de probabilidad que en el Renacimiento se calificaba como opinión o grado de creencia. En este
enfoque, las probabilidades son evaluaciones de situaciones que son inherentes a la mente del sujeto y no a las
características del mundo real que nos rodea tal como se asume implícitamente en los dos primeros enfoques. "Las
probabilidades son grados personales de creencia acerca de sucesos con incertidumbre". El enfoque señala que la
probabilidad de un evento es el grado de confianza que una persona tiene en que el evento ocurra, con base en
toda la evidencia que tiene disponible, fundamentado en la intuición, opiniones, creencias personales y otra
información indirecta. Este enfoque no depende de la repetitividad de ningún evento y permite calcular la
probabilidad de sucesos únicos y se da el caso de que ocurra o no esa única vez. Debido a que el valor de la
probabilidad es un juicio personal, al enfoque subjetivo se le denomina también enfoque personalista. Se
diferencia de lo dos enfoques anteriores, debido a que tanto el enfoque clásico como el de frecuencia relativa
producen valores de probabilidad objetivos.
Desde este enfoque, todas las incertidumbres se pueden medir apropiadamente utilizando probabilidades. Sin
embargo, no todas las opiniones numéricas acerca de resultados inciertos son probabilidades; las opiniones, para
ser tratadas como probabilidades deben ser consistentes. Por ejemplo, sería tonto hacer una apuesta de 3 a 2 en cada
uno de los dos caballos que participan en una carrera porque se pierde dinero en cuanto que la ganancia de 2 en un
caballo no compensa la pérdida de 3 en el otro. La coherencia formaliza esta idea básica de la que se pueden deducir
las leyes básicas de la probabilidad. El enfoque subjetivo de la probabilidad no supone relativismo cultural o
científico en el sentido de que no implica que "tu conjetura es tan buena como la mía". Aunque tu opinión inicial
sobre la futura conducta de una moneda o sobre cualquier otra hipótesis incierta, puede diferir radicalmente de la
de tus vecinos (de ahí viene el nombre de probabilidades personales), tu opinión y la suya se verán tan transformadas
por una serie de observaciones relevantes que llegarán a ser casi indistinguibles. Esta aproximación que surge de
opiniones inicialmente divergentes es una razón para considerar "objetivas" las inferencias desde las frecuencias
relativas.
Todas las probabilidades son condicionadas para el enfoque personalista. Formalmente, se puede establecer una
partición en cualquier conjunto de sucesos y una probabilidad es una medida asignada a cada uno de los
subconjuntos de la partición. Algunas veces la proposición a la que se asigna una probabilidad define completamente
el conjunto de partida; por ejemplo: "esta bolsa contiene 50 bolas rojas y 50 azules, completamente mezcladas.
Uno de nosotros selecciona una, metiendo la mano en la bolsa a ciegas y cogiendo la primera que encuentra.
¿Será roja?". Sin embargo, con mayor frecuencia, la proposición omite la mayor parte de la información que
especifica el conjunto de partida; por ejemplo: "la siguiente persona que veré medirá al menos 1,70 cm". La
posibilidad de que el enunciado sea verdad depende de cuestiones tales como dónde estoy en este momento y cuál
es la secuencia probable de sucesos que me llevará a ver a alguna persona: puedo estar en casa con mi mujer e hijos,
ninguno de los cuales llega a 1,70; puedo estar en un partido de baloncesto Toros-Guaiqueríes, en el primer caso
la probabilidad de que se cumpla el enunciado será muy baja, en el segundo caso aumenta esta probabilidad.
La información condicionante siempre existe, independientemente de que sea explícita o implícita. Puesto que las
probabilidades modelan creencias u opiniones, el tipo más importante de condicionamiento tiene que ver con la
información disponible en el momento en que se evalúa la probabilidad. La regla fundamental para cambiar las
probabilidades cuando se dispone de nueva información es el teorema de Bayes, que es una formalización
matemática del proceso de aprendizaje desde la experiencia. Razón por la que este enfoque personalista de la
probabilidad se llama con frecuencia Bayesiano.
Ejemplos
1) Hay una probabilidad del 90% de que las ventas mejoren el año próximo.
2) Hay una alta probabilidad de sacarme un 20 en esta materia.
10
D. ENFOQUE ESTRUCTURAL O AXIOMÁTICO (Definición Axiomática de Kolmogorov).
Después de establecer una forma de determinar la probabilidad experimentalmente, se pueden deducir leyes o
propiedades de la probabilidad en forma lógica o computacional bajo ciertas suposiciones llamados axiomas de
la probabilidad. Estos axiomas corresponden a la definición axiomática de la probabilidad de Kolmogorov.
La probabilidad formal es un concepto que se define por un sistema de axiomas y el conjunto de definiciones
y teoremas que se pueden deducir de esos axiomas. Unas probabilidades se deducen de otras probabilidades de
acuerdo a teoremas matemáticos, sin justificación para sus valores numéricos en ninguna aplicación. Para
Kolmogorov, la teoría de la probabilidad, como disciplina matemática que es, puede y debe ser desarrollada desde
los axiomas, exactamente igual que la geometría y el álgebra. Según Barnett, este enfoque estructural no clarifica
la naturaleza de la probabilidad aunque los teoremas deducidos son un indicador de posibles interpretaciones.
Sin embargo, puede servir como una estructura teórica para las dos principales concepciones de la probabilidad, la
objetivista y la subjetivista. La posición objetivista abarca los enfoques clásico y frecuencialista; según esta
perspectiva, la probabilidad es un tipo de disposición de ciertos sistemas físicos que se relaciona con frecuencias
empíricas. Algunos teoremas como las leyes de los grandes números, confirman esta relación. La posición
subjetivista trata la probabilidad como un grado de confianza en proposiciones que expresan incertidumbre.
Los axiomas que se basan en una conducta de apuestas "racional", como los de coherencia y consistencia,
proporcionan reglas para asignar probabilidades.
Es notable que las teorías estructurales construidas sobre varios sistemas de axiomas son idénticas para
objetivistas y subjetivistas si se apartan las variantes subjetivistas más radicales como la de De Finetti. Esto
significa que posiciones competitivas utilizan el mismo lenguaje axiomático con respecto a la sintaxis;
naturalmente, la semántica es diferente.
A pesar de la equivalencia formal de los enfoques, se considera que los axiomas de Kolmogorov son una
justificación de la posición objetivista, especialmente del modelo frecuencialista. El modelo estructural no
ayuda a determinar un valor para la probabilidad.
En una aplicación determinada hay que elegir una interpretación específica subjetiva u objetiva para
determinar el modelo y las probabilidades inherentes. Filosóficamente, para el estructuralista no hay forma
de decidir qué modelo es mejor.
Un ejemplo estándar de lanzar un dado azul determinado puede ayudar a ilustrar las diferentes posiciones
teóricas. El modelo clásico asigna una probabilidad de 1/6 al suceso de conseguir un seis, porque se puede
asumir que hay seis caras todas ellas igualmente probables. El modelo frecuencialista asigna una
probabilidad realizando ensayos repetidos o asignando el mismo valor para el dado azul cuando
experiencias con otro dado han producido un resultado de 1/6. En ambos modelos la probabilidad es una
característica inherente del dado y del procedimiento de lanzamiento. El modelo subjetivista afirma que la
probabilidad es un constructo mental que se puede alterar si se dispone de nueva información acerca del
dado. Por ejemplo, se puede asignar un valor diferente de 1/6 si el dado es negro o más pesado o más
pequeño o está suavemente cincelado; por supuesto que se necesita alguna base para tomar la decisión pero
dado que no se considera la probabilidad como inherente al objeto, no implica ningún problema lógico que
haya valores en conflicto.
11
AXIOMAS DE PROBABILIDAD.
La probabilidad de un evento E en un experimento aleatorio, es el valor numérico P(E) que satisface los
siguientes axiomas:
- Si E es un evento definitivo del espacio muestral S, entonces: 0 ≤ P (E) ≤ 1.
- Si S representa el conjunto de todos los resultados posibles de un experimento aleatorio, entonces: P (S) = 1.
En el certamen de belleza Miss Venezuela, el nombre de las cinco finalistas no se sabrá con certeza hasta tanto
no se realicen las pruebas correspondientes para elegirlas. Se puede conocer la lista de todas las participantes
inscritas, pero no la lista de las escogidas. El certamen constituye el experimento aleatorio, mientras que el
conjunto de todos los posibles resultados al realizar el experimento es lo que llamaremos espacio muestral.
EXPERIMENTO ALEATORIO.
Es el conjunto de pruebas aleatorias realizadas en las mismas condiciones. El resultado no se conoce a priori,
pero si se conocen todos los resultado posibles. Si se realiza una sola prueba, la misma constituye un
experimento aleatorio. Estos experimentos también se llaman estocásticos. El lanzamiento de una moneda una o
varias veces, la extracción de una baraja de un juego, etc., son ejemplos de ello. Nótese que si lanzamos un
dado, tampoco podemos determinar el resultado que vamos a obtener, aunque si conocemos todos los resultados
posibles.
12
COMPROBACIÓN DE LOS APRENDIZAJES
1) Sea el experimento lanzar dos monedas simultáneamente, describa su espacio muestral.
Solución: Nuestro espacio muestral sería los cuatro posibles resultados de este experimento.
Estos resultados podemos obtenerlos mediante dos procedimientos:
a) A través de un producto cartesiano. b) A través de un diagrama de árbol
Segunda 1ra 2da (moneda)
Primera
moneda
moneda C
C S
C CC CS C
S SC SS S
C
S
Luego el espacio muestral de estas dos monedas sería S
S CC, CS, SC, SS
13
ESPACIO MUESTRAL O DE SUCESOS.
También llamado espacio de sucesos elementales. Es el conjunto de todos los resultados posibles de un
experimento aleatorio. Se simboliza por la letra S o bien con la letra griega mayúscula Ω -omega-. Ejemplo: En
el lanzamiento de un dado, el espacio muestral es S = 1, 2, 3, 4, 5, 6.
SUCESOS ELEMENTALES.
Es cada uno de los elementos que forman parte del espacio muestral; posibles resultado de un experimento
aleatorio y se simboliza con la letra “E”. También se conoce como punto muestral o suceso aleatorio. Un
suceso elemental es un suceso unitario y constituyen un subconjunto del espacio muestral. Por ejemplo, en el
lanzamiento de una moneda, los puntos muestrales son E1 = cara y E 2 = sello. Cada uno de ellos es un suceso o
caso posible. Otro ejemplo sería el lanzar un dado, un suceso elemental sería obtener 5, otro suceso sería que
saliera par y otro obtener un múltiplo de 3.
SUCESO IMPOSIBLE.
Es el que no se verifica nunca por no tener ningún elemento. Se representa por . Ejemplo, al lanzar un dado
obtener una puntuación igual a 7.
Ejemplo. Consideremos el espacio muestral asociado al lanzamiento del dado, S = (1, 2, 3, 4, 5, 6), y los
siguientes sucesos A: "salir número impar" = (1, 3, 5), Ā: "salir número par" = (2, 4, 6). Los sucesos A y Ā son
complementarios, ya que si se realiza A no se realiza Ā y si se realiza Ā no se realiza A.
14
SUCESO COMPUESTO. Es una combinación de eventos elementales que se forman a partir de dos o más
eventos simples, tomando en cuenta las operaciones entre conjuntos.
Ejemplo: Experimento que consiste en arrojar un dado.
Espacio Muestral S = {1, 2, 3, 4, 5, 6}
Sucesos o eventos simples: E1 = {1}, E2 = {2}, E3 = {3}, E4 = {4}, E5 = {5}, E6 = {6}
Sucesos o eventos compuestos: E1 = {1, 3, 5}, E2 = {2, 4, 6}
Ejemplo:
Sea el experimento lanzar un dado y observar el número que sale en la cara superior, es decir,
E = 1, 2, 3, 4, 5, 6
Algunos sucesos simples de E, serían: A = Sale un número par = 2, 4, 6
B = Sale un número impar = 1, 3, 5
C = Sale un número menor que cinco = 1, 2, 3, 4
Definamos algunos sucesos compuestos;
1.- B C = Sale un número impar o un número menor que cinco B C = 1, 3, 5, 2, 4
2.- A C = Sale un número par o un número menor que cinco A C = 2, 4, 6, 1, 3
3.- A = No sale un número par A = 1, 3, 5
Ejemplo:
Sean 4 elementos a, b, c, d y seleccionemos 2 al azar. Si el muestreo se hace con remplazo el número de
maneras diferentes de seleccionar 2 elementos es 4 2 = 16, los cuales serían
(a,a), (a,b), (a,c), (a,d), (b,a), (b,b), (b,c), (b,d), (c,a), (c,b), (c,c), (c,d), (d,a), (d,b), (d,c), (d,d)
Cada resultado indica cuales elementos fueron seleccionados y en qué orden.
Ejercicio:
Sea un juego de barajas de 52 cartas (26 rojas y 26 negras, de ellas 13 son picas , 13 corazones ,
13 tréboles y 13 diamantes ). Si extraemos dos cartas del juego de baraja y el muestreo se hace con
reemplazo. ¿Cuál es la probabilidad de que la primera carta extraída sea negra y cuál la probabilidad de que la
segunda carta extraída también lo sea?
Solución: Como se trata de un experimento con reemplazo, la probabilidad de que la primera carta sea negra es 26/52 y
la probabilidad de que la segunda carta extraída también sea negra continua siendo 26/52.
15
SELECCIÓN SIN REEMPLAZO.
Si tenemos n elementos y seleccionamos r al azar procedemos de la siguiente forma: escogemos al azar un
elemento, anotamos su identificación y lo separamos de los demás y luego seleccionamos un segundo elemento
al azar, entre los (n – 1) elementos restantes y así sucesivamente hasta obtener los r elementos, Así el número de
n
maneras diferentes de seleccionar los r elementos será:
r
Ejemplo:
Sean 4 elementos a, b, c, d y seleccionemos 2 al azar. Si el muestreo es hecho sin reemplazo el número de
maneras diferentes de seleccionar 2 elementos es
4 4!
6 los cuales serían (a,b), (a,c), (a,d), (b,c), (b,d), (c,d)
2
2 ! 4 2!
Ejemplos:
1) En el lanzamiento de una moneda. La probabilidad de obtener una cara y un sello simultáneamente es
imposible, es decir, si A = sale cara y B = sale sello, entonces A B = . Por lo que A y B son
mutuamente excluyentes. Mientras que si en el experimento lanzar dos monedas simultáneamente definimos los
sucesos A = sale cara = CC, CS, SC y B = sale sello = CS, SC, SS e intersectemos A y B, resultaría
A B ≠ . Lo que significa que A y B no son mutuamente excluyentes. Como puedes ver se puede obtener
cara y sello al mismo tiempo al lanzar dos monedas.
2) En una caja hay 3 bolas rojas, 4 negras y 3 verdes. En cada ensayo se saca una bola y se devuelve a la caja.
Calcular la probabilidad de extraer: a) una bola roja o negra, b) rojas o verde.
Solución.
Procedimiento:
a. Se calculan las probabilidades de cada evento:
fr 3 fn 4 fv 3
P rojas = P negras = P verdes =
n 10 n 10 n 10
3 4 7
b. La probabilidad de extraer una bola roja o negra es: Proja ó negra = Proja + Pnegra 0,7
10 10 10
3 3 6
c. La probabilidad de extraer una bola roja o verde es: Proja ó verde = Proja + Pverde 0,6
10 10 10
16
3) De un grupo de profesionales recién graduados 125 son licenciados en Educación, 120 en Relaciones
Industriales, 80 en Bioanálisis y 75 en Economía. Si se elige una persona al azar de este grupo, ¿qué
probabilidad existe de que la persona elegida, sea graduado en Educación ó Bioanálisis?
Solución.
Procedimiento:
a. Se calcula, por separado, la probabilidad de que la persona elegida sea o Licenciado en Educación o
Bioanalista.
f L.E = 125; f R.I = 120; f Bioan = 80; f EC = 75
n = 125 + 120 + 80 + 75 = 400
f LE 125 80
P L.E = ; P L. Bioanalista =
n 400 400
b. Como los eventos son mutuamente excluyentes (no existe para este ejemplo ninguna persona graduada en
ambas profesiones), se aplica la fórmula respectiva.
125 80 205
P L.E ó Bioanalista = 0,5125
400 400 400
c. Interpretación: Si del grupo de recién graduados se selecciona una persona al azar, existe una probabilidad
de 0,5125 de que la persona seleccionada sea licenciado en Educación o Bioanálisis.
4) De unas barajas compuestas por 52 cartas, se extrae aleatoriamente una carta. ¿Cuál es la probabilidad de
que la carta extraída sea un as o un rey?
Solución.
Procedimiento:
a. La extracción de un as es el evento E 1
b. La extracción de un rey es el evento E2
c. Los eventos son mutuamente excluyentes, ya que no existen puntos muestrales comunes, es decir, no
existe as de rey.
d. En un juego de 52 cartas, existen 4 ases y 4 reyes.
e. Se calcula la probabilidad de cada evento por separado
4 1
P E1 = P as =
52 13
4 1
P E2 = P rey =
52 13
1 1 2
P E1 ó E2 =
13 13 13
g. Interpretación: En un juego de barajas de 52 cartas, al extraer una baraja al azar, existe la probabilidad de
que de 13 extracciones en 2 ocasiones sea un as o un rey.
17
SUCESO COMPATIBLE (Solapados o no mutuamente excluyentes).
Dos eventos E1 y E2, son compatibles si tienen puntos muestrales comunes. Los puntos muestrales comunes a
E1 y E 2, forman un subconjunto llamado Intersección de E1 y E2, y se representa por E1 E2.
S E1 E2
E1 E2
E1 E2 E3
E3
E1 E 3 E2 E3
Ejemplos
1. De un juego de 52 barajas, se extrae una carta al azar ¿Cuál es la probabilidad de extraer un as o una espada
(pica ) o ambas cosas, en una sola extracción?
Solución.
Procedimiento:
a. Los dos eventos son:
E1: Extracción de un as (existen 4)
E2: Extracción de una espada (existen 13)
d. Se halla la probabilidad de que el estudiante elegido sea de segundo año y a la vez hembra:
P E2 H = P E2 . P H
12 17 68
0,13
39 39 507
e. Se sustituye en la fórmula para eventos solapados: P E2 H = P E2 + P H – P E2 H
0,31 0,44 0,13 0,62
f. Interpretación: Si del liceo en referencia se elige un estudiante al azar, existe una probabilidad de 0,62 de que
sea de segundo año y hembra.
Nota: Selección al azar o aleatoria: Es el procedimiento mediante el cual cada uno de los elementos de la
población posee la misma oportunidad de ser elegido o extraído para formar parte de una muestra. La expresión
“seleccionar un elemento al azar de un conjunto E” significa que E es un espacio muestral equiprobable, donde
cada elemento o suceso elemental tiene la misma probabilidad de ser seleccionado o de ocurrir. Por lo que
1
PE ; si E tiene n elementos.
n
Ejemplo: En el experimento lanzar dos monedas simultáneamente, el espacio muestral está definido como
E = CC, CS, SC, SS, veamos algunos sucesos equiprobables:
A = CC y B = CS, ya que P(A) = P(B) = ¼
19
EVENTOS COMPLEMENTARIOS.
Dos eventos E1 y E2, son complementarios si el segundo es un subconjunto que contiene todos los puntos
muestrales del espacio muestral que no están en el primero. Los eventos complementarios son a su vez
mutuamente excluyentes:
E1 E2 = S y E1 E2 =
S
E E'
Ejemplo:
¿Cuál es la probabilidad de que la suma de los números que salgan al lanzar dos dados no sea 6?
Solución.
Procedimiento:
a. Se determina para la prueba aleatoria, la cantidad de puntos muestral. Para ello se multiplica el número de
puntos muestrales de cada dado: 6. 6 = 36.
b. Se halla la probabilidad de los casos favorables, es decir, la probabilidad de que la suma sea 6.
Casos favorables
Dado 1 Dado 2
1 5
2 4
3 3
4 2
5 1
d. Interpretación: Si se lanzan dos dados simultáneamente existe una probabilidad de 31/36 de que la suma de las
caras no sea 6.
20
COMPROBACIÓN DE LOS APRENDIZAJES
Si A y B son dos sucesos no mutuamente excluyentes definidos en S, entonces P(AB) = P(A) + P(B) – P(A B)
Si A y B son dos sucesos cualesquiera definidos en S, entonces P(A B) PA B PA PA B
Ejemplo: Sean A y B eventos con P(A) = 3/8, P(B) = 1/2 y P(AB) = 1/4. Hallar:
a) P(AB) b) P A c) P(A B) d) P(A B) e) P(A B) f) P(B A)
Respuesta:
a) P(AB) = ? Como A B ≠ . A y B son no mutuamente excluyentes. Luego,
3 1 1 3 4 2 5
P(AB) = P(A) + P(B) – P(A B) 0,625
8 2 4 8 8
b) P A = ? 3 83 5
P A 1 PA 1
8
8
0,625
8
5 85 3
c) P(A B) = ? P(A B) P A B 1 PA B 1
8 8
0,375
8
d) P(A B) 1 3
P(A B) P A B 1 PA B 1 0,75
4 4
(*)
Ejercicio: Sean A y B eventos con P(AB) = 3/4, P(A) = 2/3 y P(AB) = 1/4. Hallar:
a) P(A) b) P(B) c) P(A B)
3) Se lanzan dos dados simultáneamente. Determinar la probabilidad de: a) Obtener un uno y un dos.
b) Que la suma de sus resultados de 7. c) Que el producto de sus resultados sea múltiplo de 3.
21
PROBABILIDAD CONDICIONAL.
A menudo sucede que la ocurrencia de un evento depende de la ocurrencia de otro y es de frecuente interés
obtener la probabilidad de un evento, donde dicho evento está condicionado a la ocurrencia de un subconjunto
del espacio muestral (otro evento).
Si los sucesos E1 y E2 pertenecen al mismo espacio muestral S y si PE2 ≠ 0, entonces la probabilidad
condicional de que ocurra el evento E1, dado que el evento E2 haya ocurrido, se llama probabilidad condicional
del evento E1, y se representa por P E1 / E2, que se lee “probabilidad de E1 dado E2” y se determina a través de
la expresión:
P E1 E 2
P E1 / E2 = ; PE2 ≠ 0
P E2
n E1 E 2
También P E1 / E2 =
n E2
n E1 E 2 = Es la cantidad de puntos muestrales de la intersección entre E 1 y E2
n E 2 = Es la cantidad de puntos muestrales del evento E2.
La probabilidad condicional es una probabilidad calculada en un espacio muestral reducido, E 2; pues a partir
de la información se sabe con probabilidad 1 que el evento E2 ya ocurrió. En la práctica se puede resolver este
problema usando la fórmula de la definición, esto es calculando P E1 E2 y P E2 con respecto al espacio
muestral reducido E2, es decir, del evento que condiciona.
El termino probabilidad condicional toma en cuenta la posibilidad de que la probabilidad de E2 pueda
depender del hecho de que el suceso E1 haya o no ocurrido.
Ejemplo 1: Con los datos del ejemplo 2 (página 19), calcular la probabilidad de que una alumna sea
seleccionada dado que la persona seleccionada estudie segundo año en el referido liceo.
Solución.
Procedimiento:
a. H: Es el evento “ser alumna”
b. E2: Es el evento ser estudiante de segundo año
c. Se pide la probabilidad de H dado E2, es decir, P H / E2
d. Se aplica la fórmula para probabilidad condicional.
P H E 2 50 5
P H/E 2
P E 2 120 12
Varones Hembras Total
Primer año E1 100 80 180 n E 1 E 2 50 5
Segundo año E2 70 50 120 P E1 / E2 =
n E2 120 12
Tercer año E 3 50 40 90
Total 220 170 390
e. Interpretación: La probabilidad de que una alumna sea seleccionada dado que sea de segundo año es igual a
5/12.
Ejemplo 2: De la aplicación de una encuesta en una empresa de la Región Central, se sabe que el 40 % de los
obreros son mujeres y que el 20 % de todas las obreras han iniciado estudios medios. ¿Qué probabilidad existe
de que al seleccionar un obrero de forma aleatoria, haya iniciado estudios medios, si se sabe que se seleccionó
una mujer?
22
Solución. (Procedimiento):
a. E1: Es el evento “ser mujer”
b. E2: Es el evento haber iniciado estudios medios
c. La probabilidad de que la persona seleccionada haya iniciado estudios medios dado que es mujer, es:
P E2 E1 = P E2 y E 1 = 20/100 = 1/5
d. La probabilidad de que la persona sea mujer, es: P E1 = P es mujer = 40% = 40/100 = 2/5
e. La probabilidad de que el obrero seleccionado haya iniciado estudios medios dado que es mujer, es:
P E 2 E 1 1 / 5
P E2 / E1 = 0,5
P E 1 2/5
f. Interpretación: La probabilidad de que al seleccionar al azar un obrero que haya iniciado estudios medios dado
que es mujer, es de 0,5.
Ejemplo 3:
Una empresa tiene 300 trabajadores de los cuales 100 son casados y 30 son divorciados. En dicha empresa
trabajan 200 hombres, 85 de los cuales son casados y 95 son solteros. Se toma un trabajador al azar.
a) Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad de que sea mujer?
b) Si el trabajador seleccionado es mujer, ¿cuál es la probabilidad de que sea soltera?
c) ¿Cuál es la probabilidad de que sea mujer o su estado civil sea casado (a)?
Solución. (Procedimiento):
Lo primero es extraer la información que proporciona el problema y ver cómo se puede completar la siguiente.
Partamos del hecho de que la información proporcionada se puede clasificar de acuerdo a dos criterios. El sexo
de los trabajadores y el estado civil de los mismos. El siguiente cuadro muestra la información dada y la
deducida utilizando el concepto de complemento de un evento
Sexo Estado civil Total
Casado (C) Soltero (D) Divorciado (E)
Femenino (A) 15 75 10 100
Masculino (B) 85 95 20 200
Total 100 170 30 300
Como se puede observar se está totalizando tanto por filas como por columnas, es decir, de acuerdo a los dos
criterios de clasificación de la información. A esto se le llama probabilidades marginales y a la información del
interior del cuadro se le llama probabilidad conjunta de los dos eventos (criterios de clasificación). Resolviendo
el problema se tiene:
a) Si el trabajador seleccionado es soltero, ¿cuál es la probabilidad de que sea mujer? En este caso el evento
condicionante es que el trabajador sea soltero y el evento dependiente es que sea mujer
Los problemas de probabilidad de eventos dependientes se pueden resolver de dos maneras: respecto del
espacio muestral original y respecto al espacio muestral restringido del evento que condiciona. Para el primer
caso
P A D 75 / 300 75 75 170
P A / D ; P A D y P D
P D 170 / 300 170 300 300
Para el segundo caso, es decir, respecto al espacio muestral restringido del evento condicionante se tendría que
ver cuántas veces se repite el evento trabajador de sexo femenino y cuántas veces se repite el evento trabajador
soltero. De acuerdo a esto se tiene que:
P A D 75
P A / D Como podemos observar ambos resultados coinciden.
P D 170
23
EVENTOS INDEPENDIENTES (no relacionados).
Dos sucesos o eventos aleatorios E1 y E2, son independientes entre sí cuando la ocurrencia o no ocurrencia de
uno de ellos en una prueba, no afecta la probabilidad del otro en cualquier otra prueba. Es decir, si el suceso A
no depende del suceso B y viceversa, entonces A y B son sucesos independientes o no correlacionados.
En el lanzamiento de una moneda la probabilidad de obtener cara es ½ y la probabilidad de obtener cara en
otra prueba, es también ½. Por lo que, los dos eventos E1 y E2, son independientes.
La fórmula para buscar la probabilidad de que E1 y E2, aparezcan cuando sean independientes es:
n E1 E 2
También P E1 y E 2
n S
P E1 E 2 PE1 PE 2
Motivación de la definición:
Sean E1 y E2, dos sucesos tales que P(E2) > 0, intuitivamente E1 es independiente de E 2 si la probabilidad de E1
condicionada por E2 es igual a la probabilidad de E1. Es decir si:
P E1 / E 2 PE1
P E1 E 2
Nótese que de la propia definición de probabilidad condicional P E1 / E 2
P E 2
Y dado que P E1 / E2 = PE1 deducimos trivialmente que P E1 E2 = P E1 P E2
Ejemplo.
Se lanzan dos dados simultáneamente. Uno verde y otro rojo. ¿Cuál es la probabilidad de que V 4 y R 2?
Solución. (Procedimiento)
a. Se construye el espacio muestral (en un diagrama cartesiano), señalando los puntos muestrales para cada dado
24
Dado (V) b. Para el dado rojo existen 12 puntos muestrales,
E2 = R 2 que resultan de la combinación de los puntos 1 y 2
6 º º º º º º con los puntos 1, 2, 3, 4, 5 y 6 del dado verde.
g. Interpretación: Si se lanzan dos dados simultáneamente, uno rojo y otro verde, la probabilidad de que el verde
muestra una cara con números mayores o iguales a 4 y que el rojo muestra una cara con números menores o
iguales a dos es de 1/6.
Propiedades:
La independencia de sucesos es algo muy importante para la estadística y es condición necesaria en multitud
de teoremas. Por ejemplo, una de las primeras propiedades que se derivan de la definición de sucesos
independientes es que si dos sucesos son independientes entre sí, la probabilidad de la intersección es igual al
producto de las probabilidades.
Ejercicios:
1.- Sea el experimento lanzar un dado dos veces y anotar el número que sale en el mismo orden de
lanzamiento. Determinemos la probabilidad de que en el primer lanzamiento sale un número impar y en el
segundo sale un 5 ó un 6.
2.- Un impulso eléctrico debe pasar del punto I al punto II para producir una señal. Para llegar al punto II debe
pasar por dos componentes electrónicos E1 y E2. La trayectoria del impulso se interrumpe si falla cualquiera de
los dos componentes. La probabilidad de que el componente E1 no falle es 0,7 y la probabilidad de que el
componente E2 no falle es de 0,8. Además, la probabilidad de que al menos uno no falle es de 0,94. ¿Cuál es la
probabilidad de que la señal se produzca?
3- Para designar al asistente de curso de la sección CP401 de estadística II, se presentaron cuatro candidatos:
Luisa, María, Carlos y Edgar. Se decidió que se haría la primera votación entre los estudiantes postulados y
quien ganara sería el principal. Luego se haría una nueva votación entre los tres postulados que quedaran y el
mayor votado sería el suplente.
a) Si se sabe que el asistente principal electo fue Carlos, ¿cuál es la probabilidad de que María sea la
suplente?
b) Si se sabe que el suplente fue una mujer, ¿cuál es la probabilidad de que el asistente sea una mujer
también?
25
EVENTOS DEPENDIENTES (o relacionados).
Dos o más eventos son dependientes cuando el conocimiento de la verificación de uno de ellos altera la
probabilidad de verificación del o de los otros. La fórmula para calcular la probabilidad de eventos dependientes
es, si los eventos son E1 y E2:
PE1 E2 = PE1 . PE2 / E1 ó PE2 E1 = PE2 . PE1 / E2
(Regla de la multiplicación sin reemplazamiento)
Los eventos mutuamente excluyentes deben ser dependientes.
Ejemplo 1: Si voy para la marcha no puedo asistir a clase. Como observarás estos sucesos están relacionados,
son dependientes, ya que ir a la marcha (ocurrencia del suceso) afecta la ocurrencia del suceso “asistir a clases”
puesto que la ausencia a clase depende de que vaya para la marcha.
Ejemplo 2: Una caja contiene 5 bolas blancas y 3 negras. Se hace una primera extracción y sale una bola
blanca. ¿Cuál es la probabilidad de que en una segunda extracción sin reemplazo salga una bola blanca?
Solución.
Procedimiento:
a. E1: Es el evento primera extracción de una bola blanca.
b. E2: Es el evento segunda extracción de una bola blanca.
c. Se calcula la probabilidad de extraer una bola blanca
5 5
P E1 = P B. blanca
53 8
d. Se halla la probabilidad de sacar una bola blanca en una segunda extracción dado que en la primera extracción
salió blanca y no hubo remplazamiento. P E2 / E1= 4/7
B B B B B B B B B
N N N N N N
f. Interpretación: 5/14 es la probabilidad de sacar en una segunda extracción sin remplazo una bola blanca si en
la primera extracción salió una blanca.
Ejemplo 3: En un juego de barajas españolas (40) cartas), seleccionamos dos cartas al azar y determinamos la
probabilidad de que la primera carta tenga una figura de espada y la segunda carta no tenga una figura de espada.
Solución.
Procedimiento:
Sean los sucesos
A = la primera carta tenga una figura de espada
B = la segunda carta no tenga una figura de espada
Luego,
PA y B = PA B = PA . PB / A
10 30
0,1923
40 39
26
REGLAS DE LA PROBABILIDAD.
REGLA DE LA ADICIÓN.
Regla de la adición para sucesos no mutuamente excluyentes.
La regla de la adición expresa que la probabilidad de que ocurra el suceso A o B o ambos, es igual a la
probabilidad de A más la probabilidad de B menos la probabilidad de que ocurran ambos.
Ejemplo: Se lanza un dado no cargado. Usted gana 100 Bs si el resultado es menor que 5 o divisible por 2.
¿Cuál es la probabilidad de ganar?
Solución.
Procedimiento:
- Definamos el espacio muestral S = 1, 2, 3, 4, 5 6
Los sucesos definidos son los siguientes
- A = resultado es menor que 5 A = 1, 2, 3, 4 P(A) = 4/6 (1)
- B = resultado es divisible por 2 B = 2, 4, 6 P(B) = 3/6 (2)
A B = resultado es menor que 5 o resultado es divisible por 2
Luego, PA B = PA + PB – PA B (3)
- A B = resultado es menor que 5 y resultado es divisible por 2
A y B son no mutuamente excluyentes, es decir, A B ≠
- A B = 2, 4 P(A B) = 2/6 (4)
Sustituyendo (1), (2) y (4) en (3), tenemos:
4 3 2 43 2 5
- PA B 0,8333
6 6 6 6 6
Ejemplo: Si se extrae una carta de un juego de baraja española (40 cartas). ¿Cuál es la probabilidad de que la
carta sea un as o un seis de basto?
Solución.
Procedimiento:
- Sea el espacio muestral S = C1, C2, … , C40
Los sucesos definidos son los siguientes:
- A = extraer un as = 1, 2, 3, 4 P(A) = 4/40
- B = extraer un seis de basto = 1 P(B) = 1/40
A B = extraer un as o un seis de basto
Luego, PA B = PA + PB – PA B; pero A B =
Nótese que al extraer una carta del juego de baraja, esta no puede ser simultáneamente un as y un seis de basto PA B = P = 0
Por lo tanto, PA B = PA + PB
4 1 5
0,125 ó 12,5%
40 40 40
27
REGLA DE LA MULTIPLICACIÓN.
La regla de la multiplicación expresa que la probabilidad de que ocurran A y B es igual a la probabilidad de A,
multiplicada por la probabilidad de que ocurra B, dado que A ha ocurrido.
Simbólicamente:
PA y B = PA B = PA . PB/A
Demostración:
Partiendo de la definición de probabilidad condicional (página 21)
P A B
PB A multiplicando ambos miembros por PA, resulta P A B PA PB A
PA
Nota: Si los sucesos A y B son independientes, la probabilidad PB/A es igual a la probabilidad incondicional de B, es decir,
PB/A = PB. Este es el caso de la regla de la multiplicación con restitución: PA B = PA . PB regla de la multiplicación
Ejemplo: Se lanzan dos dados una sola vez. ¿Cuál es la probabilidad de que la suma sea un número par y que
aparezca seis (6) en al menos uno de los dados?
Solución.
Procedimiento:
- Determinemos su espacio muestral S 1;1 1;2 1;3 1;4 1;5 1;6
2;1 2;2 2;3 3;4 2;5 2;6
- Los sucesos definidos son 3;1 3;2 3;3 3;4 3;5 3;6
A = que la suma sea un número par 4;1 4;2 4;3 4;4 4;5 4;6
B = que aparezca un seis en al menos uno de los dados 5;1 5;2 5;3 5;4 5;5 5;6
6;1 6;2 6;3 6;4 6;5 6;6
- A B = que la suma sea un número par y
que aparezca un seis en al menos uno de los dados
Aplicando la regla de la multiplicación
- PA B = PA . PB/A determinemos las probabilidades de cada suceso.
- PA = 18/36; puesto que de un total de 36 resultados 18 dan como suma un número par
- PB/A = 5/18; probabilidad de que aparezca un 6 en al menos un dado, siempre que la suma sea par
- PB = 11/36; puesto que 11 de los 36 resultados contiene un 6 en por lo memos uno de los dados
Como puedes observar PB/A ≠ PB por lo que A y B son dependientes. (Ver nota en esta misma página)
5
También PB A = PB . PA / B pero PA / B que es la probabilidad de que la suma sea un
11
número par, si sabemos que el 6 aparece en al menos uno de los dados. Luego, sustituyendo
11 5 5
PB A . 0,14
36 11 36
28
COMPROBACIÓN DE LOS APRENDIZAJES
COMPROBACIÓN DE INDEPENDENCIA.
Dos eventos A y B son independientes si y sólo si P(AB) = P(A) P(B) o P(B/A) = P(B).
De lo contrario se dice que son dependientes.
Ejercicio 1:
Lance dos monedas y observe el resultado. Defina estos eventos:
A = cara en la primera moneda; B = cruz en la segunda moneda
¿Son independientes los eventos A y B?
Ejercicio 2:
Se lanzan dos dados, uno verde y otro rojo, y se observan los números orientados hacia arriba.
Decida cuales de los siguientes pares de sucesos son independientes. Razone su respuesta.
A = la suma es 5 y B = ambos dados muestran el mismo número
A = la suma es 7 y B = el dado rojo es par
A = la suma es par y B = el dado rojo es par
A = la suma es impar y B = la suma es 12
A = la suma es 4 y B = ambos dados muestran el mismo número
A = la suma es 6 y B = el dado rojo es par
Ejercicio 3: Use las relaciones anteriores para hallar las probabilidades en la siguiente tabla.
P(A) P(B) Condiciones para los eventos A y B P(AB) P(AB) P(A/B)
0,3 0,4 Mutuamente excluyentes
0,3 0,4 Independientes
0,1 0,5 0,1
0,2 0,5 0
29
TEOREMA DE PROBABILIDAD TOTAL o Teorema de Eliminación.
Existen situaciones en que nos interesa conocer la probabilidad de un evento final que sea dependiente de la
aparición o no aparición de eventos en las etapas intermedias de un experimento. Estos casos se resuelven
mediante el Teorema de la Probabilidad Total.
Sea A1, A2, … , An, una partición del espacio muestral. An son los n eventos mutuamente excluyentes, su
unión es el espacio muestral, cada uno con probabilidades positiva. La fórmula para calcular la probabilidad de
un evento E cualquiera del que se conocen las probabilidades condicionales P(E/Ai), llamada probabilidad total
y que debe aparecer con cada uno de esos eventos mutuamente excluyentes, es:
n
P(E) = P(A1) . P(E/A1) + P(A2) . P(E/A2) + … + P(An) . P(E/An) equivalente a PE PAi P E/Ai
i 1
5 3 8 4
PR V PR PV
14 14 14 7
2da consideración
Supongamos ahora que A y B son sucesos de un experimento aleatorio y definamos el suceso B/A.
B/A = B si previamente ha ocurrido A. (Probabilidad condicional).
PB A
Sabemos que el suceso A ocurrió, pero qué pasa con la probabilidad del suceso B: PB/A
PA
Ejemplo: Consideremos el experimento aleatorio de lanzar un dado al aire, cuyo espacio muestral es
S = 1, 2, 3, 4, 5, 6. Sean los sucesos A = obtener un 4 y B = obtener un número par.
Calculemos la probabilidad de A si previamente ha ocurrido B de dos formas
PA B 1 6 1
También podemos valernos de la fórmula anterior PA/B
PB 36 3
30
A esta altura de nuestro desarrollo, ya estamos en condición de deducir el teorema de la Probabilidad Total
Supongamos, como ya dijimos que A1 , A 2 , … , An, son los n eventos mutuamente excluyentes de un
experimento aleatorio y constituyen una partición del espacio muestral S.
PE Ai
Nótese que PE/Ai PE Ai PAi PE/Ai Válido para cualquier Ai, con i desde 1 hasta n.
PAi
Si sustituimos PE A i PAi PE/A i por cada uno de los sumandos en P(E), tendremos
Ejemplo 1: En un aula de dibujo hay 40 sillas, 30 con respaldo y 10 sin respaldo. Entre las sillas sin respaldo
hay 3 nuevas y entre las sillas con respaldo hay 7 nuevas. Elegida al azar una silla, ¿cuál es la probabilidad de
que esta sea nueva?
Solución:
3 7
7
N/R P NR 0,175
30 4 30
3
30
R
PN PN/R P N/R 0,175 0,075 0,25
4
40 3
N/ R
P NR
1 3
4 10
0,075
sillas 10
1 R
4 10
Ejemplo 2: En un club deportivo, el 52% de los socios son hombres. Entre los socios el 35% de los hombres
practican la natación, así como el 60% de las mujeres. Si elegimos un socio al azar:
a) ¿Cuál es la probabilidad de que practique la natación?
b) Sabiendo que practica la natación, ¿cuál es la probabilidad de que sea una mujer?
31
Solución:
Sabemos que la Probabilidad de que sea hombre: PH 0,52
Probabilidad de que sea mujer: P H 1 0,52 0,48
Probabilidad de que nade dado que es hombre: PN/H 0,35
Probabilidad de que nade dado que es mujer: P N/ H 0,60
Aplicamos el teorema de la probabilidad total: Probabilidad de que nade PN PN H P N H (1)
Sustituyendo en (1) Probabilidad de que nade PN PH PN/H PH P N/ H
b) Sabiendo que practica la natación, ¿cuál es la probabilidad de que sea una mujer?
Ejemplo 3: Se lanza un dado una sola vez. Si aparece un 1, se selecciona una tarjeta de la caja 1. Si aparece un
3 ó un 5, se selecciona una tarjeta de la caja II y si sale un número par, se selecciona una tarjeta de la caja III.
¿Cuál es la probabilidad de seleccionar al azar 2 tarjetas verdes, sin remplazo?
Caja I Caja II
1 2 3 4 5 6
Caja III
Caja III: H3
B
V V V V V V
R R R
32
Solución.
Procedimiento:
1. El diagrama correspondiente a la intersección del evento (aparición de 2 tarjetas verdes, sin remplazo) con
cada caja es el siguiente:
H1
H1 E
I H2 E H2
H3 E II
H3 III
2. El evento E (las dos tarjetas seleccionadas sean verdes), aparece con cada uno de los eventos H 1, H2 y H3, es
decir: H1 E, H2 E, H3 E.
3. Se calcula la probabilidad de aparición del evento E, con cada uno de los eventos H 1, H2 y H3.
4. La probabilidad de seleccionar la caja I ((H 1), es la probabilidad de que aparezca el número 1, al lanzar el
dado: P H1 = 1/6.
5. La probabilidad de seleccionar la caja II ((H2), es la probabilidad de que aparezca un 3 ó un 5, al lanzar el
dado: P H2 = 2/6.
6. La probabilidad de seleccionar la caja III ((H3), es la probabilidad de que aparezca un número par, al lanzar el
dado: P H3 = 3/6.
7. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja I, es:
B B B B B B B B B B
V V V V V
R R R R
3 2 6 1
PE / H1 = P V . P V/V
10 9 90 15
8. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja II, es:
B B B B B B
V V V
R R R R R R R R R R
2 1 2 1
PE / H2 = P V . P V/V
10 9 90 45
33
9. La probabilidad de seleccionar dos tarjetas verdes dado que provengan de la caja III, es:
B B
V V V V V V V V V V V
R R R R R R
6 5 30 1
PE/H3 = P V . P V/V
10 9 90 3
1,5 1 22,5 25 5
P E =
135 135 27
Ejercicios:
1.- En una fábrica de enlatados se producen 5000 envases diarios. La máquina A produce 3.000 de estos envases,
de los que el 2% son defectuosos y la máquina B produce los 2.000 restantes de los que sabe que el 4% son
defectuosos. Determinar la probabilidad de que un envase elegido sea defectuoso.
2.- En un colectivo de inversores bursátiles, el 20% realizan operaciones vía internet. De los inversores que
realizan operaciones vía internet, un 80% consulta Infobolsaweb. De los inversores bursátiles que no realizan
operaciones vía internet sólo el 20% consulta InfoBolsaWeb. ¿Cuál es la probabilidad de que un inversor bursátil
elegido al azar en este colectivo consulte InfoBolsaWeb?
3.- Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada equipo
es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades de
error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía y observa que tiene un
error. Determine la probabilidad de que se ha usado el primer aparato.
34
TEOREMA DE BAYES.
La interpretación más aceptada del teorema de Bayes, es que su estructura permite el cálculo de probabilidades
después de haber sido realizado un experimento (probabilidades a posteriori), basándose en el conocimiento de
la ocurrencia de ciertos eventos que dependan del evento estudiado. Es decir, se parte de probabilidades
conocidas antes de efectuar el experimento (probabilidades a priori), las cuales son afectadas por las
probabilidades propias del experimento (las que aparecen durante la ocurrencia del evento).
PA i E
Partiendo de la probabilidad condicional de Ai dado E, para cualquier i, PA i /E y aplicando en el
PE
numerador la Regla de Multiplicación y en el denominador el Teorema de Probabilidad Total, obtenemos la
ecuación que representa al Teorema de Bayes
PA i PE/Ai
PA i /E n
Los Ai son eventos mutuamente excluyentes, cuya unión es el espacio
muestral y E es el evento definido en ese espacio muestral tal que P E > 0.
PA PE/A
i 1
i i
En términos generales el teorema de Bayes es de enorme relevancia puesto que vincula la probabilidad de A
dado B con la probabilidad de B dado A. Es decir que sabiendo la probabilidad de tener un dolor de cabeza dado
que se tiene gripe, se podría saber -si se tiene algún dato más-, la probabilidad de tener gripe si se tiene un dolor
de cabeza, muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en todas sus
ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de aspectos causales dados los
efectos observados.
Se utiliza cuando dado un evento final, se desea conocer su origen o procedencia. Este teorema es el inverso
del Teorema de Probabilidad Total.
Solución:
La probabilidad de que un envase elegido sea defectuoso.
Llamemos D al suceso seleccionar un envase defectuoso y D al suceso seleccionar un envase no defectuoso.
El diagrama de árbol muestra la situación.
35
3
- Máquina A envase defectuoso P(AD) = P(A) P(D/A) P(AD) = 0,02 0,012
5
2
- Máquina B envase defectuoso P(BD) = P(B) P(D/B) P(BD) = 0,04 0,016
5
- PD PA D PB D PA PD/A PB PD/B 0,012 0,016 0,028
3
D P A/D 0,02 0,012
0,02 5
3 A
5 0,96 D P D P A/D PB/D 0,012 0,016 0,028
5000
envases
2
0,04 D P B/D 0,04 0,016
2 5
5 B
0,98 D
PA D 0,012
Probabilidad de que provenga de la máquina A: PA/D 0,4286
PD 0,028
P B D 0,016
Probabilidad de que provenga de la máquina B: PB/D 0,5714
P D 0,028
Solución:
a) Probabilidad Total: Obtener la probabilidad de que un inversor bursátil elegido al azar en este colectivo
consulte InfoBolsaWeb.
Nombramos los sucesos y hacemos un diagrama
Realiza operaciones vía internet: I P(I) = 0,20
No realiza operaciones vía internet: I P I 0,80
Consulta InfoBolsaWeb: IBW
No consulta InfoBolsaWeb: IBW
36
0,80 IBW PIIBW 0,20 0,80 0,16
I
0,20
0,20 IBW PIBW PIIBW PIIBW 0,16 0,16 0,32
0,20 IBW
P IIBW 0,80 0,20 0,16
0,80
I
0,80 IBW
- No consulta internet y consulta infoBolsaweb P I IBW 0,80 0,20 0,16
- PIBW PI IBW P I IBW 0,16 0,16 0,32
Ejemplo 3: En el departamento de historias clínicas de un hospital, tres empleadas procesan los registros de
los pacientes. La primera procesa el 45% de las historias, la segunda el 35% y las tercera el 20%. Los errores
cometidos por las empleadas son 0,04; 0,06 y 0,02 respectivamente Al seleccionar al azar una historia de las
procesadas en una semana, se descubre que tiene un error. Se quiere saber la probabilidad de que la historia
médica haya sido procesada por cada una de las empleadas.
Solución.
Procedimiento:
1. Se recomienda construir un cuadro con los datos e identificar los eventos
3. La tercera columna del cuadro representa la probabilidad que existe de que cada grupo de empleadas cometa
errores según los resultados conocidos, es decir, P E/H1
4. Para aplicar la fórmula y determinar la probabilidad de que la historia clínica seleccionada provenga de cada
uno de los grupos de empleadas, es necesario calcular
PE Hi, donde
PE H1 = PE/H1.PH1 = 0,04 (0,45) = 0,018
PE H2 = PE/H2.PH2 = 0,06 (0,35) = 0,021
PE H3 = PE/H3.PH3 = 0,02 (0,20) = 0,004
5. Se aplica la fórmula del Teorema de Bayes para cada uno de los grupos de empleadas.
PH i PE/H i
PH i /E donde
PE
6. En el Teorema de Bayes la suma de las probabilidades de pertenecer a un grupo dado es siempre igual a la
unidad
∑PHi/E = 0,4186 + 0,4884 + 0,0930 = 1,000 y esto siempre debe cumplirse.
Solución.
Procedimiento:
1. La probabilidad de que las dos tarjetas verdes provengan de la caja I, es:
1 6 6
PH 1 PE/H 1 6
PH 1 /E 6 90 540 = 0,06
PE 100 100 100
540 540
38
2. La probabilidad de que las dos tarjetas verdes provengan de la caja II, es:
2 1
PH 2 PE/H 2 6 45 2540 4 = 0,04
PH 2 /E
PE 100 270100 100
540
3. La probabilidad de que las dos tarjetas verdes provengan de la caja III, es:
3 1
PH 3 PE/H 3
3 / 18 90 = 0,90
PH 3 /E 6 3
PE 100 100 / 540 100
540
Ejercicios:
1. La probabilidad de que Judith estudie para su examen parcial de estadística es 0,30. Si estudia la probabilidad
de que apruebe el parciales de 0, 75; en tanto que si no estudia la probabilidad es de sólo 0,52.
a) ¿Cuál es la probabilidad de que Judith apruebe su examen parcial de estadística?
b) Dado que Judith aprobó su parcial. ¿Cuál es la probabilidad de que haya estudiado?
2. Una empresa tiene 4 fábricas que producen el mismo artículo. La producción de las fábricas se deposita en el
mismo almacén. En un período determinado, la fábrica A produjo el 20% de los artículos, la B el 40%, la C el
25% y la D el 15%. Los porcentajes de artículos defectuosos en las fábricas fueron 1%, 2%, 1,3% y 0,5%
respectivamente. Un artículo fue tomado al azar del almacén y resultó defectuoso. ¿Cuáles son las
probabilidades de que el artículo haya procedido de las fábricas A, B, C o D respectivamente?
3. Una fábrica que produce material para la construcción tiene 3 máquinas, a las que se les denomina A, B y C.
La máquina A produce tabique, la B adoquín y la C losetas. La máquina A produce el 50% de la producción total
de la fábrica, la B el 30% y la C el 20%. Los porcentajes de artículos defectuosos producidos por las máquinas
son, respectivamente, 3%, 4% y 5%. Si se selecciona un artículo al azar y se observa que es defectuoso,
encontrar la probabilidad de que sea un tabique.
4. A un congreso asisten 100 personas, de las cuales 65 son hombres y 35 son mujeres. Se sabe que el 10% de
los hombres y el 6% de las mujeres son especialistas en computación. Si se selecciona al azar a un especialista
en computación ¿Cuál es la probabilidad de que sea mujer?
39
TABLA DE EVENTOS PROBABILÍSTICOS.
Para un suceso E, su ocurrencia f de un total de n casos posibles está dada por: p = P (E) = f/n
La probabilidad de que no ocurra el suceso E, está dada por q = P (no E) = 1 – P (E)
Dos o más sucesos son
mutuamente excluyentes si La probabilidad de ocurrencia de E1 o E2,
SUCESO INCOMPATIBLE es la suma de las probabilidades de cada uno.
la ocurrencia de uno cualquiera
(mutuamente excluyentes).
de ellos imposibilita la ocurrencia
de los otros. P E1 ó E2 = P E1 E2 = P E1 + P E2
40
PROBABILIDAD. Reglas de Cálculo.
Pierre-Simon Laplace afirmó: "Es notable que una ciencia que comenzó con consideraciones sobre juegos de azar
haya llegado a ser el objeto más importante del conocimiento humano".
Los tres métodos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la
distribución binomial.
41
EVENTOS EXCLUYENTES Y EVENTOS INDEPENDIENTES.
Giovanni Sanabria y Kyriakos Petakos.
INTRODUCCIÓN: El presente trabajo constituye una propuesta didáctica cuyo abordaje facilitará al
estudiante universitario diferenciar entre eventos excluyentes e independientes. Dicha propuesta surgen de las
dificultades e inquietudes que presentan los estudiantes sobre el tema. El trabajo expone tres ejercicios,
ordenados según su dificultad, cuya resolución sistemática permitirá a los estudiantes explorar la diferencia entre
las dos clases de eventos. Durante los semestres que se enseña la probabilidad básica, destinada a estudiantes de
matemáticas y otras carreras, se hallan continuamente obstáculos que impiden profundizar la teoría, que
generalmente es fundamental para el desarrollo del pensamiento matemático. Entonces se tiene que afrontar este
problema teniendo presente el concepto de asertividad aceptado por la sociología y la teoría pedagógica
contemporánea:
• Sentirse estimulado a participar en la clase como una manera de conseguir la meta propuesta.
• Conseguir un ambiente social en la clase, que aliente el intercambio de opiniones entre los estudiantes y entre
estos y el profesor en un sentido productivo.
• Conservación y si fuera posible aumento de la autoestima.
El proceso de resolver problemas por medio de la utilización sistemática de etapas en tópicos de probabilidad,
parece imprescindible cuando se tiene que diferenciar entre conceptos fundamentales que habitualmente causan
confusión por parte del estudiante. Se habla de confusión en una ciencia como la matemática, la cual se
construye como una cadena aumentada, concepto tras concepto, manteniendo el equilibrio apropiado. Equilibrio
que implica la existencia de la autoestima estudiantil.
PRESENTACIÓN DEL PLAN DIDÁCTICO: Se proponen algunos ejercicios para internalizar la diferencia
entre eventos mutuamente excluyentes y eventos independientes (en el sentido estocástico). La confusión que se
genera en el aula cuando se presenta el material es una realidad indudable. Frases características por parte de los
estudiantes son las siguientes:
• Sólo el uso de la palabra excluyente significa que el uno no tiene nada que ver con el otro. De esa manera
¿cómo puede haber dependencia?
• Para mí, la representación gráfica de los diagramas de Venn es la respuesta para todo. El uno no corta al otro,
así que no lo influye. En otras palabras la exclusión tiene como consecuencia su independencia.
42
• Lo que me hace distinguir entre los dos conceptos fundamentales es su relación, como lo demuestran las
fórmulas matemáticas correspondientes. De esa manera, mecánicamente me conduzco a la relación apropiada de
calcular las probabilidades que se buscan.
Especialmente el último comentario nos inspiró a escribir este artículo, basado no sólo en la experiencia
cotidiana en el aula, sino también en las discusiones en un sentido platónico, tan popular en los representantes
de las ciencias naturales y de la literatura hispanoamericana, que se elaboraron durante las conferencias
mediterráneas sobre la enseñanza matemática de hoy y el mejoramiento del proceso de aprendizaje.
Usualmente el estudiante, como lo señalan los comentarios, suele buscar una relación de implicación entre
estos dos conceptos. Además, el profesor suele ver estos conceptos en diferentes escenarios, y da explicaciones
como: “por qué te confundes si un concepto es de conjuntos (concepto de excluyentes) y otro es de probabilidad
(concepto de independencia)”.
Explicaciones como las anteriores pueden confundir aún más al estudiante que insiste en hallar el camino
secreto y obscuro que une ambos conceptos. Un mejor camino que puede optar el profesor es, posterior al
estudio de cada concepto, comparar cada uno en un mismo escenario:
Seguidamente se presentan algunos ejemplos especialmente elegidos por enfatizar en los dos conceptos
(eventos excluyentes y eventos independientes) y presentarlos como una cadena desde lo práctico hasta lo más
sofisticado admitiendo así la técnica clásica de resolución de problemas.
Ejercicio 1
Dadas las probabilidades P(A) = 0,45, P(B) = 0,10 y P(A ∩ B) = 0,045 ¿qué conclusión podemos obtener?
Los eventos A, B ¿son independientes? ¿son mutuamente excluyentes?
Solución. Vamos a seguir el tipo de solución paso a paso, en otras palabras dividido en varias etapas
intentando aumentar la atención por parte de los estudiantes y asegurar la comprensión del material diseñado.
Etapa 1. Recordar al estudiante la definición de la independencia como la fórmula siguiente:
P(A ∩ B) = P(A) P(B)
Etapa 2. Verificar sencillamente el resultado aritmético 0,045 = (0,45) (0,10)
Etapa 3. Concluir lo deseado, que son independientes y pasar a la pregunta próxima, siguiendo el pensamiento
de definición observando P(A ∩ B) = 0,045 ≠ 0, así que no son mutuamente excluyentes.
Comentario: Se les puede solicitar a los representantes de dos grupos cooperativos que discutan en sus grupos
lo siguiente:
Para probar que son excluyentes, ¿no tenemos que demostrar que P(A∪B) = P(A) + P(B) ? En la discusión que
se desarrolla dentro del aula se revela una vez más el efecto de las normas y las leyes matemáticas que
habitualmente preceden el material didáctico de los ejercicios. La asertividad que tiene mucho que ver con la
capacidad de resolver problemas parece estar conectada inextricablemente con la presentación de algunas
normas, que atraen tanto al interés del profesor como del estudiante durante el proceso de aprendizaje. La
importancia de la norma de Poincaré: P(A∪B) = P(A) + P(B) − P(A∩B) predomina en la mente de los
estudiantes, haciéndolos olvidar lo obvio y buscar otra manera más complicada de resolver el problema.
43
Ejercicio 2
En este ejercicio introduciremos a nuestros estudiantes en el pensamiento que acompaña la justificación de la
existencia de las fórmulas.
Dado que P(A/B) = 0,2; P(B) = 0,6. Calcular el valor de P(A) para que los eventos A, B sean independientes.
Solución:
Etapa 1. Conceptualizar un poco sobre la interpretación del concepto de independencia. En el caso de que sean
independientes, A no influye en la realización o no de B, así que la condición A/B no tiene sentido, es decir,
P(A/B) = P(A).
Etapa 2. Utilizando la formula de la probabilidad condicional, en cuando a la independencia eventual tenemos
PA B P A P B
P(A/B) PA . Así que el valor de P(B) no se necesita.
PB PB
Etapa 3. Comparar las dos etapas anteriores para lograr una internalización más profunda de lo enseñado. En
esta fase realizamos una discusión sobre si la primera etapa constituye por sí sola una solución formal del
problema. Podemos observar que los grupos asignados, aún convencidos del pensamiento que se incluye en la
primera etapa, aparecen casi igualmente divididos según la existencia de la solución que no incluirá la segunda
etapa. Lo que destaca en el diálogo generado se bosqueja verdaderamente en las siguientes palabras Aunque
aceptamos entre nosotros la infalibilidad de la solución basada en la primera etapa de arriba, ¿podemos estar
seguros que no se considerará un error durante el proceso de evaluación por algún examinador?
Acá se presenta la coordinada práctica de nuestra vida diaria en la enseñanza en cada etapa, el proceso de la
evaluación con la subjetividad que puede involucrar de caso a caso. Se trata de un tema que por sí mismo pueda
ocupar el contenido de varios artículos.
Ejercicio 3
Lanzamos una moneda dos veces y registramos los resultados. Denotamos los siguientes eventos:
A = {que aparezca C en la primera lanzada}
B = {que aparezca C en la secunda lanzada}
C = {que aparezca C solamente una vez}
¿Podemos decir que los eventos A, B, C son mutuamente excluyentes?
Solución
Etapa 1. Registrar los resultados al obtener el espacio muestral, es decir, {CN, NC, NN, CC} usando C por la
cara y N por el sello.
Comentario: Se ha observado durante la corrección de los exámenes parciales que muchos errores ocurren
como consecuencia de la falta de comprensión sobre lo elementos que componen el espacio muestral. Aquí se
demuestra muy bien que aun en un proceso sencillo, como el de conteo, considerado a veces rudimentario, se
adquiere una dimensión nueva para definir un conjunto necesario, cuya cardinalidad forma el denominador de la
probabilidad según Laplace.
Etapa 2. Escribir cada uno de los eventos A, B, C en su forma analítica
A = {CN, CC}, B = {NC, CC}, C = {CN, NC}
Etapa 3. Enfocar en el concepto de la intersección, dando la equivalencia
Intersección vacía = eventos mutuamente excluyentes
Observamos que A∩B = {CC}, B∩C = {NC}, A∩C = {CN} de manera que la conclusión viene
automáticamente.
Etapa 4. (No obligatoria) Contradecir al concepto de los eventos independientes, aunque no se pregunta en
nuestro ejercicio 3. Subrayaremos que en este caso no quedamos solo en la intersección de los eventos, sino que
damos un paso más calculando la probabilidad de esta intersección
1 11
P(A B) PA PB Así que A, B son independientes.
4 22
44
CONJUNTO DE EJERCICIOS PROPUESTOS N° 1.
1. Un estudiante responde al azar a dos preguntas de verdadero y falso. Escriba el espacio muestral de este
experimento aleatorio.
2. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias o
no de consumir un determinado producto.
a) Escriba el espacio muestral asociado a dicho experimento, utilizando la letra “s” para las respuestas
afirmativas y la letra “n” para las negativas.
b) ¿Qué elementos del espacio muestral anterior constituyen el suceso “al menos dos de las personas son
partidarias de consumir el producto?
3. Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Escriba el espacio muestral
de este experimento aleatorio. Y los siguientes sucesos
a) Suceso A = {extraer tres bolas del mismo color}
b) Suceso B = {extraer al menos una bola blanca}
c) Suceso C = {extraer una sola bola negra}
4. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Si se extrae una bola al azar, calcula la probabilidad de:
a) Sea roja. b) Sea verde. c) Sea amarilla. d) No sea roja. e) No sea amarilla.
5. Una caja contiene 2 bolas rojas, 3 negras, 4 azules y 6 blancas. ¿Cuál es la probabilidad de seleccionar:
a) Una bola blanca. b) Una bola azul. c) Una bola roja o negra.
6. ¿Cuál es la probabilidad de extraer al azar una espada o un trébol de una baraja de 52 cartas?
7. Supóngase que se extrae una carta de la baraja de 52 cartas, cuál es la probabilidad de que esta sea:
a) Un rey o un as. b) Una espada o un as. c) Un trébol o un rey.
8. Si se extraen dos barajas simultáneamente del juego de 52 cartas, cuál es la probabilidad de que:
a) Las dos cartas sean espada.
b) Las dos cartas sean trébol.
c) La primera sea un as y la segunda sea espada, suponiendo que la extracción sea sin remplazo.
10. Sea el experimento lanzar un dado dos veces y anotar el número que sale en el mismo orden de los
lanzamientos. Determinar la posibilidad de que en el primer lanzamiento salga un número par y en el
segundo lanzamiento salga un 5 o un 6.
45
CONJUNTO DE EJERCICIOS PROPUESTOS N° 2.
1.- En el experimento que consiste en extraer una carta de una baraja española consideremos el suceso
A = "Salir figura". ¿Cuándo diremos que se ha realizado el suceso A?
2.- Los tipos de grupos sanguíneos humanos son: A, B, AB y O. Además, cada individuo puede tener un factor
Rh– o Rh+. Un técnico laboratorista anota el tipo de sangre de los pacientes. Elabora una lista del espacio
muestral de este experimento.
3.- Se realiza un experimento aleatorio que consiste en la extracción de una carta de una baraja española. Se pide
hallar las siguientes probabilidades
A = Obtener un oro B = Obtener un as
4.- Consideremos el experimento aleatorio que consiste en lanzar dos datos y anotar la suma de los puntos de las
caras superiores. Hallar la probabilidad de los siguientes sucesos.
A = Obtener una suma igual a 8 B = Obtener una suma menor o igual a 4
5.- Sea el experimento E: lanzar una moneda y un dado (en ese orden).
a) Exprese por extensión el espacio muestral.
b) Exprese por extensión los eventos.
A = {Aparece cara y un número par} B = {Aparece un número primo}
C = {Aparece sello y un número impar} D = {A o B ocurren}.
E = {B y C ocurren} F = {Solamente B ocurre}
G = {No ocurre B}
46
8.- En una facultad el 25 % de los estudiantes reprobó matemáticas, el 15 % reprobó estadística y el 10 %
reprobó ambas materias. Se selecciona un estudiante al azar, calcular las probabilidades siguientes:
a) Que haya reprobado al menos una materia b) Que haya reprobado solo matemáticas
c) Que haya aprobado ambas asignaturas d) Que haya aprobado solo estadística.
9.- En una encuesta realizada a 200 personas adultas se les consultó si tenían hijos y si poseían trabajo,
obteniéndose los siguientes resultados:
- 75 personas respondieron que tenían hijos
- 80 respondieron que tenían solamente trabajo.
- 35 respondieron que no poseían trabajo, pero si tenían hijos.
a) Represente la información en un diagrama de Venn.
b) Cuál es la probabilidad que una persona elegida al azar:
b1) Trabaje y tenga hijos. b2) Tenga trabajo. b3) No tenga hijos ni trabaje.
c) Se escogen personas hasta que una responde que tiene hijos o tiene trabajo, eligiendo hasta un máximo
de 5 personas.
c1) Describa el espacio muestral. c2) Calcule la probabilidad de escoger a lo más a tres personas.
10.- Una empresa produce componentes electrónicos. La probabilidad de que un componente se averíe en un
periodo de tiempo dado es 0,01. Su estado (averiado o funcionando) se comprueba con un ensayo que cumple
que, cuando el componente funciona, la probabilidad de que el ensayo diga lo contrario es 0,05, pero si el
componente está averiado el ensayo no se equivoca. Si el ensayo indica que el componente está averiado, ¿Cuál
es la probabilidad de que realmente lo esté?
11.- Se forman signos que consisten de una figura geométrica (circunferencia, cuadrado, triángulo o hexágono),
una letra y una cifra. ¿Cuántos signos de este tipo pueden formarse?
12.- ¿De cuantas formas se pueden escoger dos fichas de domino, de las 28 que hay, de forma que se puedan
aplicar una a la otra (es decir, de modo que se encuentre el mismo número de tantos en ambas fichas)?
13.- El departamento de préstamos de una institución financiera ha efectuado una encuesta entre sus afiliados,
como parte de un estudio para la determinación de prioridades en la asignación de préstamos. Se obtuvieron
2.600 respuestas con los siguientes resultados:
-800 afiliados son casados.
-1.000 afiliados habitan en casa arrendada.
-950 perciben ingresos inferiores a Bs 4.500 mensuales
-200 son casados no habitan en casa arrendada y perciben ingresos superiores a Bs 4.500 mensuales.
-350 son casados y habitan en casa arrendada.
-230 son solteros, habitan en casa arrendada y tienen ingresos inferiores a Bs 4.500 mensuales
-350 son casados y perciben ingresos inferiores a Bs 4.500 mensuales
Se pide determinar:
a) El número de afiliados casados, que habitan en casa arrendada y perciben ingresos inferiores a Bs 4.500.
b) Si se elige un afiliado al azar. Cuál es la probabilidad de que sea casado, viva en casa arrendada y
perciba ingresos inferiores a Bs 4.500 mensuales.
47
PROBABILIDAD.
APLICACIONES.
Dos aplicaciones principales de la teoría de la probabilidad en el día a día son en el análisis de riesgo y en el
comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabilísticos en
regulación ambiental donde se les llama "análisis de vías de dispersión", y a menudo miden el bienestar usando
métodos que son estocásticos por naturaleza, y escogen qué proyectos emprender basándose en análisis estadísticos
de su probable efecto en la población como un conjunto.
No es correcto decir que la estadística está incluida en el propio modelado, ya que típicamente los análisis de riesgo
son para una única vez y por lo tanto requieren más modelos de probabilidad fundamentales, por ej. "la probabilidad
de otro 11-S".
Una ley de números pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas
elecciones, lo que hace de las medidas probabilísticas un tema político. Un buen ejemplo es el efecto de la
probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio que
producen un efecto dominó en la economía en conjunto.
Un cálculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable
seguramente envía los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opinión. Por consiguiente,
las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teoría de
las finanzas conductuales surgió para describir el efecto de este pensamiento de grupo en el precio, en la política, y
en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos
de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna
importancia para la mayoría de los ciudadanos entender cómo se calculan los pronósticos y las probabilidades, y
cómo contribuyen a la reputación y a las decisiones, especialmente en una democracia.
Otra aplicación significativa de la teoría de la probabilidad en el día a día es en la fiabilidad. Muchos bienes de
consumo, como los automóviles y la electrónica de consumo, utilizan la teoría de la fiabilidad en el diseño del
producto para reducir la probabilidad de avería. La probabilidad de avería también está estrechamente relacionada
con la garantía del producto.
Se puede decir que no existe una cosa llamada probabilidad. También se puede decir que la probabilidad es la
medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por
consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en una baraja sea la J de
diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100% ó 0%,
y la elección correcta puede ser hecha con precisión por el que ve la carta. La física moderna proporciona ejemplos
importantes de situaciones determinísticas donde sólo la descripción probabilística es factible debido a información
incompleta y la complejidad de un sistema así como ejemplos de fenómenos realmente aleatorios. En un universo
determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el
caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola
parará será seguro. Naturalmente, esto también supone el conocimiento de la inercia y la fricción de la ruleta, el
peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y así
sucesivamente. Una descripción probabilística puede entonces ser más práctica que la mecánica newtoniana para
analizar el modelo de las salidas de lanzamientos repetidos de la ruleta.
La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a
través de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabilísticas. Hoy
en día no existe un medio mejor para describir la física cuántica si no es a través de la teoría de la probabilidad.
Mucha gente hoy en día confunde el hecho de que la mecánica cuántica se describe a través de distribuciones de
probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabilística
no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisión sus
parámetros fundamentales, lo que imposibilita la creación de un sistema de ecuaciones determinista.
Tomado de: http://es.wikipedia.org/wiki/Probabilidad
Fin de la Unidad I
48
UNIDAD 2:
INTRODUCCIÓN AL MUESTREO
OBJETIVO DE APRENDIZAJE:
Representar las formas de agrupación, categorización y presentación de resultados de datos.
CONTENIDO:
2.1 Terminología: Universo. Población. Población Finita. Población Infinita. Muestra. Muestra Representativa. Muestra
Probabilística. Muestra No Probabilística.
2.2 Métodos de Muestreo: Tipos de muestreo, muestreo aleatorio simple, sistemático, estratificado y conglomerado.
2.3 Distribución Muestral y Estimación: Media Muestral. Función de Distribución y Esperanza Matemática.
INTRODUCCIÓN.
En el proceso de tomar decisiones, tanto en el quehacer diario de las personas como de las empresas, se
requiere disponer de la mayor información posible sobre el tema en cuestión. Generalmente, la información
que se requiere está referida a un universo de unidades de análisis que tiene un tamaño muy grande (N). Si se
desea hacer un relevamiento total, completo y exhaustivo de dicha población (Censo) se ha de insumir mucho
tiempo y recursos en ello. Para resolver estos problemas prácticos surgió la teoría del muestreo, que es un
capítulo de la estadística y de la teoría aplicada de las probabilidades.
Esta teoría trata sobre los fundamentos probabilísticos, las distribuciones estadísticas, los métodos o técnicas
de selección, las fórmulas de cálculo de los errores de muestreo, las fórmulas y tablas de determinación del
tamaño de la muestra, los métodos de estimación de los parámetros poblacionales a partir de los estadísticos
muestrales. Indica, además, los procedimientos o técnicas para extraer una parte o muestra del colectivo o
población que se quiere estudiar, o analizar en ella las características que interesen y del resultado de este
análisis inferir o afirmar algo del universo total.
Así pues, el muestreo estadístico es la herramienta que la matemática utiliza para el estudio de las
características de una población a través de una determinada parte de la misma. La muestra de estudio debe ser
lo más pequeña posible ya que del hecho de que una muestra sea más grande, no se desprende necesariamente
que la información sea más fiable. Además, la muestra elegida debe serlo por un proceso aleatorio para que sea
lo más representativa posible. El muestreo se utiliza con mucha frecuencia en investigaciones de mercados,
medios y opinión, en investigación social, en general, puesto que ofrece algunos importantes beneficios con la
realización de un censo.
UNIVERSO y POBLACIÓN
Una vez definido el problema a investigar, formulados los objetivos y delimitadas las variables se hace
necesario determinar los elementos o individuos con quienes se va a llevar a cabo el estudio o investigación.
Esta consideración nos conduce a delimitar el ámbito de la investigación definiendo una población y
seleccionando la muestra.
El diccionario de la RAE (2001) define la población, en su acepción sociológica, como “Conjunto de los
individuos o cosas sometido a una evaluación estadística mediante muestreo”.
(Latorre, Rincón y Arnal, 2003) la definen como “el conjunto de todos los individuos (objetos, personas,
eventos, etc.) en los que se desea estudiar el fenómeno. Éstos deben reunir las características de lo que es objeto
de estudio”.
49
Los manuales clásicos de epistemología suelen definir la población como el conjunto de todas las medidas o
personas de un cierto tipo, y la hacen sinónima del concepto más antiguo de universo (Jiménez Fernández, 1983;
Sierra Bravo, 1988; Gil Pascual, 2004). Otros autores distinguen entre universo y población (Fox, 1981; Marín
Ibáñez, 1985; Buendía, Colás y Hernández, 1998; Latorre, Rincón y Arnal, 2003). Estos autores consideran que
el investigador casi nunca, o nunca, tiene acceso a todas las posibles medidas, elementos o personas y, por tanto,
utilizan el término universo para designar “esa entidad que lo incluye todo”, reservando el concepto de población
a la parte del universo de la que se selecciona la muestra y sobre la que deseamos hacer inferencia o aplicación
de las generalizaciones que obtengamos de la investigación.
“El término universo designa a todos los posibles sujetos, elementos, individuos, casos o
medidas de un cierto tipo, que manifiestan las características o hecho que nos interesa
observar, medir y conocer y al cual se van a aplicar las conclusiones del estudio. La parte del
universo a la que el investigador tiene acceso se denomina población”. (Fox, 1981).
“Población es un conjunto definido, limitado y accesible del universo que forma el referente
para la elección de la muestra. Es el grupo al que se intenta generalizar los resultados”.
(Buendía, Colás y Hernández, 1998).
Marín Ibáñez (1985) señala las diferencias entre ‘población’ o ‘universo general’ y ‘universo de trabajo’. El
primero hace referencia a toda la población a la que queremos extender las conclusiones de la muestra, mientras
que el universo de trabajo “son los casos que de alguna manera tenemos consignados y de los que podemos
extraer la muestra”. Sierra Bravo (1988) se refiere al universo de trabajo como ‘base de la muestra’. Latorre,
Rincón y Arnal (2003) también distinguen entre población y universo, haciendo sinónimo a este ultimo de
‘colectivo’ o ‘colectivo hipotético’. Paralelamente, Lohr (1999) habla de “población muestreada” para referirse
a la población de la que se extrae la muestra y de “población objetivo”, entendida como la colección completa
de observaciones que deseamos estudiar.
Hoy se prefiere hablar de “unidad de observación” o “elemento” para referirse al objeto sobre el cual se
realiza una medición. En los estudios con poblaciones humanas, con frecuencia ocurre que la unidad de
observación son los individuos.
La definición de la población es una parte importante, y con frecuencia difícil, del estudio. Lohr, (1999)
advierte: “Por ejemplo, en una encuesta política, ¿la población objetivo deberían ser todos los adultos que
pueden votar? ¿Todos los votantes registrados? ¿Todas las personas que votaron en la última elección?”. En
cualquier caso, la elección de esta ‘población objetivo’ afectará profundamente al resultado de la investigación.
Cualquier característica medible de la población se denomina parámetro, los valores de los parámetros
calculados sobre muestras se conocen como estadísticos o estadígrafos, utilizan letras latinas (0, s2, r..., media,
varianza, coeficiente de correlación) y describen a las citadas muestras.
MUESTREO
En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de
una población. Habitualmente, salvo el caso de poblaciones muy pequeñas, el investigador no trabaja con todos
los elementos de la población que estudia, sino sólo con una parte o fracción de ella; unas veces, porque aquella
es muy grande y no es fácil abarcarla en su totalidad, otras veces, porque el proceso permite ahorrar tiempo y
recursos, y a la vez obtener resultados parecidos a los que se alcanzarían si se realizase un estudio de toda la
población. A veces ni siquiera podemos delimitar exactamente una población, otras veces la población total
“aún no existe” como sucede en los estudios sobre predicción. Estos motivos de tiempo, coste, accesibilidad a
los individuos y complejidad de las operaciones de recogida, clasificación y análisis de los datos hacen que la
gran mayoría de los proyectos de investigación no estudien más que una parte representativa de la población,
denominada muestra.
50
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado (que consienta
no solo hacer estimaciones de la población sino estimar también los márgenes de error correspondientes a dichas
estimaciones), este debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de que el
resultado sea una muestra representativa, pero sí podemos actuar de manera que esta condición se alcance con
una probabilidad alta.
La importancia del muestreo radica en que no es necesario trabajar con los ‘N’ elementos de
una población para comprender con un nivel “razonable” de exactitud la naturaleza del
fenómeno estudiado. Este conocimiento se puede obtener a partir de una muestra que se
considere representativa de aquella población.
Muestra estadística
Una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de
casos o individuos de una población estadística. Las muestras se obtienen con la intención de inferir propiedades
de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta
característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede
obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste. Por otra parte,
en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un
menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de
individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para
que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de
la muestra sea idóneo es preciso recurrir a su cálculo.
En el muestreo, se pueden extraer dos o más muestras de la misma población. Al conjunto de muestras que
se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción, sigue la llamada distribución muestral.
Espacio Muestral
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles
muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.
Estimación
Una estimación es cualquier técnica para conocer un valor aproximado de un parámetro referido a la
población, a partir de los estadísticos muestrales calculados desde los elementos de la muestra.
51
Condiciones que ha de cumplir la muestra
Las condiciones fundamentales que ha de cumplir una muestra son, para Sierra Bravo, cuatro:
1. Que comprenda parte del universo y no la totalidad de éste.
2. Que su amplitud sea estadísticamente proporcionada a la magnitud del universo. Esta condición se halla
en relación con el punto práctico de determinación del tamaño de la muestra y sirve para decidir si, según
las unidades que comprende respecto al universo, una muestra es o no admisible.
3. La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna
anomalía, la muestra resultará por este mismo hecho viciada.
4. Que sea representativa o reflejo fiel del universo, de tal modo que reproduzca sus características básicas en
orden a la investigación. Esto quiere decir que si hay sectores diferenciados en la población que se supone
ofrecen características especiales, a efectos de los objetivos de la investigación, la muestra también deberá
comprenderlos y precisamente en la misma proporción, es decir, deberá estar estratificada como el universo.
Para cumplir estas condiciones es necesario aplicar unas determinadas técnicas de selección de la muestra
que garanticen su representatividad, determinar el tamaño óptimo de la muestra y tener en cuenta el ‘error
muestral’.
“... una muestra puede ofrecer resultados más precisos que una encuesta total, aunque esté
afectada del error que resulta de limitar el todo a una parte”. (Sierra Bravo, 1988). Los
inconvenientes más comunes suelen ser: dificultad de utilización de la técnica de muestreo,
una muestra mal seleccionada o sesgada distorsiona los resultados, las limitaciones propias
del tipo de muestreo y tener que extraer una muestra de poblaciones que poseen pocos
individuos con la característica que hay que estudiar.
52
Descripción matemática de una muestra aleatoria
El uso de muestras para deducir fiablemente características de la población requiere que se trate con muestras
aleatorias. Si la muestra estadística considerada no constituye una muestra aleatoria las conclusiones basadas
en dicha muestra no son fiables y en general estarán sesgadas en algún aspecto.
En términos matemáticos, dada una variable aleatoria X con una distribución de probabilidad F, una muestra
aleatoria de tamaño N es un conjunto finito de N variables independientes, con la misma distribución de
probabilidad F.
Otra forma más intuitiva, de entender una muestra es considerar que una muestra es una sucesión
de N experimentos independientes de una misma cantidad. Es importante diferenciar una muestra de tamaño N, o
más exactamente un muestreo de tamaño N, del resultado concreto de los N experimentos (que como conjunto de
valores fijos, en sí mismo, no es una muestra). El concepto de muestra incluye de alguna manera el
procedimiento escogido para obtener los datos (es decir, si las variables aleatorias consideradas son
independientes entre sí, y si tienen la misma distribución).
En general, resulta muy difícil comprobar si una determinada muestra es o no aleatoria, cosa que sólo puede
hacerse considerando otro tipo de muestreos aleatorios robustos que permitan decir si la primera muestra era
aleatoria o no.
Las muestras tienen un fundamento matemático estadístico. Éste consiste en que obtenidos unos
determinados resultados, de una muestra elegida correctamente y en proporción adecuada, se puede hacer la
inferencia o generalización fundada matemáticamente de que dichos resultados son válidos para la población
de la que se ha extraído la muestra, dentro de unos límites de error y probabilidad, que se pueden determinar
estadísticamente en cada caso.
“Aunque la razón esencial por la que se muestrea es la imposibilidad de estudiar todos los
sujetos, es un proceso lógico, porque en la práctica no es necesario obtener datos de todos los
posibles sujetos para comprender con exactitud la naturaleza del fenómeno que se estudia,
sino que, en general, se puede alcanzar esa comprensión con una parte de los sujetos. El
ahorro de tiempo o dinero y la posibilidad de mayor profundidad y exactitud en los
resultados de la realización de la investigación mediante el muestreo sólo es lógico cuando se
puede justificar el hecho de que los datos obtenidos a partir de la muestra proporcionarán una
base firme para determinar con exactitud las características del fenómeno que se estudia”.
(Fox, 1981)
La selección correcta de la muestra implica crear una que represente a la población con la mayor fidelidad
posible. Esto conlleva utilizar unas técnicas específicas de selección de la muestra, así como la necesidad de
determinar su tamaño óptimo. En este proceso de selección hemos de distinguir entre ‘elemento muestral’,
‘unidad de muestreo’ y ‘marco de muestreo’. El elemento o individuo (muestral) es un objeto en el cual se
toman las mediciones, la unidad más pequeña en que podemos descomponer la muestra. La unidad de muestreo
hace referencia a la unidad donde realizamos la muestra, está constituida por grupos excluyentes de elementos de
la población que completan la misma. Por ejemplo, podríamos desear estudiar a un grupo de personas (una
ciudad, una barriada, un grupo de estudiantes de un determinado nivel educativo, los trabajadores de un sector de
producción, etc.), pero no tenemos una lista de todos los individuos que pertenecen a la población. En su lugar
las familias, los centros educativos, las empresas... podrían servir como unidades de muestreo. Las unidades de
observación o elementos muestrales serían los individuos que viven en una familia o que trabajan en una
determinada empresa... La lista de las ‘unidades de muestreo’ (familias, centros educativos, empresas...)
constituyen el ‘marco de muestreo’.
53
Etapas del proceso de muestreo
Fox (1981: 367-369) señala cinco etapas en el proceso de muestreo:
1) Definición o selección del universo o especificación de los posibles sujetos o elementos de un
determinado tipo.
2) Determinación de la población o parte de ella a la que el investigador tiene acceso.
3) Selección de la muestra invitada o conjunto de elementos de la población a los que se pide que participen
en la investigación.
4) Muestra aceptante o parte de la muestra invitada que acepta participar.
5) Muestra productora de datos; la parte que aceptó y que realmente produce datos.
En el esquema que sigue se diagrama la secuencia de pasos para seleccionar una muestra.
UNIDADES
ELEMENTALES LISTAS
PASO 1 PASO 2
UNIDADES DE
MUESTREO DIRECTORIOS
IDENTIFICAR
DEFINIR LA EL MARCO
POBLACIÓN MUESTRAL
COBERTURA GUÍAS
PERÍODO MAPAS
MUESTRAS
PROBABILISTICAS
Aleatorio simple
Aleatorio Sistemático
PASO 3 PASO 4 Estratificado
MUESTRAS Por conglomerados
PROBABILISTICAS
SELECCIONAR ELEGIR EL
EL TIPO DE MÉTODO DE
MUESTREO MUESTREO
MUESTRAS NO
MUESTRAS NO
PROBABILÍSTICAS
PROBABILISTICAS
Coincidencial
Opinático
Por cuotas
Elección razonada
PASO 5
Porcentaje de resultado que se investiga (p = 100 – q)
Coeficiente de confianza (P z)
DETERMINAR Error de muestreo (E %)
EL TAMAÑO DE Error de estimación (e %)
LA MUESTRA Nivel de significación (P )
Intervalo de confianza (± z . E %)
Universos finitos ( N ≤ 100.000) o infinitos (N > 100.000)
54
TIPOS O TÉCNICAS DE MUESTREO
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio, de juicio o no
probabilístico y el muestreo aleatorio que incorpora el azar como recurso en el proceso de selección y cumple
con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la
muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, el muestreo
aleatorio recibe el nombre de muestreo probabilístico o muestreo de selección aleatoria.
Algunos autores exigen que todos los elementos tengan la misma probabilidad de ser
seleccionados. En la práctica real puede haber diversos grados de probabilidad, lo importante
es que la conozcamos. De hecho si de un listado de papeletas con cien personas
seleccionamos uno, éste tiene 1/100 de posibilidad de ser elegido, el segundo 1/99, y así
sucesivamente... Para que esto no hubiera ocurrido tendríamos que haber empleado el
procedimiento de obtención de la muestra con reemplazo, es decir volviendo a colocar los
que salen, para que se mantuviera la proporción del 1/100. Este último caso puede tener
interés en determinadas circunstancias, pero no en el caso de consultar, por ejemplo, varias
veces a un mismo alumno. Lo importante, para Marín Ibáñez (1985) es que conozcamos el
grado de probabilidad y, en lo posible, procurar que sea la misma.
Trata de obviar las dificultades que presentan los anteriores métodos ya que simplifica los procesos y suelen
reducir el error muestral para un tamaño dado de la muestra. A cada uno de estos estratos se le asignaría una
cuota que determinaría el número de miembros del mismo que compondrán la muestra. En ocasiones las
dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).
57
Para la obtención de la muestra estratificada se siguen los siguientes pasos:
a) Se divide la población en grupos considerando categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica a estudiar. Se puede estratificar según la profesión, el
municipio de residencia, el sexo, el estado civil, etc. Por ejemplo, en un estudio de las características
socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen
presentar características diferenciales.
b) Se selecciona una muestra aleatoria de cada estrato con arreglo a algún procedimiento de muestreo,
tratando de que todos los estratos de la población queden representados.
c) El número de individuos de cada estrato se puede decidir por paridad o proporcionalidad; y
d) La suma de las muestras de cada estrato forman la muestra total ’. (Latorre, Rincón y Arnal, 2003)
El método permite utilizar información a priori sobre la estructura de la población en relación con las
variables a estudiar y obtiene representantes de todos los estratos de la población.
El muestreo estratificado tiene interés cuando la característica en cuestión puede estar relacionada con la
variable que queremos estudiar. Cuando se realiza un muestreo, la estratificación se aplica frecuentemente en
relación al tamaño de la muestra.
Se pueden usar diferentes opciones de selección del tamaño de la muestra en los estratos:
-El mismo número en cada estrato. (Muestreo estratificado constante)
-Proporcional (Muestreo estratificado proporcional)
-Optima (Muestreo estratificado óptimo)
Muestreo estratificado constante. En este caso, también conocido como afijación simple, la muestra se
obtiene seleccionando un número igual de individuos de cada estrato en que se ha dividido la población, con
independencia del tamaño y variabilidad de los mismos dentro de la población.
Muestreo estratificado proporcional. En este caso se selecciona de cada estrato un número de elementos
proporcional a su tamaño en el conjunto de la población (afijación proporcional).
Muestreo estratificado óptimo. Jiménez Fernández (1983) considera que un criterio más útil para fijar la
proporción de la muestra es atender a la variabilidad de los estratos en la característica que interesa (afijación
óptima). Para ello es necesario un conocimiento previo de la población.
2do. Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones
de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad.
Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que
contenga también esos mismos porcentajes de hombres y mujeres.
58
3ro. Supongamos que estamos interesados en estudiar el grado de aceptación que la implantación de la
reforma educativa ha tenido entre los padres de un determinado país. A tal efecto seleccionamos una muestra de
600 sujetos. Conocemos por los datos del ministerio que de los 10.000 niños escolarizados en las edades que nos
interesan, 6.000 acuden a colegios públicos, 3.000 a colegios privados subsidiados por el gobierno y 1.000 a
colegios privados no subsidiados por el gobierno. Como estamos interesados en que en nuestra muestra estén
representados todos los tipos de colegio, realizamos un muestreo estratificado empleando como variable de
estratificación el tipo de centro.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso parece
más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño de los estratos. Por
consiguiente, calculamos que proporción supone cada uno de los estratos respecto de la población para poder
reflejarlo en la muestra.
Colegios públicos: 6000/10000 = 0.60
Colegios privados subsidiados por el gobierno: 3000/10000 = 0.30
Colegios privados no subsidiados por el gobierno: 1000/10000 = 0.10
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa proporción por el
tamaño muestral.
Colegios públicos: 0.60 x 600 = 360 sujetos
Colegios privados subsidiados por el gobierno: 0.30 x 600 = 180 sujetos
Colegios privados no subsidiados por el gobierno: 0.10 x 600 = 60 sujetos
Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este
procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos
N1, N2,..., Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La
media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y si2, respectivamente.
59
Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la
población, es decir, que las unidades muestrales son los elementos de la población. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que
llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas".
En el muestreo por conglomerados se divide la población en grupos de acuerdo con su proximidad geográfica
o de otro tipo (conglomerados) que contienen diversos elementos. Cada grupo ha de ser heterogéneo y tener
representados todas las características de la población. Por ejemplo, los conglomerados en un estudio sobre la
situación de las mujeres en una determinada zona rural pueden ser los municipios de la zona. Se seleccionan
aleatoriamente el número de conglomerados y se trabaja con el total de elementos pertenecientes a los
conglomerados elegidos y en ellos se investigan después todos los elementos pertenecientes a los conglomerados
elegidos.
Podríamos hacer una encuesta, por ejemplo, mediante el sistema de muestreo aleatorio simple, a todos los
alumnos de Bachillerato de una determinada ciudad. Las complicaciones y dificultades serían mucho menores
estableciendo una muestra al azar que tomara como unidades base del muestreo las aulas.
La unidad muestral es el conglomerado (cluster) o grupo y el proceso de selección aleatoria se aplica a la
selección de éstos y no a los elementos menores que componen el conglomerado.
Ventaja de esta técnica de muestreo
a) No es necesario identificar ni tener un listado de todos los elementos de la población para seleccionarlos
aleatoriamente, sino que después de seleccionados los conglomerados, se procede a elaborar dicho
listado sólo para los elementos que componen los conglomerados elegidos.
b) Necesitan menos información previa sobre los individuos particulares.
c) Soluciona el problema de los patrones en los datos.
d) Si el número de bloques no es muy grande se puede incurrir en errores de estimación si se han incluido
conglomerados atípicos.
e) Los conglomerados que se realizan teniendo en cuenta proximidad geográfica pueden no tener un
significado importante en la población (no responden a una característica real).
f) Este tipo de muestreo se utiliza fundamentalmente para reducir los costes de toma de muestras al tomar
grupos de individuos completos
Por ejemplo. En una investigación en la que se trata de conocer el grado de satisfacción laboral de los
profesores de institutos privados, necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder
individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que el número de
profesores por instituto es aproximadamente de 35, los pasos a seguir serían los siguientes:
1. Recoger un listado de todos los institutos.
2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20 institutos (700/35 = 20) que nos
proporcionarán los 700 profesores que necesitamos.
Para finalizar con esta exposición de los métodos de muestreo probabilísticos es necesario comentar que ante
lo compleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común
emplear lo que se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas
etapas, empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
60
MUESTREO POR ETAPAS O POLIETÁPICO.
Relacionado con el tipo anterior. Se procede dividiendo la población en varios conglomerados y se selecciona
un número de ellos, que constituyen las unidades muestrales primarias. En una segunda etapa se obtiene una
submuestra a partir de las anteriores, que constituyen las unidades muestrales secundarias, y así sucesivamente.
Se submuestrean las unidades anteriores hasta llegar a la muestra final.
El proceso sigue una secuencia de etapas de selección de unidades muestrales de mayor rango a otras de
menor, hasta llegar a los individuos o elementos que constituyen la muestra: Comunidad Autónoma, distrito
escolar, centros, aulas, alumnos. Este tipo de muestreo sólo necesita conocer los individuos que integran los
conglomerados de la última etapa. En cada etapa puede aplicarse un muestreo aleatorio.
Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas diferencias dentro
del estrato que en toda la población, no hay por qué usar este método de muestreo. En los casos en los que
existan grupos que contengan toda la variabilidad de la población, lo que se construyen son conglomerados, que
ahorran algo del trabajo que supondría analizar toda la población. En resumen, los estratos y los conglomerados
funcionan bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto a la
característica a estudiar y los conglomerados, si representan fielmente a la población, esto es, contienen toda su
variabilidad, o sea, son heterogéneos.
Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población.
Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra
aleatoria más adelante.
61
Es aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra. Se busca
seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por
lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones. En estas
técnicas no se utiliza el muestreo al azar sino que la muestra se obtiene atendiendo al criterio o criterios del
investigador o bien por razones de economía, comodidad, etc. Consecuentemente, estas técnicas no utilizan el
criterio de equiprobabilidad, sino que siguen otros criterios, (la intuición, la documentación histórica o una gran
experiencia de campo) procurando que la muestra obtenida sea lo más representativa posible. Estas muestras, al
no utilizar el muestreo al azar, no tienen la garantía de las muestras probabilísticas, pero en la práctica son a
menudo necesarias e inevitables, en opinión de Kerlinger (1975). Dentro de este tipo de muestreo se suele
distinguir entre muestreo accidental, intencional o deliberado y por cuotas.
El criterio de selección de los individuos depende de la posibilidad de acceder a ellos. Es frecuente utilizar
sujetos que las condiciones nos permiten (muestras que “proporcionan los amigos”). Por ejemplo, entrevistar a la
salida del metro, o a las personas que pasan por una calle.
Desde el punto de vista de la investigación este tipo de muestreo es más débil. No obstante, puede usarse en
estudios exploratorios cuando no se disponen de otras, cuidando mucho el análisis y la interpretación de
resultados.
Este método, que Jiménez Fernández (1983) califica de “deliberado”, se justifica cuando se quieren estudiar
elementos excepcionales de cierta población, ya que la forma de asegurarse de que se incluirán en dicho estudio,
es elegirlos intencionalmente. No dudando de su utilidad, se presta a críticas porque las muestras obtenidas
resultan inevitablemente sesgadas en el sentido del criterio que se ha usado para seleccionarla.
En estas muestras opináticas (Latorre, Rincón y Arnal; 2003), buscamos deliberadamente los elementos de la
muestra porque nos parece que pueden facilitarnos una información más válida. Si queremos datos sobre la
población delincuente será interesante recurrir a los servicios policiales, a los centros penitenciarios o de
rehabilitación social o a los propios reclusos, que no son naturalmente toda la población delincuente. Hay que
convenir con Marín (1985) que no todas las opiniones son igualmente cualificadas, y cuando nos interesa una
información más válida, la experiencia y la preparación pueden inducirnos a seleccionar deliberadamente la
muestra de acuerdo con unas características no aleatorias.
Hay muestras intencionadas que parten de ‘elementos típicos’ o ‘representativos’ a los que ya públicamente
se les ha reconocido tal rango. En España, en las Elecciones Generales se sabe que el escrutinio de apenas ocho
decenas de mesas electorales, ya determinadas, tienen un valor extrapolable al resultado global de las citadas
elecciones. Este tipo de muestras han sido ampliamente divulgado por los medios de comunicación:
62
“En la película Magic Town, el investigador de opinión pública interpretado por James
Stwart, descubrió un pueblo que tenía exactamente las mismas características que todo
Estados Unidos. Grandview poseía exactamente la misma proporción de personas que
votaban por los republicanos, la misma proporción de personas bajo la línea de la pobreza,
igual proporción de mecánicos automotrices, etcétera, que Estados Unidos visto como un
todo. El personaje de Stewart sólo tenía que entrevistar a las personas de Grandview para
saber cuál era la opinión pública en la Unión Americana”. (Lohr, 1999)
Presenta casi siempre sesgos y por tanto debe aplicarse únicamente cuando no existe alternativa. En algunos
casos, especialmente cuando se requiere una estrecha colaboración por parte de los ganaderos o veterinarios de
campo, es la única opción para que el estudio sea viable. Supongamos que queremos realizar un estudio
longitudinal consistente en tomar muestras de los animales de la explotación cada mes, o llevar diariamente unos
registros determinados de la granja, la mejor opción será realizar el estudio en granjas de confianza que permitan
las manipulaciones y tengamos garantías de que el trabajo se llevará a cabo correctamente.
También puede ser útil cuando se pretende realizar una primera prospección de la población o cuando no
existe un marco de la encuesta definido. Este tipo de muestreos puede incluir individuos próximos a la media o
no, pero casi nunca representará la variabilidad de la población, que normalmente quedará subestimada.
63
Otros tipos de muestreo.
Sierra Bravo (1988) presenta otros métodos menos utilizados.
MUESTRAS SUPERPUESTAS
Se seleccionan dos muestras distintas obtenidas de la misma base de la muestra mediante la realización de dos
sorteos o dos sistemas de muestreo distintos. Es un procedimiento muy útil cuando se quiere lograr una valiosa
corroboración o verificación de los resultados obtenidos en una encuesta.
MUESTRAS SUCESIVAS
Cuando interesa conocer la evolución del fenómeno estudiado con el paso del tiempo (estudios de mercado,
electorales...), la solución es repetir la encuesta a nuevas muestras cada cierto período de tiempo.
MUESTRAS COMPUESTAS
Se conoce con este nombre al sistema de muestreo que comprenden dos o más muestras distintas, según las
diferentes partes del fenómeno estudiado. En un estudio que abarque población de hábitats urbanos y rurales, se
podría aplicar un muestreo aleatorio simple para el primero y el de clusters para zonas rurales.
MUESTRAS COMPENSADAS
Esta técnica es aplicable cuando se conoce el valor medio que alcanza una de las características estudiadas en
el universo, por ejemplo, la talla, el peso, etc. Una vez obtenida la muestra, sería poco probable que su media
coincidiera con la de la población. La compensación consiste en sustituir unidades de la muestra por otras nuevas
elegidas también al azar, en el caso de que sus valores acerquen más la media de la muestra a la del universo.
MUESTRAS DE VOLUNTARIOS
En algunas investigaciones el autor se ve obligado a pedir voluntarios que quieran participar en su estudio,
dado que por razones éticas o morales no pueden utilizar ninguno de los demás procedimientos. Estas muestras
presentan ciertos sesgos y suelen presentar determinadas características, como por ejemplo: son sujetos con un
mayor nivel cultural, tienen mejor estatus social, suelen ser más inteligentes, son más sociables, son menos
convencionales, son menos conformistas, etc.
REPRESENTATIVIDAD DE LA MUESTRA
Uno de los problemas fundamentales que se le plantea al investigador en relación con el muestreo consiste en
saber si el grupo elegido es verdaderamente representativo del conjunto; para que lo sea, los rasgos de los
elementos o individuos elegidos para la muestra deben ser similares a los de toda la población (Marín Ibáñez,
1985).
La representatividad es la característica más importante de una muestra. El muestreo adquiere todo su sentido
en cuanto que garantiza que las características que se quieren observar en la población quedan reflejadas
adecuadamente en la muestra. Generalizar a la población a partir de la muestra sólo está justificado si ésta
representa realmente a la población.
64
“Preservar la representatividad es el atributo más importante que debe reunir el muestreo, lo
que nos permitirá generalizar a la población los resultados obtenidos en la muestra”.
(Latorre, Rincón y Arnal, 2003)
Fox (1981) señala que para lograr la representatividad se requiere: 1. Conocer qué características (variables)
están relacionadas con el problema que se estudia; 2. Capacidad para medir esas variables, y 3. Poseer datos de
la población sobre estas características o variables para usarlos como variable de comparación. El mismo autor
señala que si no se cumple alguna de estas condiciones, para algunas de las características, se pierde la capacidad
de buscar deliberadamente la representatividad en cuanto a ella.
La selección aleatoria de la muestra garantiza la ausencia de sesgo en el proceso de selección de la misma,
ayuda a garantizar su representatividad, pero esta circunstancia no es garantía total para que estemos seguros de
que la muestra al azar es representativa de la población de la que se ha extraído. Para Fox (1981) otra forma de
analizar el problema de la representatividad de la muestra consiste en distinguir entre la muestra invitada, la
muestra aceptante y la muestra productora de datos. La primera corresponde al conjunto de individuos
“invitados” del conjunto de la población, la segunda hace referencia al grupo de individuos que aceptan
participar y la muestra productora de datos coincide con la muestra real del estudio.
Si se poseen datos sobre la población se pueden comparar con ellos la muestra invitada y/o la aceptante y,
mediante algún contraste de significación adecuado (por ejemplo chi-cuadrado), determinar si difieren de ella en
las características que interesa en una investigación dada. Si el contraste indica que no hay diferencias
significativas en las variables consideradas, se puede admitir la representatividad de la muestra para las
características en cuestión, pero nada se puede afirmar sobre la representatividad de la muestra respecto de
cualquier otra variable
Si, por el contrario, no se ha logrado representatividad en una o varias variables, el investigador tiene dos
opciones: a) trabajar con la muestra no representativa y contar con ese límite; b) seleccionar más elementos de la
población, con la esperanza de que una muestra mayor sí sea representativa, aunque el estudio tenga una muestra
mayor que la buscada inicialmente.
Para realizar el contraste de representatividad de las muestras respecto de la población, hemos supuesto que
se tienen datos sobre ella. Si no se tuvieran datos de la población, no se puede realizar el contraste de la muestra
invitada y/o aceptante con respecto a la población. Entonces se recurre a contrastar la muestra aceptante con la
invitada. Sobre la muestra productora de datos siempre posee valores el investigador, ya que su referente
comparativo es la muestra aceptante. Un informe sobre los elementos que se negaron a participar, de los que
aceptaron participar pero luego no pudieron y de los que aceptando, en un primer momento, se negaron a hacerlo
al conocer más profundamente la investigación; orientará al investigador y al destinatario de la investigación
sobre la posibilidades de sesgo en esta etapa del muestreo. Una prueba de significación adecuada entre estas dos
muestras (aceptante y final) serviría para ver si difieren significativamente en algunas de las variables básicas o
si, por el contrario, la muestra productora de datos sigue siendo representativa de la muestra aceptante, lo que
demuestra que esa/s característica/s no han sido consideradas para no participar.
Por último, es necesario preguntarse qué pérdida puede tolerarse desde la selección de la muestra inicial hasta
llegar a la que proporcionan los datos. Al mismo tiempo, hay que tener en cuenta que se tiene constancia
probada de que las personas que no responden tienen opiniones o patrones de conducta distintos de las que
responden; y que el porcentaje de la pérdida también depende, para su representatividad, de cómo se distribuyan
las respuestas en la diferentes categorías de la variable. No es igual un 48% de “sí” y un “52% de “no” ante
determinada pregunta que un 16% y un 84% (Jiménez Fernández, 1983). En cualquier caso, no existe una única
respuesta cuantitativa. Se suele considerar que una pérdida del 25% debe preocupar, aún cuando no existan
diferencias estadísticamente significativas; “cuando sea inferior al 50% «se debe leer y escribir con cuidado»; y
cuando la proporción es menor del 40% no se deberían dar a conocer los datos, ni considerarlos como
conclusiones válidas. Son útiles como estudios pilotos, pero no se pueden aceptar sin hacer un estudio posterior
más exhaustivo” (Latorre, Rincón y Arnal, 2003).
65
DISTRIBUCIONES TEÓRICAS DE LA PROBABILIDAD
Variables aleatorias y Función de probabilidad.
En toda la teoría de la probabilidad es muy importante conocer e indagar las características de las
distribuciones de probabilidad para el conjunto de todos los resultados posibles (espacio muestral) de un
experimento aleatorio. Veamos dos conceptos importantes.
Supongamos que se realiza el experimento de lanzar al aire 2 monedas, sabemos que el espacio muestral de
este experimento contiene 4 puntos muestrales:
S = e1 = (CC), e2 = (CS), e3 = (SC), e4 = (SS)
donde el primer elemento de cada par indica si se obtuvo cara (c) o sello (s) en la primera moneda, y el segundo
indica lo mismo pero con respecto a la segunda moneda. La probabilidad de cada moneda es ¼. Ahora bien,
normalmente nosotros no estaremos interesados en los puntos muestrales, sino en alguna magnitud asociada con
los puntos muestrales. Por ejemplo, podríamos estar interesados en el número de caras que hay en cada punto
muestral ei, en tal caso x 1 = 2, x2 = 1, x3 = 1 y x4 = 0. Pues bien, Xi es una variable aleatoria.
Una variable X es una variable aleatoria si es una magnitud susceptible de tomar diversos valores con
determinadas probabilidad.
En el ejemplo, (eliminando el subíndice) x = 0 con probabilidad ¼ , x = 1 con probabilidad ½ , x = 2 con
probabilidad ¼ y escribiremos:
P(X = 0) (Léase probabilidad de que la variable aleatoria X sea igual a cero) = 1/4
Otra definición más precisa de variable aleatoria sería la siguiente: sea S un espacio muestral; sea X una
función real definida en S (es decir, X transforma los puntos muestrales de S en puntos en el eje de las abscisas).
Entonces X se llama variable aleatoria.
e1 = (CC) e3 = (SC)
e2 = (CS) e4 = (SS)
0 1 2 x
66
La variable aleatoria X es discreta o discontinua cuando la cantidad de valores que puede asumir es
contable, sea finita o infinita, es decir, cuando únicamente puede tomar un determinado número de valores
enteros en un intervalo, (valores susceptibles de ser contados). Por ejemplo, la variable aleatoria “número de
caras obtenidas al lanzar 2 monedas”, es una variable aleatoria discreta en el intervalo (0, 2). Sólo puede tomar
los valores 0, 1 y 2. El número de hijos de una familia, también es un ejemplo de variable aleatoria discreta. De
esta forma, al considerar los valores de una variable aleatoria es posible desarrollar una función matemática que
asigne una probabilidad a cada realización x de la variable aleatoria. Esta función recibe el nombre de función
de probabilidad.
Se dice que una variable aleatoria discreta tiene un conjunto definido de valores posibles x1, x2, x3, … , xn con
sus probabilidades respectivas p1, p 2, p3, …, p n. Es decir, solo puede tomar ciertos valores dentro de un campo
de variación dado. Como X ha de tomar uno de los valores de este conjunto, entonces p 1 + p2 + p3 + … + pn = 1
Función de probabilidad.
Los pares ordenados formados por los valores de la variable y sus probabilidades, se conoce como función de
probabilidad o distribución de probabilidades.
Notación. El par Xi, f (xi) denota una función de probabilidad, donde Xi representa los valores que asumirá
la variable y f (xi) representa la probabilidad de que la variable aleatoria X tome el valor x, es decir, que:
f (x) = P (X = x)
Con esa expresión es posible determinar probabilidades mediante igualdades o desigualdades e intervalos,
como por ejemplo P (X < x), P (X x), P (X > x), P (X x), P (x X x).
Cuando la variable aleatoria es discreta, la función de probabilidad toma el nombre de función de probabilidad
masa; si la variable aleatoria es continua toma el nombre de función de densidad. Nosotros no haremos
distinción, y en ambos casos la llamaremos función de densidad.
Sea X una variable aleatoria de un espacio muestral S, a saber, X(S) = x1, x2, x3, … , xn. Convertimos X(S)
en un espacio de probabilidad definiendo la probabilidad de x1 como P(X = x1) que se escribe como f (xi). Esta
función f de X(S), definida como f (xi) = (X = xi) se llama Distribución o Probabilidad de X y se expresa
generalmente en forma de tabla
X1 X2 ... Xn
f (x1) f (x2) … f (xn)
67
Ejemplo 1: Se lanzan tres monedas al aire. Al definir como variable aleatoria X al número de caras obtenidas
en el experimento aleatorio, el espacio muestral tendrá 2 3 = 8 resultados posibles:
S = CCC, CCS, CSS, SSS, SSC, SCC, SCS, CSC
La función de probabilidad o distribución de probabilidad está dada por:
Cuando aparece el punto muestral o evento elemental SSS, su probabilidad es: P (X = 0) = 1/8
Cuando aparecen los eventos elementales CSS, SSC, SCS, su probabilidad es: P (X = 1) = 3/8
Para los eventos elementales CCS, SCC, CSC, su probabilidad es: P (X = 2) = 3/8
Para el evento elemental CCC, su probabilidad es: P (X = 3) = 1/8
Resumiendo en un cuadro
N° de caras Prob. Acum.
X P (Xi) F (x)
0 1/8 1/8 Obsérvese que la suma de las probabilidades para el
1 3/8 4/8 espacio muestral es igual a la unidad, condición que
2 3/8 7/8 debe cumplirse para el evento completo.
3 1/8 8/8
1
Ejemplo 2: Si lanzamos 2 dados bien balanceados, y definimos la variable aleatoria X como la suma de los 2
resultados, los posibles valores de X con sus respectivas probabilidades serán:
f (x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
x 2 3 4 5 6 7 8 9 10 11 12
b) Si Xi es una variable continua f xi 0 i y f X 1
i
Observaciones:
1. Si la probabilidad es un número comprendido entre 0 y +1, es decir, 0 PE 1, entonces 0 F(x) 1.
2. Sean a y b, dos números reales cualesquiera tales que a < b, luego, los sucesos x a y a < X b, serán
mutuamente excluyentes; y su suma será el suceso X b. Al aplicar la regla de la adición, se tiene:
P (X = b) = P (X a) + P (a < X b) por lo tanto P (a < X b) = F(b)
Lo cual implica que F(x) es una función no decreciente en la medida en que el desplazamiento sea de
izquierda a derecha.
68
3. La probabilidad de que la variable aleatoria tome cualquier valor finito es igual a 1.
F Lím F x P X 1
x
De forma análoga resulta: F Lím F x P X 0
x -
Ejemplo
Se lanzan simultáneamente cuatro monedas. ¿Cuál será la distribución de probabilidad para el número de
caras?
Solución:
1. El espacio muestral lo obtenemos mediante un diagrama de árbol; siendo M = Moneda, C = Cara y S = Sello
M1 M2 M3 M4
Espacio muestral Probab.
C CCCC 1/16
C CCCS 1/16
CCSC 1/16
S
CCSS 1/16
C
CSCC 1/16
C CSCS 1/16
S CSSC 1/16
S CSSS 1/16
C SCCC 1/16
C SCCS 1/16
C SCSC 1/16
S SCSS 1/16
S SSCC 1/16
C SSCS 1/16
S SSSC 1/16
S SSSS 1/16
1,00
M1 M2 M3 M4
C
C
S
C
C
S
S
S
C
C
S
S
C
S
S
3. Para conseguir la probabilidad para el número de caras, se cuenta en el diagrama de árbol (espacio muestral),
en cuántos puntos muestrales aparece la C y se divide por el número de puntos muestrales. Por ejemplo, la cara
(C), no aparece en el punto muestral (SSSS), por lo que P (X = 0) = 0, y así sucesivamente.
Para calcular las probabilidades del número de caras en el lanzamiento de las cuatro monedas en forma
simultánea, también se puede usar el Binomio de Newton:
x 4 x
4 1 1
f x P X x
x 2 2
1 4 6 4 1
P x 4 ; P x 3 ; P x 2 ; P x 1 ; Px 0
16 16 16 16 16
La probabilidad de cara es el cociente entre el coeficiente de cada término del desarrollo y el número de puntos
muestrales. (24 = 16 puntos muestrales).
Por ejemplo: El término 4C 3S , significa que existen cuatro puntos muestrales donde la cara (C) aparece tres
4
veces y el sello (S) una vez, entonces P X 3 ; y así sucesivamente.
16
P (X = x)
f (0) = P (X = 0) = 1/16
6/16 f (3) = P (X = 3) = 4/16
f ( 4) = P (X 4) = 1/16
5/16
f ( > 4) = P (X > 4) = 0
4/16
f ( 2) = P (X 2) = 6/16 + 4/16 + 1/16 = 11/16
2 caras 1 cara 0 caras
3/16
f ( 1 X 3) = P (1 X 3) = 4/16 + 6/16 + 4/16 = 14/16
2/16 1 cara 2 caras 3 caras
1/16
X
0 1 2 3 4
70
Ejemplo 2.
Para el caso anterior (lanzamiento de las cuatro monedas). ¿Cuál será la función de distribución acumulada
para el número de caras?
Solución:
1. Una vez conocida la distribución de probabilidad, se levanta otra columna llamada de probabilidad
acumulada: F x P X x
2. Esta columna se obtiene sumando sucesivamente las probabilidades desde X = 0, hasta X = 4. El último
resultado acumulado debe ser igual a 1.
X f (x) = P (X = x) F(x) = P (X x)
4 1/16 16/16 = 1
3 4/16 15/16
2 6/16 11/16
1 4/16 5/16
0 1/16 1/16
1,00
ESPERANZA MATEMÁTICA
Las dos características fundamentales de la distribución de una variable aleatoria, lo mismo que para la
distribución muestral de frecuencias, son su tendencia central y su variabilidad. La esperanza matemática
(también llamada “valor esperado” o “valor promedio”) es una medida de tendencia central de una variable
aleatoria. Tiene su origen en los juegos de azar, debido a que los jugadores deseaban saber cuál era su esperanza
de ganar o perder en un juego determinado. Como a cada resultado particular del juego le corresponde una
probabilidad determinada, esto equivale a una función de probabilidad de una variable aleatoria y el conjunto de
todos los resultados posibles del juego estará representado por la distribución de probabilidad de la variable
aleatoria. La esperanza es uno de los parámetros que describen a una variable aleatoria.
Para calcular la esperanza matemática de una variable aleatoria, se suman los productos de todos los posibles
valores de la variable aleatoria por sus correspondientes probabilidades.
Si X es una variable aleatoria (v.a.) discreta con valores posibles x1, x2, … , xn y sus probabilidades
representadas por la función de probabilidad P(xi), entonces la media, valor esperado, esperanza
matemática o expectativa matemática de una v.a. X, denotada por X E X o simplemente , se
define como la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Y
viene dada por:
n
E(X) = x = x1 f (x1) + x2 f (x2) + x3 f (x3) + .... + xn f ( xn ) = x
i 1
i f ( xi )
Valores de X f(x)
x1 f x1
x2 f x 2
x3 f x 3
xn f x n
71
Lo anterior significa que para calcular E(X) se multiplica cada valor que puede tomar la variable aleatoria por
la probabilidad que le corresponde y después se suman esos productos, cada valor ponderado por su
probabilidad, esto es, E(X), la esperanza de una distribución de probabilidad discreta, es la media aritmética
ponderada (el promedio ponderado) de todos los valores (resultados) posibles de X, en los cuales los pesos son
las probabilidades respectivas de tales resultados.
El valor esperado representa el valor promedio que se espera suceda, al repetir el experimento en forma
independiente una gran cantidad de veces. El valor esperado se interpreta físicamente como el centro de masa o
centro de gravedad de la distribución de probabilidad, por lo que es igual a la media o promedio aritmético. Si
todos los sucesos son de igual probabilidad la esperanza es la media aritmética.
Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y
la función de densidad f (x) sería:
X E X xf x dx o E X XdP
El concepto de esperanza se asocia comúnmente en los juegos de azar al de beneficio medio o beneficio
esperado a largo plazo.
Ejemplo 1.
Se lanza un dado al aire. ¿Cuál es la esperanza matemática con respecto al número de puntos de la cara superior,
si el dado es lanzado varias veces?
Solución:
Procedimiento:
1. Se halla el espacio muestral: S = 1, 2, 3, 4, 5, 6 X 1 2 3 4 5 6
2. Se construye la distribución de probabilidad.
f (x) 1/6 1/6 1/6 1/6 1/6 1/6 1,00
3. Se multiplica la columna X y la columna f (x)
4. Se suman los productos: X . f (x) X . f (x) 1/6 2/6 3/6 4/6 5/6 6/6 21/6
5. se aplica la fórmula de la esperanza matemática
X E X x i f xi 21 / 6 3,5
6. Interpretación: Al lazar un dado varias veces, el promedio de los puntos de la cara superior es
aproximadamente 3,5
Ejemplo 2.
Si se lanzan dos dados legales, y se suman los puntos que aparecen en las caras superiores. Encontrar el valor
esperado.
Solución.
Definamos la variable aleatoria X como la suma de los números que aparecen al lanzar dos dados legales. Como
vimos en el problema anterior, la distribución de probabilidad es: xi f(xi)
xi 2 3 4 5 6 7 8 9 10 11 12
f(xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Solución.
Sea X la variable aleatoria que representa el resultado al lanzar un dado. Su distribución de probabilidad es la
siguiente:
1 2 3 4 5 6
1/6 1/6 1/6 1/6 1/6 1/6
En este caso el valor esperado debe ser igual al valor k, con lo que se espera que el jugador ni gane ni pierda.
Aplicando la fórmula del valor esperado tenemos:
El jugador debe pagar 3,5 bolívares cada vez que participa en el juego. Si la cuota k fuera de 4 bolívares por
juego, la ganancia neta esperada del casino sería de 050 bolívares por juego, ya que k = 4,00 – 3,50 = 0,50
bolívares. Como lo que recibe el jugador en un solo juego no puede ser igual a 3,5 bolívares (debe ser un número
entero entre 1 y 6), entonces la E(X) no necesariamente coincide con el resultado de un solo juego. El significado
de E(X) = 3,5 bolívares, es que si el juego se realiza un gran número de veces, el cociente Ingreso total /
Número de juegos realizados debe ser aproximadamente igual a 3,5 bolívares.
Ejemplo 4.
Consideremos una lotería con mil números. Cada número cuesta 25 centavos y el premio es de 100 pesos.
Calcular cuánto se espera ganar o perder cada vez que se participa en esta lotería.
Solución.
Sea X la variable aleatoria “utilidad que obtiene la persona que participa en la lotería” y los valores que puede
tomar son:
Cuando gana = 99,75 pesos (100 que gana del premio, menos 0,25 del costo del número).
Cuando pierde: – 0,25 pesos (costo del número)
Por su parte, la probabilidad de ganar es 1/1000 y de perder 999/1000.
De acuerdo a los datos anteriores, la distribución de probabilidad es:
X = xi 99,75 – 0,25
f(xi) 1/1000 999/1000
Por lo tanto, el valor esperado es: xi f(xi) = (99,75) (1/1000) + (– 0,25) (999/1000) = – 0,15
Es decir que la persona que participe en la lotería espera perder 15 centavos en cada juego.
73
X f(x) X . f(x)
Donde x 1,5
0 0,1 0
Si K = 2, se tendrá. E (X + K) = E(X) + K = 1,5 + 2 = 3,5
1 0,3 0,3
Comprobación:
2 0,6 1,2
E (X + K) = (0 + 2) (0,1) + (1 + 2) (0,3) + (2 + 2) (0,6)
1,0 1,5 = 0,2 + 0,9 + 2,4 = 3,5
2. Si multiplicamos cada valor de una variable aleatoria X, por una constante K, la esperanza matemática
quedará multiplicada por ese valor:
Comprobación: E (X . K) = (0) (2) (0,1) + (1) (2) (0,3) + (2) (2) (0,6)
3. Cuando una variable aleatoria X se multiplica por una constante a y después se le suma una constante b,
la esperanza matemática quedará multiplicada e incrementada por esa constante.
4. Cuando una variable aleatoria es capaz de asumir solamente un valor K, se denomina variable aleatoria
constante y la esperanza matemática de esa variable aleatoria K: E (K) = K.
VARIANZA
Existen dos aspectos que caracterizan de forma simple el comportamiento de la distribución de probabilidad,
porque proporcionan una descripción completa de la forma en que se comporta: la medida de tendencia central y
las de dispersión. La primera está representada por la media o valor esperado, ya vista en el punto anterior, y la
segunda por la variancia y/o por la desviación estándar, que evalúan la dispersión de la distribución de
probabilidad o grado en que se separan del promedio los valores de la variable aleatoria X.
Por ejemplo, en un espacio muestral equiprobable vemos que los valores 5, 10 y 15 tienen una media igual a
10 y que en los valores 9.9, 10 y 10.1 la media también es 10. Sin embargo, advertimos que los dos conjuntos
de valores difieren notablemente en la dispersión de los valores respecto a su media y que tal dispersión es de
gran importancia. Por lo tanto, para tener un conocimiento claro y completo del comportamiento de los valores
que puede tomar la variable aleatoria, es indispensable conocer tanto la media como la variancia y/o la
desviación estándar de la distribución de probabilidad.
En teoría de probabilidad, la varianza de una variable aleatoria, que suele representarse como σ x2 , también
V(X) o simplemente 2, es una medida de dispersión o variabilidad definida como la esperanza del cuadrado de
la desviación de dicha variable respecto a su media. Es decir, mide la dispersión (mayor o menor concentración)
de los resultados alrededor de la media (esperanza matemática) y se halla calculando las diferencias entre cada
uno de los resultados y su media, luego tales diferencias se elevan al cuadrado y se multiplican por sus
74
respectivas probabilidad, finalmente se suman los resultados. Entre mayor sea la varianza, mayor será la
dispersión entre los valores de la variable aleatoria o viceversa.
Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en
metros, la varianza se expresa en metros al cuadrado.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su
uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso
de otras medidas de dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en 1918.
Las desviaciones (X – ) toman valores: (x1 – ), (x2 – ), … , (xi – ), con probabilidades respectivas:
f(x1), f(x2), . . . , f(xi). Sin embargo, al tomar el valor esperado de estas desviaciones nos encontramos con que:
Esto se debe a que las desviaciones positivas se compensan con las desviaciones negativas. Para determinar
una medida de dispersión, necesitamos considerar únicamente la magnitud de las desviaciones sin sus signos.
Una manera de eliminar el signo de las desviaciones, es considerar el cuadrado de las mismas, es decir, (xi – )2
Formalmente, si a partir de una variable aleatoria X con media μ = E(X) dada, obtenemos el valor
esperado de las desviaciones elevadas al cuadrado, conseguiremos una medida de la dispersión de la
distribución de probabilidad, la cual es conocida como variancia o varianza y se simboliza por
2 ó Var (X) ó V(X).
2
V ( X ) E X .2
E X 2 2 X 2
E X 2 E X
2 2
E X 2
2 2 2
E X μ con E X X
2 2 2 2
f x
x f x , si X es discreta
2
2
i i
2
x f x dx , si X es continua
Si en las fórmulas anteriores desarrollamos el cuadrado del binomio y aplicamos propiedades de las sumatorias
(integrales) se llega a una expresión más conveniente para realizar los cálculos.
2
x i2 f x i 2 , si X es discreta
2
X f X dX 2 , si X es continua
75
Ejemplo 1:
En el lanzamiento de un dado repetidas veces, la esperanza matemática de los diversos números de la cara
superior es, E (X) = 3,5. Se desea conocer el valor de la varianza.
Solución.
Procedimiento:
1. Se halla el espacio muestral. S = 1,2, 3, 4, 5, 6
2. Se consigue la función de probabilidad: (1, 1/6) ; (2, 1/6) ; (3, 1/6) ; (4, 1/6) ; (5 , 1/6) ; (6, 1/6).
3. Se efectúa el producto del cuadrado de X por su correspondiente probabilidad
E(X 2) = X 2 . f (x) = 12 (1/6) + 22 (1/6) + 32 (1/6) + 42 (1/6) + 52 (1/6) + 62 (1/6)
= (1/6) + 4/6 + 9/6 + 16/6 + 25/6 + 36/6) = 91/6
4. Se eleva al cuadrado la esperanza matemática: (x) 2 = (3,5) 2 = 12,25
5. Se sustituye en la fórmula de la varianza: V(X)
V(X) = E(X 2) – (x) 2 = 91/6 – 12,25 = 15,17 – 12,25 = 2,92
Ejemplo 2.
Consideremos la distribución de probabilidad de las ventas semanales de unidades de alta fidelidad de la marca
A, dada en la siguiente tabla:
X = xi 0 1 2 3 4 5
f (x) 0,1 0,1 0,2 0,3 0,2 0,1
Encontrar la varianza y la desviación estándar.
Solución.
Basándonos en la distribución de probabilidad podemos construir la tabla siguiente, en la cual obtenemos todos
los valores que se necesitan para el cálculo.
X = xi 0 1 2 3 4 5 Total
f(x) 0.1 0,1 0,2 0,3 0,2 0,1 1
x f(x) 0 0,1 0,4 0,9 0,8 0,5 2,7
x2 f(x) 0 0,1 0,8 2,7 3,2 2,5 9,3
Podemos observar que: E(X) = xi f (x1) = 2,7 y que E(X2) = x2 f (x) = 9,3
por lo tanto, la variancia es: 2 = V(X) = E(X2) – 2 = 9,3 – (2,7) 2 = 2,01
y la desviación estándar: σ 2,01 1,42
0 para x 1
0,25 para 1 x 3
Ejemplo 3.
Sea la función de distribución acumulada: F x 0,50 para 3 x 5
0,75 para 5 x 7
1,0 para x 7
2 = V(X) = E(X2) – 2 = 21 – 4 2 = 5
PROPIEDADES DE LA VARIANZA
1. Si una variable aleatoria es siempre igual a una constante K, su promedio o esperanza será K y la varianza
será cero: V(X) = E(X 2) – (x) 2 = 0
2 0,3 0,6
2 0,6 1,2
1,0 2
2. Si a una variable aleatoria X, se le suma una constante K, E(X) queda aumentada en K. Sin embargo, la
diferencia X – E(K) permanece igual y, por lo tanto, V(X) no queda afectada por la constante.
Ejemplo:
X f(x) X . f(x)
0 0,1 0 V(X) = 0 2 (0,1) + 1 2 (0,3) + 2 2 (0,6) – (1,5) 2
= 0 + 0,3 + 2,4 – 2,25
1 0,3 0,3
= 2,7 – 2,25 = 0,45 por lo que
2 0,6 1,2 E(X) + K = (1,5) + 2 = 3,5 y V(X + K) = 0,45
1,0 1,5 = E(X)
3. Al multiplicar todos los valores de una variable aleatoria X por un número positivo K, la varianza queda
multiplicada por K.
n
σ V X σ2 x
i 1
2
i f xi μ 2 E X2 μ2
La desviación estándar nos señala el grado de concentración de los valores alrededor del valor esperado o
esperanza matemática. Tiene como valor mínimo 0.
Ejemplo:
Se lanzan un par de dados al aire de manera simultánea. Se le da al jugador en bolívares, la suma de los valores
que aparezcan. Determinar
a) La esperanza matemática
b) La varianza
c) La desviación típica o estándar.
Solución.
Procedimiento:
1. Se determina el espacio muestral. S
S = (1,1) , (1,2) , (1,3) , (1,4) , (1,5) , (1,6) , (2,1) , (2,2) , (2,3) , (2,4) , (2,5) , (2,6)
(3,1) , (3,2) , (3,3) , (3,4) , (3,5) , (3,6) , (4,1) , (4,2) , (4,3) , (4,4) , (4,5) , (4,6)
(5,1) , (5,2) , (5,3) , (5,4) , (5,5) , (5,6) , (6,1) , (6,2) , (6,3) , (6,4) , (6,5) , (6,6)
2. Se construye la distribución de probabilidad, sabiendo que X es la suma de los números que muestren las
caras superiores de los dados y es 2 X 12. Puntos muestrales: 62 = 36
Ejemplo 1.
Se lanza un par de dados corrientes. Obtenemos el espacio finito equiprobable S que consta de las 36 parejas
ordenadas de números entre 1 y 6. Sea X que hace corresponder a cada punto (a, b) de S el máximo de sus
números, es decir X(a, b) = máx (a, b). Entonces X es una variable aleatoria cuyo conjunto está dado por X(S)
= { 1, 2, 3, 4, 5, 6 }
Calculemos la distribución f de X:
Solución:
xi 1 2 3 4 5 6
f xi 1/36 3/36 5/36 7/36 9/36 11/36
X f xi 1/36 6/36 15/36 28/36 45/36 66/36
x i 1 – (161/36) 2 – (161/36) 3 – (161/36) 4 – (161/36) 5 – (161/36) 6 – (161/36)
xi 2 (–125/36)2 (–89/36)2 (–53/36)2 (–17/36)2 (19/36)2 (55/36)2
f x i x i 2 0,334898 0,509323 0,301033 0,04335991 0,0696373 0,713199
x i 2 1 4 9 16 25 36
x i 2 f x i 1/36 12/36 45/36 112/36 225/36 396/36
n
V(X) X i
i 1
2 f ( X i )
79
n
O también:
V ( X ) ( X i ) 2 f ( X i ) 2
i 1
V(X) = [( 1 / 36) +( 12/36 ) +( 45 / 36 ) + 112/ 36 ) + ( 225 / 36 ) +( 396 / 36 )] –(161/36 )2
V(X) = (791/ 36) – (161/36) 2 = 1,9714
Ejemplo 2: Supóngase que la variable aleatoria X es el número que queda hacia arriba al lanzar un dado legal.
La función de probabilidad correspondiente es f X 1 6 para X = 1, 2, 3, 4, 5, 6
que quiere decir que 3.5 es el valor esperado, lo que significa que 3.5 es el valor central de la distribución.
Obsérvese que no es necesario que el valor esperado sea un valor posible de la variable aleatoria. También se
interpreta en el sentido de que en 10 ejecuciones del experimento, por ejemplo, se espera que la suma de los
números obtenidos sea de (10)(3.5) = 35.
σ 2 2,9167 1,7078
Ejemplo 3: Hallar la esperanza matemática, la varianza y la desviación estándar del número de caras al lanzar
tres monedas al aire.
Solución:
El espacio muestral es S = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
La probabilidad de cada punto muestral es de 1/8
Se elabora las distribuciones de probabilidad y se realiza los cálculos respectivos. Estos resultados se presentan
en la siguiente tabla:
xi P xi x i P xi xi 2 Pxi
0 1/8 0·1/8 = 0 (0 – 1,5)2 ·1/8 = 0,281
1 3/8 1·3/8 = 3/8 (1 – 1,5)2 ·3/8 = 0,094
2 3/8 2·3/8 = 3/4 (2 – 1,5)2 ·3/8 = 0,094
3 1/8 3·1/8 = 3/8 (3 – 1,5)2 ·1/8 = 0,281
Total 1 1,5 0,750
Observando la tabla se tiene: = E(X) = 1,5 significa que si se promedian los resultados del lanzamiento de
las tres monedas (teóricamente, un número infinito de lanzamientos), se obtendrá 1,5.
2 = 0,75 y σ 2 0,75 0 ,866 miden la dispersión de los resultados de lanzar las tres monedas
alrededor de su media.
Fin de la Unidad II
80
UNIDAD 3:
VARIABLES ALEATORIAS DISCRETAS.
OBJETIVO DE APRENDIZAJE: Calcular las medidas de tendencia central para el análisis descriptivo de una población
o muestra.
CONTENIDO:
3.1 Terminología: Variables Aleatorias. Aleatorias Discretas. Aleatorias Continuas. Función de Distribución.
3.2 Variable Aleatoria Discreta: Distribución Bernoulli. Distribución Binomial. Distribución Muestral de proporciones.
INTRODUCCIÓN.
Uno de los objetivos de la estadística es el conocimiento cuantitativo de una determinada parcela de la
realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la
premisa de que lo real es siempre más complejo y multiforme que cualquier modelo que se pueda construir. De
todas formas, la formulación de modelos aceptados por las instituciones responsables y por los usuarios, permite
obviar la existencia del error o distancia entre la realidad y el modelo.
Los modelos teóricos a los que se hace referencia se reducen en muchos casos a (o incluyen en su formulación)
funciones de probabilidad. La teoría de la probabilidad tiene su origen en el estudio de los juegos de azar, que
impulsaron los primeros estudios sobre cálculo de probabilidades en el siglo XVI, aunque no es hasta el siglo
XVIII cuando se aborda la probabilidad desde una perspectiva matemática con la demostración de la “ley débil
de los grandes números” según la cual, al aumentar el número de pruebas, la frecuencia de un suceso tiende a
aproximarse a un número fijo denominado probabilidad. Este enfoque, denominado enfoque frecuentista, se
modela matemáticamente en el siglo XX cuando Kolmogorov formula la teoría axiomática de la probabilidad.
Dicha teoría define la probabilidad como una función que asigna a cada posible resultado de un experimento
aleatorio un valor no negativo, de forma que se cumpla la propiedad aditiva. La definición axiomática establece
las reglas que deben cumplir las probabilidades, aunque no asigna valores concretos. Uno de los conceptos más
importantes de la teoría de probabilidades es el de variable aleatoria que, intuitivamente, puede definirse como
cualquier característica medible que toma diferentes valores con probabilidades determinadas. Toda variable
aleatoria posee una distribución de probabilidad que describe su comportamiento (vale decir, que desagrega el 1
a lo largo de los valores posibles de la variable). Si la variable es discreta, es decir, si toma valores aislados
dentro de un intervalo, su distribución de probabilidad especifica todos los valores posibles de la variable junto
con la probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar
cualquier valor de un intervalo, la distribución de probabilidad permite determinar las probabilidades
correspondientes a la variable con subintervalos de valores. Una forma usual de describir la distribución de
probabilidad de una variable aleatoria es mediante la denominada función de densidad, en tanto que lo que se
conoce como función de distribución representa las probabilidades acumuladas.
Una de las preocupaciones de los científicos ha sido construir modelos de distribuciones de probabilidad que
pudieran representar el comportamiento teórico de diferentes fenómenos aleatorios que aparecían en el mundo
real. La pretensión de modelar lo observable ha constituido siempre una necesidad básica para el científico
empírico, dado que a través de esas construcciones teóricas, los modelos, podía experimentar sobre aquello que
la realidad no le permitía. Por otra parte, un modelo resulta extremadamente útil, siempre que se corresponda con
la realidad que pretende representar o predecir, de manera que ponga de relieve las propiedades más importantes
del mundo que nos rodea, aunque sea a costa de la simplificación que implica todo modelo.
81
En la práctica hay unas cuantas leyes de probabilidad teóricas, como son, por ejemplo, la ley binomial o la de
Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar
las distribuciones empíricas más frecuentes. Así, por ejemplo, la variable “talla de un recién nacido” puede tener
valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma probabilidad, porque las más frecuentes
son las tallas próximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribución de
probabilidad empírica, que se obtendría con una muestra grande de casos. En esta unidad estudiaremos los
procedimientos usuales para calcular probabilidades y sus inversas, para un conjunto bastante amplio de
funciones de distribución, discretas. En la siguiente unidad estudiaremos los procedimientos para tal fin en el
caso de las variables continuas, que son habituales en el proceso de modelación.
En la teoría de probabilidades no siempre es indispensable conocer los elementos del espacio muestral, sino
tener todos los puntos muestrales representados por cantidades que indiquen cierta propiedad del espacio
muestral, de forma que a cada punto muestral le corresponda un valor que lo está representando.
Variable:
A un cirujano le puede interesar el número de operaciones exitosas que realiza; un bioquímico puede estar
interesado en la densidad de glóbulos rojos de una persona; un empresario por el monto de las ventas de su
empresa durante el año; un educador por el número de estudiantes aprobados cuando usa determinado método de
enseñanza; un arquitecto por el número de casas que construirá el próximo semestre; un ingeniero agrónomo por
la producción de maíz por hectárea con una variedad hibrida que está probando; un futbolista por el número de
goles que anotará durante la temporada; un meteorólogo por la precipitación pluvial anual en cierta localidad y
así se pueden mencionar múltiples aspectos de interés. Como cualquiera de los sucesos anteriores puede tomar
valores diferentes, esto es, pueden variar, se les llama variables.
Variable aleatoria:
Si realizamos un experimento aleatorio, es lógico pensar que los resultados que se obtenga también son
aleatorios. Así:
Si los valores numéricos que toma una variable provienen de factores fortuitos y si un determinado
valor no se puede predecir con precisión, esa variable recibe el nombre de variable aleatoria (v. a.)
Distribución de Bernoulli:
Es el modelo más simple y constituye la base para deducir el modelo probabilístico binomial que está ligado
frecuentemente a muchos fenómenos. Es aplicable a cualquier variable aleatoria que pueda asumir sólo dos
valores.
Si ‘1’ y ‘0’, son los valores y ‘p’ y ‘q’, son sus respectivas probabilidades, la función de probabilidad de una
variable de Bernoulli será:
En la variable de Bernoulli, la esperanza matemática y la varianza
2
X f(x) X . f(x) X . f(x) son:
1 p p p E X X f X p
0 q 0 0
1 p p x2 V ( X ) X 2 f X x 2 p p 2 p 1 p p q
82
Ejemplo:
El 65% de los profesores que dictan matemática en Educación Media del estado Aragua, están de acuerdo con
poner en práctica una nueva metodología de la enseñanza de esta asignatura. Si se selecciona un profesor de
matemática de este nivel en forma aleatoria y sea “X = 1” si está a favor del nuevo método y “X = 0” si está en
contra. ¿Cuál es la esperanza y la varianza de X?
Solución:
La esperanza matemática es x p 65 100 0,65
A continuación se mencionan algunas otras situaciones que son similares al experimento de lanzar una
moneda:
Una socióloga está interesada en conocer la proporción de profesores de primaria que son hombres.
A un comerciante de bebidas refrescantes le interesa saber la proporción de consumidores de cola que
prefieren su marca.
Un experto en genética está interesado en la proporción de la población que tiene un gen relacionado
con la enfermedad de Alzheimer
Cada persona muestreada es semejante a lanzar una moneda, pero la probabilidad de una cara no es
necesariamente igual a ½, y aunque estas situaciones tienen distintos objetivos prácticos, todas exhiben las
características del experimento binomial.
Ejemplo 1:
Suponga que hay cerca de 1.000.000 de adultos en una ciudad y una proporción desconocida p está a favor de
una determinada propuesta del gobierno. Se elegirá una muestra de 1.000 adultos, de tal manera que cada uno de
los integrantes del millón de adultos tenga igual probabilidad de ser seleccionado, y se le preguntará a cada
adulto si está a favor de la determinada propuesta. ¿Es este un experimento binomial? ¿Tendrá el experimento
las cinco condiciones binomiales?
83
Solución:
1. Un “ensayo” es la selección de un solo adulto del millón de adultos de la ciudad. Esta muestra consta de
n = 1.000 ensayos idénticos.
2. Puesto que cada adulto estará a favor de la propuesta o no, hay dos resultados que representan los
“éxitos” o los “fracasos” en el experimento binomial. (Aunque es común nombrar a los dos resultados
posibles de un ensayo “éxito” o “fracaso”, podrían haber sido llamados “cara” o “sello”, “blanco” o
“rojo”, o cualquier otro par de palabras. En consecuencia, el resultado llamado “éxito” no necesita ser
considerado como un éxito en el sentido ordinario de la palabra).
3. La probabilidad de éxito, p, es la de que un adulto esté a favor de la propuesta. ¿Esta probabilidad será la
misma para cada adulto de la muestra? Para fines prácticos, la respuesta es sí. Por ejemplo, si 500.000
adultos de la población están a favor de la propuesta, entonces la probabilidad de un “éxito” cuando se
elige al primer adulto 500.000/1.000.000 = ½. Cuando se elige al segundo adulto, la probabilidad p
cambia un poco, dependiendo de la primera elección. Es decir, habrá 499.999 o 500.000 éxitos dejados
entre los 999.999 adultos. En cualquier caso, p es aún casi igual a ½.
4. La independencia de los ensayos está garantizada debido al gran grupo de adultos del que se elige la
muestra. La probabilidad de que un adulto esté a favor de la propuesta no cambia en función de las
respuestas de las personas seleccionadas con anterioridad.
5. La variable aleatoria X es el número de adultos de la muestra que están a favor de la propuesta.
Debido a que el estudio satisface las cinco características, para propósitos prácticos se considera un
experimento binomial.
Ejemplo 2:
Un comprador que ha recibido un embarque que contiene 20 computadoras personales (Laptops) desea
muestrear tres de ellas para ver si están funcionando bien antes de aceptar el embarque. Para probar elige las tres
computadoras más cercanas y, después, se decide si son defectuosas o no. El comprador no sabe que dos de las
20 computadoras del embarque están defectuosas. ¿Es este un experimento binomial? De nuevo, compruebe si
el procedimiento satisface las características de un experimento binomial.
Solución:
1. Un “ensayo” es la selección y prueba de una PC del total de 20. Este experimento consta de n = 3
ensayos idénticos.
2. Cada ensayo produce uno de dos resultados, ya sea que una PC esté defectuosa (un “éxito”) o no (un
“fracaso”).
3. Suponga que las PC fueron colocadas al azar en el contenedor, de tal modo que cualquiera de las 20
computadoras pudo ser colocada cerca de la puerta del contenedor. Entonces la probabilidad de sacar
una computadora defectuosa en un ensayo sería 2/20. (Recuerde que dos de las PC están defectuosas).
4. La condición de independencia entre ensayos no se satisface porque la probabilidad de sacar una PC
defectuosa en el segundo y tercer ensayo dependen del resultado del primer ensayo. Por ejemplo, si en el
primer ensayo se obtiene una PC defectuosa, entonces sólo queda una computadora defectuosa entre las
19 restantes del envío. Por tanto,
P (defectuosa en el ensayo 2/defectuosa en el ensayo 1) = 1/19
Si en el primer ensayo no se obtiene una computadora defectuosa, entonces aún hay dos computadoras
defectuosas en el envío y la probabilidad de un “éxito” (una PC defectuosa) cambia a
P (defectuosa en el ensayo 2 / no defectuosa en el ensayo 1) = 2/19
Por tanto, los ensayos son dependientes y el muestreo no representa un experimento binomial.
84
Piense en la diferencia entre estos dos ejemplos. Cuando la muestra (los n ensayos idénticos) provienen de una
población grande, la probabilidad de éxito p es casi la misma de un ensayo a otro. Cuando el tamaño N de la
población es pequeño, la probabilidad de éxito tiene un cambio drástico de un ensayo a otro, y el experimento no
es binomial.
Regla práctica
Si el tamaño de la muestra es grande con respecto al tamaño de la población,
en particular, si n/N 0,05; entonces, el experimento resultante no es binomial.
Nota:
p + q = 1. Si p = 0 q = 1, 0 p 1. Si p = 1 q = 0, 0 q 1.
Los valores de p y q dependen del nombre que se le asigne a la variable X.
La probabilidad de ocurrencia (p) debe estar asociada a la variable aleatoria descrita en el problema.
Un experimento binomial consta de n ensayos idénticos con probabilidad de éxito p en cada ensayo. La
probabilidad de x = k éxitos en n ensayos es;
n!
P x k C kn p k q n k pk qn k (DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL )
k ! n k !
Las fórmulas generales para , y 2 vistas en la unidad anterior se pueden usar para obtener las siguientes
fórmulas más simples para la media y la desviación estándar binomiales.
85
Ejemplo 1:
Encuentre P(X = 2) para una variable aleatoria binomial con n = 10 y p = 0,1
Solución:
P(X = 2) es la probabilidad de observar dos éxitos y ocho fracasos en una sucesión de 10 ensayos. Se podrían
observar primero los dos éxitos, seguidos de 8 fracasos E, E, F, F, F, F, F, F, F, F puesto que p es la
probabilidad de éxito y q la de fracaso, esta sucesión tiene probabilidad ppqqqqqqqq = p2q8.
Sin embargo, muchas otras sucesiones producen también x = 2 éxitos. La fórmula binomial usa C 10 2 para
contar el número de sucesiones y da la probabilidad exacta cuando usa la fórmula binomial con k = 2:
P x 2 C 10
2 0,1 0,9
2 10 2
10 !
0,12 0,98
2 ! 10 - 2 !
109
0,010,430467
21
0,1937
Ejemplo 2:
Durante un largo período se ha observado que un determinado tirador da en el blanco en un solo intento con
probabilidad de 0,8. Suponga que el tirador hace cuatro tiros al blanco.
a) ¿Cuál es la probabilidad de que dé en el blanco dos veces?
b) ¿Cuál es la probabilidad de que acierte al blanco por lo menos una vez?
Solución:
Un “ensayo” es un solo disparo al blanco, y se define un “éxito” como atinarle y un “fracaso” como fallar, así
que n = 4 y p = 0,8. Si se supone que la probabilidad del tirador de dar en el blanco no cambia de un disparo al
otro, entonces el número x de veces que da en el blanco es una variable aleatoria binomial.
¿Encuentra alguna razón por la que su suposición de ensayos independientes pudiera ser errónea? Si el tirador
aprende de sus tiros previos, es decir, observa la ubicación de su disparo previo y ajusta su objetivo, entonces su
probabilidad p de dar en el blanco se puede incrementar de un disparo a otro. Los ensayos no serían
independientes, y el experimento no sería binomial.
86
Ejemplo 3:
Una moneda corriente se lanza seis veces. Cuál es la probabilidad de que salgan:
a) Dos caras. g) Ningún sello.
b) Más de 3 caras. h) Sean 3 caras y 3 sellos.
c) Entre 3 y 5 caras. i) A lo más una cara.
d) Entre 3 y 5 caras (ambas inclusive). j) No más de 3 caras.
e) Más caras que sellos. k) 6 sellos o menos de 2 caras.
f) Todas sean sellos.
Solución:
1) Características del problema.
La variable X = Número de caras
n = 1, 2, 3, 4, 5, 6 (Número de lanzamientos de la moneda)
x = k = 0, 1, 2, 3, 4, 5, 6 (Cantidad de veces que sale cara)
Sea E = 0, 1, 2, 3, 4, 5, 6el espacio muestral asociado a la variable X
3) Determinemos la probabilidad de cada suceso indicado (desde ‘a’ hasta ‘k’, probabilidades requeridas en
el problema) mediante la fórmula:
n
P X x p x q n x ; donde
x
2 62
6 1 1 1 1 1 15
a) P(dos caras) P X 2 15 2 4 15 6 0,234375
2 2 2 2 2 2 64
4 2
6 1 1 1 1 15
P X 4 15 4 2 6
4
2 2 2 2 2
5
6 1 1 1 1 6
P X 5 6 5 6
5 2
2 2 2 2
6 0
6 1 1 1 1
P X 6 1 6 1 6
6 2 2 2 2
15 6 1 15 6 1 22
Luego P(más de tres caras) P X 3 0,34375
26 26 26 26 64
87
También se puede plantear de la siguiente manera
P(más de tres caras) P X 3 1 P X 0 P X 1 P X 2 P X 3
Calculamos cada una de las probabilidades indicadas, las sumamos y luego las restamos de 1.
15
c) P(entre tres y cinco caras) P3 X 5 P X 4 ; (ver parte b).
64
g) P(ningún sello) P y 0
0 6
6 1 1
0 2 2
1
11 6
2
1
0,015625
64
88
h) P(sean 3 caras y 3 sellos) P X 3
20
(Aplicando la fórmula binomial)
64
En este caso podemos determinar P(X = 3) o P (y = 3), ya que en seis lanzamientos existen igual número de
caras (3) que de sellos (3).
Ejercicio 1:
Se realiza un experimento con un lote de 5 ratas, a las cuales se les inoculó un virus que produce la muerte con
un 30% de probabilidad. Si X representa el número de ratas sobrevivientes.
Determinemos:
a) La probabilidad para cada uno de los valores que puede tomar dicha variable.
b) ¿Cuál es la probabilidad de que sobrevivan 3 o más ratas?
c) ¿Cuál es la probabilidad de que mueran entre 1 y 4 ratas (inclusive)?
Solución:
1. Características del problema:
- La variable X = Número de ratas sobrevivientes.
- x = 0, 1, 2, 3, 4, 5 (cantidad de ratas sobrevivientes).
- n = 5 (Número de ensayos).
- E = 0, 1, 2, 3, 4, 5 Espacio muestral asociado a la variable X
89
2. Determinemos los valores de p y q.
Por referencia del problema conocemos que al inocularles el virus a las ratas mueren un 30% del total, lo
que quiere decir que el 70% restante de las ratas sobreviven. Como el valor de p depende del nombre asignado a
la variable X, entonces la probabilidad de ocurrencia (p) asociada a la variable X descrita en el problema es p =
70% = 0,7. Luego, q = 1 – p = 0,3
5
P y 1 0,3 0,7 4 5 0,30,2401 0,36015
1
5
P y 2 0,32 0,7 3 10 0,09 0,343 0,3087
2
5
P y 3 0,33 0,7 2 10 0,027 0,49 0,1323
3
5
P y 4 0,34 0,7 5 0,0810,7 0,02835
4
90
Ejercicio 2:
Se extraen 5 bolitas, con restitución, de una caja que contiene 4 bolitas blancas, 4 verdes y 12 negras. ¿Cuál es
la probabilidad de obtener exactamente 3 bolitas que no sean blancas?
Solución:
La variable X = Número de bolitas que no sean blancas.
n = 5 (Número de veces que ocurre el ensayo o bolitas que se seleccionan)
x = 0, 1, 2, 3, 4, 5
16
p
20
128
Luego, la probabilidad que se busca, es: P X 3 0,2048
625
3 2
5 16 4 4096 16 128
P X 3 10 0,2048
3
20 20 8000 400 625
5
P X 3 0,83 0,2 2 10 0,512 0,04 0,2048
3
Ejercicio 3:
El 60% de las historias clínicas de un hospital corresponden a adolescentes. Si se seleccionan 5 historias
clínicas, ¿cuál es la probabilidad de que 3 de ellas correspondan a adolescentes?
Solución:
1. La ecuación es P k , n , p C kn p k q n k
2. k es la cantidad de éxitos esperados: k = 3
3. n es la muestra seleccionada: n = 5
4. p es la probabilidad de éxito: p = 60/100 = 3/5
5. q es la probabilidad de no éxito: q = 1 – p = 1 – 3/5 = 2/5
5! 543 !
6. Se desarrolla el número combinatorio C kn C 35 10
3 ! 5 3 ! 3!2!
27 4
Se sustituyen los demás valores en la fórmula P 3,5,3 / 5 10 3 / 5 2 / 5 10
3 2
7. 0,3456
125 25
8. Interpretación: Si el 60% de las historias clínicas de un hospital son de adolescentes y del grupo se eligen 5
al azar, existe una probabilidad de 0,3456 de que 3 de ellas sean de adolescentes.
Ejercicio 4:
Con los datos del ejemplo anterior, qué probabilidad existe de que:
a) Por los menos 2 historias sean adolescentes
b) Ninguna sea de adolescentes
c) Como máximo 3 sean de adolescentes
Solución:
a) Por los menos 2 historias sean adolescentes.
1. La muestra sigue siendo: n = 5
2. La cantidad de éxitos esperados es: k = 2, 3, 4, 5 (ya que la condición es que por lo menos 2 sean adolescentes)
3. La probabilidad de éxito es: p = 60/100 = 3/5
4. La probabilidad de fracaso es: q = 2/5
5. Se calculan las probabilidades para los diversos valores de k, para luego sumarlos
91
5!
Para k = 2 P2, 5, 3 / 5 C 25 3 / 52 2 / 53 9 / 25 8 / 125 10 0,36 0,064 0,2304
2! 3!
Para k = 3 P3, 5, 3 / 5 0,3456 (tomado del ejemplo anterior)
7. Interpretación: La probabilidad de que por lo menos dos historias clínicas sean de adolescentes es igual a
0,91296
k
Px k e , Para x = 0, 1, 2, 3, … (DISTRIBUCIÓN DE POISSON)
k!
93
= es el promedio esperado de éxitos en un intervalo de tiempo dado o región determinada. = n . p Es
un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un
intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos
interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo
de distribución de Poisson con = (10) (4) = 40
x = k es la cantidad de éxitos esperados. Número de ocurrencias del evento o fenómeno. La función nos da la
probabilidad de que el evento suceda precisamente k veces. A diferencia de la distribución binomial donde el
dominio de la variable discreta x está acotado entre 0 y el número de intentos, en la distribución de Poisson x 0
e = 2,71828… (es la base del logaritmo neperiano), se puede evaluar con la calculadora, que debe tener una
función ex.
Para los valores x = 0, 1, 2, 3, … la media y la desviación estándar de la variable aleatoria de Poisson son:
Para cada valor de x, podemos obtener las probabilidades individuales para la variable de Poisson, de la misma
manera como se procedió para la variable aleatoria binomial.
Ejemplo 1:
En un proceso de producción de un artículo que se fabrica en grandes cantidades, se sabe que la proporción de
artículos defectuosos es p = 0,01. Se elige una muestra aleatoria de 100 artículos. ¿Cuál es la probabilidad de que
haya 2 artículos defectuosos en esta muestra?
Solución:
1. Se halla el promedio esperado: = n . p = 100 (0,01) = 1.
2. La cantidad de éxitos esperados es: x = 2
3. Se aplica la fórmula sabiendo que e = 2,71828 = 2,72
x 1 1
PX x e 0,184
x! e 2!
4. Interpretación: La probabilidad de que hayan 2 artículos defectuosos en una muestra aleatoria de 100, es
igual a 0,184.
Ejemplo 2:
En un Instituto Educativo existen 1.095 estudiantes, ¿cuál es la probabilidad de que hayan 3 estudiantes que
celebren su cumpleaños un mismo día dado del año?
Solución:
1. Se calcula la probabilidad de que un estudiante cumpla año: p = 1/365
2. Se determina el promedio esperado: = n . p = 1.095 (1/365) = 3.
3. La cantidad de éxitos esperados es: x = 3
4. Se aplica la fórmula de Poisson, dado que = 3 < 5
x 1 33
Px 3, 2 e 3
0,2236
x! 2,72 3 !
Ejemplo 3:
Al cabo de un año, se incendian, como término medio, una casa cada 2.000, en un cierto barrio. Si hay 4.000
casas en ese barrio. ¿Cuál es la probabilidad de que se incendien exactamente 5 casa durante el año?
94
Solución:
1. La muestra es n = 4.000
2. La probabilidad de éxito es: p = 1/2.000
3. La cantidad de éxitos esperados es: x = 5
4. El promedio esperado es: = n . p = 4.000 (1/2.000) = 2
5. Se aplica la fórmula de Poisson, dado que = 2 < 5
x 1 25
Px 5, 2 e 32 0,036
2
x! 2,72 5 ! 7,4 120
Ejemplo 4:
El número promedio de demandas presentadas a una compañía de seguros es de 2 por día. ¿Cuál es la
probabilidad de que un día cualquiera:
a) Se presenten exactamente 3 demandas
b) No se presente ninguna demanda
Solución:
a) Sabemos que:
- = 2 (es el promedio de demandas por día)
- x = 3 (número de demandas presentadas por día)
x
De acuerdo a la distribución de Poisson: P X x e
x!
2 3 2,71828 2 8
P X 3
3! 3 2 1! 2,71828 2
4
0,18045
3 7,38905
Ejercicio.
Un estudiante comete, en promedio, un error de imprenta en cada página. ¿Cuál es la probabilidad de que haga
exactamente 2 errores en un trabajo de 3 páginas?
Solución:
= 2 (promedio de errores por cada tres páginas) y X = 2 (Número de errores en tres páginas)
3 2 2,718283
Utilizando Poisson: P X 2 0,22404
2!
CONTENIDO:
4.1 Terminología: Variables Aleatorias Continuas.
4.2 Variables tipificadas: Distribución Normal. Características y Propiedades.
INTRODUCCIÓN
En esta unidad se tratará una de las distribuciones de variable continua más importante y más utilizada en la
estadística aplicada: La distribución Normal o de Gauss. (Curva especial en forma de campana, denominada Gaussiana en
honor del gran científico alemán Karl Friedrick Gauss 1777-1855. Aun cuando la distribución normal fue reconocida por primera vez
por el francés Abraham de Moivre 1667-1754. A conclusiones análogas llegó también, de manera independiente, el astrónomo y
matemático Pierre Simón Laplace 1749-1827, en relación con la teoría de los errores de observación astronómica y física ).
- La curva de la distribución normal f(X), es asintótica respecto al eje de las abscisas; es decir, f(X) tiende a
cero, cuando X tiende a . Las colas de la curva se aproximan, pero nunca tocan al eje horizontal.
- Para indicar abreviadamente que una variable aleatoria se distribuye normalmente con parámetros y ,
escribiremos X N(, ) siendo la media de la distribución y su desviación típica.
No importa cuáles sean los valores de µ y ; para un distribución de probabilidad normal, el área total bajo la
curva siempre es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades.
97
Interpretación geométrica: La media es un factor de traslación y la desviación típica un factor de escala.
Interpretar probabilística: Entre la media y la desviación típica tenemos siempre la misma probabilidad.
16% 16%
Aproximadamente el 68% de todos los valores de una
población normalmente distribuida se encuentra dentro
de ± 1 desviación estándar de la media.
5% 5%
Aproximadamente el 95% de todos los
valores de una población normalmente
distribuida se encuentra dentro de ± 2
desviaciones estándar de la media.
Aproximadamente el 99% de todos los valores de una población normalmente distribuida se encuentra dentro de
± 3 desviaciones estándar de la media.
Estas gráficas muestran dos formas diferentes de medir el área bajo la curva normal. Sin embargo, muy pocas
de las aplicaciones que haremos de la distribución normal de probabilidad implican intervalos de exactamente
más o menos 1, 2 ó 3 desviaciones estándar a partir de la media. Para estos casos existen tablas estadísticas que
indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones
estándar () a partir de la media.
98
Cálculo de probabilidades en la distribución normal.
Áreas tabuladas de la distribución de probabilidad normal.
Podemos obtener la función de distribución F(x) integrando la función de densidad de probabilidad:
1 x μ 2 x 1 v μ 2
1 1
N μ,σ Px e 2 σ
F x e
2 σ
dv
σ 2π σ 2π -
b 1 v μ 2
1
Pa x b F b F a e
2 σ
dv
2 a
v u 2
1
En particular
2 e
-
2 2 dv 1
El valor de la integral puede ser calculado por integración usando métodos numéricos de aproximación, pero
obviamente sería un cálculo tedioso. Afortunadamente esta integral, y en consecuencia las probabilidades de
cualquier variable normal, pueden ser calculadas fácilmente mediante una transformación de la variable X en
otra variable Z normal con parámetros 0 y 1. Las probabilidades correspondientes a esta variable z han sido
tabuladas.
Dada una variable de media y desviación típica , se denomina valor tipificado Z, de una
observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones
típicas.
Nos permite así comparar entre dos valores de dos distribuciones normales diferentes, para
saber cuál de los dos es más extremo
100
A continuación se presentan los diferentes casos que pueden ocurrir en el cálculo de la probabilidad del área
total bajo la curva, para cuya determinación haremos uso de la tabla anexa.
2,8
Esta área al igual que la anterior son iguales por ser la curva simétrica.
–2,8
1,45
–1,45
101
5to Caso: Ambos límites están a la derecha de cero (0).
Ejemplo: Determinar la probabilidad de que Z sea mayor o igual a 1,50 y menor o igual a 2,80
Es decir, P(1,50 Z 2,80)
1,5 2,8
1,85
102
UNIDAD 4: VARIABLES ALEATORIAS CONTINUAS.
COMPROBACIÓN DE LOS APRENDIZAJES
Z X
=0 z Media = X (Promedio)
El área bajo la curva representa la probabilidad El valor de la media no es necesariamente cero
x
La relación entre las variables X y Z se operacionaliza a través de la fórmula z
Ejemplo:
Una panificadora elabora piezas de pan cuyas longitudes se distribuyen de forma normal con una media de
15 cm y una varianza de 2,25 cm2. Determine:
a) Probabilidad de que una pieza exceda los 18 cm.
b) Probabilidad de que las piezas de pan estén entre 13 cm y 17 cm.
Solución:
a) Probabilidad de que una pieza exceda los 18 cm.
La variable aleatoria “continua” que estamos estudiando es P(X exceda los 18 cm). Es decir, P(x > 18 cm)
Para calcular esa probabilidad tenemos que relacionarla con z, cuya probabilidad se encuentran en las tablas.
xx
Los valores de z se pueden aproximar por la fórmula z
s
Luego, x = 15 cm y 2 = 2,25 cm2 = 1,5 cm.
15 cm 18 cm
Así, z 2(Nótese que z no tiene unidades) X
1.5cm 15 18
Es claro que x = 18 equivale a z = 2 en las tablas
Obviamente la escala del segundo gráfico que corresponde a la variable
normal ‘tipificada’ no guarda una correcta relación con el primer gráfico de
la variable ‘sin tipificar’. Si la escala de ambos gráficos fuese la misma, la
distancia entre 15 y 18 ciertamente no podrá ser igual a la distancia entre 0
y 2 y esto se debe a que sus varianzas no coinciden.
Z
En la tabla 2,00 = 0,4772 que corresponde al área entre la media y z = 2 0 2
Luego, 0,5000 – 0,4772 = 0,0228 2, 28%
103
b) Probabilidad de que las piezas de pan estén entre 13 cm y 17 cm.
13cm 15 cm 17 cm 15 cm
z1 133 Y z2 1,33
1 .5cm 1.5cm
–1,33 1,33
En la tabla 1,33 = 0,4082 que corresponde al área entre la media y z = 1,33
Luego, por simetría, la probabilidad buscada es 0,8164 81,64%
Finalmente, la probabilidad de que una pieza de pan exceda los 18 cm es de 0,0228 2, 28%
Y la probabilidad de que las piezas de pan estén entre 13 cm y 17 cm es de es 0,8164 81,64%
Ejercicios:
1) Consideremos los coeficientes intelectuales (C.I) de los estudiantes del 5to año de una escuela secundaria.
Estos coeficientes se distribuyen normalmente con una media de 85 y una desviación estándar de 6.
a) ¿Cuál es la probabilidad de escoger a un estudiante al azar que tenga un C.I igual o mayor a 92?
b) ¿Cuál es la probabilidad de que un estudiante tenga un coeficiente intelectual entre 74 y 95, ambos
inclusive?
2) Al aplicar un test de habilidades numéricas a 750 estudiantes, se obtuvo una media aritmética de 48 puntos
y una desviación estándar de 8. Determinar (dibuje la gráfica):
a) Las calificaciones estandarizadas para las calificaciones originales 43, 57 y 78.
b) La probabilidad de obtener una calificación menor o igual a 38.
c) La probabilidad de obtener una calificación mayor o igual a 43.
d) La probabilidad de obtener una calificación menor o igual a 67.
e) La probabilidad de obtener una calificación mayor o igual a 59.
f) La probabilidad de obtener una calificación entre 35 y 47.
g) La probabilidad de obtener una calificación entre 40 y 65.
h) ¿Qué porcentaje y cuántos estudiantes obtuvieron calificaciones inferiores a 61?
i) La calificación correspondiente al percentil 72.
j) La calificación correspondiente al percentil 30.
Fin de la Unidad IV
104
TABLA A
Proporciones de áreas bajo la curva normal (1)
(B) (C ) (B) (C) (B) (C)
(A) (A) (A)
Área entre la Área más Área entre la Área más Área entre la Área más
Z Z Z
media y Z allá de Z media y Z allá de Z media y Z allá de Z
105
0.39 0.1517 0.3483 0.94 0.3264 0.1736 1.49 0.4319 0.0681
0.40 0.1554 0.3446 0.95 0.3289 0.1711 1.50 0.4332 0.0668
0.41 0.1591 0.3409 0.96 0.3315 0.1685 1.51 0.4345 0.0655
0.42 0.1628 0.3372 0.97 0.3340 0.1660 1.52 0.4357 0.0643
0.43 0.1664 0.3336 0.98 0.3385 0.1635 1.53 0.4370 0.0630
0.44 0.1700 0.3300 0.99 0.3389 0.1611 1.54 0.4382 0.0618
0.45 0.1736 0.3264 1.00 0.3413 0.1587 1.55 0.4394 0.0606
0.46 0.1772 0.3228 1.01 0.3438 0.1562 1.56 0.4406 0.0594
0.47 0.1808 0.3192 1.02 0.3461 0.1539 1.57 0.4418 0.0582
0.48 0.1844 0.3156 1.03 0.3485 0.1515 1.58 0.4429 0.0571
0.49 0.1879 0.3121 1.04 0.3508 0.1492 1.59 0.4441 0.0559
0.50 0.1915 0.3085 1.05 0.3531 0.1469 1.60 0.4452 0.0548
0.51 0.1950 0.3050 1.06 0.3554 0.1446 1.61 0.4463 0.0537
0.52 0.1965 0.3015 1.07 0.3577 0.1423 1.62 0.4474 0.0526
0.53 0.2019 0.2961 1.08 0.3599 0.1401 1.63 0.4484 0.0516
0.54 0.2054 0.2946 1.09 0.3621 0.1379 1.64 0.4495 0.0505
TABLA A
Continuación
(B) (C ) (B) (C) (B) (C)
(A) (A) (A)
Área entre la Área más Área entre la Área más Área entre la Área más
Z Z Z
media y Z allá de Z media y Z allá de Z media y Z allá de Z
106
1.86 0.4686 0.0314 2.43 0.4925 0.0075 3.00 0.4987 0.0013
1.87 0.4693 0.0307 2.44 0.4927 0.0073 3.01 0.4987 0.0013
1.88 0.4699 0.0301 2.45 0.4929 0.0071 3.02 0.4987 0.0013
1.89 0.4706 0.0294 2.46 0.4931 0.0069 3.03 0.4988 0.0012
1.90 0.4713 0.0287 2.47 0.4932 0.0068 3.04 0.4988 0.0012
1.91 0.4719 0.0281 2.48 0.4934 0.0066 3.05 0.4989 0.0011
1.92 0.4726 0.0274 2.49 0.4936 0.0064 3.06 0.4989 0.0011
1.93 0.4732 0.0268 2.50 0.4938 0.0062 3.07 0.4989 0.0011
1.94 0.4738 0.0262 2.51 0.4940 0.0060 3.08 0.4990 0.0010
1.95 0.4744 0.0256 2.52 0.4941 0.0059 3.09 0.4990 0.0010
1.96 0.4750 0.0250 2.53 0.4943 0.0057 3.10 0.4990 0.0010
1.97 0.4756 0.0244 2.54 0.4945 0.0055 3.11 0.4991 0.0009
1.98 0.4761 0.0239 2.55 0.4946 0.0054 3.12 0.4991 0.0009
1.99 0.4767 0.0233 2.56 0.4948 0.0052 3.13 0.4991 0.0009
2.00 0.4772 0.0228 2.57 0.4949 0.0051 3.14 0.4992 0.0008
2.01 0.4778 0.0222 2.58 0.4951 0.0049 3.15 0.4992 0.0008
2.02 0.4783 0.0217 2.59 0.4952 0.0048 3.16 0.4992 0.0008
2.03 0.4788 0.0212 2.60 0.4953 0.0047 3.17 0.4992 0.0008
2.04 0.4793 0.0207 2.61 0.4955 0.0045 3.18 0.4993 0.0007
2.05 0.4798 0.0202 2.62 0.4956 0.0044 3.19 0.4993 0.0007
2.06 0.4803 0.0197 2.63 0.4957 0.0043 3.20 0.4993 0.0007
2.07 0.4808 0.0192 2.64 0.4959 0.0041 3.21 0.4993 0.0007
2.08 0.4812 0.0188 2.65 0.4960 0.0040 3.22 0.4994 0.0006
2.09 0.4817 0.0183 2.66 0.4961 0.0039 3.23 0.4994 0.0006
2.10 0.4821 0.0179 2.67 0.4962 0.0038 3.24 0.4994 0.0006
2.11 0.4826 0.0174 2.68 0.4963 0.0037 3.25 0.4994 0.0006
2.12 0.4830 0.0170 2.69 0.4964 0.0036 3.30 0.4995 0.0005
2.13 0.4834 0.0166 2.70 0.4965 0.0035 3.35 0.4996 0.0004
2.14 0.4838 0.0162 2.71 0.4966 0.0034 3.40 0.4997 0.0003
2.15 0.4842 0.0158 2.72 0.4967 0.0033 3.45 0.4997 0.0003
2.16 0.4846 0.0154 2.73 0.4968 0.0032 3.50 0.4998 0.0002
2.17 0.4850 0.0150 2.74 0.4969 0.0031 3.60 0.4998 0.0002
2.18 0.4854 0.0148 2.75 0.4970 0.0030 3.70 0.4999 0.0001
2.19 0.4857 0.0143 2.76 0.4971 0.0029 3.80 0.4999 0.0001
2.20 0.4861 0.0139 2.77 0.4972 0.0028 3.90 0.49995 0.00005
2.21 0.4864 0.0136 2.78 0.4973 0.0027 4.00 0.49997 0.00003
107
BIBLIOGRAFÍA
- Chourio, J. (1997) Estadística I. (1ra. Edición) Caracas - Venezuela. Editorial Biosfera.
- López C., R. (1996) Cálculo de la Probabilidad e Inferencia Estadística con tópicos de Econometría.
(3ra. Edición) Caracas - Venezuela. Publicaciones UCAB.
- Meyer, P. (1992) Probabilidad y Aplicaciones Estadísticas. Estados Unidos. Fondo educativo Interamericano.
- Reyes, A. (1998) Probabilidad y Estadística para el aula. (1ra. Edición) Mérida – Venezuela. ULA.
- Valera I., R. (1996) Módulo de Probabilidad. (2da. Edición) Maracay – Venezuela. UPEL.
- http://www.slideshare.net/rial08/la-normal
108