Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Espacio muestral
Ejemplo:
De igual forma, el espacio muestral de tirar un par de datos, est dado por el siguiente conjunto:
En probabilidad, es importante conocer el espacio muestral de un experimento para determinar las
caractersticas de independencia de los eventos, o determinar si los eventos son mutuamente
excluyentes.
Probabilidad objetiva
Ejemplo:
Observando los eventos posibles del experimento, el espacio muestral del experimento
est dado por S = {1, 2, 3, 4, 5, 6}, donde slo uno ellos cumple con la condicin. En este
caso la probabilidad ser , o bien, 0.1667, lo que significa que existe un 16.67% de
probabilidades de que se obtenga el nmero 1 al lanzar un dado.
probabilidad ser , o bien, 0.5000, lo que significa que existe un 50% de probabilidades
de que se obtenga un nmero par al lanzar un dado.
En este caso el resultado ser 0 porque no existe un evento asociado al experimento pues
ninguna cara del dado tiene el nmero 7.
1. Al tirar un dado, solamente un evento es posible. Si cae un dos, no puede caer al mismo
tiempo un 5. A esta caracterstica se le llama eventos mutuamente excluyentes.
2. El experimento del dado tiene un total de 6 resultados posibles. Dichos eventos son el total
del experimento. A esta caracterstica se le denomina colectivamente exhaustivo.
Ejemplo:
En un estudio realizado, 751 graduados de Administracin, revel que 453 de los 751 no estaban
trabajando en su principal rea de estudio. Cul es la probabilidad de que un graduado en
especfico est trabajando en un rea distinta a su principal rea de estudio?
Por tanto:
Probabilidad subjetiva
Si existe poca o ninguna informacin o experiencia en la que se pueda basar una probabilidad, la
probabilidad subjetiva puede darnos una solucin. Fundamentalmente significa evaluar las
opiniones disponibles y otra informacin para despus llegar a la probabilidad.
Probabilidad nula
La probabilidad del evento complemento es igual a la resta de 1 menos la probabilidad del evento.
Matemticamente:
Ejemplo:
Evento A: Obtener 1.
Evento A: No obtener un 1.
Reglas de adicin
1. Regla especial de adicin: Para aplicar la regla especial de adicin, los eventos deben ser
mutuamente excluyentes, como por ejemplo, al tirar un dado.
Ejemplo:
Evento A: Obtener 1.
Evento B: Obtener un nmero par.
Ejemplo:
Una encuesta del departamento de turismo de Nuevo Len, revel que 120 turistas visitaron el
nuevo Andador Santa Luca y 100 turistas visitaron la cascada conocida como Cola de Caballo.
Tambin se sabe que 60 de los turistas visitaron ambos lugares. Cul es la probabilidad de que
un turista haya visitado el Andador Santa Luca o la Cola de Caballo?
Cuando dos eventos se traslapan, como en el caso de los turistas de Nuevo Len, se dice que
existe una Probabilidad Conjunta.
Reglas de multiplicacin
1. Regla especial de multiplicacin: Para aplicar la regla especial de adicin, los eventos
deben ser independientes, como el caso de tirar dos dados, pues el evento obtenido en el
primer dado no afecta al evento obtenido en el segundo dado.
Ejemplo:
Ejemplo:
En una urna contiene 5 pelotas rojas y 5 pelotas azules. Cul es la probabilidad de obtener una
pelota roja en un primer evento y una segunda pelota en un segundo evento?
Glosario
Experimento: Se refiere a una actividad que se observa o se mide, es algo que se planea hacer y
cuyo resultado no lo conocemos con certeza.
Evento independiente: Se dice que dos eventos son independientes, si la probabilidad de que
ocurra uno no tiene ninguna relacin en la probabilidad de que ocurra el otro.
Probabilidad conjunta: Probabilidad que mide la posibilidad de que dos o ms eventos ocurran en
forma simultnea.
Probabilidad y estadstica
Tema 2. Probabilidad Condicional e Independencia
2.1 Probabilidad Condicional
La probabilidad condicional puede definirse como:
1. Devore, J. (2008). Probabilidad y estadstica para ingeniera y ciencias. (7a. Ed.). Mxico:
Cengage Learning. Captulo: 2.
Ejemplo
Consideremos el siguiente experimento: Una muestra al azar de 100 diferentes tipos de animales,
arroja los siguientes resultados:
Podemos poner esta informacin en un diagrama de Venn, como se ilustra en la figura 2.1
Con esta informacin agrupada en un diagrama, podemos fcilmente calcular probabilidades como
por ejemplo:
Cul es la probabilidad de que un animal seleccionado al azar sea un animal que nade?
Ahora ya sabemos que el evento de que el animal seleccionado es un ave, lo que nos falta es
determinar la probabilidad de que esa ave seleccionada nade. Aplicando la frmula de probabilidad
condicional tenemos:
De los primeros ejemplos, tenemos que la probabilidad de que un animal seleccionado sea un ave
es de 55 de cada 100. Si observamos el diagrama de Venn, observamos que la proporcin de aves
que vuelan es de 45 de cada 100.
Con esta informacin podemos obtener la probabilidad de que un ave seleccionada al azar nade:
Diagramas de rbol
Una tcnica muy til para representar eventos condicionales es un diagrama de rbol.
Supongamos el siguiente ejemplo: Se hace un estudio para determinar el tiempo en aos en que
fallan ciertas partes electrnicas de una marca de televisores. El resultado es el siguiente con una
muestra de 200 televisores seleccionados se redujo a dos tipos de fallas generales:
El diagrama de rbol resultante del planteamiento se refleja en la figura 2.2
Con el rbol resultante podemos determinar por ejemplo, cul es la probabilidad de que un
televisor con falla en el monitor haya fallado en un periodo de 1 a 5 aos? Aplicando la frmula
tenemos
Nota:
Ejemplo:
Se lanzan dos monedas al aire, cul es la probabilidad de que ambas caigan guila? La
probabilidad de que una moneda caiga guila es de 0.5 al ser lanzada. Podemos deducir que el
lanzar una segunda moneda no tiene relevancia con el lanzamiento de una primer moneda, por
ende, son eventos independientes.
Entonces
Existe un 25% de probabilidades de que caigan dos guilas seguidas. Podemos comprobarlo
utilizando un diagrama de rbol como la figura 2.4
2. Devore, J. (2008). Probabilidad y estadstica para ingeniera y ciencias. (7a. Ed.). Mxico:
Cengage Learning. Captulo: 2, pgina 86
En el siglo XVIII, el reverendo Thomas Bayes, ministro presbiteriano ingls, intent demostrar la
existencia de Dios desarrollando una frmula que evaluaba la posibilidad de su existencia con base
en la evidencia existente en la tierra.
Laplace afin el trabajo de Bayes y le dio el nombre de Teorema de Bayes y lo defini como el
resultado obtenido por la distribucin de probabilidad condicional de un evento A, dado que ocurri
B, en trminos de la probabilidad condicional del evento B dado que ocurri A y la distribucin de
probabilidad el evento A.
Ejemplo:
Se han colocado dos embarques cada uno con 20 computadoras porttiles de reciente modelo. Se
sabe que en el embarque 1 existen 5 computadoras descompuestas y en el embarque 2 existe una
computadora descompuesta.
En donde:
Glosario
Probabilidad conjunta: Probabilidad que mide la posibilidad de que dos o ms eventos ocurran en
forma simultnea.
Probabilidad y estadstica
Tema 3. Tcnicas de Conteo
3.1 Diagrama de rbol
Una forma grfica para obtener el total de eventos resultado de un experimento es a travs de un
diagrama de rbol. La mejor manera de verlo es a travs de un ejemplo.
Ejemplo:
En el mundial de futbol del 2010, la Seleccin Mexicana deber enfrentar a tres rivales en la
primera fase y obtener la mayor cantidad de puntos posibles para acceder a la siguiente fase.
Considerando nicamente la primera fase, cuntas posibles combinaciones de resultados puede
obtener la Seleccin Mexicana?
Considerando nicamente los tres juegos en donde se puede perder, empatar o ganar, la lista de
resultados posibles est dada por el siguiente diagrama:
Fig. 3.1 Posibles eventos del experimento jugar la primera fase de un mundial
Sin embargo, puede resultar poco prctico llevarlo a cabo pues la cantidad de resultados puede ser
muy grande, de manera tal que podra ser complicado construirlo y de poca utilidad para visualizar
las ramas que cumplen con el requerimiento deseado.
Existen tcnicas matemticas que permiten obtener el total de elementos en un espacio muestral
para un experimento dado, entre las que se encuentran:
Principio multiplicativo
Principio aditivo
Permutaciones
Combinaciones
Sin embargo existen experimentos en los que describir eventos posibles resultara tedioso, el
enlistar y contar todas las formas posibles de obtener los eventos, pues la cantidad de posibles
combinaciones puede llegar a ser enorme; como podra ser seleccionar un conjunto de seis
nmeros de cincuenta y uno posibles para participar en el sorteo Melate.
Frmula de la multiplicacin
El principio multiplicativo establece que si hay m formas de hacer una cosa y n formas de hacer
otra, existen m x n formas de realizar ambas.
Ejemplo:
Un hombre de negocios busca determinar cul combinacin traje, camisa y corbata debe elegir
para concretar una importante negociacin. En su guardarropa, el hombre encuentra:
Cuatro trajes.
Siete camisas de vestir.
Cinco corbatas.
Suponiendo que los trajes, las camisas y las corbatas son combinables, de cuntas maneras
puede ir vestido este hombre de negocios?
Donde
El principio aditivo establece que si existen dos actividades en donde la primera tiene M formas de
ser realizada y la segunda Nformas de ser realizadas, entonces el conjunto de actividades puede
ser llevado a cabo de M + N formas.
Ejemplo:
Un escritorio.
Un archivero.
Un librero.
Al llegar a la mueblera se da cuenta que existen escritorios de madera y metlicos, cada uno en
cuatro colores diferentes, tambin encuentra archiveros de uno, dos y tres cajones en tres colores
diferentes y libreros de dos, tres, cuatro y cinco estantes en tamao chico, mediano y grande. De
cuntas maneras puede seleccionar un mueble de cada tipo?
Sea:
Sabemos que de los escritorios existen dos tipos de materiales en cuatro colores distintos,
entonces aplicamos la frmula de la multiplicacin:
Donde
Tambin sabemos que tienen archiveros de dos, tres y cuatro cajones en tres colores diferentes,
entonces aplicamos la frmula de la multiplicacin:
Donde
Posteriormente, sabemos que tienen en existencia libreros de dos, tres, cuatro y cinco estantes en
tres tamaos diferentes, entonces aplicamos la frmula de la multiplicacin:
Donde
Finalmente, para determinar de cuntas formas pueden seleccionar los muebles de oficina,
aplicamos la frmula de la adicin:
Donde
3.4 Permutaciones
La permutacin nos ayuda a determinar el nmero posible de arreglos cuando slo hay un grupo
de elementos.
1. Mason, R., Lind, D. (1995). Estadstica para administracin y economa. (7a. Ed.). Mxico:
Alfaomega Grupo Editor. Captulo: 5.
Ejemplo:
En un evento de caridad, existe una urna con 10 pelotas diferentes e identificables entre s.
Suponga que el presidente de la institucin de caridad desea obtener tres pelotas que definirn a
los ganadores de una rifa del primero, segundo y tercer premio respectivamente. Cul es la
cantidad de permutaciones posibles al seleccionar tres ganadores de un total de 10?
El evento consiste en obtener tres pelotas sin repeticin, dado que una persona no puede ganar
dos premios, y deseamos saber el total de permutaciones.
Donde
Entonces:
Se tienen 720 diferentes formas de obtener tres ganadores seleccionando 3 pelotas en una urna
de 10.
Ejemplo:
Supongamos que en el alfabeto solo existen 5 letras, cuntas palabras de tres letras podran
formarse con 5 letras?
En este caso, las letras pudieran repetirse al ir formando palabras, por tanto, se aplica la frmula
de la permutacin con repeticiones:
Donde
Entonces:
3.5 Combinaciones
En el caso de las permutaciones, otro aspecto importante adems de la repeticin, es que importa
el orden en que se obtienen los objetos del conjunto. En el ejemplo de obtener dos pelotas de una
urna de 10, no es lo mismo obtener primero la pelota A y en segundo lugar la pelota B que obtener
primero la pelota B y en segundo lugar la pelota A, pues en este caso, la permutacin contara dos
veces el obtener la pelota A y B.
Ejemplo:
Supongamos que en la rifa efectuada en el evento de caridad, los tres ganadores obtendrn el
mismo premio, es decir, el premio para cada uno de los tres elegidos es el mismo sin importar
quin salga en primero, quin en segundo y quin en tercero. Cul es la cantidad de
combinaciones posibles al seleccionar tres pelotas de un total de 10?
El evento consiste en obtener tres pelotas sin repeticin, dado que una persona no puede ganar
dos premios, y deseamos saber el total de combinaciones, pues no importa el orden en que se
obtengan las tres pelotas. Aplicando la frmula tenemos
Donde
Entonces:
Se tienen 120 diferentes formas de obtener tres pelotas en una urna de 10 pelotas sin importar el
orden en que se seleccionen.
Glosario
Principio multiplicativo: Establece que si hay m formas de hacer una cosa y n formas de hacer otra,
existen m x n formas de realizar ambas.
Principio aditivo: Establece que si existen dos actividades en donde la primera tiene M formas de
ser realizada y la segunda Nformas de ser realizadas, entonces el conjunto de actividades puede
ser llevado a cabo de M + N formas.
Una distribucin de probabilidad es un resumen grfico o tabular que nos muestra los resultados
esperados de un experimento, as como la probabilidad asociada con cada uno de los resultados
esperados.
Ejemplo:
Supongamos que estamos interesados en determinar la suma de los puntos al lanzar dos dados
balanceados. El espacio muestral para este experimento es:
De la tabla podemos concluir el nmero de ocurrencias para cada resultado, es decir, el nmero de
resultados del experimento donde se obtiene una suma de 2 es 1, mientras que el nmero de
resultados donde se obtiene una suma de 7 es 6. Veamos el resumen una tabla, en donde tambin
se incluye la probabilidad de que ocurra el resultado:
2 1
3 2
4 3
5 4
6 5
7 6
8 5
9 4
10 3
11 2
12 1
Selecciona las columnas e inserta una grfica de columnas, tal como se ve en la siguiente imagen:
Fig. 4.2. Seleccin del tipo de grfica a insertar
Un claro ejemplo de una variable aleatoria discreta es la suma de los puntos de dos dados
balanceados.
Es importante notar que no necesariamente son valores enteros, tambin puedes ser valores
fraccionarios o decimales con cierta distancia entre ellos, como pueden ser puntuaciones
otorgadas por los jueces a los gimnastas en los juegos olmpicos, como la de los clavadistas en
donde los resultados podran ser datos como los siguientes:
Una variable aleatoria continua es vlida para un nmero infinito de valores dentro de un rango, en
otras palabras, es una variable que puede tomar cualquier valor de una cantidad infinitamente
grande de valores y que es resultado de medir algn elemento de inters.
El valor esperado de una variable aleatoria es una medida de tendencia central que representa a
una distribucin probabilstica. Tambin es el valor promedio a largo plazo de la variable aleatoria,
representado por E(X)
En otras palabras, el valor esperado de una variable aleatoria se calcula sumando las
multiplicaciones individuales de cada valor de X por su probabilidad de ocurrencia.
En otras palabras, la varianza de una variable aleatoria se obtiene como la suma de las
diferencias entre la media y cada valor individual, multiplicado por su probabilidad de ocurrencia.
Ejemplo:
Nmero de televisores
Probabilidad
vendidos
P(X)
X
0 0.10
1 0.20
2 0.30
3 0.30
4 0.10
Total 1.00
El valor esperado obtenido muestra que en promedio se venden 2.1 televisores en un sbado en
particular
Nmero de
televisores Probabilidad
X * P(X)
vendidos P(X)
X
0 0.10 0
1 0.20 0.2
2 0.30 0.6
3 0.30 0.9
4 0.10 0.4
Total 1.00 E(X) = 2.1
Nmero de
televisores Probabilidad
vendidos P(X)
X
0 0.10 0 2.1 4.41 0.441
1 0.20 1 2.1 1.21 0.242
2 0.30 2 2.1 0.01 0.003
3 0.30 3 2.1 0.81 0.243
4 0.10 4 2.1 3.61 0.361
Total 1.00
Como corolario, podemos definir la desviacin estndar como la raz cuadrada de la varianza, que
para este caso es de 1.136 televisores. Recuerda que la desviacin estndar es una medida de
dispersin que nos indica la distancia en promedio que existe entre los valores mximo y mnimo,
con respecto a la media.
Glosario
Promedio: Valor que representa un conjunto de datos. Seala un centro de los valores.
Media: Medida de tendencia central (promedio) que representa el valor central de un conjunto de
datos.
Donde:
X = Un valor especfico
N = Total de valores de la poblacin
Media muestral: Medida de tendencia central para una muestra de una poblacin
Donde:
X = Un valor especfico
n = Total de valores de la muestra
Varianza poblacional: Media aritmtica de las desviaciones cuadrticas con respecto a la media
para una poblacin.
Varianza muestral: Media aritmtica de las desviaciones cuadrticas con respecto a la media para
la muestra de una poblacin.
Desviacin estndar: Media aritmtica de los valores absolutos de las desviaciones con respecto a
la media. Se define como la raz cuadrada de la varianza.
Probabilidad y estadstica
Tema 5. Distribuciones de probabilidad discretas
5.1 Distribucin de probabilidad de Bernoulli
Si X es una variable aleatoria que determina el nmero de xitos y se realiza un slo experimento
con nicamente dos posibles resultados, entonces la variable aleatoria X tiene una distribucin de
probabilidad de Bernoulli. En resumen, las caractersticas principales de una distribucin de
Bernoulli son:
La frmula para calcular una probabilidad con la distribucin de Bernoulli es:
Ejemplo:
Sea:
Aplicando la frmula:
Donde:
Entonces
Esto significa que existe el 16.67% de probabilidades de que se obtenga un 6 al tirar un dado
balanceado.
Ejemplo:
En una lnea de ensamble se encuentra que 1 de cada 5 partes producidas tiene un milmetro ms
de lo deseado. Cul es la probabilidad de que en las siguientes 7 partes producidas se
encuentren dos cuya longitud es un milmetro mayor de la esperada?
Consideremos el experimento de encontrar una pieza con un milmetro mayor al deseado, donde:
Aplicando la frmula:
Esto significa que un 27.52% de las veces se encontrarn 2 partes con un milmetro de ms.
Como todo experimento en donde hay dos resultados posibles, la probabilidad de ocurrencia de los
eventos en un experimento con las caractersticas de la distribucin de probabilidad binomial, se
puede representar tanto en una tabla de resultados como en una grfica de barras.
Ejemplo:
Para generar la grfica, selecciona las columnas e inserta una grfica de columnas, tal como se ve
en la siguiente imagen:
Fig. 5.2. Seleccin del tipo de grfica a insertar
Grfica 5.3 Distribucin de probabilidad para las partes con longitud mayor en un milmetro
El clculo de la probabilidad de un evento en especfico, es una de las posibles preguntas que nos
hacemos en un experimento; en ocasiones puede ser conveniente determinar la probabilidad
acumulada de ciertos eventos. Continuemos con el ejemplo de la lnea de ensamble: En una lnea
de ensamble se encuentra que uno de cada 5 partes producidas tiene un milmetro ms de lo
deseado.
Para el primer caso, en donde se requiere saber la probabilidad de que tres o menos partes tengan
una longitud mayor a cero, debemos calcular la probabilidad de que se encuentren 0 partes, ms la
probabilidad de que se encuentre 1 parte, ms la probabilidad de que se encuentren dos partes y
la probabilidad de que se encuentren 3 partes con una longitud mayor en un milmetro.
Esto indica que existe un 96.67% de probabilidades de encontrar tres o menos partes con un
milmetro de ms.
Para la siguiente pregunta, sobre cul es la probabilidad de que en las siguientes 7 partes
producidas se encuentren dos o ms partes cuya longitud es un milmetro ms de lo esperado, se
sigue un procedimiento similar:
Esto indica que existe un 42.33% de probabilidades de encontrar dos o ms partes con un
milmetro de ms.
Para ayudar a responder preguntas del tipo mayor que, menor que, cuando mucho, al menos
y otras similares, es conveniente realizar una tabla con la probabilidad de ocurrencia acumulada.
Nmero de partes
Probabilidades Probabilidades
con un mm. de ms P(r)
menores de mayores de
(r)
0 0.2097 0.2097 1.0000
1 0.3670 0.5767 0.7903
2 0.2753 0.8520 0.4233
Se suma Se suma
3 0.1147 hacia 0.9667 hacia 0.1480
abajo arriba
4 0.0287 0.9953 0.0333
5 0.0043 0.9996 0.0047
6 0.0004 1.0000 0.0004
7 0.0000 1.0000 0.0000
Considerando esta tabla, podemos calcular las probabilidades sin realizar los clculos
involucrados. Por ejemplo. Supongamos que en la lnea de ensamble de nuestro ejemplo, se
obtiene una muestra de 6 piezas y deseamos obtener:
Sabemos que la probabilidad de encontrar una pieza con ms de un milmetro es del 20%.
Observando la tabla, podemos obtener directamente esta probabilidad:
r 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 0.735 0.531 0.262 0.118 0.047 0.016 0.004 0.001 0.000 0.000 0.000
1 0.232 0.354 0.393 0.303 0.187 0.094 0.037 0.010 0.002 0.000 0.000
2 0.031 0.098 0.246 0.324 0.311 0.234 0.138 0.060 0.015 0.001 0.000
3 0.002 0.015 0.082 0.185 0.276 0.313 0.276 0.185 0.082 0.015 0.002
4 0.000 0.001 0.015 0.060 0.138 0.234 0.311 0.324 0.246 0.098 0.031
5 0.000 0.000 0.002 0.010 0.037 0.094 0.187 0.303 0.393 0.354 0.232
6 0.000 0.000 0.000 0.001 0.004 0.016 0.047 0.118 0.262 0.531 0.735
En este caso, la probabilidad de encontrar dos piezas con un milmetro de ms, en una muestra de
seis piezas es del 24.6%.
r 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 0.735 0.531 0.262 0.118 0.047 0.016 0.004 0.001 0.000 0.000 0.000
1 0.232 0.354 0.393 0.303 0.187 0.094 0.037 0.010 0.002 0.000 0.000
2 0.031 0.098 0.246 0.324 0.311 0.234 0.138 0.060 0.015 0.001 0.000
3 0.002 0.015 0.082 0.185 0.276 0.313 0.276 0.185 0.082 0.015 0.002
4 0.000 0.001 0.015 0.060 0.138 0.234 0.311 0.324 0.246 0.098 0.031
5 0.000 0.000 0.002 0.010 0.037 0.094 0.187 0.303 0.393 0.354 0.232
6 0.000 0.000 0.000 0.001 0.004 0.016 0.047 0.118 0.262 0.531 0.735
En este caso, la probabilidad de encontrar cuando mucho tres piezas con un milmetro de ms, en
una muestra de seis piezas es del 98.3%.
r 0.05 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95
0 0.735 0.531 0.262 0.118 0.047 0.016 0.004 0.001 0.000 0.000 0.000
1 0.232 0.354 0.393 0.303 0.187 0.094 0.037 0.010 0.002 0.000 0.000
2 0.031 0.098 0.246 0.324 0.311 0.234 0.138 0.060 0.015 0.001 0.000
3 0.002 0.015 0.082 0.185 0.276 0.313 0.276 0.185 0.082 0.015 0.002
4 0.000 0.001 0.015 0.060 0.138 0.234 0.311 0.324 0.246 0.098 0.031
5 0.000 0.000 0.002 0.010 0.037 0.094 0.187 0.303 0.393 0.354 0.232
6 0.000 0.000 0.000 0.001 0.004 0.016 0.047 0.118 0.262 0.531 0.735
La probabilidad de encontrar al menos dos piezas con un milmetro de ms en una muestra de seis
piezas es del 34.5%.
Los empleados de facturacin rara vez cometen errores en la captura de los datos de facturas.
Muchas de las facturas no tienen errores, algunas tienen uno, unas cuantas tienen dos, rara vez
una factura tiene tres errores. Una muestra aleatoria de 100 facturas revel 30 errores, cul es la
probabilidad de que en una factura seleccionada al azar no se encuentren dos errores?
Considerando el experimento, tenemos que en 100 facturas se encontraron 30 errores, una media
de 0.3 errores por factura, entonces:
La Sra. Garca est encargada de los prstamos de un banco. Con base en sus aos de
experiencia, estima que la probabilidad de que un solicitante no sea capaz de pagar
oportunamente su prstamo es de 2%. El mes pasado, la Sra. Garca realiz 400 prstamos. Cul
es la probabilidad de que 5 prstamos no se paguen a tiempo?
Existe un 9.16% de probabilidades de que 5 de que los 400 los solicitantes no paguen su prstamo
oportunamente.
Para generar la grfica, selecciona las columnas e inserta una grfica de columnas, tal como se ve
en la siguiente imagen:
Fig. 5.5. Seleccin del tipo de grfica a insertar
Grfica 5.6 Distribucin de probabilidad para los solicitantes que no pagan a tiempo
Para este caso, en donde se requiere saber la probabilidad de mximo tres prstamos no se
liquiden a tiempo, debemos calcular la probabilidad de que no se liquiden a tiempo 0 prstamos,
ms la probabilidad de que no se liquiden a tiempo 1 prstamo, ms la probabilidad de que no se
liquiden a tiempo 2 prstamos y la probabilidad de que no se liquiden a tiempo 0 prstamos.
Esto indica que existe un 4.24% de probabilidades de encontrar tres o menos solicitantes que no
paguen su prstamo oportunamente.
Para ayudar a responder preguntas del tipo mayor que, menor que, cuando mucho, al menos
y otras similares, es conveniente realizar una tabla con la probabilidad de ocurrencia acumulada.
Prstamos no
Probabilidades Probabilidades
pagados a tiempo P(x)
menores de mayores de
(x)
0 0.0003 0.0003 1.0000
1 0.0027 0.0030 0.9996
2 0.0107 0.0138 0.9970
3 0.0286 Se suma 0.0424 Se suma 0.9862
hacia hacia
4 0.0573 abajo 0.0996 arriba 0.9576
5 0.0916 0.1912 0.9003
6 0.1221 0.3134 0.8087
7 0.1396 0.4530 0.6866
8 0.1396 0.5926 0.5470
9 0.1241 0.7166 0.4074
10 0.0993 0.8159 0.2833
11 0.0722 0.8881 0.1841
12 0.0481 0.9362 0.1119
13 0.0296 0.9658 0.0638
14 0.0169 0.9827 0.0341
15 0.0090 0.9918 0.0172
16 0.0045 0.9963 0.0082
17 0.0021 0.9984 0.0037
18 0.0009 0.9994 0.0016
19 0.0004 0.9998 0.0006
20 0.0002 0.9999 0.0002
21 0.0001 1.0000 0.0001
Considerando esta tabla, podemos calcular las probabilidades sin realizar los clculos
involucrados. Por ejemplo: supongamos que en el ejemplo de la Sra. Garca, se tiene un valor
de = 1.0 deseamos obtener la probabilidad de que dos o ms solicitantes no paguen
oportunamente su prstamo.
Ejemplo:
Se sabe que la cantidad de errores promedio es de 0.3 errores por factura. Para obtener la
probabilidad de encontrar un error, despejamos la frmula del valor esperado para la distribucin
binomial:
Despejando para p
Glosario
Distribucin de Bernoulli: Distribucin de probabilidad de experimentos con un solo ensayo con dos
posibles resultados.
Para comprender mejor, supongamos lo siguiente: Se realiza un experimento en donde se tira una
moneda en cinco ocasiones y se busca obtener la probabilidad de que se obtengan dos guilas,
considerando que la segunda guila es obtenida en el ltimo intento.
Podemos obtener aquellos eventos en donde se tienen dos guilas y en la ltima de ellas es un
guila. Los casos que cumplen esta condicin son:
De los 32 resultados posibles, solo 4 cumplen la condicin de contar con un resultado con dos
guilas, siendo uno de esos resultados el ltimo evento. De lo anterior, podemos concluir que la
probabilidad de que se obtengan dos guilas, considerando que la segunda guila es obtenida en
el ltimo intento es de 0.125
Se realiza un experimento en el cual se tira una moneda en cinco ocasiones y, se busca obtener la
probabilidad de que se obtengan dos guilas, considerando que la segunda guila es obtenida en
el ltimo intento.
Consideremos el experimento de encontrar una pieza con un milmetro mayor al deseado, donde:
Aplicando la frmula:
Esto significa que el 12.5% de las veces se obtendrn dos guilas, considerando que la segunda
guila es obtenida en el ltimo intento, lo que concuerda con el anlisis realizado mediante el
espacio muestral del experimento.
De los 32 resultados posibles, solo 1 cumple la condicin de contar con un resultado de un guila
en el ltimo evento. De lo anterior, podemos concluir que la probabilidad de que se obtengan un
guila, considerando que es obtenida en el ltimo intento es de 0.03125
Se realiza un experimento en donde se tira una moneda en cinco ocasiones y se busca obtener la
probabilidad de que se obtenga un guila en el ltimo intento.
Aplicando la frmula:
Durante la semana se fabricaron 50 televisores en donde 40 de ellos operaron sin ningn problema
y 10 tuvieron al menos un defecto. Se selecciona al azar una muestra de 5 televisores y se desea
saber cul es la probabilidad de que cuatro de los 5 seleccionados funcionen sin problemas.
Aplicando la frmula:
La probabilidad de que 4 televisores de los 5 seleccionados funcionen sin problema es del 43.13%.
Probabilidad y estadstica
Tema 7. Distribuciones de probabilidad continuas
7.1 Distribucin de probabilidad Uniforme
La distribucin de probabilidad uniforme es aquella que puede tomar cualquier valor dentro de un
intervalo, todos ellos con la misma probabilidad. Es una distribucin continua porque puede tomar
cualquier valor y no nicamente un nmero determinado.
Grficamente, la probabilidad de ocurrencia de un evento est dada por la lnea en el rango donde
la distribucin es vlida, como podemos observar en la siguiente figura:
Fig. 7.2 Probabilidad de ocurrencia para que en el evento se obtiene un valor entre a y c
Ejemplo:
En este caso, la probabilidad de que la precipitacin estimada sea cualquier valor entre 400 y 500
litros, est dada por:
Grficamente:
Fig. 7.3 Probabilidad de que la precipitacin estimada este entre 400 y 500 litros
Los resultados anteriores significan que la probabilidad de que caigan 400 litros, 401, litros, 402
litros, y as sucesivamente, es de 1%. Se espera, en promedio, que lluevan 450 litros de agua para
el prximo ao, con una desviacin estndar de 28.86 litros, es decir, se espera en promedio que
llueva entre 421.14 y 478.86 litros de agua el prximo ao.
Sabiendo que la probabilidad de que lluevan una cantidad especfica de litros de agua es de 1%
entre el rango de 400 y 500 litros:
En este caso, la probabilidad de que lluevan menos de 430 litros de agua est dada por la
probabilidad de que lluevan 400 litros, ms la probabilidad de 401, etc. Matemticamente:
Similarmente, la probabilidad de que lluevan ms de 490 litros de agua est dada por la
probabilidad de que lluevan 490 litros, ms la probabilidad de 491, etc. Matemticamente
se expresa de la siguiente forma:
La probabilidad de que lluevan entre 420 y 480 litros de agua est dada por la probabilidad
de que lluevan 420 litros, ms la probabilidad de 421, etc., hasta la probabilidad de que
lluevan 480 litros de agua. Matemticamente, se expresa:
La probabilidad de que llueva entre 420 y 480 litros de agua es del 60%. Grficamente:
Fig. 7.6. Probabilidad de que lluevan entre 420 y 480 litros de agua
Grficamente, la probabilidad de ocurrencia de un evento est dada por el rea bajo la curva, como
podemos observar en la siguiente figura:
Fig. 7.8 Probabilidad de ocurrencia o rea bajo la curva para la distribucin exponencial
Ejemplo:
Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribucin
exponencial con media de 8 aos. Cul es la probabilidad de que a una persona a la que se le ha
implantado este marcapasos se le deba reimplantar otro antes de 10 aos?
Sea X la variable aleatoria que mide la duracin de un marcapasos en una persona, entonces, si el
valor esperado est dado por:
La probabilidad de que el marcapasos dure menos de 10 aos, est dada por la funcin de
distribucin de probabilidad:
El resultado indica que existe una probabilidad del 71.35% de que el marcapasos deba ser
cambiado antes de 10 aos de uso.
Matemticamente, se expresa:
Integrando la funcin de densidad y evaluando en x = 9 y x = 7, tenemos que:
El resultado indica que existe una probabilidad del 9.22% de que el marcapasos deba ser
cambiado cuando haya sido usado entre 7 y 9 aos.
Glosario
Probabilidad y estadstica
Tema 8. Distribucin normal estndar y distribuciones relacionadas
En una poblacin normal, la relacin entre la media aritmtica y la desviacin estndar presenta
tiene la siguiente estructura:
68.25 % de los puntos estn a una distancia de +-1 desviacin estndar de la media.
95.45 % de los puntos estn a una distancia de +-2 desviaciones estndar de la media.
99.73 % de los puntos estn a una distancia de +-3 desviaciones estndar de la media.
99.99966 % de los puntos estn a una distancia de +-6 desviaciones estndar de la media,
que representa el estndar de calidad para Seis Sigma.
Lo anterior significa que si tomamos un elemento de la poblacin cuyo comportamiento sea normal,
tenemos 68.25% de posibilidades de que sea un elemento que est en promedio entre ms y
menos una desviacin estndar con respecto a la media.
Ejemplo:
Una prueba de duracin realizada a un gran nmero de pilas alcalinas revel que la duracin
media para un uso especfico antes de que falle es de 19 horas. La distribucin de las duraciones
aproxima a una distribucin normal con una desviacin estndar de 1.2 horas.
Aproximadamente el 68.25% de las bateras fall entre 17.8 horas y 20.2 horas (ms
menos una desviacin estndar).
Aproximadamente el 95.45% de las bateras fall entre 16.6 horas y 21.4 horas (ms
menos dos desviaciones estndar).
Aproximadamente el 99.73% de las bateras fall entre 15.5 horas y 22.6 horas (ms
menos tres desviaciones estndar).
Cada distribucin normal estndar tiene una media y una desviacin estndar diferente. Por tanto,
el nmero de distribuciones normales es ilimitado y resultara fsicamente imposible proporcionar
una tabla de probabilidades para cada combinacin de media y desviacin estndar.
Podemos utilizar un elemento de la familia de distribuciones normales para todos los casos donde
la distribucin normal resulte aplicable, tiene una media igual a 0 y una desviacin estndar igual a
1.
Para utilizar la distribucin normal estndar en un problema con una poblacin que se distribuye
normalmente, primero se convierte la distribucin en estudio a una distribucin normal estndar, es
decir, se le aplica una estandarizacin, utilizando el Valor Z.
Una vez estandarizada, podemos buscar la probabilidad del valor Z en la tabla del rea bajo la
curva normal. La tabla considera que el valor de Z empieza en 0 y contina hacia la derecha.
Debido a que la mayora de las observaciones est a 3 desviaciones estndar, los valores de
probabilidad de Z que podemos encontrar estn en el rango de 0 al 3.09.
Veamos el siguiente ejemplo: Si obtenemos un valor de Z = 1.96, el rea bajo la curva a obtener, y
por tanto la probabilidad del valor la probabilidad, buscaremos un valor de acuerdo a la grfica 8.2:
Fig. 8.3 rea bajo la curva para un valor de Z = 1.96
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0754
0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2258 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2518 0.2549
0.7 0.2580 0.2612 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2996 0.3023 0.3051 0.3079 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.334 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.398 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.443 0.4441
1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4700 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4762 0.4767
2.0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857
2.2 0.4861 0.4865 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.497 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4980 0.4980 0.4981
2.9 0.4981 0.4982 0.4983 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Para encontrar el valor de probabilidad para una Z = 1.96, buscamos primero en la columna Z,
donde localizamos el valor 1.9. Recorremos por la fila 1.9 entre las columnas hasta encontrar el
0.06, pues 1.9 ms 0.06 da el valor 1.96 que estamos buscando.
En la unin de la fila 1.9 y la columna 0.06, encontramos el valor 0.4750, que representa el rea
bajo la curva desde 0 hasta 1.96 en la distribucin de probabilidad.
Ejemplo:
Se desea conocer:
Dado que la curva es simtrica, podemos obtener el valor de Z = 2.10 de la tabla de la distribucin
normal estndar, cuyo valor es de 0.4821. Como se muestra en la figura 8.4, el rea bajo la curva
est dado por:
Fig. 8.4 rea bajo la curva para un valor de Z = 2.1
Lo anterior nos dice que existe una probabilidad del 48.21% de que un programador seleccionado
al azar obtenga un sueldo entre 790 y 1000 pesos diarios.
Para la segunda pregunta, determinar el porcentaje de los ejecutivos tienen ingresos de 1245 o
ms, es necesario determinar el rea entre la media de 1000 y una X de 1245.
Fig. 8.5, rea bajo la curva para los sueldos mayores de 1245
Dado que buscamos mayores a 1245, entonces al valor encontrado lo restamos de 0.5, lo que nos
da un valor de 0.0071. Esto quiere decir que el 0.71% de los programadores ganan arriba de los
1245 pesos diarios.
Para el ltimo punto, en donde se desea saber el sueldo diarios por debajo del que se encuentra el
30% de los programadores, veremos primero en la grfica dnde se encuentra el 30% ms a la
izquierda de la curva normal estndar:
Fig. 8.6, rea bajo la curva para el 30% con menor sueldo
Dado que la grfica es simtrica, obtenemos el punto en donde la probabilidad es el 0.2000 para la
tabla de la distribucin de probabilidad normal.
En la tabla no existe una Z donde el valor exacto sea 0.2000. Se seleccionan los dos puntos ms
cercanos al valor buscado y determinamos nuestro valor de Z como 0.525. Como nos interesa el
lado izquierdo de la curva, entonces el valor de Z es de -0.525:
Despejando para X:
Resolviendo la ecuacin:
Lo anterior significa que el 30% de los programadores ganan menos de 947.5 pesos diarios.
Una caracterstica hasta ahora no mencionada, es que en una distribucin binomial, al aumentar el
tamao de la muestra, se acerca a una distribucin de probabilidad normal.
Ejemplo:
En una pizzera se realiz un estudio en donde se descubri que el 70% de sus clientes nuevos
vuelven una segunda ocasin. En una semana en la que 80 clientes nuevos cenaron en el
establecimiento, cul es la probabilidad de que regresen 60 o ms en otra ocasin?
Debido a que estamos aproximando una distribucin discreta a una distribucin continua, es
necesario hacer un ajuste llamado factor de correccin de continuidad. Esto obliga a restar 0.5 al
valor que estamos buscando, es decir, 60 0.5 = 59.5.
Consideremos lo siguiente:
Debido a que buscamos la probabilidad de que regresen 60 o ms clientes, lo que nos interesa es
el valor de la probabilidad del z = 0.85 en adelante. Tambin sabemos que el rea bajo la curva de
cada mitad es de 0.5, entonces:
La distribucin de Weibull se aplica en los anlisis de fiabilidad para establecer, por ejemplo, el
periodo de vida de un componente hasta que presenta una falla. La distribucin de Weibull es til
por su habilidad para simular un amplio rango de distribuciones como la distribucin de
probabilidad normal y la distribucin de probabilidad exponencial.
Ejemplo:
Consideremos lo siguiente:
Ejemplo:
En un estudio realizado en maquinaria pesada, se encontr en promedio las mquinas fallan a los
2.32 aos de uso continuo, con una desviacin estndar de 0.45. Suponiendo que sigue una
distribucin Lognormal, cul es la probabilidad de que una mquina en especfico dure 8 aos o
menos?
Considerando:
Aplicando la frmula:
Grficamente, tenemos:
Fig. 8.9 rea bajo la curva para fallas en 8 aos o menos
Buscamos el valor de 0.5345 en la tabla de Z y lo restamos a 0.5, pues es la cola derecha la que
estamos buscando y que es igual a la cola izquierda del valor original.
Debido a que el valor de Z es de 0.5345, tomamos el promedio entre las probabilidades 0.53 y
0.54, lo que da como resultado un valor de 0.20365. Al 0.5 le restamos 0.20365 y obtendremos la
probabilidad deseada, que es de 0.29635.
Esto nos dice que la probabilidad de que falle una maquinaria antes de los 8 aos en una
distribucin lognormal es de 29.63%.
La distribucin de probabilidad beta es una funcin de densidad con dos parmetros definida en el
intervalo cerrado . Se utiliza frecuentemente como modelo para fracciones, como por
ejemplo: la proporcin de impurezas en un producto qumico o la fraccin de tiempo que una
maquina est en reparacin.
Ejemplo:
En el presupuesto familiar, la proporcin que se dedica a salud sigue una distribucin Beta con
parmetros a = 2 y b = 2. Cul es la probabilidad de que se gaste ms del 25% del presupuesto
familiar en salud?
Utilizaremos Excel para obtener la probabilidad con la funcin de distribucin Beta. Conociendo los
parmetros a y b, adems del valor de X = 25, aplicamos la frmula en Excel:
Donde:
La frmula en Excel nos da la probabilidad acumulada menor al valor de X, en nuestro caso, solo
hay que buscar la probabilidad complemento, la cul es de 0.84375. Este resultado nos dice que
existe una probabilidad del 84.37% de que se gaste ms del 25% del presupuesto familiar en
salud,
Glosario
Niveles de medicin.
Existe una clasificacin que nos permite distinguir la forma en que se presentan las estadsticas,
debido principalmente a las caractersticas de los datos que se tienen o que se van a reunir.
1. Nivel nominal.
En el nivel nominal no existe un orden particular entre los grupos, puesto que se pudo haber
ordenado por el nmero de personas que practican una religin. Otra caracterstica que podemos
obtener de la tabla, es que las categoras se consideran mutuamente excluyentes, lo que significa
que una persona no podra ser protestante y al mismo tiempo no tener ninguna religin, es
decir, cada persona, objeto o medicin se incluye solamente en una categora.
Finalmente, tambin podemos observar que las categoras son exhaustivas, lo que significa que
cada individuo, objeto o medicin debe aparecer en una categora.
2. Nivel ordinal.
En el nivel ordinal, las categoras se distinguen unas de otras por tener un orden
relacionado con mejor, superior, mayor, en donde una clasificacin tiene una mejor
posicin dentro del objeto de medicin. Veamos un ejemplo:
En este ejemplo, podemos ver que una calificacin Excelente es mejor que una calificacin Muy
bien.
Al igual que el nivel nominal, las categoras son mutuamente excluyentes y exhaustivas. La
principal diferencia con el nivel nominal es la relacin mayor que entre las categoras.
3. Nivel de intervalo.
La escala de medicin de intervalo incluye todas las categoras del nivel ordinal, pero adems la
distancia entre valores de la categora es constante. La siguiente tabla muestra un ejemplo de ello.
Las puntuaciones del examen se clasifican por categoras y tiene una relacin de mayor que
entre ellas. Sin embargo, tambin se puede determinar la diferencia entre estas puntuaciones
(categoras) y tales diferencias son de un tamao constante y conocido: La puntuacin 95 est 10
puntos por encima de una de 85, una puntuacin de 85 est 10 puntos por encima de una de 75 y
as sucesivamente.
Es el nivel de medicin ms alto. Tiene todas las caractersticas del nivel de intervalo: las
distancias son de un tamao conocido y constante, las categoras son mutuamente
excluyentes y exhaustivas. Existen dos diferencias entre el nivel de razn o cociente y el
nivel de intervalo:
El dinero es un buen ejemplo del nivel de razn: el tener 0 pesos tiene significado: no se tiene
ningn dinero! Asimismo, si una persona gana $40,000 pesos al mes y otra persona gana $10,000
pesos al mes, la primera persona gana 4 veces ms que la segunda.
Otros ejemplos de niveles de razn, son el peso de una persona, el nmero de aos dedicados a la
enseanza y el nmero de automviles vendidos el ltimo mes.
Ejemplo:
De la informacin sin procesar, podemos obtener un primer par de datos de inters: El valor menor
y mayor, marcados en la tabla. Resulta tedioso en este mundo de informacin obtener informacin,
incluso el valor ms grande o el ms bajo. Una forma de resolverlo es ordenando la tabla de mayor
a menor, pero lo nico que facilitara ser precisamente encontrar los valores menor y mayor de la
tabla.
Una mejor forma de resumir las rentas mensuales de condominios es organizarlas en una
distribucin de frecuencias.
1. El primer paso es establecer un conjunto de agrupamientos denominados clases. Una
clase puede contener todas las rentas desde 600 hasta 799, inclusive. La siguiente clase
podra ser desde 800 hasta 899 inclusive, as sucesivamente.
Cada clase tiene dos lmites: un lmite inferior declarado y un lmite superior declarado. Es prctica
comn que el lmite inferior de la primera clase sea uno ligeramente menor que la primera o ms
baja observacin.
Utilizando 200 una distancia entres los lmites inferiores de las clases, stas quedaran como sigue:
Un intervalo de clase se determina restando el lmite inferior declarado de la clase del lmite
inferior declarado de la siguiente clase. En el caso de la renta de condominios, el intervalo de
clases de 200.
El punto medio de una clase, denominado marca de clase, se determina localizando la mitad entre
los lmites declarados. Se determina sumando los lmites inferior y superior y dividiendo el total
entre dos:
Una forma prctica para obtener el intervalo de clase es utilizar la siguiente frmula:
De acuerdo a nuestro ejemplo, se decidieron formar 8 clases para clasificar la renta mensual de
condominios, entonces, el intervalo de clase est dado por:
Dado que es incmodo trabajar con un intervalo de 193.375, resulta prctico redondear el intervalo
de clase para la distribucin de frecuencias.
Recomendacin: Si no se est seguro del nmero de clases que se deban utilizar, podemos utilizar
la siguiente frmula:
2. El siguiente paso es llevar la cuenta de los valores de las clases y determinar cuntos
valores pertenecen a cada clase:
Forzar las rentas a una distribucin de frecuencias ha originado prdida de informacin, pues al
organizar los datos en clases, ya no es posible sealar con exactitud valores como 692 o 1218.
Sin embargo, las ventajas de resumir en forma comprensible compensan en alto grado la
desventaja.
Puede resultar conveniente convertir las frecuencias a frecuencias de clase relativas para mostrar
el porcentaje del nmero total de observaciones en cada clase:
La frecuencia relativa se obtiene dividiendo el nmero de unidades de cada clase entre el total de
observaciones:
A menudo los datos sobre ingresos, edades, etc., se agrupan y presenta en forma de una
distribucin de frecuencias, por lo general resulta imposible obtener los datos originales. Si nos
interesa un valor representativo para los datos, es necesario estimarlo con base en la distribucin
de frecuencias.
Media aritmtica
Para evaluar la media aritmtica de datos agrupados, las observaciones de cada clase se
representan con la marca de clase. La media de una muestra de datos organizados en una
distribucin de frecuencias se calcula con:
Ejemplo:
Nmero de Marca de
Clase
unidades clase
600 799 3 699.5 2,098.50
800 999 7 899.5 6,296.50
1000 1199 11 1099.5 12,094.50
1200 1399 22 1299.5 28,589.00
1400 1599 40 1499.5 59,980.00
1600 1799 24 1699.5 40,788.00
1800 1999 9 1899.5 17,095.50
2000 2199 4 2099.5 8,398.00
El valor de la media aritmtica obtenido a travs de datos agrupados, puede ser diferente a la
media aritmtica de la que se puede obtener de los datos originales, debido principalmente a la
prdida de informacin. De esta forma, la media aritmtica de datos agrupados slo puede
considerarse una estimacin de la media aritmtica de los datos no agrupados.
Desviacin estndar
Ejemplo:
Nmero de Marca de
Clase
unidades clase
600 799 3 699.5 2,098.50 1,467,900.8
800 999 7 899.5 6,296.50 5,663,701.8
1000 1199 11 1099.5 12,094.50 13,297,902.8
1200 1399 22 1299.5 28,589.00 37,151,405.5
1400 1599 40 1499.5 59,980.00 89,940,010.0
1600 1799 24 1699.5 40,788.00 69,319,206.0
1800 1999 9 1899.5 17,095.50 32,472,902.3
2000 2199 4 2099.5 8,398.00 17,631,601.0
Histograma
Para generar el histograma, selecciona las columnas e inserta una grfica de columnas, tal como
se ve en la siguiente imagen:
Si se hubiera graficado las frecuencias relativas en vez de las frecuencias de clase, la forma
general de la distribucin sera muy parecida.
Polgono de frecuencias
Para generar el polgono de frecuencias, selecciona las columnas e inserta una grfica de
columnas, tal como se ve en la siguiente imagen:
Tanto el polgono de frecuencias como el histograma permiten obtener una imagen rpida de las
principales caractersticas de los datos: mximos, mnimos, concentracin, etc. El polgono de
frecuencias es muy til cuando se quieren comparar dos o ms distribuciones de frecuencias
Para elaborar un polgono de frecuencias acumuladas del tipo menor que, se realiza
sumando de la primera clase hasta la ltima acumulando el nmero de observaciones por
clase:
Nmero de Frecuencia
Clase
unidades acumulada
Menos de 599 0 0
Menos de 799 3 3
Menos de 999 7 10
Menos de 1199 11 21
Se suma
Menos de 1399 22 hacia 43
abajo
Menos de 1599 40 83
Menos de 1799 24 107
Menos de 1999 9 116
Menos de 2199 4 120
Para elaborar un polgono de frecuencias acumuladas del tipo mayor que, se realiza
sumando desde la ltima clase hasta la primera acumulando el nmero de observaciones
por clase:
Nmero de Frecuencia
Clase
unidades acumulada
Ms de 599 3 120
Ms de 799 7 117
Ms de 999 11 110
Ms de 1199 22 99
Se suma
Ms de 1399 40 hacia 77
arriba
Ms de 1599 24 37
Ms de 1799 9 13
Ms de 1999 4 4
Ms de 2199 0 0
Para generar el polgono de frecuencias acumuladas, selecciona las columnas e inserta una
grfica de columnas, tal como se ve en la siguiente imagen:
Fig. 9.8 Insercin de polgono de frecuencia en Excel
Con un procedimiento similar para un polgono de frecuencias acumuladas del tipo mayor que, se
obtendra la siguiente grfica:
Fig. 9.10 Polgono de frecuencias mayor que para la renta de condominios
Glosario
Intervalo de clase: Diferencia entre el lmite inferior de la clase y el lmite inferior de la siguiente
clase.
Para garantizar que un estudio de una poblacin basado en una muestra es vlido, la muestra
tomada de la poblacin debe ser una muestra probabilstica, lo que significa que se debe
seleccionar la muestra de modo que cada integrante de la poblacin en estudio tenga una
probabilidad conocida, diferente de cero, de ser incluido en la muestra.
Al utilizar mtodos no probabilsticos para determinar los elementos que componen una muestra
poblacional, no todos los integrantes tienen la misma probabilidad de ser incluidos. En estos casos
los resultados del estudio pueden estar sesgados.
El problema con este tipo de mtodos es si existe un patrn predeterminado de la muestra, como
el caso de un almacn donde se tienen los artculos ordenados por el nivel de movimiento en el
mercado. Ordenarlos por rotacin reduce la aleatoriedad de la seleccin sistemtica.
Ejemplo:
De las 352 empresas, se busca una muestra de 50 empresas a travs de una muestra
proporcional.
Empleado comnmente para reducir el costo de muestrear una poblacin dispersa en un rea
geogrfica grande. Por ejemplo, si se desea hacer una encuesta respecto a las polticas estatales
acerca del medio ambiente, se subdividen las regiones del estado en reas pequeas comnmente
llamados municipios.
De las reas pequeas se seleccionan ciertas reas al azar y se concentran los esfuerzos de
muestreo en las reas seleccionadas.
Aunque la seleccin de la muestra poblacional sea lo ms aleatoria posible y garantiza que cada
miembro de la poblacin haya tenido la misma probabilidad de haber sido incluido, es poco
probable que la media muestral sea idntica a la media poblacional. De igual forma, la desviacin
estndar calculada a partir de la muestra, probablemente no ser la exactamente igual al valor
correspondiente de la poblacin.
Media muestral
La medida de tendencia central de uso ms amplio es la llamada media aritmtica. Para datos
originales o no agrupados, lamedia es la suma de todos los valores dividida entre el nmero total
de valores. A fin de obtener la media de una muestra, se usa la siguiente frmula:
Ejemplo:
Los pesos netos en gramos de cinco envases de un perfume, seleccionados en forma aleatoria de
la lnea de produccin son: 84.4, 85.3, 84.9, 85.4 y 85.0. Cul es la media de las observaciones
muestrales de los pesos de los envases?
Consideremos:
Matemticamente, se expresa:
Varianza muestral.
La frmula para calcular la media poblacional y la media muestral es prcticamente la misma, slo
cambia la forma en que representamos la media aritmtica y, por encima de todo, la forma en que
se interpreta el resultado.
Dado que se usa en lugar de , el total de valores utilizados en el numerador es muy pequeo.
Al dividir entre n 1 en vez de n, se compensa la subestimacin en el numerador. De esta
manera, se considera un estimador insesgado de la varianza poblacional.
Ejemplo:
Los sueldos por hora en una muestra de trabajadores de medio tiempo son: $2, $10, $6, $8 y $9.
Cul es la varianza poblacional?
Esto indica que el estimador de la varianza poblacional, la varianza muestral de los sueldos por
hora es de 10.
La varianza muestral del ejemplo anterior para los sueldos por hora se calcul como 10. Cul es
la desviacin estndar de la muestra? La desviacin estndar muestral es de $3.16, obtenida de la
raz cuadrada de 10.
Para usar un estimador muestral como un estimador puntual de una poblacin, debe cumplir con
ciertas caractersticas o propiedades:
Estimacin puntual.
La estimacin puntual utiliza los estadstico muestrales para determinar el valor de un parmetro
desconocido de una poblacin. Por ejemplo, cuando se utiliza la media muestral para estimar la
media de una poblacin, o bien, para estimar la desviacin estndar poblacional a travs de la
desviacin estndar muestral.
Pruebas de hiptesis.
En los siguientes temas veremos ms detalladamente los temas de estimacin puntual y pruebas
de hiptesis
Glosario
Muestra probabilstica: Muestra que se selecciona de modo que cada integrante, de la poblacin
en estudio, tenga una probabilidad conocida de ser incluido en la muestra.
Muestra aleatoria simple: Muestra formulada de manera que cada integrante de la poblacin, tenga
la misma probabilidad de quedar incluido.
Muestra aleatoria sistemtica Los integrantes de la poblacin se ordenan por algn mtodo y se
selecciona al azar un punto de inicio; despus se elige cada k-simo elemento de la poblacin para
la muestra.
Los cientficos dedicados a la conservacin de los recursos naturales calculan el peso promedio y
otras caractersticas de la poblacin de peces o presas de caza a travs de varios dispositivos. Con
base en los datos muestrales, una persona puede estimar que el peso promedio del salmn que se
pesca en algn lago del pas es de 2.5 Kg.
El peso promedio del salmn es una estimacin de un parmetro poblacional desconocido, pues es
prcticamente imposible que podemos identificar y medir toda la poblacin de salmones, pues sta
cambia constantemente debido al nacimiento de nuevos salmones o bien, precisamente a la pesca
o eliminacin natural de los mismos.
Ejemplo:
Valores negociados
26 27 26 20 21 42 30 22
22 21 26 9 21 22 28 26
19 16 20 32 18 23 32 28
21 41 19 31 21 22 16 23
30 21 37 28 39 30 21 23
Por ejemplo, el intervalo de confianza para la media poblacional es el intervalo que tiene una
mayor probabilidad de contener la media poblacional . Se utilizan con frecuencia dos intervalos de
confianza para la media poblacional: el intervalo de confianza de 95% y el intervalo de confianza
de 99%.
De dnde provienen los valores de 1.96 y 2.58? Veamos el caso del valor 1.96: el 95% central de
las medias muestrales se encuentra en cualquiera de los lados de la media poblacional, y
lgicamente, 0.95 / 2 = 0.4750. Entonces, el rea a la derecha de la media es de 0.4750, el rea a
la izquierda de la media tambin es de 0.4750. Utilizamos la tabla de la distribucin normal
estndar para obtener el valor de 0.4750:
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.443 0.4441
1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4700 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4762 0.4767
El error estndar de la media variar de acuerdo con el tamao de la muestra. A medida que se
aumenta el tamao de la muestra, la variabilidad de las medias muestrales se vuelve cada vez ms
pequea, lo que cumple con el principio de consistencia de un estimador puntual.
Ejemplo:
El intervalo de confianza de 95% para el ingreso mensual de todos los administradores y gerentes
es entre $35,168.87 y $35,671.13.
Interpretacin:
Si hubiera que seleccionar 100 muestras de tamao 256 de la poblacin de administradores para
calcular las medias muestrales y los intervalos de confianza, la media poblacional del ingreso
mensual se encontrara en 95 de los 100 intervalos de confianza y 5 de los 100 intervalos de
confianza no contendran a la media poblacional.
Supongamos que 1600 de 2000 electores empadronados que se muestrean dijeron que planean
votar por el candidato oficial para gobernador. Si se utiliza un grado de confianza de 0.95, cul es
la estimacin de intervalo para la proporcin de la poblacin?
Sabemos que 1600 de 2000 electores votarn por el candidato oficial, por lo tanto, la proporcin de
electores es:
El intervalo de confianza para la proporcin de votantes que votarn por el candidato oficial es
entre 78.247 % y 81.753 %
Glosario:
Estimacin puntual: Nmero (denominado punto) que se utiliza para estimar un parmetro
poblacional.
Intervalo de confianza: Intervalo dentro del que se espera est un parmetro poblacional.
Tasa de produccin
97
103
96
99
105
Para el primer caso, donde los valores para la muestra son 97 y 105, la media muestral es:
Como podemos observar los diferentes valores obtenidos de las medias muestrales para cada
muestra varan, qu comportamiento podemos observar de ello?
Ejemplo:
Una empresa industrial tiene siete trabajadores de produccin, considerados como la poblacin. La
retribucin (salario por hora) de cada empleado se presenta en la siguiente tabla:
Para construir una distribucin muestral de medias se tomaron muestras de tamao 4. Para
calcular el total de distintas muestras posibles utilizamos la frmula de las combinaciones:
Ahora construiremos la distribucin de media para las muestras de los salarios de los trabajadores
con un tamao de muestra igual a 4.
$7.50 3
$ 7.75 8
$ 8.00 13
$ 8.25 8
$ 8.50 3
Total 35
Con esta distribucin de probabilidad de muestras de medias, utilizando Excel podemos obtener la
grfica de la distribucin:
Fig. 12.1. Captura de distribucin de probabilidad en Excel
Para generar la grfica, selecciona las columnas e inserta una grfica de columnas, tal como se ve
en la siguiente imagen:
Observando la grfica 12.1, podemos observar que la distribucin de medias muestrales, tiende a
aproximarse a la curva normal.
Ejemplo:
De la tabla anterior, podemos deducir que la probabilidad de que al seleccionar un miembro del
equipo de karate, ste sea un fumador est dada por:
El resultado indica que existe un 33.33% de miembros del equipo que fuman. En este caso, el valor
esperado de proporcin de fumadores es:
Para construir una distribucin muestral de proporciones se tomaron muestras de tamao 4. Para
calcular el total de de distintas muestras posibles utilizamos la frmula de las combinaciones:
Ahora construiremos la distribucin de media para las muestras de los fumadores en el equipo de
karate con un tamao de muestra igual a 4.
Para obtener la media o valor esperado de las proporciones muestrales de fumadores en el equipo
de karate, utilizamos la siguiente frmula:
El resultado indica que existe un 33.33% de miembros del equipo que fuman, obtenido a travs de
una distribucin muestral de proporciones. De lo anterior podemos concluir:
Glosario
Distribucin muestral de medias: Distribucin de probabilidad que consta de una lista de todas las
medias muestrales posibles de un tamao de muestra dado de una poblacin y la probabilidad de
ocurrencia asociada con cada media muestral.
Distribucin muestral de proporciones: Conjunto de todas las muestras posibles del mismo tamao
extradas de una poblacin, junto con el conjunto de todas las proporciones muestrales.
Probabilidad y estadstica
Tema 13. Inferencia en una poblacin
13.1 Qu es una hiptesis?
Prueba de hiptesis
Supongamos que se afirma que la comisin mensual media de los vendedores de una empresa de
computadoras es de $ 20,000 pesos. Dado que no es posible entrevistar a todos los vendedores
para establecer que la media es en realidad $ 20,000 pesos, se debe seleccionar una muestra de
vendedores de computadoras, calcular estadsticas muestrales, y con base en determinadas reglas
de decisin aceptar o rechazar la afirmacin o hiptesis.
Existe un procedimiento de cinco pasos que sistematiza la prueba de hiptesis; al llegar al quinto
paso, se est en la capacidad de tomar la decisin de rechazar o no una hiptesis:
Despus de plantear la hiptesis nula y la hiptesis alternativa, el siguiente paso es definir el nivel
de significacin o bien, la probabilidad de rechazar la hiptesis nula cuando en realidad es
verdadera.
No hay un nivel de significacin que se aplique a todos los estudios que implican muestreo. Debe
tomarse una decisin de usar el nivel de 0.05 (que a menudo se enuncia como nivel de 5%), el
nivel de 0.01, el 0.10 o cualquier nivel entre 0 y 1.
Al realizar una prueba de hiptesis, adems del riesgo de rechazar la hiptesis cuando en realidad
debe aceptarse, corremos otro tipo de riesgo: aceptar una hiptesis cuando en realidad debe
rechazarse.
Ejemplo: A fin de ilustrar cmo es posible rechazar una hiptesis verdadera, supongamos que una
compaa manufactura computadoras personales y utiliza un gran nmero de tableros con circuitos
impresos. Los proveedores ofrecen precios de diversos tableros y al que presente la oferta ms
baja se le otorga un contrato. En el contrato se especifica que el departamento de calidad
muestrear todos los envos y si ms del 6% tiene defectos, se rechazar el envo.
Una muestra de 50 circuitos, revel que 4 tableros u 8%, tenan defectos. El embarque se rechaz
porque exceda el mximo de 6% de tableros defectuosos. Si la remesa era en realidad
defectuosa, entonces fue correcta la decisin de devolver los productos al proveedor. Sin embargo,
supongamos que los 4 defectuosos que se seleccionaron en la muestra de 50 eran los nicos
tableros defectuosos en el envo de 4,000 tableros. En este caso, solo el 0.1% eran defectuosos
(menos del 6%) y fue un error rechazar la remesa. Es decir, el fabricante de computadoras cometi
un error tipo I.
Hiptesis nula
Acepta Rechaza
Existen muchos estadsticos de prueba, entre los que se encuentran los estadsticos (normal
estndar), (t-student) y (Chi-cuadrada).
Una regla de decisin simplemente es una afirmacin de las condiciones bajo las que se acepta o
rechaza la hiptesis nula. Para lograr esto, la distribucin muestral se divide en dos partes,
denominadas regin de aceptacin y regin de rechazo. El rea de rechazo define la ubicacin de
todos los valores posibles que son demasiado grandes o demasiado pequeos, por lo que la
probabilidad de que ocurran segn una hiptesis nula verdadera es muy remota.
Fig. 13.1: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5%.
De acuerdo a la tabla normal estndar, para un nivel de significacin de 0.05, buscamos aquel
valor de z cuyo punto es 0.4500 (0.5 + 0.45 = 0.95):
Dado que el valor 0.4500 est entre 1.64 y 1.65, se utiliza un valor de Z de 1.645.
El quinto y ltimo paso en la prueba de hiptesis es decidir si se acepta o rechaza la hiptesis nula.
Respecto al diagrama 13.1 si, con base en la informacin muestral se calcula que z es de 2.34 a
travs del estadstico de prueba, la hiptesis nula se rechaza en el nivel de significacin de 5%,
pues el 2.34 se encuentra a la derecha de 1.645, es decir, se encuentra en la regin de rechazo.
Lo anterior significa que la hiptesis nula se rechaza debido a que es muy improbable que un valor
de z tan grande se deba al azar, esto es, a una variacin muestral.
Si el valor calculado de z hubiera sido 1.645 o menor, por ejemplo 0.71, la hiptesis nula sera
aceptada. Se razonara que un valor calculado de z tan pequeo podra ser atribuido al azar, esto
es, a una variacin en el muestreo.
En el diagrama 13.1 se aplica una prueba de una cola o extremo, es decir, la regin de rechazo
est en una de las extremidades de la curva. Una forma de determinar la ubicacin de rechazo es
observar la direccin en que apunta el signo de desigualdad en la hiptesis alternativa (ya sea < o
bien >).
Ejemplo: Las empresas desean que el rendimiento de un neumtico sea de 40,000 kilmetros en
condiciones normales de uso, por lo que se rechaza un envo si en una prueba acelerada de
duracin revela que la vida de los neumticos est significativamente por debajo de 40,000
kilmetros.
En este caso, dado que el signo < apunta a la regin de rechazo en la cola inferior, la prueba de
hiptesis para un nivel de significacin de 5%, mostrara la regin de rechazo y aceptacin de
acuerdo al diagrama 13.2.
Fig. 13.2: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de una cola inferior).
Ejemplo: Un productor de cajas de cereales afirma que en promedio, las cajas pesan 453 gramos.
Hay preocupacin de que las cajas de cereal se empaqueten con un peso superior a 453 gramos.
En este caso, dado que el signo > apunta a la regin de rechazo en la cola superior, la prueba de
hiptesis para un nivel de significacin de 5%, mostrara la regin de rechazo y aceptacin de
acuerdo al diagrama 13.3.
Fig. 13.3: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de una cola superior).
Si en la hiptesis alternativa no se especifica una direccin, se aplica una prueba de dos colas o
extremidades. Veamos un ejemplo:
En una consultora se especula que existe una diferencia entre el ingreso medio de hombres y
mujeres. El gerente est preocupado y afirma que no existe tal diferencia entres los ingresos
medios.
Matemticamente:
En este caso, dado que no existe una direccin del signo < o bien >, la prueba de hiptesis para un
nivel de significacin de 5%, mostrara la regin de rechazo y aceptacin de acuerdo al diagrama
13.4.
Fig. 13.4: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de dos colas).
Para realizar una prueba de hiptesis para la media de una poblacin, se utiliza el estadstico z
cuando el tamao de la muestra es grande (mayores a 30). La frmula es:
Ejemplo:
Se sabe que la distribucin de las tasas de eficiencia para los trabajadores de una compaa se
distribuye normalmente con una media poblacional de 200 y una desviacin estndar poblacional
de 16. El departamento de investigacin cuestiona esta media, afirmando que es diferente de 200.
Usa el nivel de significacin del 1% y probar la hiptesis de que la media poblacional es de 200.
Matemticamente:
El estadstico adecuado es z, pues se est analizando la hiptesis sobre una media poblacional
cuando el tamao de la muestra es grande (mayores a 30). La transformacin de los datos a
unidades estndares (valores z) permite que se usen en un gran nmero de problemas diferentes.
La regla de decisin se formula hallando el valor crtico de z a partir la tabla de z. Puesto que es
una prueba de dos colas, se busca la porcin de cada cola que determina la mitad del nivel de
significacin, en este caso la mitad de 0.01 es 0.005. El rea de aceptacin por consiguiente es de
0.99. De la tabla de z, buscamos el valor de z cuyo punto es 0.4950 (0.99 dividido entre 2, dada la
simetra de la curva normal)
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857
2.2 0.4861 0.4865 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964
Dado que el valor 0.4950 est entre 2.57 y 2.58, se utiliza un valor de Z de 2.575. Grficamente:
Fig. 13.5: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 1% (prueba de dos colas).
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de z no queda entre la regin -2.575 y + 2.575. En caso contrario,
no se rechaza la hiptesis nula.
Dado que 2.19 queda en la regin de aceptacin, la hiptesis nula que indica que la media
poblacional no es diferente de 200, se acepta con un nivel del 0.01 o 1%. La diferencia entre 203.5
y 200 puede atribuirse a una variacin aleatoria.
Fig. 13.6: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de dos colas).
Ejemplo:
Matemticamente:
La regla de decisin se formula hallando el valor crtico de z a partir la tabla de z. Puesto que es
una prueba de una cola, se busca la porcin de la cola derecha que determina la mitad del nivel de
significacin, en este caso la mitad de 0.4500.
Dado que el valor 0.4500 est entre 1.64 y 1.65, se utiliza un valor de Z de 1.645. Grficamente:
Fig. 13.8: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de una cola superior).
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de zqueda ms all del valor crtico: 1.645. En caso contrario, no se
rechaza la hiptesis nula.
Donde:
Sustituyendo en la frmula, tenemos:
Dado que 2.42 queda en la regin de rechazo, la hiptesis nula que indica que la media
poblacional es de $400 pesos, se rechaza con un nivel del 0.05 o 5%. Un valor as de grande
ocurrir menos de 5% de las veces. El gerente de investigacin rechazara la hiptesis nula de que
el saldo insoluto medio es de $400 pesos a favor de la hiptesis alternativa, que plantea que la
media es mayor a $400 pesos
Dado que la distribucin t es ms extendida que la distribucin z, los valores crticos de t para un
nivel de significacin dado, son mayores en magnitud que los valores crticos correspondientes
de z. Como auxiliar para determinar valores de t para diferentes tamaos de muestra de n se han
formado tablas similares a la siguiente:
Valores crticos de t
Niveles de significacin para prueba de una cola
Grados de 0.10 0.5 0.025 0.01 0.005 0.0005
libertad
(n 1) Niveles de significacin para prueba dos colas
0.20 0.10 0.05 0.02 0.01 0.001
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
Ejemplo:
Un estudio en una aseguradora revela que en promedio, cuesta $ 600 pesos la realizacin de
todos los trmites necesarios en un accidente automovilstico. Este costo se consider exorbitante
en comparacin con el de otras compaas aseguradoras y se instauraron medidas para abatir los
costos. A fin de evaluar el impacto de estas nuevas medidas, se seleccion aleatoriamente una
muestra de 26 demandas recientes y se realiz un estudio de costos. Se encontr que la media
muestral y la desviacin estndar de la muestra fueron $ 570 y $ 100, respectivamente. En el nivel
0.01 o 1% de significacin, hay una reduccin en el costo promedio o la diferencia entre 570 y
600 puede atribuirse al azar?
Matemticamente:
La prueba es de una cola, ya que slo interesa si hay una reduccin en el costo. Esta desigualdad
en la hiptesis alternativa seala hacia la regin de rechazo en la cola o extremidad izquierda de la
distribucin.
El estadstico adecuado es t, pues se est analizando la hiptesis sobre una media poblacional
cuando el tamao de la muestra es pequeo (menores a 30).
La regla de decisin se formula hallando el valor crtico de t a partir la tabla de t. Puesto que es una
prueba de una cola, se busca la porcin de la cola izquierda en la tabla de t para un grado de
libertad de 25 (26 1):
Valores crticos de t
Niveles de significacin para prueba de una cola
Grados de 0.10 0.5 0.025 0.01 0.005 0.0005
libertad
(n 1) Niveles de significacin para prueba de dos colas
0.20 0.10 0.05 0.02 0.01 0.001
21 1.323 1.721 2.080 2.518 2.831 3.819
22 1.321 1.717 2.074 2.508 2.819 3.792
23 1.319 1.714 2.069 2.500 2.807 3.767
24 1.318 1.711 2.064 2.492 2.797 3.745
25 1.316 1.708 2.060 2.485 2.787 3.725
26 1.315 1.706 2.056 2.479 2.779 3.707
27 1.314 1.703 2.052 2.473 2.771 3.690
28 1.313 1.701 2.048 2.467 2.763 3.674
Dado que el valor 0.4500 est entre 1.64 y 1.65, se utiliza un valor de t de 1.645. Grficamente:
Fig. 13.10 Regiones de aceptacin y de rechazo para un estadstico t con un nivel de significacin
del 1% (prueba de una cola inferior)
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de tqueda abajo del valor crtico: -2.486. En caso contrario, no se
rechaza la hiptesis nula.
Donde:
Dado que -1.53 queda en la regin de aceptacin, la hiptesis nula que indica que la media
poblacional del costo de trmites es de $600 pesos, se acepta con un nivel del 0.01 o 1%. Esto
indica que no hay una reduccin del costo promedio en los trmites relacionados con un accidente
automovilstico.
Una proporcin es la fraccin, porcin relativa o porcentaje que expresa la parte de la poblacin o
muestra que tiene un atributo particular de inters. En el caso de las pruebas de hiptesis de la
proporcin, la frmula a utilizar para el estadstico z es la siguiente:
Ejemplo:
Del resultado de la encuesta, se obtuvo: de los 2000 votantes potenciales en el rea del norte del
estado , 1550 tienen planes de votar por dicho candidato a gobernador. La proporcin de 0.775
(1550 entre 2000) es lo suficientemente cercana a la proporcin necesaria de 0.80 para afirmar
que el candidato ser elegido?
Paso 1: Plantear la hiptesis nula y alternativa.
Matemticamente:
La regla de decisin se formula hallando el valor crtico de z a partir la tabla de z. Puesto que es
una prueba de una colas, se busca la porcin de la cola izquierda que determina la mitad del nivel
de significacin, en este caso la mitad de 0.4500.
Dado que el valor 0.4500 est entre 1.64 y 1.65, se utiliza un valor de Z de 1.645. Grficamente:
Fig. 13.11: Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de una cola inferior).
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de zqueda ms all del valor crtico: 1.645. En caso contrario, no se
rechaza la hiptesis nula.
Donde:
Dado que -2.80 queda en la regin de rechazo, se rechaza la hiptesis nula con un nivel del 0.05
5%. La diferencia de 2.5 porcentuales entre el porcentaje muestral (77.5%) y el porcentaje
poblacional necesaria para ganar la eleccin del estado (80%), es estadsticamente significativa.
Glosario
Valor crtico: Nmero que es el punto divisorio entre la regin de aceptacin y la regin de rechazo.
Probabilidad y estadstica
Tema 14. Inferencia en dos poblaciones
14.1 Introduccin
Como se observ con anterioridad, para muestras grandes (n > 30) puede utilizarse el
estadstico z para la prueba de hiptesis de medias muestrales. En el caso de las pruebas de
hiptesis entre dos medias poblacionales, tambin se utiliza el estadsticoz siempre y cuando
tanto como son mayores a 30. La teora que subyace en este planteamiento se expone
brevemente:
Matemticamente se expresa:
Ejemplo:
Las especificaciones para los bloques de concreto utilizados en cimientos de los edificios indican
que la media aritmtica mnima de la resistencia a la compresin de una muestra de bloques debe
ser de 1000 psi (libras por pulgada cuadrada). Una muestra de dos compaas, cuyas muestras de
bloques indican una resistencia a la compresin superior a la mnima.
Si se aplica una prueba estadstica a los resultados muestrales y se determina que ambas
muestras pueden venir de poblaciones iguales, o idnticas, el contrato para los bloques se dividir
por igual. Si las estadsticas muestrales indican que comprende dos poblaciones, al fabricante que
enve los bloques con resistencia a la compresin ms alta se le adjudicar el contrato.
Matemticamente:
La regla de decisin se formula hallando el valor crtico de z a partir la tabla de z. Puesto que es
una prueba de dos colas, se busca la porcin de cada cola que determina la mitad del nivel de
significacin, en este caso la mitad de 0.01 es 0.005. El rea de aceptacin por consiguiente es de
0.99. De la tabla de z, buscamos el valor de z cuyo punto es 0.4950 (0.99 dividido entre 2, dada la
simetra de la curva normal)
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.4773 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857
2.2 0.4861 0.4865 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964
Dado que el valor 0.4950 est entre 2.57 y 2.58, se utiliza un valor de Z de 2.575. Grficamente:
Fig. 14:1 Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 1% (prueba de dos colas).
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de z no queda entre la regin -2.575 y + 2.575. En caso contrario,
no se rechaza la hiptesis nula.
Ahora calculamos el estadstico z para evaluar la hiptesis nula. De acuerdo a la frmula, tenemos:
Donde:
Dado que 5.01 queda en la regin de rechazo, la hiptesis nula que indica que la media
poblacional de la resistencia a la compresin no es diferente entres las dos compaas, se rechaza
con un nivel del 0.01 o 1%. La diferencia entre las medias muestrales no se debe al azar
Para calcular la media ponderada de las dos proporciones muestrales , se utiliza la siguiente
frmula:
Ejemplo:
Una de las preguntas es si el perfume es preferido por una proporcin mayor de mujeres jvenes o
maduras.
Se seleccionaron damas aleatoriamente y se les pidi que olieran varios perfumes en sucesin,
incluyendo el que suelen usar y, por supuesto, Stay-Away. La persona que realiza la prueba es la
nica que conoce los nombres de los perfumes.
Un total de 100 mujeres jvenes se seleccionaron aleatoriamente, veinte de las cuales eligieron
Stay-Away como el perfume que ms les agrad. Tambin se seleccionaron doscientas damas
maduras y a cada una se le aplic la misma prueba estndar. 100 de las 200 prefirieron Stay-
Away.
Matemticamente:
La regla de decisin se formula hallando el valor crtico de z a partir la tabla de z. Puesto que es
una prueba de dos colas, se busca la porcin de cada cola que determina la mitad del nivel de
significacin, en este caso la mitad de 0.05 es 0.025. El rea de aceptacin por consiguiente es de
0.99. De la tabla de z, buscamos el valor de z cuyo punto es 0.4750 (0.95 dividido entre 2, dada la
simetra de la curva normal)
De la tabla, se utiliza un valor de Z de -1.96 para la cola izquierda y de 1.96 para la cola derecha
de la grfica. Grficamente:
Fig. 14.2 Regiones de aceptacin y de rechazo para un estadstico z con un nivel de significacin
del 5% (prueba de dos colas)
Por consiguiente, la regla de decisin es: rechazar la hiptesis nula y aceptar la hiptesis
alternativa si el valor calculado de z no queda entre la regin -1.96 y + 1.96. En caso contrario, no
se rechaza la hiptesis nula.
Donde:
Donde:
Dado que -5.00 queda en la regin de rechazo, la hiptesis nula que indica que la proporcin de
mujeres jvenes que prefieren Stay-Away es igual a la proporcin de mujeres maduras que lo
prefieren, se rechaza con un nivel del 0.05 o 5%. La diferencia entre las proporciones no se debe al
azar.
Probabilidad y estadstica
Tema 15. Anlisis de datos discretos
15.1 Distribucin Chi-cuadrada
La distribucin de probabilidad Chi-Cuadrada, tambin llamada Ji-Cuadrado o Chi-Cuadrata de
Pearson, es una distribucin de varianzas muestrales , es decir que si se extraen todas las
muestras posibles de una poblacin normal y a cada muestra se le calcula su varianza, se
obtendr la distribucin muestral de varianzas.
Matemticamente:
Dada la gran cantidad de curvas Chi-Cuadrada existentes, se ha desarrollado una tabla de los
valores crticos considerando distintos grados de libertad.
Entre las pruebas de bondad de ajuste, la Chi-Cuadrada es una de las pruebas no paramtricas
ms utilizadas. Ideada por Karl Pearson a principios de 1900, es apropiada para los niveles de
datos tanto nominal como ordinal, aunque tambin puede utilizarse para niveles de datos nominal y
de razn.
El estadstico utilizado para realizar la prueba de bondad de ajuste es:
Ejemplo:
Supongamos que existen algunas dudas respecto al funcionamiento correcto de una de las
mquinas tragamonedas de un casino en Las Vegas, existe la sospecha de que est alterado el
mecanismo de una de las ventanillas de la mquina. Como experimento, se acciona 120 veces la
palanca de la mquina y se registran los resultados, que se enlistan en la siguiente tabla:
Para resolver la duda, utilizaremos el procedimiento de pruebas utilizado para las pruebas de
hiptesis de datos de nivel intervalo.
Matemticamente:
La regla de decisin requiere identificar un valor crtico en la curva Chi-Cuadrada que separe la
regin de rechazo de la regin de aceptacin. En una prueba de Chi-Cuadrada, para obtener el
valor correcto debemos considerar los grados de libertad de la prueba definidos como k-1,
donde k es representa al nmero de categoras. En nuestro caso, los grados de libertad son 5,
pues existen 6 categoras.
Obtenemos el valor crtico de Chi-Cuadrada con 5 grados de libertad y con un nivel de significancia
de 0.05 ( ), lo obtenemos de la tabla:
Observacin: La regin de aceptacin est a la izquierda del valor crtico. Por consiguiente, la regla
de decisin es: aceptar la hiptesis nula y rechazar la hiptesis alternativa si el valor calculado del
estadstico Chi-Cuadrada es menor o igual a 11.07. En caso contrario, se rechaza la hiptesis nula.
Dibujo en la ventanilla
Frecuencias observadas Frecuencias esperadas
izquierda
Pltano 13 20
Cereza 33 20
Naranja 14 20
Durazno 7 20
Limn 36 20
Pera 17 20
Donde:
Sustituyendo en la frmula, obtenemos:
Dado que 34.40 queda en la regin de rechazo, la hiptesis nula que indica no existe diferencia
entre el nmero de frecuencias observadas y el nmero de frecuencias esperadas, se rechaza con
un nivel del 0.05 o 5%. Esto indica que la mquina tragamonedas en estudio si presenta una
alteracin en la ventanilla izquierda.
Ejemplo:
Para resolver la duda, usaremos el procedimiento de pruebas utilizado para las pruebas de
hiptesis de datos de nivel intervalo.
Matemticamente se expresa:
Si la hiptesis nula se rechaza y es aceptada, ello significar que existen diferencias entre
la experiencia local y nacional con respecto al nmero de veces que un adulto mayor ingresa al
hospital local.
La regla de decisin requiere identificar un valor crtico en la curva Chi-Cuadrada que separe la
regin de rechazo de la regin de aceptacin. En una prueba de Chi-Cuadrada, para obtener el
valor correcto debemos considerar los grados de libertad de la prueba definidos como k-1,
donde k es representa al nmero de categoras. En nuestro caso, los grados de libertad son 6,
pues existen 7 categoras.
El valor crtico de Chi-Cuadrada con 6 grados de libertad y con un nivel de significancia de 0.05 (
), lo obtenemos de la tabla:
Observacin: La regin de aceptacin est a la izquierda del valor crtico. Por consiguiente, la regla
de decisin es: aceptar la hiptesis nula y rechazar la hiptesis alternativa si el valor calculado del
estadstico Chi-Cuadrada es menor o igual a 12.59. En caso contrario, se rechaza la hiptesis nula.
El nmero de frecuencias observadas que resulta del estudio de los adultos mayores locales no
puede compararse directamente con los porcentajes dados para los hospitales de la nacin. Sin
embargo, los porcentajes pueden convertirse en frecuencias esperadas, como se ve en la siguiente
tabla:
Donde:
Dado que 2.379 queda en la regin de aceptacin, la hiptesis nula que indica no existe diferencia
entre el nmero de frecuencias observadas y el nmero de frecuencias esperadas, se acepta con
un nivel del 0.05 o 5%. Esto indica los resultados de la experiencia local con respecto a los adultos
mayores de centros de asistencia hospitalizados es similar a la de otras partes del pas.
Si slo hay dos celdas, las frecuencias esperadas en cada celda deben ser cinco o ms. El
clculo de la Chi-Cuadrada sera permisible en el siguiente problema:
Frecuencias Frecuencias
Persona
observadas esperadas
Alfabeta 643 642
Analfabeta 7 6
Frecuencias Frecuencias
Nivel directivo
observadas esperadas
Supervisor 18 16
Subgerente 39 37
Gerente 8 13
Subdirector 6 4
Director 82 78
Presidente 10 15
163 163
Sin embargo, la Chi.Cuadrada no debe utilizarse para la informacin gerencial en la siguiente tabla
porque tres de las siete frecuencias, o sea 43%, son inferiores a cinco.
Frecuencias Frecuencias
Nivel directivo
observadas esperadas
Jefe de rea 30 32
Supervisor 110 113
Subgerente 86 87
Gerente 23 24
Subdirector 5 2
Director 5 4
Presidente 4 1
163 263
Glosario
Prueba de Bondad de Ajuste: Prueba de hiptesis para determinar el grado de las diferencias entre
una distribucin observada y una distribucin terica.