Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2010
Matemáticas Avanzada II
Unidad I. Probabilidad
Unidad I. Probabilidad
Definición de Probabilidad
Probabilidad subjetiva:
Por ejemplo:
Cuando utilizamos porcentaje de probabilidad decimos que la suma de todas las probabilidades
será igual a 100.
Otras consideraciones importantes es que la probabilidad de que ocurra un evento se denota por
p y la probabilidad de que no ocurra se denota por q por lo tanto
p+q=1 de aquí p = 1 - q
Donde:
p es probabilidad de éxitos
q es la probabilidad de fracaso
Por ejemplo:
Si de una caja que contiene manzanas y naranjas se han tomado 80 frutas y de éstas 15 han sido
manzanas, se deduce que, al sacar una fruta de esa caja, la probabilidad de que sea manzana es:
Definición:
Espacio Muestral.- Se llama espacio muestral (E) asociado a un experimento aleatorio, el conjunto
de todos los resultados posibles de dicho experimento.
Por ejemplo
1.4.- Eventos
Definición:
Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los siguientes
son eventos:
a.- Mutuamente excluyentes o disjuntos. Dos eventos son mutuamente excluyentes si no pueden
ocurrir en forma simultánea o al mismo tiempo.
Por ejemplo:
b.- Mutuamente no excluyentes entre sí: Cuando la ocurrencia de uno de ellos no impide que
suceda también otro.
Por ejemplo:
Por ejemplo:
Definición:
Por ejemplo:
Regla de la adición:
Regla de la Multiplicación:
Cuando dos eventos son dependientes se emplea el concepto de probabilidad condicional que se
verá más adelante
Una tabla de probabilidades conjuntas es una tabla en la que todos los posible valores ( o
resultados) de una variable se registran como encabezados de líneas, todos los posibles eventos
de una segunda variable se registran como encabezados de columnas y el valor incluido en cada
celda de la tabla representa la probabilidad de cada ocurrencia conjunta. A menudo, las
probabilidades de tablas de este tipo se basan en frecuencias observadas de ocurrencias conjuntas
que pueden servir de base para la elaboración de una tabla de probabilidades conjuntas y se le
llama tabla de contingencias.
Ejemplo:
La tabla 1: Es una tabla de contingencia en la que se describe por géneros y edad a 200 personas
visitantes de una tienda de ropa.
Tabla de contingencias de
Genero
Edad Total
Masculino Femenino
Menor de 30 60 50 110
Mayor de 30 80 10 90
Genero
Edad Total
Masculino(M) Femenino(F)
Menor de 30 (Mn) 0.30 0.25 0.55
Mayor de 30 (My) 0.40 0.05 0.45
Probabilidad
0.70 0.30 1.00
Marginal
Tabla No. 2
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurrió algún evento A
se llama Probabilidad condicional y se denota por P(B|A). El símbolo P(B|A) por lo general se lee
“La probabilidad de que ocurra B dado que ocurrió A” o simplemente “la probabilidad de B, dado
A”
Ejemplo:
b. La probabilidad de que un avión saliera a tiempo, dado que llegó a tiempo es:
Para todo i, j
Si esto no se cumple para todos los valores se dice que hay dependencia estadística.
Tomas Bayes matemáticos Inglés (1702 – 1761) desarrollo una fórmula que puede simplificar el
cálculo de las probabilidades condicionales.
La formula de Bayes, en su forma más sencilla, permite calcular la probabilidad de que ocurra el
evento B, si se sabe que ya ocurrió el evento A, esto es, P(B|A). Para ello se requiere conocer la
probabilidad simple de que ocurra el evento A, o sea P(A); la probabilidad siempre de que ocurra
el evento B, es decir, P(B); y la probabilidad de que ocurra el evento A, si se sabe que ya ocurrió el
evento B, o sea, P(A|B).
Lo anterior puede expresarse por medio de la siguiente formula, la cual se aplica a continuación.
Ejercicios Resueltos.
Regla de la adición
Al extraer un naipe de un mazo, los eventos As (A) y Rey (R) son mutuamente excluyentes, la
probabilidad de extraer un As o un Rey en una sola extracción es:
Regla de la multiplicación
Si una moneda se lanza dos veces, la probabilidad de que ambos lanzamientos den por resultado
una Sol es:
Teorema de Bayes
1.- El 55.26% de los automóviles de un estacionamiento son de 4 puertas. Los automóviles blancos
son el 21.27% del total, y los automóviles de 4 puertas escogidos de entre los blancos son el
59.77%. Determine el porcentaje de autos blancos escogidos de entre los de 4 puertas.
Solución.
El porcentaje deseado es: P(Autos Blancos que son de 4 puertas), lo cual puede obtenerse
aplicando la formula de Bayes para probabilidades condicionales.
2.- La máquina A de una fábrica de alfileres produce el 58% de la producción total de la fábrica,
mientras que la maquina B produce el 42% del total. La maquina A produce con un porcentaje de
alfileres defectuosos del 2%, en tanto que la maquina B produce con un 4% de defectuosos.
Solución:
Forma de tabular
a. Variables cualitativas
Pueden representarse:
La frecuencia absoluta (símbolo: f ó n), que es el nº de veces que aparece cada modalidad
(resultado del recuento). La frecuencia total, de todas las modalidades juntas, se
representa por N.
la frecuencia relativa (fr) o proporción se obtiene dividiendo la frecuencia de cada
modalidad entre el total de datos. fr = f / N. Los valores posibles oscilan entre 0 y 1. Suele
expresarse con 3 decimales. La suma de todas las fr tiene que dar 1 ó un número muy
cercano al 1, si ha habido redondeos.
el porcentaje (P o %), que es la frecuencia relativa multiplicada por 100. P = fr * 100 ó % =
(f*100)/N. Suele expresarse con 3 dígitos. La suma de todos los porcentajes debe dar 100
o un número muy próximo, si ha habido redondeos.
las frecuencia acumuladas (Sf ó Sn ) que se obtienen sumando la frecuencia de cada
modalidad a las frecuencias ya acumuladas anteriormente. En la primera modalidad no
hay nada acumulado de antes y por tanto su frecuencia acumulada será su misma
frecuencia. La última modalidad tiene que dar una frecuencia acumulada igual a N.
las frecuencias relativas acumuladas y los porcentajes acumulados se obtienen de forma
similar
En las variables nominales las modalidades pueden ponerse en el orden que se quiera,
pero en las ordinales hay que respetar el orden lógico.
Sección f fr % ∑f ∑fr ∑%
En la tabla definitiva no se presentan todos estos parámetros, sino los más adecuados en cada
caso concreto.
b. Variables cuantitativas
Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1 , 4)
Si son muchos se agrupan en clases, que son intervalos sucesivos de valores. Los datos se
asignan a la clase que les corresponde y se cuentan los datos de cada clase, que está
representada por el punto medio o centro de clase (pm ó c). Esta agrupación es arbitraria
con dos condiciones esenciales: que las clases sean mutuamente excluyentes y que todos
los datos puedan se asignados a una clase. Ahora bien, la experiencia ha ido introduciendo
una serie de normas, que permiten hacer esta agrupación de la forma más racional posible
(que se verá en distribución de frecuencias).
Una distribución de frecuencias son la forma más común de organizar un gran número de
datos, por ejemplo. Las calificaciones de los alumnos de primer semestre y a partir de ellas lograr
conclusiones que no eran visibles originalmente, un estudio que se puede hacer es la
concentración de calificaciones en sus niveles bajo. Medio y alto; incluso permiten definir líneas
de decisión, como los precios al mayoreo de cierto artículo, las tarifas de agua potable para una
ciudad, o las tablas de impuesto sobre la renta.
R = (límite real superior del dato mayor – límite real inferior del dato menor)
O si se prefiere: R = (valor tabulado máximo – valor tabulado mínimo) + 1
4. Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se reparten lo mejor posible entre
ambos extremos de la distribución fijando así los límites definitivos de la tabla.
5. Construir el esquema de la tabla, poniendo columnas de:
7. Escribir la TABLA DEFINITIVA. Son obligadas las clases y la frecuencia absoluta, pudiendo
añadir otros parámetros, si se considera que mejoran la información. Una tabla
excesivamente prolija resulta más difícil de leer. Por tanto la norma es: poner todo lo
necesario, pero no más de lo necesario. Algunos de éstos parámetros son los mismos que
se han visto para las variables CL. Otros precisan una aclaración:
Los límites de las clases son los valores inferior y superior de cada clase. (Límite
inferior y límite superior). Hay que distinguir entre los límites tabulados (LT) y los
límites reales (LR). Los límites tabulados son los datos originales que abren y
cierran una clase. Los límites reales son el límite real inferior del primer valor (LRI)
y el límite real superior del último (LRS).
El punto medio o centro de la clase (pm ó c) representa a la clase cuando se hacen
operaciones matemáticas. Es la media de los límites. Da lo mismo tomar los límites
reales que los tabulados, ya que ambos dan el mismo resultado.
En una distribución con todas las clases de la misma amplitud las diferencias entre
los puntos medios, los límites inferiores y los límites superiores de dos clases
consecutivas valen lo mismo y son igual a la amplitud de la clase (i). Esto facilita la
construcción de la tabla.
Una clase es abierta cuando carece de un límite. Sólo pueden ser abiertas la
primera clase (p.e. <10 ; no tiene límite inferior)) y la última (p.e. >100 ; no tiene
límite superior). No deben usarse, a no ser que no haya otro remedio.
Ejemplo:
Tabular los 70 valores siguientes:
Datos Originales (N = 70)
40 55 19 51 62 15 20 44 60 60
45 15 21 31 13 44 41 43 51 35
50 33 25 16 61 14 14 59 59 59
20 23 25 29 29 59 58 54 50 49
39 27 37 23 24 58 27 28 57 32
32 34 57 56 35 35 54 36 43 46
52 50 49 42 43 46 40 39 31 48
Pasos de la tabulación
Los gráficos son útiles porque ponen en renombre y aclaran las tendencias que no se captan
fácilmente en la tabla, ayudan a estimar valores con una simple ojeada y brinda una verificación
gráfica de la veracidad de las soluciones.
Histogramas
Un histograma de frecuencias es un gráfico que se forma levantando rectángulos sobre cada uno
de los Límites Reales de cada intervalo, con una altura equivalente a la frecuencia absoluta de
cada clase.
El histograma se utiliza para representar datos que corresponden a los valores de una variable
cuantitativa continua. Para indicar esta continuidad de la variable no se dejan espacios entre las
barras.
Polígono de frecuencias.
Un polígono de frecuencias es sólo una línea que conecta los Puntos Medios de todas las barras de
un histograma. En el polígono de frecuencia como en el histograma, el valor de la variable aparece
en el eje horizontal y la frecuencia absoluta o relativa en el eje vertical. La diferencia con respecto
al histograma es que el polígono sólo toma en consideración los Puntos medios de clase como
representativo de cada clase o intervalo.
La gráfica de una distribución de frecuencias acumuladas se conoce como ojiva Una distribución
de frecuencias acumuladas nos permite ver cuántas observaciones son menores o igual a un valor
específico, en lugar de hacer un mero registro del número de elementos que hay dentro de los
intervalos. El intervalo (o el límite superior del intervalo) aparece en el eje horizontal y la
frecuencia absoluta acumulada o relativa acumulada en el eje vertical. Esta gráfica facilita la
comparación dos grupos de datos de forma visual y de manera mucho más efectiva que el
polígono de frecuencia, puesto que permite comparar los porcentajes acumulados de dos
distribuciones con respecto al mismo intervalo.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27,
47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
Pasos de la tabulación
Punto
clases limites medio f fa fr % Grados
(limites tabulados reales c
3 7 2.5 6.5 4.5 1 1 0.025 2.5% 9
7 11 6.5 10.5 8.5 1 2 0.025 2.5% 9
11 15 10.5 14.5 12.5 3 5 0.075 7.5% 27
15 19 14.5 18.5 16.5 3 8 0.075 7.5% 27
19 23 18.5 22.5 20.5 2 10 0.05 5.0% 18
23 27 22.5 26.5 24.5 3 13 0.075 7.5% 27
27 31 26.5 30.5 28.5 4 17 0.1 10.0% 36
31 35 30.5 34.5 32.5 7 24 0.175 17.5% 63
35 39 34.5 38.5 36.5 8 32 0.2 20.0% 72
39 43 38.5 42.5 40.5 4 36 0.1 10.0% 36
43 47 42.5 46.5 44.5 2 38 0.05 5.0% 18
12 Gráfica de Pastel 1
2
2%
11 5% 2%
10 5% 3
4
10% 7%
8%
5
5%
9
20%
6
8 8%
18%
7
10%
Ojiva
60
Frecuenecia Acumulada
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12
Nombre de la Clase
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente
para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de
cada sector es proporcional a la frecuencia absoluta correspondiente:
Ej e mp l o
Baloncesto 12 124°
Natación 3 36°
Fútbol 9 108°
Total 30 360°
Grafica de Pastel
Una medida de posición es un valor calculado de un grupo de datos que sirven para describir a
éstos de alguna manera. Lo común es que nos interese que este valor sea representativo de todos
los valores del grupo, motivo por el cual es de desear cierto tipo de promedio. Un promedio es una
medida de la tendencia central de una serie de datos o valores.
Asdasdasdasdsa.
asd