Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Descriptiva
Conceptos básicos. Variables
Distribución de frecuencias para variables cualitativas y discretas. Diagrama de Barras y
Ojiva Discreta.
Distribución de frecuencias para variables continúas. Gráficos, Histograma, Polígonos de
Frecuencias y Ojiva.
Medidas de Tendencia central: Media aritmética, mediana, moda.
Medidas de Posición: Cuartiles, Deciles y Percentiles.
Medidas de Dispersión: Rango, Varianza, Desviación Estándar, Coeficiente de Variación.
Propiedades de la media y la varianza
2. Probabilidad
Teoría básica de conjuntos.
Experimentos aleatorios y espacio muestral.
Eventos, Probabilidad de un evento.
Propiedades básicas de probabilidad.
Probabilidad Condicional, Independencia.
Teorema de Bayes.
3. Variables aleatorias y distribuciones de probabilidad
Concepto de Variable Aleatoria.
Distribuciones discretas de probabilidad.
Distribuciones continúas de probabilidad.
4. Esperanza matemática
Valor esperado de una variable aleatoria.
Varianza de una variable aleatoria.
Medias y varianzas de combinaciones lineales de variables aleatorias.
5. Algunas distribuciones discretas de probabilidad
Distribución Uniforme Discreta.
Distribución Binomial.
Distribución Hipergeométrica
Distribución de Poisson.
1. Estadística Descriptiva
Conceptos Básicos:
Población y Muestra:
Población: conjunto total de elementos que poseen una o más características comunes
posibles de observar y sobre las cuales se buscan conclusiones para poder tomar
decisiones.
Muestra: Parte o subconjunto de la población.
Parámetro: son las características de una población.
Estadístico: características de una muestra.
Tipos de Variables:
Variable Estadística: es una medida informal de como la característica, atributo o medida que se
quiere conocer y estudiar. Existen dos tipos de variables:
Escalas de Medición:
Las escalas de medición permiten la clasificación de las variables de acuerdo al patrón que siguen.
Existen cuatro escalas de medición, dos para las variables cualitativas y dos para las cuantitativas.
1. Tabla de Frecuencias.
Es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su
frecuencia correspondiente.
Tipos de Frecuencias:
Se representan sobre un eje de coordenadas, sobre las abscisas (x) se colocan los valores de una
variable y sobre el eje de ordenadas (y) las frecuencias absolutas, relativas o acumuladas. Los
datos se representan mediante barras cuya altura es proporcional a la frecuencia.
3. Diagrama de Pastel.
Se puede utilizar para todo tipo de variables, aunque generalmente se utiliza para las cualitativas.
Los datos se representan dentro de un círculo de modo que el ángulo de cada sector es
360°
proporcional a la frecuencia absoluta correspondiente: α = ∗f i .
N
Presentación de Variables Cuantitativas
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución
estadística. Sirven para sintetizar la información obtenida en una tabla o en una gráfica.
1. De Centralización
Nos indican en torno a que valor se distribuyen los datos. Son:
Media Aritmética: la media es el valor promedio de la distribución.
Mediana: Es la puntuación de la escala que separa la mitad superior de distribución de la
inferior, es decir divide la serie de datos en dos partes iguales.
Moda: es el valor que más se repite en la distribución.
2. De Posición
Son las que dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de
menor a mayor. Son:
Cuartiles: dividen la serie de datos en cuatro partes iguales.
Deciles: divide la serie de datos en diez partes iguales.
Percentiles: divide la serie de datos en cien partes iguales.
3. De Dispersión
Nos informan que tan alejados del centro están los datos en la distribución, son:
Rango o recorrido: es la diferencia entre el dato mayor y el dato menor de una
distribución estadística.
Desviación Media: la desviación media es la media aritmética de los valores absolutos de
las desviaciones respecto a la media.
Varianza: es la media aritmética del cuadrado de las desviaciones respecto a la media.
Desviación Típica: es la raíz cuadrada de la varianza.
Coeficiente de Variación: es la relación entre la desviación típica de una muestra y su
media.
Moda Estadística:
La moda es el valor que tiene la mayor frecuencia absoluta, se representa por M o. Se puede hallar
para variables cuantitativas y cualitativas. Si en un grupo hay dos o más puntuaciones con la
misma frecuencia y dicha frecuencia es la máxima decimos que es bimodal o multimodal. Cuando
todas las puntuaciones tienen la misma frecuencia no hay moda. Si dos puntuaciones adyacentes
tienen la frecuencia máxima, la moda es el promedio de las puntuaciones adyacentes.
Es el valor que ocupa el lugar central de todos los datos cuando están ordenados de menor a
mayor, se representa por M ey solo se puede calcular para variables cuantitativas.
Mediana No Agrupada
Media Aritmética
Es el valor obtenido al sumar todos los datos y dividir este valor sobre el número total de datos. El
símbolo de la media aritmética es x́ . Se le conoce también como promedio.
∑ x1 f 1
x́= i=1
N
Propiedades de la Media Aritmética:
La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética es 7.6 es igual a
0:
Observaciones:
Media Ponderada
Nos permite calcular un promedio que toma en cuenta la importancia de cada valor con respecto
al total. Su símbolo es x́ w
∑(w∗x)
x́ w =
∑w
w es el peso asignado a cada dato.
∑( w∗x) es la sumatoria de los productos de la ponderación de cada elemento por el
elemento correspondiente.
∑ w es la suma de las ponderaciones.
Media Geométrica
Es una medida de tendencia central utilizada para medir la tasa promedio de cambio o crecimiento
de alguna cantidad, se calcula tomando la n-enésima raíz del producto de n-valores que
representa el cambio. Se representa por M.G. y se calcula utilizando esta fórmula:
Medidas de Distancia: Rango, Rango interfractil, Rango Intercuartil, Cuartiles, Deciles y Percentiles
Rango
El rango es la diferencia entre el más alto y el más pequeño de los valores observados.
Cuartiles
Son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Se denominan Q 1 ,Q 2 y Q 3 Y representan el 25%, 50% y 75% respectivamente. Q 2 Es la
mediana también.
Rango Intercuartilico
Diferencia entre los valores del primer cuartil y el tercer cuartil; esta diferencia representa el rango
de la mitad central del conjunto de datos.
Rango Intercuartil=Q3−Q1
Intervalo 1: los datos que caigan por fuera del intervalo 1 se consideran datos inusuales suaves.
I 1=( Q 1−1.5 RI , Q 3 +1.5 RI )
Intervalo 2: los datos que estén por fuera del intervalo 2 se consideran datos inusuales extremos.
I 2=( Q1−3 RI , Q3 +3 RI )
Cuando los datos se encuentran en una tabla de distribución de frecuencias seguimos los
siguientes pasos
En el caso de deciles y percentiles se aplican los mismos procedimientos tanto para datos
agrupados como para no agrupados. Se debe tener en cuenta que para los deciles el valor de
k =1,2,3 … 9 y N=10 . Para los percentiles k =1,2,3 … 99 y N=100 .
Medidas de Dispersión
Varianza de Población
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística. Nos dice la medida del cuadrado de la distancia promedio entre la media y
cada observación de la población. Su resultado se expresa en unidades al cuadrado de las
unidades de los datos. Se representa por σ 2. Se calcula con esta fórmula:
Σ(x−μ)2 Σ x 2
σ 2= = −μ 2
N N
x es la observación
μ es la media de la población
N numero total de elementos en la población
∑ suma de todos los valores ( x−μ)2, o todos los valores x 2
σ 2 varianza de la población
Varianza Poblacional Para Datos Agrupados:
Σ f ( x−μ )2 Σ fx 2
σ 2= = −μ2
N N
σ 2es la varianza de la población
σ es la desviación estándar de la población
f es la frecuencia de cada una de las clases
x es el punto medio de cada clase
μ es la media de la población
N tamaño de la población
Varianza de una Muestra:
Σ ( x− x́ )2 Σ x 2 n x́ 2
s2= = −
n−1 n−1 n−1
s2 Varianza de la muestra.
s Desviación estándar de la muestra.
x Valor de cada una de las n observaciones.
x́ Media de la muestra.
n−1 Número de observaciones de la muestra menos 1.
Propiedades de la Varianza
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean
iguales.
2. Si a todos los valores de la variable se le suma un numero la varianza no cambia.
3. Si a todos los valores de la variable se multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
varianzas, se puede calcular la varianza total.
σ 21+ σ 22 +σ 2n
Si todas las muestras tienen el mismo tamaño: σ 2=
n
k 1∗σ 1+ k 2∗σ 22+ k n∗σ 2n
2
2
Si las muestras tienen diferentes tamaños: σ =
k 1 +k 2 +k n
Observaciones
1. La varianza al igual que la media es muy sensible ante las puntuaciones extremas.
2. Cuando no podemos hallar la media no se puede hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los datos, las unidades son el
cuadrado de las unidades utilizadas.
Desviación Estándar de la Población
Raíz cuadrada positiva de la varianza; medida de dispersión con las mismas unidades que los datos
originales, más que en las unidades al cuadrado en que se expresa la varianza. Es la raíz cuadrada
del promedio de los cuadrados de las distancias entre las observaciones y la media. Se representa
∑(x−μ)2 ∑ x2
por σ . Se calcula de la siguiente manera: σ =√ σ 2=
√ N
=
√ N
−μ2
x es la observación
μ es la media de la población
N número total de elementos en la población
∑ suma de todos los valores ( x−μ)2, o todos los valores x 2.
σ desviación estándar de la población
σ 2 varianza de la población
Desviación Estándar de una población para Datos Agrupados
∑ f (x −μ)2 ∑ f x2
σ = √ σ 2=
√ N
=
√N
−μ 2
∑( x−x́)2 ∑ x 2 n x́2
s= √ s2 =
√ n−1
=
√ −
n−1 n−1
s2 Varianza de la muestra.
s Desviación estándar de la muestra.
x Valor de cada una de las n observaciones.
x́ Media de la muestra.
n−1 Número de observaciones de la muestra menos 1.
Coeficiente de Variación
Es una medida relativa de la dispersión, que puede compararse para diferentes distribuciones y
que expresa la desviación estándar como un porcentaje de la media. Se calcula de la esta forma:
σ
Coeficiente de variacion de la poblacion= ∗100
μ
1. Probabilidad
Un conjunto es un grupo de elementos bien definidos. Se denotan con letras mayúsculas y sus
elementos con letras minúsculas. Se representan gráficamente utilizando diagramas de Venn. Para
representar y definir los conjuntos utilizamos corchetes. Al interior de los corchetes utilizamos
comas para separar los elementos.
Descripción por Extensión: Cuando describimos los elementos de un conjunto por extensión es
mencionar todos los elementos que lo componen. Si un conjunto tiene muchos elementos se
utilizan los puntos suspensivos para denotar la extensión.
Descripción por Comprensión: Cuando mencionamos una o más características que comparten
todos los elementos del conjunto lo estamos describiendo por comprensión.
Clases de Conjuntos
Propiedades
1. Conmutativas:
A ∪ B=B ∪ A
A ∩ B=B ∩ A
2. Asociativas:
( A ∪ B ) ∪C= A ∪ ( B∪C )
( A ∩ B ) ∩ C= A ∩( B∩ C)
3. Complementarias:
A ∪ A C =U ; A ∪ ∅= A ; A ∪ U =U
A ∩ AC =∅ ; A ∪ ∅=∅ ; A ∩U =A
4. Involutivas:
¿
5. Idempotencia:
A ∪ A= A ; A ∩ A= A
6. Distributivas:
A ∪ ( B ∩C )=(A ∪B)∩( A ∪ C)
A ∩ ( B∪C )=(A ∩B)∪( A ∩C )
7. Leyes de D’Morgan:
¿
( A ∩ B)C = AC ∪ BC
8. Otras:
Si
A ⊂ B ,entonces A ∪ B=B y A ∩ B=A . ( A ∩ B ) ⊂ A y A ⊂ ( A ∪B ) para cualquier A y cualquier B .
Cardinalidad de Un Conjunto
Propiedades:
Probabilidad
Posibilidades y Probabilidades:
Metodo Axiomatico:
Se llamara suceso a cada caso posible, es decir, a la realización de un acontecimiento y este puede
ser:
Probabilidad Empírica:
Numero de exitos
P=
Total de Casos Posibles
Probabilidad a priori:
Consiste en una observación que nos determina en que momento ocurrieron eventos
semejantes en el pasado, que permitan establecer la probabilidad de que vuelva a ocurrir
en el futuro. También puede ser la fracción de veces que un evento se presenta a larga
cuando las condiciones son estables.
Experimento Aleatorio
Espacio Muestral
1. Finito: cuando podemos escribir y contar todos los elementos del conjunto decimos que
es finito.
2. Infinito Contable: quiere decir que es posible contar la progresión de los valores, pero
dicha progresión puede ser infinita.
3. Infinito: cuando el número de elementos dentro del espacio muestral son demasiados
para contarlos o enumerarlos. Utilizamos un intervalo para su descripción. Un intervalo es
un subconjunto de la recta numérica que está localizado en su totalidad entre dos valores.
Eventos:
Cuando encontramos la unión de dos eventos se crea un conjunto que es mayor o igual al evento
más grande. Al hallar la intersección de dos eventos se crea un conjunto que será menor o igual al
evento de menor tamaño. Unir dos conjuntos creando uno más grande se conoce como la unión
de eventos. Encontrar exclusivamente los resultados comunes entre dos conjuntos sé cómo como
la intersección de dichos conjuntos. Todos los posibles resultados dentro de un espacio muestral
que no pertenezcan a un evento se conocen como el complemento de dicho evento.
Probabilidad de un Evento:
Axiomas de Probabilidad
Regla de Multiplicación:
Regla de Adición:
La unión de dos eventos A y B es el conjunto de todos los resultados en un espacio muestral, que
están en A o en B o en los dos. Para hallar la probabilidad de la unión se debe sumar la
probabilidad de A y la de B, y luego restarle la probabilidad de la intersección de A y B para evitar
hacer un doble conteo. Utilizamos la siguiente fórmula para realizar el cálculo:
P ( A ∪ B ) =P ( A )+ P ( B )−P( A ∩ B).
Regla de Adición en Eventos Mutuamente Excluyentes:
Cuando los eventos son exclusivos no tienen una intersección, por lo cual al utilizar la regla
de adición para encontrar la probabilidad de la unión de dos eventos solo sumamos la
probabilidad de cada evento.
La regla de adición es la probabilidad de que el conjunto de resultados se encuentre en A o
en B o en los dos. Con eventos ME no existen resultados que se encuentren en los dos
conjuntos.
P ( A ∪ B ) =P ( A )+ P ( B )−P( A ∩ B). Regla para eventos independientes
P ( A ∪ B ) =P ( A )+ P ( B )−P( A ∩ B), P ( A ∩ B )=0, Entonces P ( A ∪ B ) =P ( A )+ P ( B )
Regla para eventos mutuamente excluyentes.
Eventos Independientes:
Que los eventos sean independientes no significa que no pueda ocurrir simultáneamente, en
probabilidad dos eventos independientes pueden ocurrir al tiempo y coexistir puesto que no
influyen entre ellos en términos probabilísticos.
Cuando dos eventos no pueden suceder simultáneamente y por lo tanto tienen una gran
influencia entre ellos, les llamamos mutuamente excluyentes. A ∩ B=∅ o P ( A ∩B )=0.
Saber que ocurrió un evento inmediatamente hace imposible que ocurra el otro.
Que dos eventos sean mutuamente excluyentes no siempre significa que tenga que ocurrir
uno o el otro evento, en otras palabras si ocurre un evento, sabemos que el otro no puede
suceder.
Si A y B son mutuamente excluyentes sucede lo siguiente, P ( A ∩ B )=0 entonces:
P( A ∩B) 0
P ( A|B )= = =0
P( B) P( B)
Los complementos de un evento siempre serán mutuamente excluyentes porque en
términos de resultados siempre serán opuestos.
Decimos que dos eventos son independientes cuando pueden ocurrir simultáneamente, lo cual
significa que se intersectan. La fórmula de probabilidad conjunta es la multiplicación entre las
probabilidades de cada evento, pero si son eventos mutuamente excluyentes no pueden suceder
al mismo tiempo por lo que no se interceptan, y su probabilidad conjunta debe ser igual a 0.
1. Es posible que dos eventos que no son vacíos y sean independientes, puedan también ser
mutuamente excluyentes.
No es posible dado que para que sean exclusivos no se deben interceptar y la probabilidad
de esto debe ser 0. La probabilidad conjunta es la multiplicación de las probabilidades
individuales y tanto A como B son independientes. La única manera de que fuese 0 es si
alguna de las dos probabilidades fuese 0, pero se especificó previamente que los eventos
no son vacíos. Si dos eventos son no vacíos e independientes no es posible que también
sean mutuamente excluyentes.
2. Tampoco es posible que dos eventos que son mutuamente excluyentes y no vacíos sean
independientes.
Dada la definición de independencia no es posible. Para que sean independientes se debe
cumplir que la probabilidad de A dado B sea igual a la probabilidad de A. pero como
sabemos que la probabilidad de A dado B es la probabilidad de la intersección sobre la
probabilidad de B. Como son mutuamente excluyentes no habrá probabilidad de la
intersección. Para que se cumpliera la definición de independencia alguna de las
probabilidades individuales debe ser 0 y para esto algún conjunto debe ser vacío. Si dos
eventos son mutuamente excluyentes y no vacíos no pueden ser independientes también.
La única manera para que eventos mutuamente excluyentes sean independientes o en el sentido
contrario es que uno o los dos eventos sean conjuntos vacíos.
Diagramas de Venn
Es un diagrama que utiliza un rectángulo para representar el espacio muestral círculos que
representan los diferentes eventos involucrados. Si los eventos se intersectan entonces los
círculos se sobreponen en algún punto, si son mutuamente excluyentes están separados y
no hay intersección.
El diagrama nos permite organizar la información que nos dan y utilizando las leyes de
conjuntos y de probabilidad, nos ayuda a organizar, identificar y encontrar las
probabilidades que nos piden.
La suma de todas las probabilidades de las uniones en el diagrama deben ser igual a 1
Los diagramas de Venn también nos permiten demostrar reglas intermedias de la teoría de
conjuntos como las Leyes de D’Morgan.
¿ la unión se cambia por una intersección
( A ∩ B)C = AC ∪ BC cambiamos la intersección dentro del paréntesis por una unión afuera
de ellos.
Una calle tiene dos semáforos. La probabilidad de que el primer semáforo este en rojo es de 0.40,
y la probabilidad de que el segundo este también en rojo es del 0.30. Se configuraron de esta
manera para que la probabilidad de que ambos caigan en rojo sea solo del 0.10.
1. El primer paso es dibujar el diagrama. Para ello definimos el espacio muestral y los que
contiene. En este caso el espacio muestral se conforma por todas las posibles situaciones
que ocurran con los dos semáforos: los dos están en rojo, los dos no están en rojo, uno
está en rojo y el otro no.
2. Respondiendo a las preguntas. Una vez el diagrama está completo podemos responder las
preguntas.
La probabilidad de que ninguna luz este en rojo es todo lo que está por fuera de
los círculos P ( A C ∩B C )=P ( A ∪ B )C ; 1−P( A ∪ B)aplicamos la regla de
complemento.
La probabilidad de que exactamente una luz este en rojo, es decir una esté en
rojo y la otra no. Esto puede ocurrir de dos maneras o la primera es roja y la
segunda no; o la primera no es roja y la segunda sí. La probabilidad de que la
primera este en rojo y la segunda no es (todo lo que hace parte de A pero incluye
a B) P ( A ∩B C )=0.30 , la probabilidad de que la primera no sea roja y la segunda
lo sea (parte de B que no incluye A) se denota como P ( B ∩ A C )=0.20 . La palabra
exactamente nos indica que los eventos son mutuamente excluyentes por lo que
no existe una intersección entre ellos y debemos sumar las probabilidades
marginales de cada conjunto; 0.30+0.20=0.50
Diagramas de Árbol
Algunos problema requieren de un proceso de varias etapas para encontrar la solución, para estos
casos necesitamos un método para visualizar el espacio muestral en cada una de las etapas del
proceso con sus posibles resultados, y que nos permite ver las diferentes combinaciones que se
dan al formar un resultado. Este método se conoce cómo un Diagrama de Árbol.
El diagrama de árbol utiliza diferentes ramas para representar cada etapa, también cada resultado
posible dentro de una etapa especifica se representa por otra rama en el árbol. Al finalizar se
siguen los diferentes caminos formados por las ramas para encontrar todos los elementos que
conforman el espacio muestral.
Primero debemos organizar todos los posibles resultados para después añadir las probabilidades
correspondientes a cada rama individual del diagrama. Para esto utilizamos la información que nos
da el problema y la regla del complemento.
Cuando los eventos son dependientes este segundo nivel es de gran ayuda ya que las
probabilidades dependen de lo que ocurrió en el primer nivel.
Ordenación de Probabilidades para Eventos Independientes:
Cuando dos eventos no tienen influencia sobre el otro decimos que sus resultados son
independientes. Para obtener la probabilidad conjunta solo debemos multiplicar la probabilidad
marginal de cada evento en cada rama.
El número de ramas en el primer nivel depende el número de opciones que tenemos para escoger.
En el segundo nivel se continua el proceso lo que cambia son las probabilidades que se le asigna a
cada suceso. Esto sucede debido a que esta probabilidad está condicionada por lo que ocurra en el
primer evento.
Las probabilidades en cada etapa deben siempre sumar 1 porque representan todos los posibles
desenlaces en dicha etapa.
El número total de elementos que componen el espacio muestral es el mismo que en el ejemplo
anterior pero como las etapas no son independientes las probabilidades cambian de una etapa a la
otra las probabilidades de los eventos finales no son iguales.
Cada una de las ramas de un diagrama de árbol se relaciona directamente con las reglas de
probabilidad. Las probabilidades del primer nivel se llaman probabilidades marginales porque solo
nos interesa la probabilidad de un solo evento. Las de segundo orden son las probabilidades
condicionales dado que dependen del resultado del primer evento. Para calcular las
probabilidades de los desenlaces en el espacio muestral debemos multiplicar las del primer nivel
con las del segundo nivel.
Por ejemplo suponga que los índices de satisfacción de tres supermercados en un área
específica son publicados por el periódico, junto con la participación de mercado que cada
uno tiene. Como es posible calcular el índice general de satisfacción sin importar a que
tienda acuda el consumidor.
Suponga que una persona hizo mercado en el área mencionada anteriormente y se fue
satisfecha. Se busca saber a qué mercado parece ser más probable asistió (después de que
el evento ocurriese).
Ley De Probabilidad Total: la probabilidad marginal que tiene un evento de ocurrir en segunda
instancia es igual a la suma de los productos de las probabilidades marginales (1er escenario) y
condicionales (2do escenario dado 1er escenario) sobre todas las posibles maneras de que ocurra
un dicho evento.
P ( A i )∗P(B∨A i)
P ( A i|B )=
∑ P ( Ai )∗P(B∨ Ai ) Donde Ai es un evento en particular que se dio en el primer
i
escenario, dado que en el segundo escenario ocurrió B.
Tablas de Contingencia
Es una tabla que clasifica los resultados y sus probabilidades correspondientes en filas y
columnas de acuerdo a la categoría a la cual pertenece el resultado.
Son una buena manera para representar probabilidades conjuntas, las filas indican si un
evento A ocurrió, y las columnas indican si B ocurrió. Las intersecciones entre filas y
columnas nos dicen las probabilidades conjuntas entre A, B y sus complementos.
Pueden utilizarse también como alternativa a los diagramas de Venn o de Árbol para
solucionar problemas donde debemos encontrar probabilidades marginales, conjuntas o
condicionales.
Para construir una tabla de contingencia debemos seguir los siguientes pasos:
Cada una de las celdas se denota a ij, donde la i nos dice la fila y la j nos dice la columna. El dato en
cada celda recibe el nombre de “cuenta”.
EJ:
Suponga que se quiere saber si el resultado del primer lanzamiento de falta influye o no en el
resultado del segundo lanzamiento de falta de un jugador profesional de basquetbol. Tomando
como muestra a su jugador favorito se tiene la siguiente información luego de observar 155 pares
de lanzamientos de falta.
1er Paso:
E1=Convirtio 1er tiro ; F1=Fallo 1 er tiro ; E2=Convirtio 2do tiro ; F2 =Fallo 2 do tiro
;
S={E1 E2 , E1 F2 , F1 E2 , F 1 F 2 }
2do Paso:
Pasos 3 y 4
La probabilidad conjunta es la intersección de dos eventos, en este caso encestar los dos tiros. La
celda a 11nos dice el número de elementos en ( E1 ∩ E2 ) el cual debemos dividir por número total
60
de datos. =0.39
155
La fórmula general para probabilidades conjuntas en tablas de contingencia es:
Cuenta en aij
P( A ∩ B)= , donde a es la celda denotada por la fila i y la columna j
GranTotal
¿Cuál es la probabilidad de que enceste el primero? Probabilidad Marginal
Nos están preguntando cual es la posibilidad de que convierta el primer tiro sin importar lo que
pase en el segundo, en otras palabras es la probabilidad de un solo evento. Para encontrar el
resultado debemos tomar el total de la fila que representa éxito en el primer tiro y dividirlo por el
100
total de datos. =0.65
155
Formula Probabilidad Marginal de un Evento en la Fila i:
Total de la fila i
P( Evento Fila i)=
GranTotal
Formula Probabilidad Marginal de un Evento en la Columna j:
Total de la columna j
P( Evento Columna j)=
GranTotal
¿Cuál es la probabilidad de que convierta el segundo tiro si fallo el primero? Condicional
Es condicional porque nos pide la probabilidad de encestar dado que ya fallo el primer tiro. Para
encontrar este valor utilizamos la fórmula de probabilidad condicional.
45
P ( E2|F1 ) = =0.81.
55
Se toman los números que representan la intersección del evento y lo dividimos por el total de la
fila o la columna que representa la probabilidad marginal del evento que ya ocurrió:
P (E2 ∩ F 1)
P ( E2|F1 ) =
P( F 1)
Cuenta en aij
P ( Fila i|Columna J )=
Total de la Columna j
Probabilidad condicional de un evento en la columna j dado que ocurrió el evento en la fila i:
Cuenta en aij
P ( Columna j|Fila i ) =
Total de la Fila i
¿Si fallo el primer tiro, afecta esto las posibilidades de encestar el segundo?
Para poder responder esta pregunta debemos determinar si son eventos independientes o
dependientes.
Independiente Dependiente
P ( A|B )=P( A) P ( A|B ) ≠ P( A)
P ( A|BC )=P (A ) P ( A|BC ) ≠ P( A)
P ( A|B )=P( A∨BC ) P ( A|B ) ≠ P( A∨B C )
Con esta información comprobamos para saber si son independientes o no de acuerdo a los
criterios de la tabla.
1. la probabilidad de acertar los dos tiros debería ser igual a la probabilidad de acertar
fallando el primero. 0.6 no es igual a 0.82 por lo tanto son dependientes. (fila 3)
2. La probabilidad de fallar el segundo tiro debería ser la misma dado que se acertó o se falló
el primer lanzamiento debería ser la misma. 0.18 no es igual a 0.4 entonces no son
independientes. (fila 3)
3. La probabilidad de acertar el segundo lanzamiento debe ser igual a la probabilidad de
acertar el segundo dado que se falló el primero (fila 2). O la probabilidad de acertar el
segundo debe ser la misma dado que se encesto en el primer intento (fila 1).
Técnicas de Conteo
1. Regla de Multiplicación:
Se tienen “K” conjuntos, n1en el primer conjunto, n2 en el segundo hasta n ken el k-
esimo. Suponga que se desea formar una muestra de K elementos tomando un
elemento de los K conjuntos.
El número de muestras distintas será: n1∗n2∗n3 …∗n k
Ejemplo:
Un menú contiene las siguientes opciones de platos: 2 sopas, 3 platos, 4 jugos y 5 postres.
NCn= ( Nn )= n !(NN−n)!
!
Ejemplo:
3!
n=2; 3 C 2= =3
2! ( 3−2 ) !
Hay 49 balotas y se escogen 6 de ellas.
49 !
n=6 ; 49 C 6= =13.983 .816
6 ! ( 49−6 ) !
3. Regla de Permutación:
Dado un conjunto de N elementos, claramente distintos se desea seleccionar n
elementos de los N y acomodarlos dentro de n posiciones.
N!
El número de permutaciones seria: NPn=
( N−n)!
Ejemplo:
3 P 2=6
10 personas en una competencia, 3 medallas: oro, plata, bronce
10 P3=720
8 personas en 8 filas
8 P 8=40.320
Notación Factorial:
n !=1∗2∗3 ⋯ n=(n−1)! n
Variable Aleatoria
Una variable aleatoria es una función que pertenece al espacio muestral S, para el conjunto de
todas las probabilidades posibles (intervalo [0,1]) y se denota como X . x Es un número real que
representa el valor de que toma la variable aleatoria. Hay dos tipos de variables aleatorias:
V.A. Discreta: cuando puede tomar un número finito de valores o un número infinito pero
contable de valores.
V.A. Continua: es cuando puede tomar un número infinito de valores dentro de un
intervalo dado.
Distribución de Probabilidad
La distribución de probabilidad de una variable aleatoria es una función que asigna a cada
suceso definido sobre la variable la probabilidad de que dicho suceso ocurra.
Una distribución de probabilidades es una lista de los resultados de un experimento con
las probabilidades que se esperarían ver asociadas a cada resultado. Una distribución de
frecuencias es el listado de las frecuencias observadas de todos los resultados de un
experimento que se presentaron cuando se efectuó este, mientras que una distribución de
probabilidad es un listado de las probabilidades de todos los posibles resultados que se
obtendrían en caso de que se efectuara el experimento.
2. Continuas: son aquellas que tienen un número infinito de valores posibles dentro un
intervalo dado.
Función de Probabilidad
Para una variable aleatoria discreta X , su funcion de probabilidad es aquella que le asigna
probabilidades a cada valor que pueda tomar X .
Para un espacio muestral, E de la variable aleatoria X consta de los valores x 1 , x 2 ⋯ xn y
probabilidades P1=P ( X =x 1) , P2=P ( X =x 2 ) , Pn=P (X=x n ).
Se denota por P ( x ) : R → R , es una funcion definida en los números reales que tomara
valores reales no negativos.
Se define Pn=P( X=x n ). En cualquier otro caso es 0.
Gráficamente se representa con un diagrama de barras. En el eje X colocamos los
diferentes valores de la variable aleatoria y en el eje Y las posibilidades también se pueden
representar en una tabla.
1 1 2
P ( 2 )=( 1,1 )= ; P ( 12 )=( 6,6 )= ; P ( 3 )=( 1,2 ) + ( 2,1 )=
36 36 36
La distribución de probabilidad de una variable aleatoria discreta debe cumplir con las siguientes
propiedades:
Función de Densidad
Cuando X es una variable aleatoria continua, decimos que la f ( x ) :R ⊆ R es la función de densidad
si X no es negativa, es integrable y para cualquier intervalo (a , b) ⊆R :
b
p [ X ∈ ( a , b ) ]=∫ f ( x ) dx La probabilidad se calcula con la integral de la función.
a
Función de Distribución
Esta función representa la probabilidad de que la variable aleatoria X sea menor o igual a
cualquier valor a y que sea igual a la suma de todas las probabilidades de X que son menores o
iguales a .
F ( a )=∑ P( X=x)
x≤ a
La función de distribución esta definida en todos los valores desde menos infinito hasta infinito
Esta funcion es útil para calcular la probabilidad de un evento como por ejemplo:
Va desde el valor mas bajo (7) hasta el mas alto posible (12).
6 5 4 3 2 1 21
P ( 7 ≤ x ≤12 )=P ( X =7 ) + P ( X=8 ) + P ( X=9 )+ P ( X=10 ) + P ( X=11 ) + P ( X=12 ) ; + + + + + =
36 36 36 36 36 36 36
Evento: Menos de 7
1 2 3 4 5
P ( X <7 ) =P ( X=2 ) + P ( X=3 ) + P ( X=4 ) + P ( X=5 )+ P ( X=6 ) ; + + + + =0.42
36 36 36 36 36
Cuando un evento dice por lo menos x, el complemento del mismo estaría en el evento menos de
x.
1 2 3 4 5 6 5 4 3
P ( 2≤ X ≤10 )=P ( X=2 )+ P ( X =3 ) …+ P ( X=9 ) + P ( X=10 ) ; + + + + + + + + =0.92
36 36 36 36 36 36 36 36 36
Evento: Por lo menos 10
Quiere decir todo los que esta por encima del 10 sin incluir el 10, es decir 11 y 12.
2 1
P ( X >10 ) =P ( X =11 ) + P ( X =12 ) ;+ + =0.08
36 36
Función de Distribución para X = Suma de Dos Dados
X F (x)
X <2 0%
Como interpretar la función de
2 ≤ X <3 1
o 2.9 % distribución
36
3 ≤ X <4 3
o 8.3 %
36
4 ≤ X <5 6 La función de distribución es
o 16.7 % especialmente útil para encontrar
36
5 ≤ X <6 10 probabilidades que estén expuestas en
o 27.7 % términos de menor que, mayor que o
36
6 ≤ X <7 15 entre dos valores de la variable aleatoria.
o 41.7 %
36 Problemas con Menor, menor o igual,
7 ≤ X <8 21
o 58.3 % mayor, mayor o igual
36
8 ≤ X <9 26 1. : es 72.2%, nos indica
o 72.2 %
36
9 ≤ X <10 30
o 83.3 %
36
10 ≤ X <11 33
o 91.7 % P ( X ≤8 )
36
11≤ X <¿12 35
o 97.2%
36
X >12 36
o 100 %
36
5. P ( 5< X <8 )=P ( X <7 ) −P ( X <5 )=0.31 Como no son inclusivos, no se toma ni el valor de
5 ni el 8, se sustraen los dos valores para encontrar el área entre ambos lo que representa
nuestra respuesta.
6. P ( 5≤ X ≤ 8 )=P ( X ≤ 8 )−P ( X ≤ 4 )=0.56 En este caso si incluimos los valores de 8 y 5 ya
que es menor o igual que X.
7. P ( 5≤ X < 8 )=P ( X =7 )−P ( X =4 )=0.42 Es una mezcla de los dos anteriores, no
tenemos en cuenta el 8 (problema 5) y si tomamos en cuenta el 5 (problema 6).
El complemento de estar entre a y b (sin incluir a o b) es menor o igual que a o mayor
o igual que b.
El complemento de estar entre a y b (incluyendo a y b) es menor o igual que a -1 o
mayor o igual que b+1
El complemento de estar entre a y b (incluyendo a pero no b) es menor o igual que a-1
o mayor o igual que b.
Valor Esperado:
Varianza:
La varianza de una variable aleatoria es cuanto cambian los resultados después de repetir
el experimento infinitas veces. Se denota como V ( X ) .
2 2 2
Y su formula es V ( X )=σ =E [ ( X −μ ) ]= ∑ p(x)( x −μ)
todo x
1. Encontrar E( X)2
2. Encontrar E ( X ) o μ
3. Elevamos al cuadrado el valor esperado μ2
4. Hacemos la resta E( X)2 −μ 2
Una variable aleatoria tiene una distribución discreta uniforme si cumple con las siguientes
condiciones:
Los posibles valores de la V.A. son números enteros consecutivos desde a hasta b
(inclusivos).
Cada posible valor de la V.A. tienen una probabilidad equivalente.
1
P ( x) = , para a≤ x ≤ b
b−a+ 1
La función de distribución de una discreta uniforme es:
0 , para x < a
{
F ( x )= x −a+1 , para a ≤ x ≤ b
b−a+1
1 , para enteros x ≥ b
b+a
representa el punto medio entra a y b.
2
Varianza y desviación estándar de un discreta uniforme
( b−a+2)(b−a)
V ( X )=
12
σ=
√
(b−a+2)(b−a)
12
Distribución Binomial
Para que una variable aleatoria tenga una distribución binomial dicha situación debe cumplir con
las siguientes condiciones:
( nx) p ( 1− p)
x n−x
donde
n es el numero de intentos
x es el numero determinado de casos exitosos
n−x es el numero de intentos fallidos
p es la probabilidad de exito en cualquier intento
1− p es la probabilidad de fracasos en cualquier intento