Está en la página 1de 97

Estadística 1

Profesor: Dr. Flavio Augusto Pinto Siabatto

Escuela Superior de Administración Pública


Territorial de Santander
Temas de las secciones 12-14 Ago
1. Introducción al curso
• Presentación del syllabus
• Presentación de los participantes
• Reglas y acuerdos
• Evaluación
• Fechas y plazos
2. Capítulo 1 Datos y estadística
3. Capítulo 2 Estadística descriptiva: presentaciones
tabulares y gráficas
4. Capítulo 3 Estadística descriptiva: medidas
numéricas
0. Introducción al curso
• Presentación del syllabus
• Presentación de los participantes
• Reglas y acuerdos
• Hora de inicio de la clase
• Asistencia
• Evaluación
• Qué se evalúa
• Cómo se evalúa
• Fechas y plazos
Capítulo 1:
Datos y Estadísticas
1. Estadística y las estadísticas
2. Elementos, variables y observaciones
3. Tipos de datos y variables
• Cualitativos vs. cuantitativos
• Datos de sección transversal vs. Series de tiempo
4. Estadística descriptiva
5. Inferencia estadística
1.1 Estadística y estadísticas

Datos: Son
hechos/informaciones y
cifras que se recogen,
analizan y resumen para su
presentación e
interpretación.

Conjunto de datos: A todos


los datos reunidos para un
determinado estudio se les
llama conjunto de datos
para el estudio.
1.1 Estadística y estadísticas
PRODUCTO INTERNO BRUTO TOTAL Y POR HABITANTE
(A precios constantes de 2005)
27 Total Por habitante
Miles de Millones Variación anual Millones de Pesos
Fin de: de pesos % dólares de 2005 Variación anual % Dólares de 2005
2000 284.761 - 122.701 7.066.808 - 3.045
2001 289.539 1,68 124.760 7.094.190 0,39 3.057
2002 296.789 2,50 127.884 7.181.162 1,23 3.094
2003 308.418 3,92 132.895 7.369.789 2,63 3.176
2004 324.866 5,33 139.982 7.667.632 4,04 3.304
2005 340.156 4,71 146.570 7.931.153 3,44 3.417
2006 362.938 6,70 156.387 8.361.479 5,43 3.603
2007 387.983 6,90 167.179 8.832.464 5,63 3.806
2008 401.744 3,55 173.108 9.037.877 2,33 3.894
2009 408.379 1,65 175.967 9.079.360 0,46 3.912
2010 424.599 3,97 182.956 9.329.881 2,76 4.020
2011 452.578 6,59 195.012 9.829.122 5,35 4.235
2012 470.880 4,04 202.898 10.108.664 2,84 4.356
2013 493.831 4,87 212.788 10.480.837 3,68 4.516
2014 515.528 4,39 222.137 10.816.380 3,20 4.661
2015 (p) 531.262 3,05 228.916 11.021.255 1,89 4.749
2016 (p) 542.116 2,04 233.593 11.120.851 0,90 4.792
2017 (p) 551.701 1,77 237.723 11.192.595 0,65 4.823

(p) Provisional.
Nota: PIB en dólares de 2005 = PIB en millones de pesos de 2005 sobre la tasa de cambio nominal
promedio de 2005.
Fuente: DANE - Dirección de Síntesis y Cuentas Nacionales y Banco de la República, Estudios
Económicos - Cuentas Financieras.
PRODUCTO INTERNO BRUTO TOTAL
Miles de millones de pesos, a precios constantes de 2005
600,000

551,701
542,116
531,262
515,528
493,831
500,000
470,880
452,578

424,599
408,379
401,744
400,000 387,983
362,938
340,156
Miles de millones

324,866
308,418
296,789
300,000 284,761 289,539

200,000

100,000

0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015(p) 2016(p) 2017(p)
Año
Miles de
millones…
VARIACIÓN DEL PIB TOTAL
%
Variación anual %
8

6.90
7 6.70
6.59

5.33

4.87
5 4.71
4.39
Porcentaje

3.97 4.04
3.92
4
3.55

3.05
3
2.50

2.04
2 1.77
1.68 1.65

0.00
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015( p )2016( p )2017( p )
Año
1.2 Elementos, variables y observaciones

Elementos: Son las entidades de las que se obtienen los datos. En el


conjunto de datos de la tabla 1.1, cada acción de una
empresa es un elemento; los nombres de los elementos
aparecen en la primera columna. Como se tienen 25
acciones, el conjunto de datos contiene 25 elementos.

Una variable: Es una característica de los elementos que es de interés.

Datos: Son los valores encontrados para cada variable en cada


uno de los elementos.
1.3.1. Datos cualitativos vs. cuantitativos

El análisis estadístico adecuado para una determinada variable depende de si


la variable es cualitativa o cuantitativa.

Datos cualitativos:
Comprenden etiquetas o nombres que se usan para identificar un atributo
de cada elemento. Los datos cualitativos emplean la escala nominal o la
ordinal y pueden ser numéricos o no.

Una variable cualitativa es una variable con datos cualitativos.

Aún cuando para los datos cualitativos se use un código numérico, las
operaciones aritméticas de adición, sustracción, multiplicación o división
no tienen sentido.

Tales datos se resumen contando el número de observaciones o calculando


la proporción de observaciones en cada categoría cualitativa.
1.3 Tipos de datos y variables

1.3.1. Datos cualitativos vs. Datos cuantitativos


El análisis estadístico adecuado para una determinada variable depende de si
la variable es cualitativa o cuantitativa.

Datos cualitativos:
Comprenden etiquetas o nombres que se usan para identificar un atributo
de cada elemento. Los datos cualitativos emplean la escala nominal o la
ordinal y pueden ser numéricos o no.

Una variable cualitativa es una variable con datos cualitativos.

Aún cuando para los datos cualitativos se use un código numérico, las
operaciones aritméticas de adición, sustracción, multiplicación o división
no tienen sentido.

Tales datos se resumen contando el número de observaciones o calculando


la proporción de observaciones en cada categoría cualitativa.
1.3.1. Datos cualitativos vs. cuantitativos
Datos cuantitativos:
Requieren valores numéricos que indiquen cuánto o cuántos una característica de los
elementos que es de interés.

Los datos cuantitativos se obtienen usando las escalas de medición de intervalo o de razón.

Las operaciones aritméticas sí tienen sentido en las variables cuantitativas.

Por ejemplo, cuando se tienen variables cuantitativas, los datos se pueden sumar y luego
dividir entre el número de observaciones para calcular el valor promedio.

Este promedio suele ser útil y fácil de interpretar.

En general hay más alternativas para el análisis estadístico cuando se tienen datos
cuantitativos.
1.3 Tipos de datos y variables
1.3.2. Datos de sección transversal vs. Series de tiempo
Datos de sección transversal:
Datos de sección transversal son los obtenidos en el mismo o aproximadamente el mismo
momento (punto en el tiempo).

Los datos de la tablas…

1.1 son datos transversales porque describen las cinco variables de las 25 empresas del 25
S&P en un mismo momento.

Datos de series de tiempo:


Los datos de series de tiempo son datos obtenidos a lo largo de varios periodos.

Por ejemplo, la figura 1.1 presenta una gráfica de los precios promedio por galón de
gasolina normal en las ciudades de Estados Unidos.

Ejercicio: Construir en Excel un gráfica de series de tiempo.


1.4 Estadística descriptiva
La mayor parte de la información estadística en periódicos, revistas, informes de empresas
y otras publicaciones consta de datos que se resumen y presentan en una forma fácil de
leer y de entender.

A estos resúmenes de datos, que pueden ser tabulares, gráficos o numéricos se les conoce
como estadística descriptiva.
1.5 Estadística inferencial
En muchas situaciones se requiere información acerca de grupos grandes de elementos
(individuos, empresas, votantes, hogares, productos, clientes, etc.).

Debido al tiempo, costo y a otras consideraciones, sólo es posible recolectar los datos de
una pequeña parte de este grupo.

Al grupo grande de elementos en un determinado estudio se le llama población y al grupo


pequeño muestra.
1.5 Estadística inferencial
Censo: Es el proceso de realizar un estudio para recolectar datos de toda una población.

Encuesta: Es el proceso de efectuar un estudio para recolectar datos de una muestra se le


llama encuesta muestral.

Una de las principales contribuciones de la estadística es emplear datos de una muestra


para hacer estimaciones y probar hipótesis acerca de las características de una población
mediante un proceso al que se le conoce como inferencia estadística.
1.6 Resumen y glosario
Estadística El arte y la ciencia de recolectar, analizar, presentar e interpretar datos.

Datos Los hechos y las cifras que se recolectan, analizan y resumen para su
presentación e interpretación.

Conjunto de datos Todos los datos recolectados en un estudio determinado.

Elementos Entidades sobre las que se recolectan los datos.

Variable Una característica que interesa de un elemento.

Observación El conjunto de mediciones obtenidas de un elemento determinado.

Datos cualitativos Etiquetas o nombres utilizados para identificar un atributo de


cada elemento.
Datos cuantitativos Valores numéricos que indican cuánto o cuántos de algo. Los
datos cuantitativos se obtienen mediante la escala de intervalo o de razón.
1.6 Resumen y glosario
Variable cualitativa Una variable con datos cualitativos.

Variable cuantitativa Una variable con datos cuantitativos.

Datos de sección transversal Datos recolectados en el mismo o aproximadamente en el


mismo momento.

Datos de series de tiempo Datos recolectados a lo largo de varios periodos de tiempo.

Estadística descriptiva Resúmenes tabulares, gráficos o numéricos de datos.

Población Conjunto de todos los elementos que interesan en un estudio determinado.

Muestra Un subconjunto de la población.

Censo Un estudio para recolectar los datos de toda la población.

Encuesta muestral Un estudio para recolectar los datos de una muestra.

Inferencia estadística El proceso de emplear los datos obtenidos de una muestra para hacer
estimaciones o probar hipótesis acerca de las características de la población.
Capítulo 2:
Estadística descriptiva:
presentaciones tabulares y gráficas

1. Estadística en la práctica
2. Resumen de datos cualitativos
3. Resumen de datos cuantitativos
4. Análisis exploratorio de datos
5. Tabulaciones cruzadas y diagramas de dispersión
2.0 Estadística en la práctica
La empresa Colgate-Palmolive aplica la
estadística en su programa de
aseguramiento de la calidad en los
detergentes caseros para la ropa.

Todos los paquetes de cierto tamaño se


llenan con la misma cantidad de
detergente en peso, aunque el volumen
del detergente varía de acuerdo con la
densidad del polvo detergente.

Si la densidad del detergente es alta, se


necesita una cantidad menor de
detergente para tener el peso señalado en
el paquete. El resultado es que cuando el
Gráfico de la representación de
cliente abre el paquete le parece que no
ha sido bien llenado. distribuciones de frecuencias, en el
que se emplean rectángulos dentro
Densidades mayores a 0.40 son de unas coordenadas.
inaceptablemente altas.
2.1 Resumen de datos cualitativos
2.1.1. Distribución de frecuencia
Es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases disyuntas (que no se sobreponen).

Ejercicio:
Elaborar en Excel la tabla de distribución de frecuencias
Graficar la distribución de frecuencias.
2.1 Resumen de datos cualitativos
2.1.2. Distribuciones de frecuencia relativa y de
frecuencia porcentual
En una distribución de frecuencia se aprecia el número (frecuencia) de los
elementos de cada una de las diversas clases disyuntas.

Sin embargo, con frecuencia lo que interesa es la proporción o porcentaje de


elementos en cada clase.

La frecuencia relativa de una clase es igual a la parte o proporción de los elementos


que pertenecen a cada clase.

La frecuencia porcentual de una clase es la frecuencia relativa multiplicada por 100.


2.1 Resumen de datos cualitativos
2.1.2. Distribuciones de frecuencia relativa y de frecuencia
porcentual
Una distribución de frecuencia relativa da un resumen tabular de datos en el que se
muestra la frecuencia relativa de cada clase.

Una distribución de frecuencia porcentual da la frecuencia porcentual de los datos de


cada clase.
2.1 Resumen de datos cualitativos
2.1.3. Grafica de barras y gráfica de pastel

Elaborar un gráfico de barras de la frecuencia relativa

Elaborar la gráfica de pastel de las ventas.


2.1 Resumen de datos cualitativos
Ejercicios
Páginas 31-34.
2.2 Resumen de datos cuantitativos
2.2.1. Distribución de frecuencia
TABLA 2.4 AUDITORÍA ANUAL (DÍAS DE DURACIÓN)
Por ejemplo, considere los datos
cuantitativos de la tabla 2.4. 12 14 19 18
15 15 18 17
Éstos presentan el tiempo en días necesario 20 27 22 23
para completar las auditorías de final de 22 21 33 28
14 18 16 13
año para una muestra de 20 clientes de
Sanderson and Clifford, una pequeña firma
de contadores públicos.

Los tres pasos necesarios para definir las clases de una distribución de
frecuencia con los datos cuantitativos son los siguientes:

1. Determine el número de clases que no se superponen.


2. Defina el ancho de cada clase.
3. Determine los límites de clase.
2.2 Resumen de datos cuantitativos
Número de clases
Las clases se forman mediante la TABLA 2.4 AUDITORÍA ANUAL (DÍAS DE DURACIÓN)
especificación de los rangos que se usarán
para agrupar los datos. Como regla general, 12 14 19 18
se recomienda utilizar entre 5 y 20 clases. 15 15 18 17
20 27 22 23
22 21 33 28
En el caso de un número pequeño de 14 18 16 13
elementos de datos se pueden utilizar cinco
o seis clases para resumir los datos.

Si se tienen muchos elementos, se requiere un número grande de clases.

La idea es utilizar suficientes clases para mostrar la variación en los datos,


pero no demasiadas si sólo se tienen algunos elementos.

Dado que el número de elementos de datos en la tabla 2.4 es


relativamente pequeño (n = 20), se eligió elaborar una distribución de
frecuencia con cinco clases.
2.2 Resumen de datos cuantitativos
Ancho de clase
TABLA 2.4 AUDITORÍA ANUAL (DÍAS DE DURACIÓN)
El segundo paso en la elaboración de una
12 14 19 18
distribución de frecuencia para datos 15 15 18 17
20 27 22 23
cuantitativos es elegir el ancho de las clases. 22 21 33 28
14 18 16 13

Como regla general, es recomendable que sea el


mismo para todas. Por tanto, el número y el
ancho de clase no son decisiones independientes.

Un número grande de clases significa un ancho de clase menor, y viceversa.

Para determinar un ancho de clase aproximado, primero se identifican los


valores de datos mayores y menores.

Luego, una vez especificado el número de clases deseado, se utiliza la


expresión siguiente para determinar el ancho de clase aproximado.
2.2 Resumen de datos cuantitativos
Límites de clase
Deben elegirse de modo que cada elemento de datos pertenezca a una y
sólo una de las clases.

El límite de clase inferior identifica el valor de datos menor asignado a la


clase.

El límite de clase superior identifica el valor de datos mayor asignado a la


clase.

En la elaboración de distribuciones de frecuencia para datos cualitativos


no se necesita especificar los límites de clase, debido a que cada
elemento de datos corresponde de manera natural a una clase separada.

Pero con los datos cuantitativos, como en el caso de la duración de las


auditorías de la tabla 2.4, se necesitan los límites de clase para
determinar a dónde pertenece cada valor de datos.
2.2 Resumen de datos cuantitativos
Distribuciones Acumuladas
La distribución de frecuencia acumulada muestra el número de
elementos de datos con valores menores o iguales que el límite de clase
superior de cada clase.

Ejercicio: Construya la gráfica de la frecuencia acumulada, según los


valores de la tabla 2.7, y discuta en el grupo su forma.
2.3 Análisis de datos exploratorios
El diagrama de tallo y hoja
Las técnicas del análisis de datos exploratorio consisten en una aritmética
simple y gráficas fáciles de elaborar que pueden usarse para resumir los
datos rápidamente.
2.3 Análisis de datos exploratorios
El diagrama de tallo y hoja
Las técnicas del análisis de datos exploratorio consisten en una aritmética
simple y gráficas fáciles de elaborar que pueden usarse para resumir los
datos rápidamente.
2.3 Análisis de datos exploratorios
El diagrama de tallo y hoja como histograma
La rotación de esta gráfica en sentido contrario a las manecillas del reloj
sobre su lado proporciona una imagen de los datos similar a un
histograma con las clases 60 – 69, 70 – 79, 80 – 89, etcétera.
2.3 Análisis de datos exploratorios

El diagrama de tallo y hoja como


discriminador de datos

Si creemos que nuestro diagrama original condensó


demasiado los datos, podemos extenderlo fácilmente
usando dos o más tallos para cada dígito principal.
2.3 Análisis de datos exploratorios

El diagrama de tallo y hoja como


agrupador de datos

Considere los datos siguientes sobre el


número de hamburguesas vendidas por un
restaurante de comida rápida durante cada
una de 15 semanas.
Capítulo 3:
Estadística descriptiva: medidas
numéricas
1. Medidas de posición o localización
2. Medidas de variabilidad
3. Medidas de la forma de la distribución
4. Análisis exploratoria de datos
5. Medidas entre dos variables
6. Medida ponderada y datos agrupados
3.1 Medidas de posición o localización
Media
La media o valor medio es una medida de la Media muestral:
ubicación central de los datos.

Si los datos son para una muestra, la media se


denota por 𝑥.ҧ (3.1)
Si los datos son para una población, se denota
por la letra griega μ.

En las fórmulas estadísticas se acostumbra 𝑛


denotar el valor de la primera observación de ෍ 𝑥𝑖 = 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
la variable x mediante x1, el valor de la
𝑖=1
segunda observación de la variable x por
medio de x2, y así sucesivamente.

En general, el valor de la i-ésima observación


de la variable x se representa por medio de xi.

Si se tiene una muestra con n observaciones,


la fórmula para la media muestral es la
siguiente.
3.1 Medidas de posición o localización
Media poblacional
La media o valor medio es una medida de la ubicación central de los datos.

𝑛
1
Media muestral: 𝑥ҧ = ෍ 𝑥𝑖
𝑛
𝑖=1

Ejemplo: considere los datos siguientes sobre el tamaño del grupo


para una muestra de cinco grupos de estudiantes universitarios.

46 54 42 46 32

Media muestral:

n=5
𝑛
1 1 1
𝑥ҧ = ෍ 𝑥𝑖 = 46 + 54 + 42 + 46 + 32 = 220 = 44
𝑛 5 5
𝑖=1
3.1 Medidas de posición o localización

Media poblacional
La fórmula para determinar la media de una
población es la misma, pero se usa una
notación diferente para indicar que se está
trabajando con toda la población.
(3.2)
El número de observaciones en una población
se denota por N y el símbolo para la media
poblacional es μ.
3.1 Medidas de posición o localización

Mediana
La mediana es otra medida de ubicación central; es el valor de en medio cuando los datos
están acomodados en orden ascendente (del valor menor al valor mayor).

Con un número impar de observaciones, la mediana es el valor de en medio.

Con un número par, no hay valor de en medio.

En este caso se sigue la convención y la mediana se define como el promedio de los valores
de las dos observaciones de en medio.

Por conveniencia, la definición de la mediana se replantea como sigue.

Ordene los datos de forma ascendente (del valor menor al valor mayor).

a) Para un número impar de observaciones, la mediana es el valor de en


medio.

b) Para un número par de observaciones, la mediana es el promedio de


los dos valores de en medio.
3.1 Medidas de posición o localización

Mediana
Calcule la mediana de la muestra:

46 54 42 46 32

Suponga además que se calcula la mediana de los sueldos iniciales para los 12 licenciados en
administración de empresas de la tabla 3.1. Primero se acomodan los datos en orden
ascendente.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

3490 + 3520
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 3505
2
3.1 Medidas de posición o localización

Mediana
Calcule la mediana de la muestra:

46 54 42 46 32

Suponga además que se calcula la mediana de los sueldos iniciales para los 12 licenciados en
administración de empresas de la tabla 3.1. Primero se acomodan los datos en orden
ascendente.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

3490 + 3520
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 3505
2
3.1 Medidas de posición o localización

Mediana y media -usos


Aunque la media es la medida de posición central de uso más común, en algunas situaciones
se prefiere la mediana, ya que los valores de datos muy pequeños y muy grandes influyen en
la media.

Suponga que uno de los licenciados recién graduados (tabla 3.1) tenía un sueldo inicial de
$10 000 al mes (tal vez la empresa es propiedad de su familia).

Si se cambia el sueldo mensual inicial más alto de la tabla 3.1 de $3 925 a $10 000 y se
vuelve a calcular la media, la media muestral pasa de $3 540 a $4 046.

Sin embargo, la mediana de $3 505 permanece igual, ya que $3 490 y $3 520 siguen siendo
los dos valores de en medio.

Si el sueldo inicial es sumamente alto, la mediana proporciona una mejor medida de


posición central que la media.

Al hacer una generalización, se afirma que siempre que un conjunto de datos contiene
valores extremos, la mediana suele ser la medida preferida de posición central.
3.1 Medidas de posición o localización

Ejemplo Sueldos mensuales


iniciales para una muestra
Calcule la media y la mediana de la siguiente muestra
de 12 licenciados en
administración recién
egresados

1 3450
2 3550
3 36650
4 3480
5 3355
6 3310
7 3490
8 3730
9 3540
10 3925
11 3520
12 3480
3.1 Medidas de posición o localización

Moda
La moda es el valor que ocurre con mayor frecuencia.

Moda

Moda
3.1 Medidas de posición o localización

Percentiles
Un percentil proporciona información sobre CÁLCULO DEL p-ÉSIMO PERCENTIL
cómo se distribuyen los datos en el intervalo
Paso 1. Ordene los datos de modo
del valor menor al valor mayor.
ascendente (del valor menor al valor
mayor).
Para datos que no contienen muchos valores
repetidos, el percentil p-ésimo los divide en Paso 2. Calcule un índice i
dos partes.
𝒑
𝒊= 𝒏
Alrededor de p por ciento de las observaciones 𝟏𝟎𝟎
tiene valores menores que el percentil p-ésimo donde p es el percentil de interés y n es el
y cerca de (100 − 𝑝) por ciento de las número de observaciones.
observaciones tiene valores mayores que el
percentil p-ésimo. Paso 3.
a) Si i no es un entero, redondéelo.
El entero siguiente mayor que i denota la
Definición: El percentil p-ésimo es un valor tal
posición del p-ésimo percentil.
que por lo menos p por ciento de las
observaciones es menor o igual que este valor, b) Si i es un entero, el p-ésimo percentil es
y por lo menos (100 − 𝑝) por ciento de las el promedio de los valores en las posiciones
observaciones es mayor o igual que este valor. 𝒊 e 𝒊 + 𝟏.
3.1 Medidas de posición o localización
Percentiles
Ejemplo:
Determinar el percentil 85 para los datos de los sueldos iniciales mensuales de Tabla 3.1
Sueldos mensuales
la tabla 3.1. iniciales para una
muestra de 12
licenciados en
Paso 1: Ordene los datos de modo ascendente. administración recién
egresados

𝟖𝟓 1 3450
Paso 2: Calcule un índice i: 𝒊= 𝒏 2 3550
𝟏𝟎𝟎
3 36650
Paso 3: Como i no es un entero, se redondea. La posición del percentil 85 es el 4 3480
siguiente entero mayor que 10.2, es decir, la posición 11. 5 3355
6 3310
7 3490
Observe de nuevo los datos: el percentil 85 es el valor de datos en la posición 8 3730
11, o 3730. 9 3540
10 3925
𝟓𝟎 11 3520
Considere el cálculo del percentil 50 para los datos: 𝒊 = 𝒏
𝟏𝟎𝟎 12 3480

Paso 3b: El percentil 50 es el promedio de los valores sexto y séptimo; por


tanto, el percentil 50 es (3490 + 3520)/2 = 3505.
3.1 Medidas de posición o localización
Cuartiles
División de los datos en 4 partes, cada
una de las cuales contiene aprox. un
cuarto, 0 25% de observaciones.

Los puntos de división se conocen


como cuartiles y son definidos como:

Q1 = primer cuartil, o percentil 25


Q2 = segundo cuartil, o percentil 50 (también la mediana)
Q3 = tercer cuartil, o percentil 75.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
𝟐𝟓
Q 1: 𝒊= 𝟏𝟐 = 𝟑
𝟏𝟎𝟎

Paso 3b: el primer cuartil, o percentil 25, es el promedio del tercer y cuarto valores de los datos;
por tanto, Q1 = (3450 + 3480)/2 = 3465.
3.1 Medidas de posición o localización

Cuartiles: Ejercicios
Realizar cuatro de los ejercicios de las páginas 92-95.
3.2 Medidas de variabilidad
Con frecuencia es conveniente considerar las medidas
de variabilidad o dispersión.

Por ejemplo, el profesor quiere saber, no sólo cuál esa el


promedio de retardo de sus estudiantes en la entrega de
trabajos escritos, sino que también quiere hacer una
medición del rango de variación de tiempo de entregas.

Días de retardo en la entrega


de trabajos escritos

t
0 1 2 3 4 5 6

Buscamos medidas que nos informen sobre el rango de


variación de la muestra.
3.2 Medidas de variabilidad

Este ejemplo ilustra una situación en la que la variabilidad en los tiempos de entrega
puede ser una consideración primordial al seleccionar a un proveedor.
3.2 Medidas de variabilidad
Rango
𝑹𝒂𝒏𝒈𝒐 = 𝒗𝒂𝒍𝒐𝒓 𝒎𝒂𝒚𝒐𝒓 − 𝒗𝒂𝒍𝒐𝒓 𝒎𝒆𝒏𝒐𝒓

Aun cuando el rango es la medida de variabilidad más fácil


de calcular, pocas veces se usa como la única medida
debido a que se basa sólo en dos de las observaciones y,
por tanto, los valores extremos influyen mucho en él.

Ejemplo:

t
0 1 2 3 4 5 6
3.2 Medidas de variabilidad
Rango intercuartílico
Es una medida de la variabilidad que supera la dependencia
sobre los valores extremos es el rango intercuartílico (RIC).

Esta medida de la variabilidad es la diferencia entre el tercer


cuartil, Q3, y el primer cuartil, Q1.

En otras palabras, el rango intercuartílico es el rango de la


media de 50% de los datos.

𝑹𝑰𝑸 = 𝑸𝟑 − 𝑸𝟏

Ejemplo:

Para los datos sobre los sueldos mensuales iniciales, los cuartiles son
Q3 = 3600 y Q1 = 3465.

Por tanto, el rango intercuartílico es 3600 - 3465 = 135.


3.2 Medidas de variabilidad
Varianza
La varianza es una medida de la variabilidad que utiliza todos los datos.

Se basa en la diferencia entre el valor de cada observación (𝑥𝑖 ) y la media.

Desviación respecto de la media


Se llama desviación respecto de la media a la diferencia entre cada 𝑥𝑖 y la media
(𝑥ҧ para una muestra; μ para una población).

Para una muestra, una desviación respecto de la media se escribe (𝑥𝑖 − 𝑥).
ҧ

Para una población, la desviación de cada dato respecto de la se escribe (𝑥𝑖 − 𝜇).
3.2 Medidas de variabilidad
Varianza
Varianza poblacional
Si los datos pertenecen a una población, el promedio de las desviaciones elevadas al
cuadrado se llama varianza poblacional, la cual se denota por medio del símbolo griego 𝜎 2 .

σ(𝑥 − 𝜇) 2
𝑖
𝜎2 =
𝑁
Varianza muestral
En la mayoría de aplicaciones, los datos que se analizan provienen de una muestra.

Cuando se calcula una varianza muestral, a menudo lo que interesa es usarla para estimar la
varianza poblacional 𝜎 2 .

Puede mostrarse que si la suma de las desviaciones respecto de la media al cuadrado se


divide entre 𝑛 − 1, y no entre 𝑛, la varianza muestral resultante proporciona un estimador
insesgado de la varianza poblacional.

La varianza muestral, denotada por 𝑠 2 , se define como:

ҧ 2
σ(𝑥𝑖 −𝑥)
𝑠2 =
𝑛−1
3.2 Medidas de variabilidad
Cálculo de desviaciones
3.2 Medidas de variabilidad
Cálculo de desviaciones
3.2 Medidas de variabilidad
Desviación estándar
La desviación estándar se define como la raíz cuadrada
positiva de la varianza.
3.2 Medidas de variabilidad
Coeficiente de variación
En algunas situaciones nos interesa la estadística descriptiva
que indique qué tan grande es la desviación estándar con
respecto a la media.
3.3 Medidas de la forma de la distribución

Forma de la
distribución
Uso de software para el
cálculo del sesgo.
3.3 Medidas de la posición
Valor z
También interesa la posición relativa de los valores
dentro de un conjunto de datos.

Medidas de posición relativa ayudan a determinar a qué


distancia de la media está un valor determinado.

A partir de la media y la desviación estándar se puede


determinar la posición relativa de cualquier observación. ഥ)𝟐
σ(𝒙𝒊 − 𝒙
𝒛𝒊 =
𝒔
Suponga que se tiene una muestra de n observaciones,
con los valores denotados por x1, x2, . . . , xn.

Asimismo, suponga que la media muestral, 𝑥,ҧ y la


desviación estándar muestral, s, ya se calcularon.

Asociado con cada valor, xi, hay otro valor llamado valor
z.
La ecuación (3.9) muestra cómo se calcula la puntuación
z para cada xi .
3.3 Medidas de la posición
Valor z
También interesa la posición relativa de los
valores dentro de un conjunto de datos.

Medidas de posición relativa ayudan a


determinar a qué distancia de la media
está un valor determinado.

A partir de la media y la desviación estándar se puede determinar


la posición relativa de cualquier observación.

Suponga que se tiene una muestra de n observaciones, con los


valores denotados por x1, x2, . . . , xn.

Asimismo, suponga que la media muestral, 𝑥,ҧ y la desviación


estándar muestral, s, ya se calcularon.

Asociado con cada valor, xi, hay otro valor llamado valor z.

La ecuación muestra cómo se calcula la puntuación z para cada xi .


3.3 Medidas de la posición
Teorema de Chebyshev
El teorema de Chebyshev permite hacer afirmaciones acerca de la proporción de los valores de
datos que deben estar dentro de un número específico de desviaciones estándar de la media.

Algunas implicaciones de este teorema cuando z = 2, 3 y 4 desviaciones estándar:

• Por lo menos 0.75, o 75%, de los datos debe estar dentro de z=2 desviaciones estándar de la
media.
• Al menos 0.89, u 89%, de los datos debe estar dentro de z=3 desviaciones estándar de la media.
• Por lo menos 0.94, o 94%, de los datos debe estar dentro de z=4 desviaciones estándar de la
media.

Como ejemplo, suponga que las calificaciones obtenidas en los exámenes parciales por 100
estudiantes universitarios en un curso de estadística para negocios tenían una media de 70 y una
desviación estándar de 5.
¿Cuántos alumnos obtuvieron una calificación de entre 60 y 80 en los exámenes?
¿Cuántos obtuvieron calificaciones de entre 58 y 82?
3.3 Medidas de la posición
Regla empírica
Una de las ventajas del teorema de Chebyshev estriba en
que se aplica a cualquier conjunto de datos sin importar su
forma de distribución.

En muchas aplicaciones prácticas los conjuntos de datos


exhiben una distribución simétrica con forma de pila o de
campana.

Cuando se piensa que los datos se aproximan a esta


distribución, la regla empírica se usa para determinar el
porcentaje de valores de datos que deben estar dentro de
un número específico de desviaciones estándar de la media.
3.4 Análisis exploratorio de datos
Resumen de cinco números
En un resumen de cinco números, los cinco siguientes se usan para resumir los datos.

1. Valor menor
2. Primer cuartil (Q1)
3. Mediana (Q2)
4. Tercer cuartil (Q3)
5. Valor mayor.

La manera más fácil de elaborar un resumen de cinco números es colocar primero los
datos en orden ascendente.

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

Q1 = 3465 Q2 = 3505 Q3 = 3600


(mediana)
3.4 Análisis exploratorio de datos
Diagrama de caja
Un diagrama de caja es un resumen gráfico de los datos basado en un resumen de cinco números.

La clave para elaborar de un diagrama de caja es el cálculo de la mediana y los cuartiles Q 1 y Q3.

El rango intercuartílico, RIC = Q3 - Q1, también se utiliza.

En la figura se aprecia el diagrama de cuadro de los datos de los sueldos mensuales iniciales.
3.4 Análisis exploratorio de datos
Diagrama de caja

1. Se traza una caja con sus extremos ubicados en el primer y tercer cuartiles. Para los datos de los
sueldos iniciales, Q1 = 3465 y Q3 = 3600. Este cuadro contiene la mitad, 50%, de los datos.

2. Se traza una línea vertical en el cuadro donde se ubica la mediana (3505 para los datos de los
sueldos iniciales).

3. Al usar el rango intercuartílico, RIC = Q3 - Q1, se localizan los límites. Para el diagrama de caja los
límites son 1.5(RIC) por debajo de Q1 y 1.5(RIC) por encima de Q3. Para los datos de los sueldos,
RIC = Q3 - Q1 = 3600 - 3465 = 135. Por tanto, los límites son 3465 - 1.5(135) = 3262,5 y 3 600 #
1.5(135) = 3802,5. Los datos fuera de estos límites se consideran observaciones atípicas.

4. Las líneas punteadas de la figura 3.5 se llaman bigotes. Éstos se trazan desde los extremos de la
caja hasta los valores menor y mayor dentro de los límites calculados en el paso 3. Por tanto, los
bigotes terminan en los valores de los sueldos de 3310 y 3730.

5. Por último, la ubicación de cada observación atípica se señala con un asterisco (símbolo*). En la
figura 3.5 se aprecia una observación, 3925.
3.4 Análisis exploratorio de datos
Diagrama de caja
Ejemplo
Con la finalidad de comparar los sueldos mensuales iniciales de los
licenciados en administración de empresas por área de especialización, se
seleccionó una muestra de 111 licenciados recién graduados. Se registraron
el campo de especialización y el sueldo mensual inicial de cada profesional.
3.5 Medidas de asociación entre dos variables
En esta sección se presentan la covarianza y la correlación
como medidas descriptivas de la relación entre dos variables.

Covarianza
Se introduce la covarianza como una medida descriptiva de
la asociación lineal entre dos variables.
Capítulo 4:
Introducción a la probabilidad

1. EXPERIMENTOS, REGLAS DE CONTEO Y


ASIGNACIÓN DE PROBABILIDADES
2. EVENTOS Y SUS PROBABILIDADES
3. ALGUNAS RELACIONES BÁSICAS DE
PROBABILIDAD
Introducción a la probabilidad

La probabilidad es una medida numérica de la


posibilidad de que un evento ocurra.

Los valores de probabilidad siempre se asignan en


una escala de 0 a 1.

Una probabilidad cercana a 0 indica que es poco


probable que un evento ocurra, una probabilidad
cercana a 1 indica que es casi seguro que un evento
se produzca.
4.1 Experimentos, reglas de conteo y asignación de
probabilidades
Experimento
En el estudio de la probabilidad, un experimento se define como un proceso que
genera resultados bien definidos.

En cada repetición ocurre uno y sólo uno de los resultados posibles del experimento.
4.1 Experimentos, reglas de conteo y asignación de
probabilidades
Espacio muestral
El espacio muestral es el conjunto de todos los
resultados posibles de una experimento.

Ejemplo: Ejercicio:
Experimento: lanzamiento de una moneda Experimento: lanzamiento de un dado.

Espacio muestral: Describa el espacio muestral.


𝑆 = 𝑐𝑎𝑟𝑎, 𝑠𝑒𝑙𝑙𝑜
4.1 Reglas de conteo Experimento: Se saca una bola de una bolsa, se
registra su color, y se retorna para el siguiente paso,
a una tula opaca. Colores: rojo, blanco, verde.
La identificación y el conteo de los resultados
del experimento es un paso necesario en la
asignación de probabilidades

Experimentos de pasos
múltiples (conteo secuencial) ¿De cuántas maneras se pueden sacar dos veces las
Experimento: lanzamiento de dos monedas mismas tres bolas de colores?

Espacio muestral: Espacio muestral:

𝑅, 𝑅 , 𝑅, 𝐵 , 𝑅, 𝑉 ,
𝑆= 𝐶, 𝐶 , 𝐶, 𝑆 , 𝑆, 𝐶 , (𝑆, 𝑆) 𝑆= 𝐵, 𝐵 , 𝐵, 𝑅 , 𝐵, 𝑉 ,
𝑉, 𝑉 , 𝑉, 𝑅 , 𝑉, 𝐵 ,

𝑆 = 22 = 4 𝑆 = 32 = 9
Un proyecto de expansión de una planta
4.1 Reglas de conteo
Etapas del proyecto:
1. Diseño
2. Construcción
Experimentos de pasos múltiples
(conteo secuencial)
Diagrama del árbol

Representación gráfica que ayuda a visualizar un


experimento de pasos múltiples.

𝑆 = 22 = 4
4.1 Reglas de conteo
Permutaciones
La regla de las permutaciones permite contar las veces en
que n objetos pueden disponerse en k posiciones.

n objetos distinguibles

n n-1 n-k+1 n-k 2 1



𝑃𝑘𝑛 = 𝑛 ∙ 𝑛 − 1 ∙ 𝑛 − 2 … (𝑛 − 𝑘 + 1)

𝑛∙ 𝑛−1 ∙ 𝑛−2 … 𝑛−𝑘+1 ∙ 𝑛−𝑘 … 2 ∙ 1


𝑃𝑘𝑛 = 𝑛−𝑘 … 2 ∙ 1

𝑛!
𝑃𝑘𝑛 =
𝑛−𝑘 !
4.1 Reglas de conteo
Combinaciones
Regla de conteo para combinaciones: Permite contar el número de resultados cuando el experimento
consiste en la selección de n objetos de un conjunto (generalmente mayor) de N objetos.

n n-1 n-k+1 n-k n-k-1 1


Cuenta las veces en que n
… … 𝑛! objetos distinguibles pueden
… disponerse

n n-1 n-k+1 n-k n-k-1 1


𝑛! Descuenta las veces en que k
… … 𝑃𝑘𝑛 = de n objetos distinguibles
… 𝑘! pueden disponerse.

k n-k
𝑛!
n n-1 n-k+1 n-k n-k-1 1 𝑃𝑘𝑛 =
… … 𝑘! 𝑛 − 𝑘 !
… Descuenta las veces en que k de n objetos
distinguibles pueden disponerse.

k n-k Descuenta las veces en que n-k de n


objetos distinguibles pueden disponerse.
Resultado de
4.1 Reglas de conteo permutaciones
Combinatoria

Combinaciones - 𝑛 𝑛!
=
Ejemplo x 𝑘 𝑘! 𝑛 − 𝑘 !
Muestreo de dos objetos de
un lote de cuatro, con dos de x 4! 1∙2∙3∙4
4
ellos defectuosos.
2
= =
x x 2!2! 2∙2
¿De cuántas maneras puede 4 3∙4 12
aparecer al menos un objeto 2
= = =6
x 2 2
defectuoso en el muestreo?

𝒏! 4! x
𝑷𝒏𝒌 = =
𝒌! 2! x x
1∙2∙3∙4
𝑃𝑘𝑛 = = 12 x
1∙2 x x

n=4 k=2 x
x
x x x
x
x
x Cinco de seis posibles resultados del
x muestreo producen que al menos una de
las piezas resulte defectuosa.
4.1 Asignación de probabilidades
¿Cómo asignar las probabilidades a los resultados del experimento?

Los enfoques:
Método clásico
Método de la frecuencia relativa y
Método subjetivo.

Requisitos para la asignación de probabilidades


1. La probabilidad asignada a cada resultado experimental debe
estar entre 0 y 1, inclusive.

Si 𝐸𝑖 denota el i-ésimo resultado del experimento y P(𝐸𝑖 ) su


probabilidad, entonces

0 ≤ 𝑃(𝐸𝑖 ) ≤ 1

2. La suma de las probabilidades para todos los resultados del


experimento debe ser igual a 1.

Para n resultados:

𝑃 𝐸1 + 𝑃 𝐸2 + ⋯ + 𝑃 𝐸𝑛 = 1
4.1 Asignación de probabilidades:
Método clásico

El método clásico de asignación de probabilidades es apropiado


cuando todos los resultados del experimento son igualmente
probables.

Si n resultados son posibles, una probabilidad de 1/n se asigna a


cada resultado experimental.

Cuando se utiliza este método, los dos requisitos básicos para la


asignación de probabilidades se cumplen de manera automática.

Ejemplo
Experimento: Lanzamiento de una moneda sin truco.

Los dos resultados (cara y sello) son igualmente probables.

Dado que uno de los dos resultados igualmente probables es una


cara, la probabilidad de observar una cara es 1/2, o 0.50.

Asimismo, la probabilidad de observar una cruz también es 1/2 o


0.50.
4.1 Asignación de probabilidades:
Método de la frecuencia relativa

El método de frecuencia relativa de asignación de Se asignarán unas probabilidades de:


probabilidades es apropiado cuando los datos están
disponibles para estimar la proporción del tiempo en 2
𝑃 𝑒𝑠𝑝𝑒𝑟𝑎 = 0 = = 0,10 < 1
20
que ocurrirá el resultado si el experimento se repite
un gran número de veces. 5
𝑃 𝑒𝑠𝑝𝑒𝑟𝑎 = 1 = = 0,25 < 1
20
Ejemplo 6
Experimento: un estudio de los tiempos de espera 𝑃 𝑒𝑠𝑝𝑒𝑟𝑎 = 2 = = 0,30 < 1
20
en el Dpto. de rayos X para un hospital local.
4
𝑃 𝑒𝑠𝑝𝑒𝑟𝑎 = 3 = = 0,20 < 1
20
Un empleado registró el número de pacientes que
esperan el servicio a las 9:00 a.m. durante 20 días 3
sucesivos y obtuvo los resultados siguientes. 𝑃 𝑒𝑠𝑝𝑒𝑟𝑎 = 4 = = 0,15 < 1
20

𝑃 0 +𝑃 1 +𝑃 2 +𝑃 3 +𝑃 4 =

0,10 + 0,25 + 0,30 + 0,20 + 0,15 = 1,0


4.1 Asignación de probabilidades:
Método subjetivo

El método subjetivo de asignación de probabilidades


es más apropiado cuando no se puede asumir en
forma realista que los resultados del experimento
son igualmente probables y cuando se dispone de
pocos datos relevantes.

Cuando el método subjetivo se utiliza para asignar


probabilidades a los resultados del experimento, es
posible usar cualquier información disponible, como
nuestra experiencia o intuición.

Después de considerar toda la información


disponible, un valor de probabilidad que expresa
nuestro grado de creencia (en una escala de 0 a 1) de
que el resultado experimental ocurrirá se especifica.
4.1 Ejemplo – Proyecto de expansión de una planta

Etapas del proyecto:


1. Diseño
2. Construcción
4.2 Eventos y probabilidades

Eventos:
Un evento es una colección de puntos de la muestra.

Ejemplo:
Suponga que el gerente está interesado en el evento
de que el proyecto completo se termine en 10 meses
o menos.

#𝑝𝑢𝑛𝑡𝑜𝑠 = 2,6 , 2,7 , 2,8 , 3,6 , 3,7 , 4,6

#𝑝𝑢𝑛𝑡𝑜𝑠
𝑃 𝐶 ≤ 10 =
𝑆

6 2
𝑃 𝐶 ≤ 10 = =
9 3
4.3 Relaciones básicas de probabilidad
Complemento de un evento
Dado un evento A, el complemento de A se define como el evento que consta de todos los
puntos de la muestra que no están en A.

𝑃 𝐴 + 𝑃 𝐴𝑐 = 1

Cálculo de 𝑃 𝐴
𝑃 𝐴 = 1 − 𝑃 𝐴𝑐
4.3 Relaciones básicas de probabilidad

Complemento de un evento
Dado un evento A, el complemento de A se define como el evento que consta de todos los puntos de la
muestra que no están en A.

𝑃 𝐴 + 𝑃 𝐴𝑐 = 1

Cálculo de 𝑃 𝐴
𝑃 𝐴 = 1 − 𝑃 𝐴𝑐 (4,5)

Ejemplo:
Considere el caso de un gerente de ventas quien, después de revisar los informes de ventas, establece
que 80% de los contactos de clientes nuevos no generan ninguna venta. Encuentre la probabilidad de que
los contactos de clientes nuevos generen al menos una venta.

Evento 𝐴: Al menos una venta


Complemento 𝐴𝑐 : Ninguna venta

𝑃 𝐴 = 1 − 𝑃 𝐴𝑐 = 1 − 0,8 = 0,2
4.3 Relaciones básicas de probabilidad

Ley de la adición de
probabilidades
La ley de la adición es útil cuando interesa
conocer la probabilidad de que ocurra por lo
menos uno de dos eventos.

Es decir, con los eventos A y B nos interesa


conocer la probabilidad de que ocurra el
evento A o el evento B, o ambos.

Antes de presentar la ley de la adición,


debemos estudiar dos conceptos relacionados
con la combinación de eventos: la unión de
eventos y la intersección de eventos.

Dados dos eventos A y B, la unión de A y B se


define como sigue.
Unión de Dos Eventos
La unión de A y B es el evento que contiene
todos los puntos de la muestra que
pertenecen a A o B o ambos.
La unión se denota mediante 𝐴 ∪ 𝐵.
4.3 Relaciones básicas de probabilidad
Ley de la adición de
probabilidades
El hecho de que los círculos se traslapen indica La ley de la adición proporciona una manera de
que algunos puntos de la muestra están calcular la probabilidad de que ocurra el evento
contenidos tanto en A como en B. A o el evento B o ambos.

A continuación se presenta la definición de En otras palabras, la ley de la adición se utiliza


intersección de A y B. para calcular la probabilidad de la unión de dos
eventos.
Intersección de dos eventos
Dados dos eventos A y B, la intersección de A y La ley de la adición se escribe como sigue.
B es el evento que contiene los puntos de la
muestra que pertenecen a tanto a A como a B. Ley de la adición
La intersección se denota por medio de 𝐴 ∩ 𝐵. 𝑃 𝐴 ∪ 𝐵 = 𝑃 𝐴 + 𝑃 𝐵 − 𝑃(𝐴 ∩ 𝐵)
4.3 Relaciones básicas de probabilidad
Ley de la adición para eventos mutuamente excluyentes

𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵
4.4 Probabilidad condicional
La probabilidad de un evento a menudo es influida por el hecho
de si otro evento relacionado ha ocurrido ya.

Suponga que se tiene un evento 𝐴 con probabilidad 𝑃 𝐴 .

Si se obtiene nueva información y se aprende que un evento


relacionado, denotado por 𝐵, ya ocurrió, esta información se
puede aprovechar mediante el cálculo de una nueva
probabilidad del evento 𝐴, a la cual se denomina probabilidad
condicional, y se escribe

𝑃 𝐴𝐵
La notación se utiliza para indicar que se está considerando la
probabilidad del evento A dada la condición de que B ha
ocurrido.

De ahí que la notación 𝑃 𝐴 𝐵 se lea “la probabilidad de 𝐴 dado


𝐵”.
4.4 Probabilidad condicional
Ejemplo Después de revisar el registro de ascensos, un
comité de mujeres policía planteó un caso de
discriminación sobre la base de que 288 oficiales
El estado de ascensos de oficiales hombres y
mujeres de una fuerza policiaca hombres fueron promovidos, en comparación con
sólo 36 mujeres.
metropolitana en el este de Estados Unidos.

La policía local está formada por 1 200 La comandancia argumentó que el número
relativamente bajo de ascensos de las oficiales
oficiales, 960 hombres y 240 mujeres.
femeninas no se debe a discriminación, sino al
hecho de que en la policía hay relativamente pocos
Durante los últimos dos años fueron
miembros que son mujeres.
ascendidos 324 oficiales de policía.
¿Cómo se utiliza la probabilidad condicional para
La composición específica de la promoción de
hombres y mujeres se muestra en la tabla: analizar la acusación de discriminación?

Sean

𝐻 = el evento de que un oficial es hombre.

𝑀 = el evento de que un oficial es mujer.

𝐴 = el evento de que un oficial es ascendido.

𝐴𝑐 = el evento de que un oficial no es ascendido.


4.4 Probabilidad condicional
𝐻 = el evento de que un oficial es hombre.
Ejemplo 𝑀 = el evento de que un oficial es mujer.
𝐴 = el evento de que un oficial es ascendido.
𝐴𝑐 = el evento de que un oficial no es ascendido.

288
Una 𝑃 𝐻 ∩ 𝐴 = = 0,24 de que un agente
1200
elegido al azar sea hombre y sea ascendido.

672
÷ 1200 Una 𝑃 𝐻 ∩ 𝐴𝑐 =
1200
= 0,56 de que un agente
elegido al azar sea hombre y no sea ascendido.

36
Una 𝑃 𝑀 ∩ 𝐴 = = 0,03 de que un agente
1200
elegido al azar sea mujer y sea ascendida.
𝑃 𝐴 =𝑃 𝐻∩𝐴 +𝑃 𝑀∩𝐴 204
Una 𝑃 𝑀 ∩ 𝐴𝑐 = = 0,17 de que un agente
𝑃 𝐴 = 0,24 + 0,03 = 0,27 1200
elegido al azar sea mujer y no sea ascendida.

Debido a que cada uno de estos valores da la


probabilidad de la intersección de dos eventos, las
Tabla de probabilidades conjuntas probabilidades se llaman probabilidades
conjuntas.
4.4 Probabilidad condicional

288 288/1200 0,24


𝑃 𝐴𝐻 = = =
960 960/1200 0,80

𝑃 𝐴 𝐻 = 0,30

Para resolver el problema de detección de la


eventual discriminación de género, buscamos Probabilidad condicional
calcular
𝑃(𝐴 ∩ 𝐻)
𝑃 𝐴𝐻 : La probabilidad del oficial de ser 𝑃 𝐴𝐻 =
ascendido, dado que es hombre. 𝑃(𝐻)
𝑃 𝐴 𝐻 = 288/960,

𝑃 𝐴 𝐻 = 0,30.
4.4 Probabilidad condicional

288 288/1200 0,24


𝑃 𝐴𝐻 = = =
960 960/1200 0,80

𝑃 𝐴 𝐻 = 0,30

Para resolver el problema de detección de la


eventual discriminación de género, buscamos Probabilidad condicional
calcular
𝑃(𝐴 ∩ 𝐻)
𝑃 𝐴𝐻 : La probabilidad del oficial de ser 𝑃 𝐴𝐻 =
ascendido, dado que es hombre. 𝑃(𝐻)
𝑃 𝐴 𝐻 = 288/960,

𝑃 𝐴 𝐻 = 0,30.
4.4 Probabilidad condicional

36 36/1200 0,03
𝑃 𝐴𝑀 = = =
240 240/1200 0,20

𝑃 𝐴 𝑀 = 0,15
𝑃 𝐴𝑀 : La probabilidad del oficial de ser 𝑃 𝐴 𝐻 = 0,30
ascendido, dado que es mujer.
¿Hay discriminación?
𝑃 𝐴 𝐻 = 36/240,

𝑃 𝐴 𝐻 = 0,15.
4.4 Probabilidad condicional

Eventos independientes Ley de la multiplicación


Dos eventos A y B son independientes si la ley de la multiplicación se utiliza para
calcular la probabilidad de la intersección de
𝑃 𝐴 𝐵 = 𝑃(𝐴) dos eventos.
o
𝑃 𝐵 𝐴 = 𝑃(𝐵) 𝑃 𝐴 ∩ 𝐵 = 𝑃(𝐵)𝑃 𝐴 𝐵
O
De lo contrario, los eventos son dependientes.
𝑃 𝐴 ∩ 𝐵 = 𝑃(𝐴)𝑃 𝐵 𝐴
4.4 Probabilidad condicional
Ley de multiplicación para
Ejemplo eventos independientes
Se sabe que 84% de las familias en un vecindario A y B son independientes siempre que
en particular se suscribe a la edición diaria del 𝑃 𝐴 𝐵 = 𝑃(𝐴) o 𝑃 𝐵 𝐴 = 𝑃(𝐵).
periódico.
Por lo tanto,
Si D denota el evento de que una familia se
suscribe a la edición diaria, 𝑃 𝐷 = 0,84. 𝑃 𝐴∩𝐵 =𝑃 𝐴 𝑃 𝐵
Además, se sabe que la probabilidad de que una
Si 𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃 𝐵 , entonces A y B son
familia que ya cuenta con una suscripción también eventos independientes.
adquiera la edición dominical (evento S) es de
0.75; es decir, 𝑃 𝑆 𝐷 = 0,75. Si 𝑃 𝐴 ∩ 𝐵 ≠ 𝑃 𝐴 𝑃 𝐵 , entonces A y B son
eventos dependientes.
¿Cuál es la probabilidad de que una familia se
suscriba tanto a las ediciones dominicales como a
las ediciones diarias del periódico?

Utilizando la ley de la multiplicación, calculamos el


𝑃(𝑆 ∩ 𝐷) deseado como

𝑃 𝑆 ∩ 𝐷 = 𝑃 𝐷 𝑃 𝑆 𝐷 = 0,84 0,75 = 0,63

Se sabe que 63% de las familias se suscribe tanto a


las ediciones dominicales como a las diarias.

También podría gustarte