Está en la página 1de 73

Capitulo 2: Presentación de datos en

tablas y gráficas
En el presente capitulo abordaremos los siguientes temas:

2.1 Tablas y gráficas para datos categóricos o cualitativos

2.2 Organización de los datos cuantitativos (discretos y continuos)

2.3 Tablas y gráficos para datos numéricos

2.4 Tablas y gráficas de datos bivariados


2.1 Tablas y gráficas para datos categóricos
•Cuando
  se tienen datos categóricos se registran las respuestas en
categorías y luego se presentan las frecuencias o los porcentajes de
cada categoría en:

Ejemplo. Se quiere determinar el tipo de aceite de cocina que se consumen en los


hogares de una comuna , de la ciudad de Medellín. Se elige en forma aleatoria 50
hogares de dicha comuna y se encontraron los siguientes resultados: 15 hogares
consumen aceite tipo 20 consumen aceite tipo ; 10 consumen aceite tipo y 5
consumen aceite tipo
2.1 Tablas y gráficas para datos categóricos
Tabla de resumen
La tabla de resumen indica la frecuencia, cantidad o porcentaje de
objetos, individuos (hogares en nuestro caso) en un conjunto de
categorías para observar la diferencia que hay entre ellas.
Tipo de aceite Porcentaje
2.1 Tablas y gráficas para datos categóricos
Gráfica de barras
Las clases o categorías se representan en el eje horizontal y las
frecuencias o porcentajes en el eje vertical. Cada barra muestra una
categoría y su longitud es proporcional a su frecuencia o porcentaje.
2.1 Tablas y gráficas para datos categóricos
•Gráfica
  de pastel
La grafica de pastel es un circulo que se divide en partes para
representar las categorías

 𝑨 ( 𝟑𝟎 % )

𝑩
  ( 𝟒𝟎 % )
 𝑫 (𝟏𝟎 % )

𝑪
  ( 𝟐𝟎 % )
2.1 Tablas y gráficas para datos categóricos
Diagrama de Pareto
En un diagrama de Pareto las respuestas categorizadas se trazan en
orden descendente de acuerdo con sus frecuencias o porcentajes y se
combina con la línea de porcentaje acumulado en la misma gráfica.
2.1 Tablas y gráficas para datos categóricos

Principio de Pareto: existe cuando la


mayoría de los elementos de un conjunto
de datos caen en un numero pequeño de
categorías, y las pocas observaciones
restantes se dispersan en un gran número
de categorías. A menudo nos referimos a
estas dos grupos como lo “poco vital” y lo
“mucho trivial”.
2.2 Organización de datos cuantitativos discretos
•Si  son los datos observados de una variable cuantitativa discreta, correspondiente a
una muestra, y el número de resultados diferentes es pequeño se puede presentar
un resumen de los datos de la muestra en una tabla de frecuencias o porcentajes.

A partir de la tabla se pueden tener gráficas de barras, pastel y Pareto.


2.2 Organización de datos cuantitativos
continuos
•   el número de datos distintos
Si que se tienen de una muestra
correspondiente a una variable cuantitativa discreta, o si los datos
corresponden a una variable cuantitativa continua; se puede utilizar un
procedimiento estadístico llamado “agrupamiento de datos” que permite
una presentación resumida de todos los datos.
Podemos ilustrar gráficamente la idea del procedimiento estadístico
“agrupamiento de datos” de la siguiente manera.
2.2 Organización de datos cuantitativos
continuos

 
2.2 Organización de datos cuantitativos
continuos
•  Procedimiento del método agrupación de datos
• Numero de clases ()
Se utiliza la siguiente formula probada por el estadístico Sturges

tamaño de la muestra
Si es decimal se aproxima al menor entero tal que . Por ejemplo si el
tamaño de la muestra es entonces:

Los 50 datos de la muestra se pueden reunir en 5 clases


2.2 Organización de datos cuantitativos continuos
•  Rango de los datos ()

representa el mayor de los datos


representa el menor de los datos
• Amplitud de las clases ()
esta división puede ser exacta o no exacta.
Si es exacta la primera clase comienza en el dato menor y la ultima clase
termina en el dato mayor. Por ejemplo si tuviéramos una muestra
De tamaño y rango , entonces
2.2 Organización de datos cuantitativos continuos

 Si el rango de los datos que estamos considerando, es por ejemplo

Entonces no es exacta. En esta caso se puede hacer lo siguiente:


2.2 Organización de datos cuantitativos continuos
• 
Para nuestro caso considerado , en efecto
2.2 Organización de datos cuantitativos continuos
•Observación.
  Cuando utilicemos la hoja de Excel, independiente si la
amplitud es exacta o no, comenzaremos la primera clase en el valor y la
ultima clase la terminamos en el valor

  En este caso, el número total de clases es y las marcas de clase


2.2 Organización de datos cuantitativos continuos
•  Marca de clase
valor que representa a todos los datos que están en la clase .

Donde representan los limites superior e inferior de la clase


• Frecuencia de clase
número de datos de la muestra
que se encuentran el la clase
2.2 Organización de datos cuantitativos continuos
Utilizando el procedimiento descrito “agrupamiento de datos” la
información de los datos de la muestra se pueden resumir en la
siguiente tabla de frecuencias, porcentajes.
2.2 Organización de datos cuantitativos
continuos
Ejemplo 1.
Los datos mostrados a continuación representan el costo de la energía
eléctrica durante julio de 2019 para una muestra aleatoria de 50
departamentos de una habitación de una comuna X de una gran ciudad
(Medellín). 96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
108 119 183 151 114 135 191 137 129 158

Presente un resumen de los datos en una tabla fe frecuencias o porcentajes,


utilizando el procedimiento “agrupación de datos” que hemos presentado.
2.3 Tablas y gráficas de datos bivariados
En negocios es común el estudio de patrones que pueden existir entre dos o
más variables categóricas
Tabla de contingencia
Una tabla de contingencia o de clasificación presenta los resultados de dos
variables categóricas. Las categorías de una variable se localizan en las
filas, y las categorías de la otra variable se localizan en las columnas.
La tabla se construye dependiendo del tipo de contingencia, las celdas para
cada combinación fila-columna contiene la frecuencia, el porcentaje del
total global, el porcentaje del total de las filas o el porcentaje total de las
columnas.
2.3 Tablas y gráficas de datos bivariados
Ejemplo 1
En la tabla se presenta información para una muestra de fondos de inversión,
clasificados según su objetivo y según nivel de Riesgo. Hay dos objetivo:
crecimiento y valor, y hay tres niveles de riesgo: alto, medio y bajo
Objetivo Nivel de riesgo

  Alto Medio Bajo


Crecimiento 14 23 12
Valor 3 23 46

Para explorar cualquier posible patrón o relación entre fondos objetivo y de


riesgo, es conveniente realizar tablas de contingencias basadas en porcentajes,
como también gráficas realizadas utilizando Excel.
2.3 Tablas y gráficas de datos bivariados
Ejemplo 2
En un hospital cada día se realizan varios cientos de pruebas de laboratorio.
La tasa de pruebas realizadas de forma impropia (i que deben de
practicarse de nuevo) al parecer es constante y cerca del 4%. En un esfuerzo
por llegar a la raíz del problema (pruebas que requieren volver a hacerse),
el director del laboratorio decide guardar los registros de una semana. Las
pruebas de laboratorio se dividieron entre el turno de empleados que
realizan las pruebas de laboratorio. Los resultados son los siguientes.

Prueba de Turno
Laboratorio
  Día Tarde
Insatisfactorias 16 24
Satisfactorias 654 306
Descripción de datos: medidas numéricas
•Objetivos
  de aprendizaje
• Medidas de ubicación: media poblacional , media muestral , mediana ,
moda .
• Otras medidas de ubicación: Cuartiles , Deciles , Percentiles .
• Medidas de variabilidad: Rango , varianza poblacional , error estándar
poblacional , varianza muestral , error estándar muestral .
• Medidas relacionadas: medidas que relacionan una medida de ubicación
y una medida de variabilidad : coeficiente de variación , estandarización ,
regla de Chebyshev.
Descripción de datos: medidas numéricas
Medidas de ubicación
• 
Media poblacional.
: letra minúscula griega , representa la media poblacional;
: es el número de valores en la población;
representa cualquier valor particular de la población;
Observación. Recordemos que un parámetro es una característica
medible de una población, luego la media poblacional es un
parámetro.
Media muestral.
Descripción de datos: medidas numéricas
Medidas de ubicación
• 
Observación. Recordemos que un estadístico es una característica medible de
una muestra, luego la media muestral es un estadístico. Los estadísticos se
utilizan para estimar parámetros, los cuales por lo general son desconocidos.
Ejemplo. Recordemos la situación del costo de la energía eléctrica en el mes de
julio de 2019 para los departamentos de una habitación en una comuna X de
la ciudad. Se tomaron los costos de 50 departamentos tomados al azar, los
cuales se resumieron utilizando el procedimiento agrupación de datos.
Calcular la media muestral e interpretarla.
Solución (ver hoja de Excel)
Descripción de datos: medidas numéricas
Medidas de ubicación
• 
Propiedades de la media
a. La media para un conjunto de datos es única
b. La media es el punto de equilibrio de un conjunto de datos
c. Si son los datos de una muestra que pertenecen al mismo nivel de
intervalo o de razón, con media , entonces la suma de las diferencias de
cada valor a la media es cero. Esto es, . En efecto,
d. La media es muy sensible a datos extremadamente grandes o pequeños en
comparación con la mayoría de los datos. En estos casos se utilizan otras
medidas de ubicación, como la mediana o la moda.
Descripción de datos: medidas numéricas
Medidas de ubicación
•Mediana.
 
La mediana de un conjunto de datos cuantitativos, es el punto medio de los
valores una ves se han ordenado de menor a mayor o de mayor a menor. El
punto medio divide al conjunto de datos ordenados en dos subconjuntos cada
uno con el 50% de los datos.
¿Cómo calcular ?
• Para datos no agrupados. Si son los datos de una muestra de valores
cuantitativos organizados de menor a mayor, entonces:
Descripción de datos: medidas numéricas
Medidas de ubicación

• 
Ejemplo. Supongamos que los siguientes datos organizados de menor a mayor
corresponden a una muestra cuantitativa.

¿Cuál es la mediana de los datos?


Solución. Como el número de observaciones es impar (), entonces la mediana
corresponde a uno de los datos. En este caso la mediana viene dado por el
dato en la posición . Esto es
Si la muestra tuviera seis datos, por ejemplo

Como el tamaño de la muestra es par , la mediana esta dada por:


Descripción de datos: medidas numéricas
Medidas de ubicación
• Para
  datos agrupados. Si los datos los tenemos agrupados, para encontrar el valor
de la mediana podemos seguir el siguiente procedimiento.
Encontramos la clase de la mediana: primera clase donde la frecuencia
acumulada
 Utilizamos la siguiente formula de interpolación.

: Limite inferior de la clase de la mediana


: frecuencia acumulada hasta la clase anterior a la clase de la mediana
: frecuencia absoluta de la clase de la mediana
amplitud de la clase de la mediana
Descripción de datos: medidas numéricas
Medidas de ubicación
•Ejemplo.
  Encontrar la mediana de los datos correspondientes al costo de la
energía bajo el supuesto de que los datos los tenemos en forma agrupada.
Solución.
 Clase de la mediana, primera clase donde
Li Ls Xi fi % % acumulado
81 100 90,5 4 8,00% 8,00%
100 119 109,5 6 12,00% 20,00%
119 138 128,5 9 18,00% 38,00%
138 157 147,5 12 24,00% 62,00%
157 176 166,5 10 20,00% 82,00%

 Utilizar la formula de interpolación 176


195
195
214
185,5
204,5
5
4
10,00%
8,00%
92,00%
100,00%
Total     50    

El 50% de los departamentos de una habitación tubo un pago y un 50% pago


menos de $147,5.
Descripción de datos: medidas numéricas
Medidas de ubicación

•   moda.
La
Valor de la observación que aparece con mayor frecuencia. La moda se puede
utilizar para datos cuantitativos, pero es de especial utilidad para resumir
datos de nivel nominal
Ejemplo. Se quiere determinar el tipo de aceite de cocina que se consumen en
los hogares de una comuna , de la ciudad de Medellín.
Se elige en forma aleatoria 50 hogares de dicha comuna Frecuencia

y se encontraron los siguientes resultados: 15 hogares 25

Número de encuestados
20
20
15
consumen aceite tipo 20 consumen aceite tipo ; 15

10
10

10 consumen aceite tipo y 5 consumen aceite tipo 5


5

Por consiguiente el tipo de aceite tipo representa la moda. A B


Tipo de aceite
C D
Descripción de datos: medidas numéricas
Medidas de ubicación

•Si  los datos están agrupados, la moda la podemos encontrar de la siguiente


forma:
 Se encuentra la clase modal: clase con mayor frecuencia
 Se utiliza la siguiente formula de interpolación para encontrar el valor de la
moda.

: limite inferior de la clase modal

frecuencia absoluta de la clase modal


amplitud de la clase modal
Descripción de datos: medidas numéricas
Medidas de ubicación

•Ejemplo.
  Encontrar la moda de los datos correspondientes al costo de la
energía bajo el supuesto de que los datos, los tenemos en forma agrupada.
 Clase de la moda. Clase con mayor frecuencia (clase 4, clase modal)
Li Ls Xi fi % % acumulado
81 100 90,5 4 8,00% 8,00%
100 119 109,5 6 12,00% 20,00%
119 138 128,5 9 18,00% 38,00%
138 157 147,5 12 24,00% 62,00%
157 176 166,5 10 20,00% 82,00%
176 195 185,5 5 10,00% 92,00%
195 214 204,5 4 8,00% 100,00%
Total     50    

Utilizar la formula de interpolación


: pago del costo de la energía con mayor frecuencia.
Descripción de datos: medidas numéricas
Otras medidas de ubicación. Cuartiles, Deciles y Percentiles
• 
Existen otras formas de describir la variación o dispersión de un conjunto de
datos. Un método consiste en determinar la ubicación de los valores que
dividen un conjunto de observaciones en partes iguales. Estas medidas
incluyen los cuartiles, deciles y percentiles.
Definiciones.
Cuartiles : conjunto de valores que dividen a un conjunto de observaciones en
cuatro partes porcentualmente iguales; cada parte con el 25% de los datos
Descripción de datos: medidas numéricas
Otras medidas de ubicación. Cuartiles, Deciles y Percentiles
•Deciles
  : conjunto de valores que dividen a un conjunto de observaciones en
diez partes porcentualmente iguales; cada parte con el 10% de los datos

Percentil : conjunto de valores que dividen a un conjunto de observaciones en


cien partes porcentualmente iguales; cada parte con el 1% de los datos.
Descripción de datos: medidas numéricas
Cálculo de los Cuartiles, Deciles y Percentiles
•Presentaremos
  a continuación el procedimiento para calcular los Cuartiles,
Deciles y Percentiles para datos agrupados, queda como consulta como
hacerlo si los datos no están agrupados.
 Calcula la clase del
Primera clase donde la frecuencia acumulada
Primera clase donde la frecuencia acumulada
Primera clase donde la frecuencia acumulada
 Utilizar las siguientes formulas de interpolación
Descripción de datos: medidas numéricas
Cálculo de los Cuartiles, Deciles y Percentiles
• Utilizar las siguientes formulas de interpolación

Ejemplo. Con relación al ejemplo del costo de la energía, suponga que 38% de
los departamentos de una habitación realizó un pago mayor o igual a . ¿Cuál
es el valor de ?
Descripción de datos: medidas numéricas
Cálculo de los Cuartiles, Deciles y Percentiles
•Solución.
 

 Clase del primera clase donde


corresponde a la cuarta clase Li
81
Ls
100
Xi
90,5
fi
4
%
8,00%
% acumulado
8,00%
100 119 109,5 6 12,00% 20,00%
119 138 128,5 9 18,00% 38,00%
138 157 147,5 12 24,00% 62,00%
157 176 166,5 10 20,00% 82,00%
176 195 185,5 5 10,00% 92,00%
195 214 204,5 4 8,00% 100,00%
Total     50    

 Utilizando la formula de interpolación tenemos:


Descripción de datos: medidas numéricas
Medidas de variabilidad
• 
Varianza de la población
: es el valor de una observación de la población
es la media aritmética de la población
es el número de observaciones de la población
Desviación estándar de la población
distancia promedio de los valores de la población respecto a la media
poblacional
Varianza muestral presentaremos como calcularla, si los datos de la
muestra están no agrupados o si están agrupados.
Descripción de datos: medidas numéricas
Medidas de variabilidad
• 
Desviación estándar muestral
se puede interpretar la dispersión promedio como de encuentran las datos
de la muestra respecto a la media muestral
Ejemplo. Calcular la varianza y el error estándar muestral de los datos
correspondiente al costo de la energía e interpretarlas (hoja de Excel)
Descripción de datos: medidas numéricas
  Medidas relacionadas
•Coeficiente
  de variación . A diferencia de las medidas de variación antes
expuestas, el coeficiente de variación es una medida relativa que se utiliza por
lo general para comparar dos o más conjuntos de datos medidos con
unidades distintas y/o diferentes valores de . El coeficiente de variación mide
la dispersión de los datos con respecto a la media y se calcula como:

Ejemplo. El gerente de operaciones de un servicio de entrega de paquetería


está pensando si es conveniente adquirir una nueva flota de camiones. Para
los paquetes, se deben tener en cuenta dos características: el peso(en libras) y
el volumen (en pies cúbicos)
Descripción de datos: medidas numéricas
  Medidas relacionadas
•El  gerente de operaciones toma una muestra de 200 paquetes, y encuentra que
la media del peso es 26,0 libras, con una desviación estándar de 3,9 libras.
Mientras que la media en volumen es de 8,8 pies cúbicos, con una desviación
estándar de 2,2 pies cúbicos. ¿Cómo puede el gerente de operaciones comparar
la variación de peso y volumen?
Solución. Como las unidades difieren para el peso y volumen, el gerente de
operaciones debe comparar la variabilidad relativa en ambos tipos de medida.
Para el peso, el coeficiente de variación es:
Para el volumen, el coeficiente de variación es:
De esta forma, en relación con la media el volumen del paquete es más variable
que su peso.
Descripción de datos: medidas numéricas
  Medidas relacionadas
•Puntuaciones
  o estandarización . Las puntuaciones o estandarizaciones de un
conjunto de datos con media y desviación estándar conocida, es igual a la
diferencia entre cada dato y la media, dividida por la desviación estándar.
Las puntuaciones son útiles para identificar valores atípicos, valores ubicados
muy lejos de la media.

Ejemplo. Supongamos que se tienen una muestra de 10 datos que


representan los tiempos (en minutos) necesarios para arreglarse por la
mañana.
Descripción de datos: medidas numéricas
  Medidas relacionadas
• 
Encontremos las puntuaciones de los datos.
La puntuación para el primer dato se calcula 39 -0,09
29 -1,57
A partir de
43 0,50
La mayor puntuación 1,83 fue para el cuarto 52 1,83
dato 52 minutos. La menor puntuación fue -1,57 39 -0,09
44 0,65
para el segundo dato 29 minutos. Como regla
40 0,06
general, una puntuación se considera atípica 31 -1,27

si es menor que -3,0 o mayor que +3,0. 44 0,65


35 -0,68
Ninguno de los tiempos satisface este criterio
Descripción de datos: medidas numéricas
  Medidas relacionadas
•Regla
  de Chebyshev.
Una importante propiedad que describe a un conjunto de datos numéricos es la
forma como se distribuyen los datos a través de todo su rango.
La forma de como se distribuyen los datos tiene que ver con la relación entre la
media, la mediana y la moda de los datos.
 Si ; asimetría negativa
o sesgo izquierdo.
Si los datos tienen
distribución simétrica (forma de campana)
 Si ; asimetría positiva
o sesgo hacia la derecha.
Descripción de datos: medidas numéricas
  Medidas relacionadas
•Observación.
  Una desviación estándar pequeña de un conjunto de valores
indica que estos se localizan cerca de la media. Por lo contrario una desviación
grande revela que las observaciones se encuentran muy dispersas con respecto
a la media.
El matemático Ruso Chebyshev estableció un teorema que permite establecer,
independiente de la forma de la distribución, la mínima porción de valores que
se encuentran a cierta cantidad de desviaciones estándares de la media.
Teorema de Chebyshev. En cualquier conjunto de observaciones (muestra o
población), la proporción de valores que se encuentran a desviaciones
estándares de la media es, por lo menos, de , siendo cualquier constante mayor
que 1.
Descripción de datos: medidas numéricas
  Medidas relacionadas
•Por
  ejemplo a dos desviaciones estándares de la media,
tendríamos por lo menos el 75% de los datos.
Ejemplo. Supongamos que la nota promedio del primer
parcial fue . ¿Por lo menos qué
porcentaje de las notas se encuentran entre 3,9 y 4,3?
Solución.

, de las notas están entre 3,9 y 4,3.


Descripción de datos: medidas numéricas
  Medidas relacionadas
El teorema de Chebyshev se relaciona con cualquier conjunto de valores; es
decir la forma de la distribución puede tener cualquier forma.
Si la distribución es simétrica con forma de campana, se puede determinar de
forma más precisa la dispersión en torno a la media, mediante la regla
empírica, a veces denominada la regla normal
Regla empírica. En cualquier distribución de frecuencias simétrica, con forma
de campana, aproximadamente 68% de las observaciones se encontrarán
entre más o menos una desviación estándar de la media; cerca del 95% de las
observaciones se encontrarán entre más o menos dos desviaciones estándares
de la media y, de hecho, todas (99,7%) estarán entre más o menos tres
desviaciones estándares de la media.
Descripción de datos: medidas numéricas
  Medidas relacionadas

Curva simétrica con forma de campana que


muestra las relaciones entre la desviación
estándar y la media de las observaciones.
Ejemplo. (uso de la regla empírica)
La cantidad media de llenado de una población
Integrada por 12 latas de gaseosa es de 12,06 onzas, con una desviación
estándar de 0,02. También se sabe que esta población tiene forma de
campana. Describa la distribución de la cantidad de llenado de las latas.
¿Existe una gran probabilidad de que una lata tenga menos de 12 onzas de
gaseosa?
Descripción de datos: medidas numéricas
  Medidas relacionadas
• 
Solución.

Utilizando la regla empírica, aproximadamente el 68% de las latas tendrán entre 12.04 y 12.08
onzas, aproximadamente el 95% tendrá entre 12.02 y 12.10 onzas, y aproximadamente el 99.7%
tendrá entren12.00 y 12.12 onzas. Así es poco probable que una lata tenga menos de 12 onzas.
Si no tiene forma de campana la distribución, podemos decir que entre 0 y 11,11% de las latas
tienen menos de 12 onzas.
Probabilidad básica
Objetivos de aprendizaje
 Conceptos básicos: experimento, espacios muéstrales de experimentos,
eventos o sucesos, concepto de probabilidad, probabilidad de un evento o
suceso, tablas de contingencia y diagramas de Venn
 Métodos básicos para calcular probabilidades: método empírico, método
subjetivo y método clásico.
 Reglas para calcular probabilidades: Regla de la adición, probabilidad
condicional, probabilidad conjunta, regla del producto.
 Regla de Bayes
 Reglas de conteo
Probabilidad básica
Conceptos básicos
•Experimento.
  Un experimento estadístico es cualquier acción, procedimiento con
las siguientes características:
1. Todos los posibles resultados del experimento son conocidos antes de hacer
una realización del experimento
2. El resultado exacto en cualquier ejecución del experimento no es predecible
(aleatorio).
Ejemplos:

Una bombilla manufacturada en una planta es expuesta a una prueba de vida y


el tiempo de duración de una bombilla es registrado,
Probabilidad básica
Conceptos básicos
•Un  ejemplo de un experimento no estadístico podría ser:
Seleccionar al azar un estudiante de un colegio masculino y observar su
género. Aquí no se cumple la condición (2), ya que se puede predecir una
ejecución del experimento, el género del alumno.
Espacio muestral (). El espacio muestral de un
experimento es el conjunto de todos los resultados
posibles del experimento estadístico.
Por ejemplo el espacio muestral de lanzar dos
monedas es:
Probabilidad básica
Conceptos básicos
• 

Observación. A cada uno de los elementos del espacio muestral de un


experimento se le llaman puntos muéstrales.
Evento o suceso
Todo subconjunto de un espacio muestral de un experimento, es un evento del
experimento.
Probabilidad básica
Conceptos básicos
• 
Ejemplo. Consideremos el experimento
definamos un evento como: .

Probabilidad. La probabilidad de un punto


muestral del espacio muestral de un expe-
rimento, denotada por es una medida que
Indica la posibilidad de ocurrencia o no de con
Las siguientes características:
;
Probabilidad básica: Conceptos básicos
•Observación:
 
• Puede ocurrir que
• si es cercano a , indica que la posibilidad de que ocurra es alta, por el
contrario, si es próxima a cero, indica que la ocurrencia de es baja.
Probabilidad de un evento . Si es un evento de un espacio muestral de un
experimento dado, entonces
.
Observación.
• Como entonces

Conceptos básicos:
Diagramas de Venn y tablas de contingencias
•Cuando
  se tiene un experimento, su espacio muestral , se puede ver como el
universo y los subconjuntos de este espacio muestral serian los eventos
Para lo cual podemos utilizar diagramas de Venn

 𝐴 ∪ 𝐵= { 𝑥 ∈ 𝑆/ 𝑥 ∈ 𝐴 ∨ 𝑥 ∈ 𝐵 }  𝐴 ∩ 𝐵= { 𝑥 ∈ 𝑆/ 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝐵 }

 𝐴 = { 𝑥 ∈ 𝑆/ 𝑥 ∈ 𝑆 ∧ 𝑥 ∉ 𝐴 }
Conceptos básicos:
Diagramas de Venn y tablas de contingencias
  − 𝑨 ={ 𝒙 ∈ 𝑺 / 𝒙 ∈ 𝑩∧ 𝒙 ∉ 𝑨 }
𝑩
 𝑨 − 𝑩={ 𝒙 ∈ 𝑺 / 𝒙 ∈ 𝑨 ∧ 𝒙 ∉ 𝑩 }
′ 𝐵  − 𝐴 ={ 𝑥 ∈ 𝑆 /𝑥 ∈ 𝐵∧ 𝑥 ∈ 𝐴 ′ }=𝐵 ∩ 𝐴 ′
 𝐴 − 𝐵={ 𝑥 ∈ 𝑆 / 𝑥 ∈ 𝐴 ∧ 𝑥 ∈ 𝐵 } = 𝐴 ∩ 𝐵′

𝐵  − 𝐴 =𝐵 ∩ 𝐴 ′
 Enresumen si es el espacio muestral de
un experimento son eventos,
subconjuntos de , entonces se puede
dividir de la siguiente forma (  𝐴 ∪ 𝐵 )′ = 𝐴 ′ ∩ 𝐵 ′
 𝐴 − 𝐵=𝐴 ∩𝐵 ′

 𝐴 ∩ 𝐵
Conceptos básicos:
Diagramas de Venn y tablas de contingencias

•El  diagrama de Venn para representar el espacio muestral de un experimento


con los sucesos también se puede presentar en una tabla de contingencia.
(  𝐴 ∪ 𝐵 )′ = 𝐴 ′ ∩ 𝐵 ′

 

 𝐴 − 𝐵=𝐴 ∩𝐵 ′  𝐴 ∩ 𝐵 𝐵  − 𝐴 =𝐵 ∩ 𝐴 ′
Enfoques para asignar probabilidades
• 
Describiremos tres formas, métodos de asignar una probabilidad a un evento:
Clásica, empírica y subjetiva. Los dos primeros se basan en datos e información. El
método subjetivo se basa en la creencia del sujeto acerca de la probabilidad de un
evento.
Probabilidad clásica. La probabilidad clásica parte del supuesto de que los
resultados de un experimento son igualmente posible.

Ejemplo. Considere el experimento de lanzar dos dados. ¿Cuál es la probabilidad del


evento
Solución. El espacio muestral del experimento lanzar dos dados, esta formado por
36 puntos muestrales igualmente probables. El evento tiene 6 puntos muestrales
Enfoques para asignar probabilidades
• 
Luego,

Probabilidad empírica. La probabilidad empírica o frecuencia relativa, se basa


en el número de veces que ocurre el evento como proporción del número de
intentos conocidos.

El enfoque empírico de la probabilidad se basa en la llamada ley de los


grandes números.
Ley de los grandes números. En una gran cantidad de intentos, la
probabilidad empírica de un evento se aproxima a su probabilidad real
Enfoques para asignar probabilidades
Para ilustrar la ley de los grandes números, consideremos la siguiente
situación. Se lanza una moneda común muchas veces, en la siguiente tabla se
muestran las frecuencias relativas de las caras
 Observación. Conforme se
incrementa el número de
intentos, la probabilidad
empírica de que salga cara
se aproxima a el cual es su
valor de acuerdo con el
enfoque clásico de
probabilidad.
Enfoques para asignar probabilidades
•Ejemplo
  1. Suponga que en el Hospital General ocurrieron, 10000 nacimientos en
el primer semestre del 2020, de los cuales 7000 fueron niñas. ¿Cual es la
probabilidad de que el próximo nacimiento en dicho hospital sea una niña?
Solución. Definamos el evento , utilizando el enfoque empírico o frecuencia
relativa tenemos

Ejemplo 2. El 1 de febrero de 2003 explotó el transbordador espacial Columbia.


Este fue el segundo desastre en 113 misiones espaciales de la NASA. Con base en
esta información. ¿cuál es la probabilidad de que una futura misión concluya con
éxito?
Enfoques para asignar probabilidades
•Solución.
  Definamos el suceso vuelo es exitoso, utilizando el enfoque empírico o
frecuencia relativa tenemos

La probabilidad de que una futura misión del transbordador espacial concluya


con éxito es de .
Probabilidad subjetiva. Posibilidad (probabilidad) de que un evento ocurra en
particular de acuerdo a un individuo a partir de cualquier información disponible
que tenga. Generalmente se utiliza para eventos que nunca han ocurrido.
Ejemplos.
 Probabilidad de que Colombia sea el próximo campeón mundial de futbol
 probabilidad de que el desempleo en Colombia se reduzca al 2% el próximo año
Probabilidad simple (marginal) y conjunta
•Probabilidad
  simple. Se refiere a la probabilidad de ocurrencia de un evento
simple,
Probabilidad conjunta. Se refiere a la probabilidad de ocurrencia que implica
a dos o más eventos.
Para calcular estas probabilidades puede usarse el punto de vista clásica,
empírica.
Ejemplo. En la tabla siguiente, se presentan las resultados de una encuesta
realizada a una muestra de 1000 hogares en términos del comportamiento
de compras de equipos de televisión de pantalla grande.
Probabilidad simple (marginal) y conjunta
•   El espacio muestral consiste en las   Realmento lo compró
Planea comprarlo Si No Total
1000 personas encuestadas. Los
Si 200 50 250
eventos simples son: No 100 650 750
Total 300 700 1000
Planea comprarlo
No planea comprarlo; Compra realmente; No lo compra realmente
El evento “planea comprarlo y realmente lo compra” es un evento conjunto
porque quien responda debe planear comprar la televisión y realmente
comprarla. Este evento conjunto utilizando la notación definida para los
eventos simples la podemos representar como:
Planea comprarlo y realmente lo compró
Probabilidad simple (marginal) y conjunta
•Preguntas.
  Si se elije una persona al azar responder
a. Probabilidad de planear la compra
b. Probabilidad haber planeado la compra y haberlo comprado realmente
c. Probabilidad comprar realmente
d. Probabilidad de no tener planeado la compra y comprar realmente.
e. Probabilidad de planear o comprar.   Realmento lo compró
Planea comprarlo Si : C No : D Total
Solución. Si : A 200 50 250

f. No : B 100 650 750


Total 300 700 1000
g. ; c.
Probabilidad simple (marginal) y conjunta
•d. 
  Realmento lo compró
Planea comprarlo Si : C No : D Total
Si : A 200 50 250
Reglas para calcular probabilidades No : B
Total
100
300
650
700
750
1000

 Regla de la adición

Con esta regla podemos responder la pregunta e.


e.

 𝐴 ∩ 𝐵
Reglas para calcular probabilidades
•Observación.
 
• Dos eventos son mutuamente excluyentes si ambos eventos no pueden
ocurrir de manera simultanea. Esto es

• Si son eventos excluyente, entonces

• Una colección de eventos son excluyentes si


• En este caso la regla de la adición queda como:
Reglas para calcular probabilidades
•  Regla del complemento

Por tanto

 Regla Probabilidad condicional


Probabilidad de que un evento en particular ocurra, dado que otro evento
haya ocurrido. Esta probabilidad condicional se denota por .
Reglas para calcular probabilidades
•Ejemplo
  1. De la encuesta en consideración, si se elije al azar una persona y se
sabe que esta persona planea hacer la compra, ¿Cuál es la probabilidad de
Realmento lo compró
que realmente haga la compra?  

Planea comprarlo Si : C No : D Total


Solución. Si : A 200 50 250
No : B 100 650 750
Total 300 700 1000

El espacio muestral restringido en este caso son todos los que planean hacer
la compra (250), y de ellos 200 la realizan realmente.
Observación.
Reglas para calcular probabilidades
•   general, si son eventos de un mismo espacio muestral se tiene:
En

 Regla del producto.


Reglas para calcular probabilidades
•Ejemplo.
  Se tiene un juego 52 cartas, donde 4 son as . Se eligen en forma
aleatoria dos cartas sin restitución, ¿Cuál es la probabilidad de que ambas
cartas elegidas sean as?
Solución.
La primera carta elegida es as
la segunda carta elegida es as
Luego,
Independencia estadística
•   eventos son estadísticamente independientes si y solo si
Dos

De otra forma si son estadísticamente independientes, entonces

También podría gustarte