Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Etapa de Profundizacion
Etapa de Profundizacion
Estadística y
Probabilidad
Tabla de contenido
Introducción ................................................................................................................................3
Pregunta orientadora ..................................................................................................................3
1. Definiciones y conceptos básicos ...........................................................................................3
1.1. Población y muestra............................................................................................................ 3
1.2. Variables cuantitativas discretas y continuas ...................................................................... 4
1.3. Variables cualitativas ordinales y nominales ....................................................................... 5
3. Medidas de tendencia central .................................................................................................7
3.1. Media o promedio aritmético ............................................................................................... 7
3.2. Mediana…........................................................................................................................... 7
3.3. Moda……… ........................................................................................................................ 9
4. Medidas de dispersión............................................................................................................9
4.1. Varianza y desviación estándar........................................................................................... 9
4.2. Desviación media y coeficiente de variación ......................................................................10
5. Probabilidad .........................................................................................................................11
5.1. Definición y Problemas de aplicación .................................................................................11
5.2. Reglas de la multiplicación .................................................................................................12
5.3. Problema condicional .........................................................................................................12
5.4. Probabilidad condicional ....................................................................................................13
5.5. Teorema de Bayes .............................................................................................................14
5.6. Regla de la suma ...............................................................................................................15
5.7. Diagrama de Árbol .............................................................................................................16
Referencias...............................................................................................................................16
3
Introducción
Sin embargo, no sobra aclarar que esas series de datos con las cuales nos encontramos, deben
corresponder a un tema específico, lógico y que permita tomar decisiones. Sobre esto podemos
inicialmente mencionar ejemplos elementales, como averiguar cuánto tarda un automóvil en ir de
la ciudad A a la B; cuánto pesa un recién nacido; de varios candidatos a la presidencia, cual será
el favorito en las próximas elecciones, entre otros. En la mayoría de las veces uno mismo hace
sus apreciaciones sobre los resultados y se entera si se demoró lo normal en recorrer una
trayectoria.
En oposición a lo que acabamos de presentar, se puede dar cuenta el que un conjunto abstracto
de números referente a una situación cualquiera puede considerarse simplemente informativa y
por consiguiente no ser estadística. Por lo tanto, el enfoque para comenzar se basará en resolver
aquellos aspectos de la investigación de observaciones utilizando la estadística y probabilidad
como medio.
Pregunta orientadora
Población se refiere al universo, conjunto o totalidad de elementos sobre los que se investiga o
hacen estudios. Muestra es una parte o subconjunto de elementos que se seleccionan
previamente de una población para realizar un estudio. Las poblaciones están compuestas por
elementos que tienen características en común, y pueden ser de varios tipos:
Población finita: es aquella que se puede contar y se pueden estudiar con mayor
facilidad a sus integrantes. Por ejemplo, la cantidad de personas inscritas en un gimnasio.
Población infinita: son inmensas poblaciones donde se hace muy difícil contabilizar a
sus integrantes, por lo que suele tomarse en cuenta solo una porción de ella a la hora de
realizar un estudio, seleccionando así una muestra. Por ejemplo, la cantidad de granos
de arena en una playa.
4
Población hipotética: son poblaciones posibles que pueden ser estudiadas ante una
eventualidad. Por ejemplo, la cantidad de nacimientos de bebés prematuros.
Las muestras se emplean para hacer estudios de las poblaciones que se hacen un poco
más factibles, ya que en ocasiones por el tamaño de las poblaciones no es fácil realizar
los estudios, existen diferentes tipos de muestreo por medio de los cuales a partir de una
población se pueden extraer los datos a analizar.
Muestreo aleatorio simple: los elementos se eligen de una lista al azar. Funciona más
eficazmente cuando el universo es reducido y homogéneo.
Las variables cuantitativas son las que se pueden representar a partir de un resultado numérico
y son las más utilizadas en encuestas. Las variables cuantitativas se pueden dividir en discretas
y continuas.
Continua: la variable continua, por otro lado, puede otorgar un valor de cualquier intervalo
o medición, es decir que puede haber otros valores en medio de dos exactos.
Generalmente estos son representados por valores decimales, por lo cual la cifra será
mucho más específica. Por ejemplo, la estatura de una persona puede ser de 1,75
centímetros.
Una variable cualitativa es un tipo de variable estadística que describe las cualidades,
circunstancias o características de un objeto o persona, sin hacer uso de números, de esta
manera, las variables cualitativas permiten expresar una característica, atributo, cualidad o
categoría no numérica. Por ejemplo, el sexo de una persona es una variable cualitativa, ya que
es masculino o femenino.
Nominal: variable que no es representada por números ni tiene algún tipo de orden, y por lo
tanto es matemáticamente menos precisa. Por ejemplo, son variables nominales los colores:
negro, azul, rojo, amarillo, naranja, entre otros.
Ordinaria: es también conocida como variable cuasi cuantitativa, es representada por una
modalidad que no requiere números, pero sí consta de un orden o un puesto. Por ejemplo, el
nivel socioeconómico: alto, medio, bajo.
Binaria: se trabaja con valores específicos del tipo binario. Por ejemplo, el sexo de una persona
será masculino o femenino.
2. Tablas de frecuencia
En la tabla que se muestra a continuación tenemos varios ítems los cuales el 𝑋𝑖 que representa
la variable a analizar y la columna representa los valores que toma esa variable, en la siguiente
columna, la frecuencia absoluta 𝑓 es presentada, cuyo valor es el número de veces que se midió
dicho valor de la variable, en la siguiente columna se representan las frecuencias relativas, las
cuales son el resultado de dividir la frecuencia absoluta por el número total de mediciones, en la
columna número 4 y 5 se muestran las frecuencias acumuladas que es el resultado de sumar las
frecuencias absolutas hasta la posición donde se encuentra el dato que se desea calcular; es
decir, que para calcular la frecuencia relativa de 4 hay que sumar 7+19+25+12=63.
Por otro lado, tenemos las tablas de datos agrupadas en las cuales como su nombre lo indica,
los datos se agrupan para formar lo que se conoce como clases y así facilitar la interpretación de
los datos.
Una medida de tendencia central es un valor único que resume un conjunto de datos. De una
manera práctica señala el centro de los valores.
La media aritmética es la suma de todos los valores de la población o muestra dividido entre el
número total de dichos datos. Para este parámetro, hacemos uso de las fórmulas dispuestas en
la siguiente tabla:
3.2. Mediana
La mediana se define como “el valor abajo del cual se encuentra la mitad de los valores y arriba
del cual se encuentra la otra mitad.” Es decir, la mediana es el punto central o medio de los datos,
después de ordenarlos de menor a mayor o viceversa, donde el 50% de las observaciones son
menores a dicho valor y el 50% son superiores.
8
𝑀𝑒 = 𝑥𝑛+1
2
𝑥1 = 4, 𝑥2 = 7, 𝑥3 = 8, 𝑥4 = 5, 𝑥5 = 6, 𝑥6 = 3, 𝑥7 = 1
El valor central es el cuarto (𝑥4 = 5). Este valor, que es la mediana de ese conjunto de datos, nos
deja 3 datos por debajo y tres por encima del valor calculado.
b) Si n es par, la mediana es la media aritmética de los dos valores centrales. Por ejemplo
si n=6, la mediana es el punto central de los datos 𝑥3, 𝑥4.
𝑥1 = 4, 𝑥2 = 7, 𝑥3 = 8, 𝑥4 = 5, 𝑥5 = 6, 𝑥6 = 3
𝑥𝑛 + 𝑥𝑛 + 1 𝑥3 + 𝑥4 8 + 5
2 2
𝑀𝑒 = = = = 6,5
2 2 2
Si los datos están agrupados en una tabla de distribución de frecuencias de clase, la mediana se
puede hallar aplicando la siguiente fórmula:
𝑛
− 𝐹𝑎𝑐
𝑀𝑒 = 𝐿𝑖𝑐 + (2 )𝑐
𝑓𝑚𝑒
Donde:
3.3. Moda
Se define como el dato que se presenta con mayor frecuencia. Se determina, para datos
agrupados con la aplicación de la siguiente fórmula:
𝑑𝑖
𝑀𝑜 = 𝐿𝑖𝑐 + ( )𝑐
𝑑1 + 𝑑2
4. Medidas de dispersión
Las medidas de tendencia central solamente localizan el centro de los datos, pero un promedio
no indica nada si no se establece como están distribuidos los datos con respecto al citado
promedio. En tal sentido se hace necesario establecer qué tanto están alejados con respecto a
la media; es decir, describir la variabilidad o dispersión de los datos considerados.
Rango y Amplitud
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Se utiliza en aplicaciones del control estadístico de la calidad y de los procesos de producción.
La varianza se define como el promedio de las desviaciones cuadráticas de los datos con
respecto a la media. La desviación estándar se define como la raíz cuadrada de la varianza. Se
extrae la raíz con el propósito de mantener las unidades de los datos originales.
∑(𝑥𝑖 − 𝜇)2
𝜎=√
𝑁
Donde:
𝑁: Tamaño de la población.
(∑ 𝑥)2
∑(𝑥𝑖 − 𝜇)2 ∑ (𝑥 2 − )
√ 𝑛
𝑠=√ =
𝑛−1 𝑛−1
Si los datos se encuentran agrupados en una tabla de distribución de frecuencias, la fórmula para
la desviación estándar se convierte entonces en:
∑(𝑥𝑖 − 𝜇)2 𝑓𝑖
𝑆=√
𝑛−1
Desviación media
∑ |𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛
Coeficiente de variación
Es una medida relativa que se define como el cociente entre la desviación estándar y la media
aritmética, expresada como un porcentaje. Su utilidad radica en poder comparar conjuntos de
datos que tienen diferentes unidades o los datos están en las mismas unidades, pero los valores
medios están muy distantes. El resultado se expresa en porcentaje y se calcula de la forma
siguiente:
𝑠
𝐶𝑉 =
𝑥̅
Por ejemplo, si el cálculo anterior para dos conjuntos de datos nos da el 20% y el 10%, se
interpreta que el primer conjunto tiene una mayor dispersión relativa, con respecto a la media de
la distribución.
11
5. Probabilidad
Gran parte de la vida del hombre se caracteriza por la incertidumbre. Muchos fenómenos del
mundo parecen estar dominados por el comportamiento aleatorio. Casi todas las decisiones se
toman en un entorno caracterizado por la ausencia de un conocimiento completo de la situación.
Así, una decisión acerca de la cantidad de unidades a fabricar se basa en las estimaciones del
número de unidades que se espera vender. El término probabilidad se refiere al estudio de la
aleatoriedad y la incertidumbre. En cualquier situación donde se produzca uno o más de varios
resultados, la teoría de la probabilidad proporciona métodos adecuados para cuantificar las
posibilidades, oportunidades o simplemente probabilidades.
Clásica o a-priori:
Empírica o a-posteriori:
Se basa en las frecuencias relativas. Los resultados no se pueden dar con anterioridad.
Subjetiva:
Dos o más eventos son mutuamente excluyentes si la ocurrencia de cualquiera de ellos, implica
que ninguno de los otros eventos pueda ocurrir al mismo tiempo, o sea, no pueden ocurrir o
presentarse al mismo tiempo. Por ejemplo, es chino o es china, o es tuerca o es tornillo; pero no
las dos cosas a la vez.
12
Los eventos son dependientes si la ocurrencia de un evento afecta la ocurrencia de otro. En este
caso se realiza un muestreo sin reposición.
Colectivamente exhaustivo: Si por lo menos uno de los eventos debe ocurrir cuando se realiza
un experimento, es decir su unión explica todos los posibles resultados de un experimento.
De acuerdo con los enfoques clásico o empírico para determinar probabilidades, el valor de
probabilidad se basa en el cociente del número de resultados elementales igualmente probables
que son favorables, con respecto al número total de resultados en el espacio muestral. Cuando
los problemas son simples, es posible contar en forma directa los resultados elementales, sin
embargo, en la práctica no se puede llevar a cabo tan fácilmente esta labor. Para determinar el
número de posibles resultados elementales, hacemos uso de ciertas reglas o principios de
conteo.
Principio de la multiplicación
Ejemplo
El principio también es aplicable a la emisión de placas de automóviles, donde las tres primeras
posiciones son letras, con determinadas restricciones y las tres últimas son dígitos. El número
total de placas emitidas en una ciudad estará dado por:
Una probabilidad en tanto por uno se debe expresar con 4 cifras decimales Ej. 0,3658. La anterior
cifra se puede escribir como 36,58%. Un valor cercano a cero significa que es poco probable que
el evento suceda. Un valor cercano a uno significa que es altamente probable que el evento
suceda.
13
La probabilidad de que un evento suceda es igual a uno menos la probabilidad de que el evento
no ocurra y viceversa. Se conoce con el nombre de regla del complemento.
𝑃(𝐸) = 1 − 𝑃(𝐸′)
𝑃(𝐸′) = 1 − 𝑃(𝐸)
Si dos eventos E1 y E2 son mutuamente excluyentes, la regla especial de la adición indica que
la probabilidad de que ocurra uno u otro de los eventos, es igual a la suma de sus probabilidades
simples.
Dados n eventos E1, E2, E3…… En mutuamente excluyentes, la probabilidad de que ocurra uno
u otro de los eventos, es igual a la suma de sus probabilidades simples o probabilidades
marginales.
Si dos eventos E1 y E2 son no mutuamente excluyentes, la regla especial de la adición indica que
la probabilidad de que ocurra uno u otro de los eventos o ambos a la vez, se puede expresar
mediante la siguiente fórmula:
Es una generalización para “n” eventos independientes, entonces la probabilidad conjunta que
los E1, E2, E3…… En eventos ocurran al mismo tiempo o en sucesión es igual al producto de
las probabilidades marginales y se puede expresar mediante la siguiente fórmula:
Es la probabilidad de que ocurra un evento determinado, dado que otro evento ya haya ocurrido.
La probabilidad de que ocurra el evento A dado que el evento B ha ocurrido se escribe P(A/B).
La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran
se encuentra multiplicando la probabilidad de que suceda A, por la probabilidad condicional de
que ocurra el evento B.
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)
En el siglo XVIII el reverendo Thomas Bayes quería probar la existencia de Dios, para ello intentó
desarrollar una fórmula matemática con base en evidencias terrenales disponibles. Más adelante,
Laplace afinó el trabajo de Bayes y le dio el nombre de Teorema de Bayes. Es conocido como la
fórmula de la probabilidad de causas. La probabilidad condicional tiene en cuenta información
adicional acerca de la ocurrencia de un evento para encontrar la probabilidad de otro. En este
caso, para expresar la probabilidad condicional de un evento aleatorio A dado que sucedió B
necesitamos primero otro resultado y como se vería afectado su valor.
Parte de una situación en la que es posible conocer las probabilidades de que ocurra una serie
de sucesos Ai. A esta se añade un suceso B cuya ocurrencia proporciona cierta información, ya
que las probabilidades de ocurrencia de B son diferentes y dependen de que Ai haya ocurrido.
Conociendo que ha ocurrido el suceso B, la fórmula del teorema de Bayes nos indica cómo
modifica esta información las probabilidades de los sucesos Ai.
La regla establece que dados dos eventos A y B, la probabilidad conjunta de que ambos ocurran
se encuentra multiplicando la probabilidad de que suceda A, por la probabilidad condicional de
que ocurra el evento B.
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵|𝐴)
𝑃(𝐸1|𝐸2) = 𝑃(𝐸1)
𝑃(𝐸2|𝐸1) = 𝑃(𝐸2)
15
P(E1 ∩ E2)
P(E1|E2) =
P(E2)
P(E1 ∩ E2)
P(E2|E1) =
P(E1)
De igual manera para comprender el nombrado Teorema de Bayes, se hace necesario tener
presente los enfoques de clásico (a priori) y empírico (a posteriori).
𝑃(𝐴)𝑃(𝐵|𝐴𝑖 )
𝑃(𝐴𝑖 |𝐵) =
𝑃(𝐴𝑖 )𝑃(𝐵|𝐴1 ) + 𝑃(𝐴2 )𝑃(𝐵|𝐴2 ) + ⋯ + 𝑃(𝐴𝑛 )𝑃(𝐵|𝐴𝑛 )
Si dos o más sucesos son tales, que solamente uno de ellos puede ocurrir en un solo ensayo, se
dice que son mutuamente excluyentes. Se denomina probabilidad aditiva y será igual a la suma
de las probabilidades de cada suceso.
𝑃 = 𝑃1 + 𝑃2 + 𝑃3 + ⋯ + 𝑃𝑛
Consideremos que p1, p2, p3,................pn son las distintas probabilidades de n sucesos
mutuamente excluyentes, la probabilidad (P) de que uno de estos sucesos se presente en un
solo ensayo, estará dada por la suma de las probabilidades para cada suceso.
𝑃 = 𝑃1 + 𝑃2 + 𝑃3 + ⋯ + 𝑃𝑛
𝑃(𝐴𝑜𝐵) = 𝑃𝐴 + 𝑃𝐵
𝑃(𝐴𝑜𝐵𝑜𝐶) = 𝑃𝐴 + 𝑃𝐵 + 𝑃𝐶 = PAUBUC
El diagrama de árbol es una representación gráfica útil para organizar cálculos que abarcan
varias etapas. Cada segmento en el árbol es una etapa del problema. Las probabilidades escritas
cerca de las ramas son las probabilidades condicionales del experimento.
Ejemplo
En una bolsa que contiene 7 chips rojos y 5 chips azules, se seleccionan dos chips uno después
del otro sin reemplazarlo. Elabore un diagrama de árbol mostrando esta información.
Referencias