Está en la página 1de 15

1

PROBABILIDAD Y ESTADÍSTICA
Por Juan Carlos Espíndola Mateos

Variable aleatoria, valor esperado, media, varianza y


covarianza.
Supongamos que se desea saber el estado civil (soltero, casado, divorciado, unión
libre) de las personas que trabajan de meseros en restaurantes de una ciudad. Para
ello se recurre a una muestra y se infieren datos de la población a partir de la
muestra.

Debido a que las predicciones o decisiones que formulamos sobre una población
con apoyo de la información muestral, genera un grado de incertidumbre, ésta se
expresa en probabilidades.

Para el caso de los meseros, puede ser de interés estudiar si la probabilidad de


divorcio es alta.

Objetivo: Calcular probabilidades utilizando la función de probabilidad y la


función de distribución de una variable discreta.

Comprender el concepto de valor esperado.

Calcular la media y la desviación estándar de una distribución de


probabilidad discreta.

Este material didáctico, elaborado para fines académicos, fue tomado, adaptado y
elaborado a partir de:

Walpole R., Myers R., Myers S., Ye K. Probabilidad y Estadística para


ingeniería y ciencias. Octava Edición. Pearson, Prentice Hall. 2007

Devore J. Probabilidad y Estadística para ingeniería y ciencias. Séptima


edición. Cengage Learning. 2008

Reservados todos los derechos. No se permite reproducir, almacenar en sistemas


de recuperación de la información ni transmitir parte alguna de esta publicación,
cualquiera que sea el medio empleado –electrónico, fotocopia, grabación, etc.-, sin
el permiso previo del titular de los derechos de la propiedad intelectual.

Esta obra puede ser utilizada sin fines de lucro, citando invariablemente la fuente y
sin alterar la obra, respetando los términos institucionales de uso y los derechos de
propiedad.
2

Variable aleatoria, valor esperado, media, varianza y


covarianza.

Distribuciones de probabilidad.

El principio de la distribución de la probabilidad resulta al considerar un experimento


aleatorio, y al preguntarnos acerca de los eventos posibles y sus respectivas
probabilidades.

Hay dos tipos de distribución de probabilidad los cuales son de gran importancia en
diversas áreas del conocimiento: las distribuciones discretas y las continuas.

Las distribuciones discretas se derivan de las variables aleatorias discretas, por


ejemplo, el número de llamadas telefónicas que se reciben por quejas, el número
de respuestas contestadas de manera correcta en un examen, el número de
artículos defectuosos, entre otros ejemplos.

Las distribuciones continuas se generan a partir de las variables aleatorias


continuas; ejemplo de este tipo de variables son el periodo de vida de una batería,
el promedio de las calificaciones de los estudiantes al finalizar un ciclo escolar, o el
coeficiente intelectual de una persona.

Espacio muestral.

El espacio muestral es el conjunto de todos los posibles resultados de un


experimento aleatorio y se suele representar como S (o bien como omega, Ω, del
alfabeto griego).

Retomemos este tema, que se vio en sesiones anteriores, con un ejemplo:


3

Un juego de azar consiste en lanzar dos


dados legales al mismo tiempo y ganar
tantos pesos como sea el resultado de la
suma de los puntos obtenidos en los dados.

Como se solicita la suma de números o


puntos obtenidos en cada dado para dar un
premio en pesos equivalente a la suma
obtenida, entonces, esta suma de los
puntos representa el espacio muestral
solicitado:

S = {2, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10,
10, 10, 11, 11, 12}

Variables aleatorias.

Recuerda que puedes tener dos tipos variables: cualitativas y cuantitativas. Las
primeras hacen referencia a las cualidades de lo que se pretende observar o medir.
Mientras que las otras le asignan una medida numérica a lo observado en un
experimento. Además, las cuantitativas o numéricas son discretas o continuas.

No obstante, en ocasiones los resultados de un experimento aleatorio no tienen


necesariamente un valor numérico, por lo que en muchas encuestas los resultados
se miden en una escala cualitativa.

Por otra parte, a los números se les puede registrar o contar; además su información
se puede resumir con facilidad en un reporte.

La regla que asigna números a los posibles resultados de un experimento se le


conoce como variable aleatoria. En otras palabras, una variable aleatoria es una
regla que representa los posibles valores numéricos asociados con los resultados
de un experimento.
4

Por ejemplo, cuál es la probabilidad de


obtener la suma de 4 al lanzar dos dados al
mismo tiempo:

S = {2, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6,
7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 9, 10, 10,
10, 11, 11, 12}

La variable aleatoria se denota con letras


mayúsculas “X” y sus valores con
minúsculas “x”.

Ejemplo:

X: obtener 4 al sumar los puntos obtenidos cuando se lanzan dos dados legales;

x: 4

Se expresa p(x) = P(X = x); es decir, p(4) = P(X = 4) = 3/36

Variable aleatoria discreta.

Las variables aleatorias que se observan en la naturaleza poseen ciertas


características y se pueden clasificar según su tipo, por ejemplo, X: el número de
insectos que se mueren al aplicar una dosis de un insecticida. Los valores de esa
variable son: x = 0, 1, 2, … A esta variable se le clasifica como discreta.
5

Ejemplo de aplicación de la variable aleatoria discreta.

Examen de opción múltiple: ¿qué opiniones tienes al respecto? ¿cómo se te hacen


estos exámenes al responderlos? ¿te ha sorprendido la calificación obtenida en
estos exámenes?

En este caso se analizará un examen de tres preguntas las cuales se responden al


azar:

 ¿De cuántas maneras diferentes se puede contestar el examen?


 ¿Cuántas respuestas correctas se pueden obtener?
 ¿Cómo se puede organizar la información según el número de respuestas
correctas?

Cada pregunta tiene dos respuestas: I (si se responde en forma incorrecta) y C (si
se responde en forma correcta).

En la siguiente tabla se muestran las diferentes respuestas proporcionadas por los


encuestados en donde la variable aleatoria “X” se asocia al número de respuesta
correctas y con ello determinar el espacio muestral:

Resultado obtenido Valor de la variable aleatoria x.


Pregunta 1 Pregunta 2 Pregunta 3
I I I 0
I I C 1
I C I 1
C I I 1
I C C 2
C I C 2
C C I 2
C C C 3

La información de la tabla se interpreta de la siguiente manera: x = 0, indica que


ninguna de las tres preguntas se contestaron de manera correcta (tres preguntas
se contestaron de manera incorrecta); si x = 1, significa que una de las tres
respuestas es correcta; si x = 2, señala que dos respuestas fueron correctas y; x =
3 muestra que las tres respuestas son correctas.
6

Lo anterior se puede resumir de la siguiente manera:

Valor numérico de x con un evento Composición


[x = 0] {III}
[x = 1] {ICI, IIC, CII}
[x = 2] {ICC, CIC, CCI}
[x = 3] {CCC}

Entonces “X” es la variable aleatoria asociada al número de respuestas correctas,


resultado del experimento. Los valores que puede tomar “x” son 0, 1, 2 o 3. Observa
que de acuerdo al resultado que se puede obtener en las tres preguntas la variable
es del tipo discreto, es decir, o toma un valor o toma otro valor, pero no puede tomar
valores intermedios entre los resultados obtenidos.

Distribución de probabilidad de una variable aleatoria discreta.

Tomando en cuenta el ejemplo anterior sobre los posibles números de respuestas


correctas se pueden determinar sus probabilidades de ocurrencia:

Número de
respuestas 0 1 2 3
correctas.

Composición. {III} {ICI, IIC, CII} {ICC, CIC, CCI} {CCC}

Probabilidad. 1/8 3/8 3/8 1/8

Una variable aleatoria discreta es una variable numérica, que toma un número de
valores que se pueden contar. Hay que recordar que la variable “X” representa el
número de respuestas correctas, la tabla anterior describe los posibles valores
que “X” puede tener, y la probabilidad de cada valor.
7

La notación que se usa para la distribución de una variable aleatoria es similar a la


notación para la probabilidad de un evento. Por ejemplo, x = 0 se puede definir como
el evento A = {ninguna respuesta es correcta}. Por ejemplo, x = 0 correspondería a
un evento (supongamos que es A), ninguna respuesta es correcta
p(A) = P(X = 0)=1/8:

p(A) P(X = 0)
A: ninguna respuesta es correcta La probabilidad de que A adquiera o
indique que el número de respuestas
correctas es cero o que X = 0.

X (X) adquiere el valor (=), ninguna


respuesta es correcta (0).

En general, la probabilidad para la variable aleatoria X se expresa por:

para todos los valores posibles de X.

Retomando el problema se tiene que las probabilidades son:

Número de Composición. Probabilidad. Probabilidad con


respuestas notación.
correctas.

0 {III}

1 {ICI, IIC, CII}

2 {ICC, CIC, CCI}

3 {CCC}
s

, la probabilidad de que el número de respuestas correctas


(X) sea exactamente cero (x), es de 1/8.
8

, la probabilidad de que el número de respuestas correctas


(X) sea exactamente una (x), es de 3/8.

Con la información
anterior se puede
construir una gráfica,
por tratarse de una
variable aleatoria
discreta se debe de
emplear un diagrama
de barras para esta
distribución de
probabilidad,
además, se trata de
un polígono de
frecuencia relativa:

La distribución de probabilidad de la variable aleatoria discreta satisface las


siguientes condiciones:

1. , para cada valor de de .

2.

3.
9

Notación para el cálculo de probabilidades.

A menudo, estamos interesados en el procedimiento para calcular probabilidades


en que la variable aleatoria toma un valor. Cuando se realiza este tipo de cálculos
se utiliza un lenguaje con el que debemos familiarizarnos, por lo cual decimos que
“X” es:

 Al menos x, menos de x, más que x o mayor que x, entre x1 y x2, a lo más x,


entre x1 y x2 inclusive.

En la siguiente tabla se resume esta notación y se indica el significado y su relación


con la probabilidad.

Lenguaje común Interpretación Notación


La probabilidad de que Todos los valores de la
variable
X tome un valor que es aleatoria
Al menos “x” Que son los valores de “x”
o mayores que “x”
Más que “x” Que son mayores que el
valor “x”
A lo más “x” Que son los valores de “x”
o menores que “x”
Menos de “x” Que son menores que el
valor “x”
Entre x1 y x2 Que son mayores que los
valores x1 y menores que
los valores x2
Entre x1 y x2 y que les Que inicia con el valor de
incluye x1 y termina con el valor
de x2 incluyendo los
valores x1 y x2
10

Valor esperado (esperanza) y desviación estándar.

Si tenemos un dado de seis caras donde cinco de ellas


tienen un 3 y una de ellas un 6. Si tiramos el dado 6000
veces.

¿Cuál sería el valor esperado del promedio de tiros


lanzados? ¿Por qué?

Considere el siguiente juego. Lanzamos


dos dados. Si el resultado suma 2 entonces
el jugador gana $1000; de lo contrario
pierde $100.

¿Jugarías a este juego?

¿A qué suma le apostarías? ¿Por qué?

Recordemos que sobre los datos obtenidos a través de las variables cuantitativas
se pueden calcular medidas numéricas tanto para la población como para una
muestra.

Un parámetro es la medida numérica que se calcula a partir de los datos observados


en una población.

Un estadístico es la medida numérica que se calcula a partir de los datos


observados en una muestra.
11

Medidas numéricas
Media Mediana Varianza Desviación
poblacional poblacional poblacional estándar
Población Parámetro poblacional

Media Mediana Varianza Desviación


muestral muestral muestral estándar
Muestra Estadístico muestral

No obstante, una vez que se cuenta con el análisis de los datos, su distribución y
su función de distribución de probabilidad acumulada se tiene interés por responder
algunas preguntas generadas a partir de la variable aleatoria (v. a.) “X”: ¿Cuál es la
distribución de probabilidad para un determinado valor de la v. a. “X”? ¿Cuál es la
media de la v. a. “X”? ¿Cuál es la desviación estándar para la distribución de
probabilidad dada la v. a. “X”?

Por ejemplo, todos los seres humanos tenemos características numéricas que nos
identifican y nos distinguen de otras personas, por ejemplo, la edad, estatura, talla,
peso, etc. Si pudiéramos considerar la totalidad de todos estos números para una
persona en particular, la identificaríamos de manera única. Algo similar sucede con
las variables aleatorias.

Para entender lo anterior recuerda las dos situaciones planteadas al inicio de este
tema. A partir de esto, el valor esperado o la esperanza de una variable aleatoria es
entonces un número que indica el promedio ponderado de los diferentes valores
que puede tomar la variable.

En otras palabras, dada una variable aleatoria (v. a.) “X”, la esperanza estudia en
torno a qué valor esperamos el resultado (medida de posición central de la v.a. “X”)
y cómo es la variabilidad de “X” (medida de dispersión de la v. a. “X”).

A la esperanza se le conoce también con los nombres de: media, valor esperado o
valor promedio. En general se usa la letra griega µ (mu) para denotarla o de manera
alternativa con E(X).

Por lo que la media o valor esperado de la variable aleatoria “X” es:


12

La suma es sobre todos los valores distintos de xi de X y tiene las siguientes


características:

 La E(X) es un promedio y es un posible valor de la v.a. X.

 La E(X) puede no existir.

 La E(X) se introdujo originalmente ligado a los juegos de azar como el beneficio que
se espera obtener en el juego.

Retómenos el siguiente juego para explicar


la esperanza o valor esperado:

Un juego de azar consiste en lanzar dos


dados legales al mismo tiempo y ganar
tantos pesos como sea el resultado de la
suma de los puntos obtenidos en los dados.

¿A qué valor le apostarías? ¿Por qué?

X: La suma de los puntos obtenidos

La tabla siguiente muestra la distribución de probabilidad de los puntos obtenidos al


lanzar dos dados:
13

Valor de la
suma "x" de
los puntos al 2 3 4 5 6 7 8 9 10 11 12 Total
lanzar dos
dados
Frecuencia
absoluta de
los posibles 1 2 3 4 5 6 5 4 3 2 1 36
resultados de
la suma
Probabilidad
de ocurrencia
0.0278 0.0556 0.0833 0.1111 0.1389 0.1667 0.1389 0.1111 0.0833 0.0556 0.0278 1.00
de alguna
suma p(x)

Entonces, para calcular la esperanza, media, valor esperado o valor promedio; de


acuerdo con la fórmula establecida se debe de multiplicar cada valor de X=x por su
probabilidad y al final realizar la suma de estos resultados:

Valor de la
suma "x" de
los puntos al 2 3 4 5 6 7 8 9 10 11 12 Total
lanzar dos
dados
Frecuencia
absoluta de
los posibles 1 2 3 4 5 6 5 4 3 2 1 36
resultados de
la suma
Probabilidad
de ocurrencia
0.0278 0.0556 0.0833 0.1111 0.1389 0.1667 0.1389 0.1111 0.0833 0.0556 0.0278 1.00
de alguna
suma p(x)

x*p(x) 0.0556 0.1667 0.3333 0.5556 0.8333 1.1667 1.1111 1.0000 0.8333 0.6111 0.3333 7.00

De acuerdo a este resultado el valor del parámetro


representa la media que se
espera obtener como resultado de la suma de los
puntos al lanzar dos dados. Este parámetro es
una medida de tendencia central (centro) de la
distribución de probabilidad.
14

Varianza de una distribución de probabilidad.

El concepto de valor esperado permite medir de manera numérica la dispersión de


una distribución de probabilidad, es decir, la desviación estándar. En otras palabras,
la esperanza de una variable aleatoria da información sobre el “centro” de la variable
aleatoria. Sin embargo, la esperanza no brinda información sobre cómo están
dispersados los valores alrededor de su centro. Para tener una medida de la
dispersión se define la varianza.

La varianza es una medida del grado de dispersión de los diferentes valores


tomados por la variable. Se le denota regularmente por la letra σ2 (sigma cuadrada).
A la raíz cuadrada positiva de la varianza, esto es σ, se le llama desviación estándar

Observemos que para calcular Var(X) necesitamos conocer primero E(X). Así la
varianza se define por:

En resumen, la varianza de la variable aleatoria X es:

Y la desviación estándar de la variable aleatoria X es:


15

Calculemos la varianza y desviación estándar del ejemplo anterior:

Valor de la
suma "x " de
los puntos al 2 3 4 5 6 7 8 9 10 11 12 Total
lanzar dos
dados
Frecuencia
absoluta de
los posibles 1 2 3 4 5 6 5 4 3 2 1 36
resultados de
la suma
Probabilidad
de ocurrencia
0.0278 0.0556 0.0833 0.1111 0.1389 0.1667 0.1389 0.1111 0.0833 0.0556 0.0278 1.00
de alguna
suma p(x )

x *p(x ) 0.0556 0.1667 0.3333 0.5556 0.8333 1.1667 1.1111 1.0000 0.8333 0.6111 0.3333 7.00

(x- μ ) p(x)
2
0.6944 0.8889 0.7500 0.4444 0.1389 0.0000 0.1389 0.4444 0.7500 0.8889 0.6944 5.83

El valor del parámetro mide que tan dispersos están los


datos con respecto a su media. Este parámetro es una medida de variabilidad con
respecto a la media de la distribución de probabilidad.

Por otra parte, el valor del parámetro es la desviación


estándar que indica qué tan dispersos están los datos alrededor de la media. La
desviación estándar utiliza las mismas unidades de medida que los datos.

Revisa el siguiente video:

https://riunet.upv.es/handle/10251/135044

También podría gustarte