Está en la página 1de 22

UNIDAD 1

Estadística El estudio de los fenómenos aleatorios


Obtención de conclusiones basadas en datos
Inferencia estadística
experimentales

Población Cualquier colección, ya sea de un número finito de mediciones


o virtualmente infinita, de datos acerca de algo de interés.

Muestra Subconjunto representativo seleccionado de una población

Existe la posibilidad de error. La confiabilidad se mide en términos de la


probabilidad de que la inferencia sea correcta.

Variable característica de los elementos que es de interés

Datos cualitativos y cuantitativos

Los datos cualitativos comprenden etiquetas o nombres. Emplean la


escala nominal o la ordinal y pueden ser numéricos o no.
Los datos cuantitativos requieren valores numéricos. Se obtienen usando
las escalas de medición de intervalo o de razón. Pueden ser:
Continuos: entre los posibles valores de los datos no hay separación.
Discreto: no se puede hacer más preciso. Por lo general, implica
números enteros.

Estadística descriptiva
El término estadística descriptiva se refiere al análisis, el resumen y la
presentación de los resultados relacionados con un conjunto de datos
derivados de una muestra o de toda la población.

La estadística descriptiva comprende tres categorías principales:


distribución de frecuencias,
medidas de tendencia central y
medidas de variabilidad.
DISTRIBUCIÓN DE FRECUENCIAS

Frecuencia fi
Es un resumen tabular de datos que muestra el número (frecuencia) de
elementos en cada una de las diferentes clases disyuntas (que no se
sobreponen).

Para elaborar una distribución de frecuencia con datos, se cuenta el número


de veces que aparece cada dato en la tabla. La distribución de frecuencia
resume la información sobre la popularidad de los datos.

Frecuencia relativa fri


Es igual a la parte o proporción de los elementos que pertenecen a cada
clase. En un conjunto de datos, en el que hay n observaciones:
Frecuencia de la clase /n

Frecuencia porcentual fri%


La frecuencia porcentual de una clase es la frecuencia relativa
multiplicada por 100.

Frecuencia acumulada absoluta Fi


En lugar de mostrar la frecuencia de cada clase, la distribución de
frecuencia acumulada muestra la cantidad de datos que tienen un valor
menor o igual al límite superior de cada clase. La frecuencia acumulada en
esta clase es simplemente la suma de la frecuencia de todas las clases en
que los valores de los datos son menores o iguales que la que se esta
midiendo.

Frecuencia acumulada relativa Fri


indica la proporción de todos los datos que tienen valores menores o
iguales al límite superior de cada clase.
Frecuencia absoluta de la clase /n

Frecuencia acumulada porcentual Fri%


Es la frecuencia acumulada relativa multiplicada por 100.
Intervalos
La tabla de frecuencia se puede hacer de dos formas:
Simple, cuando los valores se encuentran uno a uno
En intervalos, agrupa los datos en clases.

Clases
Número de clases: Se recomienda emplear entre 5 y 20 clases. clases.
La idea es tener las clases suficientes para que se muestre la variación
en los datos, pero no deben ser demasiadas si algunas de ellas
contienen sólo unos cuantos datos.
Ancho de clase: es recomendable que el ancho sea el mismo para
todas las clases. Para determinar el ancho de clase apropiada se
empieza por identificar el mayor y el menor de los valores de los datos.
Después, usando el número de clases deseado, se emplea la expresión
siguiente para determinar el ancho aproximada de clase

Ancho Valor mayor en los datos - Valor menor en los datos


=
aproximado Número de clase

Límite de clase: Los límites de clase deben elegirse de manera que


cada dato pertenezca a una y sólo una de las clases. El límite de clase
inferior indica el menor valor de los datos a que pertenece esa clase. El
límite de clase superior indica el mayor valor de los datos a que
pertenece esa clase.
GRÁFICOS
Grafica de barras

Es una gráfica para representar los datos cualitativos de una distribución de frecuencia, de
frecuencia relativa o de frecuencia porcentual. En uno de los ejes de la gráfica (por lo general en
el horizontal), se especifican las etiquetas empleadas para las clases (categorías).

Para el otro eje de la gráfica (el vertical) se usa una escala para
frecuencia, frecuencia relativa o frecuencia porcentual.
Después, empleando un ancho de barra fijo, se dibuja sobre
cada etiqueta de las clases una barra que se extiende hasta la
frecuencia, frecuencia relativa o frecuencia porcentual de la
clase.

Grafica de pastel

proporciona otra gráfica para presentar distribuciones de frecuencia relativa y de frecuencia


porcentual de datos cualitativos. Para elaborar una gráfica de pastel, primero se dibuja un
círculo que representa todos los datos.
Después se usa la frecuencia relativa para subdividir el círculo en
sectores, o partes, que corresponden a la frecuencia relativa de cada
clase. Por ejemplo, como un círculo tiene 360 grados y Coca cola
clásica presenta una frecuencia relativa de 0.38, el sector de la
gráfica de pastel correspondiente a Coca cola clásica resultará de
0.38(360)= 136.8 grados.

Graficas de puntos

En el eje horizontal se presenta el intervalo de los datos. Cada dato se representa por un
punto colocado sobre este eje. Las gráficas de puntos muestran los detalles de los datos y son
útiles para comparar la distribución de los datos de dos o más variables.

Histograma

Una presentación gráfica usual para datos cuantitativos es el histograma. Esta gráfica se hace
con datos previamente resumidos mediante una distribución de frecuencia, de frecuencia
relativa o de frecuencia porcentual.
Un histograma se construye colocando la variable de interés en el eje
horizontal y la frecuencia, la frecuencia relativa o la frecuencia
porcentual en el eje vertical. La frecuencia, frecuencia relativa o
porcentual de cada clase se indica dibujando un rectángulo cuya
base está determinada por los límites de clase sobre el eje horizontal
y la altura es la frecuencia correspondiente

Ojiva
es una gráfica que muestra los valores de los datos en el eje
horizontal y las frecuencias acumuladas, las frecuencias relativas
acumuladas
o las frecuencias porcentuales acumuladas en el eje vertical.
R: Xᵢ max- Xᵢ min
K(num de intervalos): 1+log₂ (m)
MEDIDAS NUMÉRICAS A: R/K

MEDIA x
La media proporciona una medida de localización central de los datos. Si
los datos son datos de una muestra, la media se denota X̅ ; si los datos son
datos de una población, la media se denota con la letra griega μ.

La fórmula para la media muestral cuando se tiene una muestra de n


observaciones es la siguiente:

x = Σxᵢ
n
Para calcular la media en base a datos agrupados:

x = Σxᵢ.fᵢ
N (número total de
datos, o la suma de fᵢ)

MEDIANA me o Xme
Ordenar los datos de menor a mayor (en forma ascendente).
1. Si el número de observaciones es impar, la mediana es el valor de
enmedio.
2. Si el número de observaciones es par, la mediana es el promedio de las
dos observaciones de enmedio

En datos agrupados se usa la siguiente fórmula:

n Linf: límite inferior del intervalo


- Fᵢ-1 . a Fᵢ-1: frecuencia absoluta
Xme = Linf + 2 acumulada anterior
fᵢ a: amplitud del intervalo

MODA mo o Xmo

La moda es el valor que se presenta con mayor frecuencia. Puede ser:


unimodal, bimodal, multimodal.

En datos agrupados se usa la siguiente fórmula:

fi: frecuencia de mayor valor


fᵢ - fᵢ-1 a
Xmo = Linf + . Linf: límite inferior del intervalo
Fᵢ-1: frecuencia acumulada anterior
(fᵢ - fᵢ-1) + (fᵢ -fᵢ+1) Fᵢ+1: frecuencia acumulada posterior
a: amplitud del intervalo
PERCENTILES pk
Son 99 valores de la variable que dividen a un conjunto de datos
ordenados en 100 partes iguales. Se calcula:
Paso 1: Ordenar los datos de menor a mayor (colocar los datos en
orden ascendente).
Paso 2. Calcular el índice i

i= (100
p ( n P= percentil deseado
n= número de observaciones

Paso 3:
Si no es un número entero redondeo para arriba
Si es un número entero el percentil p es el promedio de los valores
en las posiciones i e i + 1.

QUARTILES qk
Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada
parte contiene una cuarta parte o 25% de las observaciones.

Se calculan igual que el percentil, pero se buscan los percentiles 25,50


(mediana) y 75.

De la misma manera se calculan deciles, quintiles o cualquier número por


el que queramos dividir los datos.

En datos agrupados
KN KN
- Fᵢ-1 . - Fᵢ-1
Q k = linf + 4 a P k = linf + 100 . a
fᵢ fᵢ
MEDIDAS DE VARIABILIDAD

Rango Valor mayor -Valor menor

Rango intercuartilico RIC


Es la diferencia entre el tercer cuartil Q3 y el primer cuartil Q1. En otras
palabras, el rango intercuartílico es el rango en que se encuentra el 50%
central de los datos.
RIC= Q3 - Q1
2
VARIANZA S2 ó O
Está basada en la diferencia entre el valor de cada observación (xi) y la
media. A la diferencia entre cada valor xi y la media ( cuando se trata de
una muestra, μ cuando se trata de una población) se le llama desviación
respecto de la media.
varianza poblacional varianza muestral
vamos a
usar este
salvo que
aclare

que es lo mismo que

s²= Σ Xᵢ² - X̅ ²
n

DESVIACIÓN ESTANDAR S ó DS
Se define como la raíz cuadrada positiva de la varianza

Desviación poblacional
Desviación muestral

COEFICIENTE DE VARIACIÓN CV
En algunas ocasiones se requiere un estadístico descriptivo que indique
cuán grande es la desviación estándar en relación con la media.

Tomamos menor a 30% como homogéneo


MEDIDAS DE FORMA

ASIMETRÍA AS
Indica si los datos presentan sesgo, es decir para que lado están corridos
los datos.

AS= Σ (Xᵢ - .X̅ )³


n.S³

Si da menos que 0, hay sesgo negativo, los datos se encuentran


a izquierda (a), La media se encuentra a la izquierda de la
mediana.

Si da 0, es simetrico (b), la media es igual a la mediana

Si es mayor a 0, hay sesgo positivo, los datos se encuentran a la


derecha (c). La media se encuentra a la derecha de la mediana.

KURTOSIS k

La kurtosis indica como se ubican verticalmente los datos, la


forma de la concentración de los datos. Se usa la siguiente
fórmula:
k= Σ (Xᵢ - .X̅ )⁴ O restar 3 y usar el 0
de referencia
n.S⁴

Si da mayor a 3 es una distribución leptocúrtica


Si da menor a 3 es una distribución platicurtica
Si da igual a 3 es una distribución mesocúrtica

Diagrama de caja
Es un resumen gráfico de los datos. La clave para la elaboración de un
diagrama de caja es el cálculo de la mediana y de los cuartiles Q1 y Q3
También se necesita el rango intercuartílico. Los pasos para elaborar un
diagrama de caja son los siguientes.
1. Se dibuja una caja cuyos extremos se localicen en el primer y tercer
cuartiles. Esta caja contiene 50% de los datos centrales
2. En el punto donde se localiza la mediana se traza una línea vertical.
3. Usando el rango intercuartílico, RIC Q3 – Q1, se localizan los límites.
En un diagrama de caja los límites se encuentran 1.5(RIC) abajo del
Q1 y 1.5(RIC) arriba del Q3. Los datos que quedan fuera de estos
límites se consideran observaciones atípicas.
4. Alas líneas punteadas que se observan en la figura 3.5 se les llama
bigotes. Los bigotes van desde los extremos de la caja hasta los
valores menor y mayor de los límites calculados en el paso 3.
5. mediante un asterisco se indica la localización de las observaciones
atípicas.

Para ejercicios:
El largo de la caja determina el RIC, por lo que cuanto más grande más dispersos
se encuentran los datos
La mediana indica si hay sesgos o es simetrica, si la mediana se encuentra más
cerca del Q1 hay sesgo positivo, si se encuentra más cerca del Q2 hay sesgo
negativo.
UNIDAD 2
Probabilidad
La probabilidad es una medida numérica de la posibilidad de que
ocurra un evento. Los valores de probabilidad se encuentran en una
escala de 0 a 1. Los valores cercanos a 0 indican que las posibilidades de
que ocurra un evento son muy pocas. Los cercanos a 1 indican
que es casi seguro que ocurra un evento. Otras probabilidades entre
cero y uno representan distintos grados de posibilidad de que ocurra
un evento.

Espacio muestral S
Es el conjunto de todos los resultados posibles de un evento aleatorio.
Ejemplo cara o cruz en el evento lanzar una moneda.

Evento o suceso
Uno o varios de los posibles resultados

Reglas de conteo
Experimentos de pasos múltiples: Un experimento se describe como
una sucesión de k pasos en los que hay n1 resultados posibles en el
primer paso, n2 resultados posibles en el segundo paso y así en lo
sucesivo, entonces el número total de resultados experimentales es (n1)
(n2) . . . (nk). Si considera el experimento del lanzamiento de dos
monedas como la sucesión de lanzar primero una moneda (n1 = 2) y
después lanzar la otra (n2 = 2), siguiendo la regla de conteo (2)(2) = 4,
entonces hay cuatro resultados distintos

Combinaciones permite contar el número de resultados experimentales


cuando el experimento consiste en seleccionar n objetos de un conjunto
(usualmente mayor) de N objetos. Ésta es la regla de conteo para
combinaciones.

*0!=1
Como ejemplo del uso de la regla de conteo para combinaciones,
considere un procedimiento de control de calidad en el que un
inspector selecciona al azar dos de cinco piezas para probar que no
tengan defectos. En un conjunto de cinco partes. De acuerdo con la
regla de conteo de la ecuación con N=5 y n=2 se tiene:

Permutaciones: Dicha regla permite calcular el número de resultados


experimentales cuando se seleccionan n objetos de un conjunto de N
objetos y el orden de selección es relevante. Los mismos n objetos
seleccionados en orden diferente se consideran un resultado
experimental diferente.

Un ejemplo, reconsidere el proceso de control de calidad en el


que un inspector selecciona dos de cinco piezas para probar que
no tienen defectos. La ecuación indica que si N=5 y n=2, se tiene

Asignación de probabilidades

Requerimientos basicos para la asignación de probabilidades


1. La probabilidad asignada a cada resultado experimental debe
estar entre 0 y 1, inclusive
2. La suma de las probabilidades de los resultados experimentales
debe ser igual a 1.0. Para resultados experimentales n escriba este
requerimiento como
Método clásico
Es apropiado cuando todos los resultados experimentales tienen la
misma posibilidad. Si existen n resultados experimentales, la
probabilidad asignada a cada resultado experimental es 1/n.

método de frecuencia relativa


Es el más conveniente cuando existen datos para estimar la proporción
de veces que se presentarán los resultados si el experimento se repite
muchas veces. Ejemplo, un estudio sobre los tiempos de espera en el
departamento de rayos x de un hospital pequeño. Durante 20 días
sucesivos un empleado registra el número de personas que están
esperando el servicio a las 9:00 a.m.; los resultados son los siguientes.
Xi Fi

La probabilidad que se le asignará al resultado experimental 0


pacientes esperan el servicio, será 2/20 = 0.10; un paciente espera el
servicio 5/20 = 0.25; 6/20= 0.30 a dos pacientes esperan el servicio;
4/20= 0.20 a tres pacientes esperan el servicio y 3/20 =0.15 a cuatro
pacientes esperan el servicio.

método subjetivo
El más indicado cuando no es factible suponer que todos los resultados
de un experimento sean igualmente posibles y, además, cuenta con
pocos datos relevantes. Usa toda la información disponible, por ejemplo,
la propia experiencia o la intuición. Después de considerar dicha
información se asigna un valor de probabilidad que expresa el grado de
confianza (en una escala de 0 a 1) que tiene acerca de que un resultado
experimental ocurra. Como la probabilidad subjetiva expresa el grado
de confianza que tiene un individuo, es personal.

Desarrollo axiomático de la probabilidad


Para normalizar la definición de probabilidad, a través de un conjunto
de axiomas, se repasara brevemente los conceptos básicos de la teoría
de los conjuntos (o eventos), sobre los cuales se fundamenta la
definición formal de probabilidad.
El conjunto de todos los posibles resultados de un experimento recibe
el nombre de espacio muestral.
Se dice que es discreto si puede ponerse en una correspondencia
uno a uno con el conjunto de enteros positivos. Puede ser finito o
infinito
Se dice que es continuo si su resultado consiste en un intervalo de
números reales. Siempre es infinito.

Un evento del espacio muestral es un grupo de resultados contenidos


en este, cuyos miembros tienen una característica en común.
Evento nulo o vacío: no contiene ningún resultado del espacio
muestral
Evento seguro, el espacio muestral en si mismo.

Sean E1 y E2 dos eventos que se encuentren en un espacio muestral


denotado S
Recibe el nombre de unión el evento formado por todos los
resultados de E1 y E2. Se denota E1 U E2
Recibe el nombre de intersección el evento formado por todos los
resultados comunes de E1 y E2. Se denota E1 ∩ E2
Dos eventos son mutuamente excluyentes si no tienen resultados
en común, es decir E1 ∩
E2 = ∅
Si cualquier resultado de E2 es también resultado de E1, se dice que
E2 esta contenido en E1 y se denota E2 ⊂ E1
El complemento de un evento E con respecto al espacio muestral
S, es aquel que contiene todos los resultados de S que no se
-
encuentran en E, se denota E' ó E

Ley de Laplace
Número de casos favorables
P(a)=
Número de casos posibles

Regla de la suma
O --> Union
Unión inclusiva:
Y--> Intersección
P(AUB)= P(A)+(PB)- P(A ∩ B) /--> Dado que

Unión exclusiva (dado que):


P(AUB)= P(A)+(PB)- P(A∩ B)
Regla de la multiplicación
Saber si dos eventos son
Se usa cuando queremos encontrar la independientes
probabilidad de que 2 o más eventos se tiene que cumplir:
ocurran a la vez. P(A/B)=PA
Eventos independientes P(B/A)=PB

P(A ∩ B)= P(A) . P(B) ∩


P(A B)=PA.PB

Eventos dependientes con corroborar una de las


tres condiciones alcanza
P(A ∩ B)= P(A) . P(B|A)
P(A ∩ B)= P(B) . P(A|B)

Probabilidad condicional
La notación | indica que se está considerando la probabilidad del evento A
dada la condición de que el evento B ha ocurrido.
P(A|B)= P (A∩ B)
PB

Probabilidad marginal
Se obtienen al sumar las probabilidades conjuntas del renglón o columna
correspondiente de la tabla de probabilidades conjuntas
Teorema de la probabilidad total
Permite calcular la probabilidad de que ocurra un evento, que se
puede realizar a través de varios caminos.

Teorema de bayes

Es una aplicación de la probabilidad condicional.

P(A|B)= P (B|A ) . P(A)


PB

Más propiedades de probabilidad


UNIDAD 3
Variables aleatorias V.A.

Una variable aleatoria es un valor numérico que se asigna a un


resultado aleatorio en un experimento o proceso aleatorio.

Un ejemplo sería el lanzamiento de un dado. Si se asigna el valor 1 a la


cara del dado que aparece hacia arriba, entonces la variable aleatoria
podría tomar los valores 1, 2, 3, 4, 5, o 6 con igual probabilidad de 1/6
para cada uno de ellos. En este caso, la variable aleatoria representa
el resultado numérico del lanzamiento del dado.

En lenguaje matemático, una V.A. es una función cuyo dominio es el


espacio muestral y cuyo rango es el conjunto de los números reales. Se
acostumbra denotar las variables aleatorias con letras mayúsculas,
tales como X y Y.

En ocasiones se deseará definir y estudiar diferentes variables del


mismo espacio muestral.

Ejemplo:
En un experimento se determinó el número de bombas en dos
gasolineras. Se definen tres variables aleatorias:
X : número total de bombas en uso en ambas gasolineras,
Y: diferencia entre el número de bombas en la gasolinera 1 y 2
U:el máximo de los números de bombas en uso en ambas
gasolineras.

Si se obtiene un resultado de s=(2,3), entonces se puede calcular que


X=5, Y=-1 y U=3.

A su vez, las variables aleatorias pueden asumir números infinitos de


valores, como el caso de tirar una moneda al aire hasta que salga cara y
que la variable aleatoria X sea la cantidad de tiros hasta lograrlo.
Dos tipos de variables aleatorias
Variables aleatoria discretas, tienen un número contable de valores
entre dos valores cualesquiera.
Variables aleatoria es continuas, tienen un número infinito de
valores entre dos valores cualesquiera. Caracteristicas:
Su conjunto de valores posibles se compone de todos los
números que hay en uno o más intervalos sobre la línea de
numeración.
La probabilidad de que la variable aleatoria tome cualquier valor
específico es igual a cero, es decir, la probabilidad de que X sea
igual a algún valor particular c es P(X = c) = 0. En cambio, se
calcula la probabilidad de que la variable aleatoria esté dentro
de un rango determinado de valores.

Distribución de probabilidad

Una distribución de probabilidad es una función matemática que


describe la probabilidad de que una variable aleatoria tome un valor
específico o un rango de valores posibles.

Distribuciones de probabilidad para variables aleatorias discretas

Función de probabilidad
La función de probabilidad discreta asigna una probabilidad a cada
posible valor que puede tomar la variable aleatoria. La suma de todas las
probabilidades debe ser igual a 1.

La fórmula matemática de la función puede variar dependiendo del


tipo de distribución de probabilidad que se esté utilizando. Sin
embargo, en términos generales, la función de probabilidad para una
variable aleatoria discreta se puede expresar de la siguiente manera:
f(x)=P(X = x) = p
P(X = x) es la probabilidad de que la variable aleatoria X tome un
valor específico x
x es un valor posible que puede tomar la variable aleatoria X
p es la probabilidad asociada a ese valor x

Así se ve la tabla de probabilidad:


Ejemplo:

Gráfica lineal para la función de probabilidad:


Indica para cada valor que
puede tomar la variable (eje x)
la probabilidad (eje y). Para la
siguiente tabla de
probabilidad

el grafico sería -->

Función de distribución acumulativa FDA


La Función de Probabilidad Acumulada (FDA) se denota como F(x) y se
define como la probabilidad de que X sea menor o igual que un valor
dado x. La fórmula para calcular la FDA es la siguiente:

F(x) = P(X ≤ x)
Por ejemplo, si X representa el resultado del lanzamiento de un dado y
se quiere calcular la probabilidad de obtener un valor menor o igual a
3,. En este caso, la FDA se define como:
F(x) = P(X <= x) = P(X = 1) + P(X = 2) + P(X = 3)

Siendo en este caso la probabilidad de cada número la misma, 1/6,


quedaría:

F(3) = P(X <= 3) = P(X = 1) + P(X = 2) + P(X = 3) = 1/6 + 1/6 + 1/6 = 1/2

Grafico:
Para una variable aleatoria discreta X, la
gráfica de F(x) mostrará un salto con cada
valor posible de X, y será plana entre los
valores posibles.

Propiedades de la función de distribución acumulada (FDA) son:



0 ≤ F(x) ≤ 1 x: La función siempre toma valores entre 0 y 1 para
cualquier valor de x.
F(xi) ≥ F(xj) si xi ≥ xj: Si xi y xj son dos valores posibles que puede
tomar la VA, con xi ≥ xj, entonces la probabilidad acumulada de que la
VA tome un valor menor o igual a xi (F(xi)) es mayor o igual a la
probabilidad acumulada de que la variable aleatoria tome un valor
menor o igual a xj (F(xj)).
P(X > x) = 1 − F(x): la probabilidad de que X sea mayor que x es igual a 1
menos la probabilidad acumulada de X hasta x. Ejemplo, si F(x) = 0.8,
entonces p de que X sea mayor que x es P(X > x) = 1 - F(x) = 1 - 0.8 = 0.2.
P(X = x) = F(x) − F(x - ε): la probabilidad de que la variable aleatoria X
tome el valor exacto x es igual a la diferencia entre el valor de la
función de distribución acumulada en x y el valor de la función en x-ϵ,
donde ϵ es una cantidad infinitesimalmente pequeña.
P(xi ≤ X ≤ xj) = F(xj) − F(xi - ε): La probabilidad de que la variable
aleatoria tome un valor entre xi y xj es igual a la diferencia entre la
probabilidad acumulada de que tome un valor menor o igual a xj
(F(xj)) y la probabilidad acumulada de que tome un valor menor o
igual a un valor ligeramente menor que xi (F(xi - ε)). Esto se debe a
que la variable aleatoria puede tomar un valor cercano a xi o a xj pero
no exactamente igual a ninguno de los dos.
Esperanza E
La esperanza, valor esperado o valor medio de una variable aleatoria
discreta es una medida de tendencia central que representa el valor
promedio que se espera obtener en múltiples repeticiones de un
experimento aleatorio. Se calcula sumando el producto de cada valor
posible de la variable aleatoria y su correspondiente probabilidad. Se
define como:
E(X) = ∑ [x * P(x)] para todo x en los posibles valores de X

donde x es cada posible valor que puede tomar X y P(X = x) es la


probabilidad de que X tome ese valor.

Propiedades
𝐸 (𝑏𝑋) = 𝑏 ∗ 𝐸(𝑋)
𝐸( 𝑋 + 𝑎) = 𝐸 (𝑋 )+ 𝑎
𝐸 (𝑎 + 𝑏𝑋 )= 𝑎 + 𝑏 ∗ 𝐸(𝑋)
𝐸 (𝑔(𝑋)) = Σ g(xi) . p(xi)
𝐸 (𝑋 ± 𝑌) = 𝐸(𝑋) ± 𝐸(𝑌)
𝐸 (𝑋𝑌) = 𝐸 (𝑋 )∗ 𝐸(𝑌) (si x e y eran independientes)

Varianza de X

Se utilizará la varianza de X para evaluar la cantidad de variabilidad en


(la distribución de) X, del mismo modo que se utilizó S² en la U1 para
medir la variabilidad en una muestra.

𝑉(𝑋) = Σ(Xi - 𝐸(𝑋))².P(Xi)

ó se puede calcular con la fórmula:

𝑉(𝑋) = 𝐸(𝑋²) − 𝐸² (𝑋) para todo x en los posibles valores de X, donde x es


cada posible valor que puede tomar

Propiedades de la varianza:

𝑉 (𝑏𝑋) = 𝑏² ∗ 𝑉(𝑋)
𝑉 (𝑋 + 𝑎) = 𝑉( 𝑋)
𝑉 (𝑎 + 𝑏𝑋) = 𝑏 ² ∗ 𝑉(𝑋)
𝑉 𝑋 ± 𝑌 = 𝑉 (𝑋 )+ 𝑉 (Y)²
Desvió estándar
√V(X)
Asimetría
𝑉(𝑋) = Σ(Xi - 𝐸(𝑋))³.P(Xi)
(D.S (x) ³)
Si da menos que 0, hay sesgo negativo, los datos se encuentran a
izquierda (a), La media se encuentra a la izquierda de la mediana.

Si da 0, es simetrico (b), la media es igual a la mediana

Si es mayor a 0, hay sesgo positivo, los datos se encuentran a la


derecha (c). La media se encuentra a la derecha de la mediana.

Curtosis

K(𝑋) = Σ(Xi - 𝐸(𝑋))⁴.P(Xi)


(D.S (x) ⁴)

Si da mayor a 3 es una distribución leptocúrtica


Si da menor a 3 es una distribución platicurtica
Si da igual a 3 es una distribución mesocúrtica

Distribuciones de probabilidad de variables continuas

Densidad
Permite determinar la probabilidad de que la variable caiga dentro de
un rango continuo de valores. La fórmula de la función de densidad
para una variable aleatoria continua es la siguiente:

Para que f(x) sea una función de densidad de probabilidad legítima,


debe satisfacer las dos siguientes condiciones:
Propiedades de la FDA (VA continua)
0 ≤ F(x) ≤ 1 x ∀
F (xi)≥ F (xj) si xi≥ xj
P (X > x) = 1- F(x)
P(xi≤X≤xj)= F(xj)-F(xi)
dF(x)/dx= f(x)

Esperanza

E(X)=∫ ∀ ( xi ∈ X) xi. f(xi) dx


Varianza

V(X)=∫ ∀ ( xi ∈ X) (xi-E(X))². f(xi) dx


Desvio estandar

DS(X)=√V(X)
Asimetria

As(X)=∫ ∀ ( xi ∈ X) (xi-E(X))³. f(xi) dx


(DS(X))³
Kurtosis

As(X)=∫ ∀ ( xi ∈ X) (xi-E(X))⁴. f(xi) dx


(DS(X))⁴

También podría gustarte