Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sanchez Diaz
ID. 1076689
VARIAS VARIABLES Probabilidad y Estadistica
3.1 DISTRIBUCIONES DE
FRECUENCIAS MULTIVARIANTES
y analógicamente:
Por ejemplo, la distribución marginal del color de los ojos de las madres en la tabla 3.1 toma dos
posibles valores, claros y oscuros, con frecuencias relativas 0,37 y 0,63.
3.1.3 DISTRIBUCIONES
CONDICIONADAS
La distribución condicionada de y para x = xi es la distribución univariante de la
variable y que se obtiene considerando sólo los elementos que tienen para la
variable x el valor xi. Puede obtenerse de la distribución conjunta dividiendo las
frecuencias relativas de la línea definida por x = xi por su suma. Llamando
fr(yj|xi) a las frecuencias relativas de esta distribución:
Con esta operación garantizamos que la suma de las frecuencias relativas para
todos los valores de la variable y es uno, ya que, sumando para los valores de y:
En general la distribución condicionada de y
para x = xi puede interpretarse como la
distribución de la característica y en los
elementos de la población que tienen como
característica x el valor xi. Se diferencia de
la distribución marginal de y en que ésta
tiene en cuenta la distribución de y en todos
los elementos, con independencia del valor
que en ellos tenga la característica x.
donde el sumatorio está extendido a las n parejas de valores (x, y). Una expresión equivalente de la
covarianza es
ℎ 𝑥 = 𝑎 + 𝑏𝑥
donde a es la ordenada en el origen [valor de ℎ(𝑥) cuando 𝑥 = 0] y 𝑏 será la pendiente, que es el
incremento de ℎ(𝑥) si 𝑥 aumenta una unidad.
CONTINUACION
Si decidimos medir las distancias en el sentido vertical, la recta resultante se denomina recta de regresión.
Los coeficientes a y b se determinan minimizando las distancias verticales entre los puntos observados, 𝑦𝑖 ,
y las ordenadas previstas por la recta para dichos puntos, 𝑎 + 𝑏𝑥𝑖 . El criterio será minimizar:
(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )2
donde las desviaciones se han tomado al cuadrado para prescindir de su signo. Derivando respecto a
ambos coeficientes e igualando a cero, resultan las ecuaciones:
𝟐 𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 −1 = 0
𝟐 𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 −𝑥𝑖 = 0
CONTINUACIÓN
Podemos construir una medida de variabilidad de los datos respecto a la recta de regresión
igual que hicimos con las desviaciones típicas promediando las desviaciones verticales al
cuadrado entre cada punto y la ordenada correspondiente a la recta. Llamaremos desviación
típica residual a:
σ[𝑦𝑖 − ℎ 𝑥 ]2
𝑆𝑅 =
𝑛