Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Datos Bivariados
Se llaman datos bivariados a aquellos que provienen de dos variables medidas al
mismo tiempo sobre cada individuo.
La relación que se utiliza es la Relación Lineal, por lo que se llevan a cabo Análisis de
Correlación Lineal y de Regresión Línea. El análisis de correlación, se usa para medir
la fuerza de asociación entre las variables. El objetivo medir la covarianza que existe
entre esas dos variables numéricas. El análisis de regresión se usa con propósitos de
predicción.
Covarianza
La covarianza es una de las medidas utilizadas para cuantificar la variación conjunta
entre dos variables X y Y. La expresión matemática para la covarianza es:
Distribución Bidimensionales
Podemos estudiar dos o más caracteres cuantitativos diferentes de forma simultánea.
Ejemplo, en un curso de estudiantes el peso y la altura, las notas de matemáticas y
estadística, y así llamamos distribución bidimensional a un conjunto ordenado de pares
de valores de dos caracteres (Xi, Yj) asociado a las frecuencias absolutas nij o relativas
fij de dichos pares.
Tabla De Correlación: presentación de una variable bidimensional. Es una tabla de
doble entrada. Sea una población con 2 caracteres X e Y, se representa por (Xi Yj, nij)
siendo Xi, Yj: 2 valores cualesquiera y nii la frecuencia absoluta conjunta del valor i der
X con el j de Y (número de veces que se repite). El número total de individuos observados
es N.
Distribuciones Marginales: estudio aislado de cada una de las variables, coincide con
la distribución unidimensional, así tendremos 2 distribuciones unidimensionales (se
estudia el comportamiento de una variable con independencia de los valores que pueda
tomar la otra), correspondiendo las frecuencias marginales a la última fila y la última
columna de la tabla de correlación.
Tabla de Contingencia
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos. En general, el interés se centra en estudiar si existe alguna asociación entre
una variable denominada fila y otra variable denominada columna y se calcula la
intensidad de dicha asociación. De manera formal, se consideran X e Y dos variables
categóricas con I y J categorías respectivamente.
Una observación puede venir clasificada en una de las posibles I × J categorías que
existen. Cuando las casillas de la tabla contienen las frecuencias observadas, la tabla se
denomina tabla de contingencia, término que fue introducido por Pearson en 1904. Una
tabla de contingencia (o tabla de clasificación cruzada), con I filas y J columnas se
denomina una tabla I ×J.
Por ejemplo, se considera la distribución conjunta de dos variables y la correspondiente
tabla de contingencia en una muestra de pacientes de un hospital. Se tiene la siguiente
tabla donde se consideran el riesgo de ataque al corazón respecto a la toma de aspirinas:
Estudiante: Carlos Eduardo Reyes Castro N MA 3-5
X ≡Se toma aspirina o placebo (I = 2).
Y ≡Se sufre ataque cardiaco o no (J = 3).