Está en la página 1de 3

GABINETE NÚMERO TRECE ESTADÍSTICA GESTIÓN 2022

Abg. Dr. Pedro Fernando Pinto Guerrero

Introducción.
La estadística descriptiva se clasifica en univariante y multivariante, lo que desarrollamos hasta el
presente ha sido la univariante o mono variante, que estudia una variable desde su organización (cuadros, tablas
y gráficos) hasta la construcción e interpretación de indicadores.
Una vez mas es importante insistir que la estadística estudia a las características variables de las unidades
de análisis de una población, por lo tanto, puede definirse varios alcances que implica su estudio: el nivel
exploratorio (cuando las variables no han sido estudiadas o son nuevas), el nivel descriptivo (cuando la intención
es la simple descripción de la variable considerada de manera individual), el nivel correlacional (cuando al mismo
tiempo se estudian dos o más variables), finalmente el explicativo (cuando mediante el experimento o sea la
manipulación de una o mas variables, se verifica el efecto sobre otra variable).
La estadística multivariante, estudia dos o mas variables al mismo tiempo, tomando en cuenta un modelo
matemático y = f (u, v, w, x, z,...), donde y es la variable dependiente y u, v, w, x, z,..., son las variables
independientes. El caso mas simple constituye la forma bivariante y = f(x), x la variable dependiente, y la variable
dependiente.
La estadística bivariante, esencialmente es descriptiva, el dato corresponde a un par ordenado, que
pertenece a la regla de correspondencia y=f(x). Según la naturaleza de las variables intervinientes, se pueden
relacionar dos variables cualitativas, dos variables cuantitativas o una cualitativa con una cuantitativa, y en cada
caso agrupando las variables cualitativas nominal y ordinal y las variables cuantitativas discreta y continua, 16
combinaciones posibles.
Ejemplo: sexo con estado civil (cualitativa nominal con cualitativa ordinal)
Edad con Glicemia (cuantitativa continua con cuantitativa continua)
Los datos corresponden a pares ordenados (x, y), es decir, cada par es un dato indivisible y se refiere solo a una
unidad de análisis, por lo tanto, cada par se puede repetir un número de veces, por lo tanto, cada par tiene su
correspondiente frecuencia absoluta y por ende su frecuencia relativa.
Existen dos formas de organizar los pares: en una tabla similar a la empleada en la estadística unidimensional
(tabla dimensional simple) y en una tabla bidimensional de doble entrada.
yj
(xi; yj) nij xi yj nij xi A B C D TOTAL
(2, A) 8 2 A 8 2 8 0 0 0 8
(3, B) 20 3 B 20 3 0 20 0 0 20
(4, C) 12 4 C 12 4 0 0 12 0 12
(5, D) 10 5 D 10 5 0 0 0 10 10
TOTAL 50 50 TOTAL 8 20 12 10 50

Como se puede observar, la tabla bidimensional es mucho mas conveniente, sin embargo, de una tabla
bidimensional se puede obtener distribuciones unidimensionales (distribuciones marginales) pero no a la
inversa.
Cuando una o las dos variables son cualitativas, la tabla bidimensional se denomina tabla de contingencia.
Los símbolos de la tabla bidimensional estándar son los siguientes:
La organización de la tabla bidimensional contiene filas (horizontales) y columnas (verticales), que se pueden
sumar el las últimas filas y columnas.
xi es la variable independiente (generalmente se la coloca en las filas)
yj es la variable dependiente
nij es la frecuencia absoluta del par (xi, yj)
n es el número total de unidades de análisis, que corresponde a la suma de los subtotales de las columnas o de
los subtotales de las filas (deben necesariamente ser iguales)
Si se separan la columna de clasificación de la variable xi y la columna de los totales n*i, se origina la frecuencia
marginal de las filas, otro tanto ocurre con las filas. En estas distribuciones marginales, podemos hallar los
diferentes indicadores estudiados en la estadística descriptiva unidimensional, sobresalen la media aritmética,
la varianza y la desviación estándar.
De igual manera, que se tiene la tabla bidimensional de las frecuencias absolutas, se puede hallar la tabla de
distribución de frecuencias relativas, dividiendo todos los datos de la tabla entre el total.
También es posible hallar dos nuevos tipos de frecuencias relativas: respecto al total de filas y la relativa al total
de columnas.
En las tablas bidimensionales de variables cuantitativas, se puede hallar un indicador intermedio que es la
covarianza, es intermedio, dado que se emplea para hallar un indicador muy importante el coeficiente de
correlación lineal.
∑𝑘 𝑙
𝑖=1 ∑𝑗=1 𝑛𝑖𝑗 (𝑥𝑖 −𝑥̅ )(𝑦𝑗 −𝑦
̅)
La covarianza se define: Covxy = M[(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅)] = 𝑛

Una fórmula reducida de la anterior es Covxy = M(xy)-M(x)M(y)


Desarrollo.
1. Se tienen los siguientes datos, obtenidos del registro de 30 pacientes
Variables: sexo(X)(m=masculino, f=femenino);estado civil(Y)(s=soltero,c=casado,d=divorciado)
x m m m m f f f m f m f m f m f m f f f f m m f f m m f f m m
y s s s c s c c s s c d s s d d c s c d c s s c s s s c c d d
a) Construir una tabla bidimensional simple y una tabla bidimensional de doble entrada.
b) En ambas tablas hallar la frecuencia relativa respecto al total.
2. Se tienen los siguientes datos
Variable: X: gramos de sacarosa ingeridos Y: nivel de glicemia mg/dl
x 22 21 25 24 24 22 21 23 35 35 38 37 32 40 40 40 42 24 25 28 31 39 41 22 28
y 80 85 86 88 89 90 87 88 81 82 83 86 90 82 84 81 82 83 89 82 85 87 88 81 83
Hallar a) la tabla de doble entrada organizando los datos de la variable dependiente (y) en 2 intervalos de clase
y la variable independiente (x) en 3 intervalos. b) Las distribuciones de frecuencias marginales de i) las filas ii)
las columnas; c) hallar la media y la desviación estándar ( xn) de las distribuciones marginales; d) Covarianza.
PRACTICA TRECE.
1. Se tienen los siguientes datos, obtenidos del registro de 30 pacientes
Variable: y: número de hijos; x: estado civil del conyugue (s=soltero, c=casado)

X s s s s c s c s s s c s c s c s s c c s c s s c s s s c s c
Y 0 0 1 0 2 0 1 0 0 1 2 0 1 0 1 0 1 2 0 0 0 1 0 2 0 1 2 2 2 0
a) Construir una tabla bidimensional simple y una tabla bidimensional de doble entrada.
b) En ambas tablas hallar la frecuencia relativa respecto al total.
2. Se tienen los siguientes datos
Variable: X: promedio de gramos de carne ingeridos; Y: nivel de ácido úrico mg/dl
x 80 84 86 88 89 89 87 88 81 82 83 86 90 82 84 81 85 80 85 89
y 2,2 2,1 2,5 2,4 2,4 2,2 2,1 2,3 3,5 3,5 3,8 3,7 3,2 4,0 4,0 4,0 3,4 2,1 3,6 3,9

Hallar a) la tabla de doble entrada organizando los datos de la variable dependiente (y) en 2 intervalos de clase
y la variable independiente (x) en 3 intervalos. b) Las distribuciones de frecuencias marginales de i) las filas ii)
las columnas; c) hallar la media y la desviación estándar ( xn) de las distribuciones marginales; d) Covarianza.

También podría gustarte