Está en la página 1de 2

INFORME DE MODELOS FACTORIALES BAYESIANOS

PARA DATOS CATEGÓRICOS MULTIVARIADOS


OBTENIDOS DE CUESTIONARIOS
Escuela Profesional de Ingeniería Estadística
Miguel Angel Cervantes Buleje

I. Introducción
Las observaciones de variables categoricas son muy comunes en estudios
sociales, de comportamiento, en cuestionarios que en la mayoria tienen
grandes dimensiones y para una mejor aplicación se busca la reduccion de
estas dimensiones, particularmente en datos categoricos que tengan
alguna correlacion importante donde se utilizaran modelos factoriales
bajo el paradigma bayesiano.
II. Objetivo
Investigar dependencias entre los items de un cuestionario donde las respuestas son categorias,
consiguiendo factores latentes que puedan explicar las preguntas así se podria reducir las dimensiones
teniendo en consideracion la incertidumbre de los datos.
III. Desarrollo
Se considera que la variable categoria 𝒚𝒚𝒊𝒊𝒊𝒊 fue generada por una variable latente continua 𝒚𝒚𝒊𝒊𝒊𝒊 ∗ , donde cada
categoria tendra una respectiva probabilidad, primero veremos el performance de los estimadores y luego
el procedimiento de inferencia el cual se realiza bajo el paradigma bayesiano asumiendo el número de
factores q conocidos. Una ventaja de seguir el paradigma bayesiano es que el procedimiento de inferencia
se realiza bajo un marco único y, naturalmente, se tiene en cuenta la incertidumbre sobre la estimación de
parámetros. Asumimos distribuciones previas independientes no informativas para los parámetros. Dado
que el Kernel de la distribución posterior no da como resultado el de una distribución conocida, utilizamos
métodos MCMC para obtener muestras de ella. Luego realizaremos comparaciones de los valores
obtenidos para cada factor q, con ello obtendremos el analisis de la data y veremos que variables se
correlacionan y pueden estar en un mismo grupo
IV. Conclusiones
Se propuso un modelo factorial para conjuntos de datos policotómicos correlacionados ordenados y no
ordenados que se pueden explicar por un número menor de factores latentes y los resultados obtenidos
parecen prometedores, ya que están en línea con los resultados obtenidos mediante correlación policórica

V. Referencias bibliográficas
- Multivariate truncated count data (Wedel et al., 2003)
- Binary data coming from an unobserved heterogeneous population ( Cagnone and Viroli, 2012)
- Censored non-normal random variables to deal with influential observations and cesored data e
(Castro et al., 2015)
- Gibbs sampling algorithm to sample from the posterior distribution in standard factor analysis and
estimate the number of latent factors (Lopes and West, 2004)

1
REPORT ON BAYESIAN FACTORIAL MODELS FOR
MULTIVARIATE CATEGORICAL DATA OBTAINED
FROM QUESTIONNAIRES
Professional School of Statistical Engineering
Miguel Angel Cervantes Buleje

I. Introduction
Observations of categorical variables are very common in studies social,
behavioral, in questionnaires that most have
large dimensions and for a better application, the reduction of
these dimensions, particularly in categorical data that have
some important correlation where factorial models will be used under the
Bayesian paradigm.
II. Objective
Investigate dependencies between the items of a questionnaire where the answers are categories,
obtaining latent factors that can explain the questions, so the dimensions could be reduced taking into
account the uncertainty of the data.
III. Developing
It is considered that the category variable 𝒚𝒚ij was generated by a continuous latent variable𝒚𝒚𝒊𝒊j∗, where each
category will have a respective probability, first we will see the performance of the estimators and then the
inference procedure which is carried out under the Bayesian paradigm assuming the number of known
factors q. An advantage of following the Bayesian paradigm is that the inference procedure is performed
under a single framework and, naturally, the uncertainty about the parameter estimation is taken into
account. We assume non-informative independent priors for the parameters. Since the kernel of the
posterior distribution does not result in that of a known distribution, we use MCMC methods to obtain
samples from it. Then we will make comparisons of the values obtained for each factor q, with this we will
obtain the analysis of the data and we will see which variables are correlated and can be in the same group.
IV. Conclusions
A factorial model was proposed for ordered and unordered correlated polychromic data sets that can be
explained by a smaller number of latent factors, and the results obtained seem promising, as they are in
line with the results obtained by polychoric correlation.

V. Bibliographic references

- Multivariate truncated count data (Wedel et al., 2003)


- Binary data coming from an unobserved heterogeneous population ( Cagnone and Viroli, 2012)
- Censored non-normal random variables to deal with influential observations and cesored data e
(Castro et al., 2015)
- Gibbs sampling algorithm to sample from the posterior distribution in standard factor analysis and
estimate the number of latent factors (Lopes and West, 2004)

También podría gustarte