Está en la página 1de 8

Introduccin al Anlisis de Datos

El anlisis de datos de la encuesta tiene como objetivo la deteccin de grupos variables altamente
relacionados, para ello se utilizan los siguientes anlisis :
Anlisis Descriptivo : ayudar a observar el comportamiento de la muestra en estudio, a travs de tablas,
grficos.....

Los resultados recogidos en la muestra se resumen en una matriz de datos N x M , en la cual N es el nmero
de unidades de anlisis utilizadas ( nmero de casos ) y M es el nmero de caractersticas de dichas unidades ,
unidades de las que tenemos informacin.
Anlisis Exploratorio : la analizacin exploratoria pretende partir de un conocimiento profundo y
creciente de los datos para , trabajando inductivamente , llegar a un modelo ajustado de los datos. Los pasos
en este tipo de anlisis son los siguientes :

Anlisis de cada una de las variables incluidas en la matriz de datos. Los datos se agrupan de un modo
rpido y a ser posible grfico , las tcnicas mas utilizadas son :

Tronco y hoja
La caja
Ambas pretenden :
Conocer la variable analizada para determinar si su distribucin es simtrica o no.
Poder descubrir valores extremos y analizarlos antes de poder pasar al anlisis multivariante.
Transformacin de los datos : la transformacin persigue la consecucin de una distribucin aproximada
a la normal. Tipos de transformacin :

Lineales : suma , resta , divisin , multiplicacin , cambia los valores brutos ( datos obtenidos ) de la
variable sin alterar nada mas.

No lineales monotnicas : cambian los valores originales y tambien sus distancias pero no el orden
No lineales no monotnicas : similar a la anterior pero no altera el orden..
Anlisis Confirmatorio / Explicativo : la mayor parte de las tcnicas tradicionales de anlisis estadstico
de los datos tienen un carcter deductivo confirmatorio. De todas las tcnicas de anlisis confirmatorio la
ms til para el socilogo es aquella que parte del anlisis de variables , entre las que cabe distinguir :
nominales y de intervalo o de razn . En la investigacin sociolgica las de tipo ordinal son muy
frecuentes , pero las tcnicas de anlisis escasas , de modo que se tratan como variables de intervalo o razn
, labor muy complicada o como nominales.

Investigacin con Variables Nominales
En la investigacin con variables nominales se utilizan tcnicas como el anlisis de varianza o factorial.
Dentro de las tcnicas multivariantes de anlisis de variables nominales existen dos de caracterespecial :
Los coeficientes <d> J. Davis ha perfeccionado un modelo que se basa en las diferencias
porcentuales. Los coeficientes <d> son diferencias entre proporciones y se utilizan como indicadores
del impacto causal de unas variables sobre otras.

1
Modela <loglinear> explican la probabilidad de que una persona elegida al azar presente una
determinada combinacin de categoras/ niveles del conjunto de variables de clasificacin utilizados

6. Investigacin con variables de intervalo o de razn : en estas se utiliza el anlisis de regresin : puede
utilizarse siempre que la variable dependiente sea una variable de intervalo.
2. Anlisis de los Datos de Encuesta
El anlisis de los datos de la encuesta , como cualquier otro tipo de datos de inters cientfico , ha de
guardar relacin con el problema de conocimiento que se trata de esclarecer y con la mtrica de la
informacin emprica que se tiene entre manos , es decir lo primero que se debe realizar en una
encuesta no es ver que dicen los datos sino que dicen en relacin con el problema que se plantea y las
hiptesis que uno se haba planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son :
La cantidad y calidad del conocimiento que se desea obtener sobre un problema no est
necesariamente en funcin del tamao de la muestra empleada para hacer una encuesta.

Ni el margen global de error en los resultados de una encuesta disminuye necesariamente aumentando
el tamao de la muestra.

Los datos de la encuesta son mas tiles cuanto mayor sea la posibilidad de poderlos comparar con
otros similares y anteriores en el tiempo o procedentes simultneamente de otras poblaciones.

Tipos de Anlisis :
Anlisis de Correlacin : Con los datos mas simples de respuestas a varias preguntas se pueden fabricar
medidas combinatorias de los mismos en forma de ndices o escalas.
Estas medidas constituyen la operacionalizacin de los conceptos, es la referencia emprica reducida a
valores empricamente manejables.
Los conceptos son elaboraciones tericas con las que definimos un determinado aspecto de la realidad y de la
que nos servimos para expresar teoras e hiptesis.
Las variables : son dimensiones de la realidad que deseamos estudiar.
Los indicadores : son expresiones numerables de las distintas dimensiones de un concepto.
Con los datos indexados podemos hacer anlisis de correlacin de diferentes tipo.
La correlacin entre dos o mas variables expresa la extensin en que una incide en la otra interseccin, la
interseccin de ambas, su grado de asociacin... . Pero no indica si a partir de los valores de una de ellas
podemos predecir los valores de la otra , esto se consigue mediante el coeficiente de regresin que indica si
la correlacin entre variables es tal que a partir de una podemos calcular los valores de otra. Todo esto lo
podemos realizar con medidas de la estadstica no paramtrica no pueden ser calculadas.
A partir del Anlisis de Correlacin se puede trabajar con distintos modelos de anlisis multivariable :
Un conjunto de modelos de anlisis podra denominarse como el del anlisis causal : aqu se incluiran los
anlisis de cadena (< path anlisis>) , el de regresin mltiple y el de segmentacin por arborescencia
(<tree anlisis>) el cual es una tcnica multivariable que produce una serie de agrupamientos dicotomizados
en un modelo que se asemeja a las ramas de un arbol. La divisin de las cosas en grupos dicotomizados la
2
realiza el anlisis de segmentacin de modo que en ellos quede explicada de la mejor forma posible la
variacin de una cierta variable que llamamos dependiente , respecto a otras que llamamos independientes. La
divisin en grupos dicotomizados e deberalizar en cada paso de tal manera que la variacin en ellos sea
mnima, que sean lo mas homogneos posibles al mismo tiempo que la variacin entre si sea la mayor posible,
que los dos grupos resultantes sean lo mas heterogneos posibles entre si.
Otro conjunto estara formado por distintos modelos que implican conglomerados de variables o asociaciones
entre los que se encuentran :
El anlisis factorial : es una forma de anlisis de matrices. El objeto de este mtodo es resumir la
informacin obtenida de las variables iniciales expresando las mismas como combinacin lineal de
otras variables no observables ( subyacentes) denominadas factores. Se busca una estructura de
interrelacin en muestras variables. Para decidir si esta anlisis factorial es factible utilizaremos
ciertas medidas como pude ser la :

KaiserMeyerOlkin : basada en los coeficientes de correlacin parcial situando su
rango de variacin entre 0 y 1.

Medida de adecuacin muestral : la cual nos indica hasta que punto debe entrar una
variable en el anlisis factorial.

El anlisis Tipolgico : es un anlisis de estructuras latentes , nos permite identificar dentro de una
poblacin determinada un cierto nmero de grupos, los cuales tienen una igualdad caractersticas en
una multiplicidad de dimensiones.

El del espacio mas pequeo.
2. Anlisis de los Datos de Encuesta
El anlisis de los datos de la encuesta , como cualquier otro tipo de datos de inters cientfico , ha de
guardar relacin con el problema de conocimiento que se trata de esclarecer y con la mtrica de la
informacin emprica que se tiene entre manos , es decir lo primero que se debe realizar en una
encuesta no es ver que dicen los datos sino que dicen en relacin con el problema que se plantea y las
hiptesis que uno se haba planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son :
La cantidad y calidad del conocimiento que se desea obtener sobre un problema no est
necesariamente en funcin del tamao de la muestra empleada para hacer una encuesta.

Ni el margen global de error en los resultados de una encuesta disminuye necesariamente aumentando
el tamao de la muestra.

Los datos de la encuesta son mas tiles cuanto mayor sea la posibilidad de poderlos comparar con
otros similares y anteriores en el tiempo o procedentes simultneamente de otras poblaciones.

Tipos de Anlisis :
Anlisis de Correlacin : Con los datos mas simples de respuestas a varias preguntas se pueden fabricar
medidas combinatorias de los mismos en forma de ndices o escalas.
Estas medidas constituyen la operacionalizacin de los conceptos, es la referencia emprica reducida a
valores empricamente manejables.
3
Los conceptos son elaboraciones tericas con las que definimos un determinado aspecto de la realidad y de la
que nos servimos para expresar teoras e hiptesis.
Las variables : son dimensiones de la realidad que deseamos estudiar.
Los indicadores : son expresiones numerables de las distintas dimensiones de un concepto.
Con los datos indexados podemos hacer anlisis de correlacin de diferentes tipo.
La correlacin entre dos o mas variables expresa la extensin en que una incide en la otra interseccin, la
interseccin de ambas, su grado de asociacin... . Pero no indica si a partir de los valores de una de ellas
podemos predecir los valores de la otra , esto se consigue mediante el coeficiente de regresin que indica si
la correlacin entre variables es tal que a partir de una podemos calcular los valores de otra. Todo esto lo
podemos realizar con medidas de la estadstica no paramtrica no pueden ser calculadas.
A partir del Anlisis de Correlacin se puede trabajar con distintos modelos de anlisis multivariable :
Un conjunto de modelos de anlisis podra denominarse como el del anlisis causal : aqu se incluiran los
anlisis de cadena (< path anlisis>) , el de regresin mltiple y el de segmentacin por arborescencia
(<tree anlisis>) el cual es una tcnica multivariable que produce una serie de agrupamientos dicotomizados
en un modelo que se asemeja a las ramas de un arbol. La divisin de las cosas en grupos dicotomizados la
realiza el anlisis de segmentacin de modo que en ellos quede explicada de la mejor forma posible la
variacin de una cierta variable que llamamos dependiente , respecto a otras que llamamos independientes. La
divisin en grupos dicotomizados e deberalizar en cada paso de tal manera que la variacin en ellos sea
mnima, que sean lo mas homogneos posibles al mismo tiempo que la variacin entre si sea la mayor posible,
que los dos grupos resultantes sean lo mas heterogneos posibles entre si.
Otro conjunto estara formado por distintos modelos que implican conglomerados de variables o asociaciones
entre los que se encuentran :
El anlisis factorial : es una forma de anlisis de matrices. El objeto de este mtodo es resumir la
informacin obtenida de las variables iniciales expresando las mismas como combinacin lineal de
otras variables no observables ( subyacentes) denominadas factores. Se busca una estructura de
interrelacin en muestras variables. Para decidir si esta anlisis factorial es factible utilizaremos
ciertas medidas como pude ser la :

KaiserMeyerOlkin : basada en los coeficientes de correlacin parcial situando su
rango de variacin entre 0 y 1.

Medida de adecuacin muestral : la cual nos indica hasta que punto debe entrar una
variable en el anlisis factorial.

El anlisis Tipolgico : es un anlisis de estructuras latentes , nos permite identificar dentro de una
poblacin determinada un cierto nmero de grupos, los cuales tienen una igualdad caractersticas en
una multiplicidad de dimensiones.

El del espacio mas pequeo.
El Anlisis de Contenido
Definicin : El anlisis de contenido es una tcnica de investigacin para la descripcin objetiva, sistemtica
y cualitativa del contenido manifiesto de la comunicacin ( Berelson 1952) , esta es la definicin mas
4
imporatante pero tambin existen otras como puede ser la de Krippendorff ( 1980 ) segn la cual el anlisis de
contenido es una tcnica de investigacin para hacer inferancias reproductibles y vlidas de los datos.
Aplicaciones del anlisis de Contenido
Los objetivos del anlisis de contenido son tres :
La descripcin precisa y sistemtica , de las caractersticas de una comunicacin.
La formulacin de inferencias sobre contenidos exteriores al contenido de la comunicacin.
La prueba de hiptesis para su verificacin o rechazo.
Para Janis ( 1965 ) todo anlisis de contenido debera tener como fin el someter a prueba alguna relacin entre
caractersticas del contenido y otras variables.
Dada esta definicin se pueden obtener diferentes tipos de anlisis de contenido :
Anlisis de contenido semntico : clasificacin de los signos segn su significadao : ejemplo nmero de
referencias al Fc.Barcelona.

Anlisis de designaciones : nmero de veces que aparecen referencias a determinados objetos.
Anlisis de atribucin : proporciona la frecuencia con que aparecen ciertas caracterizaciones : nmero de
veces que aparece una caracterstica.

Anlisis de Afirmaciones : proporciona la frecuencia en la que ciertos objetos aparecen caracterizados de
una determinada manera.

Anlisis de contenido pragmtico : clasificacin de signos segn sus causas o efectos probables.
Anlisis de vehculo del signo : clasificacin del contenido segn las proporciones psicofsicas de los
signos.

El contenido tradicional del anlisis de contenido es la descripcin; se centra en el contenido y no en hiptesis
, por lo tanto el objetivo principal es entonces la descripcin de ese contenido, de su fondo y de su forma. (
suelen ser investigaciones de carcter exploratorio o de ndole histrica).
La clasificacin ms completa del anlisis de contenido de carcter descriptivo es la realizada por Berelson (
1952 ) el cual utiliz el criterio de la < funcin > del anlisis de Holsti ( 1969 ) es la siguiente :
Anlisis de las caractersticas del contenido en cuanto a su sustancia o fondo :
Para descubrir tendencias y cambios en el contenido de la comunicacin.
Para averiguar la evolucin de los intereses y de las actividades del pensamiento erudito.
Para revelar diferencias internacionales en el contenido de la comunicacin.
Para realizar comparaciones entre diferentes medios de comunicacin y entre diferentes niveles de
comunicacin.

Para analizar el contenido de la comunicacin en trminos de sus objetivos explcitos o implcitos.
Para elaborar y poner en vigor ciertos estndares de comunicacin as como examinar el contenido
de las comunicaciones en trminos de tales estndares.

Para ayudar en operaciones tcnicas de investigacin, como en la codificacin de datos obtenidos en
entrevistas u observaciones no esestrucuturadas.

Para relaciones caractersticas conocidas de las fuetes de la comunicacin con los mensajes que tales
fuentes producen.

Para relacionar caractersticas conocidas de la audiencia con mensajes creados para ella.
Anlisis de las caractersticas del contenido en cuanto a su forma :
Para revelar tcnicas de propaganda o persuasin.
Para medir la legibilidad ( inters, amenidad.......) de material impreso.
Para descubrir rasgos estilsticos en lenguajes, en periodos histricos en tipos de discurso y en
5
autores individuales.
El anlisis de contenido de carcter descriptivo se caracteriza por producir determinados tipos de
generalizaciones , las cuales muchas provienen de la comparacin de contenidos de comunicaciones de
diferente origen ( diarios italianos , franceses...), o comunicaciones de nico origen pero diferente tiempo, o
comunicaciones de nico origen pero de situaciones distintas, en otras ocasiones son generalizaciones que
proceden de la comparacin del contenido de una o mas comunicaciones y finalmente las que proceden del
anlisis de relacin o asociacin entre dos o mas variables, destacando aqu el anlisis de contingencia : el de
la aparicin simultanea de determinadas variables.
Otro objetivo del anlisis de contenido es la realizacin de inferencias , cuando el contenido de los mensajes
es analizado para apoyar conclusiones no relacionadas con el contenido, entonces adquiere la investigacin n
carcter explicativo o inferencial.
Hay dos categoras de inferencias :
Las que se refieren al origen, causas ,condiciones, antecedentes de la comunicacin y especialmente al
autor de la misma, estas inferencias responden a las preguntas < quien > y < por qu >.

La segunda est formada por las inferencias que se refieren a efectos o resultados de la comunicacin y el
anlisis responde al interrogante < con que efecto >.

Combinando las aportaciones de Berelson y Holsti se obtiene la siguiente clasificacin del anlisis de
contenido de carcter inferencial :
Anlisis para realizar inferencias acerca de las causas , de los productores o de los antecedentes de la
comunicacin :

Para identificar las intenciones y otras caractersticas de los creadores de las comunicaciones.
Para analizar rasgos psicolgicos de individuos o determinar el estado psicolgico de personas o
grupos.

Para detectar la existencia de propaganda.
Para obtener informacin poltica y militar.
Para determinar actitudes, intereses, a valores de grupos o poblaciones , as como el cambio en los
mismos que haya podido tener lugar.

Para proporcionar pruebas jurdicas.
Para decidir disputas sobre paternidad literaria.
Anlisis para realizar inferencias de las consecuencias o efectos de la comunicacin :
Para determinar qu actitudes y comportamientos son consecuencia de la comunicacin.
Para analizar la corriente de informacin.
Para medir la legibilidad de textos.
De todo esto dicho anteriormente se extraen dos conclusiones :
el anlisis de contenidos puede ser defectuoso por aplicacin errnea de las tcnicas de anlisis, en cuyo
caso l descripcin del contenido de las comunicaciones estar mas o menos llena de errores.

el anlisis de contenido puede ser defectuoso aun cuando la descripcin del contenido sea correcto, por
aplicacin errnea de la tcnicas de inferencia o interpretacin.

De la clasificacin de Krippendorff se extraen dos conclusiones :
que el objetivo del anlisis de contenido parte de dos ideas interrelacionadas.
que el anlisis de contenido pude adoptar diversas formas, entre las que destacan :
Sistemas : aparatos conceptuales que se utilizan para describir una porcin de realidad.
6
Estndares : criterios con los que se comparan objetos , para dterminar cuan buenos son o de qu tipo son.
ndices : variables cuya significacin en una investigacin depende del grado en que verse correlacionado
con otros fenmenos.

Elementos componentes del Anlisis de contenidos
Los Datos : Es una unidad de informacin grabada en un medio resistente y duradero ( papel, cinta...) que se
distingue de otros datos en que es analizable por medio de tcnicas explcitas siendo significativos para un
problema determinado.
El Muestreo
Las unidades de Anlisis : son los elementos de la comunicacin en que se va a centrar el anlisis.
Las unidades de muestreo : son las diversas partes de la realidad sometida a observacin que el investigador
considera como independientes entre si pudiendo ser objeto de anlisis.
Tipos :
Artificiales : bloques de lneas, columnas....
Naturales: editoriales, artculos, carteles....
La unidad de registro : es la mnima porcin del contenido que el investigador aisla y separa por aparecer
all uno de los elementos, smbolos, slogans , que el investigador considera significativos.
La unidad contexto : es la porcin de la unidad de muestreo que tiene que ser examinada para poder
caracterizar una unidad de registro.
El Registro : proceso por el cual cada unidad de registro es codificada, descrita en forma analizable.
La codificacin es el proceso por el cual los datos brutos son transformados y clasificados en categoras.
Categoras :
Materia , tema , asunto : da respuesta al interrogante : De que se trata la comunicacin?
Direccin o punto de vista : de este derivan categoras de tratamiento que pude ser desfavorable o
favorable.

Criterio o valor : determina la base\s que sirven para hacer la clasificacin en trminos de direccin o
punto de vista, la base sobre la que descansa la presentacin o el tratamiento del asunto o materia por el
autor de la comunicacin.

Autoridad Frente a Prueba : de aqu surgen categoras que identifican a las personas, grupos,
instituciones....

Objetivo Meta : las categoras que se derivan de este se refieren los objetivos que se desean alcanzar o que
se consideran deseables. El interrogante al que da respuesta es : Qu es lo que la gente desea, que
persigue, cuales son sus ambiciones?.

Medio o mtodo : como se consiguen los objetivos que se consideran deseables.
Actores : son los grupos , personas , actores, que ocupan posiciones centrales o que llevan a cabo
determinadas acciones , es decir , clasificaa aquellos que en el texto sometido a anlisis son representados
como realizadores de determinados actos.

Caractersticas personales y rasgos de carcter : en este principio de clasificacin se incluyen categoras
que describen caractersticas personales ( edad, sexo, raza...)

Origen : clasifica el lugar de origen de las comunicaciones.
7
Destino : clasifica el grupo al que la comunicacin est especialmente dirigida.
Formas de la afirmacin : este principio elabora subcategoras como la distincin entre proa y poesa ,
entre novela y ensayo.....

Intensidad : clasifica el componente emocional de la comunicacin, el entusiasmo, excitacin.....
Mecanismo o recurso : se utiliza con fines propagandsticos o persuasorios o tendenciosos.
La Validez en el Anlisis de Contenido : la validez de un anlisis se juzga por el grado en que los resultados
que produce son compatibles con otras pruebas u testimonios importantes y pertinentes.
La prctica muestras dos tipos de validez :
Interna : la que descansa en la existencia de una relacin lgica entre indicadores , categoras y
resultados de anlisis.

Externa : la que se apoya en una relacin emprica. Los tipos de validez externa que mas se adecuan
al anlisis de contenido son :

La validez Pragmtica : cuando el inters se centra en la utilidad de los resultados
del anlisis para indicar o precisar algn comportamiento o alguna caracterstica
especfica de individuos, grupos..... Esta validez puede ser concurrente : cuando el
investigador est interesado en alguna caracterstica del presente o predictiva :
cuando est interesado en alguna caraterstica del pasado.

Validacin de rasgos abstractos : se utiliza para hacer referencias respecto a algn
rasgo abstracto y multidimensional que se supone est reflejado en los resultados del
anlisis de contenido.

Validez del Contenido : se dice que la muestra o el contenido es vlido si su
composicin corresponde a la composicin de universo de posibles indicadores de la
caracterstica, atributo o comportamiento de que se trata.

Validez Semntica : podr comprobarse la validez semntica comprobando si son
similares o no los resultados de dos reparticiones diferentes del mismo conjunto de
unidades de anlisis, una realizada analticamente y otra segn el criterio externo.

1
8

También podría gustarte