Está en la página 1de 66

Aproximándose a la aculturación

mediante medidas de
composición y estructura de las
redes personales
National Science Foundation, Award No. BCS-0417429

Chris McCarty
University of Florida
Jose Luis Molina y Miranda Lubbers
Universitat Autonoma de Barcelona
Esta presentación tiene cuatro
partes
1. Una visión de conjunto de la
investigación en ciencias sociales
2. Una visión de conjunto de las redes
sociales
3. Una introducción al análisis de redes
sociocéntricas
4. Una introducción al análisis de redes
personales
5. Una presentación de Egonet
• La mayor parte de la investigación en ciencias
sociales está diseñada para predecir actitudes,
conductas o condiciones de personas a partir de
sus características.

• Los científicos sociales preguntan u observan


características acerca de respondientes y
utilizan esa variabilidad en esas características
para explicar las variables dependientes
Ejemplo de un diseño de
investigación
Edad
Formación Número de
Ingresos cigarrillos que
fuma cada día
Altura
Peso
Variables independientes Variable dependiente

Un/a científico/a social puede recoger información sobre


una muestra de 500 respondientes e intentar predecir su
conducta fumadora utilizando la variabilidad en su edad,
formación, ingresos, altura y peso
Conclusión
Edad
Formación Número de
cigarrilos que
Ingresos
fuma cada día
Peso
Altura
Variables independientes Variable dependiente

El/la investigador/a concluye que la edad, el nivel


de formación y los ingresos son buenos
predictores de cuántos cigarrilos fuma cada día,
mientras que el peso y la altura no lo son.
Influencia social
• Los científicos sociales piensan que algunas variables
dependientes están influenciadas por factores sociales.

• Por ejemplo, está comúnmente aceptado que la


introducción al hábito de fumar entre adolescentes es
debido a la influencia de los colegas.

• Dado que la influencia de los colegas no se puede


observar de formar directa, los científicos socials
diseñan preguntas que pueden ser utilizadas como
aproximaciones para observar la influencia de los
colegas.
Preguntas “proxy” (indicadoras)
• ¿Fuman tus padres? (Padres)

• ¿Fuma la mayor parte de tus amigos?


(Amigos)

• ¿Alguno de tus amigos te ha ofrecido


alguna vez un cigarrillo? (Ofrecimiento)
Poder predictivo de la influencia
social
Edad
Formación
Número de
Ingresos cigarrilos que
fuma cada día
Padres
Amigos
Ofrecimiento
Variables independientes Variable dependiente

Los investigadores/as han descubierto que estas preguntas


aproximativas explican parte de una varianza previamente
inexplicada en relación al hábito de fumar por la edad, la
formación y los ingresos.
Preguntas
• ¿Conocer más detalles sobre la influencia
social que rodea a un respondiente nos
proporciona más poder explicativo?

• ¿Qué preguntas podemos hacer para


conseguir esta clase de detalle?

• Proponemos utilizar la aproximación de las


redes sociales.
Dos tipos de análisis de redes
sociales
Análisis sociocéntrico Análisis de redes personales
(redes “completas”)
• Se centra en la • Se centra en los efectos
interacción dentro del de la red en las actitudes
grupo individuales, conductas y
condiciones

• Recoge información de • Recoge información sobre


los miembros de un el respondiente (ego)
grupos acerca de sus acerca de sus
relaciones con el resto de interacciones con los
miembros miembros de la red (alteri)
Aproximación sociocéntrica al hábito
de fumar y la influencia social

• Selección de un grupo de estudiantes


dentro de una clase.

• Preguntar a cada estudiante que puntúe en


una escala de 0 a 5 cuánto se socializa con
cada uno de los otros.

• Preguntar a los estudiantes si fuman o no.


Matriz de adyacencia de estudiantes
David Faith Rosanna Antonio Napp Lem Jim Beth Mark Kent Amber Thomas
David 5 2 2 0 0 1 0 3 1 0 2 0
Faith 1 5 5 0 0 0 0 1 0 0 2 0
Rosanna 2 5 5 0 0 1 0 2 0 0 4 0
Antonio 0 1 1 5 0 0 0 0 0 0 0 0
Napp 0 0 0 0 5 0 0 0 0 0 0 0
Lem 2 0 2 0 0 5 5 2 0 0 2 0
Jim 0 0 1 0 0 5 5 5 0 0 2 0
Beth 4 3 1 0 0 1 5 5 0 0 3 0
Mark 1 0 0 1 0 0 0 0 5 0 1 0
Kent 0 0 0 0 0 0 0 0 0 5 0 3
Amber 2 3 3 0 0 1 2 2 1 0 5 0
Thomas 0 0 0 0 0 0 0 0 0 3 0 5

• Las evaluaciones realizadas por cada persona pueden ser usadas para construir una matriz que represente las relaciones entre los miembros de la clase
• Las celdas que interseccionan dos personas representan la valoración realizada
• David dice que se socializa con Faith a un nivel 2
• Faith dice que se socializa con David a un nivel 1
Visualización de la red

• Podemos usar la matriz para visualizar la estructura de relaciones


• Hay un gran grupo en el centro.
• Amber y Beth fuman
• Napp no se socializa con nadie y Thomas y Kent sólo se socializan entre
ellos dos
Visualización de la red

• Podemos calcular algunas medidas de esta estructura


• Hay dos componentes de la red
• Beth es la que tiene un grado nodal más alto
• Amber es la que tiene un grado de intermediación más alto
Conclusión
• Podemos concluir que aquéllos que forman parte
del grupo de Beth y Amber es más probable que
fumen.

• Napp, Kent y Thomas no.

• Este análisis no dice nada de las influencias fuera


del grupo.

• Para estudiar las influencias a través de grupos


utilizamos análisis de redes personales.
Tom tiene una Red Personal de 10
personas
Tom se encuentra con esas personas en tres
grupos
CLUB

FAMILY
WORK
Dentro de cada grupo se conocen todos
CLUB

FAMILY
WORK
Hay también algunas relaciones entre grupos
CLUB

WORK

FAMILY
A veces las redes personales
pueden ser complejas
Introducción a la recolección de
datos de redes personales
1. Identificar una población

2. Seleccionar una muestra de respondientes

3. Preguntas sobre cada respondiente

4. Obtener miembros de la red personal

5. Preguntar sobre cada miembro de la red personal

6. Pedir que se evalúe la relación entre los miembros de la


red personal
Identificar una población
• El análisis de las redes pesonales empieza
de forma muy parecida a cualquier
investigación en ciencias sociales.

• La primera cosa a hacer es claramente


identificar la población de interés.
Seleccionar una muestra de
respondientes
• La recolección de datos sobre redes
personales puede ser un largo proceso de
entrevista que a veces requiere un
programa informático especial.

• Esto puede significar un compromiso entre


la representatividad de la muestra y el
nivel de detalles acerca de sus redes
personales.
Preguntas sobre ego

• Queremos saber algunas cosas sobre el


respondiente (ego)

– Queremos saber sobre las variables


dependientes de interés.
– Queremos saber también acerca de otras
variables explicativas que no están
relacionadas con la influencia social.
Obtener miembros de la red
personal
• Aquí es donde la recolección de datos de redes
personales difiere del resto de investigaciones de ciencias
sociales.

• Preguntamos a ego un conjunto de cuestiones


(generadors de nombres) que permiten obtener nombres
de personas que conocen (alteri):
– Lista-libre de gente con la que han obtenido contacto en el
pasado año
– Gente con la que discuten temas importantes
– Gente con lo que hablaron la semana pasada
– Gente con nombres de pila específicos

• Esto define la red


Preguntas sobre cada alter
• Preguntar a ego sobre cada alter

• Normalmente ésta es la parte más larga de la entrevista

• Si cada respondiente genera 50 alteriy se quieren


conocer 10 cosas sobre cada uno, entonces tenemos
que hacer 500 preguntas.

• Se debe buscar un equilibrio entre el número de alters y


la cantidad de información que se quiere obtener de
cada uno.
Pedir que evalúen la relación entre
cada par de alteri
• Finalmente, queremos recoger datos estructurales para
formar una matriz de adyacencia.

• Esto significa que ego debe evaluar todos los lazos


posibles entre cada par de alteri.

• Afortunadamente, usualmente asumimos que los lazos


son simétricos, lo cual significa que solamente tenemos
que conocer si los dos alteri están relacionados.

• El número de lazos a evaluar crece geométricamente a


medida que se añaden nuevos alteri.
Carga de trabajo a medida que se
añaden alteri
Cuatro posibles soluciones para
reducir la carga del respondiente
1. Preguntar menos alteri

2. Preguntar muchos alteri y después seleccionar una


muestra de alteri seleccionada de forma aleatoria para
establecer las relaciones entre sí.

3. Preguntar muchos alteri y después seleccionar un


subcojunto de relaciones

4. Intentar predecir un lazo a partir de la noción de


transitividad
Conclusiones
• Para la mayor parte de medidas
estructurales, un subcojunto aleatorio de
20 alteri proporcionará similares
resultados que un listado de 45 alteri.
What kind of data do we get?
• Data on network composition. These are
summaries of the attributes of network
alters.

• Data on network structure. These are


summary measures of the pattern of
relations

• Combinations of composition and structure


Personal network composition
Name Closeness Relation Sex Age Race Where Live Year_Met
Joydip_K 5 14 1 25 1 1 1994
Shikha_K 4 12 0 34 1 1 2001
Candice_A 5 2 0 24 3 2 1990
Brian_N 2 3 1 23 3 2 2001
Barbara_A 3 3 0 42 3 1 1991
Matthew_A 2 3 1 20 3 2 1991
Kavita_G 2 3 0 22 1 3 1991
Ketki_G 3 3 0 54 1 1 1991
Kiran_G 1 3 1 23 1 1 1991
Kristin_K 4 2 0 24 3 1 1986
Keith_K 2 3 1 26 3 1 1995
Gail_C 4 3 0 33 3 1 1992
Allison_C 3 3 0 19 3 1 1992
Vicki_K 1 3 0 34 3 1 2002
Neha_G 4 2 0 24 1 2 1990
. . . . . . . .
. . . . . . . .
. . . . . . . .

This ego has told us some things about each alter. For example, Joydip is
a 25 year old male she met in 1994 that she is very close to.
And we can add these to our model
Age
Education
Number of
Income cigarettes
smoked per day
Altage
Altsmoke
Duration
Independent variables Dependent variable

For each respondent these now become variables about


their social environment that can be used to predict
outcome variables. In this case we may believe that
higher proportions of smoking alters leads to smoking.
Now we can create a set of
compositional variables
• Average age of each alter (ALTAGE)
• Proportion of alters that are women
(ALTWOMEN)
• Proportion of alters that are family
(ALTFAMILY)
• Average length of time ego has known
each alter (DURATION)
• Proportion of alters that smoke
(ALTSMOKE)
Personal Network Structure
Joydip_K Shikha_K Candice_A Brian_N Barbara_A Matthew_A Kavita_G Ketki_G . . .

Joydip_K 1 1 1 1 0 0 0 0 . . .

Shikha_K 1 1 0 0 0 0 0 0 . . .

Candice_A 1 0 1 1 1 1 1 1 . . .

Brian_N 1 0 1 1 1 1 1 1 . . .

Barbara_A 0 0 1 1 1 1 0 0 . . .

Matthew_A 0 0 1 1 1 1 1 1 . . .

Kavita_G 0 0 1 1 0 1 1 1 . . .

Ketki_G 0 0 1 1 0 1 1 1 . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

The same Ego also evaluated the ties between their alters. We end up with
an adjacency matrix for each ego. We can use this to calculate structural
measures.
Now we can create a set of
structural variables
• Number of components (COMP)
• Average betweenness centrality
(BETWEEN)
• Closeness centralization (CLOSCENT)
• Number of alters in network core
(CORESIZE)
And these can be added to the model
Age
Education
Number of
Income cigarettes
smoked per day
Altage
Altsmoke Dependent variable

Duration In this model we want to test whether


Comp the structure of the personal network
impacts smoking. For example,
Between betweenness centrality is a measure
of bridging. Bridging represents
Coresize
exposure to different groups which
Independent variables
may not tolerate smoking.
Some measures of personal network structure
• Degree Centrality – An alter is highly degree-central to the extent he or she is directly connected to
many other alters.

• Closeness Centrality –An alter is highly close-central if he or she is connected by short paths to
many other alters.

• Betweenness Centrality –An alter is highly between-central to the extent he or she lies on many
geodesics (shortest paths) between alters.

• Components – A set of alters who are connected to one another directly or indirectly.

• Isolates – A node unconnected to any other node.

• Network-Degree Centralization – A measure of the extent to which the network is dominated by a


single alter using degree centrality.

• Network-Closeness Centralization – A measure of the extent to which the network is dominated by


a single alter using closeness centrality.

• Network-Betweenness Centralization – A measure of the extent to which the network is dominated


by a single alter using betweenness centrality.
How do we collect and analyze
these data?
• Many researchers develop paper
instruments or computerized instruments
that let them collect these data
• Compositional data are calculated using a
statistical package (e.g. SAS or SPSS)
• Structural analyses are not typical and are
often limited to personal network density,
since it is an easy measure to program
Need for personal network software
• A standardized software package would offer
many advantages
• It provides a computer interface that edits and
standardized data input with complex skip
patterns
• It automatically can calculate compositional and
structural measures and export them to a data
set compatible with a statistical package
• It makes it possible to analyze individual cases
EgoNet
Personal Network Analysis Software

Available at www.mdlogix.com
Egonet design
• Egonet is written in Delphi and runs on a
Windows platform
• There are two programs:
1. Administrator program to create a study and
assemble a questionnaire
2. Client program to collect data and analyze it
Example data file from Egonet
ID Sex Age Average tie Proportion of Average alter Components Cliques
strength females age

1 M 35 2.6 0.23 34.6 3 13

2 F 56 3.4 0.65 45.3 1 7

3 F 24 4.1 0.52 24.8 2 23

4 M 41 3.5 0.34 43.2 1 12

5 F 22 2.3 0.72 21.5 1 14

6 F 65 4.2 0.58 62.7 2 19

7 M 19 3 0.29 18.4 1 11

Egonet outputs data across all the respondents and assembles it into one file.
Notice that the data set has data about ego (sex, age), compositional data
(Proportion of females, average alter age), and structural data (components,
cliques). This data set would be difficult to produce without this software.
Egonet can also visualize the
personal network of a single Ego

This is the personal network of Merced, a 19-year-old second generation


West African migrant in Spain. The dots represent her alters and the lines
represent a connection between alters based on her evaluation of the ties.
We can label the dots (nodes) with
information we collected from Merced about
each alter, like where they are from
We can also size the nodes, in this case by
Merced’s assessment of how close she is to
each alter
And we can color the nodes, in this case by
race
Finally, we can shape the nodes, in this
case by whether they smoke (smokers are
the squares)
We now have a picture we can use to interview Merced
about her acculturation experience in Spain. See the
potential influence of white, Spanish smokers in the upper
right from her high school
Contrast this with the visualization of her 22 year old sister
Laura, labeled, sized, colored and shaped with the same
variables. Their acculturation experiences are different.
This is Vivian, a 36 year old
Moroccan woman
And this is Jose, a 46 year old
Dominican man
We can also use Egonet to visualize structural
measures. Here is Merced’s network with nodes
colored by betweenness centrality.
Here Merced’s network is colored by her relation type (blue
nodes are relatives). Egonet has done a cluster analysis
and circled nodes and labeled them with numbers.
Samples of first and second
generation immigrants
Location Group Interviews

Barcelona Argentine 81
Barcelona Moroccan 70
Barcelona Dominican 64
Barcelona Gambian 26
Barcelona Equatorial Guinean 9
Barcelona Senegalese 43
New York City Puerto Rican 86
New York City Dominican 97
New York City Columbian 34
Miami Cuban 12
Miami Haitian 13
Kansas Mexican 13
Total 548
Procedure
• Respondents answered a set of questions about
themselves, including an acculturation scale
• Respondents free-listed 45 alters given the
following definition:
“You know them and they know you by sight or by
name. You have had some contact with them in
the past two years, either face-to-face, by
phone, mail or e-mail, and you could still contact
them if you had to.”
Procedure (continued)
• Respondents answered twelve questions about
each alter
• Respondents evaluated all 990 possible ties
between alters rating the probability that the
alters talk to each other independently of the
respondent
• Structural variables were calculated using ties
that the respondent was sure existed
• We conducted a qualitative interview with each
respondent using a visualization of their network
Data Cleaning
• In some cases we questioned the
authenticity of the data
• We viewed each of the 486 visualizations
and listened to the interviews.
• These were scaled on a scale of 0-5
reflecting our assessment of their
authenticity
Percent Distribution of Authenticity Scores

*There are 369 cases (so far) with authenticity of 4 or 5


Dependent Variables

• Health – 42% excellent, 42% good, 14%


fair, 2% poor
• Smoking - 76% smoke, 24% don’t smoke
• Depression – 66% not depressed, 23%
mild depression, 11% depressed
• Children – 51% no children, 19% one
child, 13% two children
Independent variables
Respondent characteristics
Variable Proportion
HOST COUNTRY (Spain) .68
COUNTRY ORIGIN (Dominican) .30
SEX (Male) .54
GENERATION (First) .92
AGE (Less than 30 years old) .51
SKIN COLOR (White) .30
MARITAL STATUS (Never married) .52
LEGAL (Yes) .65
EMPLOYMENT (No) .30
EDUCATION (Secondary school) .49
ACCULTURATION (Level 1) .40
Independent Variables
Compositional Characteristics
Independent Variables
Structural Characteristics
Correlation between Dependent Variables and
Respondent Characteristics
Correlation between Dependent Variables
and Compositional Characteristics
Correlation between Dependent Variables
and Structural Characteristics

También podría gustarte