Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Representacin de
Grficos
Representaciones Grficas
UNIVERSIDAD AUTNOMA DE COAHUILA
FACULTAD DE CIENCIAS DE LA EDUCACIN Y HUMANIDADES
MAESTRA EN METODOLOGA DE LA INVESTIGACIN
Representaciones Grficas
DISEO, LECTURA Y REPRESENTACIN DE GRFICOS
SERIE DIDCTICA: METODOLOGA DE LA INVESTIGACIN
FACULTAD DE CIENCIAS DE LA EDUCACIN Y HUMANIDADES
EDIFICIO N UNIDAD CAMPO REDONDO
TEL. 412-91-33
ISBN:
Representaciones Grficas
CONTENIDO
El Diseo, la Lectura y la Representacin de los Grficos..................................................7
APARTADO A.
APARTADO B.
I.
II.
PRLOGO...................................................................................................................31
HISTOGRAMAS...........................................................................................................32
Introduccin...............................................................................................................................................32
La Densidad del trazo................................................................................................................................34
Estructura de datos....................................................................................................................................37
III.
GRFICAS DE PASTEL.............................................................................................38
Introduccin y Propsitos Generales.........................................................................................................38
La estructura de los datos..........................................................................................................................38
IV.
DIAGRAMA DE CAJAS............................................................................................39
Introduccin...............................................................................................................................................39
La definicin del diagrama de cajas..........................................................................................................39
La Caja.......................................................................................................................................................39
Los valores adyacentes lmites...................................................................................................................40
Los valores extremos..................................................................................................................................41
Comparaciones mltiples...........................................................................................................................41
La estructura de datos................................................................................................................................43
V. CARTAS O GRFICAS DE BARRAS...............................................................................43
Introduccin y Propsitos Generales.........................................................................................................43
La estructura de datos................................................................................................................................43
VI.
DIAGRAMAS DE PROBABILIDAD............................................................................44
Introduccin...............................................................................................................................................44
La lectura del diagrama de probabilidad..................................................................................................46
Los outliers.................................................................................................................................................47
Las colas largas.........................................................................................................................................47
La asimetra...............................................................................................................................................47
Las mesetas y los valles.............................................................................................................................48
Precauciones..............................................................................................................................................48
Los detalles tcnicos..................................................................................................................................48
La estructura de datos................................................................................................................................50
VII.
DIAGRAMA DE DISPERSIN...................................................................................50
Introduccin...............................................................................................................................................50
Estructura de datos....................................................................................................................................51
VIII. MATRIZ DE DIAGRAMAS DE DISPERSIN..............................................................52
Introduccin...............................................................................................................................................52
Representaciones Grficas
Estructura de los datos..............................................................................................................................53
DIAGRAMAS DE SUPERFICIE 3D............................................................................53
Introduccin...............................................................................................................................................53
La Estructura de los datos.........................................................................................................................55
Estilos del Diagrama de superficie............................................................................................................55
X. DIAGRAMAS DE VIOLN.............................................................................................57
Introduccin...............................................................................................................................................57
Los diagramas de violn.............................................................................................................................59
Estructura de datos....................................................................................................................................61
XI.
CARTAS DE PARETO...............................................................................................61
Introduccin...............................................................................................................................................61
Muestra el diagrama de una grfica de Pareto.........................................................................................62
Estructura de datos....................................................................................................................................62
XII.
AGRUPAMIENTOS JERRQUICOS............................................................................63
Introduccin...............................................................................................................................................63
XIII. LAS GRFICAS DE BARRAS DE ERROR...................................................................64
Introduccin...............................................................................................................................................65
Los valores perdidos..................................................................................................................................65
Estructura de datos....................................................................................................................................66
XIV. MATRIZ REJILLA DE PUNTOS.................................................................................66
Introduccin...............................................................................................................................................66
Estructura de datos....................................................................................................................................67
Las opciones...............................................................................................................................................67
Variable (X, Y, Z)........................................................................................................................................68
Mnimo y mximo (X, Y, Z).........................................................................................................................68
Rebanadas (X, Y, Z)....................................................................................................................................68
Decimales de Z...........................................................................................................................................68
El estilo del diagrama................................................................................................................................68
Bloques.......................................................................................................................................................68
Smbolos con un color................................................................................................................................69
Smbolos de colores mltiples....................................................................................................................69
IX.
APARTADO C.
XV.
GRFICAS CATEGORIZADAS..................................................................................71
Qu son los Grficos Categorizados?.....................................................................................................72
Mtodos de Categorizacin.......................................................................................................................74
Histogramas...............................................................................................................................................77
Diagramas de puntos.................................................................................................................................80
Grficos de Probabilidad...........................................................................................................................82
Diagramas Quantil-Quantil.......................................................................................................................83
Diagramas Probabilidad-Probabilidad.....................................................................................................84
Diagramas de Lnea...................................................................................................................................85
Diagramas de Caja....................................................................................................................................86
Grficas de Pastel......................................................................................................................................88
Diagramas de puntos de datos perdidos por rango...................................................................................89
Diagramas 3D............................................................................................................................................90
Diagramas Ternarios.................................................................................................................................91
XVI. CEPILLADO............................................................................................................93
XVII.
ALISADO DE DISTRIBUCIONES BIVARIANTES....................................................94
XVIII. COMPRESIN DE CAPAS.....................................................................................96
XIX. PROYECCIONES DE JUEGOS DE DATOS 3D.............................................................97
Representaciones Grficas
XX.
DIAGRAMAS DE CONOS........................................................................................98
Analizando Diagramas de conos..............................................................................................................99
Taxonoma de Diagramas de conos........................................................................................................101
Estandardizacin de valores....................................................................................................................103
Aplicaciones.............................................................................................................................................103
Grficas Relacionales..............................................................................................................................104
Tipos de Grficos de conos.....................................................................................................................104
conos enmarcados...................................................................................................................................109
XXI. REDUCCIN DE DATOS.........................................................................................110
XXII.
ROTACIN DE DATOS (EN ESPACIO 3D)...........................................................111
Ligas para consultar los tipos de grficas en Statistica..........................................................................112
APARTADO D.
DIAGRAMAS CORRELACIONALES.............................................114
ASCC................................................................................................................................114
XXIII. EL ANLISIS SISTMICO POR MEDIO DE CONSTELACIONES CORRELACIONALES
114
INTRODUCCIN....................................................................................................................................114
Apuntes complementarios sobre la correlacin estadstica.....................................................................117
Descripcin de la tcnica de constelaciones correlacionales.................................................................122
Elaboracin de las constelaciones correlacionales.................................................................................129
Lectura de las constelaciones..................................................................................................................133
Las conclusiones y su validez externa......................................................................................................135
Consideraciones finales...........................................................................................................................136
LITERATURA DE CONSULTA..............................................................................................137
Representaciones Grficas
Ctese como: Muoz Lpez, Temstocles. 2004. Diseo, Lectura y Representacin de Grficos.
Segunda edicin. Maestra en Metodologa de la Investigacin. Facultad de Ciencias de la
Educacin y Humanidades. Universidad Autnoma de Coahuila. Saltillo.
Dr. Temstocles Muoz Lpez
Representaciones Grficas
Todo signo en si mismo parece muerto: qu es lo que le da vida?... vive de su uso.
Wittgenstein (Investigaciones Filosficas)
Las comunidades acadmicas y profesionales tambin utilizan un sistema de
cdigos, smbolos y grafas especiales que no solo representan sus ideas, sino
que las delimitan y autoexcluyen de otras comunidades. No obstante, el
aislamiento no es total ni permanente, no son sistemas cerrados, siempre
conservan rasgos comunes entre s, que se constituyen en puentes o vasos
comunicantes que permiten su desarrollo regulado por el intercambio e
incorporacin de nuevas ideas y representaciones.
Es decir, estas comunidades aceptan que en su conjunto pertenecen a una
comunidad epistmica mayor, y que al presentar rasgos cientficos comunes,
pueden
ser
posibles
los
intercambios
conceptuales,
metodolgicos
Representaciones Grficas
el
lmite
de
la
creatividad
grfica
cientficamente
aceptable,
las
Representaciones Grficas
Psicol. Imagen o concepto en que se hace presente a la conciencia un objeto
exterior o interior. || Grfica. f. Mat. Figura con que se expresa la relacin entre
diversas magnitudes.
Grfico, ca. Grafo. m. Ling. Unidad abstracta que comprende el conjunto de
grafas de una letra. Grafo-. (Del gr. , escribir). Composicin de elementos.
Significa 'escritura'. Grafologa, grafomana. fa. (Del gr. -o, de la raz de
, escribir). elem. compos. Significa 'que escribe' o 'que describe'.
Mecangrafo, telgrafo, bolgrafo, hidrgrafo. Grfico, ca. (Del lat. graphcus, y
este del gr. ). adj. Dicho de una descripcin, de una operacin o de una
demostracin: Que se representa por medio de figuras o signos. U. t. c. s. || m.
Representacin de datos numricos por medio de una o varias lneas que hacen
visible la relacin que esos datos guardan entre s. || f. grfico (representacin
por medio de lneas)
En un diccionario mdico biolgico encontramos que Graph, segn Francisco
Corts
Gabaudan
(http://clasicas.usal.es/dicciomed/)
()
es
Inform.
Representacin
grfica
esquemtica
utilizada
para
10
Representaciones Grficas
|| Idea o concepto que alguien tiene de algo y que condiciona su comportamiento.
|| en ~. loc. adv. esquemticamente (por medio de esquemas).
Figura. (Del lat. figra). f. Forma exterior de un cuerpo por la cual se diferencia de
otro. || Cosa que representa o significa otra. || ilustracin (estampa, grabado de
un libro). || Geom. Lnea o conjunto de lneas con que se representa un objeto. ||
Geom. Espacio cerrado por lneas o superficies. ||
Ilustracin. f. Accin y efecto de ilustrar. || Estampa, grabado o dibujo que adorna
o documenta un libro. || Publicacin, comnmente peridica, con lminas y
dibujos, adems del texto que suele contener. ||.
Semntico, ca. (Del gr. , significativo) adj. Perteneciente o relativo a la
significacin de las palabras. || f. Estudio del significado de los signos lingsticos y
de sus combinaciones, desde un punto de vista sincrnico o diacrnico. V. calco
~, campo ~.
Semitica. (Del gr. ). f. semiologa (estudio de los signos en la vida
social). || Teora general de los signos.
Seal. (Del lat. signlis, de sgnum, sea). f. Marca o nota que se pone o hay en
las cosas para darlas a conocer y distinguirlas de otras. || Signo o medio que se
emplea para luego acordarse de algo. || Distintivo, marca. || Signo (cosa que
representa o sustituye a otra). || Indicio o muestra inmaterial de algo. || Sea (nota,
indicio o gesto). || Vestigio o impresin que queda de algo, por donde se viene en
conocimiento de ello. || Imagen o representacin de algo. || Prodigio o cosa
extraordinaria y fuera del orden natural. || dar ~es de algo. fr. Mostrar indicios de
su existencia. || en ~. loc. adv. En prueba, prenda o muestra de algo.
Signo. (Del lat. signum). m. Objeto, fenmeno o accin material que, por
naturaleza o convencin, representa o sustituye a otro. || Indicio, seal de algo. ||
Mat. Seal o figura que se usa en los clculos para indicar la naturaleza de las
cantidades y las operaciones que se han de ejecutar con ellas. || natural. m. El
11
Representaciones Grficas
que nos hace venir en conocimiento de algo por la analoga o dependencia natural
que tiene con ello.
Smbolo. (Del lat. simblum, y este del gr. oo). m. Representacin
sensorialmente perceptible de una realidad, en virtud de rasgos que se asocian
con esta por una convencin socialmente aceptada. || Ling. Tipo de abreviacin de
carcter cientfico o tcnico, constituida por signos no alfabetizables o por letras, y
que difiere de la abreviatura en carecer de punto; p. ej., N, He, km y $ por Norte,
helio, kilmetro y dlar, respectivamente. || algbrico. m. Letra o figura que
representa un nmero variable o bien cualquiera de los entes para los cuales se
ha definido la igualdad y la suma.
Sintctico, ca. (Del gr. ). adj. Gram. Perteneciente o relativo a la
sintaxis.
Sintaxis. (Del lat. syntaxis, y este del gr. , de , coordinar). f.
Gram. Parte de la gramtica que ensea a coordinar y unir las palabras para
formar las oraciones y expresar conceptos. || Inform. Conjunto de reglas que
definen las secuencias correctas de los elementos de un lenguaje de
programacin.
Tabla. (Del lat. tabla). Lista o catlogo de cosas puestas por orden sucesivo o
relacionadas entre s. || Cuadro o catlogo de nmeros de especie determinada,
dispuestos en forma adecuada para facilitar los clculos. Mat. tabla de
multiplicacin de los nmeros dgitos dispuesta en forma de cuadro.
12
Representaciones Grficas
13
Representaciones Grficas
misma pgina donde se le menciona, se colocar al inicio de la siguiente cuartilla,
en la cual debe reanudarse el texto si an queda espacio despus del grapho,
facilitando as la lectura y el anlisis de la informacin. No es aceptable ubicar los
graphos al final de la Literatura Citada. Los graphos que en su versin final ocupen
ms de una pgina no son aceptables.
Cada variable o concepto se identifica con su nombre y unidades. Reduzca las
cifras grandes para dejar slo los dgitos significativos, de acuerdo con el nivel de
precisin con que se midi la variable. No es necesario utilizar todos los decimales
que salen del listado de la computadora, se recomiendan solamente 2.
En cada grapho solamente presente un mximo de tres lneas horizontales a todo
lo largo o (aunque puede haber varias sublneas que abarquen parte de las
columnas o conceptos): la primera lnea se coloca debajo del ttulo del grapho; la
segunda, abajo de los criterios de clasificacin principales y contiene el cuerpo de
datos; y la tercera, al final del grapho.
Despus de la ltima lnea horizontal mayor se colocan las notas de pie del
grapho, las que son de dos tipos:
a) Para indicar niveles de significancia estadstica y su simbologa de
representacin, por ejemplo (_____ =p0.05,
p0.01)
para
14
Representaciones Grficas
que toda la informacin de este grapho est a doble espacio para que los
asesores, rbitros y editores tengan lugar suficiente para hacer sus anotaciones.
Tabla 1. Caractersticas acadmicas de grupos de alumnos integrados por sus calificaciones
en dos aos de evaluacin .
Caractersticas de aprovechamiento
Atributos medidos
Grupos de
Historia
acadmica
Calificaciones
Calificacin
Asistencia
semestral
Horas diarias
de estudio
Alumnos
promedios
Exmenes
Tareas (%)
Hrs. medidas
Hrs.
declaradas
2001
Grupo A
87
85
34.2
248
3.25
Grupo B
92
89
33.4b
145
3.00
Integracin A y B
97
96
31.0c
120
3.12
2002
Grupo A
87
86
28.5
340
3.60
Grupo B
94
92
41.3
280
3.00
Integracin A y B
99
95
35.0
150
2.00
Cuadros
Los cuadros se emplean para clarificar el texto, cuando se presentan nombres o
nmeros con lectura independiente, sinttica y complementaria, o cuando su
uso constituye un ahorro importante de espacio. Son claros, simples y concisos.
15
Representaciones Grficas
Cada cuadro debe presentar datos en forma organizada, de manera que facilite
las comparaciones, muestre clasificaciones, se observe rpidamente algunas
relaciones y, sobre todo, se ahorre espacio del texto. Cada cuadro se explica por
s mismo y su contenido no se repite en las figuras ni en el texto del artculo,
solamente se hace referencia a l.
Solamente los cuadros y las tablas tienen el epgrafe en su parte superior. Las
dems representaciones iconogrficas lo tendrn en la parte inferior.
Tablas
Las tablas son concentrados de datos numricos ordenados matricialmente para
mostrar los listados de resultados que son la fuente de la informacin textual
analtica, presentada en forma de lectura interdependiente. Siguen las mismas
normas generales en su presentacin.
16
Representaciones Grficas
que la reproduccin de figuras es conveniente hacerlas de un tamao tal que
permita mantener la nitidez en una reduccin hasta de 50% para la impresin final.
Al respecto, se sugiere un tamao de media pgina para figuras sencillas y de una
pgina para figuras complejas, con un tamao mnimo de 8 puntos para las letras
o nmeros.
En una figura lo que interesa destacar es el contenido y no los ejes.
Consecuentemente, el grosor de estos ltimos conviene que sea menor que el de
las lneas interiores. Para indicar las dimensiones de los ejes se sugiere elegir
escalas apropiadas, que destaquen lo que se desea mostrar; las leyendas de cada
eje se colocarn como se indica en la Figura 1. Observe que la figura no tiene
marco, lo que aumenta la simplicidad pero no se pierde contenido. En
consecuencia, los editores solamente se aceptan las figuras si cumplen con los
requisitos indicados por ellos.
80.00
Edades
estimadas
70.00
60.00
11
12
50.00
13
40.00
14
30.00
15
20.00
16
10.00
0.00
11
12
13
14
15
16
Edades reales
Al igual que los cuadros, todas las figuras debern estar expresamente citadas en
el texto previo, en orden progresivo.
17
Representaciones Grficas
Nunca comience un apartado, ya sea captulo (ttulo de primer orden) o ttulo de
segundo o tercer orden con una tabla o representacin grfica.
Unidades
Las unidades a usar son las del Sistema Internacional. Se sugiere colocar entre
parntesis la equivalencia de los smbolos de cualquier otro sistema la primera
vez que se nombre una unidad, si son diferentes.
En una serie de datos con igual unidad de medicin, utilice numerales seguidos de
la forma abreviada de la unidad (sin colocar punto final ni maysculas al principio);
por ejemplo: 2, 4 y 6 ml L-1, 16, 20 y 33%; 3400, 1200 y 400 kg, 4 y 9 meses.
En cambio, si slo hay una cifra y sta es menor de 10, se escribe con palabras
(seis variables, cuatro repeticiones, ocho ambientes), a diferencia de 16 alumnos,
126 casos; sin embargo, si esa cifra va acompaada inmediatamente de alguna
unidad del sistema internacional, debe expresarse con nmero (2 mg, g -1, 6 g, 5 lt)
No empiece una frase o prrafo con un numeral. Cambie la frase o escriba la
cantidad con letras.
Cuando se trate de nmeros grandes en el texto, procure redondear la cifra y
emplear palabras como parte del nmero; as, $458,960.00 puede expresarse
como casi 460 mil pesos. Recuerde que los smbolos de las unidades de medida
no se pluralizan: kilo(s) = kg, kilmetro(s) = km, hectrea(s) = ha, metro(s) = m,
litro(s) = lt, gramo(s) = g, etc.
Frmulas
Los ndices y subndices estarn bien ubicados y legibles. Tenga especial cuidado
en diferenciar claramente los nmeros 0 y 1 de las letras O e l, respectivamente.
El tamao mnimo aceptable es de 2 mm u 8 puntos.
18
Representaciones Grficas
Las letras griegas, as como los smbolos que se utilizan para marcar o referir, se
explican inmediatamente despus de haberse usado por primera vez, excepto
aquellos del dominio del sistema internacional.
Para expresar fracciones use la forma lineal, con exponentes negativos para los
denominadores; ejemplo: g/cm2, kg/ha-1
Las ecuaciones que expresan las derivaciones matemticas de una frmula,
progresivas o no, sern numeradas consecutivamente entre parntesis, al lado
derecho cuando sean ms de una. En general se numeran slo aqullas
explcitamente referidas en el texto.
Se recomienda el uso de potencias fraccionarias (0.5, 0.33) en vez de races
cuadradas, cbicas, etc.
Las potencias de e se expresan mejor como exp (abreviatura de la funcin
exponencial)
En el caso de las frmulas qumicas, la carga de los iones se expresa como lo
seala el ejemplo siguiente: Ca2 y CO3, y no Ca++.
En la escritura de istopos, el nmero de masa se indica en la parte superior del
lado izquierdo del smbolo; ejemplo: 15N, 14C, etctera.
Normas ticas
Las grficas pueden ser modificadas para facilitar su lectura y magnificar los
efectos de los datos, pero tambin para crear intencionalmente impresiones falsas,
de tal forma que es conveniente que el investigador est pendiente de sus
diseos, y del impacto que las representaciones tienen en otras personas.
La siguiente grfica puede ser modificada para magnificar los efectos de los datos
y crear las impresiones que convienen a los que la elaboran. En ella se indican
dos variables que miden lo mismo y son recprocos, de tal suerte que la
19
Representaciones Grficas
modificacin no es en los datos, sin en la escala utilizada y las dimensiones del
grfico.
20
Representaciones Grficas
La tica (ethos: comportamiento) del investigador le reclama apegarse a la verdad
y a la responsabilidad que tiene con los dems usuarios de la informacin que
presenta.
construccin
de
grficas,
con
los
programas
comerciales
de
1. Matrices
Las matrices de datos usualmente no se presentan en la investigacin a menos de
que se trate de ejemplificar o mostrar con ellas algn hecho relevante que influye
en la investigacin. Las matrices son referidas como tablas de doble entrada.
El siguiente ejemplo muestra un fragmento de una base de datos:
21
Representaciones Grficas
Nmero
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
22
Representaciones Grficas
2. Cuadros
Los cuadros son representaciones de datos importados de otros autores, donde se
concentra la informacin sistemticamente organizada y pertinente.
Ejemplo:
Las polticas de desarrollo agrcola relacionadas con los factores de la
sustentabilidad ambiental, son propuestas por Gligo (1990) de acuerdo al siguiente
cuadro:
Factores:
Coherencia ecolgica
Polticas:
Global
Especfica
Cientfica y
tecnolgica.
Ordenamiento
territorial.
Estabilidad Socioestructural.
Estructura de
tenencia.
Reforma agraria.
Regulacin jurdica.
Complejidad infraestructural.
Obras pblicas.
Riego y drenaje.
Obras viales.
Estabilidad econmico-financiera.
Comercializacin.
agropecuaria
Precios agrcolas.
Capacidad de compra.
Precios de productos.
Precios de insumos tecnolgicos.
Crditos subsidiados.
Subsidios para la recuperacin de los suelos
erosionados.
Subsidios para la reforestacin.
Crditos agrcolas.
Subsidios para
la recuperacin
ambiental.
Incertidumbre y
riesgo.
Financiera.
23
Representaciones Grficas
4. Diagramas
Se consideran similares: Dendrogramas, Rutas, Secuencias, Correlacionales,
Constelaciones,
Dispersogramas,
Flujo,
Diacrnico,
Polietapas,
Mapas
conceptuales.
24
Representaciones Grficas
5. Figuras
Se consideran similares: Grficas de conos, Caras de Chernoff, conos de Pastel,
Estrellas, conos de Columnas, Rayos solares, conos de Lneas, conos
poligonales, conos de perfiles.
25
Representaciones Grficas
6. Grficos
Se consideran similares: Histogramas, Grficas de cajas, Grficas de puntos,
Grficas de lneas, Grficas de probabilidad, Grficas de reas, Grficas
circulares, Anillos, Grficas ternarias, Superficie, Grficas de contorno, Grficas
secuenciales.
26
Representaciones Grficas
27
Representaciones Grficas
7. Lminas
Ilustraciones coloreadas.
28
Representaciones Grficas
8. Mapas
Distribuciones territoriales y mentales (si as se especifica), Ubicaciones, Rutas.
Combinaciones personalizadas
Los arreglos especficos de los datos modificando los estilos predeterminados.
Diseos 2D y 3D
Solamente usuales en casos en que se requiere incluir 3 o ms variables que se
relacionan dimensionalmente. No se permiten en la mayora de las editoriales
debido a que se pierde la perspectiva de los ejes X e Y.
Ajustes personalizados
Se permiten las modificaciones predeterminadas en ejes, colores, leyendas, tablas
adjuntas, tendencias, lneas de divisin. De hecho, es deseable realizar las
modificaciones pertinentes para ganar mayor riqueza en la presentacin.
29
Representaciones Grficas
Simbologa
Las literales, smbolos especiales y smbolos internacionales se permiten en la
mayora de las publicaciones, con la precaucin de no saturar la representacin,
indicando su significado al pi de la grfica o en el texto previo.
Colores.
Se requiere preferentemente usar los colores blanco y negro para publicaciones y
en color para presentaciones en pantalla con fines exploratorios.
30
Representaciones Grficas
APARTADO B.
GENERACIN Y USO DE
GRFICOS COMUNES
I.
PRLOGO
Nmero de clases
2
La adaptacin, traduccin y ajustes que presentan los textos seleccionados en stos apuntes han
sido modificados por el autor a partir de materiales originales de NCSS (Number Cruncher
Statistical System) y Statistica, para facilitar su comprensin como material de gua.
Dr. Temstocles Muoz Lpez
31
Representaciones Grficas
Antes de comenzar con la elaboracin de grficos es conveniente conocer el
nmero de clases, segmentos o porciones en que se distribuirn grficamente los
datos. Para ello se utilizan dos procedimientos comunes:
1) Frmula de Sturges para el nmero de clases (Forns, M., T. Kirchner, y M.
Torres (1991). k=1+3.3(log n). donde
k= nmero de clases
n= tamao de la muestra
Ejemplo:
Muestra: 257
Desarrollo: Log de n = 2.41
Base 3.3+1= 4.3
k= 10
2) Regla del tanteo (http://www.cofc.edu/~milesd/freqdist.htm) k=5(log n).
donde:
k= nmero de clases
n= tamao de la muestra
Ejemplo:
Muestra: 257
Desarrollo: Log de n = 2.41
Base 5
k= 12
En ambos casos el nmero de intervalos de clase es muy similar grficamente y el
investigador requiere aplicar ambos para observar y decidir cul es el que muestra
mejor los datos.
II. HISTOGRAMAS
Introduccin
La palabra histograma viene de los griegos stos () que significa mstil,
telar, tejido, trama de filamentos, y gram () a, que significa letra,
trazo, signo, esquema o grfico. Por la definicin directa de histograma se toma
grfico de tramas o postes. (Histograma. De histo- y -grama. 1. m. Estad.
Representacin grfica de una distribucin de frecuencias por medio de
Dr. Temstocles Muoz Lpez
32
Representaciones Grficas
rectngulos, cuyas anchuras representan intervalos de la clasificacin y cuyas
alturas representan las correspondientes frecuencias. Real Academia Espaola:
www.rae.es)
Histogram
40.0
estn
alineados
26.7
Count
postes
13.3
0.0
40.0
53.3
66.7
80.0
SepalLength
33
Representaciones Grficas
Histogram (EJERMETI.STA 12v*25c)
y = 25 * 5 * normal (x, 49.2, 13.31665)
6
No of obs
<= 25
(25,30]
(30,35]
(35,40]
(40,45]
(45,50]
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
> 75
POTENCIA
34
Representaciones Grficas
referencias a lo largo del rango de datos. Matemticamente, la densidad en un
valor x se define como la fraccin de los valores de los datos por la unidad de
medida en un intervalo centrado en x.
Una vez que usted escoja una anchura conveniente del intervalo, puede calcular la
densidad en cualquier (y a cada) valor de x. Si usted calcula la densidad en, por
ejemplo,
50
valores
los
conecta,
obtiene
la
densidad
del
trazo.
Count
53.3
26.7
0.0
40.0
53.3
66.7
80.0
SepalLength
35
Representaciones Grficas
Histogram
50.0
Count
33.3
16.7
0.0
40.0
53.3
66.7
80.0
SepalLength
En tanto que con 40% la figura se agrupa ms, pero mantiene la concentracin
marcada:
Histogram
40.0
Count
26.7
13.3
0.0
40.0
53.3
66.7
80.0
SepalLength
36
Representaciones Grficas
Histogram
40.0
Count
26.7
13.3
0.0
40.0
53.3
66.7
80.0
SepalLength
Estructura de datos
37
Representaciones Grficas
El histograma se construye con una sola variable. Una segunda variable se puede
utilizar para dividir la primera variable en grupos (Ej., categora de edad o gnero).
No se solicita otro requisito en los datos de entrada. Sin embargo, las
distribuciones disponibles en NCSS asumen que los datos son continuos. Observe
que son ignoradas las filas con valores perdidos en las variables seleccionadas.
III.
GRFICAS DE PASTEL
Produccin
IV.
DIAGRAMA DE CAJAS
38
Representaciones Grficas
Introduccin
Al analizar los datos con un diagrama usted necesita ver a menudo las
caractersticas de una sola serie de nmeros, de observaciones o de medidas.
Puede ser que desee conocer el centro y cmo est la distribucin de los datos
sobre este valor central. Puede ser que usted desee investigar los valores
extremos atpicos (llamados outliers) o estudiar la distribucin de los valores de los
datos (el patrn de los valores de los datos a lo largo del eje de la mediana). Hay
varias tcnicas que estn disponibles para permitir que usted estudie la
distribucin. stos incluyen el diagrama de tallo-hoja, el histograma, la densidad
del trazo, el diagrama de probabilidad, y el diagrama de cajas (Box Plot)
presentado en seguida.
La Caja
El diagrama de cajas se compone de una caja (un rectngulo) con las lneas, y los
puntos agregados a ella. La anchura de la caja puede ser arbitraria o convencional
y se debe seleccionar su dimensin para hacer una exhibicin agradable a la vista.
La presentacin usual de los lmites de la cubierta y el fondo de la caja son los
porcentajes 25avo y 75avo. La longitud de la caja es as el rango interquartil (IQR).
Es decir, la caja representa el 50% o mitad de los datos centrales.
El IQR es una medida popular de la distribucin. Usted puede representar la caja
como un rectngulo, un diamante, una elipse, o una figura especial diseada para
hacer comparaciones mltiples. En ella se dibuja una lnea a travs del centro de
la caja en el punto medio o mediana (el porcentaje del 50avo). El punto medio es
una medida popular de la localizacin del valor medio o de centro de las variables.
39
Representaciones Grficas
Box Plot
SepalLength
80.0
65.0
50.0
35.0
Iris
Box Plot
SepalLength
80.0
65.0
50.0
35.0
Iris
40
Representaciones Grficas
Comparaciones mltiples
Estas se utilizan a menudo para las distribuciones de varias agrupaciones de
datos, puesto que resumen el centro y la distribucin de los datos con apariencia
muy agradable. Al hacer comparaciones concluyentes entre las localizaciones
(puntos medios) de varias agrupaciones, es til hacer un diagrama de caja
modificado llamado diagrama truncado.
Se construyen los cortes usando la frmula:
41
Representaciones Grficas
Box Plot
SepalLength
80.0
66.7
53.3
40.0
Iris
SepalLength
80.0
66.7
53.3
40.0
Iris
Esta versin modifica el smbolo usado para la caja. De hecho, pone la caja hacia
fuera, y dos lneas horizontales marcan la posicin de la caja. La parte que se
grafica es solamente la parte truncada. Esto hace mucho ms fcil hacer
comparaciones. Si dos de los cortes se traslapan, los puntos medios del grupo no
42
Representaciones Grficas
son perceptiblemente diferentes. Observe que al hacer comparaciones entre
varias agrupaciones, los diagramas truncados no requieren ningn ajuste para la
multiplicidad de pruebas en que son conducidos. Mientras que los diagramas
truncados se utilicen informalmente, no hay necesidad de ajustes tcnicos.
La estructura de datos
El diagrama de cajas se construye a partir de una variable. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categora de edad
o gnero). En este caso, un diagrama separado de la caja se exhibe para cada
grupo. No se solicita otro requisito en los datos de entrada.
V.
90
visualmente valores
80
70
es
el
on
Junio
Ki
wi
s
grfica de rea, y la
nj
as
ur
a
barras horizontal, la
Mayo
Pe
r
an
za
na
s
vertical, la grfica de
Abril
os
la grfica de barras
ar
a
zn
variaciones en la grfica
60
50
40
30
20
10
0
as
Toneladas
versiones bi y
tridimensionales de cada uno. Arriba se muestra un ejemplo de una grfica de
barras 3D.
La estructura de datos
43
Representaciones Grficas
Los datos de la grfica de barras 3D se incorporan en el formato estndar de la
fila-columna de la hoja de datos. Cada valor numrico de los datos se convierte en
una barra. Los datos alfabticos se utilizan para etiquetar las filas y las columnas
de la grfica. En la tabla est un ejemplo de los datos graficados.
FRUTA
ABRIL
MAYO
JUNIO
Manzanas
82
70
20
Peras
73
50
33
Duraznos
67
45
28
Naranjas
85
65
17
Kiwis
54
42
24
Melones
33
58
20
VI.
DIAGRAMAS DE PROBABILIDAD
Introduccin
Este procedimiento construye los diagramas de probabilidad normal, las
distribuciones de Weibull, Chi-ajustado, de gamma, uniformes, exponenciales, y
mitad-normales. Le permite intentar varias transformaciones para ver si alguna se
acerca ms a la distribucin de su inters. Los lmites de confianza aproximados
se dibujan para ayudar a precisar si un sistema de datos sigue una distribucin
dada. Si se especifica una variable agrupadora, se dibuja en una lnea separada y
se exhibe para cada valor nico de la variable agrupadora.
44
Representaciones Grficas
Normal Probability Plot of SepalLength
SepalLength
80.0
66.7
53.3
40.0
-3.0
-1.0
1.0
3.0
Normal Distribution
45
Representaciones Grficas
3. Permite que las generalizaciones sean hechas de la muestra a la poblacin.
Estas generalizaciones toman generalmente la forma de intervalos de confianza y
de pruebas de hiptesis.
4. Entender la distribucin de una muestra puede proporcionar la entrada en el
proceso fsico que cre los datos.
Obviamente la naturaleza no genera automticamente los datos que siguen cierta
distribucin de probabilidad. Cuando usted asume que sus datos siguen la
distribucin normal, realmente est asumiendo que la distribucin de sus datos es
razonablemente aproximada a la distribucin normal. La pregunta que se presenta
es que tan bastante cerca est de lo normal? Esta pregunta se puede estudiar
usando procedimientos numricos y grficos. Se han desarrollado las pruebas
numricas de hiptesis que permiten que usted determine si sus datos siguen
cierta distribucin. Consulte sobre mnibus K.
Las pruebas para la normalidad se proporcionan generalmente en los programas
estadsticos en el apartado de estadstica descriptiva. Los procedimientos grficos
son tiles porque le dan una impresin visual sobre si es vlida la asuncin de
normalidad. Le permiten precisar si la asuncin es invalidada por uno o dos
outliers (que podran ser quitados), o si los datos siguen una distribucin
totalmente dispersa. Tambin sugieren qu transformacin de los datos (raz
cuadrada, registro, lo contrario, los etc.) sigue ms de cerca la distribucin normal.
El mejor acercamiento es aplicar procedimientos numricos y grficos. Dado que
los datos estn disponibles en su computadora, toman solamente algunos golpes
de teclado hacer ambos chequeos.
46
Representaciones Grficas
hacer varias prcticas con bases de datos que siguen los patrones que usted
comprende. Genere los diagramas de probabilidad para conseguir una apreciacin
de cmo se muestran diversos patrones de datos en los diagramas. Si los puntos
en la probabilidad se trazan en toda la pendiente a lo largo de una lnea recta,
usted puede asumir que los datos siguen esa distribucin de la probabilidad. Por lo
menos, la distribucin real es bastante aproximada para la distribucin que usted
ha trazado. Discutiremos brevemente los tipos de patrones que coincidan
generalmente con salidas de la rectitud de esta lnea.
Los outliers
Los outliers o casos atpicos son los valores que no siguen el patrn del cuerpo de
los datos. Se localizan en cualquier extremo de la probabilidad. Puesto que los
outliers grandes desviarn seriamente la mayora de los anlisis estadsticos,
usted debe investigarlos cuidadosamente. Si son errores u ocurrencias de una
sola vez deben ser quitados de su anlisis. Una vez que se hayan quitado los
outliers, el diagrama de probabilidad debe ser rediseado sin ellos.
La asimetra
Si la probabilidad tiene una curva convexa o cncava (ms que una lnea recta),
los datos se sesgan a un lado o al otro de la mitad. Esto puede ser corregido
generalmente usando una frmula de ajuste como transformacin de poder.
47
Representaciones Grficas
Precauciones
El estudio de diagramas de la probabilidad es una herramienta muy til en anlisis
de datos, teniendo algunas precauciones debido a que:
1. Estos diagramas acentan los problemas que pueden aparecer en las colas de
la distribucin, no en el centro (puesto que ah hay muchos puntos agrupados).
2. La variacin natural en los datos causar una cierta salida de la rectitud.
3. Puesto que el diagrama considera solamente una variable a la vez, no se
atiende alguna relacin que pueda existir con otras variables.
4. Los lmites de confianza exhibidos en el diagrama son solamente aproximados.
Tambin, dependen mucho de un tamao de muestra razonable. Para las
muestras inferiores de 20 casos, estos lmites se deben tomar con mucha
precaucin. Tambin puede cambiar mucho los lmites cambiando el nivel de
confianza (el valor de alfa). Asegrese de que el valor que usted est utilizando es
razonable.
48
Representaciones Grficas
Vamos a asumir que tenemos un sistema de los nmeros x 1, x2..., xn y deseamos
estudiar visualmente si la asuncin de la normalidad es razonable. El mtodo
bsico es:
1. Clasifique los xis del ms pequeo al ms grande. Represente el sistema
clasificado de nmeros como x(1), x(2)..., x(n). Por lo tanto, x(1) es el mnimo y el
x(n) es el mximo de estos datos.
2. Defina los quantiles empricos de n, p1, p2..., pn, donde pi = i/n. stos son
similares a los porcentajes. Por ejemplo, si n = 5 los pi s seran 2, 4, 6, 8, 10. El
valor p2 del 4 se interpreta como significado que ste es el 40 porcentaje.
3. Encuentre un sistema de los nmeros, z1, z2..., el zn, que esperara de los
datos que siguen exactamente la distribucin normal. Por ejemplo, z2 es el
nmero que contbamos con si obtuviramos 5 valores de una distribucin
normal, clasificndoles, y seleccionado el segundo ms bajo. stos se llaman los
quantiles.
4. Construya un diagrama de dispersin con los pares x(1) y z1, x(2) y z2,
etctera. Si los xis vinieran de una distribucin normal, anticiparamos que los
puntos trazados caern a lo largo de una lnea recta. El grado de no-normalidad es
sugerido por la cantidad de la curvatura en el diagrama.
Hay varios refinamientos al procedimiento de arriba. El ms comn es la definicin
de los pis en el paso 2. La frmula usada generalmente es pi = (i-a)/(n-2a+1),
donde a es un nmero entre 0 y 1. Muchos estadsticos recomiendan a = 1/3. ste
es el valor por defecto usado por programas como NCSS (el valor de a se fija en la
opcin de la constante del porcentaje). Otra modificacin est en el escalamiento
usado para los zis. Si se utilizan los zis del paso 3, la definicin terminante es el
diagrama del quantil. Si los z s se convierten a una escala de probabilidad, el
diagrama se conoce como diagrama de probabilidad. Hoy en da estas
definiciones se han debilitado y utilizamos el trmino de diagrama de probabilidad
para representar cualquiera de estos diagramas. Los diagramas de probabilidad
49
Representaciones Grficas
se pueden construir para cualquier distribucin, aunque el de normalidad es el
ms comn.
Los cuatro pasos antedichos se utilizan para cualquiera de las siete funciones de
distribucin que estn disponibles en NCSS. Las tablas de compartimientos, de
Cleveland, de Kleiner, y de Tukey (1983) que se muestran debajo dan la
informacin tcnica sobre estas distribuciones. Una de las caractersticas ms
tiles de estas tablas es la columna ordenada y marcada en la segunda tabla. Esta
columna define la transformacin de los datos que se deben utilizar para alcanzar
un diagrama estndar de probabilidad para esa distribucin.
Por ejemplo, si deseaba generar un diagrama gamma de probabilidad, debe tomar
los datos de una mitad de poder. Observe que no hay transformacin especial
necesaria para el diagrama normal de probabilidad. Estos lmites de confianza
sirven en tanto que la referencia limita cuando est estudiando un diagrama de
probabilidad. Cuando la cada de los puntos est fuera de estos lmites, los
considerara como evidencia que la asuncin de la normalidad (o cualquier
distribucin que est considerando) es invlida.
La estructura de datos
El diagrama de probabilidad se construye de una sola variable. Una segunda
variable se puede utilizar para dividir la primera variable en grupos (ej., categora
de edad o gnero). No se solicita otro requisito en los datos de entrada, sin
embargo, las distribuciones disponibles en NCSS asumen que los datos son
continuos. Las filas que faltan son ignoradas con valores en una de las variables
seleccionadas.
VII.
DIAGRAMA DE DISPERSIN
Introduccin
50
Representaciones Grficas
El diagrama x-y de dispersin es una de las herramientas de mayor alcance para
analizar datos. NCSS incluye un men de caractersticas para realzar el diagrama
bsico de dispersin. Algunas de estas caractersticas son lneas de la tendencia
(mnimos cuadrados) y lmites de confianza, polinomios, lneas, curvas lowess,
diagramas de caja insertados, y diagramas de girasol.
Lo que sigue es un ejemplo de un diagrama tpico de la dispersin con una lnea
de tendencia y con diagramas de caja incorporados.
Estructura de datos
El diagrama de dispersin se construye a partir de dos variables. Se puede utilizar
una tercera variable para dividir las primeras dos variables en grupos (Ej.,
categora de edad o gnero). No se hacen otros requerimientos para los datos de
entrada.
Height (inches) vs Weight (lbs)
Weight (lbs)
250.0
183.3
116.7
50.0
50.0
60.0
70.0
80.0
Height (inches)
51
Representaciones Grficas
Height (inches) vs Weight (lbs)
Weight (lbs)
250.0
Gender
1
2
183.3
116.7
50.0
50.0
60.0
70.0
80.0
Height (inches)
Considere que las filas con valores perdidos en una de las variables seleccionadas
sern ignoradas en ambas.
VIII.
Introduccin
La matriz de diagramas de dispersin es una tabla de dispersin mltiple. Cada
diagrama es pequeo para poder introducir muchos diagramas en una pgina.
Cuando usted necesita dar una mirada de diagramas, por ejemplo al principio de
un anlisis de regresin mltiple, la matriz del diagrama de dispersin es una
herramienta muy til. Lo que sigue es un ejemplo de una matriz del diagrama de
dispersin creada durante la fase inicial de un estudio de la regresin mltiple.
En el siguiente ejemplo hay cinco variables de la prueba que forman un juego de
variables independientes, contrastadas contra ellas mismas considerando cada la
variable como dependiente para organizarlas. Observe cmo puede explorar
rpidamente los diagramas para variables altamente correlacionadas, y outliers.
52
Representaciones Grficas
Raz_Ded_
Raz_Ind_
Pens_Cr_t_
Poten_
Poten_
Pens_Cr_t_
Raz_Ind_
Raz_Ded_
Ex_Esc_
Ex_Esc_
IX.
DIAGRAMAS DE SUPERFICIE 3D
Introduccin
Los diagramas de superficie 3D
son diagramas de datos
tridimensionales. Ms que
53
Representaciones Grficas
mostrar los puntos de referencias individuales, los diagramas superficiales
muestran una relacin funcional entre una variable dependiente sealada (Y), y
dos variables independientes (X1 y X2).
El diagrama de puntos es un diagrama que acompaa al diagrama de contorno.
Es importante entender cmo se construyen estos diagramas.
Se construye una rejilla de dos dimensiones de X1 y de X2. El rango de esta rejilla
es igual al rango de los datos. Despus, un valor de Y se calcula para cada punto
de la rejilla. Este valor de Y es un promedio cargado de todos los valores de los
datos que se acerquen a este punto de la rejilla. (El nmero de puntos generados
es un promedio especificado por el usuario). Se construye la superficie
tridimensional usando un promedio de estos valores. Por lo tanto, el diagrama
superficial no muestra la variacin en cada punto de rejilla. Estos diagramas son
tiles en el anlisis de regresin, para ver la relacin entre una variable
dependiente y dos variables independientes.
Pudiramos pensar que una de las variables, X2, es en realidad Z, o sea la
perspectiva que da fondo de tercera dimensin a la grfica, pero considere que
sta puede ser X1 o X2 dependiendo de la perspectiva de la rotacin.
Grfico de superficie 3D
Ex Esc
10.0
10.0
2.0
0.0
10.0 0.0
Raz Ded
Raz Ind
54
Representaciones Grficas
Recuerde que la regresin mltiple asume que esta superficie es una superficie
perfectamente plana. Por lo tanto, el diagrama superficial le permite precisar
visualmente si la regresin mltiple es apropiada.
Los diagramas de superficie son muy tiles en la exploracin de los datos, sobre
todo haciendo rotar el diagrama con las opciones del programa tanto en NCSS
como en Statistica. Despus de rotar la figura en tres dimensiones el poder
explicativo del investigador se incrementa, pero desafortunadamente muchas
veces no es posible expresar la explicacin en una sola perspectiva de la figura
dentro del informe de investigacin, por lo cual se requiere seleccionar la mejor
vista.
Scatter Plot
Ex Esc
10.0
10.0
2.0
0.0
10.0 0.0
Raz Ded
Raz Ind
La siguiente grfica est elaborada con Statistica, que adems permite la rotacin
dinmica.
55
Representaciones Grficas
3D Surface Plot (BDInvestigacin de valores final 83v*980c)
AUTOCONT = Distance Weighted Least Squares
12
10
8
6
56
Representaciones Grficas
X. DIAGRAMAS DE VIOLN
Introduccin
El Diagrama de Violn, como el diagrama de cajas, es til para exhibir la media y la
distribucin de un sistema de datos. Varios diagramas de caja se pueden exhibir
en anchuras distintas para permitir que usted compare el promedio y la extensin
de varios grupos.
La densidad del trazo en el histograma es til para exhibir la distribucin de los
datos. Desafortunadamente, es difcil comparar varios rastros de densidad
mostrando anchuras. An as, se considera una tarea comn comparar las
distribuciones de varias agrupaciones de datos. Se ha inventado un nuevo
diagrama que llamamos el diagrama del violn. Este diagrama es un hbrido de la
densidad del trazo y del diagrama de cajas que permite que usted compare varias
distribuciones rpidamente.
En un diagrama de cajas los datos se mostraran de la siguiente manera:
Dr. Temstocles Muoz Lpez
57
Representaciones Grficas
Box Plot
70.0
Amount
48.3
26.7
5.0
PetalLength
Variables
Count
53.3
26.7
0.0
0.0
23.3
46.7
70.0
PetalLength
58
Representaciones Grficas
cajas levemente demostrando el punto medio como crculo, hicimos esto de modo
que las comparaciones de los puntos medios pudieran ser hechas rpidamente.
Llamamos a esto un diagrama del violn porque uno de los primeros juegos de
datos que trabajamos tena el aspecto de un violn. Usted lo encontrar as:
Violin Plot
70.0
Densidad de trazo
Quartil superior
46.7
Amount
Mediana
23.3
Quartil inferior
0.0
PetalLength
Variables
Si usted compara este diagrama con la densidad del trazo y de la caja con los
mismos datos, notar que aunque el diagrama de cajas es til en muchas
situaciones, no representan los datos que se arraciman (multimodales). Por otra
parte, aunque la densidad del trazo demuestra la distribucin de los datos, es
difcil ver la media y su dispersin. La respuesta obvia a estos defectos es
combinar los dos diagramas.
Diagrama de violn al 10% del trazo de los datos:
59
Representaciones Grficas
Violin Plot
70.0
Amount
46.7
23.3
0.0
SepalLength SepalWidth
PetalLength
PetalWidth
Variables
Amount
46.7
23.3
0.0
SepalLength SepalWidth
PetalLength
PetalWidth
Variables
60
Representaciones Grficas
Estructura de datos
El diagrama del violn se construye de una o ms variables. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categora de edad
o gnero). En este caso, un diagrama del violn se exhibe para cada grupo. No se
solicitan otros requerimientos en los datos de entrada.
XI.
CARTAS DE PARETO
Introduccin
La descripcin de la de las Grficas de Pareto un economista italiano (Vilfredo
Pareto 1848-1923), notaron una gran desigualdad en la distribucin del ingreso.
Algunas pocas personas posean la mayora del ingreso. J. M. Juran encontr que
este mismo fenmeno del vital de pocos y el trivial muchos aplicado a muchas
reas del proceso estadstico econmico. Le acreditan a l acuar los trminos de
la grfica de Pareto y anlisis de Pareto para representar este fenmeno.
En el control de calidad el anlisis de Pareto refiere la tendencia al acumulamiento
de los problemas de calidad en unas pocas fuentes posibles del total. Por lo tanto,
aislando y corrigiendo las reas problemticas principales, usted obtiene el mayor
aumento de calidad.
La grfica de Pareto es una representacin grfica que acenta el principio de
Pareto usando un grfico de barra en el cual las barras se arreglen en una
magnitud que disminuye. Los programas estadsticos proporcionan diversos
estilos de la grfica de Pareto, as como un informe numrico.
61
Representaciones Grficas
Pareto Chart of FEET
60.00
FEET
45.00
30.00
15.00
0.00
Label
Estructura de datos
La tabla 37.1 muestra los datos para la grfica antedicha de Pareto. Da el nmero
de tablero-pies defectuosos (en 100s) a partir de diez diversos aserraderos
(etiquetados A - J).
QATEST, base de Datos Pareto
aserraderos
A
B
C
D
E
F
G
H
I
J
Pies defectuosos
6
2
57
13
7
3
36
1
42
4
XII.
AGRUPAMIENTOS JERRQUICOS
Introduccin
Breve descripcin
Los algoritmos de agrupamientos jerrquicos construyen una jerarqua de racimos
que se exhiben comnmente como un diagrama de rbol llamado Dendrograma.
Dr. Temstocles Muoz Lpez
62
Representaciones Grficas
Comienzan con cada objeto (casos o variables) en un racimo separado. En cada
paso, los dos racimos que son ms similares se ensamblan en un solo racimo
nuevo. Una vez que estn fundidos los objetos nunca se separan. Los ocho
mtodos que estn disponibles representan ocho mtodos para definir la
semejanza entre los racimos.
Suponga que deseamos agrupar en racimos los datos bivariados mostrados en el
siguiente diagrama de dispersin. En este caso, el agrupamiento se puede percibir
visualmente. Los datos tienen tres racimos y dos casos aislados, 6 y 13.
Red vs Blue
16.0
Variables
6
10.7
8 10
Blue
1 3 5
12
9 11
13
5.3
141516
171819
202122
0.0
0.0
6.7
13.3
20.0
Red
63
Representaciones Grficas
Dendrogram
Row
12
11
9
10
8
7
22
21
20
19
16
18
17
15
14
6
13
5
4
2
3
1
2.00
1.50
1.00
0.50
0.00
Dissimilarity
XIII.
Introduccin
64
Representaciones Grficas
State
Nev
Vir
Price
250000.0
200000.0
150000.0
100000.0
Bedrooms
State
Nev
Vir
Price
250000.0
200000.0
150000.0
100000.0
Bedrooms
65
Representaciones Grficas
Los valores perdidos se quitan sobre la base de caso-por-caso (casewise). Es
decir, un valor que falta en una variable ignora los casos de otras variables en la
misma fila.
Estructura de datos
Cada fila de datos debe contener por lo menos una variable numrica de
respuesta. Tambin pueden ser sealadas hasta dos variables categricas y hasta
cinco variables clasificatorias. Se produce una grfica separada para cada valor
nico de las variables clasificatorias.
Lo que sigue es un ejemplo numrico de las grficas anteriores con variables
categricas y dos de una sola respuesta. Los datos de abajo dan el estado, el
precio de venta, y el nmero de los dormitorios para 150 caractersticas
residenciales vendidas durante cuatro meses en dos estados. Solamente se
muestran las primeros 8 de las 150 observaciones.
Porcin de los datos de venta de las propiedades
State
Nev
Nev
Vir
Nev
Nev
Nev
Nev
Nev
Price
260000
66900
127900
181900
262100
967500
167200
395700
Bedrooms
2
3
2
3
2
2
2
2
XIV.
Introduccin
El diagrama de rejilla (matriz) de puntos es un tipo de diagrama del contorno
convertido para exhibir tres variables. Las primeras dos variables se exhiben como
en el diagrama de dispersin en los ejes verticales y horizontales. La tercera
variable se muestra por el color del bloque o por un smbolo que es codificado de
abajo hacia arriba.
66
Representaciones Grficas
Las variantes pueden ser seleccionadas en muy distintas formas para facilitar la
lectura de los datos.
Grid Plot of PetalLength
45.0
PetalLength
A 3.9
B 11.7
C 19.4
D 27.2
E 35.0
F 42.8
G 50.6
H 58.3
I 66.1
SepalW idth
37.5
30.0
22.5
15.0
40.0
50.0
60.0
70.0
80.0
SepalLength
Estructura de datos
El diagrama de rejilla se construye a partir de tres variables. Las variables de X e
Y se muestran en los ejes horizontales y verticales, respectivamente. Se reparte
en ellos la variable Z y sus valores son representados por el smbolo del diagrama
o el color del bloque (vase los ejemplos arriba). Observe que las tres variables
deben ser numricas.
Las opciones
67
Representaciones Grficas
Consulte la seccin de Opciones donde se describen las opciones disponibles en
este procedimiento.
Variable (X, Y, Z)
Cada caja especifica la variable numrica que es utilizada para construir el
diagrama. La variable de X se exhibe a lo largo del eje horizontal, la variable de Y
a lo largo del eje vertical, y se muestra la variable de Z usando las capas del
contorno.
Rebanadas (X, Y, Z)
Es el nmero de las divisiones (puntos de rejilla) a lo largo de cada eje. El nmero
de rebanadas a lo largo del eje de z es el nmero de las lneas del contorno. Se
utiliza solamente si la caja de los valores del contorno (z) se deja en blanco.
Decimales de Z
El nmero de decimales a mostrar en los nmeros de referencia de la leyenda.
Bloques
Los valores de la variable de Z se exhiben como bloques coloreados.
68
Representaciones Grficas
B
B
SepalWidth
37.5
30.0
22.5
B
C
B
C
B
C
I I
B BB
B BB
H
C
BBB B
B CC
BBB C
B
F GH
BC
G
H H
B BC
B B
G G
FG HHGH
B CB
HG
H
FG
BB BBC F FF G
FGG
F G
HFGH HH IH
B
EF FGFHF F
I
GFG G
FGGHF G
H I
F FG
F G GG
F EF H
I
F D FFG
G H
E
E
B E F
F
G
FF
E
15.0
40.0
50.0
60.0
70.0
PetalLength
A 3.9
B 11.7
C 19.4
D 27.2
E 35.0
F 42.8
G 50.6
H 58.3
I 66.1
80.0
SepalLength
69
Representaciones Grficas
Los valores de la variable de Z se exhiben como letras que tienen diversos
colores. Cada letra representa una gama de valores.
70
Representaciones Grficas
cuantificar
las
diferencias
que
revelar
el
agrupamiento
(Ej.,
ANOVA/MANOVA). Sin embargo, las tcnicas grficas (tales como los grficos
categorizados discutidos en esta seccin) ofrecen ventajas nicas que no se
pueden sustituir por ningn mtodo de cmputo por si mismo, y pueden revelar los
patrones que no pueden ser cuantificados fcilmente (Ej., las interacciones, las
71
Representaciones Grficas
excepciones, las anomalas complejas), y proporcionan las perspectivas analticas
multidimensionales, globales nicas, para explorar o "explotar" los datos.
72
Representaciones Grficas
dos vas o de multiva, donde no hay un criterio nico (Ej., Ciudad) sino dos o ms
criterios (Ej., Ciudad y poca del da) se utilizan para crear los subconjuntos. Los
grficos categorizados de dos vas se pueden pensar como " grficos de
tabulaciones cruzadas" donde cada componente grfico representa una seccin
representativa de un nivel de una variable agrupadora (Ej., Ciudad) y de un nivel
de la otra variable agrupadora (Ej., tiempo).
La adicin de este segundo factor
revela que los patrones de la tensin
que reportan en Nueva York y Chicago
son realmente diferentes cuando se
toma en consideracin la hora en que
se hizo la pregunta, mientras que el
factor Tiempo diferencia poco en
Dallas.
Grficos categorizados contra grficos de matriz. Los grficos de matriz
tambin producen las exhibiciones que contienen grficos de componentes
mltiples; sin embargo, cada uno de esos grficos de componentes se basa (o
puede basarse) en el mismo juego de casos, y los grficos se generan para todas
las combinaciones de variables a partir de una o dos listas. Los grficos
categorizados requieren una seleccin de las variables que normalmente deberan
ser seleccionadas para los grficos no-categorizados del tipo respectivo (Ej., dos
variables para un diagrama de puntos). Sin embargo, en los diagramas
categorizados tambin necesita especificar al menos una variable agrupadora (o
algunos criterios que se utilizarn para clasificar las observaciones en las
categoras) que contenga la informacin sobre calidad de miembro del grupo en
cada caso (Ej., Chicago, Dallas). Esa variable agrupadora no ser incluida en el
grfico directamente (es decir, no ser trazada) pero servir como criterio para
dividir todos los casos analizados en grficos separados. Segn lo ilustrado arriba,
un grfico ser creado para cada grupo (categora) identificado por la variable
agrupadora.
73
Representaciones Grficas
Escalamiento comn contra Escalamiento independiente. Cada grfico
individual de la categora se puede escalar segn su propia gama de los valores
(escalamiento independiente), o
como abajo, todos los grficos se
pueden escalar a una escala
comn
de
suficientemente
par
en
amplia
par
para
Mtodos de Categorizacin
Hay cinco mtodos generales de clasificacin de valores y sern repasados
brevemente en esta seccin: Modo de nmero entero, de categoras, de lmites,
de cdigos, y de subconjuntos mltiples. Observe que los mismos mtodos de
74
Representaciones Grficas
clasificacin se pueden utilizar para categorizar casos en grficos componentes y
para categorizar casos dentro de grficos componentes (Ej., en histogramas o
diagramas de la caja).
Modo de Nmero Entero. Cuando
usted utiliza el modo de nmero entero,
los valores del nmero entero de la
variable
sern
agrupadora
utilizados
seleccionada
para
definir
las
categora
(definida
por
esos
Con
este
modo
de
de
la
variable
agrupadora
75
Representaciones Grficas
que
usted
personalice
las
pueden
no
representar
76
Representaciones Grficas
condiciones que pueden implicar cualquier nmero de variables de subjuegos).
Por ejemplo, usted puede especificar seis categoras basadas en combinaciones
del gnero, de la edad, y del empleo de tres variables.
Histogramas
En general, los histogramas se utilizan para examinar distribuciones de frecuencia
de valores de las variables. Por ejemplo, las demostraciones del diagrama de la
distribucin de frecuencia en que los valores, o los rangos especficos de valores
de la variable examinada son los ms frecuentes, qu tan diferentes son los
valores, si la mayora de las observaciones estn concentradas alrededor de la
media, si la distribucin es simtrica o sesgada, si es multimodal (es decir, si tiene
dos o ms picos) o unimodal, etc. Los histogramas son tambin tiles para evaluar
la semejanza de una distribucin observada con distribuciones tericas o
previstas.
Los histogramas categorizados permiten ser analizados por una o ms variables
categricas, o por cualquiera de uno o ms sistemas de reglas de clasificacin
lgica (vase los mtodos de la clasificacin). Hay dos razones importantes por
las que son de inters las distribuciones de frecuencia.
Uno puede aprender sobre la naturaleza de la variable examinada a partir de
la forma de distribucin (Ej., una distribucin bimodal puede sugerir que la
muestra no sea homognea, y no consista de las observaciones que
pertenecen a dos poblaciones que se distribuyen
ms o menos
normalmente).
Mucha de la estadstica se basa en asunciones sobre las distribuciones de las
variables analizadas; y los histogramas lo ayudan a uno a probar si esas
asunciones estn resueltas. A menudo, el primer paso en el anlisis de un
nuevo subjuego es analizar todas las variables con histogramas.
77
Representaciones Grficas
Histogramas contra rompimientos analticos. Los histogramas categorizados
proporcionan la informacin similar a los rompimientos analticos (Ej., medio, punto
medio, mnimo, mximo, diferenciacin de valores, etc.; vea el captulo de
Estadstica Bsica y Tablas). Aunque la estadstica descriptiva (numrica)
especfica es ms fcil de leer dentro una tabla, la forma total y las caractersticas
descriptivas globales de una distribucin son mucho ms fciles de examinar en
un grfico. Por otra parte, el grfico proporciona la informacin cualitativa sobre la
distribucin que no se puede representar completamente por un solo ndice. Por
ejemplo, la distribucin sesgada total del ingreso puede indicar que la mayora de
gente tiene un ingreso que sea mucho ms cercano al mnimo que al mximo del
rango del ingreso. Por otra parte, cuando es analizado por gnero y el fondo
tnico, esta caracterstica de la distribucin de ingresos se puede encontrar ms
pronunciada en ciertos subgrupos.
Aunque esta informacin ser contenida en el ndice de oblicuidad (para cada
subgrupo), cuando est presentado en la forma grfica de un histograma, la
informacin generalmente se reconoce y se recuerda ms fcilmente. El
histograma puede tambin revelar el "impacto" y ello puede representar hechos
importantes sobre la estratificacin social especfica de la poblacin, o de las
anomalas investigadas en la distribucin del ingreso en un grupo particular,
causadas por una reforma fiscal reciente.
Histogramas y diagramas de puntos categorizados. Un uso til de los mtodos
de la clasificacin para las variables continuas es representar las relaciones
simultneas entre tres variables. Se muestra abajo un diagrama de puntos para la
carga 1 de dos variables y la carga 2.
78
Representaciones Grficas
Ahora suponga que usted quisiera agregar una tercera variable (salida) y examinar
cmo esta se distribuye en diferentes niveles de la distribucin comn de la carga
1 y de la carga 2. El grfico siguiente ser producido:
de
salida.
Observe
que
el
"cuadro"
(paralelogramo)
incluye
79
Representaciones Grficas
aproximadamente las mismas observaciones (casos) de ambos grficos
mostrados arriba.
Diagramas de puntos
En general, se utilizan dos diagramas de puntos bidimensionales para visualizar
las relaciones entre dos variables X e Y (Ej., peso y altura). En diagramas de
puntos los puntos de referencias individuales son representados por los puntos
marcados en el espacio bidimensional, donde los ejes representan las variables.
Las dos coordenadas (X e Y) que determinan la localizacin de cada punto
corresponden a sus valores especficos en las dos variables. Si las dos variables
estn fuertemente relacionadas, entonces los puntos de referencias toman una
forma sistemtica (Ej., una lnea recta o una curva clara). Si las variables no estn
relacionadas, entonces los puntos forman una "nube" redondeada.
La opcin categorizada del diagrama de puntos permite que usted produzca los
diagramas de puntos categorizados por una o ms variables. Va el mtodo de
mltiples subjuegos (vase los mtodos de la clasificacin), usted puede tambin
categorizar el diagrama de puntos basado en las condiciones lgicas de la
seleccin que definen cada categora o grupo de observaciones.
Los diagramas de puntos categorizados ofrecen una tcnica exploratoria y
analtica de gran alcance para investigar relaciones entre dos o ms variables
dentro de diferentes subgrupos.
Homogeneidad de las distribuciones bivariantes (formas de relaciones). El
diagrama de puntos se utiliza tpicamente para identificar la naturaleza de
relaciones entre dos variables (Ej., la presin arterial y colesterol), porque pueden
proporcionar mucho ms informacin que un coeficiente de correlacin.
Por ejemplo, una carencia de la homogeneidad en la muestra de la cual era
calculada una correlacin, puede predisponer el valor de la correlacin. Imagine
un caso donde un coeficiente de correlacin se calcula de los puntos de
referencias que vienen a partir de dos diferentes grupos experimentales, pero este
Dr. Temstocles Muoz Lpez
80
Representaciones Grficas
hecho
fue
ignorado
cuando
la
81
Representaciones Grficas
fciles o automticas a utilizar para medir relaciones curvilneas entre las
variables: El coeficiente estndar de Pearson r mide por si mismo relaciones
lineares, pero algunas correlaciones no paramtricas tales como la r de Spearman
pueden medir relaciones curvilneas, pero no las relaciones no-montonas. El
examinar diagramas de puntos permite que uno identifique la forma de las
relaciones, para poder elegir ms adelante una transformacin apropiada de los
datos al "enderezar" los datos o elegir una ecuacin no lineal apropiada de la
estimacin a que se ajustar.
Para ms informacin, vea los captulos en estadstica bsica, no paramtrica, las
distribuciones, la regresin mltiple, y la valoracin no lineal en Statistica.
Grficos de Probabilidad
Hay tres tipos de diagramas categorizados de probabilidad, Normales, MitadNormales, y Tendenciales. Los diagramas normales de probabilidad proporcionan
una manera rpida de examinar visualmente en qu medida el patrn de datos
sigue una distribucin normal.
Uno puede examinar, va diagramas categorizados de probabilidad, cmo la
distribucin de una variable sigue de cerca la distribucin normal en diferentes
subgrupos.
82
Representaciones Grficas
Los diagramas normales categorizados de probabilidad proporcionan una
herramienta eficiente para examinar el aspecto de la normalidad en la
homogeneidad del grupo.
Diagramas Quantil-Quantil
El diagrama categorizado de Quantil-Quantil (o Q-Q) es til para encontrar la
distribucin ms apropiada dentro de una familia de distribuciones.
Con los diagramas categorizados de Q-Q, se produce una serie de diagramas del
Quantil-Quantil (o Q-Q) para cada categora de los casos identificados por las
Dr. Temstocles Muoz Lpez
83
Representaciones Grficas
variables de la categora de X o de X y de Y (o identificados por los criterios
mltiples del subconjunto, vea los mtodos de la clasificacin). Los ejemplos de
las distribuciones que se utilizan para los diagramas de Q-Q son la Distribucin
Exponencial, las Distribuciones Extremas, Normal, de Rayleigh, Beta, Gammas,
de Log normal, y de Weibull.
Diagramas Probabilidad-Probabilidad
El diagrama categorizado de Probabilidad-Probabilidad (o los P-P) es til para
precisar que tan bien est ajustada
una distribucin terica especfica
de los datos observados. Este tipo
de grfico incluye una serie de
diagramas
de
la
Probabilidad-
categora
de
los
casos
84
Representaciones Grficas
lnea diagonal, los datos pueden necesitar ser transformados despus para
ajustados al patrn deseado de la distribucin).
Diagramas de Lnea
En los diagramas de lneas los puntos
de
referencias
individuales
son
un
Diagramas de Caja
En los diagramas de la caja (trmino primero usado por Tukey, 1970), los rangos
de valores de una variable seleccionada (o las variables) se trazan por separado
para los grupos de casos definidos con valores de hasta tres variables
(agrupadoras) categricas, o segn lo definido por las categoras de Subjuegos
Mltiples.
La tendencia central (Ej.,
mediana o media), y la del
rango
la
variacin
estndar,
o
85
Representaciones Grficas
desviaciones estndar) se computa para cada grupo de casos, y los valores
seleccionados se presentan en uno de cinco estilos (filamentos truncados de la
caja, filamentos truncados, cajas, columnas, o cierre Alto-Bajo). Los puntos de
referencia del afloramiento pueden tambin ser trazados (vase las secciones en
casos atpicos y extremos).
Por ejemplo, en el grfico siguiente, los casos atpicos extremos (en este caso, los
puntos mayores o menos de 1.5 veces el rango interquartil) indican
particularmente un "desafortunado" extremo en una combinacin que sera de otra
manera casi perfecta de factores:
Sin embargo, en el grfico siguiente, no hay casos atpicos o valores extremos
evidentes.
Hay dos usos comunes para los diagramas de caja: (a) demostrar rangos de los
valores para los tems, los casos o las muestras individuales (Ej., un diagrama
tpico de MIN-MAX para las existencias o los productos o los diagramas de datos
agregados con los rangos), y (b) demostrando la variacin de conteos en grupos o
muestras individuales (Ej., la caja y el filamento truncado presentan la mediana
para cada muestra como un punto dentro de la caja, los errores estndar en la
86
Representaciones Grficas
caja, y las desviaciones estndar alrededor de la mediana como una caja ms
estrecha, o un par de "filamentos truncados").
La caja, al mostrar la variacin de conteos permite que uno evale rpidamente e
"intuitivamente con imaginacin" la fuerza de la relacin entre la variable
agrupadora y la variable dependiente. Especficamente, si se asume que la
variable dependiente est distribuida normalmente, y sabiendo qu proporcin de
observaciones baja, por ejemplo, dentro de desviaciones estndar 1 o 2 de la
media (vase los conceptos elementales), uno puede evaluar fcilmente los
resultados de un experimento y decir que, por ejemplo, las conteos en el cerca de
95% de casos en el grupo experimental 1 pertenecen a una diversa gama que
conteos en cerca del 95% de los casos en el grupo 2.
Adems, pueden ser trazadas las Medias Truncadas supuestas (este trmino
primero fue utilizado por Tukey, 1962) excluyendo un porcentaje especificado de
casos de los extremos (es decir, las colas) de la distribucin de casos.
Grficas de Pastel
La grfica de pastel es uno de los formatos ms comunes usados para representar
proporciones o valores de variables. Este permite que usted produzca las grficas
de pastel analizadas por una o ms variables (Ej., agrupando variables tales como
gnero) o categorizadas segn algunas condiciones lgicas de seleccin que
identifiquen subconjuntos mltiples (vase los mtodos de la clasificacin).
Para
los
propsitos
de
esta
87
Representaciones Grficas
pastel de frecuencias) interpreta los datos como un histograma. Categoriza todos
los valores de la variable que sigue la tcnica de la clasificacin seleccionada, y
despus exhibe las frecuencias relativas como rebanadas de pastel de tamaos
proporcionales. As, ofrecen un mtodo alternativo para exhibir datos del
histograma de frecuencias (vase la seccin en histogramas categorizados).
Pastel-Diagramas de puntos. Otro uso til de las grficas de pastel
categorizadas es representar la distribucin de las frecuencias relativas de una
variable en cada "ubicacin" de la distribucin comn de otras dos variables. Aqu
est un ejemplo:
Observe
que
los
pasteles
estn
88
Representaciones Grficas
Diagramas 3D
Este tipo de grfico permite
que
usted
diagramas
produzca
de
los
puntos
3D
(diagramas
espaciales,
diagramas
espectrales,
diagramas de desviacin, y
diagramas de trazo), trazos de
contorno,
superficie,
subconjuntos
diagramas
para
de
de
los
casos
89
Representaciones Grficas
diagrama son facilitar comparaciones entre grupos o las categoras, con respecto
a las relaciones entre tres o ms variables.
Usos. En general, los grficos de
3D en los ejes XYZ resumen las
relaciones interactivas entre tres
variables. Las diversas maneras en
las cuales los datos pueden ser
categorizados
(en
un
grfico
esas
relaciones
90
Representaciones Grficas
Diagramas Ternarios
Un diagrama ternario categorizado se puede utilizar para examinar las relaciones
entre tres o ms dimensiones, donde tres de esas dimensiones representan
componentes de una mezcla (es decir, las relaciones entre ellos se obligan de tal
forma que los valores de las tres variables agreguen la misma constante para
cada caso) para cada nivel de una variable agrupadora.
91
Representaciones Grficas
En diagramas ternarios, los sistemas coordinados triangulares se utilizan para
trazar cuatro (o ms) variables (los componentes X, Y, y Z, y las respuestas V1,
V2, etc.) en dos dimensiones (diagramas de puntos o contornos ternarios), o tres
dimensiones (diagramas ternarios de superficie). Para producir grficos ternarios,
se obliga a las proporciones relativas de cada componente dentro de cada caso a
que se ajusten hasta el mismo valor (Ej., 1).
En
un
diagrama
ternario
categorizado, se produce un
grfico componente para cada
nivel
de
la
variable
datos
definido
por
el
entre
los
92
Representaciones Grficas
de datos grficos por cepillando, un mtodo interactivo que permite que uno
seleccione, en la presentacin en pantalla, los puntos de referencia o los
subconjuntos especficos de datos, y que identifique sus caractersticas (Ej.,
comunes), o que examine sus efectos sobre relaciones entre las variables
relevantes (Ej., en matrices del diagrama de puntos), o que identifique casos
atpicos (outliers).
Esas relaciones entre las variables se pueden visualizar por las funciones
ajustadas (Ej., por las lneas 2Ds o las superficies 3D) y sus intervalos de
confianza, as, por ejemplo, uno puede examinar cambios en esas funciones
recprocamente (temporalmente) quitando o agregando subconjuntos especficos
de datos. Por ejemplo, uno de muchos usos de la tcnica de cepillado debe
seleccionar, destacando, en un diagrama de matriz de puntos, todos los puntos de
referencia que pertenezcan a cierta categora (Ej., un nivel "medio" de ingresos,
observe el subconjunto del componente superior derecho, destacado en el grfico
de la ilustracin de abajo):
Para examinar cmo esas
observaciones
especficas
subjuego
(Ej.,
la
en
el
ejemplo
actual).
Si la facilidad de cepillado
soporta
las
caractersticas
93
Representaciones Grficas
dinmica de la contribucin de la variable de criterio y las relaciones entre otras
variables relevantes en el mismo subjuego.
superficies
las
Esta
tcnica
es
de
94
Representaciones Grficas
relativamente poca ayuda si est aplicada a un patrn simple de datos
categorizados (tales como el histograma que fue mostrado arriba).
95
Representaciones Grficas
grficos
pequeos
del
representan
ms
margen
imgenes
comprimidas vertical y
horizontalmente
del
grfico principal.
En los grficos 2D la
compresin de capas es
una tcnica exploratoria del anlisis de datos que puede facilitar la identificacin
de tendencias y de patrones, de otra manera cubiertos en subjuegos de 2
dimensiones. Por ejemplo, en la ilustracin siguiente, (basado en un ejemplo
discutido por Cleveland, 1993), puede ser visto que el nmero de manchas solares
en cada ciclo se decae ms lentamente que cuando se levanta en el inicio de cada
ciclo. Esta tendencia no es fcilmente evidente al examinar el diagrama de lneas
estndar; sin embargo, el grfico comprimido revela el patrn ocultado.
96
Representaciones Grficas
Con respecto a los diagramas superficiales, pueden ser menos eficaces para
visualizar rpidamente la forma completa de las estructuras de datos 3D,
97
Representaciones Grficas
98
Representaciones Grficas
las dimensiones especficas de los objetos (generalmente un caso = un objeto). La
asignacin es tal que el aspecto total del objeto cambia en funcin de la
configuracin de los valores.
As, los objetos dan "identidades" visuales
nicas para las configuraciones de valores, y
eso se puede identificar por el observador.
Examinar tales conos puede ayudar a descubrir
los racimos (clusters) especficos de ambas
relaciones simples y las interacciones entre las
variables.
99
Representaciones Grficas
3. Si se encuentran algunas regularidades, intente identificarlas en trminos de las
variables especficas implicadas.
4. Reasigne las variables a las caractersticas de los conos (o seleccione uno de
los diagramas secuenciales del cono) para verificar la estructura identificada de
las relaciones (Ej., intente mover juntos los aspectos relacionados del cono ms
cercano para facilitar otras comparaciones). En algunos casos, en el final de esta
fase se recomienda sacar las variables que no parecen contribuir al patrn
identificado.
5. Finalmente, utilice un mtodo cuantitativo (tal como un mtodo de la regresin,
una valoracin no lineal, un anlisis de funcin discriminante, o un anlisis de
racimos) a la prueba, y cuantifique el patrn identificado o por lo menos algunos
aspectos del patrn.
total
del
cono
puede
100
Representaciones Grficas
Para traducir tales patrones globales en modelos especficos (en trminos de
relaciones entre las variables) o verificar las observaciones especficas sobre el
patrn, es provechoso cambiar a uno de los diagramas secuenciales de cono que
se puedan probar de forma ms eficiente cuando uno sabe qu buscar.
conos
secuenciales.
Los
individuales
son
secuencia
pequeos
(de
diferentes tipos).
Los valores de variables consecutivas son representados en los diagramas por
distancias entre la base del cono y los puntos de ruptura consecutivos de la
secuencia (Ej., la altura de las columnas mostradas arriba). Esos diagramas
pueden ser menos eficientes como herramienta para la fase exploratoria inicial del
anlisis del cono, porque los conos pueden ver similares. Sin embargo, segn lo
mencionado antes, pueden ser provechosos en la fase en que se ha revelado ya
un cierto patrn hipottico y uno necesita verificarlo o articularlo en trminos de
relaciones entre las variables individuales.
conos de Pastel. Los diagramas de
cono de pastel caen en parte entre las
dos
categoras anteriores;
todos
los
101
Representaciones Grficas
Desde un punto de vista funcional, pertenecen ms al tipo secuencial que a la
categora circular, aunque pueden ser utilizados para ambos usos.
Caras de Chernoff. Este tipo de cono es una categora por s mismo. Los casos
son visualizados por las caras del diagrama esquemtico, de tale forma que los
valores relativos de las variables seleccionadas son representados por variaciones
de caractersticas faciales especficas.
Debido a sus caractersticas nicas, es
considerado por algunos investigadores
como
la
ltima
tcnica
exploratoria
variables,
que
no
se
pueden
Estandardizacin de valores
A excepcin de casos inusuales, cuando usted se propone que los conos reflejen
las diferencias globales en rangos de valores entre las variables seleccionadas,
los valores de las variables se deben estandardizar en la escala para asegurar la
compatibilidad de rangos del valor dentro del cono. Por ejemplo, porque los
valores del juego de datos son ms grandes que el punto de referencia global del
escalamiento para los conos, entonces, si hay variables que estn en una gama
de orden mucho ms pequea, pueden no aparecer en el cono, Ej., en un
diagrama de estrella, los rayos que los representan sern demasiado cortos para
ser visibles.
Aplicaciones
102
Representaciones Grficas
Los diagramas de cono son generalmente aplicables (1) a las situaciones donde
uno desea encontrar patrones o racimos sistemticos de observaciones, y (2)
cuando uno desea explorar posibles relaciones complejas entre varias variables.
El primer tipo de uso es similar al anlisis de racimos, es decir, puede ser utilizado
para clasificar observaciones.
Por ejemplo, suponga que usted estudi las personalidades de artistas, y registr
los puntajes para varios artistas en un nmero de cuestionarios de la personalidad.
El diagrama puede ayudarle a precisar si hay racimos naturales de los artistas
distinguidos por los patrones particulares de conteos en diferentes cuestionarios
(Ej.,
usted
puede
encontrar
que
algunos
artistas
son
muy
creativos,
Grficas Relacionales
103
Representaciones Grficas
Los diagramas de matriz visualizan relaciones entre las variables a partir de una o
dos listas. Si el software permite que usted marque subconjuntos seleccionados,
los diagramas de matriz pueden proporcionar la informacin similar en diagramas
de cono.
Si el software permite que usted cree, y que identifique subconjuntos definidos por
el usuario en diagramas de puntos, los diagramas de puntos 2D simples se
pueden utilizar para explorar las relaciones entre dos variables; asimismo, al
explorar las relaciones entre tres variables, los diagramas de puntos 3D
proporcionan una alternativa a los diagramas de cono.
104
Representaciones Grficas
Para ms informacin vea las caras de Chernoff en taxonoma de los diagramas
de cono.
Estrellas. Los conos de estrellas son un tipo circular de diagrama de cono. Una
estrella separada se traza para cada caso como cono; los valores relativos de las
variables seleccionadas en cada caso son representados (a la derecha,
comenzando en las 12:00) por la longitud de rayos individuales en cada estrella.
Los extremos de los rayos son conectados por una lnea.
Rayos de Sol. Los conos de rayos de sol son un tipo circular de diagrama
separado para cada caso, cada rayo representa una de las variables
seleccionadas (hacia la derecha, comenzando en las 12:00), y la longitud del rayo
representa el valor relativo de la variable respectiva. Los valores de los datos de
las variables para cada caso son conectados por una lnea.
105
Representaciones Grficas
Polgonos. Los conos de polgono son un tipo circular que se traza para cada
caso, y los valores relativos de las variables seleccionadas en cada caso son
representados por la distancia del centro del cono a las esquinas consecutivas del
polgono (a la derecha, comenzando en las 12:00).
Pasteles. Los conos de pastel son un tipo circular de diagrama donde los valores
de los datos para cada caso se trazan como grfica de pastel (a la derecha,
comenzando en las 12:00); los valores relativos de variables seleccionadas son
representados por el tamao de las rebanadas del Pastel.
106
Representaciones Grficas
Columnas. Los conos de columnas son un tipo secuencial del diagrama que se
traza para cada caso; los valores relativos de las variables seleccionadas por caso
son representados por la altura de columnas consecutivas.
107
Representaciones Grficas
Un grfico de lnea individual se traza para cada caso, y los valores relativos de
las variables seleccionadas para cada caso son representados por la altura de los
puntos consecutivos de la lnea, sobre la lnea de fondo.
Perfiles. Los conos de perfil son un tipo secuencial de diagrama de conos. Un
grfico individual del rea se traza por caso, y los valores relativos de las variables
seleccionadas para cada caso son representados por la altura de los picos
consecutivos del perfil sobre la lnea de fondo.
conos enmarcados
108
Representaciones Grficas
Si el software permite que usted especifique subconjuntos mltiples, es til
especificar los casos (sujetos) cuyos conos sern enmarcados (y los marcos
sern puestos alrededor de los conos seleccionados) en el diagrama.
109
Representaciones Grficas
Todos los casos que renan la condicin definida en el subconjunto 2 (es decir, los
casos para los cuales el valor de Iristype son iguales a la variable Virginic, y para
los cules es menor el nmero del caso de 100) tendrn un marco diferente
alrededor de los conos seleccionados.
seleccionar
casos
de
n,
110
Representaciones Grficas
aleatoriamente de los casos disponibles, y crear el diagrama basado en estos
casos por si mismo.
Observe que tales mtodos de la reduccin de subjuegos (o tamao de muestra)
dibujan con eficacia una muestra escogida al azar de los subjuegos existentes.
Obviamente, la naturaleza de tal reduccin de datos es enteramente diferente que
cuando los datos se reducen selectivamente a un subconjunto especfico o se
parten en los subgrupos basados en ciertos criterios (Ej., el gnero, la regin, o el
nivel de colesterol). Los ltimos mtodos se pueden poner en ejecucin
recprocamente (Ej., con el mtodo de cepillado animado), u otras tcnicas (Ej., los
grficos categorizados o las condiciones de seleccin de casos). Todos estos
mtodos pueden ayudar posteriormente a identificar patrones en subjuegos
grandes.
software
ofrecen
perspectivas
del
"punto
de
vista"
ms
111
Representaciones Grficas
En tanto que estas posibilidades son tiles para el anlisis de datos exploratorio
inicial, pueden ser tambin absolutamente beneficiosas en explorar el espacio
factorial (vase el Anlisis Factorial) y explorar el espacio dimensional (vase el
Escalamiento Multidimensional).
Espectrales
Trazos
Grficas 3D
Secuenciales
Contorno
Desviacin
Cajas
Espaciales
Rangos
Espectrales
Datos crudos
Contorno/Discretos
Secuencial Contorno
Superficie
Grficas Ternarias
Categorizadas
Secuencial Superficie
Ternarias Contorno/Area
Ternarias Contorno/Lneas
Grficas de Pastel
3D Ternarias
Probabilidad
Contorno/rea
Probabilidad-Probabilidad
Contorno/Lneas
Quantil-Quantil
Desviacin 3D
Rango
Espaciales 3D
Diagrama de puntos
Voronoi
Grficas 3D
Categorizadas
Diagramas de puntos
Diagramas de puntos
Secuencial/Estacas
Techniques.
Histogramas Bivariantes
Lneas
Diagramas de puntos
Graphical
Grficas 2D
Categorizadas
Probabilidad Tendencial
Probabilidad MitadNormal
Dr. Temstocles Muoz Lpez
Ternarias Diagrama de
puntos
Grficas nD/cono
Caras de Chernoff
Columnas
Lneas
Pasteles
Polgonos
Perfiles
Estrellas
Rayos de Sol
Grficas Matriciales
112
Representaciones Grficas
Grficas 3D XYZ
Contorno
Desviacin
Diagramas de puntos
Probabilidad Normal
ProbabilidadProbabilidad
Quantil-Quantil
Columnas
Lneas
Diagramas de puntos
Espaciales
113
Representaciones Grficas
APARTADO D. DIAGRAMAS
CORRELACIONALES
ASCC
XXIII. EL ANLISIS SISTMICO POR MEDIO DE
CONSTELACIONES CORRELACIONALES
INTRODUCCIN
En el trabajo educativo a veces encontramos problemas para elucidar las
relaciones entre las diferentes circunstancias que se asocian a nuestro quehacer.
Se propone esta tcnica de Anlisis Sistmico por medio de Constelaciones
Correlacionales (ASCC), donde se obtiene una configuracin o modelo del
sistema, que surge de un orden que existe en la realidad con un nivel de
aproximacin significativo estadsticamente.
La lectura de los datos es simplificada cuando se diagraman las relaciones entre
las variables, lo que permite concentrar la atencin en secuencias y
agrupamientos especficos.
Por ejemplo:
Tabla de correlacin cannica entre las variables de 13 y 14 aos. Correlaciones
significativas a p 0.01, r 0.2578, n= 99. La fila superior corresponde a los 14
aos y la primera columna a los 13.
13
14 REAFECT RMREGJU RMCONVP RMAUTIM RMSENPR RMDEBIE RMBIENO RMASERT REOPAYU REAPJUV REPADEF
REAFECT
RMREGJU
0.27
0.31
0.29
RMCOMRE
0.35
114
Representaciones Grficas
RMAUTIM
0.26
HNOCAST
0.28
REPOROB
0.28
RMSENPR
0.29
RMBIEMA
0.28
0.34
RMAYUDA
0.30
0.28
REACTIV
0.27
0.30
RESOCIA
-0.29
RMBIENO
-0.26
0.30
0.33
RMASERT
0.27
0.27
REBUECO
0.28
REPROLE
0.32
REVALYS
0.35
REINVES
0.26
REAPADR
0.29
0.29
0.36
0.32
0.34
RECAMEJ
REAPCOM
REHEREN
0.28
0.27
HAESIMP
HBUEXIG
0.34
0.26
0.32
0.31
0.27
0.30
0.26
115
Representaciones Grficas
ARESOCIA
ARMAUTIM
BRMCONVP
BRMAUTIM
BRMBIENO
ARMSENPR
AREHEREN
AREAPCOM
BREAFECT
AREINVES
BRMSENPR
AREBUECO
AREPROLE
ARMCOMRE
ARMASERT
AREVALYS
AHBUEXIG
BREOPAYU
AREACTIV
BRMREGJU
AREAPADR
ARMREGJU
BREPADEF
ARMBIEMA
ARMAYUDA
ARMBIENO
ARECAMEJ
BREAPJUV
BRMDEBIE
AHNOCAST
AREAFECT
AREPOROB
BRMASERT
AHAESIMP
116
Representaciones Grficas
La Tcnica de Anlisis Sistmico por medio de Constelaciones Correlacionales
est diseada para la toma de decisiones y se fundamenta en cuatro aspectos
bsicos: La Teora de Sistemas, la teora y el proceso de la correlacin estadstica,
el uso de sistemas de cmputo y, la sistematizacin u organizacin de los
elementos (variables) que intervienen en el fenmeno, problema u objeto de
estudio.
Ampliando los fundamentos tericos de la tcnica presentada, se puede abordar
con mayor facilidad y una comprensin ms completa su utilidad y sus posibles
aplicaciones.
El uso de los sistemas de cmputo ha hecho variar las metodologas y tcnicas de
investigacin, tanto en diversidad como en una significativa reduccin del tiempo
de ejecucin de las mismas.
Esto se hace ms patente en la aplicacin, captura y proceso de la informacin,
que permite manejar un nmero significativamente mayor de variables que en las
dcadas anteriores en forma muy rpida y altamente precisa, de tal manera que el
investigador puede ampliar considerablemente tanto el nmero de problemas
analizados como las aplicaciones estadsticas en los mismos, con diferentes,
interesantes y novedosas perspectivas.
Una de las caractersticas que se denotan con mayor nfasis en el uso del
procesamiento por cmputo, es que cada vez en mayor medida se utiliza en la
toma de decisiones.
117
Representaciones Grficas
una mayor tendencia para variar conjuntamente, mayor correlacin habr entre
ambas, pudindose llegar a una correlacin perfecta.
Desde el punto de vista de la
teora
de
sistemas,
hay
el
cambio
r = 0.85
Fertilizantes
y riego
otros
puntos
Crecimiento
del
sistema, ya que desde su punto de vista estn unidos por cohesin y covarianza.
No habr de perderse de vista que la correlacin estadstica mide el grado de
intensidad de la asociacin entre variables, y no puede hablarse de causalidad, a
menos que se tengan evidencias consistentes.
El estadstico r mide el grado de correlacin entre dos variables, as, un valor de r=
1.00 indica una correlacin positiva perfecta, un valor de -1.00 expresa una
correlacin negativa perfecta, en tanto que un valor correlacional de 0 (cero) indica
independencia total entre las variables, o falta de correlacin entre ellas. En las
ciencias sociales o en la naturaleza no suelen obtenerse correlaciones perfectas
debido al tipo de variables que se estudian y a los instrumentos de medicin que
se utilizan, pudindose encontrar correlaciones imperfectas de cinco tipos:
1
1. Altas y positivas
2. Altas y negativas
3. Nulas
Variable 1
4
5
4. Bajas y positivas
5. Bajas y negativas
Variable 2
118
Representaciones Grficas
El coeficiente de correlacin permite predecir o pronosticar una variable a partir de
los valores obtenidos en la otra. De esta forma, el coeficiente de correlacin lineal
r, es la medida de la fuerza de relacin lineal entre dos variables, la magnitud del
efecto que cualquier cambio en una variable ejerce o transmite sobre la otra en un
sentido positivo o negativo.
El conocimiento de como vara un elemento o fenmeno con otro del sistema hace
posible explicar la dinmica de una situacin o hacer predicciones, de esta
manera, con el conocimiento de la variacin conjunta (covariacin) se podra
controlar un hecho o fenmeno manipulando otro u otros elementos del sistema,
una aspiracin cientfica y tecnolgica del hombre.
De acuerdo con Spiegel, M. (1991), hay varios tipos de correlacin:
a) Correlacin no lineal. No implica que no haya correlacin, sino que esta
puede ser curvilnea.
b) Correlacin espuria. Es una correlacin sin sentido que se establece entre
dos variables evidentemente no relacionadas en la realidad.
c) Autocorrelacin. Es aquella que nos permite correlacionar valores de una
variable X en ciertos tiempos, con valores correspondientes de la misma
variable en tiempos anteriores.
d) Correlacin Mltiple. Es el grado de correlacin que se establece entre tres
o ms variables.
En suma, la correlacin mide el grado o la intensidad de asociacin o relacin
tendencial que existe entre dos o ms variables cualitativas o cuantitativas. A partir
de los cambios que se pueden producir en una variable, se pueden deducir, inducir
y predecir los cambios que sufrirn las otras variables con que se relaciona.
Las correlaciones definen la concordancia (correlacin positiva) o diferencia
(correlacin negativa) y adems permiten abordar esquemas referenciales
simples, parciales o multivariados en diferentes grados de complejidad. As,
podemos mencionar algunas cualidades de diferentes tipos de correlacin (S.E.P.
1985), como las siguientes:
119
Representaciones Grficas
a) La correlacin positiva que identifica tendencias concordantes de sentido.
b) La correlacin negativa que identifica tendencias divergentes o inversas de
sentido.
c) La correlacin rectilnea a demostrado su efectividad al referir la dimensin
espacial (longitud, latitud y profundidad) as como lo relacionado con la
previsibilidad de fenmenos de bajo riesgo y aquellos que perfilan constantes o se
los ubica en microdimensiones.
d) La correlacin curvilnea ha dado un mayor sentido interpretativo al referir
fenmenos relacionados con las dimensiones temporales, bio-psico-sociales o
personales, as como en relacin a las concepciones de relatividad, universo
curvo, previsin de fenmenos de alto riesgo, gradacin, variabilidad, ciclicidad o
macrodimensiones.
Una correlacin positiva significa que los individuos (variables, elementos o casos)
que obtienen altas calificaciones en una variable, tienden a obtener altas
calificaciones en una segunda variable segn Gonzlez Alans (1992).
De acuerdo con el mismo autor la clase de coeficiente de correlacin que se usa,
depende del tipo de escala en la cual se expresa la variable; de la naturaleza de la
distribucin fundamental segn sea continua y discreta, y de la forma lineal o no
lineal de la distribucin de las calificaciones. Expresa adems que:
El coeficiente de correlacin del producto-momento de Pearson "r", se puede
emplear con variables de intervalo o de razn.
No encontrar evidencia de una relacin entre dos variables, a travs de la r de
Pearson, puede significar que las variables estn relacionadas en una forma
distinta de la relacin lineal.
120
Representaciones Grficas
La suposicin de que existe una relacin lineal, es la justificacin ms
importante para el empleo de la r de Pearson cuando se quiere obtener una
medida de la relacin entre variables.
Mientras que las relaciones sean unimodales y relativamente simtricas, el
clculo de la r de Pearson puede considerarse legtimo.
El coeficiente de correlacin por rangos de Spearman, se emplea con datos
de variables ordinales de pares comparados.
Antes de aplicar la correlacin de Spearman, ambas escalas deben
expresarse en rangos.
Aunque se pueda obtener la r de Pearson con datos ordenados, la r de
Spearman reduce la tarea del cmputo manual para obtener la correlacin.
Cuando las series nominales son dicotmicas, se usa la correlacin
tetracrica, entre otras.
Es conveniente que para poder leer los resultados estadsticamente, se contemple
cuando menos la siguiente clasificacin de relaciones de acuerdo a S.E.P. (Op.
Cit.):
1. Contingente: Fortuita
2. Casual: Al azar o aleatoria.
3. Causal: Determinacin univariable.
4. Concomitante: Dependencia de una relacin en funcin de otro factor de
incidencia.
5. Concausal.: Determinacin multivariable.
6. Condicional: Causas predisponentes, desencadenantes y determinantes; en
una funcin polivalente, diacrnica y sincrnica, en sus perspectivas
relacionales, longitudinales, transversales e integrales.
121
Representaciones Grficas
Si tenemos una poblacin o una muestra determinada, los valores de r sern
menores en tanto sta aumente en nmero, pero conservando altos valores de
significancia (ver Tabla 2), de ah que en el diseo de una configuracin de
mltiples variables interrelacionadas, se nos presente un entramado de lneas que
dificulta leer su significado.
A veces es conveniente, sobre todo en sta tcnica, separar la poblacin en
subpoblaciones por criterios de gnero, procedencia (rural o urbana), continuacin
de estudios (contra desercin) u otras variables nominales que se deriven de sus
propios atributos naturales.
Los mtodos estadsticos que generalmente culminaban con medidas de
tendencia central o dispersin, o con los histogramas representativos de la
informacin recabada, ahora pueden ser llevados con una gran facilidad a las
aplicaciones no paramtricas y anlisis multivariados con auxilio del cmputo
estadstico.
Esto ha impactado de manera relevante a las ciencias de la educacin, forzando a
los investigadores a introducirse en los beneficios tecnolgicos que representan
los tratamientos cuantitativos para el manejo preciso de grandes volumenes de
informacin. En esta tcnica, que tiene carcter exploratorio, se pretende
precisamente mejorar la calidad de las decisiones tomadas en la educacin con el
auxilio de la estadstica y del cmputo, ampliando el acceso de usuarios a estos
beneficios tecnolgicos.
122
Representaciones Grficas
tcnica se fue refinando progresivamente y clarificando su uso para observar el
logro de los objetivos institucionales, y en las perspectivas de la investigacin y
evaluacin continua en las escuelas, as como en otras aplicaciones derivadas
hacia otros campos de la administracin.
Por otra parte, se encontr que la tcnica de ASCC podra servir para explicitar el
proceso educativo en el aula, arrojando informacin til para la toma de decisiones
y la previsin y control de las variables, llevndolas a un proceso de desarrollo y
prueba en situaciones contingentes, dentro de un amplio espectro de condiciones
educacionales.
La necesidad de depurar y precisar la tcnica para facilitar la toma de decisiones,
tanto de la organizacin escolar como de la prctica educativa, llev al autor a
usarla en situaciones diversas (Romero Dvila. A. 1992 y Muoz Lpez, T. 1991),
adems de aplicarla en su tesis doctoral (Muoz Lpez, T. 1997).
Aqu se entienden las Constelaciones Correlacionales como diagramas o
configuraciones desarrollados para modelar o denotar la estructura de un sistema
mediante la aplicacin y desarrollo del anlisis de la correlacin estadstica.
Precisando, a partir de la correlacin tratada con programas de cmputo, se puede
configurar la estructura fundamental del sistema u orden que existe en la realidad,
adems de elucidar la relacin de las variables o elementos que lo constituyen en
una constelacin de condicionalidad mltiple.
Sin dejar de lado el punto de vista esttico, usted obtendr representaciones
grficas elegantes y explicativas en las presentaciones de carcter ejecutivo y con
el personal a su cargo, adems de garantizar resultados ms consistentes en las
propuestas que se deriven del anlisis de las estructuras modeladas.
Ms adelante tambin puede trabajar simulaciones con la alteracin de los valores
de alguna variable en estudio, antes de hacer los cambios en la realidad, por
ejemplo: Que sucedera si aumentamos el presupuesto destinado a la
capacitacin docente?, antes de programarlo en el gasto puede incrementar en
123
Representaciones Grficas
un, digamos 20%, los valores de su base de datos para sa variable y observar el
efecto del cambio resultante sobre la correlacin con otras variables como el
aprovechamiento escolar o el porciento de avance de los cursos.
Ello permitir decidir si aumentamos el apoyo a las variables precedentes.
Seguramente si antes no existi correlacin, ahora probablemente sea diferente,
pero es menos riesgoso simularlo en un modelo antes de hacerlo realmente.
124
Representaciones Grficas
Shore y otros (1987) estudiaron pacientes depresivos en tres culturas tribales
indias
americanas
concluyen
precisando
tres
distintas
constelaciones
125
Representaciones Grficas
plantas por Anlisis de Componentes Principales de Laura Pla (1986) y en el
Programa Integral de Investigacin Educativa de la S.E.P. (1985).
126
Representaciones Grficas
Los valores aceptables de r que se busca obtener dependen del tamao de la
muestra. A muestras ms grandes el valor de r aceptable es menor y viceversa.
Usted necesitar saber stos valores antes de leer los datos para saber cuales
son las correlaciones aceptables, para lo cual se presentan en la Tabla 2, donde
se busca el valor de r aceptable segn el nivel de probabilidad de error que haya
fijado.
Por ejemplo, si su muestra es de 127 personas o casos, y busca el valor de r
significativo a una probabilidad de error menor o igual a 0.05, buscar en la tabla
el valor de r equivalente a 125 casos (n-2 g.l.) que en ste caso es de r (mayor o
igual a 0.159 para aceptar la correlacin entre las variables como significativa.
Si en los valores de la tabla para el tamao de la muestra no est su caso, es
necesario buscar el valor adecuado en las tablas de los textos de estadstica o en
programas especializados de acuerdo al valor de probabilidad deseado y el
tamao de la muestra.
Tabla 2. Valores significativos de r para diferentes tamaos de muestras (n), representados por los
grados de libertad (g.l.). La probabilidad de error (p) aceptada es de 0.05 o 0.01.
g.l. (n2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
r con
p=0.05
0.997
0.950
0.878
0.811
0.754
0.707
0.666
0.632
0.602
0.576
0.553
0.532
0.514
0.497
0.482
0.468
0.456
0.444
0.433
0.423
0.413
r con
p=0.01
1.000
0.990
0.959
0.917
0.874
0.834
0.798
0.765
0.735
0.708
0.684
0.661
0.641
0.623
0.606
0.590
0.575
0.561
0.549
0.537
0.526
g.l. (n2)
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
125
150
200
300
400
r con
p=0.05
0.388
0.381
0.374
0.367
0.361
0.355
0.349
0.325
0.304
0.288
0.273
0.250
0.232
0.217
0.205
0.195
0.174
0.159
0.138
0.113
0.098
r con
p=0.01
0.496
0.487
0.478
0.470
0.463
0.456
0.449
0.418
0.393
0.372
0.354
0.325
0.302
0.283
0.267
0.254
0.228
0.208
0.181
0.148
0.128
127
Representaciones Grficas
22
23
0.404
0.396
0.515
0.505
500
1000
0.088
0.062
0.115
0.081
Variables correlacionadas3
4, -5, -10, 11, 12, 13, 16.
-9, 11.
-9
1, -8, 11, 12, 14, 16, 19.
-1, -6, -16.
-5, 8, -13, -17.
Sin variables correlacionadas.
-4, 6.
-2, -3.
-1, -16, -24, -27.
1, 2, 4, 12, 19.
1, 4, 11, 13 a 21. (no se grafica)
1, -6, 12, 16, 17.
4, 12.
12, 18, 20, 21.
1, 4, -5, -10, 12, 12, 19, 20.
-6, 12, 13.
12, 15, 18, 21.
4, 11, 12, 16, 18.
12, 13, 15, 16, 21.
12, 15, 18, 20.
Sin variables correlacionadas.
Al trmino del listado se pueden seleccionar las variables que tienen una relacin
espuria (por carecer de sentido o no posibles en la realidad), labor de limpieza que
nos dejar menos relaciones y por lo tanto, menos trabajo al elaborar
posteriormente el diagrama del sistema.
128
Representaciones Grficas
A partir de este punto se precisa la parte prctica de la tcnica que consiste en
denotar la estructura del sistema con las variables y sus correlaciones. Se
recomienda el uso de pizarrones blancos de acrlico con marcadores de tinta
fugaz, ya que se borran fcilmente al desplazar las variables, aunque puede
utilizar tambin hojas de rotafolio, lpiz y borrador. El proceso lleva a los siguientes
pasos:
3) Se dibujan crculos que semejan la disposicin de las horas en una cartula de
reloj (ver Figura 2), tantos crculos como variables existan y dentro de ellos se
anota el nmero de la variable (puede ponerse texto, pero ste tiene la
desventaja de ocupar demasiado espacio que en este paso puede ahorrarse).
2
1
2
2
2
3
2
0
1
9
1
8
1
7
7
1
6
8
1
5
9
1
4
1
3
1
2
11
1
0
129
Representaciones Grficas
5) Haciendo uso de la imaginacin, pensemos que las lneas son hilos mviles y
elsticos que unen las variables. Esto, en una hoja de papel o pizarrn, nos
permite desplazar fcilmente primero aquellas variables (crculo numerado)
que tengan menos relaciones (1 o 2 lneas) hacia espacios externos a la
cartula del reloj, cerca de las variables con las que se relacionan. Ser
necesario borrarlas y redibujarlas en la nueva posicin, iniciando por mover a
aquellas variables que tienen pocas lneas o relaciones (Figura 4). Repita el
proceso con otras variables.
1
22
21
20
19
18
17
16
8
15
9
10
14
13
1
0
12
11
1
2
4
1
1 que denotan las correlaciones entre las variables. Las correlaciones positivas son
Figura 3. Lneas
2
4
lneas slidas y5las negativas
0 punteadas.
8
6) Buscamos que en el diseo final no exista ninguna lnea que se sobreponga
a
1
5
otra, o sea, lneas cruzadas.
Ahora procuremos mover las variables
de los
9
crculos numerados que
tengan ms relaciones al centro de la cartula
imaginaria1 inicial en todos los casos posibles. Como se puede observar, la
longitud de
8 las lneas variar con los cambios de posicin, esto no es
importante, pero poco a poco nos llevar a que el sistema o modelo se
6
flexibilice y vaya tomando su propia configuracin.
2
2
1
2
7
1
6
1
7
Dr. Temstocles Muoz Lpez
1
3
11
130
3
Representaciones Grficas
7) El cruce de las lneas tiene que ser resuelto en su totalidad, situacin que se
complica si tenemos muestras demasiado grandes, dado que tendremos
numerosas relaciones con bajos valores correlacionales pero con un alto nivel
de significancia.
8) Ahora se puede proceder a anotar en el extremo de la lnea una punta que la
convierta en flecha, lo que indicar la posibilidad de una relacin de
condicionalidad e influencia de unas variables sobre otras. Sin perder de vista
que deseamos estructurar un sistema explicativo, el criterio que lleva implcita
la direccin de la flecha es el de temporalidad,
o sea que se presupone y se
6
tiene evidencia de la existencia
previa y la influencia de una variable (fuente de
5
la flecha), para que suceda una respuesta en otra (destino de la flecha). Si no
tiene evidencia terica o emprica 1de la temporalidad y/o de la supuesta
3 el caso especfico que estudia, evite
condicin previa de las variables para
1
indicar los direccionamientos, slo dibuje la lnea.
7
1
1
0
11
4
2
0
1
5
1
8
1
4
2
1 Dr. Temstocles 1Muoz Lpez
9
7
1
2
131
2
2
Representaciones Grficas
Dado que estamos trabajando con una correlacin entre mltiples variables,
generalmente la expresin de una de ellas est condicionada por un nmero que
puede ser muy grande de variables, y se presume por lo tanto que sobre ella no
hay
un
efecto
puro
nico.
Podemos
decir
que
esperamos
una
1
6
1
0
11
4
2
0
1
5
1
4
3
2
1 Temstocles Muoz
Dr.
1 Lpez
9
1
8
1
2
132
2
2
Representaciones Grficas
1
1
6
16
4
1
4
20
11
1
9
1
1
9
0
Figura 7. Ejemplo de correlaciones con una variable de inters en el centro.
133
Representaciones Grficas
independientes en el sistema, transcribiendo el significado de estos subconjuntos
para posteriormente leerlos como el sistema total.
En el segundo mtodo se puede tomar de los listados una variable de nuestro
inters y aisladamente, se hace incidir sobre ella a las lneas o relaciones que
guarda con otras variables, procurando hacer nfasis en sus caractersticas y
consecuencias (Figura 7). Este procedimiento es complementario del primero y de
gran importancia cuando unas pocas variables concentran muchas relaciones.
Es conveniente que identifiquemos tentativamente las variables iniciadoras
predisponentes o desencadenantes como aquellas de las que parten las lneas o
flechas, las variables mediadoras como aquellas que condicionan, reciben y
aportan efectos en otras variables en un numero aproximadamente igual. Las
variables finales caen en esa clasificacin tentativa por el hecho de solo recibir
efectos de otras variables y por lo tanto son el producto del sistema.
Es necesario que al final de la lectura de los resultados reconsidere la clasificacin
original de las variables y su pertenencia a una determinada categora o variable
compleja. En la grfica elaborada es tambin recomendable dejar anotadas las
variables aisladas (las que no resultaron correlacionadas con otras) y revisar que
no estn presentes las correlaciones espurias, sin sentido o ilgicas.
Probablemente no exista algo ms valioso que la experiencia de las personas o
investigadores que se relacionan vivencialmente con el objeto de investigacin,
siendo ellos los que pueden destacar o corregir la direccin de las relaciones y
apoyar objetivamente la lectura del sistema.
Por otra parte, si sta tcnica se aplica en investigaciones cientficas formales, no
precisamente en las operacionales y diagnsticos, evite el uso de las flechas y
explore la informacin con otros estadsticos.
134
Representaciones Grficas
Los resultados que se presentan en la lectura de las constelaciones son
enunciados que se establecen a partir de una representacin grfica de las
variables y sus relaciones. El nmero de enunciados podr ser demasiado grande
como para explicarlo a otras personas, an en condiciones ptimas de tiempo y
ambiente.
Otra forma de presentar la explicacin de los resultados es mediante la obtencin
de conclusiones que sintetizan la lectura final. Para concluir necesitamos primero
reunir los enunciados de los resultados que se refieren a un mismo tpico.
Aqu es necesario pensar que estamos reduciendo varios enunciados en otro
mayor que los contiene, de sta manera nuestra atencin se dirige a las variables
ms importantes por su nmero de relaciones significativas, o por su posicin
generadora, mediadora o receptora de influencia de las otras variables en el
sistema estudiado.
Antes de presentar los resultados le conviene verificar la validez externa de su
investigacin, lo cual quiere decir que hay seguridad de extrapolarlos a la
poblacin de la que proviene la muestra, de otra forma tendr que afirmar que sus
estimaciones son vlidas al menos para los individuos muestreados.
Si la muestra fue adecuadamente seleccionada, de tal manera que todos los
individuos o casos tuvieron la misma probabilidad de ser tomados y, si su nmero
representa la proporcin adecuada de la poblacin, seguramente podr extrapolar
con niveles aceptables de confianza que adquiri al seguir con cuidado los pasos
y las recomendaciones prescritos en la tcnica.
Consideraciones finales
La tcnica ASCC que aqu se presenta es un intento de inducir a usar la
estadstica a todos aquellos maestros, directivos escolares y departamentos
acadmicos relacionados con la toma de decisiones, que contando con equipo de
cmputo, tienen la necesidad pero no los instrumentos conceptuales para el
enfoque de mayor precisin y confiabilidad de sus problemas y soluciones.
Dr. Temstocles Muoz Lpez
135
Representaciones Grficas
Es necesario que se considere que, si bien, se presenta la posibilidad de un
tratamiento ms completo de los datos para transformarlos en informacin,
siempre ser necesario profundizar en el conocimiento de la estadstica,
especialmente en puntos relacionados con el muestreo, normalidad, medidas de
tendencia central, medidas de dispersin, teora de la correlacin, diseo de
reactivos de respuesta, escalas y medidas y, los principios fundamentales de la
logstica de la investigacin cientfica.
Si usted se interesa en los fundamentos, aplicaciones y las novedades de los
desarrollos estadsticos, es conveniente que consulte algunos textos de stas en
las ciencias naturales, sobre todo en ecologa cuantitativa, y explorando tambin
los nuevos programas de cmputo estadstico. La anterior recomendacin se debe
a que las aplicaciones matemticas en ciencias sociales para Mxico son muy
restringidas en profundidad y en nmero de casos de investigadores, en tanto que
en las ciencias naturales son prcticamente rutinas de trabajo de mayor amplitud.
Aunque en algunas tcnicas de toma de decisiones derivadas del anlisis
sistmico se plantea un objetivo despus de plantear el problema, a diferencia de
las investigaciones de otro tipo, esto se considera slo como una mencin sin
mayor profundidad, dado que el nivel operacional que se plantea aqu no lo
requiere.
La toma de decisiones se puede derivar fcilmente de la lectura de la constelacin
correlacional obtenida, sin embargo, el sistema o configuracin logrado debe ser
estudiado cuidadosamente para ver las variables que podemos manipular para
lograr los resultados deseados.
El xito y satisfaccin al obtener buenas decisiones usando sta tcnica se
incrementar progresivamente y el usuario la manejar con mayor precisin y
facilidad, sobre todo si se interesa en las lecturas adicionales que encuentre
relacionadas con el tema.
136
Representaciones Grficas
La tcnica que se presenta puede ser llevada, con los lmites de su imaginacin y
sus necesidades, a la toma de decisiones en otros campos de la administracin, la
investigacin de los fenmenos naturales, algunos casos de produccin de bienes
o estudios sociales.
Literatura de consulta
Agencia para el Desarrollo Internacional. 1971. Conferencias sobre Muestreo.
Curso suplementario para un estudio de caso sobre encuestas y censos.
Versin en espaol. Bureau of Census. U.S. Department of Commerce.
American Psychological Association. 1999. Electronic reference formats
recommended by the American Psychologycal Association. (1999,
November 19). Washington, DC. Retrieved November 3, 2000 from:
http://www.apa.org/journals/webref.html
Campbell, Stephen K. 1990. Equvocos y Falacias en la Interpretacin de
Estadsticas. Primera reimpresin. Ed. Limusa. Mxico.
Cochran, William C. 1985. Tcnicas de muestreo. Ed. CECSA. Mxico.
Colegio de postgraduados de Chapingo. 1996. Gua para autores. Agrociencia
30:4. 601-610pp.
Forns, M., T. Kirchner, y M. Torres. (1991). Principales modelos de evaluacin
psicolgica. L'estudi d'en llop Barcelona.
Garca Santos, Aguinaldo. 1990. Muestreo. Apuntes para la maestra en
Productividad de la UANE y la Maestra en Educacin de la U. A. de C.
Saltillo.
Gibaldi, Joseph, and Walter S. Achtert. MLA Handbook for Writers of Research
Papers, 3rd ed. NY: MLA, 1988
Isebrands, J.G. y T.R. Crow. 1975. Introduction to uses and interpretation of
Principal Component Analysis in Forest Biology. General technical Report.
USDA Forest Service. St. Paul, Minnesota.
Krejcie, R. V. and D. W. Morgan. 1970. Determining sample size for research
activities. Educational and Psychological Measurement. 30, 607-610 pp.
Li, Xia, and Nancy Crane. Electronic Style: A Guide to Citing Electronic
Information. Westport: Meckler, 1993.
137
Representaciones Grficas
Ludwig, John A. and James F. Reynolds. 1988. Statistical Ecology. A primer on
methods and computing. John Wiley & Sons. New York.
Mendenhall, William. 1982. Introduccin a la probabilidad y la estadstica.
Wadsworth Internacional/Iberoamrica. Belmont.
Modern Language Association (MLA on line). 2002. A Writer's Practical Guide To
MLA Documentation. http://ccc.commnet.edu/mla/practical_guide.htm.
Muoz Lpez, Temstocles. 1999. Recomendaciones para elaborar un
cuestionario de investigacin o para evaluacin en ciencias sociales.
Perfiles Ao 2, Nmero 12. Coordinacin General de Estudios de Postgrado
e Investigacin. Universidad Autnoma de Coahuila. Saltillo.
Muoz Lpez, Temstocles. 2000. Apuntes sobre muestreo. Perfiles. Ao 3,
Nmero 15. Coordinacin General de Estudios de Posgrado e
Investigacin. Universidad Autnoma de Coahuila. Saltillo. Artculo.
NCSS 2000. 1999. NCSS and PASS Trial. Users Guide. Utah.
Pla, Laura E. 1986. Anlisis multivariado: Mtodo de componentes Principales.
Monografa. Secretara General de la O.E.A. Programa Regional de
Desarrollo Cientfico y Tecnolgico. Washington.
Rojas Soriano, R. 1982. Gua para realizar Investigaciones Sociales. Textos
Universitarios. UNAM. Mxico.
Romero Dvila, Mara Antonieta. 1992. La capacitacin en el IMSS Delegacin
Coahuila, con la tcnica de Anlisis Sistmico por medio de Constelaciones
Correlacionales. Tesis de Licenciatura. Fac. de Ciencias de la Educacin y
Humanidades. U.A. de C., Saltillo.
S.E.P. Coahuila. 1985. Programa Integral de Investigacin Educativa. Saltillo.
Selltiz, C., L. S. Wrightsman y S. W. Cook. 1980. Mtodos de investigacin en las
relaciones sociales. Ediciones RIALP. Madrid.
Smith, Peter H. 1981. La movilidad poltica en el Mxico Contemporneo. In.
Lecturas de poltica Mexicana. Centro de Estudios Internacionales. El
Colegio de Mxico. Mxico.
StatSoft, Inc. (1997). STATISTICA for Windows [Computer program manual]. Tulsa,
OK: StatSoft, Inc., 2300 East 14th Street, Tulsa, OK 74104, phone: (918)
749-1119, fax: (918) 749-2217, email: info@statsoft.com, WEB:
http://www.statsoft.com
StatSoft, Inc. (2003). Electronic Textbook. Glossary.
http://www.statsoft.com/textbook/stathome.html
138
Representaciones Grficas
StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques.
http://www.statsoft.com/textbook/stathome.html
Young, Robert k. y Donald J. Veldman. 1981. Introduccin a la estadstica aplicada
a las ciencias de la conducta. 2 edicin. Ed. Trillas. Mxico.
139