Está en la página 1de 139

Diseo, Lectura y

Representacin de
Grficos

Dr. Temstocles Muoz Lpez

SERIE DIDCTICA: METODOLOGA DE


LA INVESTIGACIN
FCEyH 2004

Representaciones Grficas
UNIVERSIDAD AUTNOMA DE COAHUILA
FACULTAD DE CIENCIAS DE LA EDUCACIN Y HUMANIDADES
MAESTRA EN METODOLOGA DE LA INVESTIGACIN

DISEO, LECTURA Y REPRESENTACIN DE GRFICOS

DR. TEMSTOCLES MUOZ LPEZ


SALTILLO, COAHUILA
SEGUNDA EDICIN, AGOSTO DE 2004

Dr. Temstocles Muoz Lpez

Representaciones Grficas
DISEO, LECTURA Y REPRESENTACIN DE GRFICOS
SERIE DIDCTICA: METODOLOGA DE LA INVESTIGACIN
FACULTAD DE CIENCIAS DE LA EDUCACIN Y HUMANIDADES
EDIFICIO N UNIDAD CAMPO REDONDO
TEL. 412-91-33

ISBN:

UNIVERSIDAD AUTNOMA DE COAHUILA


BLVD. GONZLEZ LOBO Y V. CARRANZA S/N
SALTILLO, COAHUILA
C.P. 25000

UNIVERSIDAD AUTNOMA DE COAHUILA


SEGUNDA EDICIN, AGOSTO DE 2004
IMPRESO EN MXICO

Dr. Temstocles Muoz Lpez

Representaciones Grficas

CONTENIDO
El Diseo, la Lectura y la Representacin de los Grficos..................................................7
APARTADO A.

NORMAS GENERALES DE ICONOGRAFA ESTADSTICA........9

LA ICONOGRAFA ESTADSTICA Y SUS FUNCIONES ...............................................................9


Terminologa de las representaciones simblicas........................................................................................9
Normas Generales de presentacin...........................................................................................................12
Normas ticas.............................................................................................................................................19
Tipos de icongrafos como ejemplo...........................................................................................................21
Combinaciones personalizadas..................................................................................................................29

APARTADO B.
I.
II.

GENERACIN Y USO DE GRFICOS COMUNES.......................31

PRLOGO...................................................................................................................31
HISTOGRAMAS...........................................................................................................32

Introduccin...............................................................................................................................................32
La Densidad del trazo................................................................................................................................34
Estructura de datos....................................................................................................................................37
III.
GRFICAS DE PASTEL.............................................................................................38
Introduccin y Propsitos Generales.........................................................................................................38
La estructura de los datos..........................................................................................................................38
IV.
DIAGRAMA DE CAJAS............................................................................................39
Introduccin...............................................................................................................................................39
La definicin del diagrama de cajas..........................................................................................................39
La Caja.......................................................................................................................................................39
Los valores adyacentes lmites...................................................................................................................40
Los valores extremos..................................................................................................................................41
Comparaciones mltiples...........................................................................................................................41
La estructura de datos................................................................................................................................43
V. CARTAS O GRFICAS DE BARRAS...............................................................................43
Introduccin y Propsitos Generales.........................................................................................................43
La estructura de datos................................................................................................................................43
VI.
DIAGRAMAS DE PROBABILIDAD............................................................................44
Introduccin...............................................................................................................................................44
La lectura del diagrama de probabilidad..................................................................................................46
Los outliers.................................................................................................................................................47
Las colas largas.........................................................................................................................................47
La asimetra...............................................................................................................................................47
Las mesetas y los valles.............................................................................................................................48
Precauciones..............................................................................................................................................48
Los detalles tcnicos..................................................................................................................................48
La estructura de datos................................................................................................................................50
VII.
DIAGRAMA DE DISPERSIN...................................................................................50
Introduccin...............................................................................................................................................50
Estructura de datos....................................................................................................................................51
VIII. MATRIZ DE DIAGRAMAS DE DISPERSIN..............................................................52
Introduccin...............................................................................................................................................52

Dr. Temstocles Muoz Lpez

Representaciones Grficas
Estructura de los datos..............................................................................................................................53
DIAGRAMAS DE SUPERFICIE 3D............................................................................53
Introduccin...............................................................................................................................................53
La Estructura de los datos.........................................................................................................................55
Estilos del Diagrama de superficie............................................................................................................55
X. DIAGRAMAS DE VIOLN.............................................................................................57
Introduccin...............................................................................................................................................57
Los diagramas de violn.............................................................................................................................59
Estructura de datos....................................................................................................................................61
XI.
CARTAS DE PARETO...............................................................................................61
Introduccin...............................................................................................................................................61
Muestra el diagrama de una grfica de Pareto.........................................................................................62
Estructura de datos....................................................................................................................................62
XII.
AGRUPAMIENTOS JERRQUICOS............................................................................63
Introduccin...............................................................................................................................................63
XIII. LAS GRFICAS DE BARRAS DE ERROR...................................................................64
Introduccin...............................................................................................................................................65
Los valores perdidos..................................................................................................................................65
Estructura de datos....................................................................................................................................66
XIV. MATRIZ REJILLA DE PUNTOS.................................................................................66
Introduccin...............................................................................................................................................66
Estructura de datos....................................................................................................................................67
Las opciones...............................................................................................................................................67
Variable (X, Y, Z)........................................................................................................................................68
Mnimo y mximo (X, Y, Z).........................................................................................................................68
Rebanadas (X, Y, Z)....................................................................................................................................68
Decimales de Z...........................................................................................................................................68
El estilo del diagrama................................................................................................................................68
Bloques.......................................................................................................................................................68
Smbolos con un color................................................................................................................................69
Smbolos de colores mltiples....................................................................................................................69

IX.

APARTADO C.

TPICOS SELECTOS DE TCNICAS GRFICAS ANALTICAS


71

XV.

GRFICAS CATEGORIZADAS..................................................................................71
Qu son los Grficos Categorizados?.....................................................................................................72
Mtodos de Categorizacin.......................................................................................................................74
Histogramas...............................................................................................................................................77
Diagramas de puntos.................................................................................................................................80
Grficos de Probabilidad...........................................................................................................................82
Diagramas Quantil-Quantil.......................................................................................................................83
Diagramas Probabilidad-Probabilidad.....................................................................................................84
Diagramas de Lnea...................................................................................................................................85
Diagramas de Caja....................................................................................................................................86
Grficas de Pastel......................................................................................................................................88
Diagramas de puntos de datos perdidos por rango...................................................................................89
Diagramas 3D............................................................................................................................................90
Diagramas Ternarios.................................................................................................................................91
XVI. CEPILLADO............................................................................................................93
XVII.
ALISADO DE DISTRIBUCIONES BIVARIANTES....................................................94
XVIII. COMPRESIN DE CAPAS.....................................................................................96
XIX. PROYECCIONES DE JUEGOS DE DATOS 3D.............................................................97

Dr. Temstocles Muoz Lpez

Representaciones Grficas
XX.

DIAGRAMAS DE CONOS........................................................................................98
Analizando Diagramas de conos..............................................................................................................99
Taxonoma de Diagramas de conos........................................................................................................101
Estandardizacin de valores....................................................................................................................103
Aplicaciones.............................................................................................................................................103
Grficas Relacionales..............................................................................................................................104
Tipos de Grficos de conos.....................................................................................................................104
conos enmarcados...................................................................................................................................109
XXI. REDUCCIN DE DATOS.........................................................................................110
XXII.
ROTACIN DE DATOS (EN ESPACIO 3D)...........................................................111
Ligas para consultar los tipos de grficas en Statistica..........................................................................112
APARTADO D.

DIAGRAMAS CORRELACIONALES.............................................114

ASCC................................................................................................................................114
XXIII. EL ANLISIS SISTMICO POR MEDIO DE CONSTELACIONES CORRELACIONALES
114
INTRODUCCIN....................................................................................................................................114
Apuntes complementarios sobre la correlacin estadstica.....................................................................117
Descripcin de la tcnica de constelaciones correlacionales.................................................................122
Elaboracin de las constelaciones correlacionales.................................................................................129
Lectura de las constelaciones..................................................................................................................133
Las conclusiones y su validez externa......................................................................................................135
Consideraciones finales...........................................................................................................................136
LITERATURA DE CONSULTA..............................................................................................137

Dr. Temstocles Muoz Lpez

Representaciones Grficas

EL DISEO, LA LECTURA Y LA REPRESENTACIN DE


LOS GRFICOS1

En la vida del hombre la simbologa juega un papel muy importante, tanto en el


lenguaje como en la correspondencia que guardan las imgenes con una
representacin del orden social y natural en que habita.
Todo signo o smbolo encierra informacin que es evidente solamente para
quienes pertenecen a la cultura que los cre o hered. Con el desarrollo de las
civilizaciones y sus lenguajes en diferentes espacios geogrficos, cada comunidad
tnica, filosfica o cientfica resulta en una suerte de nsula que especializa sus
medios de comunicacin y su patrimonio cultural. As, la realidad, aunque puede
ser la misma para todos, es codificada e interpretada por cada comunidad
especfica, como una convencin social particular, por medio de un sistema de
smbolos.
Los signos grficos y las formas fnicas pueden variar de una lengua a otra, pero las cosas
y las imgenes de las cosas son las mismas para todas.
Aristteles: De interpretatione, 16-2-8
En su libro sobre la manipulacin de la ciencia, Pierre Thuillier (1975) indica que
Leibniz demuestra con ejemplos precisos que las lenguas difieren no solamente
desde el punto de vista fnico, sino sintctico y semntico. No reflejan solamente
la historia de los pueblos, sino que pueden condicionar la mentalidad y las
costumbres. El uso de signos est incorporado y define tanto el lenguaje de la
comunidad, como la percepcin de la realidad y el orden de la realidad misma
para sa comunidad, solamente ella y para s, lo decodifica e interpreta en un acto
significador.

Ctese como: Muoz Lpez, Temstocles. 2004. Diseo, Lectura y Representacin de Grficos.
Segunda edicin. Maestra en Metodologa de la Investigacin. Facultad de Ciencias de la
Educacin y Humanidades. Universidad Autnoma de Coahuila. Saltillo.
Dr. Temstocles Muoz Lpez

Representaciones Grficas
Todo signo en si mismo parece muerto: qu es lo que le da vida?... vive de su uso.
Wittgenstein (Investigaciones Filosficas)
Las comunidades acadmicas y profesionales tambin utilizan un sistema de
cdigos, smbolos y grafas especiales que no solo representan sus ideas, sino
que las delimitan y autoexcluyen de otras comunidades. No obstante, el
aislamiento no es total ni permanente, no son sistemas cerrados, siempre
conservan rasgos comunes entre s, que se constituyen en puentes o vasos
comunicantes que permiten su desarrollo regulado por el intercambio e
incorporacin de nuevas ideas y representaciones.
Es decir, estas comunidades aceptan que en su conjunto pertenecen a una
comunidad epistmica mayor, y que al presentar rasgos cientficos comunes,
pueden

ser

posibles

los

intercambios

conceptuales,

metodolgicos

instrumentales, que al asimilarse les propicien ventajas adaptativas dinmicas y un


mayor xito explicativo y operacional.
Las representaciones grficas siguen de hecho ste patrn, en el cual, lo que las
comunidades acadmicas consideran cientfico, por lo tanto racional, objetivo y
verdadero, en tanto es til, es incorporado por otras comunidades perifricas. Con
ello el proceso de normalizacin o normativo para representar los hechos
cientficos ha madurado conservando las especificidades y criterios de cada
disciplina en particular.

Dr. Temstocles Muoz Lpez

Representaciones Grficas

APARTADO A. NORMAS GENERALES


DE ICONOGRAFA ESTADSTICA

LA ICONOGRAFA ESTADSTICA Y SUS FUNCIONES


Existe quiz una respuesta al problema de la relacin entre el lenguaje y la realidad. El
lenguaje es, o bien un velo tejido por la costumbre entre nosotros y la realidad, y que es
necesario desgarrar, o bien una deformacin de la realidad que hace falta rectificar
inventando otros smbolos y otros instrumentos.
W. M. Urban, Language and Reality (1951)
Los graphos (in sensu lato) son transformaciones de los datos que sirven para representarlos, con la finalidad de propiciar o mejorar la comprensin de los
fenmenos que se estudian (funcin exploratoria), o para mostrar y sustentar
afirmaciones que se hacen sobre ellos (funcin explicativa). En las publicaciones
acadmicas las normas generales sobre los graphos se aplican con rigor, y la
creatividad se deja para el esfuerzo por cumplirlas.
En

el

lmite

de

la

creatividad

grfica

cientficamente

aceptable,

las

representaciones artsticas de temas acadmicos en las ilustraciones o los


carteles (posters) pueden utilizarse con fines promocionales siempre y cuando
conserven los criterios de cientificidad.

Terminologa de las representaciones simblicas


Primero es conveniente analizar la terminologa general involucrada en el uso de
las representaciones, dado que cada editorial las conceptualiza en forma distinta.
Se presentan a continuacin algunos conceptos bsicos para analizar, de acuerdo
a la Real Academia Espaola mediante la consulta en lnea en: www.rae.es:
Representacin. (Del lat. representato, -nis). f. Accin y efecto de representar. ||
Figura, imagen o idea que sustituye a la realidad. || Cosa que representa otra. ||

Dr. Temstocles Muoz Lpez

Representaciones Grficas
Psicol. Imagen o concepto en que se hace presente a la conciencia un objeto
exterior o interior. || Grfica. f. Mat. Figura con que se expresa la relacin entre
diversas magnitudes.
Grfico, ca. Grafo. m. Ling. Unidad abstracta que comprende el conjunto de
grafas de una letra. Grafo-. (Del gr. , escribir). Composicin de elementos.
Significa 'escritura'. Grafologa, grafomana. fa. (Del gr. -o, de la raz de
, escribir). elem. compos. Significa 'que escribe' o 'que describe'.
Mecangrafo, telgrafo, bolgrafo, hidrgrafo. Grfico, ca. (Del lat. graphcus, y
este del gr. ). adj. Dicho de una descripcin, de una operacin o de una
demostracin: Que se representa por medio de figuras o signos. U. t. c. s. || m.
Representacin de datos numricos por medio de una o varias lneas que hacen
visible la relacin que esos datos guardan entre s. || f. grfico (representacin
por medio de lneas)
En un diccionario mdico biolgico encontramos que Graph, segn Francisco
Corts

Gabaudan

(http://clasicas.usal.es/dicciomed/)

()

es

sustantivo: escritura, grabado.


Icono o cono. (Del fr. icne, este del ruso ikona, y este del gr. bizantino ,
-o). Signo que mantiene una relacin de semejanza con el objeto
representado.

Inform.

Representacin

grfica

esquemtica

utilizada

para

identificar funciones o programas.


La palabra "icono" en sus diversas acepciones procede del griego eikn-eiknos
(imagen), formado sobre el verbo eko (parecer) En pocas recientes se ha
usado para definir el concepto lingstico de signo de naturaleza no arbitraria que
guarda alguna semejanza con la cosa representada.
Esquema. (Del lat. schema, y este del gr. , figura). m. Representacin
grfica o simblica de cosas materiales o inmateriales. || Resumen de un escrito,
discurso, teora, etc., atendiendo solo a sus lneas o caracteres ms significativos.

Dr. Temstocles Muoz Lpez

10

Representaciones Grficas
|| Idea o concepto que alguien tiene de algo y que condiciona su comportamiento.
|| en ~. loc. adv. esquemticamente (por medio de esquemas).
Figura. (Del lat. figra). f. Forma exterior de un cuerpo por la cual se diferencia de
otro. || Cosa que representa o significa otra. || ilustracin (estampa, grabado de
un libro). || Geom. Lnea o conjunto de lneas con que se representa un objeto. ||
Geom. Espacio cerrado por lneas o superficies. ||
Ilustracin. f. Accin y efecto de ilustrar. || Estampa, grabado o dibujo que adorna
o documenta un libro. || Publicacin, comnmente peridica, con lminas y
dibujos, adems del texto que suele contener. ||.
Semntico, ca. (Del gr. , significativo) adj. Perteneciente o relativo a la
significacin de las palabras. || f. Estudio del significado de los signos lingsticos y
de sus combinaciones, desde un punto de vista sincrnico o diacrnico. V. calco
~, campo ~.
Semitica. (Del gr. ). f. semiologa (estudio de los signos en la vida
social). || Teora general de los signos.
Seal. (Del lat. signlis, de sgnum, sea). f. Marca o nota que se pone o hay en
las cosas para darlas a conocer y distinguirlas de otras. || Signo o medio que se
emplea para luego acordarse de algo. || Distintivo, marca. || Signo (cosa que
representa o sustituye a otra). || Indicio o muestra inmaterial de algo. || Sea (nota,
indicio o gesto). || Vestigio o impresin que queda de algo, por donde se viene en
conocimiento de ello. || Imagen o representacin de algo. || Prodigio o cosa
extraordinaria y fuera del orden natural. || dar ~es de algo. fr. Mostrar indicios de
su existencia. || en ~. loc. adv. En prueba, prenda o muestra de algo.
Signo. (Del lat. signum). m. Objeto, fenmeno o accin material que, por
naturaleza o convencin, representa o sustituye a otro. || Indicio, seal de algo. ||
Mat. Seal o figura que se usa en los clculos para indicar la naturaleza de las
cantidades y las operaciones que se han de ejecutar con ellas. || natural. m. El

Dr. Temstocles Muoz Lpez

11

Representaciones Grficas
que nos hace venir en conocimiento de algo por la analoga o dependencia natural
que tiene con ello.
Smbolo. (Del lat. simblum, y este del gr. oo). m. Representacin
sensorialmente perceptible de una realidad, en virtud de rasgos que se asocian
con esta por una convencin socialmente aceptada. || Ling. Tipo de abreviacin de
carcter cientfico o tcnico, constituida por signos no alfabetizables o por letras, y
que difiere de la abreviatura en carecer de punto; p. ej., N, He, km y $ por Norte,
helio, kilmetro y dlar, respectivamente. || algbrico. m. Letra o figura que
representa un nmero variable o bien cualquiera de los entes para los cuales se
ha definido la igualdad y la suma.
Sintctico, ca. (Del gr. ). adj. Gram. Perteneciente o relativo a la
sintaxis.
Sintaxis. (Del lat. syntaxis, y este del gr. , de , coordinar). f.
Gram. Parte de la gramtica que ensea a coordinar y unir las palabras para
formar las oraciones y expresar conceptos. || Inform. Conjunto de reglas que
definen las secuencias correctas de los elementos de un lenguaje de
programacin.
Tabla. (Del lat. tabla). Lista o catlogo de cosas puestas por orden sucesivo o
relacionadas entre s. || Cuadro o catlogo de nmeros de especie determinada,
dispuestos en forma adecuada para facilitar los clculos. Mat. tabla de
multiplicacin de los nmeros dgitos dispuesta en forma de cuadro.

Normas Generales de presentacin


Los Criterios
Para la elaboracin de las representaciones seguiremos cinco criterios normativos
bsicos que necesariamente deben cumplirse:

Dr. Temstocles Muoz Lpez

12

Representaciones Grficas

Importancia. Denotando lo relevante o sustantivo contra lo adjetivo de lo


que se muestra, como apoyo a los datos de la investigacin.

Pertinencia. Implica la inclusin de solamente lo necesario, importante y lo


conveniente.

Esttica. Referida a una presentacin atractiva, que invite al lector a


consultarla, buscando la proporcin entre la forma, el fondo, el ajuste de los
espacios, el tamao y la forma de las letras.

Equilibrio. Cuidando la distribucin de las concentraciones de objetos,


rtulos, espacios vacos y las anotaciones complementarias.

Simplicidad. Con los menos elementos posibles.

Los epgrafes, referencias cruzadas, fuentes y colores tienen regulaciones


tcnicas generales y especficas para cada tipo de publicacin, presentacin y
editor, los cuales son especificados en Guas para los autores que proporcionan
a cada investigador que solicita que su material sea publicado. En adelante
revisaremos los aspectos genricos.

Las Normas para la elaboracin de las representaciones


Los graphos deben ir numerados progresivamente sin anteponer la abreviatura de
nmero (i.e., Cuadro 3), a continuacin se anotar el ttulo, el cual estar escrito
en la parte superior y con letras minsculas, excepto la inicial de la primera
palabra y las iniciales de los nombres propios. El ttulo finalizar con un punto.
Los rtulos explicativos, descriptivos o de referencia del cuadro, figura, tabla,
grfico u otro tipo de representacin, con su descripcin, se denominan epgrafes.
La ubicacin del cuadro deber ser inmediatamente despus del prrafo donde se
le menciona por primera vez (anotado como referencia cruzada con solo rtulo y
nmero), siempre y cuando quepa completo; en caso de que no quepa en la

Dr. Temstocles Muoz Lpez

13

Representaciones Grficas
misma pgina donde se le menciona, se colocar al inicio de la siguiente cuartilla,
en la cual debe reanudarse el texto si an queda espacio despus del grapho,
facilitando as la lectura y el anlisis de la informacin. No es aceptable ubicar los
graphos al final de la Literatura Citada. Los graphos que en su versin final ocupen
ms de una pgina no son aceptables.
Cada variable o concepto se identifica con su nombre y unidades. Reduzca las
cifras grandes para dejar slo los dgitos significativos, de acuerdo con el nivel de
precisin con que se midi la variable. No es necesario utilizar todos los decimales
que salen del listado de la computadora, se recomiendan solamente 2.
En cada grapho solamente presente un mximo de tres lneas horizontales a todo
lo largo o (aunque puede haber varias sublneas que abarquen parte de las
columnas o conceptos): la primera lnea se coloca debajo del ttulo del grapho; la
segunda, abajo de los criterios de clasificacin principales y contiene el cuerpo de
datos; y la tercera, al final del grapho.
Despus de la ltima lnea horizontal mayor se colocan las notas de pie del
grapho, las que son de dos tipos:
a) Para indicar niveles de significancia estadstica y su simbologa de
representacin, por ejemplo (_____ =p0.05,

p0.01)

para

diferenciar los datos resultantes de tratamientos o muestras se emplean


letras minsculas (a, b, c, etc.); y
b) Para dar informacin complementaria como llamadas al ttulo, a los
encabezamientos o a los datos, se pueden emplear nmeros arbigos (a
manera de exponentes); sin embargo, si se cuenta con mquina que posea
diferentes smbolos, se recomienda utilizarlos siempre y cuando aporten
claridad a la explicacin.
En la Tabla 1 se presenta un ejemplo del formato general. Ntese que cuando se
generaliza se escribe cuadros o tablas o figuras, etc. en minsculas. Cuando se
particulariza se escribe con mayscula, seguido del nmero. Obsrvese tambin
Dr. Temstocles Muoz Lpez

14

Representaciones Grficas
que toda la informacin de este grapho est a doble espacio para que los
asesores, rbitros y editores tengan lugar suficiente para hacer sus anotaciones.
Tabla 1. Caractersticas acadmicas de grupos de alumnos integrados por sus calificaciones
en dos aos de evaluacin .
Caractersticas de aprovechamiento

Atributos medidos

Grupos de

Historia
acadmica

Calificaciones

Calificacin

Asistencia
semestral

Horas diarias
de estudio

Alumnos

promedios

Exmenes

Tareas (%)

Hrs. medidas

Hrs.
declaradas

2001
Grupo A

87

85

34.2

248

3.25

Grupo B

92

89

33.4b

145

3.00

Integracin A y B

97

96

31.0c

120

3.12

2002
Grupo A

87

86

28.5

340

3.60

Grupo B

94

92

41.3

280

3.00

Integracin A y B

99

95

35.0

150

2.00

: Promedios de tres trimestres en 2001 y cuatro en 2002.


: Se refiere al obtenido de archivos despus del diseo del estudio.
: En este ao, se concentraron manualmente los datos los primeros 20 das despus de los exmenes.
F : Promedios seguidos de la misma manera en cada ao, que no son diferentes estadsticamente, segn
Duncan (p 0.05).

Adems de los puntos anteriores, los autores tendrn especial cuidado en no


saturar su escrito con graphos de tamao reducido, cuando muchas veces en uno
se puede reunir la informacin de varios. Sin embargo, tampoco es conveniente
que se emplee un cuadro o tabla con demasiadas columnas o hileras, sobre todo
si la informacin tabulada no se utiliza en la discusin. Todas las variables
incluidas en los cuadros y figuras estarn descritas en el captulo de Materiales y
Mtodos (Metodologa), as como ledas y discutidas en el captulo de Resultados
y/o el de Discusin.

Cuadros
Los cuadros se emplean para clarificar el texto, cuando se presentan nombres o
nmeros con lectura independiente, sinttica y complementaria, o cuando su
uso constituye un ahorro importante de espacio. Son claros, simples y concisos.

Dr. Temstocles Muoz Lpez

15

Representaciones Grficas
Cada cuadro debe presentar datos en forma organizada, de manera que facilite
las comparaciones, muestre clasificaciones, se observe rpidamente algunas
relaciones y, sobre todo, se ahorre espacio del texto. Cada cuadro se explica por
s mismo y su contenido no se repite en las figuras ni en el texto del artculo,
solamente se hace referencia a l.
Solamente los cuadros y las tablas tienen el epgrafe en su parte superior. Las
dems representaciones iconogrficas lo tendrn en la parte inferior.

Tablas
Las tablas son concentrados de datos numricos ordenados matricialmente para
mostrar los listados de resultados que son la fuente de la informacin textual
analtica, presentada en forma de lectura interdependiente. Siguen las mismas
normas generales en su presentacin.

Figuras y otras representaciones grficas


Las figuras y otras representaciones como dibujos, grficas, diagramas y
fotografas tienen bsicamente las mismas normas. Su informacin, en el captulo
de Resultados, no se duplica en otras representaciones que explican lo mismo, ni
en forma de prosa en el texto.
En caso de las fotografas, deben tener un contraste adecuado para su impresin
o fotocopia de tamao postal y que claramente sealen lo que el autor desea
mostrar.
Los dibujos, grficas y diagramas deben ser presentados con toda la informacin
que permita su comprensin para un pblico amplio, en un epgrafe al pie de la
figura.
Al igual que en el caso de los cuadros, las figuras se especifican en el texto y en el
ttulo de las mismas como referencias cruzadas con mayscula inicial, como por
ejemplo Figura 1, Figura 2,... (Figuras 8 y 9), etc. Los autores deben considerar

Dr. Temstocles Muoz Lpez

16

Representaciones Grficas
que la reproduccin de figuras es conveniente hacerlas de un tamao tal que
permita mantener la nitidez en una reduccin hasta de 50% para la impresin final.
Al respecto, se sugiere un tamao de media pgina para figuras sencillas y de una
pgina para figuras complejas, con un tamao mnimo de 8 puntos para las letras
o nmeros.
En una figura lo que interesa destacar es el contenido y no los ejes.
Consecuentemente, el grosor de estos ltimos conviene que sea menor que el de
las lneas interiores. Para indicar las dimensiones de los ejes se sugiere elegir
escalas apropiadas, que destaquen lo que se desea mostrar; las leyendas de cada
eje se colocarn como se indica en la Figura 1. Observe que la figura no tiene
marco, lo que aumenta la simplicidad pero no se pierde contenido. En
consecuencia, los editores solamente se aceptan las figuras si cumplen con los
requisitos indicados por ellos.

80.00

Edades
estimadas

70.00
60.00

11
12

50.00

13

40.00

14

30.00

15

20.00

16

10.00
0.00
11

12

13

14

15

16

Edades reales

Figura 1 . Ejemplo de elementos de una figura.

Al igual que los cuadros, todas las figuras debern estar expresamente citadas en
el texto previo, en orden progresivo.

Dr. Temstocles Muoz Lpez

17

Representaciones Grficas
Nunca comience un apartado, ya sea captulo (ttulo de primer orden) o ttulo de
segundo o tercer orden con una tabla o representacin grfica.

Unidades
Las unidades a usar son las del Sistema Internacional. Se sugiere colocar entre
parntesis la equivalencia de los smbolos de cualquier otro sistema la primera
vez que se nombre una unidad, si son diferentes.
En una serie de datos con igual unidad de medicin, utilice numerales seguidos de
la forma abreviada de la unidad (sin colocar punto final ni maysculas al principio);
por ejemplo: 2, 4 y 6 ml L-1, 16, 20 y 33%; 3400, 1200 y 400 kg, 4 y 9 meses.
En cambio, si slo hay una cifra y sta es menor de 10, se escribe con palabras
(seis variables, cuatro repeticiones, ocho ambientes), a diferencia de 16 alumnos,
126 casos; sin embargo, si esa cifra va acompaada inmediatamente de alguna
unidad del sistema internacional, debe expresarse con nmero (2 mg, g -1, 6 g, 5 lt)
No empiece una frase o prrafo con un numeral. Cambie la frase o escriba la
cantidad con letras.
Cuando se trate de nmeros grandes en el texto, procure redondear la cifra y
emplear palabras como parte del nmero; as, $458,960.00 puede expresarse
como casi 460 mil pesos. Recuerde que los smbolos de las unidades de medida
no se pluralizan: kilo(s) = kg, kilmetro(s) = km, hectrea(s) = ha, metro(s) = m,
litro(s) = lt, gramo(s) = g, etc.

Frmulas
Los ndices y subndices estarn bien ubicados y legibles. Tenga especial cuidado
en diferenciar claramente los nmeros 0 y 1 de las letras O e l, respectivamente.
El tamao mnimo aceptable es de 2 mm u 8 puntos.

Dr. Temstocles Muoz Lpez

18

Representaciones Grficas
Las letras griegas, as como los smbolos que se utilizan para marcar o referir, se
explican inmediatamente despus de haberse usado por primera vez, excepto
aquellos del dominio del sistema internacional.
Para expresar fracciones use la forma lineal, con exponentes negativos para los
denominadores; ejemplo: g/cm2, kg/ha-1
Las ecuaciones que expresan las derivaciones matemticas de una frmula,
progresivas o no, sern numeradas consecutivamente entre parntesis, al lado
derecho cuando sean ms de una. En general se numeran slo aqullas
explcitamente referidas en el texto.
Se recomienda el uso de potencias fraccionarias (0.5, 0.33) en vez de races
cuadradas, cbicas, etc.
Las potencias de e se expresan mejor como exp (abreviatura de la funcin
exponencial)
En el caso de las frmulas qumicas, la carga de los iones se expresa como lo
seala el ejemplo siguiente: Ca2 y CO3, y no Ca++.
En la escritura de istopos, el nmero de masa se indica en la parte superior del
lado izquierdo del smbolo; ejemplo: 15N, 14C, etctera.

Normas ticas
Las grficas pueden ser modificadas para facilitar su lectura y magnificar los
efectos de los datos, pero tambin para crear intencionalmente impresiones falsas,
de tal forma que es conveniente que el investigador est pendiente de sus
diseos, y del impacto que las representaciones tienen en otras personas.
La siguiente grfica puede ser modificada para magnificar los efectos de los datos
y crear las impresiones que convienen a los que la elaboran. En ella se indican
dos variables que miden lo mismo y son recprocos, de tal suerte que la

Dr. Temstocles Muoz Lpez

19

Representaciones Grficas
modificacin no es en los datos, sin en la escala utilizada y las dimensiones del
grfico.

El efecto anterior, magnificado, si es preparado para una presentacin puede tener


un sentido negativo sobre la percepcin pblica de la conduccin de la poltica
econmica, en tanto que si es con fines de anlisis o exploracin de los datos
servir para apreciar con ms detalle las variaciones.

Dr. Temstocles Muoz Lpez

20

Representaciones Grficas
La tica (ethos: comportamiento) del investigador le reclama apegarse a la verdad
y a la responsabilidad que tiene con los dems usuarios de la informacin que
presenta.

Tipos de icongrafos como ejemplo

Se enfatiza que los programas estadsticos para la investigacin difieren en


la

construccin

de

grficas,

con

los

programas

comerciales

de

procesamiento de textos y de bases de datos con hojas de clculo, en que


los primeros agrupan los datos en rangos numricos (ambos ejes son
tratados como nmeros o ejes verdaderos X e Y), y los comerciales
presentan solamente la estructura que tienen las tablas de origen (un eje es
tratado como nmeros y otro como etiquetas de categoras).

Los primeros se llaman Grficos Cientficos o Tcnicos y los segundos


Grficos Secuenciales.

El anlisis preliminar de las bases de datos es altamente recomendable antes de


su procesamiento, para ello los casos atpicos u outliers se eliminan si estn ms
all de 3 sigmas, siempre y cuando exista un previo anlisis explicativo
independiente de cada uno de ellos, ya que pudieron ser introducidos por errores
de dedo en la captura o desviaciones preferenciales afectivas de los sujetos.
Para lograr detectarlos se utilizan grficos como Box Plot que los marcan.
Las representaciones de datos o dibujos descriptivos pueden clasificarse
convencionalmente y a manera de ejemplo se usa la siguiente tipologa general.

1. Matrices
Las matrices de datos usualmente no se presentan en la investigacin a menos de
que se trate de ejemplificar o mostrar con ellas algn hecho relevante que influye
en la investigacin. Las matrices son referidas como tablas de doble entrada.
El siguiente ejemplo muestra un fragmento de una base de datos:

Dr. Temstocles Muoz Lpez

21

Representaciones Grficas
Nmero
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

GEdad GCiudad Regin GGnero RMafecto REreconv Hreaucas Hregtrad Hregacua


15
Saltillo Sureste
1
1
0
2
3
5
15
Saltillo Sureste
1
9
7
0
5
8
15
Saltillo Sureste
2
10
9
10
10
9
15
Saltillo Sureste
2
10
9
10
10
8
15
Saltillo Sureste
2
8
1
5
10
10
15
Saltillo Sureste
2
9
2
5
8
9
15
Saltillo Sureste
1
9
7
5
3
5
15
Saltillo Sureste
1
10
7
8
6
7
14
Saltillo Sureste
2
10
1
5
8
9
14
Saltillo Sureste
2
9
7
5
9
9
15
Saltillo Sureste
1
9
3
8
6
8
14
Saltillo Sureste
1
7
2
1
3
7
15
Saltillo Sureste
2
10
3
6
10
7
14
Saltillo Sureste
2
8
3
4
10
9
15
Saltillo Sureste
1
8
1
7
10
9
14
Saltillo Sureste
1
10
1
3
10
7
15
Saltillo Sureste
2
10
0
1
6
5

Se consideran similares: Matrices de correlacin (generalmente presentadas como


tablas), Matrices de las bases de datos.
No todas las matrices o tablas requieren ser incluidas en la investigacin o el
informe de la misma, a menos que sea estrictamente necesario. El siguiente
ejemplo muestra una matriz de datos de correlacin que no aparecer en la
investigacin pero que tiene valor exploratorio y como lectura para los resultados.
Correlaciones cannicas de las variables de la cohorte 16 significativas a p .01 N=69 y una r 0.31
Justicia
Autocontrol
Autocontrol Autocontrol Autocontrol Autoestima
RMREGJUS RMAUTCON RMCOMRES RMAUTIMP RMPACREC RMCONLIM
HBUEXIG
0.374
0.428
0.346
0.324
HCOMPL
0.502
HCONTAUT
0.423
HINDMEJ
0.342
HNOCAST
REACTIV
0.348
0.309
REAFECTO
0.312
0.478
0.319
0.362
REAPADRE
0.359
0.331
REAPJUVE
0.449
0.316
REAPMOTR
0.338
0.503
REBUECON
0.460
0.410
0.394
0.516
0.364
0.539

Dr. Temstocles Muoz Lpez

22

Representaciones Grficas

2. Cuadros
Los cuadros son representaciones de datos importados de otros autores, donde se
concentra la informacin sistemticamente organizada y pertinente.
Ejemplo:
Las polticas de desarrollo agrcola relacionadas con los factores de la
sustentabilidad ambiental, son propuestas por Gligo (1990) de acuerdo al siguiente
cuadro:

Factores:
Coherencia ecolgica

Polticas:
Global

Especfica

Cientfica y
tecnolgica.

Investigacin de recursos naturales.


Investigacin agronmica.
reas protegidas.
reas de expansin
agrcola.

Ordenamiento
territorial.
Estabilidad Socioestructural.

Estructura de
tenencia.

Reforma agraria.
Regulacin jurdica.

Complejidad infraestructural.

Obras pblicas.

Riego y drenaje.
Obras viales.

Estabilidad econmico-financiera.

Comercializacin.
agropecuaria
Precios agrcolas.

Capacidad de compra.
Precios de productos.
Precios de insumos tecnolgicos.
Crditos subsidiados.
Subsidios para la recuperacin de los suelos
erosionados.
Subsidios para la reforestacin.

Crditos agrcolas.
Subsidios para
la recuperacin
ambiental.

Incertidumbre y
riesgo.

Financiera.

Dr. Temstocles Muoz Lpez

Fondos de rubros especficos.


Seguros.

23

Representaciones Grficas

3. Tablas para el informe de investigacin


Las tablas concentran datos con una entrada de rtulos en la parte superior, y
representan una concentracin de datos relevantes y pertinentes de lo que se
desea mostrar.
Se consideran similares: Tablas de resultados estadsticos, Tablas comparativas
de tratamientos.

4. Diagramas
Se consideran similares: Dendrogramas, Rutas, Secuencias, Correlacionales,
Constelaciones,

Dispersogramas,

Flujo,

Diacrnico,

Polietapas,

Mapas

conceptuales.

Dr. Temstocles Muoz Lpez

24

Representaciones Grficas

5. Figuras
Se consideran similares: Grficas de conos, Caras de Chernoff, conos de Pastel,
Estrellas, conos de Columnas, Rayos solares, conos de Lneas, conos
poligonales, conos de perfiles.

Dr. Temstocles Muoz Lpez

25

Representaciones Grficas

6. Grficos
Se consideran similares: Histogramas, Grficas de cajas, Grficas de puntos,
Grficas de lneas, Grficas de probabilidad, Grficas de reas, Grficas
circulares, Anillos, Grficas ternarias, Superficie, Grficas de contorno, Grficas
secuenciales.

Dr. Temstocles Muoz Lpez

26

Representaciones Grficas

Dr. Temstocles Muoz Lpez

27

Representaciones Grficas

7. Lminas
Ilustraciones coloreadas.

Dr. Temstocles Muoz Lpez

28

Representaciones Grficas

8. Mapas
Distribuciones territoriales y mentales (si as se especifica), Ubicaciones, Rutas.

Combinaciones personalizadas
Los arreglos especficos de los datos modificando los estilos predeterminados.

Diseos 2D y 3D
Solamente usuales en casos en que se requiere incluir 3 o ms variables que se
relacionan dimensionalmente. No se permiten en la mayora de las editoriales
debido a que se pierde la perspectiva de los ejes X e Y.

Ajustes personalizados
Se permiten las modificaciones predeterminadas en ejes, colores, leyendas, tablas
adjuntas, tendencias, lneas de divisin. De hecho, es deseable realizar las
modificaciones pertinentes para ganar mayor riqueza en la presentacin.

Dr. Temstocles Muoz Lpez

29

Representaciones Grficas

Simbologa
Las literales, smbolos especiales y smbolos internacionales se permiten en la
mayora de las publicaciones, con la precaucin de no saturar la representacin,
indicando su significado al pi de la grfica o en el texto previo.

Colores.
Se requiere preferentemente usar los colores blanco y negro para publicaciones y
en color para presentaciones en pantalla con fines exploratorios.

Dr. Temstocles Muoz Lpez

30

Representaciones Grficas

APARTADO B.

GENERACIN Y USO DE
GRFICOS COMUNES

I.

PRLOGO

Se ha seleccionado cuidadosamente el material de los programas NCSS y


Statistica por dos razones: primero, dado que las bases que se aprenden en ellos
para la generacin, exploracin y lectura de datos de una investigacin son
verstiles y sencillos, y en segundo lugar, porque se utiliza extensamente por los
maestros y alumnos en el desarrollo de sus investigaciones en los estudios de
Ciencias Sociales y Naturales.
Se insiste en que los programas estadsticos para la investigacin difieren de los
programas comerciales de procesamiento de textos y de bases de datos con hojas
de clculo para la construccin de grficas, en que los primeros agrupan los datos
en rangos numricos (ambos ejes son tratados como nmeros o ejes verdaderos
X e Y), y los comerciales presentan solamente la estructura que tienen las tablas
de origen (un eje es tratado como nmeros y otro como etiquetas de categoras).
Los primeros se llaman Grficos Cientficos o Tcnicos y los segundos Grficos
Secuenciales.
Evidentemente los grficos cientficos tienen mucha mayor riqueza y poder en la
presentacin y la exploracin de los datos para convertirlos en informacin
confiable. Al estudiar stos mdulos bsicos, se sigue un criterio de anlisis
didctico para favorecer el aprendizaje del uso de estadsticos por grficos.

Nmero de clases
2

La adaptacin, traduccin y ajustes que presentan los textos seleccionados en stos apuntes han
sido modificados por el autor a partir de materiales originales de NCSS (Number Cruncher
Statistical System) y Statistica, para facilitar su comprensin como material de gua.
Dr. Temstocles Muoz Lpez

31

Representaciones Grficas
Antes de comenzar con la elaboracin de grficos es conveniente conocer el
nmero de clases, segmentos o porciones en que se distribuirn grficamente los
datos. Para ello se utilizan dos procedimientos comunes:
1) Frmula de Sturges para el nmero de clases (Forns, M., T. Kirchner, y M.
Torres (1991). k=1+3.3(log n). donde
k= nmero de clases
n= tamao de la muestra
Ejemplo:
Muestra: 257
Desarrollo: Log de n = 2.41
Base 3.3+1= 4.3
k= 10
2) Regla del tanteo (http://www.cofc.edu/~milesd/freqdist.htm) k=5(log n).
donde:
k= nmero de clases
n= tamao de la muestra
Ejemplo:
Muestra: 257
Desarrollo: Log de n = 2.41
Base 5
k= 12
En ambos casos el nmero de intervalos de clase es muy similar grficamente y el
investigador requiere aplicar ambos para observar y decidir cul es el que muestra
mejor los datos.

II. HISTOGRAMAS
Introduccin
La palabra histograma viene de los griegos stos () que significa mstil,
telar, tejido, trama de filamentos, y gram () a, que significa letra,
trazo, signo, esquema o grfico. Por la definicin directa de histograma se toma
grfico de tramas o postes. (Histograma. De histo- y -grama. 1. m. Estad.
Representacin grfica de una distribucin de frecuencias por medio de
Dr. Temstocles Muoz Lpez

32

Representaciones Grficas
rectngulos, cuyas anchuras representan intervalos de la clasificacin y cuyas
alturas representan las correspondientes frecuencias. Real Academia Espaola:
www.rae.es)
Histogram

Quizs esta palabra fue elegida

40.0

porque un histograma parece


una trama o un conjunto de
que

estn

alineados

juntos. Un histograma se utiliza


para exhibir la distribucin de los

26.7

Count

postes

13.3

valores de los datos a lo largo del


nmero de la lnea verdadera.
Compite con el diagrama de

0.0
40.0

53.3

66.7

80.0

SepalLength

probabilidad como mtodo de anlisis grfico de la normalidad.


A veces no se puede comprender un conjunto grande de observaciones
leyndolas directamente. Para realizar la lectura de los nmeros, usted debe
resumirlos, clasificando, agrupando, y obteniendo un promedio de ellos. Un
mtodo de hacer esto es construir una distribucin de frecuencias. Esto implica el
dividir el rango de los datos en algunos intervalos (generalmente iguales). El
nmero de las observaciones que se agrupan en cada intervalo se cuenta
grficamente. Esto da una distribucin de frecuencias. El histograma es un grfico
de distribucin de las frecuencias en el cual el eje vertical (y) representa la cuenta
(frecuencia) y el eje horizontal (x) representa el rango posible de los valores de los
datos.
Observe en el siguiente ejemplo de Statistica cmo se incluyen los rangos de los
intervalos y los detalles tcnicos de la grfica. Todas las especificaciones de la
grfica pueden ser editadas desde el programa antes de que la pueda incluir en su
informe de investigacin. Para editar algn aspecto especial en ese programa
haga clic con el botn derecho del ratn y selecciones options o layout.
Observe que entre parntesis se incluyen los intervalos de clase.

Dr. Temstocles Muoz Lpez

33

Representaciones Grficas
Histogram (EJERMETI.STA 12v*25c)
y = 25 * 5 * normal (x, 49.2, 13.31665)
6

No of obs

<= 25

(25,30]

(30,35]

(35,40]

(40,45]

(45,50]

(50,55]

(55,60]

(60,65]

(65,70]

(70,75]

> 75

POTENCIA

La Densidad del trazo


El histograma se utiliza extensamente y necesita poca explicacin. Sin embargo,
tiene sus desventajas. Primero, el nmero y la anchura de los intervalos son una
decisin subjetiva, con todo, el nmero de intervalos de clase puede ser calculado
con la frmula de Sturges k=1+3.3(log n), o la regla de tanteo que se vio en el
apartado anterior, y la seleccin que hagamos tiene un alto impacto en la
apariencia del histograma. Los valores de lmite levemente modificados pueden
dar dramticas apariencias a diversos histogramas (usted puede experimentar con
NCSS para ver el impacto de cambiar el nmero de intervalos en la apariencia del
histograma). Otro problema con el histograma es que los rectngulos aparentan
que los datos estn separados uniformemente a travs del intervalo, pero a
menudo en la realidad ste no es el caso.
Tambin, la apariencia global del histograma representa la naturaleza algo alisada
de la distribucin de los datos. Estas quejas contra el histograma han trado
muchas innovaciones. Una de las tcnicas ms nuevas y populares de la
presentacin para demostrar la distribucin de datos es la densidad del trazo. La
densidad se refiere a la frecuencia relativa (concentracin) de los puntos de

Dr. Temstocles Muoz Lpez

34

Representaciones Grficas
referencias a lo largo del rango de datos. Matemticamente, la densidad en un
valor x se define como la fraccin de los valores de los datos por la unidad de
medida en un intervalo centrado en x.
Una vez que usted escoja una anchura conveniente del intervalo, puede calcular la
densidad en cualquier (y a cada) valor de x. Si usted calcula la densidad en, por
ejemplo,

50

valores

los

conecta,

obtiene

la

densidad

del

trazo.

Desafortunadamente muchos programas no contienen sta funcin. En NCSS, la


anchura del intervalo se especifica como porcentaje. Mientras que usted aumenta
el porcentaje, usted aumenta la cantidad de datos incluidos en cada clculo de la
densidad. Esto aumenta la suavidad de la grfica. Los cuatro trazos siguientes de
la densidad fueron hechos de los mismos datos con aumento del porcentaje de la
suavidad. Observe cmo muestran ms estas grficas que el histograma comn
presentado al inicio de ste captulo.
La densidad del trazo al 25% de los datos se representa de la siguiente forma:
Histogram
80.0

Count

53.3

26.7

0.0
40.0

53.3

66.7

80.0

SepalLength

Con densidad de 30% quedara as:

Dr. Temstocles Muoz Lpez

35

Representaciones Grficas
Histogram
50.0

Count

33.3

16.7

0.0
40.0

53.3

66.7

80.0

SepalLength

En tanto que con 40% la figura se agrupa ms, pero mantiene la concentracin
marcada:
Histogram
40.0

Count

26.7

13.3

0.0
40.0

53.3

66.7

80.0

SepalLength

En un caso extremo de agrupamiento al 60% el efecto se exagera de la siguiente


forma:

Dr. Temstocles Muoz Lpez

36

Representaciones Grficas
Histogram
40.0

Count

26.7

13.3

0.0
40.0

53.3

66.7

80.0

SepalLength

Mientras se aumenta la anchura del intervalo son incluidos los puntos de


referencias ms lejanos y ms prximos del valor de centro. Para disminuir el peso
de los puntos que quedan lejos del valor de centro, utilizamos un esquema que
carga los puntos de los pesos proporcionalmente a su distancia del valor del
centro. La funcin del peso usada es la mitad de la funcin del coseno, con su pico
en el valor de centro que disminuye simtricamente a cero, despus de lo cual se
aplica un peso de cero. Por lo anterior, los puntos tienen un impacto cada vez ms
pequeo y ms pequeo en la densidad del trazo, mientras que estn ms al
fondo y ms prximos del centro.
Otra manera de pensar en la densidad del trazo es imaginarse que usted
construye 1,000 histogramas de los mismos datos usando posiciones levemente
diversas del lmite y toma la altura media del rectngulo en cada uno de 50 valores
a lo largo del rango de datos. Esto le dara un histograma alisado que tiene
muchas de las mismas caractersticas de la densidad del trazo. Por lo tanto, la
densidad del trazo se debe pensar como un histograma alisado, en el cual la
anchura del intervalo y el nmero de compartimientos no estn en juego.

Estructura de datos

Dr. Temstocles Muoz Lpez

37

Representaciones Grficas
El histograma se construye con una sola variable. Una segunda variable se puede
utilizar para dividir la primera variable en grupos (Ej., categora de edad o gnero).
No se solicita otro requisito en los datos de entrada. Sin embargo, las
distribuciones disponibles en NCSS asumen que los datos son continuos. Observe
que son ignoradas las filas con valores perdidos en las variables seleccionadas.

III.

GRFICAS DE PASTEL

Introduccin y Propsitos Generales


Los fines generales de la grfica de pastel es
construir segmentos dividiendo un crculo en
dos o ms secciones. La grfica se utiliza
para mostrar la proporcin en que cada parte

Grfica de pastel del presupuesto


Marketing Administracin
R&D

contribuye al total. Por lo tanto, debe ser


utilizada cuando usted desea comparar
categoras individuales con el conjunto. Si
usted desea comparar los valores de una
categora con otra, utilice un diagrama de la
grfica de dispersin de barras. Por ejemplo,

Produccin

la grfica muestra el presupuesto para cada uno de los cuatro departamentos en


una compaa hipottica. Las grficas de pastel son tiles para exhibir hasta cerca
de seis o siete rebanadas o porciones.

La estructura de los datos


Los valores de datos deben ser positivos y numricos. Se omiten los valores no
positivos. Los datos se pueden incorporar en la tabla en dos formatos posibles:
verticales u horizontales. En el formato vertical, una variable (columna) contiene
los valores que se graficarn. En el formato horizontal, una fila los contiene. Estos
datos estn en la base de datos original de la grfica.

IV.

DIAGRAMA DE CAJAS

Dr. Temstocles Muoz Lpez

38

Representaciones Grficas

Introduccin
Al analizar los datos con un diagrama usted necesita ver a menudo las
caractersticas de una sola serie de nmeros, de observaciones o de medidas.
Puede ser que desee conocer el centro y cmo est la distribucin de los datos
sobre este valor central. Puede ser que usted desee investigar los valores
extremos atpicos (llamados outliers) o estudiar la distribucin de los valores de los
datos (el patrn de los valores de los datos a lo largo del eje de la mediana). Hay
varias tcnicas que estn disponibles para permitir que usted estudie la
distribucin. stos incluyen el diagrama de tallo-hoja, el histograma, la densidad
del trazo, el diagrama de probabilidad, y el diagrama de cajas (Box Plot)
presentado en seguida.

La definicin del diagrama de cajas


El diagrama de cajas demuestra tres caractersticas principales de una variable: su
centro, la distribucin de sus datos, y sus outliers o valores atpicos.

La Caja
El diagrama de cajas se compone de una caja (un rectngulo) con las lneas, y los
puntos agregados a ella. La anchura de la caja puede ser arbitraria o convencional
y se debe seleccionar su dimensin para hacer una exhibicin agradable a la vista.
La presentacin usual de los lmites de la cubierta y el fondo de la caja son los
porcentajes 25avo y 75avo. La longitud de la caja es as el rango interquartil (IQR).
Es decir, la caja representa el 50% o mitad de los datos centrales.
El IQR es una medida popular de la distribucin. Usted puede representar la caja
como un rectngulo, un diamante, una elipse, o una figura especial diseada para
hacer comparaciones mltiples. En ella se dibuja una lnea a travs del centro de
la caja en el punto medio o mediana (el porcentaje del 50avo). El punto medio es
una medida popular de la localizacin del valor medio o de centro de las variables.

Dr. Temstocles Muoz Lpez

39

Representaciones Grficas
Box Plot

SepalLength

80.0

65.0

50.0

35.0

Iris

Box Plot

SepalLength

80.0

65.0

50.0

35.0

Iris

Los valores adyacentes lmites


Los valores adyacentes al borde superior de la caja son la observacin ms
grande, que es menor que, o igual al porcentaje del 75avo ms 1.5 veces IQR. El
valor adyacente ms bajo de la caja es la observacin ms pequea que es mayor
que, o igual al porcentaje del 25avo menos 1.5 veces IQR. Los valores adyacentes
se exhiben como lneas en forma de T que se extienden en cada extremo de la
caja. Otros valores fuera de los lmites son considerados extremos.

Dr. Temstocles Muoz Lpez

40

Representaciones Grficas

Los valores extremos


Los valores que se ubican fuera de los valores adyacentes superiores y ms bajos
que la T de la grfica se llaman valores extremos, anmalos o atpicos (outliers).
Los valores que estn debajo de tres IQRs de los 25avo y 75avo porcentajes se
llaman outliers suaves, en tanto que fuera de tres IQRs se llaman outliers severos.
Los outliers suaves no son raros y los outliers severos si lo son.

Comparaciones mltiples
Estas se utilizan a menudo para las distribuciones de varias agrupaciones de
datos, puesto que resumen el centro y la distribucin de los datos con apariencia
muy agradable. Al hacer comparaciones concluyentes entre las localizaciones
(puntos medios) de varias agrupaciones, es til hacer un diagrama de caja
modificado llamado diagrama truncado.
Se construyen los cortes usando la frmula:

Mediana IQR n 1.57.



Los diagramas truncados de caja se utilizan para hacer comparaciones mltiples
entre las agrupaciones. Si los cortes de dos cajas no se traslapan, podemos
asumir que los puntos medios son perceptiblemente diferentes (los centros son
estadsticamente significativos). El 1.57 se selecciona para el nivel del 95% de
significancia. El diagrama de cajas presentado abajo es el diagrama truncado
clsico.

Dr. Temstocles Muoz Lpez

41

Representaciones Grficas
Box Plot

SepalLength

80.0

66.7

53.3

40.0

Iris

Recientemente, los estadsticos han notado que el diagrama truncado de caja no


permite que usted se centre en las comparaciones mltiples. Se ha propuesto una
versin moderna del diagrama truncado para hacer esta comparacin (vase el
diagrama abajo).
Box Plot

SepalLength

80.0

66.7

53.3

40.0

Iris

Esta versin modifica el smbolo usado para la caja. De hecho, pone la caja hacia
fuera, y dos lneas horizontales marcan la posicin de la caja. La parte que se
grafica es solamente la parte truncada. Esto hace mucho ms fcil hacer
comparaciones. Si dos de los cortes se traslapan, los puntos medios del grupo no

Dr. Temstocles Muoz Lpez

42

Representaciones Grficas
son perceptiblemente diferentes. Observe que al hacer comparaciones entre
varias agrupaciones, los diagramas truncados no requieren ningn ajuste para la
multiplicidad de pruebas en que son conducidos. Mientras que los diagramas
truncados se utilicen informalmente, no hay necesidad de ajustes tcnicos.

La estructura de datos
El diagrama de cajas se construye a partir de una variable. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categora de edad
o gnero). En este caso, un diagrama separado de la caja se exhibe para cada
grupo. No se solicita otro requisito en los datos de entrada.

V.

CARTAS O GRFICAS DE BARRAS

Introduccin y Propsitos Generales


Las grficas de barras se
utilizan para comparar

90

visualmente valores

80
70

es

el
on

grfica de lneas. Hay

Junio
Ki
wi
s

grfica de rea, y la

nj
as

ur
a

barras horizontal, la

Mayo

Pe
r

an
za

na
s

vertical, la grfica de

Abril

os

la grfica de barras

ar
a

de barras, stas incluyen

zn

variaciones en la grfica

60
50
40
30
20
10
0

as

Toneladas

contiguos. Hay algunas

versiones bi y
tridimensionales de cada uno. Arriba se muestra un ejemplo de una grfica de
barras 3D.

La estructura de datos

Dr. Temstocles Muoz Lpez

43

Representaciones Grficas
Los datos de la grfica de barras 3D se incorporan en el formato estndar de la
fila-columna de la hoja de datos. Cada valor numrico de los datos se convierte en
una barra. Los datos alfabticos se utilizan para etiquetar las filas y las columnas
de la grfica. En la tabla est un ejemplo de los datos graficados.
FRUTA

ABRIL

MAYO

JUNIO

Manzanas

82

70

20

Peras

73

50

33

Duraznos

67

45

28

Naranjas

85

65

17

Kiwis

54

42

24

Melones

33

58

20

VI.

DIAGRAMAS DE PROBABILIDAD

Introduccin
Este procedimiento construye los diagramas de probabilidad normal, las
distribuciones de Weibull, Chi-ajustado, de gamma, uniformes, exponenciales, y
mitad-normales. Le permite intentar varias transformaciones para ver si alguna se
acerca ms a la distribucin de su inters. Los lmites de confianza aproximados
se dibujan para ayudar a precisar si un sistema de datos sigue una distribucin
dada. Si se especifica una variable agrupadora, se dibuja en una lnea separada y
se exhibe para cada valor nico de la variable agrupadora.

Dr. Temstocles Muoz Lpez

44

Representaciones Grficas
Normal Probability Plot of SepalLength

SepalLength

80.0

66.7

53.3

40.0
-3.0

-1.0

1.0

3.0

Normal Distribution

Proporcionaremos una breve introduccin a las tcnicas de grficas de


probabilidad, y una discusin completa de este asunto se puede encontrar en
Chambers (1983) que procuraremos resumir a continuacin.
Muchos anlisis estadsticos asumen que los datos estn muestreados de una
poblacin ms grande con una distribucin especificada. A menudo, la distribucin
de esta poblacin ms grande se asume que es normal (en trabajos de
confiabilidad y de supervivencia la distribucin subyacente se asume que es
exponencial o Weibull). Esto a menudo se llama la asuncin de normalidad. (note
que la distribucin normal a veces es llamada distribucin gaussiana para evitar la
confusin con su definicin comn. Aunque implica que es normal la distribucin
generalmente, no lo es! Esta asuncin de normalidad se hace por varias razones:
1. Permite que los datos sean representados compactados. Mil valores que vienen
de la distribucin normal se pueden resumir por solamente dos nmeros: la media
y la varianza.
2. Permite el uso de varios procedimientos estadsticos, tales como el anlisis de
la variabilidad, de pruebas t, o de regresin mltiple.

Dr. Temstocles Muoz Lpez

45

Representaciones Grficas
3. Permite que las generalizaciones sean hechas de la muestra a la poblacin.
Estas generalizaciones toman generalmente la forma de intervalos de confianza y
de pruebas de hiptesis.
4. Entender la distribucin de una muestra puede proporcionar la entrada en el
proceso fsico que cre los datos.
Obviamente la naturaleza no genera automticamente los datos que siguen cierta
distribucin de probabilidad. Cuando usted asume que sus datos siguen la
distribucin normal, realmente est asumiendo que la distribucin de sus datos es
razonablemente aproximada a la distribucin normal. La pregunta que se presenta
es que tan bastante cerca est de lo normal? Esta pregunta se puede estudiar
usando procedimientos numricos y grficos. Se han desarrollado las pruebas
numricas de hiptesis que permiten que usted determine si sus datos siguen
cierta distribucin. Consulte sobre mnibus K.
Las pruebas para la normalidad se proporcionan generalmente en los programas
estadsticos en el apartado de estadstica descriptiva. Los procedimientos grficos
son tiles porque le dan una impresin visual sobre si es vlida la asuncin de
normalidad. Le permiten precisar si la asuncin es invalidada por uno o dos
outliers (que podran ser quitados), o si los datos siguen una distribucin
totalmente dispersa. Tambin sugieren qu transformacin de los datos (raz
cuadrada, registro, lo contrario, los etc.) sigue ms de cerca la distribucin normal.
El mejor acercamiento es aplicar procedimientos numricos y grficos. Dado que
los datos estn disponibles en su computadora, toman solamente algunos golpes
de teclado hacer ambos chequeos.

La lectura del diagrama de probabilidad


Esta seccin presentar algunos de los fundamentos para el anlisis y la lectura
de los diagramas de la probabilidad. Nuestra discusin es breve, as que es
recomendable que busque informacin adicional si lee regularmente estos
diagramas. Tambin, la experimentacin es un profesor muy bueno. Usted debe

Dr. Temstocles Muoz Lpez

46

Representaciones Grficas
hacer varias prcticas con bases de datos que siguen los patrones que usted
comprende. Genere los diagramas de probabilidad para conseguir una apreciacin
de cmo se muestran diversos patrones de datos en los diagramas. Si los puntos
en la probabilidad se trazan en toda la pendiente a lo largo de una lnea recta,
usted puede asumir que los datos siguen esa distribucin de la probabilidad. Por lo
menos, la distribucin real es bastante aproximada para la distribucin que usted
ha trazado. Discutiremos brevemente los tipos de patrones que coincidan
generalmente con salidas de la rectitud de esta lnea.

Los outliers
Los outliers o casos atpicos son los valores que no siguen el patrn del cuerpo de
los datos. Se localizan en cualquier extremo de la probabilidad. Puesto que los
outliers grandes desviarn seriamente la mayora de los anlisis estadsticos,
usted debe investigarlos cuidadosamente. Si son errores u ocurrencias de una
sola vez deben ser quitados de su anlisis. Una vez que se hayan quitado los
outliers, el diagrama de probabilidad debe ser rediseado sin ellos.

Las colas largas


De vez en cuando algunos puntos en ambos extremos se perdern de la lnea.
Estos puntos parecen seguir un patrn, no el patrn del resto de los datos.
Generalmente, los puntos en el extremo de la lnea tirarn para arriba, mientras
que los puntos en el fondo de la lnea caern debajo de ella. Esto es causado por
una distribucin de los datos con colas ms largas que las que se esperan ser
consideradas bajo distribucin terica (Ej., normal). Los datos con colas ms
largas pueden causar problemas con algunos procedimientos estadsticos.

La asimetra
Si la probabilidad tiene una curva convexa o cncava (ms que una lnea recta),
los datos se sesgan a un lado o al otro de la mitad. Esto puede ser corregido
generalmente usando una frmula de ajuste como transformacin de poder.

Dr. Temstocles Muoz Lpez

47

Representaciones Grficas

Las mesetas y los valles


Los puntos que arraciman los datos se muestran en el diagrama de probabilidad
como valles y mesetas (desplazamientos horizontales de puntos). Esto puede ser
causado por la granulidad de los datos. Por ejemplo, si la variable puede adquirir
solamente cinco valores, el diagrama exhibir sus patrones. Cuando ocurren estos
patrones, debe estar seguro que sabe la razn de ellos. Es debido a la
naturaleza discreta de los datos, o los racimos son causados por una segunda
variable extraa?

Precauciones
El estudio de diagramas de la probabilidad es una herramienta muy til en anlisis
de datos, teniendo algunas precauciones debido a que:
1. Estos diagramas acentan los problemas que pueden aparecer en las colas de
la distribucin, no en el centro (puesto que ah hay muchos puntos agrupados).
2. La variacin natural en los datos causar una cierta salida de la rectitud.
3. Puesto que el diagrama considera solamente una variable a la vez, no se
atiende alguna relacin que pueda existir con otras variables.
4. Los lmites de confianza exhibidos en el diagrama son solamente aproximados.
Tambin, dependen mucho de un tamao de muestra razonable. Para las
muestras inferiores de 20 casos, estos lmites se deben tomar con mucha
precaucin. Tambin puede cambiar mucho los lmites cambiando el nivel de
confianza (el valor de alfa). Asegrese de que el valor que usted est utilizando es
razonable.

Los detalles tcnicos

Dr. Temstocles Muoz Lpez

48

Representaciones Grficas
Vamos a asumir que tenemos un sistema de los nmeros x 1, x2..., xn y deseamos
estudiar visualmente si la asuncin de la normalidad es razonable. El mtodo
bsico es:
1. Clasifique los xis del ms pequeo al ms grande. Represente el sistema
clasificado de nmeros como x(1), x(2)..., x(n). Por lo tanto, x(1) es el mnimo y el
x(n) es el mximo de estos datos.
2. Defina los quantiles empricos de n, p1, p2..., pn, donde pi = i/n. stos son
similares a los porcentajes. Por ejemplo, si n = 5 los pi s seran 2, 4, 6, 8, 10. El
valor p2 del 4 se interpreta como significado que ste es el 40 porcentaje.
3. Encuentre un sistema de los nmeros, z1, z2..., el zn, que esperara de los
datos que siguen exactamente la distribucin normal. Por ejemplo, z2 es el
nmero que contbamos con si obtuviramos 5 valores de una distribucin
normal, clasificndoles, y seleccionado el segundo ms bajo. stos se llaman los
quantiles.
4. Construya un diagrama de dispersin con los pares x(1) y z1, x(2) y z2,
etctera. Si los xis vinieran de una distribucin normal, anticiparamos que los
puntos trazados caern a lo largo de una lnea recta. El grado de no-normalidad es
sugerido por la cantidad de la curvatura en el diagrama.
Hay varios refinamientos al procedimiento de arriba. El ms comn es la definicin
de los pis en el paso 2. La frmula usada generalmente es pi = (i-a)/(n-2a+1),
donde a es un nmero entre 0 y 1. Muchos estadsticos recomiendan a = 1/3. ste
es el valor por defecto usado por programas como NCSS (el valor de a se fija en la
opcin de la constante del porcentaje). Otra modificacin est en el escalamiento
usado para los zis. Si se utilizan los zis del paso 3, la definicin terminante es el
diagrama del quantil. Si los z s se convierten a una escala de probabilidad, el
diagrama se conoce como diagrama de probabilidad. Hoy en da estas
definiciones se han debilitado y utilizamos el trmino de diagrama de probabilidad
para representar cualquiera de estos diagramas. Los diagramas de probabilidad

Dr. Temstocles Muoz Lpez

49

Representaciones Grficas
se pueden construir para cualquier distribucin, aunque el de normalidad es el
ms comn.
Los cuatro pasos antedichos se utilizan para cualquiera de las siete funciones de
distribucin que estn disponibles en NCSS. Las tablas de compartimientos, de
Cleveland, de Kleiner, y de Tukey (1983) que se muestran debajo dan la
informacin tcnica sobre estas distribuciones. Una de las caractersticas ms
tiles de estas tablas es la columna ordenada y marcada en la segunda tabla. Esta
columna define la transformacin de los datos que se deben utilizar para alcanzar
un diagrama estndar de probabilidad para esa distribucin.
Por ejemplo, si deseaba generar un diagrama gamma de probabilidad, debe tomar
los datos de una mitad de poder. Observe que no hay transformacin especial
necesaria para el diagrama normal de probabilidad. Estos lmites de confianza
sirven en tanto que la referencia limita cuando est estudiando un diagrama de
probabilidad. Cuando la cada de los puntos est fuera de estos lmites, los
considerara como evidencia que la asuncin de la normalidad (o cualquier
distribucin que est considerando) es invlida.

La estructura de datos
El diagrama de probabilidad se construye de una sola variable. Una segunda
variable se puede utilizar para dividir la primera variable en grupos (ej., categora
de edad o gnero). No se solicita otro requisito en los datos de entrada, sin
embargo, las distribuciones disponibles en NCSS asumen que los datos son
continuos. Las filas que faltan son ignoradas con valores en una de las variables
seleccionadas.

VII.

DIAGRAMA DE DISPERSIN

Introduccin

Dr. Temstocles Muoz Lpez

50

Representaciones Grficas
El diagrama x-y de dispersin es una de las herramientas de mayor alcance para
analizar datos. NCSS incluye un men de caractersticas para realzar el diagrama
bsico de dispersin. Algunas de estas caractersticas son lneas de la tendencia
(mnimos cuadrados) y lmites de confianza, polinomios, lneas, curvas lowess,
diagramas de caja insertados, y diagramas de girasol.
Lo que sigue es un ejemplo de un diagrama tpico de la dispersin con una lnea
de tendencia y con diagramas de caja incorporados.

Estructura de datos
El diagrama de dispersin se construye a partir de dos variables. Se puede utilizar
una tercera variable para dividir las primeras dos variables en grupos (Ej.,
categora de edad o gnero). No se hacen otros requerimientos para los datos de
entrada.
Height (inches) vs Weight (lbs)

Weight (lbs)

250.0

183.3

116.7

50.0
50.0

60.0

70.0

80.0

Height (inches)

Si la variable gnero se incluye para separar los datos:

Dr. Temstocles Muoz Lpez

51

Representaciones Grficas
Height (inches) vs Weight (lbs)

Weight (lbs)

250.0

Gender
1
2

183.3

116.7

50.0
50.0

60.0

70.0

80.0

Height (inches)

Considere que las filas con valores perdidos en una de las variables seleccionadas
sern ignoradas en ambas.

VIII.

MATRIZ DE DIAGRAMAS DE DISPERSIN

Introduccin
La matriz de diagramas de dispersin es una tabla de dispersin mltiple. Cada
diagrama es pequeo para poder introducir muchos diagramas en una pgina.
Cuando usted necesita dar una mirada de diagramas, por ejemplo al principio de
un anlisis de regresin mltiple, la matriz del diagrama de dispersin es una
herramienta muy til. Lo que sigue es un ejemplo de una matriz del diagrama de
dispersin creada durante la fase inicial de un estudio de la regresin mltiple.
En el siguiente ejemplo hay cinco variables de la prueba que forman un juego de
variables independientes, contrastadas contra ellas mismas considerando cada la
variable como dependiente para organizarlas. Observe cmo puede explorar
rpidamente los diagramas para variables altamente correlacionadas, y outliers.

Dr. Temstocles Muoz Lpez

52

Representaciones Grficas
Raz_Ded_

Raz_Ind_

Pens_Cr_t_

Poten_

Poten_

Pens_Cr_t_

Raz_Ind_

Raz_Ded_

Ex_Esc_

Ex_Esc_

Estructura de los datos


Cada diagrama de dispersin se construye a partir de dos variables numricas. Se
puede utilizar una tercera variable, alfanumrica para controlar el smbolo del
diagrama.

IX.

DIAGRAMAS DE SUPERFICIE 3D

Introduccin
Los diagramas de superficie 3D
son diagramas de datos
tridimensionales. Ms que

Dr. Temstocles Muoz Lpez

53

Representaciones Grficas
mostrar los puntos de referencias individuales, los diagramas superficiales
muestran una relacin funcional entre una variable dependiente sealada (Y), y
dos variables independientes (X1 y X2).
El diagrama de puntos es un diagrama que acompaa al diagrama de contorno.
Es importante entender cmo se construyen estos diagramas.
Se construye una rejilla de dos dimensiones de X1 y de X2. El rango de esta rejilla
es igual al rango de los datos. Despus, un valor de Y se calcula para cada punto
de la rejilla. Este valor de Y es un promedio cargado de todos los valores de los
datos que se acerquen a este punto de la rejilla. (El nmero de puntos generados
es un promedio especificado por el usuario). Se construye la superficie
tridimensional usando un promedio de estos valores. Por lo tanto, el diagrama
superficial no muestra la variacin en cada punto de rejilla. Estos diagramas son
tiles en el anlisis de regresin, para ver la relacin entre una variable
dependiente y dos variables independientes.
Pudiramos pensar que una de las variables, X2, es en realidad Z, o sea la
perspectiva que da fondo de tercera dimensin a la grfica, pero considere que
sta puede ser X1 o X2 dependiendo de la perspectiva de la rotacin.

Grfico de superficie 3D

Ex Esc

10.0

10.0
2.0
0.0
10.0 0.0

Raz Ded

Raz Ind

Dr. Temstocles Muoz Lpez

54

Representaciones Grficas
Recuerde que la regresin mltiple asume que esta superficie es una superficie
perfectamente plana. Por lo tanto, el diagrama superficial le permite precisar
visualmente si la regresin mltiple es apropiada.
Los diagramas de superficie son muy tiles en la exploracin de los datos, sobre
todo haciendo rotar el diagrama con las opciones del programa tanto en NCSS
como en Statistica. Despus de rotar la figura en tres dimensiones el poder
explicativo del investigador se incrementa, pero desafortunadamente muchas
veces no es posible expresar la explicacin en una sola perspectiva de la figura
dentro del informe de investigacin, por lo cual se requiere seleccionar la mejor
vista.

La Estructura de los datos


El diagrama de superficie se construye a partir de tres variables. Las variables
(independientes) X1 y X2 se muestran en los ejes horizontales. La variable de Y se
muestra a lo largo del eje vertical. Observe que las tres variables son numricas.

Estilos del Diagrama de superficie

Scatter Plot

Ex Esc

10.0

10.0

2.0
0.0

10.0 0.0

Raz Ded

Raz Ind

La siguiente grfica est elaborada con Statistica, que adems permite la rotacin
dinmica.

Dr. Temstocles Muoz Lpez

55

Representaciones Grficas
3D Surface Plot (BDInvestigacin de valores final 83v*980c)
AUTOCONT = Distance Weighted Least Squares

12
10
8
6

Abajo se muestran ms ejemplos de variantes en los diagramas, que son tiles


para analizar los datos, manipulando el diseo y la rotacin.

Dr. Temstocles Muoz Lpez

56

Representaciones Grficas

X. DIAGRAMAS DE VIOLN
Introduccin
El Diagrama de Violn, como el diagrama de cajas, es til para exhibir la media y la
distribucin de un sistema de datos. Varios diagramas de caja se pueden exhibir
en anchuras distintas para permitir que usted compare el promedio y la extensin
de varios grupos.
La densidad del trazo en el histograma es til para exhibir la distribucin de los
datos. Desafortunadamente, es difcil comparar varios rastros de densidad
mostrando anchuras. An as, se considera una tarea comn comparar las
distribuciones de varias agrupaciones de datos. Se ha inventado un nuevo
diagrama que llamamos el diagrama del violn. Este diagrama es un hbrido de la
densidad del trazo y del diagrama de cajas que permite que usted compare varias
distribuciones rpidamente.
En un diagrama de cajas los datos se mostraran de la siguiente manera:
Dr. Temstocles Muoz Lpez

57

Representaciones Grficas
Box Plot
70.0

Amount

48.3

26.7

5.0

PetalLength

Variables

En tanto que en un histograma con alta densidad de trazo se presentaran as:


Histogram
80.0

Count

53.3

26.7

0.0
0.0

23.3

46.7

70.0

PetalLength

La combinacin en los diagramas de violn


El diagrama del violn se hace combinando una forma de caja para trazar con dos
anchuras en proporcin a la densidad vertical. Una densidad del trazo se extiende
a la izquierda mientras que la otra se extiende a la derecha. No hay diferencia en
estos rastros de densidad con excepcin de la direccin a la cual son extendidos.
Ponemos dos rastros de la densidad en el diagrama para agregar la simetra, que
hace mucho ms fcil comparar las agrupaciones. El diagrama del violn destaca
los picos y los valles de una distribucin de variables. Cambiamos el diagrama de

Dr. Temstocles Muoz Lpez

58

Representaciones Grficas
cajas levemente demostrando el punto medio como crculo, hicimos esto de modo
que las comparaciones de los puntos medios pudieran ser hechas rpidamente.
Llamamos a esto un diagrama del violn porque uno de los primeros juegos de
datos que trabajamos tena el aspecto de un violn. Usted lo encontrar as:

Violin Plot
70.0

Densidad de trazo
Quartil superior

46.7

Amount

Mediana

23.3

Quartil inferior
0.0

PetalLength

Variables
Si usted compara este diagrama con la densidad del trazo y de la caja con los
mismos datos, notar que aunque el diagrama de cajas es til en muchas
situaciones, no representan los datos que se arraciman (multimodales). Por otra
parte, aunque la densidad del trazo demuestra la distribucin de los datos, es
difcil ver la media y su dispersin. La respuesta obvia a estos defectos es
combinar los dos diagramas.
Diagrama de violn al 10% del trazo de los datos:

Dr. Temstocles Muoz Lpez

59

Representaciones Grficas
Violin Plot
70.0

Amount

46.7

23.3

0.0

SepalLength SepalWidth

PetalLength

PetalWidth

Variables

Diagrama de violn al 30% del trazo de los datos:


Violin Plot
70.0

Amount

46.7

23.3

0.0

SepalLength SepalWidth

PetalLength

PetalWidth

Variables

El ejemplo siguiente demuestra los diagramas de violn de las cuatro variables en


datos del diagrama de Fisher. Observe cmo pueden comparar fcilmente los
puntos medios, las longitudes de la caja (la extensin), y los patrones de
distribucin de los datos. En este ejemplo, note que las dos variables de petal
(ptalo) demuestran dos picos (bimodal) mientras que las dos variables sepal
(spalo) son unimodales (un pico). Hay varias opciones que le dejarn ajustar este
diagrama a sus necesidades.

Dr. Temstocles Muoz Lpez

60

Representaciones Grficas

Estructura de datos
El diagrama del violn se construye de una o ms variables. Una segunda variable
se puede utilizar para dividir la primera variable en grupos (Ej., categora de edad
o gnero). En este caso, un diagrama del violn se exhibe para cada grupo. No se
solicitan otros requerimientos en los datos de entrada.

XI.

CARTAS DE PARETO

Introduccin
La descripcin de la de las Grficas de Pareto un economista italiano (Vilfredo
Pareto 1848-1923), notaron una gran desigualdad en la distribucin del ingreso.
Algunas pocas personas posean la mayora del ingreso. J. M. Juran encontr que
este mismo fenmeno del vital de pocos y el trivial muchos aplicado a muchas
reas del proceso estadstico econmico. Le acreditan a l acuar los trminos de
la grfica de Pareto y anlisis de Pareto para representar este fenmeno.
En el control de calidad el anlisis de Pareto refiere la tendencia al acumulamiento
de los problemas de calidad en unas pocas fuentes posibles del total. Por lo tanto,
aislando y corrigiendo las reas problemticas principales, usted obtiene el mayor
aumento de calidad.
La grfica de Pareto es una representacin grfica que acenta el principio de
Pareto usando un grfico de barra en el cual las barras se arreglen en una
magnitud que disminuye. Los programas estadsticos proporcionan diversos
estilos de la grfica de Pareto, as como un informe numrico.

Muestra el diagrama de una grfica de Pareto


La grfica de Pareto siguiente representa el nmero de tablero-pies de madera
defectuosos (en centenas) a partir de diez diversos aserraderos. Note que tres
aserraderos explican el casi 80% del producto defectuoso. Obviamente, los
esfuerzos se deben concentrar en corregir defectos en estos tres aserraderos.
Dr. Temstocles Muoz Lpez

61

Representaciones Grficas
Pareto Chart of FEET
60.00

FEET

45.00

30.00

15.00

0.00

Label

Estructura de datos
La tabla 37.1 muestra los datos para la grfica antedicha de Pareto. Da el nmero
de tablero-pies defectuosos (en 100s) a partir de diez diversos aserraderos
(etiquetados A - J).
QATEST, base de Datos Pareto
aserraderos
A
B
C
D
E
F
G
H
I
J

Pies defectuosos
6
2
57
13
7
3
36
1
42
4

XII.

AGRUPAMIENTOS JERRQUICOS

Introduccin
Breve descripcin
Los algoritmos de agrupamientos jerrquicos construyen una jerarqua de racimos
que se exhiben comnmente como un diagrama de rbol llamado Dendrograma.
Dr. Temstocles Muoz Lpez

62

Representaciones Grficas
Comienzan con cada objeto (casos o variables) en un racimo separado. En cada
paso, los dos racimos que son ms similares se ensamblan en un solo racimo
nuevo. Una vez que estn fundidos los objetos nunca se separan. Los ocho
mtodos que estn disponibles representan ocho mtodos para definir la
semejanza entre los racimos.
Suponga que deseamos agrupar en racimos los datos bivariados mostrados en el
siguiente diagrama de dispersin. En este caso, el agrupamiento se puede percibir
visualmente. Los datos tienen tres racimos y dos casos aislados, 6 y 13.
Red vs Blue
16.0

Variables
6

10.7

8 10

Blue

1 3 5

12
9 11

13

5.3
141516
171819
202122

0.0
0.0

6.7

13.3

20.0

Red

Lo que sigue es correr un dendrograma de los resultados de estos datos con el


algoritmo que arracima el promedio del grupo. El eje horizontal del dendrograma
(rama) representa la distancia o la disimilitud entre los racimos. El eje vertical
representa los objetos y los racimos que comprende cada rama. El dendrograma
es bastante simple de leer.

Dr. Temstocles Muoz Lpez

63

Representaciones Grficas

Dendrogram
Row
12
11
9
10
8
7
22
21
20
19
16
18
17
15
14
6
13
5
4
2
3
1

2.00

1.50

1.00

0.50

0.00

Dissimilarity

Recuerde que nuestro inters principal consiste en semejanza y agrupamiento.


Cada ensamble (fusin) de dos racimos es representado en el grfico al partir una
lnea horizontal en otras dos lneas horizontales (ramas). La posicin horizontal de
la fractura, mostrada por la barra vertical corta, da la distancia (desemejanza)
entre los dos racimos.
Con este dendrograma puede ver los tres racimos como tres ramas que ocupan
una distancia horizontal casi igual. Los dos outliers, 6 y 13, estn fundidos algo
arbitrariamente adentro en distancias mucho ms altas. sta es la lectura. En este
ejemplo podemos comparar nuestra lectura con un diagrama real de los datos.
Desafortunadamente, esto generalmente no ser posible si nuestros datos
consisten en ms de dos variables.

XIII.

LAS GRFICAS DE BARRAS DE ERROR

Introduccin

Dr. Temstocles Muoz Lpez

64

Representaciones Grficas

Propsitos generales y descripcin


Las grficas de barra del error exhiben las lneas de medias y los errores estndar
(o las desviaciones estndar). Los siguientes son ejemplos de los tipos de grficas
producidas por este procedimiento.
Error Bar Plot
300000.0

State
Nev
Vir

Price

250000.0

200000.0

150000.0

100000.0

Bedrooms

Error Bar Plot


300000.0

State
Nev
Vir

Price

250000.0

200000.0

150000.0

100000.0

Bedrooms

Los valores perdidos

Dr. Temstocles Muoz Lpez

65

Representaciones Grficas
Los valores perdidos se quitan sobre la base de caso-por-caso (casewise). Es
decir, un valor que falta en una variable ignora los casos de otras variables en la
misma fila.

Estructura de datos
Cada fila de datos debe contener por lo menos una variable numrica de
respuesta. Tambin pueden ser sealadas hasta dos variables categricas y hasta
cinco variables clasificatorias. Se produce una grfica separada para cada valor
nico de las variables clasificatorias.
Lo que sigue es un ejemplo numrico de las grficas anteriores con variables
categricas y dos de una sola respuesta. Los datos de abajo dan el estado, el
precio de venta, y el nmero de los dormitorios para 150 caractersticas
residenciales vendidas durante cuatro meses en dos estados. Solamente se
muestran las primeros 8 de las 150 observaciones.
Porcin de los datos de venta de las propiedades
State
Nev
Nev
Vir
Nev
Nev
Nev
Nev
Nev

Price
260000
66900
127900
181900
262100
967500
167200
395700

Bedrooms
2
3
2
3
2
2
2
2

XIV.

MATRIZ REJILLA DE PUNTOS

Introduccin
El diagrama de rejilla (matriz) de puntos es un tipo de diagrama del contorno
convertido para exhibir tres variables. Las primeras dos variables se exhiben como
en el diagrama de dispersin en los ejes verticales y horizontales. La tercera
variable se muestra por el color del bloque o por un smbolo que es codificado de
abajo hacia arriba.

Dr. Temstocles Muoz Lpez

66

Representaciones Grficas
Las variantes pueden ser seleccionadas en muy distintas formas para facilitar la
lectura de los datos.
Grid Plot of PetalLength
45.0

PetalLength
A 3.9
B 11.7
C 19.4
D 27.2
E 35.0
F 42.8
G 50.6
H 58.3
I 66.1

SepalW idth

37.5

30.0

22.5

15.0
40.0

50.0

60.0

70.0

80.0

SepalLength

Estructura de datos
El diagrama de rejilla se construye a partir de tres variables. Las variables de X e
Y se muestran en los ejes horizontales y verticales, respectivamente. Se reparte
en ellos la variable Z y sus valores son representados por el smbolo del diagrama
o el color del bloque (vase los ejemplos arriba). Observe que las tres variables
deben ser numricas.

Las opciones

Dr. Temstocles Muoz Lpez

67

Representaciones Grficas
Consulte la seccin de Opciones donde se describen las opciones disponibles en
este procedimiento.

Variable (X, Y, Z)
Cada caja especifica la variable numrica que es utilizada para construir el
diagrama. La variable de X se exhibe a lo largo del eje horizontal, la variable de Y
a lo largo del eje vertical, y se muestra la variable de Z usando las capas del
contorno.

Mnimo y mximo (X, Y, Z)


Son los valores mnimos y mximos a lo largo de cada eje. Debe tener el cuidado
de utilizarlos dado que pueden distorsionar el diagrama.

Rebanadas (X, Y, Z)
Es el nmero de las divisiones (puntos de rejilla) a lo largo de cada eje. El nmero
de rebanadas a lo largo del eje de z es el nmero de las lneas del contorno. Se
utiliza solamente si la caja de los valores del contorno (z) se deja en blanco.

Decimales de Z
El nmero de decimales a mostrar en los nmeros de referencia de la leyenda.

El estilo del diagrama


Especifica el mtodo usado para exhibir el valor de la variable de Z.

Bloques
Los valores de la variable de Z se exhiben como bloques coloreados.

Dr. Temstocles Muoz Lpez

68

Representaciones Grficas

Smbolos con un color


Los valores de la variable de Z son todas las letras con el mismo color. Cada letra
representa una gama de valores.
En el caso de los smbolos:
Grid Plot of PetalLength
45.0

B
B

SepalWidth

37.5

30.0

22.5

B
C
B
C
B
C
I I
B BB
B BB
H
C
BBB B
B CC
BBB C
B
F GH
BC
G
H H
B BC
B B
G G
FG HHGH
B CB
HG
H
FG
BB BBC F FF G
FGG
F G
HFGH HH IH
B
EF FGFHF F
I
GFG G
FGGHF G
H I
F FG
F G GG
F EF H
I
F D FFG
G H
E
E
B E F
F
G
FF
E

15.0
40.0

50.0

60.0

70.0

PetalLength
A 3.9
B 11.7
C 19.4
D 27.2
E 35.0
F 42.8
G 50.6
H 58.3
I 66.1

80.0

SepalLength

Smbolos de colores mltiples

Dr. Temstocles Muoz Lpez

69

Representaciones Grficas
Los valores de la variable de Z se exhiben como letras que tienen diversos
colores. Cada letra representa una gama de valores.

Dr. Temstocles Muoz Lpez

70

Representaciones Grficas

APARTADO C. TPICOS SELECTOS DE


TCNICAS GRFICAS ANALTICAS
Tcnicas Representativas de Visualizacin
basadas en Statistica
XV. GRFICAS CATEGORIZADAS
Uno de los mtodos analticos generales ms importantes, y tambin de gran
alcance, implica el dividir ("partir") los patrones de datos en categoras de
subjuegos con la finalidad comparar los subconjuntos que resultan. Esta tcnica
comn se conoce bajo una gran variedad de trminos (tales como subdivisin,
agrupamiento, categorizacin, partir, rebanar, perforar, o condicionar) y se utiliza
en anlisis exploratorios de datos y las pruebas de hiptesis. Por ejemplo: Una
relacin positiva entre la edad y el riesgo de un ataque del corazn puede ser
diferente en los varones y las hembras (puede ser ms fuerte en varones). Una
relacin prometedora entre tomar una droga y una disminucin del nivel del
colesterol puede estar presente en mujeres con una presin arterial baja y en 30 a
40 aos. Los ndices de capacidad del proceso, o histogramas de capacidad,
pueden ser diferentes por los perodos del tiempo supervisados por diferentes
operadores. Las pendientes de la regresin pueden ser diferentes en diferentes
grupos experimentales.
Hay muchas tcnicas de cmputo que se centran en agrupar y que se disean
para

cuantificar

las

diferencias

que

revelar

el

agrupamiento

(Ej.,

ANOVA/MANOVA). Sin embargo, las tcnicas grficas (tales como los grficos
categorizados discutidos en esta seccin) ofrecen ventajas nicas que no se
pueden sustituir por ningn mtodo de cmputo por si mismo, y pueden revelar los
patrones que no pueden ser cuantificados fcilmente (Ej., las interacciones, las

Dr. Temstocles Muoz Lpez

71

Representaciones Grficas
excepciones, las anomalas complejas), y proporcionan las perspectivas analticas
multidimensionales, globales nicas, para explorar o "explotar" los datos.

Qu son los Grficos Categorizados?


Se llaman grficos categorizados (el trmino fue usado primero en software de
STATISTICA por StatSoft en 1990; tambin recientemente llamados Grficos de
Trellis, por Becker, Cleveland, y Clark, en los laboratorios de Bell) a la serie de 2D,
3D, grficos ternarios, o del nD (tales como los histogramas, diagramas de puntos,
diagramas de lneas, diagrama de superficie, los diagramas de puntos ternarios,
etc.), seleccionados por una variable especfica (es decir, grupo o subconjunto de
casos), para seguir el ejemplo grfico de abajo, de encuestados por la variable de
Nueva York, de Chicago, de Dallas, del etc. Estos grficos "compuestos" se ponen
secuencialmente en una presentacin, permitiendo comparaciones entre los
patrones de los datos mostrados en los grficos, para cada uno de los grupos
solicitados (Ej., Ciudades).
Se puede utilizar una gran variedad de mtodos para seleccionar los
subconjuntos; el ms simple de ellos es utilizando una variable categrica (Ej., una
variable Ciudad, con tres valores Nueva York, Chicago, y Dallas). Por ejemplo, el
siguiente grfico muestra los histogramas de una variable representando los
niveles de stress en cada una de las tres Ciudades.
Uno podra concluir que los datos
sugieren que la gente que vive en
Dallas es menos probable que reporte
estar tensionada, mientras que los
patrones (distribuciones) de la tensin
que reportan en Nueva York y Chicago
son absolutamente similares entre s.
Los grficos categorizados en algunos
sistemas de software (Ej., en STATISTICA) tambin apoyan las clasificaciones de

Dr. Temstocles Muoz Lpez

72

Representaciones Grficas
dos vas o de multiva, donde no hay un criterio nico (Ej., Ciudad) sino dos o ms
criterios (Ej., Ciudad y poca del da) se utilizan para crear los subconjuntos. Los
grficos categorizados de dos vas se pueden pensar como " grficos de
tabulaciones cruzadas" donde cada componente grfico representa una seccin
representativa de un nivel de una variable agrupadora (Ej., Ciudad) y de un nivel
de la otra variable agrupadora (Ej., tiempo).
La adicin de este segundo factor
revela que los patrones de la tensin
que reportan en Nueva York y Chicago
son realmente diferentes cuando se
toma en consideracin la hora en que
se hizo la pregunta, mientras que el
factor Tiempo diferencia poco en
Dallas.
Grficos categorizados contra grficos de matriz. Los grficos de matriz
tambin producen las exhibiciones que contienen grficos de componentes
mltiples; sin embargo, cada uno de esos grficos de componentes se basa (o
puede basarse) en el mismo juego de casos, y los grficos se generan para todas
las combinaciones de variables a partir de una o dos listas. Los grficos
categorizados requieren una seleccin de las variables que normalmente deberan
ser seleccionadas para los grficos no-categorizados del tipo respectivo (Ej., dos
variables para un diagrama de puntos). Sin embargo, en los diagramas
categorizados tambin necesita especificar al menos una variable agrupadora (o
algunos criterios que se utilizarn para clasificar las observaciones en las
categoras) que contenga la informacin sobre calidad de miembro del grupo en
cada caso (Ej., Chicago, Dallas). Esa variable agrupadora no ser incluida en el
grfico directamente (es decir, no ser trazada) pero servir como criterio para
dividir todos los casos analizados en grficos separados. Segn lo ilustrado arriba,
un grfico ser creado para cada grupo (categora) identificado por la variable
agrupadora.

Dr. Temstocles Muoz Lpez

73

Representaciones Grficas
Escalamiento comn contra Escalamiento independiente. Cada grfico
individual de la categora se puede escalar segn su propia gama de los valores
(escalamiento independiente), o
como abajo, todos los grficos se
pueden escalar a una escala
comn

de

suficientemente

par

en

amplia

par
para

acomodar todos los valores en


todas las categoras de grficos.

El escalamiento comn permite que el analista haga comparaciones de rangos y


distribuciones de valores entre categoras. Sin embargo, si los rangos de valores
en las categoras del grfico son considerablemente diferentes (causando una
escala comn muy ancha), entonces algunos de los grficos pueden ser difciles
de examinar. El uso del escalamiento independiente puede hacer ms fcil marcar
tendencias y patrones especficos dentro de categoras, pero puede ser ms difcil
hacer comparaciones de rangos de valores entre categoras.

Mtodos de Categorizacin
Hay cinco mtodos generales de clasificacin de valores y sern repasados
brevemente en esta seccin: Modo de nmero entero, de categoras, de lmites,
de cdigos, y de subconjuntos mltiples. Observe que los mismos mtodos de

Dr. Temstocles Muoz Lpez

74

Representaciones Grficas
clasificacin se pueden utilizar para categorizar casos en grficos componentes y
para categorizar casos dentro de grficos componentes (Ej., en histogramas o
diagramas de la caja).
Modo de Nmero Entero. Cuando
usted utiliza el modo de nmero entero,
los valores del nmero entero de la
variable
sern

agrupadora
utilizados

seleccionada

para

definir

las

categoras, y ser creado un grfico


para todos los casos que pertenezcan a
cada

categora

(definida

por

esos

valores del nmero entero). Si la variable agrupadora seleccionada contiene


valores de no-nmero entero, el software truncar generalmente cada valor
encontrado de la variable agrupadora seleccionada a un valor de nmero entero.
Categoras.

Con

este

modo

de

clasificacin, usted especifica el nmero


de las categoras que desea utilizar. El
software dividir el rango entero de
valores

de

la

variable

agrupadora

seleccionada (de mnimo a mximo) en


el nmero solicitado de intervalos de
igual longitud.
Lmites. El mtodo de los lmites tambin crear la clasificacin de intervalo, sin
embargo, los intervalos pueden estar (Ej.) de anchura desigual arbitraria segn lo
definido por los lmites solicitados del intervalo (por ejemplo, "menos que -10, "
"mayor que o igual a -10 pero menos de 0, " "mayor que o igual a 0 pero menos de
10, " y "igual o mayor que a 10").

Dr. Temstocles Muoz Lpez

75

Representaciones Grficas

Cdigos. Utilice este mtodo si la variable agrupadora seleccionada contiene


"cdigos" (es decir, valores significativos especficos, tales como varn, hembra)
de los cuales desea especificar las categoras.

Subconjuntos mltiples. Este mtodo


permite

que

usted

personalice

las

categoras, y le permite utilizar ms de


una variable para definir la categora. Es
decir las clasificaciones basadas en
definiciones mltiples del subconjunto de
categoras

pueden

no

representar

distribuciones de variables (individuales)


y distribuciones de frecuencias especficas de "eventos" especficos, definidos por
combinaciones particulares de valores de varias variables (y definidos por las

Dr. Temstocles Muoz Lpez

76

Representaciones Grficas
condiciones que pueden implicar cualquier nmero de variables de subjuegos).
Por ejemplo, usted puede especificar seis categoras basadas en combinaciones
del gnero, de la edad, y del empleo de tres variables.

Histogramas
En general, los histogramas se utilizan para examinar distribuciones de frecuencia
de valores de las variables. Por ejemplo, las demostraciones del diagrama de la
distribucin de frecuencia en que los valores, o los rangos especficos de valores
de la variable examinada son los ms frecuentes, qu tan diferentes son los
valores, si la mayora de las observaciones estn concentradas alrededor de la
media, si la distribucin es simtrica o sesgada, si es multimodal (es decir, si tiene
dos o ms picos) o unimodal, etc. Los histogramas son tambin tiles para evaluar
la semejanza de una distribucin observada con distribuciones tericas o
previstas.
Los histogramas categorizados permiten ser analizados por una o ms variables
categricas, o por cualquiera de uno o ms sistemas de reglas de clasificacin
lgica (vase los mtodos de la clasificacin). Hay dos razones importantes por
las que son de inters las distribuciones de frecuencia.
Uno puede aprender sobre la naturaleza de la variable examinada a partir de
la forma de distribucin (Ej., una distribucin bimodal puede sugerir que la
muestra no sea homognea, y no consista de las observaciones que
pertenecen a dos poblaciones que se distribuyen

ms o menos

normalmente).
Mucha de la estadstica se basa en asunciones sobre las distribuciones de las
variables analizadas; y los histogramas lo ayudan a uno a probar si esas
asunciones estn resueltas. A menudo, el primer paso en el anlisis de un
nuevo subjuego es analizar todas las variables con histogramas.

Dr. Temstocles Muoz Lpez

77

Representaciones Grficas
Histogramas contra rompimientos analticos. Los histogramas categorizados
proporcionan la informacin similar a los rompimientos analticos (Ej., medio, punto
medio, mnimo, mximo, diferenciacin de valores, etc.; vea el captulo de
Estadstica Bsica y Tablas). Aunque la estadstica descriptiva (numrica)
especfica es ms fcil de leer dentro una tabla, la forma total y las caractersticas
descriptivas globales de una distribucin son mucho ms fciles de examinar en
un grfico. Por otra parte, el grfico proporciona la informacin cualitativa sobre la
distribucin que no se puede representar completamente por un solo ndice. Por
ejemplo, la distribucin sesgada total del ingreso puede indicar que la mayora de
gente tiene un ingreso que sea mucho ms cercano al mnimo que al mximo del
rango del ingreso. Por otra parte, cuando es analizado por gnero y el fondo
tnico, esta caracterstica de la distribucin de ingresos se puede encontrar ms
pronunciada en ciertos subgrupos.
Aunque esta informacin ser contenida en el ndice de oblicuidad (para cada
subgrupo), cuando est presentado en la forma grfica de un histograma, la
informacin generalmente se reconoce y se recuerda ms fcilmente. El
histograma puede tambin revelar el "impacto" y ello puede representar hechos
importantes sobre la estratificacin social especfica de la poblacin, o de las
anomalas investigadas en la distribucin del ingreso en un grupo particular,
causadas por una reforma fiscal reciente.
Histogramas y diagramas de puntos categorizados. Un uso til de los mtodos
de la clasificacin para las variables continuas es representar las relaciones
simultneas entre tres variables. Se muestra abajo un diagrama de puntos para la
carga 1 de dos variables y la carga 2.

Dr. Temstocles Muoz Lpez

78

Representaciones Grficas

Ahora suponga que usted quisiera agregar una tercera variable (salida) y examinar
cmo esta se distribuye en diferentes niveles de la distribucin comn de la carga
1 y de la carga 2. El grfico siguiente ser producido:

En este grfico, la carga 1 y la carga 2 estn ambas categorizadas en 5 intervalos,


y se computa dentro de cada combinacin de intervalos la distribucin para la
variable

de

salida.

Observe

que

el

"cuadro"

Dr. Temstocles Muoz Lpez

(paralelogramo)

incluye

79

Representaciones Grficas
aproximadamente las mismas observaciones (casos) de ambos grficos
mostrados arriba.

Diagramas de puntos
En general, se utilizan dos diagramas de puntos bidimensionales para visualizar
las relaciones entre dos variables X e Y (Ej., peso y altura). En diagramas de
puntos los puntos de referencias individuales son representados por los puntos
marcados en el espacio bidimensional, donde los ejes representan las variables.
Las dos coordenadas (X e Y) que determinan la localizacin de cada punto
corresponden a sus valores especficos en las dos variables. Si las dos variables
estn fuertemente relacionadas, entonces los puntos de referencias toman una
forma sistemtica (Ej., una lnea recta o una curva clara). Si las variables no estn
relacionadas, entonces los puntos forman una "nube" redondeada.
La opcin categorizada del diagrama de puntos permite que usted produzca los
diagramas de puntos categorizados por una o ms variables. Va el mtodo de
mltiples subjuegos (vase los mtodos de la clasificacin), usted puede tambin
categorizar el diagrama de puntos basado en las condiciones lgicas de la
seleccin que definen cada categora o grupo de observaciones.
Los diagramas de puntos categorizados ofrecen una tcnica exploratoria y
analtica de gran alcance para investigar relaciones entre dos o ms variables
dentro de diferentes subgrupos.
Homogeneidad de las distribuciones bivariantes (formas de relaciones). El
diagrama de puntos se utiliza tpicamente para identificar la naturaleza de
relaciones entre dos variables (Ej., la presin arterial y colesterol), porque pueden
proporcionar mucho ms informacin que un coeficiente de correlacin.
Por ejemplo, una carencia de la homogeneidad en la muestra de la cual era
calculada una correlacin, puede predisponer el valor de la correlacin. Imagine
un caso donde un coeficiente de correlacin se calcula de los puntos de
referencias que vienen a partir de dos diferentes grupos experimentales, pero este
Dr. Temstocles Muoz Lpez

80

Representaciones Grficas
hecho

fue

ignorado

cuando

la

correlacin era calculada. Suponga


que la manipulacin experimental en
uno de los grupos aument los valores
de ambas variables correlacionadas, y
los datos de cada grupo forman as
una "nube" distintiva; en el diagrama
de puntos (segn lo mostrado en la ilustracin).
En este ejemplo, la alta correlacin es enteramente debida al arreglo de los dos
grupos, y no representa la "verdadera" relacin entre las dos variables, que es
prcticamente igual a 0 (como se podra considerar con una mirada a cada grupo
por separado).
Si usted sospecha que tal patrn puede existir en sus datos y usted sabe cmo
identificar el "subjuego" posible de datos, entonces producir un diagrama de
puntos categorizado como el anterior puede dar un cuadro ms exacto de la
fuerza de la relacin entre la variable de X y de Y, dentro de cada grupo (es decir,
despus de controlar cada miembro del grupo).

Relaciones Curvilneas. La curvilinearidad es otro aspecto de las relaciones entre


las variables que se pueden examinar en diagramas de puntos. No hay pruebas

Dr. Temstocles Muoz Lpez

81

Representaciones Grficas
fciles o automticas a utilizar para medir relaciones curvilneas entre las
variables: El coeficiente estndar de Pearson r mide por si mismo relaciones
lineares, pero algunas correlaciones no paramtricas tales como la r de Spearman
pueden medir relaciones curvilneas, pero no las relaciones no-montonas. El
examinar diagramas de puntos permite que uno identifique la forma de las
relaciones, para poder elegir ms adelante una transformacin apropiada de los
datos al "enderezar" los datos o elegir una ecuacin no lineal apropiada de la
estimacin a que se ajustar.
Para ms informacin, vea los captulos en estadstica bsica, no paramtrica, las
distribuciones, la regresin mltiple, y la valoracin no lineal en Statistica.

Grficos de Probabilidad
Hay tres tipos de diagramas categorizados de probabilidad, Normales, MitadNormales, y Tendenciales. Los diagramas normales de probabilidad proporcionan
una manera rpida de examinar visualmente en qu medida el patrn de datos
sigue una distribucin normal.
Uno puede examinar, va diagramas categorizados de probabilidad, cmo la
distribucin de una variable sigue de cerca la distribucin normal en diferentes
subgrupos.

Dr. Temstocles Muoz Lpez

82

Representaciones Grficas
Los diagramas normales categorizados de probabilidad proporcionan una
herramienta eficiente para examinar el aspecto de la normalidad en la
homogeneidad del grupo.

Diagramas Quantil-Quantil
El diagrama categorizado de Quantil-Quantil (o Q-Q) es til para encontrar la
distribucin ms apropiada dentro de una familia de distribuciones.

Con los diagramas categorizados de Q-Q, se produce una serie de diagramas del
Quantil-Quantil (o Q-Q) para cada categora de los casos identificados por las
Dr. Temstocles Muoz Lpez

83

Representaciones Grficas
variables de la categora de X o de X y de Y (o identificados por los criterios
mltiples del subconjunto, vea los mtodos de la clasificacin). Los ejemplos de
las distribuciones que se utilizan para los diagramas de Q-Q son la Distribucin
Exponencial, las Distribuciones Extremas, Normal, de Rayleigh, Beta, Gammas,
de Log normal, y de Weibull.

Diagramas Probabilidad-Probabilidad
El diagrama categorizado de Probabilidad-Probabilidad (o los P-P) es til para
precisar que tan bien est ajustada
una distribucin terica especfica
de los datos observados. Este tipo
de grfico incluye una serie de
diagramas

de

la

Probabilidad-

Probabilidad (o los P-P), uno para


cada

categora

de

los

casos

identificados por las variables de la


categora de X o de X y de Y (o
identificado por los criterios mltiples del subconjunto, vea los Mtodos de
Clasificacin).
En los diagramas P-P, la funcin de distribucin acumulativa observada (la
proporcin de los valores en que no falta x) se traza contra una funcin de
distribucin acumulativa terica para precisar el ajuste de la distribucin terica a
los datos observados. Si todos los puntos en este diagrama caen sobre una lnea
de la diagonal (con la intercepcin 0 y la pendiente 1), usted puede concluir que la
distribucin acumulativa terica se aproxima adecuadamente la distribucin
observada.
Si los puntos de referencias no caen todos en la lnea diagonal, usted puede
utilizar este diagrama para precisar visualmente donde los datos siguen y no
siguen la distribucin (Ej., si los puntos forman una forma de S a lo largo de la

Dr. Temstocles Muoz Lpez

84

Representaciones Grficas
lnea diagonal, los datos pueden necesitar ser transformados despus para
ajustados al patrn deseado de la distribucin).

Diagramas de Lnea
En los diagramas de lneas los puntos
de

referencias

individuales

son

conectados por una lnea. El diagrama


de lneas proporciona una manera
simple de presentar visualmente una
secuencia de muchos valores (Ej.,
cotizacin en la bolsa sobre

un

nmero de das). El grfico de lnea


categorizada de los diagramas es til cuando uno desea la visin de tales datos
analizados (categorizados) por una variable agrupadora (Ej., el cierre de acciones
cotiza el lunes, martes, el etc.) o algunos otros criterios lgicos que implican una o
ms variables (Ej., el cierre cotiza solo para los das cuando hay otras dos
acciones y el ndice de Dow Jones va para arriba, contra el resto de cierres; vea
los Mtodos de Clasificacin).

Diagramas de Caja
En los diagramas de la caja (trmino primero usado por Tukey, 1970), los rangos
de valores de una variable seleccionada (o las variables) se trazan por separado
para los grupos de casos definidos con valores de hasta tres variables
(agrupadoras) categricas, o segn lo definido por las categoras de Subjuegos
Mltiples.
La tendencia central (Ej.,
mediana o media), y la del
rango

la

variacin

estadstica (Ej., cuartiles,


errores

Dr. Temstocles Muoz Lpez

estndar,

o
85

Representaciones Grficas
desviaciones estndar) se computa para cada grupo de casos, y los valores
seleccionados se presentan en uno de cinco estilos (filamentos truncados de la
caja, filamentos truncados, cajas, columnas, o cierre Alto-Bajo). Los puntos de
referencia del afloramiento pueden tambin ser trazados (vase las secciones en
casos atpicos y extremos).
Por ejemplo, en el grfico siguiente, los casos atpicos extremos (en este caso, los
puntos mayores o menos de 1.5 veces el rango interquartil) indican
particularmente un "desafortunado" extremo en una combinacin que sera de otra
manera casi perfecta de factores:
Sin embargo, en el grfico siguiente, no hay casos atpicos o valores extremos
evidentes.

Hay dos usos comunes para los diagramas de caja: (a) demostrar rangos de los
valores para los tems, los casos o las muestras individuales (Ej., un diagrama
tpico de MIN-MAX para las existencias o los productos o los diagramas de datos
agregados con los rangos), y (b) demostrando la variacin de conteos en grupos o
muestras individuales (Ej., la caja y el filamento truncado presentan la mediana
para cada muestra como un punto dentro de la caja, los errores estndar en la

Dr. Temstocles Muoz Lpez

86

Representaciones Grficas
caja, y las desviaciones estndar alrededor de la mediana como una caja ms
estrecha, o un par de "filamentos truncados").
La caja, al mostrar la variacin de conteos permite que uno evale rpidamente e
"intuitivamente con imaginacin" la fuerza de la relacin entre la variable
agrupadora y la variable dependiente. Especficamente, si se asume que la
variable dependiente est distribuida normalmente, y sabiendo qu proporcin de
observaciones baja, por ejemplo, dentro de desviaciones estndar 1 o 2 de la
media (vase los conceptos elementales), uno puede evaluar fcilmente los
resultados de un experimento y decir que, por ejemplo, las conteos en el cerca de
95% de casos en el grupo experimental 1 pertenecen a una diversa gama que
conteos en cerca del 95% de los casos en el grupo 2.
Adems, pueden ser trazadas las Medias Truncadas supuestas (este trmino
primero fue utilizado por Tukey, 1962) excluyendo un porcentaje especificado de
casos de los extremos (es decir, las colas) de la distribucin de casos.

Grficas de Pastel
La grfica de pastel es uno de los formatos ms comunes usados para representar
proporciones o valores de variables. Este permite que usted produzca las grficas
de pastel analizadas por una o ms variables (Ej., agrupando variables tales como
gnero) o categorizadas segn algunas condiciones lgicas de seleccin que
identifiquen subconjuntos mltiples (vase los mtodos de la clasificacin).
Para

los

propsitos

de

esta

discusin, las grficas de pastel


categorizadas sern interpretadas
siempre como Grficas de pastel
de frecuencias (en comparacin
con grficas de pastel de los
datos). Este tipo de grfica de
pastel (a veces llamada grfica de

Dr. Temstocles Muoz Lpez

87

Representaciones Grficas
pastel de frecuencias) interpreta los datos como un histograma. Categoriza todos
los valores de la variable que sigue la tcnica de la clasificacin seleccionada, y
despus exhibe las frecuencias relativas como rebanadas de pastel de tamaos
proporcionales. As, ofrecen un mtodo alternativo para exhibir datos del
histograma de frecuencias (vase la seccin en histogramas categorizados).
Pastel-Diagramas de puntos. Otro uso til de las grficas de pastel
categorizadas es representar la distribucin de las frecuencias relativas de una
variable en cada "ubicacin" de la distribucin comn de otras dos variables. Aqu
est un ejemplo:
Observe

que

los

pasteles

estn

dibujados en "ubicaciones" donde hay


datos. As, el grfico mostrado toma el
aspecto de un diagrama de puntos (de
las variables L1 y L2), con los pasteles
individuales como puntos marcados. Sin
embargo, adems de la informacin
contenida en un diagrama de puntos
simple, cada pastel muestra la distribucin relativa de una tercera variable en la
localizacin respectiva (es decir, baja, media, y alta calidad).

Diagramas de puntos de datos perdidos por rango


Este grfico produce una serie de grficos 2D (uno para cada categora de los
casos identificados por las variables agrupadoras o por los criterios mltiples del
subconjunto; vea los Mtodos de Clasificacin) de puntos de referencia que faltan
y/o de "fuera del rango de especificacin del usuario" puntos en los cuales usted
puede visualizar el patrn o la distribucin de datos que faltan (y/o puntos "fuera
del rango de especificacin") dentro de cada subconjunto de los casos (categora).

Dr. Temstocles Muoz Lpez

88

Representaciones Grficas

Este grfico es til en anlisis exploratorio de datos para precisar la distribucin


(y/o el "fuera del rango") de datos perdidos, y si los patrones de esos datos
ocurren aleatoriamente.

Diagramas 3D
Este tipo de grfico permite
que

usted

diagramas

produzca
de

los

puntos

3D

(diagramas

espaciales,

diagramas

espectrales,

diagramas de desviacin, y
diagramas de trazo), trazos de
contorno,

superficie,
subconjuntos

diagramas
para
de

de
los

casos

definidos por las categoras especificadas en una variable seleccionada, o las


categoras determinadas por condiciones definidas por el usuario en la seleccin
de casos (vase los mtodos de clasificacin). As, los fines generales de este

Dr. Temstocles Muoz Lpez

89

Representaciones Grficas
diagrama son facilitar comparaciones entre grupos o las categoras, con respecto
a las relaciones entre tres o ms variables.
Usos. En general, los grficos de
3D en los ejes XYZ resumen las
relaciones interactivas entre tres
variables. Las diversas maneras en
las cuales los datos pueden ser
categorizados

(en

un

grfico

categorizado) permiten que uno


repase

esas

relaciones

contingentes con un cierto criterio


(Ej., calidad de miembro de grupo).
Por ejemplo, del diagrama superficial categorizado mostrado al lado, uno puede
concluir que el ajuste del nivel de tolerancia en un aparato no afecta la relacin
investigada entre las medidas (Dependiente 1, Dependiente 2, y altura) a menos
que el ajuste sea 3.
El efecto es ms sobresaliente cuando usted cambia a la representacin del
diagrama del contorno.

Dr. Temstocles Muoz Lpez

90

Representaciones Grficas

Diagramas Ternarios
Un diagrama ternario categorizado se puede utilizar para examinar las relaciones
entre tres o ms dimensiones, donde tres de esas dimensiones representan
componentes de una mezcla (es decir, las relaciones entre ellos se obligan de tal
forma que los valores de las tres variables agreguen la misma constante para
cada caso) para cada nivel de una variable agrupadora.

Dr. Temstocles Muoz Lpez

91

Representaciones Grficas
En diagramas ternarios, los sistemas coordinados triangulares se utilizan para
trazar cuatro (o ms) variables (los componentes X, Y, y Z, y las respuestas V1,
V2, etc.) en dos dimensiones (diagramas de puntos o contornos ternarios), o tres
dimensiones (diagramas ternarios de superficie). Para producir grficos ternarios,
se obliga a las proporciones relativas de cada componente dentro de cada caso a
que se ajusten hasta el mismo valor (Ej., 1).
En

un

diagrama

ternario

categorizado, se produce un
grfico componente para cada
nivel

de

la

variable

agrupadora (o del subconjunto


de

datos

definido

por

el

usuario) y todos los grficos


componentes se arreglan en
una presentacin para permitir
comparaciones

entre

los

subconjuntos de los datos


(categoras).
Usos. Un uso tpico de este grfico es cuando la respuesta(s) medida de un
experimento depende de las proporciones relativas de tres componentes (Ej., tres
diferentes productos qumicos) que se varen para precisar una combinacin
ptima de esos componentes (Ej., en diseos de la mezcla). Este tipo de grfico
se puede utilizar tambin para otros usos, donde las relaciones entre las variables
ajustadas necesitan ser comparadas a travs de categoras o de subconjuntos de
datos.

XVI. TCNICA DE CEPILLADO


Quizs la ms comn y primera tcnica que se utiliz histricamente de manera
ms extensa fue la tcnica identificada explcitamente como el anlisis exploratorio

Dr. Temstocles Muoz Lpez

92

Representaciones Grficas
de datos grficos por cepillando, un mtodo interactivo que permite que uno
seleccione, en la presentacin en pantalla, los puntos de referencia o los
subconjuntos especficos de datos, y que identifique sus caractersticas (Ej.,
comunes), o que examine sus efectos sobre relaciones entre las variables
relevantes (Ej., en matrices del diagrama de puntos), o que identifique casos
atpicos (outliers).
Esas relaciones entre las variables se pueden visualizar por las funciones
ajustadas (Ej., por las lneas 2Ds o las superficies 3D) y sus intervalos de
confianza, as, por ejemplo, uno puede examinar cambios en esas funciones
recprocamente (temporalmente) quitando o agregando subconjuntos especficos
de datos. Por ejemplo, uno de muchos usos de la tcnica de cepillado debe
seleccionar, destacando, en un diagrama de matriz de puntos, todos los puntos de
referencia que pertenezcan a cierta categora (Ej., un nivel "medio" de ingresos,
observe el subconjunto del componente superior derecho, destacado en el grfico
de la ilustracin de abajo):
Para examinar cmo esas
observaciones

especficas

contribuyen a las relaciones


entre otras variables en el
mismo

subjuego

(Ej.,

la

correlacin entre "deuda" y


"activos"

en

el

ejemplo

actual).
Si la facilidad de cepillado
soporta

las

caractersticas

como "cepillado animado" (vase el ejemplo abajo) o "funcin automtica de


reajuste", uno puede definir un cepillo dinmico que se mover sobre las rangos
consecutivas de una variable del criterio (Ej., "ingreso" medido en una escala
continua y no una escala discreta como en la ilustracin antedicha), y examinar la

Dr. Temstocles Muoz Lpez

93

Representaciones Grficas
dinmica de la contribucin de la variable de criterio y las relaciones entre otras
variables relevantes en el mismo subjuego.

XVII. ALISADO DE DISTRIBUCIONES BIVARIANTES


Los histogramas tridimensionales se utilizan para visualizar tabulaciones cruzadas
de valores en dos variables. Pueden ser considerados para hacer una conjuncin
de dos (es decir, univariada) histogramas simples, combinadas de tal forma que
pueden ser examinadas las frecuencias de co-ocurrencias de valores en las dos
variables. En el formato ms comn de este grfico, una barra 3D se dibuja para
cada "celda" en la tabla de la tabulacin cruzada, y la altura de la barra representa
la frecuencia de los valores para la celda respectiva de la tabla. Se pueden utilizar
diferentes mtodos de clasificacin para cada una de las dos variables en las que
se visualiza la distribucin bivariante (vase aqu).
Si el software proporciona la
facilidad para alisar, usted puede
ajustar

superficies

las

representaciones 3D de los datos


bivariantes de la frecuencia. As,
cada histograma 3D se puede
transformar en una superficie
alisada.

Dr. Temstocles Muoz Lpez

Esta

tcnica

es

de
94

Representaciones Grficas
relativamente poca ayuda si est aplicada a un patrn simple de datos
categorizados (tales como el histograma que fue mostrado arriba).

Sin embargo, si est aplicado a patrones ms complejos de frecuencias, puede


ser una tcnica exploratoria valiosa, permitiendo la identificacin de regularidades
que son menos evidentes, al examinar las representaciones estndares del
histograma 3D (Ej., vea la superficie sistemtica del "patrn de ondas" mostrado
en el histograma alisado de arriba).

Dr. Temstocles Muoz Lpez

95

Representaciones Grficas

XVIII. COMPRESIN DE CAPAS


Cuando se utiliza la compresin de capas, el rea de trazo del grfico principal se
reduce de tamao al espacio, para permitir lugar a los grficos del margen
derecho superior y lograr la presentacin (con un grfico miniatura en la esquina).
Estos

grficos

pequeos

del

representan

ms
margen

imgenes

comprimidas vertical y
horizontalmente

del

grfico principal.
En los grficos 2D la
compresin de capas es
una tcnica exploratoria del anlisis de datos que puede facilitar la identificacin
de tendencias y de patrones, de otra manera cubiertos en subjuegos de 2
dimensiones. Por ejemplo, en la ilustracin siguiente, (basado en un ejemplo
discutido por Cleveland, 1993), puede ser visto que el nmero de manchas solares
en cada ciclo se decae ms lentamente que cuando se levanta en el inicio de cada
ciclo. Esta tendencia no es fcilmente evidente al examinar el diagrama de lneas
estndar; sin embargo, el grfico comprimido revela el patrn ocultado.

XIX. PROYECCIONES DE JUEGOS DE DATOS 3D


Los diagramas de contorno generados por proyecciones de las superficies
(creadas de los juegos de datos multivariados, tpicamente de tres variables) es un
mtodo til para explorar y examinar analticamente los datos a partir de las
formas de las superficies.

Dr. Temstocles Muoz Lpez

96

Representaciones Grficas

Con respecto a los diagramas superficiales, pueden ser menos eficaces para
visualizar rpidamente la forma completa de las estructuras de datos 3D,

sin embargo, su ventaja principal es que permiten el examen preciso y el anlisis


de la forma de la superficie (los diagramas de contorno exhiben una serie de
secciones cruzadas" de la superficie no distorsionadas horizontalmente).

Dr. Temstocles Muoz Lpez

97

Representaciones Grficas

XX. DIAGRAMAS DE CONOS


Los grficos de conos representan casos o unidades de observacin como
smbolos multidimensionales y ofrecen un poderoso instrumento, aunque no es
fcil utilizarla como tcnica exploratoria. La idea general detrs de este mtodo se
capitaliza por la capacidad del investigador, al marcar "automticamente" las
relaciones complejas (a veces interactivas) entre las variables mltiples, si esas
relaciones son constantes a travs de un juego de casos (en este caso "conos").
A veces la observacin (o una "percepcin") de que en ciertos casos "son
similares en algo" viene antes de que el observador (en este caso un analista)
pueda articular cules variables especficas son responsables de la consistencia
observada (Lewicki, Hill, y Czyzewska, 1992). Sin embargo, el anlisis posterior
que se centra en tales consistencias marcadas puede revelar la naturaleza
especfica de las relaciones relevantes entre las variables.
La idea bsica de los diagramas de
conos es representar unidades
individuales de observacin como
objetos grficos particulares, donde
los valores de las variables se
asignan a las caractersticas o a

Dr. Temstocles Muoz Lpez

98

Representaciones Grficas
las dimensiones especficas de los objetos (generalmente un caso = un objeto). La
asignacin es tal que el aspecto total del objeto cambia en funcin de la
configuracin de los valores.
As, los objetos dan "identidades" visuales
nicas para las configuraciones de valores, y
eso se puede identificar por el observador.
Examinar tales conos puede ayudar a descubrir
los racimos (clusters) especficos de ambas
relaciones simples y las interacciones entre las
variables.

Analizando Diagramas de conos


El diseo "ideal" del anlisis de los diagramas de conos consiste en cinco fases:
1. Seleccione el grupo de variables que va a ser analizado. En muchos casos una
secuencia que comienza al azar es la mejor solucin. Usted tambin puede
intentar incorporar las variables basadas en el orden de una ecuacin de la
regresin mltiple, las cargas factoriales en un factor interpretable (vase el
captulo del anlisis factorial), o una tcnica multivariada similar. Ese mtodo
puede simplificar y "homogenizar" el aspecto general de los conos que pueden
facilitar la identificacin de patrones escondidos. Puede tambin lograr algunos
patrones interactivos ms difciles de encontrar. No se pueden dar a este punto
ningunas recomendaciones universales, con excepcin de que intente otro mtodo
ms rpido (ordenar al azar) antes de involucrarse en un mtodo ms
desperdiciador de tiempo.
2. Busque cualquier regularidad potencial, tal como semejanzas entre los grupos
de conos, los casos atpicos, o las relaciones especficas entre aspectos de los
conos (Ej., el "si los primeros dos rayos del cono de estrella son largos, entonces
uno o dos rayos en el otro lado del cono son generalmente cortos"). Se
recomienda para esta fase el tipo de diagramas de conos circulares.

Dr. Temstocles Muoz Lpez

99

Representaciones Grficas
3. Si se encuentran algunas regularidades, intente identificarlas en trminos de las
variables especficas implicadas.
4. Reasigne las variables a las caractersticas de los conos (o seleccione uno de
los diagramas secuenciales del cono) para verificar la estructura identificada de
las relaciones (Ej., intente mover juntos los aspectos relacionados del cono ms
cercano para facilitar otras comparaciones). En algunos casos, en el final de esta
fase se recomienda sacar las variables que no parecen contribuir al patrn
identificado.
5. Finalmente, utilice un mtodo cuantitativo (tal como un mtodo de la regresin,
una valoracin no lineal, un anlisis de funcin discriminante, o un anlisis de
racimos) a la prueba, y cuantifique el patrn identificado o por lo menos algunos
aspectos del patrn.

Taxonoma de Diagramas de conos


La mayora de los diagramas de conos se pueden asignar a una de dos
categoras: circular y secuencial.
conos circulares. Los diagramas circulares de conos (diagramas de estrella,
diagramas de rayo de sol, conos de polgono) tienden al formato de "ajustarse
alrededor del radio" donde los valores de las variables son representados por
distancias entre el centro ("eje") del cono y de sus bordes.
Esos conos pueden ayudar a
identificar relaciones interactivas
entre las variables porque la
forma

total

del

cono

puede

asumir patrones totales distintivos


e identificables, dependiendo de
configuraciones multivariadas de
los valores de las variables de
entrada.
Dr. Temstocles Muoz Lpez

100

Representaciones Grficas
Para traducir tales patrones globales en modelos especficos (en trminos de
relaciones entre las variables) o verificar las observaciones especficas sobre el
patrn, es provechoso cambiar a uno de los diagramas secuenciales de cono que
se puedan probar de forma ms eficiente cuando uno sabe qu buscar.
conos

secuenciales.

Los

diagramas de cono secuenciales


(conos de columna, conos de
perfil, conos de lnea) siguen un
formato ms simple donde los
smbolos

individuales

son

representados por los diagramas


de

secuencia

pequeos

(de

diferentes tipos).
Los valores de variables consecutivas son representados en los diagramas por
distancias entre la base del cono y los puntos de ruptura consecutivos de la
secuencia (Ej., la altura de las columnas mostradas arriba). Esos diagramas
pueden ser menos eficientes como herramienta para la fase exploratoria inicial del
anlisis del cono, porque los conos pueden ver similares. Sin embargo, segn lo
mencionado antes, pueden ser provechosos en la fase en que se ha revelado ya
un cierto patrn hipottico y uno necesita verificarlo o articularlo en trminos de
relaciones entre las variables individuales.
conos de Pastel. Los diagramas de
cono de pastel caen en parte entre las
dos

categoras anteriores;

todos

los

conos tienen la misma forma (Pastel)


pero se dividen secuencialmente de
diferente forma segn los valores de
variables consecutivas.

Dr. Temstocles Muoz Lpez

101

Representaciones Grficas
Desde un punto de vista funcional, pertenecen ms al tipo secuencial que a la
categora circular, aunque pueden ser utilizados para ambos usos.
Caras de Chernoff. Este tipo de cono es una categora por s mismo. Los casos
son visualizados por las caras del diagrama esquemtico, de tale forma que los
valores relativos de las variables seleccionadas son representados por variaciones
de caractersticas faciales especficas.
Debido a sus caractersticas nicas, es
considerado por algunos investigadores
como

la

ltima

tcnica

exploratoria

multivariada que es capaz de revelar


patrones ocultos de interrelaciones entre
las

variables,

que

no

se

pueden

observarse por ninguna otra tcnica.


Esta declaracin puede ser una exageracin, sin embargo. Tambin, debe ser
admitido que las caras de Chernoff son un mtodo que es difcil de utilizar, y
requiere mucha experimentacin con la asignacin de variables a las
caractersticas faciales. Vea tambin las Tcnicas de anlisis de datos.

Estandardizacin de valores
A excepcin de casos inusuales, cuando usted se propone que los conos reflejen
las diferencias globales en rangos de valores entre las variables seleccionadas,
los valores de las variables se deben estandardizar en la escala para asegurar la
compatibilidad de rangos del valor dentro del cono. Por ejemplo, porque los
valores del juego de datos son ms grandes que el punto de referencia global del
escalamiento para los conos, entonces, si hay variables que estn en una gama
de orden mucho ms pequea, pueden no aparecer en el cono, Ej., en un
diagrama de estrella, los rayos que los representan sern demasiado cortos para
ser visibles.

Aplicaciones

Dr. Temstocles Muoz Lpez

102

Representaciones Grficas
Los diagramas de cono son generalmente aplicables (1) a las situaciones donde
uno desea encontrar patrones o racimos sistemticos de observaciones, y (2)
cuando uno desea explorar posibles relaciones complejas entre varias variables.
El primer tipo de uso es similar al anlisis de racimos, es decir, puede ser utilizado
para clasificar observaciones.
Por ejemplo, suponga que usted estudi las personalidades de artistas, y registr
los puntajes para varios artistas en un nmero de cuestionarios de la personalidad.
El diagrama puede ayudarle a precisar si hay racimos naturales de los artistas
distinguidos por los patrones particulares de conteos en diferentes cuestionarios
(Ej.,

usted

puede

encontrar

que

algunos

artistas

son

muy

creativos,

indisciplinados, e independientes, mientras que un segundo grupo son


particularmente inteligentes, disciplinados, y relacionados con el xito reconocido
del pblico).
El segundo tipo de uso (la exploracin de relaciones entre varias variables) es ms
similar al anlisis factorial; es decir, puede ser utilizado para detectar qu variables
tienden a "agruparse" Por ejemplo, suponga que usted estudiaba la estructura de
la opinin de la gente con coches. Varios sujetos terminaron los cuestionarios
detallados que clasificaban diferentes coches en numerosas dimensiones. En la
base de datos se registran los promedios en cada dimensin (las variables) para
cada coche (como casos u observaciones).
Cuando estudia usted ahora las caras de Chernoff (cada cara que representa las
opiniones para un coche), si el precio fue asignado a sonrisa y aceleracin al
tamao de orejas, puede ocurrirle que las caras sonrientes tienden a tener orejas
grandes; entonces este "descubrimiento" significa que los coches rpidos son ms
costosos. Esto, por supuesto, es un ejemplo simple; en anlisis de datos
exploratorios de la vida real, pueden llegar a ser evidentes las relaciones
complejas no obvias entre las variables.

Grficas Relacionales

Dr. Temstocles Muoz Lpez

103

Representaciones Grficas
Los diagramas de matriz visualizan relaciones entre las variables a partir de una o
dos listas. Si el software permite que usted marque subconjuntos seleccionados,
los diagramas de matriz pueden proporcionar la informacin similar en diagramas
de cono.
Si el software permite que usted cree, y que identifique subconjuntos definidos por
el usuario en diagramas de puntos, los diagramas de puntos 2D simples se
pueden utilizar para explorar las relaciones entre dos variables; asimismo, al
explorar las relaciones entre tres variables, los diagramas de puntos 3D
proporcionan una alternativa a los diagramas de cono.

Tipos de Grficos de conos


Hay varios tipos de diagramas de cono.
Caras de Chernoff. Una "cara" separada se dibuja para cada caso; los valores
relativos de las variables seleccionadas para cada caso se asignan a las formas y
a los tamaos de las caractersticas faciales individuales (Ej., longitud de la nariz,
ngulo de cejas, anchura de la cara).

Dr. Temstocles Muoz Lpez

104

Representaciones Grficas
Para ms informacin vea las caras de Chernoff en taxonoma de los diagramas
de cono.
Estrellas. Los conos de estrellas son un tipo circular de diagrama de cono. Una
estrella separada se traza para cada caso como cono; los valores relativos de las
variables seleccionadas en cada caso son representados (a la derecha,
comenzando en las 12:00) por la longitud de rayos individuales en cada estrella.
Los extremos de los rayos son conectados por una lnea.

Rayos de Sol. Los conos de rayos de sol son un tipo circular de diagrama
separado para cada caso, cada rayo representa una de las variables
seleccionadas (hacia la derecha, comenzando en las 12:00), y la longitud del rayo
representa el valor relativo de la variable respectiva. Los valores de los datos de
las variables para cada caso son conectados por una lnea.

Dr. Temstocles Muoz Lpez

105

Representaciones Grficas

Polgonos. Los conos de polgono son un tipo circular que se traza para cada
caso, y los valores relativos de las variables seleccionadas en cada caso son
representados por la distancia del centro del cono a las esquinas consecutivas del
polgono (a la derecha, comenzando en las 12:00).

Pasteles. Los conos de pastel son un tipo circular de diagrama donde los valores
de los datos para cada caso se trazan como grfica de pastel (a la derecha,
comenzando en las 12:00); los valores relativos de variables seleccionadas son
representados por el tamao de las rebanadas del Pastel.

Dr. Temstocles Muoz Lpez

106

Representaciones Grficas

Columnas. Los conos de columnas son un tipo secuencial del diagrama que se
traza para cada caso; los valores relativos de las variables seleccionadas por caso
son representados por la altura de columnas consecutivas.

Lneas. La lnea conos es un tipo secuencial de diagrama de conos.

Dr. Temstocles Muoz Lpez

107

Representaciones Grficas

Un grfico de lnea individual se traza para cada caso, y los valores relativos de
las variables seleccionadas para cada caso son representados por la altura de los
puntos consecutivos de la lnea, sobre la lnea de fondo.
Perfiles. Los conos de perfil son un tipo secuencial de diagrama de conos. Un
grfico individual del rea se traza por caso, y los valores relativos de las variables
seleccionadas para cada caso son representados por la altura de los picos
consecutivos del perfil sobre la lnea de fondo.

conos enmarcados

Dr. Temstocles Muoz Lpez

108

Representaciones Grficas
Si el software permite que usted especifique subconjuntos mltiples, es til
especificar los casos (sujetos) cuyos conos sern enmarcados (y los marcos
sern puestos alrededor de los conos seleccionados) en el diagrama.

Los patrones de lnea de los marcos que identifican subconjuntos especficos se


deben enumerar en la leyenda junto con las condiciones de la seleccin del caso.
El grfico siguiente muestra un ejemplo de los subconjuntos marcados.
Todos los casos (observaciones) que renan la condicin especificada en el
subconjunto 1 (es decir, los casos para los cuales el valor de la variable Iristype
son iguales a los de la variable Setosa y para los cules el nmero del caso es
menor de 100) estn marcados con un marco especfico alrededor de los conos
seleccionados.

Dr. Temstocles Muoz Lpez

109

Representaciones Grficas

Todos los casos que renan la condicin definida en el subconjunto 2 (es decir, los
casos para los cuales el valor de Iristype son iguales a la variable Virginic, y para
los cules es menor el nmero del caso de 100) tendrn un marco diferente
alrededor de los conos seleccionados.

XXI. TCNICAS DE REDUCCIN DE DATOS


A veces se puede obscurecer un patrn existente trazando un subjuego
extremadamente grande (vase la grfica de abajo que puede tenerse como
animacin con los archivos del curso). Cuando usted tiene una base de datos muy
grande, puede ser til trazar un subconjunto de los datos, de modo que el patrn
no sea ocultado por el nmero de los marcadores de puntos.
Algunos software ofrecen mtodos para la
reduccin de datos (u optimizacin) que
puede ser til en estos casos. Idealmente,
una opcin de la reduccin de datos
permitir que usted especifique un valor n
del nmero entero menor que el nmero de
casos en la base de datos. Entonces el
software

seleccionar

Dr. Temstocles Muoz Lpez

casos

de

n,

110

Representaciones Grficas
aleatoriamente de los casos disponibles, y crear el diagrama basado en estos
casos por si mismo.
Observe que tales mtodos de la reduccin de subjuegos (o tamao de muestra)
dibujan con eficacia una muestra escogida al azar de los subjuegos existentes.
Obviamente, la naturaleza de tal reduccin de datos es enteramente diferente que
cuando los datos se reducen selectivamente a un subconjunto especfico o se
parten en los subgrupos basados en ciertos criterios (Ej., el gnero, la regin, o el
nivel de colesterol). Los ltimos mtodos se pueden poner en ejecucin
recprocamente (Ej., con el mtodo de cepillado animado), u otras tcnicas (Ej., los
grficos categorizados o las condiciones de seleccin de casos). Todos estos
mtodos pueden ayudar posteriormente a identificar patrones en subjuegos
grandes.

XXII. ROTACIN DE DATOS (EN ESPACIO 3D)


Cambiando el punto de vista para los diagramas de puntos de 3D los (Ej.,
diagramas espectrales, simples, o espaciales) puede ser una tcnica exploratoria
eficaz, puesto que puede revelar los patrones que son fcilmente ocultados, a
menos que usted mire la "nube" de los puntos de referencias desde un ngulo
apropiado (vase la grfica de abajo que puede tenerse como animacin con los
archivos del curso).
Algunos

software

ofrecen

perspectivas

interactivas, la rotacin y los controles que


hacen girar continuamente pueden ser tiles
en estos casos. Idealmente, estos controles
permitirn que usted ajuste el ngulo y la
perspectiva de la grfica para encontrar la
localizacin

del

"punto

de

vista"

ms

informativo del grfico, as como permitirle


que controle su rotacin vertical y horizontal.

Dr. Temstocles Muoz Lpez

111

Representaciones Grficas
En tanto que estas posibilidades son tiles para el anlisis de datos exploratorio
inicial, pueden ser tambin absolutamente beneficiosas en explorar el espacio
factorial (vase el Anlisis Factorial) y explorar el espacio dimensional (vase el
Escalamiento Multidimensional).

Ligas para consultar los tipos de grficas en Statistica


StatSoft,
Inc.
(2003).
Electronic
Textbook.
http://www.statsoft.com/textbook/stathome.html
Grficas 2D
Barras/Columnas
Barras de Desviacin
Barras izquierda Y
Barras Derecha Y
Barras Arriba
Barras X
Cajas
Probabilidad Tendencial
Probabilidad MitadNormal
Histogramas de Barras
Colgantes
Histogramas

Espectrales
Trazos
Grficas 3D
Secuenciales

Contorno
Desviacin

Cajas

Espaciales

Rangos

Espectrales

Datos crudos
Contorno/Discretos
Secuencial Contorno

Superficie
Grficas Ternarias
Categorizadas

Secuencial Superficie

Ternarias Contorno/Area

Filamentos Datos Crudos

Ternarias Contorno/Lneas

Datos crudos Superficie


Grficas 4D/Ternarias

Grficas de Pastel

3D Ternarias

Probabilidad

Contorno/rea

Probabilidad-Probabilidad

Contorno/Lneas

Quantil-Quantil

Desviacin 3D

Rango

Espaciales 3D

Diagrama de puntos
Voronoi

Grficas 3D
Categorizadas

Diagramas de puntos

Diagramas de puntos

Secuencial/Estacas

Techniques.

Histogramas Bivariantes

Lneas

Diagramas de puntos

Graphical

Grficas 2D
Categorizadas
Probabilidad Tendencial
Probabilidad MitadNormal
Dr. Temstocles Muoz Lpez

Ternarias Diagrama de
puntos
Grficas nD/cono
Caras de Chernoff
Columnas
Lneas
Pasteles
Polgonos
Perfiles
Estrellas
Rayos de Sol
Grficas Matriciales

112

Representaciones Grficas

Grficas 3D XYZ
Contorno
Desviacin
Diagramas de puntos

Probabilidad Normal
ProbabilidadProbabilidad
Quantil-Quantil

Columnas
Lneas
Diagramas de puntos

Espaciales

Dr. Temstocles Muoz Lpez

113

Representaciones Grficas

APARTADO D. DIAGRAMAS
CORRELACIONALES
ASCC
XXIII. EL ANLISIS SISTMICO POR MEDIO DE
CONSTELACIONES CORRELACIONALES
INTRODUCCIN
En el trabajo educativo a veces encontramos problemas para elucidar las
relaciones entre las diferentes circunstancias que se asocian a nuestro quehacer.
Se propone esta tcnica de Anlisis Sistmico por medio de Constelaciones
Correlacionales (ASCC), donde se obtiene una configuracin o modelo del
sistema, que surge de un orden que existe en la realidad con un nivel de
aproximacin significativo estadsticamente.
La lectura de los datos es simplificada cuando se diagraman las relaciones entre
las variables, lo que permite concentrar la atencin en secuencias y
agrupamientos especficos.
Por ejemplo:
Tabla de correlacin cannica entre las variables de 13 y 14 aos. Correlaciones
significativas a p 0.01, r 0.2578, n= 99. La fila superior corresponde a los 14
aos y la primera columna a los 13.
13

14 REAFECT RMREGJU RMCONVP RMAUTIM RMSENPR RMDEBIE RMBIENO RMASERT REOPAYU REAPJUV REPADEF

REAFECT
RMREGJU

0.27
0.31

0.29

RMCOMRE

0.35

Dr. Temstocles Muoz Lpez

114

Representaciones Grficas
RMAUTIM

0.26

HNOCAST

0.28

REPOROB

0.28

RMSENPR

0.29

RMBIEMA

0.28

0.34

RMAYUDA

0.30

0.28

REACTIV

0.27

0.30

RESOCIA

-0.29

RMBIENO

-0.26

0.30

0.33

RMASERT
0.27
0.27

REBUECO

0.28

REPROLE

0.32

REVALYS

0.35

REINVES

0.26

REAPADR

0.29

0.29
0.36
0.32
0.34

RECAMEJ
REAPCOM
REHEREN

0.28

0.27

HAESIMP
HBUEXIG

0.34

0.26
0.32

0.31

0.27

0.30
0.26

En un diagrama la representacin quedara de la siguiente forma:

Dr. Temstocles Muoz Lpez

115

Representaciones Grficas
ARESOCIA
ARMAUTIM
BRMCONVP

BRMAUTIM

BRMBIENO

ARMSENPR
AREHEREN
AREAPCOM

BREAFECT

AREINVES

BRMSENPR
AREBUECO

AREPROLE
ARMCOMRE

ARMASERT

AREVALYS
AHBUEXIG

BREOPAYU
AREACTIV

BRMREGJU
AREAPADR
ARMREGJU
BREPADEF

ARMBIEMA

ARMAYUDA

ARMBIENO
ARECAMEJ

BREAPJUV

BRMDEBIE

AHNOCAST

AREAFECT

AREPOROB
BRMASERT

AHAESIMP

En este trabajo se pretende destacar la importancia de introducirse al uso de la


estadstica en las llamadas comnmente ciencias sociales (a partir de un nfasis
en muestreo y correlacin), para fundamentar la tcnica ASCC con el uso del
cmputo en la toma de decisiones, misma que puede ser ampliada en otras reas
de nivel directivo no educacional como el anlisis de procesos administrativos y
productivos.
Se pretende adems, sin profundizaciones, abrir las posibilidades de uso de la
estadstica para quien no tiene conocimientos de la misma, llevndolo lentamente
en una serie de pasos, para que tome las decisiones ms adecuadas con altos
niveles de precisin.

Dr. Temstocles Muoz Lpez

116

Representaciones Grficas
La Tcnica de Anlisis Sistmico por medio de Constelaciones Correlacionales
est diseada para la toma de decisiones y se fundamenta en cuatro aspectos
bsicos: La Teora de Sistemas, la teora y el proceso de la correlacin estadstica,
el uso de sistemas de cmputo y, la sistematizacin u organizacin de los
elementos (variables) que intervienen en el fenmeno, problema u objeto de
estudio.
Ampliando los fundamentos tericos de la tcnica presentada, se puede abordar
con mayor facilidad y una comprensin ms completa su utilidad y sus posibles
aplicaciones.
El uso de los sistemas de cmputo ha hecho variar las metodologas y tcnicas de
investigacin, tanto en diversidad como en una significativa reduccin del tiempo
de ejecucin de las mismas.
Esto se hace ms patente en la aplicacin, captura y proceso de la informacin,
que permite manejar un nmero significativamente mayor de variables que en las
dcadas anteriores en forma muy rpida y altamente precisa, de tal manera que el
investigador puede ampliar considerablemente tanto el nmero de problemas
analizados como las aplicaciones estadsticas en los mismos, con diferentes,
interesantes y novedosas perspectivas.
Una de las caractersticas que se denotan con mayor nfasis en el uso del
procesamiento por cmputo, es que cada vez en mayor medida se utiliza en la
toma de decisiones.

Apuntes complementarios sobre la correlacin estadstica


Los conceptos de correlacin fueron presentados por el cientfico ingls Sir
Francis Galton (l822-1911), cuando haca investigaciones sobre la herencia y otras
reas de la biologa, llegando a ser en la actualidad una de las tcnicas
estadsticas ms utilizadas para analizar o manejar las relaciones en los sistemas
complejos. El anlisis de correlacin nos permite ver la fuerza o intensidad de las
relaciones que hay entre dos o ms variables que covaran recprocamente. Si hay
Dr. Temstocles Muoz Lpez

117

Representaciones Grficas
una mayor tendencia para variar conjuntamente, mayor correlacin habr entre
ambas, pudindose llegar a una correlacin perfecta.
Desde el punto de vista de la
teora

de

sistemas,

hay

causalidad, entre las mltiples


variables o elementos que
integran un sistema, y si son
dependientes,

el

cambio

r = 0.85

Fertilizantes
y riego

operado en uno de ellos


resultar en un cambio en
otro

otros

puntos

Crecimiento

del

sistema, ya que desde su punto de vista estn unidos por cohesin y covarianza.
No habr de perderse de vista que la correlacin estadstica mide el grado de
intensidad de la asociacin entre variables, y no puede hablarse de causalidad, a
menos que se tengan evidencias consistentes.
El estadstico r mide el grado de correlacin entre dos variables, as, un valor de r=
1.00 indica una correlacin positiva perfecta, un valor de -1.00 expresa una
correlacin negativa perfecta, en tanto que un valor correlacional de 0 (cero) indica
independencia total entre las variables, o falta de correlacin entre ellas. En las
ciencias sociales o en la naturaleza no suelen obtenerse correlaciones perfectas
debido al tipo de variables que se estudian y a los instrumentos de medicin que
se utilizan, pudindose encontrar correlaciones imperfectas de cinco tipos:
1

1. Altas y positivas
2. Altas y negativas
3. Nulas

Variable 1

4
5

4. Bajas y positivas

5. Bajas y negativas

Variable 2

Dr. Temstocles Muoz Lpez

118

Representaciones Grficas
El coeficiente de correlacin permite predecir o pronosticar una variable a partir de
los valores obtenidos en la otra. De esta forma, el coeficiente de correlacin lineal
r, es la medida de la fuerza de relacin lineal entre dos variables, la magnitud del
efecto que cualquier cambio en una variable ejerce o transmite sobre la otra en un
sentido positivo o negativo.
El conocimiento de como vara un elemento o fenmeno con otro del sistema hace
posible explicar la dinmica de una situacin o hacer predicciones, de esta
manera, con el conocimiento de la variacin conjunta (covariacin) se podra
controlar un hecho o fenmeno manipulando otro u otros elementos del sistema,
una aspiracin cientfica y tecnolgica del hombre.
De acuerdo con Spiegel, M. (1991), hay varios tipos de correlacin:
a) Correlacin no lineal. No implica que no haya correlacin, sino que esta
puede ser curvilnea.
b) Correlacin espuria. Es una correlacin sin sentido que se establece entre
dos variables evidentemente no relacionadas en la realidad.
c) Autocorrelacin. Es aquella que nos permite correlacionar valores de una
variable X en ciertos tiempos, con valores correspondientes de la misma
variable en tiempos anteriores.
d) Correlacin Mltiple. Es el grado de correlacin que se establece entre tres
o ms variables.
En suma, la correlacin mide el grado o la intensidad de asociacin o relacin
tendencial que existe entre dos o ms variables cualitativas o cuantitativas. A partir
de los cambios que se pueden producir en una variable, se pueden deducir, inducir
y predecir los cambios que sufrirn las otras variables con que se relaciona.
Las correlaciones definen la concordancia (correlacin positiva) o diferencia
(correlacin negativa) y adems permiten abordar esquemas referenciales
simples, parciales o multivariados en diferentes grados de complejidad. As,
podemos mencionar algunas cualidades de diferentes tipos de correlacin (S.E.P.
1985), como las siguientes:

Dr. Temstocles Muoz Lpez

119

Representaciones Grficas
a) La correlacin positiva que identifica tendencias concordantes de sentido.
b) La correlacin negativa que identifica tendencias divergentes o inversas de
sentido.
c) La correlacin rectilnea a demostrado su efectividad al referir la dimensin
espacial (longitud, latitud y profundidad) as como lo relacionado con la
previsibilidad de fenmenos de bajo riesgo y aquellos que perfilan constantes o se
los ubica en microdimensiones.
d) La correlacin curvilnea ha dado un mayor sentido interpretativo al referir
fenmenos relacionados con las dimensiones temporales, bio-psico-sociales o
personales, as como en relacin a las concepciones de relatividad, universo
curvo, previsin de fenmenos de alto riesgo, gradacin, variabilidad, ciclicidad o
macrodimensiones.
Una correlacin positiva significa que los individuos (variables, elementos o casos)
que obtienen altas calificaciones en una variable, tienden a obtener altas
calificaciones en una segunda variable segn Gonzlez Alans (1992).
De acuerdo con el mismo autor la clase de coeficiente de correlacin que se usa,
depende del tipo de escala en la cual se expresa la variable; de la naturaleza de la
distribucin fundamental segn sea continua y discreta, y de la forma lineal o no
lineal de la distribucin de las calificaciones. Expresa adems que:
El coeficiente de correlacin del producto-momento de Pearson "r", se puede
emplear con variables de intervalo o de razn.
No encontrar evidencia de una relacin entre dos variables, a travs de la r de
Pearson, puede significar que las variables estn relacionadas en una forma
distinta de la relacin lineal.

Dr. Temstocles Muoz Lpez

120

Representaciones Grficas
La suposicin de que existe una relacin lineal, es la justificacin ms
importante para el empleo de la r de Pearson cuando se quiere obtener una
medida de la relacin entre variables.
Mientras que las relaciones sean unimodales y relativamente simtricas, el
clculo de la r de Pearson puede considerarse legtimo.
El coeficiente de correlacin por rangos de Spearman, se emplea con datos
de variables ordinales de pares comparados.
Antes de aplicar la correlacin de Spearman, ambas escalas deben
expresarse en rangos.
Aunque se pueda obtener la r de Pearson con datos ordenados, la r de
Spearman reduce la tarea del cmputo manual para obtener la correlacin.
Cuando las series nominales son dicotmicas, se usa la correlacin
tetracrica, entre otras.
Es conveniente que para poder leer los resultados estadsticamente, se contemple
cuando menos la siguiente clasificacin de relaciones de acuerdo a S.E.P. (Op.
Cit.):
1. Contingente: Fortuita
2. Casual: Al azar o aleatoria.
3. Causal: Determinacin univariable.
4. Concomitante: Dependencia de una relacin en funcin de otro factor de
incidencia.
5. Concausal.: Determinacin multivariable.
6. Condicional: Causas predisponentes, desencadenantes y determinantes; en
una funcin polivalente, diacrnica y sincrnica, en sus perspectivas
relacionales, longitudinales, transversales e integrales.

Dr. Temstocles Muoz Lpez

121

Representaciones Grficas
Si tenemos una poblacin o una muestra determinada, los valores de r sern
menores en tanto sta aumente en nmero, pero conservando altos valores de
significancia (ver Tabla 2), de ah que en el diseo de una configuracin de
mltiples variables interrelacionadas, se nos presente un entramado de lneas que
dificulta leer su significado.
A veces es conveniente, sobre todo en sta tcnica, separar la poblacin en
subpoblaciones por criterios de gnero, procedencia (rural o urbana), continuacin
de estudios (contra desercin) u otras variables nominales que se deriven de sus
propios atributos naturales.
Los mtodos estadsticos que generalmente culminaban con medidas de
tendencia central o dispersin, o con los histogramas representativos de la
informacin recabada, ahora pueden ser llevados con una gran facilidad a las
aplicaciones no paramtricas y anlisis multivariados con auxilio del cmputo
estadstico.
Esto ha impactado de manera relevante a las ciencias de la educacin, forzando a
los investigadores a introducirse en los beneficios tecnolgicos que representan
los tratamientos cuantitativos para el manejo preciso de grandes volumenes de
informacin. En esta tcnica, que tiene carcter exploratorio, se pretende
precisamente mejorar la calidad de las decisiones tomadas en la educacin con el
auxilio de la estadstica y del cmputo, ampliando el acceso de usuarios a estos
beneficios tecnolgicos.

Descripcin de la tcnica de constelaciones correlacionales.


Antecedentes de la tcnica
Durante las diferentes confrontaciones del autor con problemas educativos, tanto
acadmicos como administrativos, surgieron numerosas opciones sobre las
soluciones, la validez de los resultados y las posibilidades del tratamiento de las
variables educativas para la toma de decisiones escolares. Al irse integrando la

Dr. Temstocles Muoz Lpez

122

Representaciones Grficas
tcnica se fue refinando progresivamente y clarificando su uso para observar el
logro de los objetivos institucionales, y en las perspectivas de la investigacin y
evaluacin continua en las escuelas, as como en otras aplicaciones derivadas
hacia otros campos de la administracin.
Por otra parte, se encontr que la tcnica de ASCC podra servir para explicitar el
proceso educativo en el aula, arrojando informacin til para la toma de decisiones
y la previsin y control de las variables, llevndolas a un proceso de desarrollo y
prueba en situaciones contingentes, dentro de un amplio espectro de condiciones
educacionales.
La necesidad de depurar y precisar la tcnica para facilitar la toma de decisiones,
tanto de la organizacin escolar como de la prctica educativa, llev al autor a
usarla en situaciones diversas (Romero Dvila. A. 1992 y Muoz Lpez, T. 1991),
adems de aplicarla en su tesis doctoral (Muoz Lpez, T. 1997).
Aqu se entienden las Constelaciones Correlacionales como diagramas o
configuraciones desarrollados para modelar o denotar la estructura de un sistema
mediante la aplicacin y desarrollo del anlisis de la correlacin estadstica.
Precisando, a partir de la correlacin tratada con programas de cmputo, se puede
configurar la estructura fundamental del sistema u orden que existe en la realidad,
adems de elucidar la relacin de las variables o elementos que lo constituyen en
una constelacin de condicionalidad mltiple.
Sin dejar de lado el punto de vista esttico, usted obtendr representaciones
grficas elegantes y explicativas en las presentaciones de carcter ejecutivo y con
el personal a su cargo, adems de garantizar resultados ms consistentes en las
propuestas que se deriven del anlisis de las estructuras modeladas.
Ms adelante tambin puede trabajar simulaciones con la alteracin de los valores
de alguna variable en estudio, antes de hacer los cambios en la realidad, por
ejemplo: Que sucedera si aumentamos el presupuesto destinado a la
capacitacin docente?, antes de programarlo en el gasto puede incrementar en

Dr. Temstocles Muoz Lpez

123

Representaciones Grficas
un, digamos 20%, los valores de su base de datos para sa variable y observar el
efecto del cambio resultante sobre la correlacin con otras variables como el
aprovechamiento escolar o el porciento de avance de los cursos.
Ello permitir decidir si aumentamos el apoyo a las variables precedentes.
Seguramente si antes no existi correlacin, ahora probablemente sea diferente,
pero es menos riesgoso simularlo en un modelo antes de hacerlo realmente.

La terminologa relativa a las constelaciones


La denominacin de constelaciones se refiere a la semejanza que tienen las
configuraciones que resultan de los sistemas estudiados, con las imgenes
mitolgicas estelares que explicaban o significaban un orden y afinidad aparentes
entre los fenmenos terrestres y los del cielo nocturno a los pueblos antiguos,
terminologa que hereda la astronoma moderna. El concepto de constelacin al
parecer se ha transformado en un trmino polismico, razn por la cual se precisa
a continuacin el sentido que aqu se le confiere.
Probablemente la psicologa y los estudios relativos al comportamiento han usado
en tiempos ms recientes el concepto de constelacin con mayor asiduidad (como
concepto, no como configuracin correlacional), sobre todo en sociogramas. Su
significado vara ampliamente y es utilizado para indicar situaciones donde se
presentan conjuntos, secuencias u ordenaciones de relaciones entre variables de
muy diverso tipo y niveles de complejidad.
Una presentacin de algunas investigaciones sobre el uso del concepto de
constelaciones, nos clarifican la polisemia del trmino. En 1980 Ann M. Johns
analiz la cohesin del discurso comercial; adems, B. Beebe y L. Gerstman
(1984) lo aplicaron para definir paquetes de entendimiento maternal facial-visual.
Entre otros estudios sobre "constelaciones", M. Hite y otros (1985), R. Williams y
B. E. Compas (1988), R. W. Bradley en 1982, R. Scott y David A. Stone (1986),
Auvenshine (1987) y Kreppner (1986) estudiaron constelaciones familiares.

Dr. Temstocles Muoz Lpez

124

Representaciones Grficas
Shore y otros (1987) estudiaron pacientes depresivos en tres culturas tribales
indias

americanas

concluyen

precisando

tres

distintas

constelaciones

influenciadas culturalmente, G. D. Rowles en 1982 distinguiendo constelaciones


de principios de soporte, y E. Shapiro y R. Tate (1988) utilizaron modelos de
constelaciones con regresin mltiple. Brian Kidd (1984) condujo un estudio sobre
constelaciones de recursos disponibles en el campus y el paso de los alumnos del
nivel medio superior a la universidad. Por otra parte, G. Karrby (1986) estudi las
constelaciones grupales en preescolares analizando sus interacciones.
Barbara L. Goedel (1985) identific relaciones en las constelaciones fraternales
usando anlisis multivariado, en tanto que Byrnes y Canale (1987) trazaron
constelaciones histricas en enseanza de lenguas extranjeras. Por otra parte,
Dale H. Schunk (1987) indica que el complejo de constelaciones de aptitudes
predice mejor el aprendizaje que cualquier aptitud sola.
Iran Nejad, A. y A. Ortony (1982) discuten la organizacin funcional de las
constelaciones de elementos neuronales. En un trabajo posterior (1983) los
mismos autores conciben las constelaciones de elementos neuronales como
microsistemas fisiolgicos en tanto que Goodman (1989) considera el autismo
como resultado de constelaciones de inapareamientos funcionales.
Malow y otros (1989) encontraron diferentes constelaciones de problemas de la
personalidad, y adicionalmente L. Perfetti (1990) codifica constelaciones
fraternales para programas que salvan memoria de microcomputadora.
Como se observa, la polisemia del concepto se refiere a diversos campos
profesionales y a muy variadas metodologas.
Se pudieron encontrar adicionalmente esquemas metodolgicos que dieron ideas
acerca del desarrollo de sta tcnica en trabajos como los de Peter H. Smith
(1981), sobre la Movilidad Poltica en el Mxico Contemporneo haciendo uso de
la probabilidad estadstica. Tambin estn en las correlaciones entre especies de

Dr. Temstocles Muoz Lpez

125

Representaciones Grficas
plantas por Anlisis de Componentes Principales de Laura Pla (1986) y en el
Programa Integral de Investigacin Educativa de la S.E.P. (1985).

El proceso y la seleccin de los datos


La matriz con el concentrado de datos capturada en un programa de cmputo
estadstico procesa la correlacin, as obtendremos las relaciones de la variable
uno con el resto y sucesivamente las siguientes hasta obtener todos los resultados
en pantalla.
Los listados comprenden generalmente el nmero o nombre de las variables, el
nmero de casos procesados en la muestra, el valor de r que existe entre dos
variables (valor correlacional), adems del valor de la probabilidad estadstica.
Este ltimo en la mayora de los programas puede aparecer a la cabeza del listado
como p igual a cero, o sea la probabilidad con que se prueba la hiptesis nula. En
la medida en que aumente el valor de p, aumentar la probabilidad del error hasta
llegar a un mximo de 1. Otros programas dan el nivel de significancia, como
anlogo a la probabilidad, que nos indica que hay escasa probabilidad (p<0.05) de
que la relacin encontrada se deba al azar.
Mendenhall (1982), menciona que..."es improbable que un fenmeno, observado
en ciencias fsicas y especialmente en ciencias sociales, sea funcin de una sola
variable. As, es probable que el coeficiente de correlacin entre el promedio de
aprovechamiento acadmico y cualquier otra variable sea bastante pequeo y de
valor cuestionable".
Dado que usted requiere trabajar con un alto nivel de precisin, para el caso de p
igual a cero se procede a seleccionar las variables marcando en los listados las
que tengan valores iguales o menores de 0.05 de probabilidad de error, o mejor p
igual o menor ( ) que 0.01 de probabilidad de error, de acuerdo al criterio del
investigador, criterio que para todos los casos necesita ser el mismo y precisado al
principio de la investigacin.

Dr. Temstocles Muoz Lpez

126

Representaciones Grficas
Los valores aceptables de r que se busca obtener dependen del tamao de la
muestra. A muestras ms grandes el valor de r aceptable es menor y viceversa.
Usted necesitar saber stos valores antes de leer los datos para saber cuales
son las correlaciones aceptables, para lo cual se presentan en la Tabla 2, donde
se busca el valor de r aceptable segn el nivel de probabilidad de error que haya
fijado.
Por ejemplo, si su muestra es de 127 personas o casos, y busca el valor de r
significativo a una probabilidad de error menor o igual a 0.05, buscar en la tabla
el valor de r equivalente a 125 casos (n-2 g.l.) que en ste caso es de r (mayor o
igual a 0.159 para aceptar la correlacin entre las variables como significativa.
Si en los valores de la tabla para el tamao de la muestra no est su caso, es
necesario buscar el valor adecuado en las tablas de los textos de estadstica o en
programas especializados de acuerdo al valor de probabilidad deseado y el
tamao de la muestra.
Tabla 2. Valores significativos de r para diferentes tamaos de muestras (n), representados por los
grados de libertad (g.l.). La probabilidad de error (p) aceptada es de 0.05 o 0.01.
g.l. (n2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

r con
p=0.05
0.997
0.950
0.878
0.811
0.754
0.707
0.666
0.632
0.602
0.576
0.553
0.532
0.514
0.497
0.482
0.468
0.456
0.444
0.433
0.423
0.413

r con
p=0.01
1.000
0.990
0.959
0.917
0.874
0.834
0.798
0.765
0.735
0.708
0.684
0.661
0.641
0.623
0.606
0.590
0.575
0.561
0.549
0.537
0.526

g.l. (n2)
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
125
150
200
300
400

Dr. Temstocles Muoz Lpez

r con
p=0.05
0.388
0.381
0.374
0.367
0.361
0.355
0.349
0.325
0.304
0.288
0.273
0.250
0.232
0.217
0.205
0.195
0.174
0.159
0.138
0.113
0.098

r con
p=0.01
0.496
0.487
0.478
0.470
0.463
0.456
0.449
0.418
0.393
0.372
0.354
0.325
0.302
0.283
0.267
0.254
0.228
0.208
0.181
0.148
0.128

127

Representaciones Grficas
22
23

0.404
0.396

0.515
0.505

500
1000

0.088
0.062

0.115
0.081

Los datos significativos seleccionados (es recomendable sealarlos con


marcatextos) se pasan a un listado donde se indican progresivamente las
variables en estudio, seguidas de los nmeros de las variables con las cuales
guarda correlacin significativa cada una de ellas, teniendo especial cuidado de
denotar con un subrayado y con el signo negativo (-), las correlaciones negativas
que aparecen en los listados de cmputo. Se da como ejemplo la Forma 1.
Forma 1. Listado de variables correlacionadas en un estudio los intereses y hbitos de los alumnos
de una escuela tcnica forestal de nivel medio superior.
Variable
1. Inters por Act. al aire libre
2. Inters mecnico
3. Inters por el clculo
4. Inters cientficos
5. Inters persuasivo
6. Inters artstico
7. Inters literario
8. Inters musical
9. Inters por servicio social
10. Inters de oficina
11. Coeficiente intelectual
12. Promedio de hbitos y habilidades (13 a 21)
13. Motivacin para estudiar
14. Organizacin del tiempo
15. Concentracin
16. Lectura de textos
17. Elaboracin de apuntes
18. Redaccin de ensayos e informes
19. Disponibilidad de materiales
20. Revisin de contenidos vistos
21. Preparacin de exmenes
22. Memorizacin y Transf. de Conocimientos

Variables correlacionadas3
4, -5, -10, 11, 12, 13, 16.
-9, 11.
-9
1, -8, 11, 12, 14, 16, 19.
-1, -6, -16.
-5, 8, -13, -17.
Sin variables correlacionadas.
-4, 6.
-2, -3.
-1, -16, -24, -27.
1, 2, 4, 12, 19.
1, 4, 11, 13 a 21. (no se grafica)
1, -6, 12, 16, 17.
4, 12.
12, 18, 20, 21.
1, 4, -5, -10, 12, 12, 19, 20.
-6, 12, 13.
12, 15, 18, 21.
4, 11, 12, 16, 18.
12, 13, 15, 16, 21.
12, 15, 18, 20.
Sin variables correlacionadas.

Al trmino del listado se pueden seleccionar las variables que tienen una relacin
espuria (por carecer de sentido o no posibles en la realidad), labor de limpieza que
nos dejar menos relaciones y por lo tanto, menos trabajo al elaborar
posteriormente el diagrama del sistema.

Elaboracin de las constelaciones correlacionales


3

Las correlaciones negativas en el concentrado de datos se marcan subrrayndolas.


Dr. Temstocles Muoz Lpez

128

Representaciones Grficas
A partir de este punto se precisa la parte prctica de la tcnica que consiste en
denotar la estructura del sistema con las variables y sus correlaciones. Se
recomienda el uso de pizarrones blancos de acrlico con marcadores de tinta
fugaz, ya que se borran fcilmente al desplazar las variables, aunque puede
utilizar tambin hojas de rotafolio, lpiz y borrador. El proceso lleva a los siguientes
pasos:
3) Se dibujan crculos que semejan la disposicin de las horas en una cartula de
reloj (ver Figura 2), tantos crculos como variables existan y dentro de ellos se
anota el nmero de la variable (puede ponerse texto, pero ste tiene la
desventaja de ocupar demasiado espacio que en este paso puede ahorrarse).

2
1

2
2

2
3

2
0

1
9

1
8

1
7

7
1
6

8
1
5

9
1
4

1
3

1
2

11

1
0

Figura 2. Variables dispuestas inicialmente en forma de cartula de reloj. El ejemplo corresponde al


estudio del perfil del alumno de nivel medio superior de la Escuela Forestal de la SARH en Saltillo
durante 1990.

4) De acuerdo a la lista inicial se trazan lneas que unen las variables


correlacionadas, quedando as una trama de lneas (correlaciones)
entrecruzadas. Observe que no se incluyen las correlaciones de la variable 12
porque es un promedio de las siguientes diez y produce complicaciones
innecesarias porque correlaciona con todas las variables que lo originan.

Dr. Temstocles Muoz Lpez

129

Representaciones Grficas
5) Haciendo uso de la imaginacin, pensemos que las lneas son hilos mviles y
elsticos que unen las variables. Esto, en una hoja de papel o pizarrn, nos
permite desplazar fcilmente primero aquellas variables (crculo numerado)
que tengan menos relaciones (1 o 2 lneas) hacia espacios externos a la
cartula del reloj, cerca de las variables con las que se relacionan. Ser
necesario borrarlas y redibujarlas en la nueva posicin, iniciando por mover a
aquellas variables que tienen pocas lneas o relaciones (Figura 4). Repita el
proceso con otras variables.
1

22

21

20

19

18

17

16

8
15

9
10

14
13

1
0

12

11

1
2
4
1
1 que denotan las correlaciones entre las variables. Las correlaciones positivas son
Figura 3. Lneas
2
4
lneas slidas y5las negativas
0 punteadas.
8
6) Buscamos que en el diseo final no exista ninguna lnea que se sobreponga
a
1
5
otra, o sea, lneas cruzadas.
Ahora procuremos mover las variables
de los
9
crculos numerados que
tengan ms relaciones al centro de la cartula
imaginaria1 inicial en todos los casos posibles. Como se puede observar, la
longitud de
8 las lneas variar con los cambios de posicin, esto no es
importante, pero poco a poco nos llevar a que el sistema o modelo se
6
flexibilice y vaya tomando su propia configuracin.

2
2
1
2
7

1
6

1
7
Dr. Temstocles Muoz Lpez
1
3

11

130
3

Representaciones Grficas

Figura 4. Resultado de la primera descomposicin de variables.

7) El cruce de las lneas tiene que ser resuelto en su totalidad, situacin que se
complica si tenemos muestras demasiado grandes, dado que tendremos
numerosas relaciones con bajos valores correlacionales pero con un alto nivel
de significancia.
8) Ahora se puede proceder a anotar en el extremo de la lnea una punta que la
convierta en flecha, lo que indicar la posibilidad de una relacin de
condicionalidad e influencia de unas variables sobre otras. Sin perder de vista
que deseamos estructurar un sistema explicativo, el criterio que lleva implcita
la direccin de la flecha es el de temporalidad,
o sea que se presupone y se
6
tiene evidencia de la existencia
previa y la influencia de una variable (fuente de
5
la flecha), para que suceda una respuesta en otra (destino de la flecha). Si no
tiene evidencia terica o emprica 1de la temporalidad y/o de la supuesta
3 el caso especfico que estudia, evite
condicin previa de las variables para
1
indicar los direccionamientos, slo dibuje la lnea.
7
1

9) Como paso final se procede a revisar las correlaciones negativas


representadas por lneas punteadas (o de otro color), ya que sto indica el
sentido de la correlacin (positivo o negativo).
1
6

1
0

11
4

2
0
1
5
1
8

1
4
2
1 Dr. Temstocles 1Muoz Lpez
9
7

1
2

131
2
2

Representaciones Grficas

Figura 5. Constelacin correlacional ajustando la posicin de las variables.

Dado que estamos trabajando con una correlacin entre mltiples variables,
generalmente la expresin de una de ellas est condicionada por un nmero que
puede ser muy grande de variables, y se presume por lo tanto que sobre ella no
hay

un

efecto

puro

nico.

Podemos

decir

que

esperamos

una

multicondicionalidad (ver Figura 5 y la final Figura 6), y a veces permanecen lneas


cruzadas que implican una configuracin en tercera dimensin.
10)Considerando lo anterior, pueden analizarse6 las variables de importancia
especial ponindolas al centro
de las dems con las que se correlaciona
5
(Figura 7).
1

11) No olvide anotar en su esquema final,


3 al margen, aquellas variables que
1
quedaron aisladas del sistema y participaron 7en la investigacin sin tener
correlaciones, eso ayuda tambin a explicar el sistema que se estudia.
1

1
6

1
0

11
4

2
0
1
5

1
4
3

2
1 Temstocles Muoz
Dr.
1 Lpez
9
1
8

1
2

132
2
2

Representaciones Grficas

Figura 6. Resultado de la constelacin correlacional final.

Se presenta en la Figura 7 un ejemplo de variables de especial inters ubicadas


en el centro del diagrama. stas no son constelaciones correlacionales pero
competan la explicacin del fenmeno que estudiamos.
1

1
1
6

16

4
1
4

20

11

1
9

1
1
9
0
Figura 7. Ejemplo de correlaciones con una variable de inters en el centro.

Lectura de las constelaciones


Toda vez que tenemos configurada la constelacin correlacional, ser necesario
leerla para transformarla en una explicacin del comportamiento del modelo.
Para esto se puede proceder de dos formas, la primera consiste en aislar
imaginariamente subconjuntos de variables que aparecen ms o menos

Dr. Temstocles Muoz Lpez

133

Representaciones Grficas
independientes en el sistema, transcribiendo el significado de estos subconjuntos
para posteriormente leerlos como el sistema total.
En el segundo mtodo se puede tomar de los listados una variable de nuestro
inters y aisladamente, se hace incidir sobre ella a las lneas o relaciones que
guarda con otras variables, procurando hacer nfasis en sus caractersticas y
consecuencias (Figura 7). Este procedimiento es complementario del primero y de
gran importancia cuando unas pocas variables concentran muchas relaciones.
Es conveniente que identifiquemos tentativamente las variables iniciadoras
predisponentes o desencadenantes como aquellas de las que parten las lneas o
flechas, las variables mediadoras como aquellas que condicionan, reciben y
aportan efectos en otras variables en un numero aproximadamente igual. Las
variables finales caen en esa clasificacin tentativa por el hecho de solo recibir
efectos de otras variables y por lo tanto son el producto del sistema.
Es necesario que al final de la lectura de los resultados reconsidere la clasificacin
original de las variables y su pertenencia a una determinada categora o variable
compleja. En la grfica elaborada es tambin recomendable dejar anotadas las
variables aisladas (las que no resultaron correlacionadas con otras) y revisar que
no estn presentes las correlaciones espurias, sin sentido o ilgicas.
Probablemente no exista algo ms valioso que la experiencia de las personas o
investigadores que se relacionan vivencialmente con el objeto de investigacin,
siendo ellos los que pueden destacar o corregir la direccin de las relaciones y
apoyar objetivamente la lectura del sistema.
Por otra parte, si sta tcnica se aplica en investigaciones cientficas formales, no
precisamente en las operacionales y diagnsticos, evite el uso de las flechas y
explore la informacin con otros estadsticos.

Las conclusiones y su validez externa

Dr. Temstocles Muoz Lpez

134

Representaciones Grficas
Los resultados que se presentan en la lectura de las constelaciones son
enunciados que se establecen a partir de una representacin grfica de las
variables y sus relaciones. El nmero de enunciados podr ser demasiado grande
como para explicarlo a otras personas, an en condiciones ptimas de tiempo y
ambiente.
Otra forma de presentar la explicacin de los resultados es mediante la obtencin
de conclusiones que sintetizan la lectura final. Para concluir necesitamos primero
reunir los enunciados de los resultados que se refieren a un mismo tpico.
Aqu es necesario pensar que estamos reduciendo varios enunciados en otro
mayor que los contiene, de sta manera nuestra atencin se dirige a las variables
ms importantes por su nmero de relaciones significativas, o por su posicin
generadora, mediadora o receptora de influencia de las otras variables en el
sistema estudiado.
Antes de presentar los resultados le conviene verificar la validez externa de su
investigacin, lo cual quiere decir que hay seguridad de extrapolarlos a la
poblacin de la que proviene la muestra, de otra forma tendr que afirmar que sus
estimaciones son vlidas al menos para los individuos muestreados.
Si la muestra fue adecuadamente seleccionada, de tal manera que todos los
individuos o casos tuvieron la misma probabilidad de ser tomados y, si su nmero
representa la proporcin adecuada de la poblacin, seguramente podr extrapolar
con niveles aceptables de confianza que adquiri al seguir con cuidado los pasos
y las recomendaciones prescritos en la tcnica.

Consideraciones finales
La tcnica ASCC que aqu se presenta es un intento de inducir a usar la
estadstica a todos aquellos maestros, directivos escolares y departamentos
acadmicos relacionados con la toma de decisiones, que contando con equipo de
cmputo, tienen la necesidad pero no los instrumentos conceptuales para el
enfoque de mayor precisin y confiabilidad de sus problemas y soluciones.
Dr. Temstocles Muoz Lpez

135

Representaciones Grficas
Es necesario que se considere que, si bien, se presenta la posibilidad de un
tratamiento ms completo de los datos para transformarlos en informacin,
siempre ser necesario profundizar en el conocimiento de la estadstica,
especialmente en puntos relacionados con el muestreo, normalidad, medidas de
tendencia central, medidas de dispersin, teora de la correlacin, diseo de
reactivos de respuesta, escalas y medidas y, los principios fundamentales de la
logstica de la investigacin cientfica.
Si usted se interesa en los fundamentos, aplicaciones y las novedades de los
desarrollos estadsticos, es conveniente que consulte algunos textos de stas en
las ciencias naturales, sobre todo en ecologa cuantitativa, y explorando tambin
los nuevos programas de cmputo estadstico. La anterior recomendacin se debe
a que las aplicaciones matemticas en ciencias sociales para Mxico son muy
restringidas en profundidad y en nmero de casos de investigadores, en tanto que
en las ciencias naturales son prcticamente rutinas de trabajo de mayor amplitud.
Aunque en algunas tcnicas de toma de decisiones derivadas del anlisis
sistmico se plantea un objetivo despus de plantear el problema, a diferencia de
las investigaciones de otro tipo, esto se considera slo como una mencin sin
mayor profundidad, dado que el nivel operacional que se plantea aqu no lo
requiere.
La toma de decisiones se puede derivar fcilmente de la lectura de la constelacin
correlacional obtenida, sin embargo, el sistema o configuracin logrado debe ser
estudiado cuidadosamente para ver las variables que podemos manipular para
lograr los resultados deseados.
El xito y satisfaccin al obtener buenas decisiones usando sta tcnica se
incrementar progresivamente y el usuario la manejar con mayor precisin y
facilidad, sobre todo si se interesa en las lecturas adicionales que encuentre
relacionadas con el tema.

Dr. Temstocles Muoz Lpez

136

Representaciones Grficas
La tcnica que se presenta puede ser llevada, con los lmites de su imaginacin y
sus necesidades, a la toma de decisiones en otros campos de la administracin, la
investigacin de los fenmenos naturales, algunos casos de produccin de bienes
o estudios sociales.

Literatura de consulta
Agencia para el Desarrollo Internacional. 1971. Conferencias sobre Muestreo.
Curso suplementario para un estudio de caso sobre encuestas y censos.
Versin en espaol. Bureau of Census. U.S. Department of Commerce.
American Psychological Association. 1999. Electronic reference formats
recommended by the American Psychologycal Association. (1999,
November 19). Washington, DC. Retrieved November 3, 2000 from:
http://www.apa.org/journals/webref.html
Campbell, Stephen K. 1990. Equvocos y Falacias en la Interpretacin de
Estadsticas. Primera reimpresin. Ed. Limusa. Mxico.
Cochran, William C. 1985. Tcnicas de muestreo. Ed. CECSA. Mxico.
Colegio de postgraduados de Chapingo. 1996. Gua para autores. Agrociencia
30:4. 601-610pp.
Forns, M., T. Kirchner, y M. Torres. (1991). Principales modelos de evaluacin
psicolgica. L'estudi d'en llop Barcelona.
Garca Santos, Aguinaldo. 1990. Muestreo. Apuntes para la maestra en
Productividad de la UANE y la Maestra en Educacin de la U. A. de C.
Saltillo.
Gibaldi, Joseph, and Walter S. Achtert. MLA Handbook for Writers of Research
Papers, 3rd ed. NY: MLA, 1988
Isebrands, J.G. y T.R. Crow. 1975. Introduction to uses and interpretation of
Principal Component Analysis in Forest Biology. General technical Report.
USDA Forest Service. St. Paul, Minnesota.
Krejcie, R. V. and D. W. Morgan. 1970. Determining sample size for research
activities. Educational and Psychological Measurement. 30, 607-610 pp.
Li, Xia, and Nancy Crane. Electronic Style: A Guide to Citing Electronic
Information. Westport: Meckler, 1993.

Dr. Temstocles Muoz Lpez

137

Representaciones Grficas
Ludwig, John A. and James F. Reynolds. 1988. Statistical Ecology. A primer on
methods and computing. John Wiley & Sons. New York.
Mendenhall, William. 1982. Introduccin a la probabilidad y la estadstica.
Wadsworth Internacional/Iberoamrica. Belmont.
Modern Language Association (MLA on line). 2002. A Writer's Practical Guide To
MLA Documentation. http://ccc.commnet.edu/mla/practical_guide.htm.
Muoz Lpez, Temstocles. 1999. Recomendaciones para elaborar un
cuestionario de investigacin o para evaluacin en ciencias sociales.
Perfiles Ao 2, Nmero 12. Coordinacin General de Estudios de Postgrado
e Investigacin. Universidad Autnoma de Coahuila. Saltillo.
Muoz Lpez, Temstocles. 2000. Apuntes sobre muestreo. Perfiles. Ao 3,
Nmero 15. Coordinacin General de Estudios de Posgrado e
Investigacin. Universidad Autnoma de Coahuila. Saltillo. Artculo.
NCSS 2000. 1999. NCSS and PASS Trial. Users Guide. Utah.
Pla, Laura E. 1986. Anlisis multivariado: Mtodo de componentes Principales.
Monografa. Secretara General de la O.E.A. Programa Regional de
Desarrollo Cientfico y Tecnolgico. Washington.
Rojas Soriano, R. 1982. Gua para realizar Investigaciones Sociales. Textos
Universitarios. UNAM. Mxico.
Romero Dvila, Mara Antonieta. 1992. La capacitacin en el IMSS Delegacin
Coahuila, con la tcnica de Anlisis Sistmico por medio de Constelaciones
Correlacionales. Tesis de Licenciatura. Fac. de Ciencias de la Educacin y
Humanidades. U.A. de C., Saltillo.
S.E.P. Coahuila. 1985. Programa Integral de Investigacin Educativa. Saltillo.
Selltiz, C., L. S. Wrightsman y S. W. Cook. 1980. Mtodos de investigacin en las
relaciones sociales. Ediciones RIALP. Madrid.
Smith, Peter H. 1981. La movilidad poltica en el Mxico Contemporneo. In.
Lecturas de poltica Mexicana. Centro de Estudios Internacionales. El
Colegio de Mxico. Mxico.
StatSoft, Inc. (1997). STATISTICA for Windows [Computer program manual]. Tulsa,
OK: StatSoft, Inc., 2300 East 14th Street, Tulsa, OK 74104, phone: (918)
749-1119, fax: (918) 749-2217, email: info@statsoft.com, WEB:
http://www.statsoft.com
StatSoft, Inc. (2003). Electronic Textbook. Glossary.
http://www.statsoft.com/textbook/stathome.html

Dr. Temstocles Muoz Lpez

138

Representaciones Grficas
StatSoft, Inc. (2003). Electronic Textbook. Graphical Techniques.
http://www.statsoft.com/textbook/stathome.html
Young, Robert k. y Donald J. Veldman. 1981. Introduccin a la estadstica aplicada
a las ciencias de la conducta. 2 edicin. Ed. Trillas. Mxico.

Dr. Temstocles Muoz Lpez

139

También podría gustarte