Está en la página 1de 11
1. Introduccién 1.1. Introduccién En las dltimas décadas se ha producido un gran crecimiento del uso de las técuicas estadisticas multivariantes en todos los eampos de la investigacién cientilica, Podrian dlarse muchas razones para este usp creciente, pero quuizdss las dos mas importantes sean las siguientes (Dillon y Goldstein, 1984) + En la mayoria de las investigaciones cientifi esario analizar rela- ciones simultdneas entre tres o més variables, La investigaeién clentifica es un proceso iterative. Primero cs necesaria la formulacién explicita de las hipétesis que despu analisis de los datos. Estos anélisis probablemente sugieran una modifi- cacién de las hipotesis. En este proceso se aiiaden y eliminan continua mente variables, La complejidad de los fenémenos analizados hace que sean muchas las variables implicadas y, por ello, las investigaciones sean s han de contrastarse mediante la recogida yel necesariamente multivariantes. » El desarrollo de ordenacores con capacidad de almacenamiento y potencia, de procesamiento suficiente, acompai ven facies de usar, acdos de programas cad Pero j.cémo definir el andlisis multivariante? La tarea no es sencilla. Muchos autores (Hair ef al, 2014a) optan por la alternativa de mostrarlo como una. extension del andlisis bivariante, Bajo esta perspectiva, el anslisis multivariante serfa el easo general y las técnicas univariantes © bivariantes serfan los casos particnlares de la anterior. De ima manera algo mas formal, Kachigen (1991) define el anélisis amaltiva- rianle como la rama del andlisis estadistico que se centra en Ia investigacion simultanea de dos 0 més caracteristicas (variables) medidas en un conjunto de objetos. En esta definicién, volumtariamente laxa, el elemento central es la relacibn simultnea entre las variables. En otras palabras, las téenieas multiva- riantes difieren de las univariantes y bivariantes en que dirigen su atencién no al andlisis de la media y la varianza de una variable, o a la correlacion entre dos variables, sino al anslisis de las covarianzas 0 correlaciones que reflejan la relacién entre tres o mas variables. Alo largo de este libro, utilizaremos el término fjetos para referirnos a las personas, cosas 0 entidades de las que se toman las medidas. Las medidas, a las que casi siempre nos referiremas como variables, serfn las caracteristicas © atributos de los objetos que se consideran en la investigacion, 1.2. Niveles de medi: Medir es el proceso mediante el cual se asocian niimeros o sfmbolos a deter minadas caracteristicas de los objetos, de acuerdo con reglas preestablecidas (Sharma, 1996). Por ejemplo, a los individuos se les puede describir con res- ja de las variables pecto a earacteristicas como la edad, la educacién, Ios ingresos, el sexo o Ta preferencia por una marea uw otra, y se deben buscar escalas adecadas para medir esas caracteristicas. EL tipo de escala utilizado para medir una variable es fundamental en la cleccién y aplieacin correcta del andlisis multivariante. A modo de ejemplo, si queremos establecer si existe una relacién de dependencia entre el nivel de ingresos de un individuo y, por ejemplo, su edad, edueacién 0 sexo, no seri lo mismo si los ingresos estén medidos directamente en euros, que si se reeurre a una escala donde la medicion se hace por intervalos: 1 = [0,600], 2 = [601, 1200] y 3= (1201, oof. En el primer caso podremos recurrir a uma regresién lineal, en el segundo, probablemente debamos recurrir a una regresi6n logistica multino- nial. Stevens (1946) considers que cualqnier escala de medida puede clasificarse en alguno de los siguientes euatro tipos: nominales, ordinales, de intervalo o de razén, Esta clasificacién es la mds extendida y sera la que adoptaremos en este texto. Sin embargo, como sefiala Sharma (1996), no podemos dejar de sefialar que la aplicacién de esta clasificacion signe generando debates no resueltos en la literatura estadistiea, Puede consultarse Velleman ¥ Wilkinson (1993) para profundizar en esta cuestién, 1.2.1. Escala nominal Bh este easo, los nrimeros asignados a cada caracteristica se comportan como etiquetas, con tanta valides como letras del alfabeto, que de hecho tambien padrian asignarse. Su mision es distinguir entre diferentes valores; por ejemplo: sexo (hombre, mujer). En el proceso de codificacién se puede asignar 1 al valor hombre y 2 al valor mujer. Esto no signifiea que la mujer sea mayor que el hombre (2 > 1) ni el doble (2 = 1x 2), ni que existan personas de sexo intermedio (1,5). Por ello resulta totalmente inapropiado caleular estadés cos como la media © Ia varianza de una variable nominal, debiendo limitarnos a los recuentos de frecuencias, mada o tablas de contingencia cuando se cruce con otra variable nominal, Una exigencia baisica de las escalas nominales es que los objetos han de poder clasificarse en categorias que sean mutuamente excluyentes y exhaustivas, es decir, cada individuo debe poder asignarse a una y solo una categoria y todos los individuos han de poder clasificarse en las categorfas existentes 1.2.2. Escala ordinal No solo consigue distinguir entre valores, como Ja anterior, sino que ademits: establece un orden entre ellos. Consideremos que a un individuo se le pide que ordene 4 modelos de coche (A, B, Cy D) en funcién de que le gusten més © menos. Su respuesta es [A= 1, D = 2, C = 3 y B = dl. Bs obvio que el individuo no solo no prefiere igual al modelo A que al B, sino que, ademés, prefiere el modela A mais que el B. Sin embargo es muy importante sefialar que aunque las diferencias numéricas: entre las categorias sean muméri las diferencias de preferencia también lo sean. La diferencia de preferencia entre el automévil A y el D no tiene por qué ser la misma que entre el C y el B, aunque (2—1 = 4—3). Tampoco el automévil A se prefiere el dable que el D. Por lo tanta, em las escalas ordinales, tiene sentido distinguir y ordenar, pero no las diferencias ni las razones Los estadisticos que pueden ealcularse en este tipo de escalas son, ademas de los que se calculaban en las nominales, medianas y percentiles amente las mismas, esta no quiere decir que 1.2.3. Escala de intervalo Una escala de interval posee las caracteristicas de una nominal (diferentes valores representan diferentes caracteristicas de los objetos) y de Ia ordinal (mayor valor representa mayor presencia de la earacterfstica, por ejemplo la preferencia). Sin embargo la escala de intervalo aide una nueva propiedad: las diferencias también tienen sentido. Un ejemplo, que ademas es til para distinguir estas escalas de las de razén, es la medicién de la temperatura me- diante, por ejemplo, una eseala Celsius. $i el termémetro marca 35°, marca wna temperatura distinta a si marca 30° (como la nominal}, pero también marca nds temperatura (como la ordinal). Sin embargo, ademés, entre 35° y 30° hay 1a diferencia de temperatura que entre 30° y 25°: las diferencias iguales la mis en los cédigos se traducen en diferencias iguales en el atribute medido. Pero jtienen sentido las razones? Esto no es tan seneillo de ver. Aparente- mente 20° es el doble de temperatura que 10°. Sin embarge veamos esta misma medicién en una escala Fahrenheit (figura 1.1). El atributo que se esta midien- do es el mismo, la temperatura, pero decir que 20° es el doble de 10° en Celsius implicaria decir que 68° es el doble de 50° en Fahrenheit, y Siempre que el atributo que se esté midiendo no tenga un cero absoluto, sino que este sea arbitrario, estaremos ante escalas de intervalo. Es el caso, por ejemplo, de los calendarios, donde el cero se ha colocado arbitrariamente en el nacimiento de Cristo, pero hay calendarios eon otros eeras y, de nueva, las diferencias de afies tendran sentido pero las razones, cuando se comparen, no. to no es ast

También podría gustarte