MAESTRIA EN MBA V PROMOCION CON MENCION EN DIRECCION ESTRATEGICA

ESTADISTICA PARA LA TOMA DE DECISIONES

ESTADISTICA CUALITATIVA O DE ATRIBUTOS

SANDRA RIVERA RAFAEL GORDILLO MARCELO PAREDES DAVID REVELO FERNANDO RIVERA

OCTUBRE 2010

ordenación. y se debe trabajar con sólo los de la muestra. Por ejemplo.) a los que se refieren los datos que se consideran. resumen y análisis de datos de cualquier tipo sobre colectivos. que es lo más frecuente. será necesario utilizar no sólo las técnicas de la Estadística Descriptiva. siempre obligadas en todo caso para la comprensión de los resultados. sino también otras que permiten inferir afirmaciones sobre la población a partir de los datos de la muestra y que constituyen la Estadística Inferencial o Inferencia 2 . se estructuren y se resuman dichos datos para su mejor comprensión. Ello nos llevará a hablar de Estadística Descriptiva. Este conjunto puede venir dado de dos formas que condicionan toda clasificación interna de la Estadística. Si se dispone de datos de una o más variables sobre la población completa. considerar un grupo de elementos (personas. se ordenen. cosas. y que son las siguientes: a) Población . animales. y que es una parte (a menudo pequeña) de la población. en consecuencia. pues. o conjunto de todos los elementos cuyo estudio nos interesa. b) Muestra. lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística: es necesario. experimentos. la idea más adecuada es considerar que incumbe a la Estadística la recogida. y sus aplicaciones directas o indirectas.ESTADISTICA CUALITATIVA O DE ATRIBUTOS INTRODUCCION El concepto de Estadística es muy amplio. a la simple descripción de los datos se añade el interés por valorar hasta qué punto los resu ltados de la muestra son extrapolables o generalizables a la población. o se puede acceder a ellos. es decir. que se describan. Cuando no se puede acceder a los datos de toda la población. la Estadística tendrá como misión que la recogida sea adecuada. muy numerosas. etc. o conjunto de elementos de los que efectivamente se dispone de datos. el conjunto de los varones mayores de 65 años y residentes en una provincia sería una población.

- Las gráficas estadísticas dan una información similar a la de las tablas. pero de forma más directa. de ellas trata otro apartado. porque tienen un tratamiento distinto en todo lo que sigue. - Finalmente. el resumen de la información se realiza mediante las medidas de centralización. dispersión y posición. que se pueden resumir de esta forma: En primer lugar. se hará hincapié en que lo que se estudia son en realidad las variables. Por ejemplo. Los elementos fundamentales de la descripción de una variable son los que siguen en los apartados siguientes. 3 .Estadística. lo que nos obliga rá a distinguir los tipos básicos de ellas. - Las distribuciones de frecuencia son necesarias en el paso siguiente para expresar los resultados obtenidos mediante tablas estadísticas. el grupo de los varones mayores de 65 años y residentes en una provincia que son usua rios de bibliotecas públicas sería una muestra de la población citada en el párrafo anterior (otra cosa es que la muestra fuese o no representativa del conjunto de tal población).

Por ejemplo. Lo usual es considerar primero las variables una a una. son básicamente las siguientes: VARIABLES CUALITATIVAS. y consecuentemente las clases de datos que se pueden encontrar. Los tipos de variables. variables categóricas o atributos. para el que habitualmente se utiliza la letra n). sin plantearse problemas de asociación entre ellas. que son aquellas que no necesitan números para expresarse. cada dato no es más que la información de que un determinado elemento de la muestra 4 . el sexo de una persona es una variable cualitativa y ³varón´ o ³mujer´ son sus únicas modalidades. En consecuencia. cada forma particular en que pueden presentarse se denomina modalidad . También llamadas caracteres. Lo que se estudia en una muestra o población es una serie de variables en cada individuo o elemento. por lo que podemos pensar sólo en una variable de cuyos datos imaginamos disponer en una muestra (el número de datos es el llamado Tamaño de Muestra.TIPOS DE VARIABLES. para una variable cualitativa.

Entre la s variables cualitativas cabe distinguir: 1) las variables cualitativas ordinales. de forma que sus modalidades se enuncian siguiendo una cierta ordenación ascendente o descendente y no de otra manera. etc. en este orden. tales como la media. 3) las variables dicotómicas . la variable ³gravedad del pronóstico de lesiones traumáticas´ podría tener como orden natural entre sus modalidades ³leve´. 2) las variables cualitativas puras o nominales . pero nunca diríamos ³grave´. El hecho de tener sólo dos modalidades les confiere características especiales. pensando que convierten en ordinales a las variables. ya que no significan una verdadera ordenación natural de las modalidades) . Cabe citar como ejemplos el ya citado del sexo.. y en las que ni siquiera tiene sentido plantearse si son o no ordinales. y podemos utilizar cualquier ordenación para ellas. ³grave´. que son las que teniendo más de dos modalidades tienen establecido un orden natural entre las mismas. ³moderado´. que tienen sólo dos modalidades posibles. Por ejemplo. 5 . como por ejemplo el grupo sanguíneo o la nacionalidad de una persona (no hay que confundirse con ordenaciones arbitrarias. no teniendo sentido el empleo de promedios. y si responden a una escala ordinal. etc. ³leve´. ³moderado´. el pertenecer o no a una asociación. como el orden alfabético. solo se podrá utilizar la moda como resumen de la información. la mediana. que no tienen un orden natural preestablecido entre sus modalidades. o en general cualquier situación que sólo admita una respuesta ³sí o no´. Lo que nos planteamos en este tema es estudiar la posibilidad de establecer medidas similares a la correlación para este tipo de variables.presenta una determinada modalidad. ANALISIS DE DATOS Podemos obtener la distribución de frecuencias.

yi representaría el rango de B i.y Si los caracteres se pueden ordenar de acuerdo con cierta escala se puede llegar a unos coeficientes de correlación que mida el grado de asociación entre ellos.1. y Si las observaciones son nominales. Sean Ai y Bi los caracteres que presentan las observaciones. y sea x i el número de orden o rango que le correspondería a A i si ordenáramos esta característica. queremos estudiar el grado de asociación entre los caracteres A i y B i. CORRELACIÓN POR RANGOS. Se obtendrá fácilmente a partir del coeficiente de correlación lineal 1 N 1 N § . COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN. entonces se establecen los llamados coeficientes de asociación y contingencia . Basándonos en la concordancia o discordancia de las ³clasificaciones por rangos´ x i e yi. 1. 1.

x i i  x yi  y .

. y r= § .

x i x § .

y 2 i 1 N i 2 Como xi e yi son rangos. utilizando sus propiedades y operando convenientemente obtenemos el coeficiente de correlación ordinal o de Spearman : 6§ d i2 V ! 1 N N i 3 siendo d i=xi-yi 6 .

...y y y Varia entre 1 y ±1..1 n... nik nh1 nh2 « nhj . Para el atributo B se encuentra reflejada en la última fila y para el A en la última columna..2. Dicha tabla recibe el nombre de tabla de contingencia . n... V =-1...... A B B1 B2 TOTAL 7 .1. A A1 A2 « Ai « Ah TOTAL B B1 B2 « Bj « Bk n11 n12 « n1j .. .. . ... Si no la disconcordancia es perfecta... n1k n21 n22 « n2j .. . Si la concordancia de los rangos es perfecta. La observación simultánea de dos atributos da lugar a una tabla de doble entrada donde n ij indica el número de individuos que poseen conjuntamente las modalidades indicadas en la fila i -ésima y en la columna jésima. ni1 ni2 « nij .. .. . . N Las distribuciones que se refieren a uno solo de los dos atributos se denominan marginales.. La más sencilla es la que presenta dos modalidades mutuamente excluyentes para cada carácter... nh. V =1. .....k TOTAL n1. 1. n2.j .. n2k .. ..2. ... ASOCIACIÓN ENTRE CARACTERES NOMINALES. .. 1.. . nhk n. .2 « n.. TABLA DE CONTINGENCIA 2X2. nj.

CRITERIO DE ASOCIACIÓN. 1.A1 A2 TOTAL n11 n12 n21 n22 n. n2. entre los que destacaremos: Coeficiente de asociación H A1 y B1 son independientes si n1. Dos atributos son independientes cuando entre ellos no existe ningún tipo de influencia mutua. Lo que se reflejará estadísticamente en que la frecuencia relativa conjunta es igual al producto de las frecuencias marginales respectivas. Es contrario al de independencia. Para medirlos se han ideado diversos procedimientos. n. n.2.1 n 11= N . por lo tanto para medir la asociación podemos estudiar la diferencia n 11 - n1. coeficientes de asociación .2 n1. a la que llamaremos H. N haciendo las operaciones convenientes llegamos a la siguiente expresión para H: 8 . N 1.2.1 n. tendremos distintos grados de aso ciación.1 .3. Diremos que A y B están asociados si aparecen juntos un número de veces mayor del que cabría esperar si fuesen independientes. CRITERIO DE INDEPENDENCIA. Según que esa tendencia a coincidir o a no coincidir esté más o menos marcada.2.

n.3. Si H >0 los atributos presentan asociación positiva.j entonces A y B son independientes. j Si nij= N para todo i. En este caso tenemos h modalidades para el atributo A y k para el B. n22. El coeficiente varía entre  n12 n21 N y n11n22 N . n 11. 1. ni.1 N y y y Si H es 0 los atributos son independientes. n12. Este coeficiente presenta el inconveniente de que su amplitud depende de los valores que tomen N.H= Nn11  n1. n. TABLAS DE CONTINGENCIA hxk. n21. Para medir el grado de asociación entre A y B utilizaremos los siguientes coeficientes de confiabilidad: y Coeficiente de contingencia G2 9 . Si H <0 los atributos presentan asociación negativa. Otra expresión que podemos dar es H= n22 n11  n12 n21 N .

n.Si denominamos n ij la frecuencia conjunta corre spondiente a la modalidad A i de A y Bj de B y nij´ la que correspondería en el caso de ni. ´ ij es decir n ij´= N entonces: G . j que 2 fueran h k independientes.

Si A y B son independientes C=0. Si los atributos fueran independientes serían cero. y El cuadrado medio de la contingencia no es apropiado para constituir por sí mismo un coeficiente. lo que no se alcanza nada más que en el caso ideal de infinitas modalidades. 1 N 2 N  G2 10 . Por este motivo.n  nij ´ nij 2 = i 1 j 1 se le denomina también cuadrado de la contingencia. Pearson. dado que sus límites varían en cada caso. G2 1 N ! ! N N 2 h k 2 nij ´ ij se utiliza la expresión §§ n i !1 j !1 1 C= N2 G2 = . Coeficiente de contingencia de K. Otra fórmula es También denominada cuadrado medio de la contingencia. Pearson propuso el siguiente coeficiente Varia entre 0 y 1 . Ninguno de los dos coeficientes puede ser negativo.     G 2 h k = §§ n i !1 j !1 2 nij ´ ij N. Total asociación C=1. K.

C revelará un menor grado de asociación entre los atributos cuanto más próximo esté a cero. . y del . T2= Varía entre 0 y 1. N2 G 2 . Tschuprow propuso un coeficiente que depende de total de elementos. del número de filas y columnas. Coeficiente de Tschuprow y Para evitar los inconvenientes del coeficiente C. N.

h  1 .

sin mayor complicación (el rectángulo de una modalidad con frecuencia 7 tendrá altura 7 y así con todas). Los rectángulos suelen representarse separados en este tipo de gráficas. Si las bases de los rectángulos se dibujan todas iguales. El diagrama de sectores . que refleja como sectores de un círculo las - frecuencias de cada modalidad. consistente en asociar a cada - modalidad de la variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en horizontal y la escala de frecuencias absolutas o relativas en vertical.k  1 GRAFICAS ESTADISTICAS Así. para cumplir la regla fundamental de proporcionalidad basta 11 . par cumplir la regla fundamental antes citada basta tomar como alturas de los rectángulos directamente las frecuencias. Como el radio es constante en un círculo. para caracteres o variables CUALITATIVAS se pueden mencionar: El diagrama de barras o rectángulos . que también pueden aparecer con las barras horizontales y las modalidades situadas verticalmente.

Este tipo de gráficas es muy útil para comparar los resultados de una variable cualitativa en dos o más muestras. en los que se representa una misma figura para cada modalidad pero con tamaño proporcional a las frecuencias (pictograma por extensión) o una misma figura repetida tantas veces como sea necesario para reflejar la frecuencia de cada modalidad (pictograma por repetición). en trozos proporcionales a las frecuencias. en los que se representa cada modalidad sobre puntos o regiones de un mapa. o los diagramas de superficie . generalmente un rectángulo. Hay otras gráficas menos frecuentes pero igualmente válidas para variables cualitativas. 12 . cabe citar los pictogramas . lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa de cada modalidad.hacer al ángulo de cada sector proporcional a la frecuencia. en los que se divide una figura geométrica. los cartogramas .

Sign up to vote on this title
UsefulNot useful