MAESTRIA EN MBA V PROMOCION CON MENCION EN DIRECCION ESTRATEGICA

ESTADISTICA PARA LA TOMA DE DECISIONES

ESTADISTICA CUALITATIVA O DE ATRIBUTOS

SANDRA RIVERA RAFAEL GORDILLO MARCELO PAREDES DAVID REVELO FERNANDO RIVERA

OCTUBRE 2010

b) Muestra.ESTADISTICA CUALITATIVA O DE ATRIBUTOS INTRODUCCION El concepto de Estadística es muy amplio. o se puede acceder a ellos. Por ejemplo. que es lo más frecuente. en consecuencia. considerar un grupo de elementos (personas. y que son las siguientes: a) Población . siempre obligadas en todo caso para la comprensión de los resultados. lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadística: es necesario. cosas. la idea más adecuada es considerar que incumbe a la Estadística la recogida. y sus aplicaciones directas o indirectas. y se debe trabajar con sólo los de la muestra. el conjunto de los varones mayores de 65 años y residentes en una provincia sería una población. o conjunto de todos los elementos cuyo estudio nos interesa. ordenación. muy numerosas. experimentos. pues. y que es una parte (a menudo pequeña) de la población. Si se dispone de datos de una o más variables sobre la población completa. será necesario utilizar no sólo las técnicas de la Estadística Descriptiva. o conjunto de elementos de los que efectivamente se dispone de datos. sino también otras que permiten inferir afirmaciones sobre la población a partir de los datos de la muestra y que constituyen la Estadística Inferencial o Inferencia 2 . la Estadística tendrá como misión que la recogida sea adecuada. es decir. animales. Ello nos llevará a hablar de Estadística Descriptiva. se estructuren y se resuman dichos datos para su mejor comprensión. Cuando no se puede acceder a los datos de toda la población. a la simple descripción de los datos se añade el interés por valorar hasta qué punto los resu ltados de la muestra son extrapolables o generalizables a la población. Este conjunto puede venir dado de dos formas que condicionan toda clasificación interna de la Estadística. resumen y análisis de datos de cualquier tipo sobre colectivos. que se describan.) a los que se refieren los datos que se consideran. se ordenen. etc.

lo que nos obliga rá a distinguir los tipos básicos de ellas. 3 . porque tienen un tratamiento distinto en todo lo que sigue. pero de forma más directa. - Las gráficas estadísticas dan una información similar a la de las tablas. de ellas trata otro apartado. Los elementos fundamentales de la descripción de una variable son los que siguen en los apartados siguientes. que se pueden resumir de esta forma: En primer lugar. se hará hincapié en que lo que se estudia son en realidad las variables. dispersión y posición. el resumen de la información se realiza mediante las medidas de centralización. el grupo de los varones mayores de 65 años y residentes en una provincia que son usua rios de bibliotecas públicas sería una muestra de la población citada en el párrafo anterior (otra cosa es que la muestra fuese o no representativa del conjunto de tal población). Por ejemplo.Estadística. - Finalmente. - Las distribuciones de frecuencia son necesarias en el paso siguiente para expresar los resultados obtenidos mediante tablas estadísticas.

por lo que podemos pensar sólo en una variable de cuyos datos imaginamos disponer en una muestra (el número de datos es el llamado Tamaño de Muestra. Los tipos de variables. En consecuencia. y consecuentemente las clases de datos que se pueden encontrar. Lo usual es considerar primero las variables una a una. variables categóricas o atributos. cada forma particular en que pueden presentarse se denomina modalidad . son básicamente las siguientes: VARIABLES CUALITATIVAS. para el que habitualmente se utiliza la letra n). sin plantearse problemas de asociación entre ellas. para una variable cualitativa.TIPOS DE VARIABLES. Lo que se estudia en una muestra o población es una serie de variables en cada individuo o elemento. el sexo de una persona es una variable cualitativa y ³varón´ o ³mujer´ son sus únicas modalidades. También llamadas caracteres. cada dato no es más que la información de que un determinado elemento de la muestra 4 . que son aquellas que no necesitan números para expresarse. Por ejemplo.

que no tienen un orden natural preestablecido entre sus modalidades. como el orden alfabético. de forma que sus modalidades se enuncian siguiendo una cierta ordenación ascendente o descendente y no de otra manera. Lo que nos planteamos en este tema es estudiar la posibilidad de establecer medidas similares a la correlación para este tipo de variables.presenta una determinada modalidad. etc. 2) las variables cualitativas puras o nominales . la mediana. Cabe citar como ejemplos el ya citado del sexo. etc. ³moderado´. y en las que ni siquiera tiene sentido plantearse si son o no ordinales. solo se podrá utilizar la moda como resumen de la información. El hecho de tener sólo dos modalidades les confiere características especiales. tales como la media. ya que no significan una verdadera ordenación natural de las modalidades) . la variable ³gravedad del pronóstico de lesiones traumáticas´ podría tener como orden natural entre sus modalidades ³leve´. pensando que convierten en ordinales a las variables. que son las que teniendo más de dos modalidades tienen establecido un orden natural entre las mismas. y si responden a una escala ordinal. ANALISIS DE DATOS Podemos obtener la distribución de frecuencias. Por ejemplo. o en general cualquier situación que sólo admita una respuesta ³sí o no´. ³grave´. 3) las variables dicotómicas . y podemos utilizar cualquier ordenación para ellas. no teniendo sentido el empleo de promedios. 5 . ³moderado´. que tienen sólo dos modalidades posibles. Entre la s variables cualitativas cabe distinguir: 1) las variables cualitativas ordinales. pero nunca diríamos ³grave´. ³leve´. como por ejemplo el grupo sanguíneo o la nacionalidad de una persona (no hay que confundirse con ordenaciones arbitrarias.. el pertenecer o no a una asociación. en este orden.

y Si las observaciones son nominales.y Si los caracteres se pueden ordenar de acuerdo con cierta escala se puede llegar a unos coeficientes de correlación que mida el grado de asociación entre ellos. COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN. 1. entonces se establecen los llamados coeficientes de asociación y contingencia . Basándonos en la concordancia o discordancia de las ³clasificaciones por rangos´ x i e yi. 1. Sean Ai y Bi los caracteres que presentan las observaciones. y sea x i el número de orden o rango que le correspondería a A i si ordenáramos esta característica. CORRELACIÓN POR RANGOS. Se obtendrá fácilmente a partir del coeficiente de correlación lineal 1 N 1 N § . yi representaría el rango de B i.1. queremos estudiar el grado de asociación entre los caracteres A i y B i.

x i i  x yi  y .

. y r= § .

x i x § .

utilizando sus propiedades y operando convenientemente obtenemos el coeficiente de correlación ordinal o de Spearman : 6§ d i2 V ! 1 N N i 3 siendo d i=xi-yi 6 .y 2 i 1 N i 2 Como xi e yi son rangos.

... n1k n21 n22 « n2j . .. n2. ni1 ni2 « nij .... .... .. . Dicha tabla recibe el nombre de tabla de contingencia .j . ...... V =1.2 « n. ASOCIACIÓN ENTRE CARACTERES NOMINALES.. La observación simultánea de dos atributos da lugar a una tabla de doble entrada donde n ij indica el número de individuos que poseen conjuntamente las modalidades indicadas en la fila i -ésima y en la columna jésima. 1..k TOTAL n1... N Las distribuciones que se refieren a uno solo de los dos atributos se denominan marginales... A B B1 B2 TOTAL 7 . n2k . .. 1... nhk n. .. nj. La más sencilla es la que presenta dos modalidades mutuamente excluyentes para cada carácter.2.1. nh. Para el atributo B se encuentra reflejada en la última fila y para el A en la última columna.... n. .2. Si la concordancia de los rangos es perfecta. . .y y y Varia entre 1 y ±1..1 n. .. nik nh1 nh2 « nhj . A A1 A2 « Ai « Ah TOTAL B B1 B2 « Bj « Bk n11 n12 « n1j .. TABLA DE CONTINGENCIA 2X2... . V =-1..... Si no la disconcordancia es perfecta. .

Dos atributos son independientes cuando entre ellos no existe ningún tipo de influencia mutua.2. Diremos que A y B están asociados si aparecen juntos un número de veces mayor del que cabría esperar si fuesen independientes. CRITERIO DE INDEPENDENCIA. Para medirlos se han ideado diversos procedimientos. coeficientes de asociación . entre los que destacaremos: Coeficiente de asociación H A1 y B1 son independientes si n1. CRITERIO DE ASOCIACIÓN. Lo que se reflejará estadísticamente en que la frecuencia relativa conjunta es igual al producto de las frecuencias marginales respectivas.3. n.2. N 1. 1. N haciendo las operaciones convenientes llegamos a la siguiente expresión para H: 8 . n.1 n.1 .1 n 11= N .2. Según que esa tendencia a coincidir o a no coincidir esté más o menos marcada. tendremos distintos grados de aso ciación.A1 A2 TOTAL n11 n12 n21 n22 n. Es contrario al de independencia. por lo tanto para medir la asociación podemos estudiar la diferencia n 11 - n1. n2. a la que llamaremos H.2 n1.

n. En este caso tenemos h modalidades para el atributo A y k para el B. El coeficiente varía entre  n12 n21 N y n11n22 N . n21. Si H <0 los atributos presentan asociación negativa.3. n12.j entonces A y B son independientes. j Si nij= N para todo i. Otra expresión que podemos dar es H= n22 n11  n12 n21 N . n 11.1 N y y y Si H es 0 los atributos son independientes. TABLAS DE CONTINGENCIA hxk. Si H >0 los atributos presentan asociación positiva. n. Este coeficiente presenta el inconveniente de que su amplitud depende de los valores que tomen N. Para medir el grado de asociación entre A y B utilizaremos los siguientes coeficientes de confiabilidad: y Coeficiente de contingencia G2 9 .H= Nn11  n1. n22. ni. 1.

Si denominamos n ij la frecuencia conjunta corre spondiente a la modalidad A i de A y Bj de B y nij´ la que correspondería en el caso de ni. n. j que 2 fueran h k independientes. ´ ij es decir n ij´= N entonces: G .

Total asociación C=1. lo que no se alcanza nada más que en el caso ideal de infinitas modalidades. y El cuadrado medio de la contingencia no es apropiado para constituir por sí mismo un coeficiente. Ninguno de los dos coeficientes puede ser negativo. K. Otra fórmula es También denominada cuadrado medio de la contingencia. Pearson. Por este motivo. Coeficiente de contingencia de K. G2 1 N ! ! N N 2 h k 2 nij ´ ij se utiliza la expresión §§ n i !1 j !1 1 C= N2 G2 = . Si A y B son independientes C=0.     G 2 h k = §§ n i !1 j !1 2 nij ´ ij N. Pearson propuso el siguiente coeficiente Varia entre 0 y 1 .n  nij ´ nij 2 = i 1 j 1 se le denomina también cuadrado de la contingencia. Si los atributos fueran independientes serían cero. dado que sus límites varían en cada caso. 1 N 2 N  G2 10 .

N2 G 2 . del número de filas y columnas.C revelará un menor grado de asociación entre los atributos cuanto más próximo esté a cero. N. y del . T2= Varía entre 0 y 1. . Coeficiente de Tschuprow y Para evitar los inconvenientes del coeficiente C. Tschuprow propuso un coeficiente que depende de total de elementos.

h  1 .

par cumplir la regla fundamental antes citada basta tomar como alturas de los rectángulos directamente las frecuencias. que también pueden aparecer con las barras horizontales y las modalidades situadas verticalmente. sin mayor complicación (el rectángulo de una modalidad con frecuencia 7 tendrá altura 7 y así con todas). que refleja como sectores de un círculo las - frecuencias de cada modalidad.k  1 GRAFICAS ESTADISTICAS Así. Como el radio es constante en un círculo. Si las bases de los rectángulos se dibujan todas iguales. consistente en asociar a cada - modalidad de la variable un rectángulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en horizontal y la escala de frecuencias absolutas o relativas en vertical. Los rectángulos suelen representarse separados en este tipo de gráficas. para cumplir la regla fundamental de proporcionalidad basta 11 . para caracteres o variables CUALITATIVAS se pueden mencionar: El diagrama de barras o rectángulos . El diagrama de sectores .

los cartogramas . en los que se divide una figura geométrica. generalmente un rectángulo. en los que se representa cada modalidad sobre puntos o regiones de un mapa. en trozos proporcionales a las frecuencias. Hay otras gráficas menos frecuentes pero igualmente válidas para variables cualitativas. Este tipo de gráficas es muy útil para comparar los resultados de una variable cualitativa en dos o más muestras. 12 . cabe citar los pictogramas . o los diagramas de superficie . lo que se consigue multiplicando los 360º del círculo por la frecuencia relativa de cada modalidad. en los que se representa una misma figura para cada modalidad pero con tamaño proporcional a las frecuencias (pictograma por extensión) o una misma figura repetida tantas veces como sea necesario para reflejar la frecuencia de cada modalidad (pictograma por repetición).hacer al ángulo de cada sector proporcional a la frecuencia.

Sign up to vote on this title
UsefulNot useful