Está en la página 1de 27

Lidia C.

Diblasi

CAPTULO I CONCEPTOS BSICOS DE LA ESTADSTICA La estadstica expresa cierto estado del alma colectiva E. Durkheim Qu es la Estadstica? Hugo Ambrosi en el primer captulo de su libro expresa: Una de las

definiciones ms breves e ingeniosas de la Estadstica dice que es la ciencia de aprender con los datos. La idea central en esa definicin es aprender, la que se caracteriza por una forma, la ciencia y un material, los datos. La ciencia, agrega, es la forma ordenada de adquirir conocimiento, mediante la observacin o la experimentacin que son dos formas de acumular datos de la realidad. Los datos son los signos que representan las caractersticas observadas de los fenmenos. Constituyen la quintaesencia de la experiencia (Ambrosi,2008; p.17) Manuel Garca Ferrando en la introduccin al primer captulo dice: La Estadstica, en trminos amplios y generales, puede considerarse como la ciencia de las regularidades que se observan en conjuntos de fenmenos naturales. Puede considerarse a la Estadstica tambin como la coleccin de mtodos cientficos que permiten el anlisis e interpretacin de la informacin numrica (Garca Ferrando, 1992; p. 23). En un cuadernillo que confeccion conjuntamente con el Lic. Edmundo Ricardo Romagnoli dedicado a la enseanza de la Estadstica aplicada a nuestros alumnos de las carreras de Trabajo Social y Sociologa construimos la siguiente definicin: la Estadstica es un procedimiento cientfico destinado a la recoleccin, presentacin, anlisis e interpretacin de datos". (Diblasi,L; Romagnoli, E, 2001;p.1) La importancia de la Estadstica Por qu es importante saber Estadstica? Porque nos guste o no, ella est

Lidia C. Diblasi

presente en todos los momentos de nuestra vida. Veamos algunos ejemplos: -Si nos recetan algn anlisis clnico, los resultados siempre incluyen algn intervalo dentro del cual estn los valores normales; si nos hacemos algn estudio radiolgico como densitometras, campos visuales, audiometras, etc. los resultados estn dados en nmeros que debemos comparar o incorporar en intervalos de valores normales o en valores de t o z, que significan cantidad de desvos respecto al promedio, -Si nos interesa el futbol, por ejemplo, vemos la posibilidad de que nuestro equipo favorito est primero en algn campeonato, contamos los goles que ha realizado en los partidos jugados y lo comparamos con los otros equipos, -Si nos preocupa la cantidad de gente que vive con sueldos inferiores a, o la cantidad de hijos que tienen las familias con sueldos inferiores a, -Si nos preocupa la cantidad de delitos que se han cometido desde el inicio del ao, comparado con los de aos anteriores; - Si nos tenemos que comprar algn electrodomstico, como heladera, lavarropas, etc. averiguamos precios en distintos lugares de venta y sacamos un promedio de cunto debemos disponer para poder adquirirlo; etc.

Para poder interpretar el cmulo de informacin que llega diariamente a nuestra vidas necesitamos conocer algo sobre qu son esos datos, cmo se obtuvieron, dnde, si se han generalizado a toda la poblacin o es slo una informacin de una porcin no representativa de la poblacin? Si no tenemos algn conocimiento de Estadstica podemos caer fcilmente en una trampa. Para no caer en alguna trampa, dice Ambrosi, debe fijarse claramente su verdadera naturaleza, como herramienta que sirve para abrir el camino en la bsqueda de la verdadLa Estadstica nos proporciona un mbito exterior a nosotros, un espacio objetivo y neutral, donde nuestro pensamiento puede ser

Lidia C. Diblasi

sometido a crtica y comparado con el de otros, ordenando el debate y facilitando el acuerdo entre los distintos actores, lo que refuerza los cimientos de nuestra accin colectiva. Tanto en la industria, el gobierno, en la salud, la educacin y el trabajo (Ambrosi; p. 26-27). La Estadstica nos suministra la informacin de una foto, la realidad en un tiempo y momento determinado, no representa a nadie en particular, es una visin de conjunto que nos permite razonar, nos permite el desarrollo de un pensamiento crtico. Cuenta con el auxilio de los ordenadores informticos que nos simplifican los clculos pero que nunca reemplazarn al razonamiento estadstico. Estadstica es razonamiento y clculo. Razonamiento como arte de la argumentacin, a la que todos debemos recurrir en la convivencia social. Clculo como prctica artesanal, que nos auxilia y facilita la organizacin de los argumentos (Ambrosi, 2008; p. 45) En general se puede decir que todo estudio referido a observaciones y ms concretamente a la obtencin de datos es susceptible para aplicar en l mtodos y tcnicas estadsticas. An en las ramas del saber menos pensadas de ser susceptibles de trabajar con nmeros como la Lingstica, por ejemplo. Estos mtodos y tcnicas surgen y se desarrollan en una determinada ciencia o en relacin a un fenmeno muy concreto que se est estudiando e inmediatamente encuentran aplicacin en otras ciencias. La Estadstica aparece en las Ciencias Sociales impregnada de una imagen contradictoria, de rechazo, por un lado por cuanto trabaja con nmeros que aparecen como de difcil comprensin e interpretacin y, de instrumento mgico por otro, ya que los estudios que poseen un aparato estadstico profuso aparezcan como ms cientficos. Ms all de esta bipolaridad de sentimientos, vivimos rodeados de informacin numrica por lo que es necesario que se

Lidia C. Diblasi

adquieran conocimientos bsicos y rigurosos sobre el contenido de la Estadstica. (Garca Ferrando, 1992;p.23) Es muy conocida la ancdota del primer ministro de la Reina Victoria, Benjamn Disrael, que dijo en una ocasin que haba tres clases de mentiras: mentiras, mentiras despreciables y estadsticas y es cierto que muchas veces se utilizan datos numricos para apoyar razonamientos falsos. Por ello siempre les digo a mis alumnos que los nmeros no mienten, quienes mienten, consciente o inconcientemente, son los que usan y abusan de los datos haciendo

inferencias que no son apropiadas. Por ello es importante conocer quin es la institucin o persona responsable de la informacin que se est usando. Cuando se recaba informacin siempre se lo hace en base a un inters especfico o particular, de acuerdo a los objetivos de la investigacin que se est realizando, por lo que generalmente sern incompletos o insatisfactorios para otros usuarios que esperan encontrar en ellos, los que necesiten de acuerdo a sus propios objetivos.

Cmo opera la Estadstica Hay dos principios bsicos, dice Ambrosi, que sostienen todo el edificio de la informacin sin los cuales ste se derrumbara estrepitosamente, ellos son: el consentimiento informado y el secreto o reserva estadstica. El primero hace referencia a que todo aqul que es interrogado durante un relevamiento debe ser informado del contenido y objetivo del estudio para que tenga la posibilidad de negarse a contestar parte o toda la entrevista. A su vez el secreto estadstico hace referencia a que no podrn revelarse datos individuales. Los datos deben difundirse nicamente en compilaciones de conjunto como cuadros o ndices. (Ambrosi,2008; P.91)

Lidia C. Diblasi

Estadstica aplicada Un experto es una persona que ha cometido todos los errores que se pueden cometer en un determinado campo Niels Bohr1 El objeto de la investigacin est en probar hiptesis desarrolladas tericamente, y los mtodos estadsticos resultan dichas pruebas. adecuados para efectuar Se debe tener en cuenta, sin embargo, que los procesos

implicados en pasar de la teora a las hiptesis reales de investigacin y de stas a los enunciados de probabilidad empleados en la inferencia estadstica no son en modo alguno directos, como bien seala Blalock (p. 5). En efecto, si se desean probar las siguientes hiptesis:"A medida que aumenta el nivel de urbanismo, disminuye el nivel de analfabetismo" Corresponder "analfabetismo". Ahora bien, los conceptos pueden ser definidos tericamente u operativamente. Se entiende por definicin terica, la explicitacin de un concepto mediante otros conceptos que se suponen previamente adquiridos. As por ejemplo, resulta posible, definir tringulo en funcin de los vocablos: figura, tres, ngulos. En un sistema completamente deductivo se toman ciertos conceptos sin definir y todos los dems se definen en trminos de los primeros. Sin embargo cuando el sistema sobre el cual se verificarn las hiptesis no es totalmente deductivo, las definiciones tericas, resultan inadecuadas para trabajar directamente, por tanto corresponde definir los conceptos en forma operativa. Por definicin operativa, se entiende un conjunto de acuerdos y convenciones que permiten afirmar si una unidad de anlisis posee una caracterstica particular y en su caso determinar la magnitud correspondiente. Expresado de otra manera, definir operativamente consiste en enunciar efectivamente los procedimientos empleados en la medicin. en primer lugar definir los conceptos "urbanismo" y

Citado por Ambrosi, Hugo.O. Ob Cit, pg. 83

Lidia C. Diblasi

Conceptos bsicos de la Estadstica Vamos a definir algunos conceptos esenciales de la Estadstica como son: 1- Dato: El dato constituyera la materia prima con la cual opera la Estadstica, razn por la cual conviene definirlo, precisar su estructura y establecer sus condiciones. Dato: Es el registro de una informacin. Es una magnitud cualitativa o cuantitativa. Por ejemplo el peso marcado en una lata de leche es mostrado en cierto nmero de gramos; los ingresantes a la U.N.Cuyo, en un ao determinado, se registran mediante un nmero; la situacin de desempleo en un pas es expresada mediante el nmero de personas en esas condiciones; el salario de un obrero se expresa en un nmero de pesos; la actividad que realiza una persona mediante una categora; el estado civil, mediante una categora; etc. Estos nmeros o categoras son datos estadsticos siempre que puedan ser comparados, analizados e interpretados. Un dato estadstico tiene una estructura tripartita compuesta de: unidades de anlisis, variables y valores a) Unidad de anlisis: es el elemento sobre los cuales se realiza el estudio, es decir, es el objeto de estudio, el objeto de medicin. Pueden ser: personas, instituciones, viviendas, hogares, familias, etc. b) Variables: son las caractersticas que sintetizan o abrevian conceptualmente lo que se desea conocer acerca de las unidades de anlisis, por ejemplo: edad, sexo, nivel socioeconmico, ingresos de las personas, tipos de vivienda, tenencia de la vivienda, instituciones sociales, tamao de los hogares, etc. c) Valores: son los resultados de la medicin, pueden ser magnitudes nominales (modalidades) o magnitudes

Lidia C. Diblasi

cardinales

(valores numricos) que alcanzan las variables que

se han elegido para decir algo sobre las unidades de anlisis. Lo que medimos no es la unidad de anlisis sino una caracterstica de la misma. Por ejemplo, si la variable es tenencia, la unidad de anlisis es una vivienda, el valor que puede asumir la variable tenencia puede ser: ocupada por el propietario, alquilada, ocupada gratuitamente, otros. Otro ejemplo: si la variable es la edad, la unidad de anlisis es una persona, el valor que puede asumir la variable edad es: 20 aos, 35 aos, 56 aos, otros. Podemos decir entonces que: "El dato es el registro del valor asignado a una unidad de anlisis en una variable determinada". Todo dato debe ser confiable, objetivo y vlido. Por confiable se entiende que, observaciones repetidas de las mismas respuestas registradas por un mismo observador deben producir los mismos datos. Si, por ejemplo, le preguntamos directamente a un entrevistado su opinin sobre la modificacin de la ley de radiodifusin y ste contesta que est muy de acuerdo. Al final de la entrevista se le vuelve a preguntar sobre el acuerdo de la modificacin de la ley, en una pregunta abierta para que el informante pueda expresar con detalles su postura y esta es ambivalente. No tenemos un dato confiable. Por objetivo se entiende que observaciones repetidas de las mismas respuestas registradas por observadores diferentes deben producir los mismos datos. Si un periodista le solicita a un entrevistado su opinin sobre si considera que la informacin sobre los actos del gobierno es manejada por los medios de comunicacin y le responde que no. Al finalizar nuestro entrevistado se encuentra con una persona vinculada al gobierno y ste le hace la misma pregunta y l contesta que si. Estamos ante la presencia de un dato no objetivo

Lidia C. Diblasi

Por vlido se entiende que los datos obtenidos deben medir la propiedad que se desean estudiar. Los principios ya mencionados de consentimiento informado y proteccin de la privacidad, constituyen tambin medios necesarios para que la informacin no se vea afectada en su validez y confiabilidad por los temores propios de los informantes en los interrogatorios.

DATO Estructura Tripartita

Unidad de anlisis u observacin

Variable

Valor

2- Poblacin Cuando estamos trabajando sobre un conjunto de unidades de anlisis es importante distinguir s lo hacemos con la totalidad de las mismas o con una parte. Todas las unidades cuya observacin interesa o sea el conjunto de todos los casos forman la poblacin objetivo. En cambio si por distintas razones, como tiempo y costo, solo examinamos una parte de los elementos de la poblacin objetivo, estamos ante una muestra. La muestra no es cualquier parte, sino una que represente con fidelidad al resto. (Ambrosi, pag.93) La poblacin es un conjunto finito o infinito de unidades de anlisis. Una poblacin estadstica o universo, lo forman el conjunto de todos los valores de las variables que desea medir el investigador en todas las unidades de anlisis (Garca Ferrando, 1992; 31) Es un conjunto que debe estar bien definido. Si nos

Lidia C. Diblasi

referimos a la poblacin formada por todos los estudiantes universitarios, debemos referirnos, para que esta poblacin est bien definida, al lugar y al tiempo. As, por ejemplo, si queremos estudiar la intencin de voto de los jvenes de la Provincia de Mendoza, debemos definir la poblacin objetivo como la poblacin de jvenes, entre 18 y 25 aos de Mendoza, en junio de 2009. Una poblacin no necesariamente est formada por seres vivos. Son poblaciones: las escuelas primarias, las plantaciones de via de una regin, los accidentes de una carretera, los delitos cometidos por los internos de una crcel, las viviendas afectadas por un terremoto, etc. 3- Muestra Una muestra es un subconjunto de la poblacin. La caracterstica de las muestras estadsticas es que se eligen sus unidades al azar en base a las

probabilidades asignadas a cada elemento de la poblacin para garantizar su neutralidad. De la forma que se realice la eleccin de la muestra depender la calidad de todo lo que se haga con ella. De la homogeneidad o heterogeneidad de la poblacin objetivo depender tambin el tamao de la muestra. Si todos los elementos de la poblacin son iguales, con una unidad o elemento que se estudie, conoceremos a la poblacin. En cambio si la diversidad entre sus elementos es muy amplia, el tamao requerido de la muestra ser mayor para que esta refleje la diversidad. A veces es ms importante tomar ms de una muestra, que una de gran tamao, ello permitir analizar la estabilidad de los resultados, al comparar las diferencias entre las muestras con medidas muy simples. Esto es imprescindible para que los resultados obtenidos sean verdaderamente tiles y confiables. Analizaremos ms profundamente este tema en el captulo de muestreo.

Lidia C. Diblasi

Por su tamao las muestras se

consideran generalmente pequeas ms de 30

cuando tienen hasta 30 elementos, y grandes cuando tienen elementos. Una muestra debe

reunir ciertas condiciones: representatividad y

aleatoriedad. La representatividad revela las caractersticas de la poblacin lo ms aproximadamente posible; la aleatoriedad implica que en la formacin de la muestra cada elemento del universo debe tener la misma probabilidad de ser elegido. A partir de una muestra se pueden estimar los valores de las medidas de la poblacin, los parmetros, como promedio, moda, mediana, desviacin tpica, etc., y tambin, probar hiptesis sobre los valores de dichos parmetros. As como a los valores de la poblacin se denominan parmetros, los de la muestra se denominan estadsticos o estadgrafos. La estadstica inferencial se ocupa de estos problemas por medio de procedimientos adecuados, tiles, para inferir con cierto riesgo conocido de equivocarse, si los resultados hallados en la muestra son verdaderos en la poblacin de la que se tom la muestra. Esto ocurrir siempre que la muestra se haya obtenido por medio de lo que se denomina "mtodos de probabilidad. La parte de la estadstica que trata solamente de describir y analizar los

resultados hallados en las muestras sin hacer inferencias en la poblacin se llama estadstica descriptiva. Al final del captulo retomamos esta clasificacin.

4- Medicin Medir es contar, comparar una unidad con otra y asignarle un valor. Es asignar nmeros a las caractersticas de los objetos. El sistema de medicin est formado por cuatro componentes: el objeto medido, el instrumento de medicin, el Sistema de referencia o Patrn de comparacin y

10

Lidia C. Diblasi

el operador, o encargado de poner en relacin a los otros tres componentes (Ambrosi, 2008: 116). Las mediciones son complejas por todos los elementos que intervienen en ella, y la complejidad se aumenta cuando lo que intentamos medir son intereses, opiniones, actitudes, etc. antes del acto material de la medicin hay actos complejos y difciles de definir, como la delimitacin de lo que ha de ser medido, la elaboracin de la regla, la concepcin e incluso a veces la materializacin de la unidad de medida y la misma construccin del instrumento de medida. En el momento de la medicin aparecen problemas difciles de abordar como son los referentes al conjunto de circunstancias en que se producen y que pueden confundirse con la medicin contaminndola. Por ltimo despus de la medicin se plantea todo el problema referido a las operaciones y pruebas tratamiento y anlisis- de los datos recogidos a su interpretacin y valoracin. (Prez Juste, 1989:12) Ms all de las dificultades que pueda tener la medicin, esta ocupa un lugar fundamental en la investigacin emprica. El investigador necesita los datos, resultados de la medicin, para poner a prueba sus hiptesis mediante las tcnicas estadsticas apropiadas, que le permitan verificarlas o rechazarlas, segn un cierto nivel de probabilidad. Los datos deben reunir tambin ciertas caractersticas, de lo contrario puede ocurrir que la informacin que se sumunistra no tenga relevancia si los datos de que se vale no representan adecuadamente la realidad medida.

5-Variables Podemos definir a las variables como una propiedad, caracterstica o un atributo que puede darse en ciertos sujetos o puede darse en grados o modalidades diferentes. Garca Ferrando dice que se puede definir una variable como cualquier caracterstica o propiedad de un objeto o acontecimiento que contenga dos o ms

11

Lidia C. Diblasi

categoras posibles en las que un objeto o acontecimiento pueda ser clasificado potencialmente

5.1- Variables cualitativa o categricas Son conceptos clasificatorios que permiten ubicar a los individuos en categoras o clases y son susceptibles de identificacin y medicin. A este tipo de variables se las llama categricas o cualitativas. Cuando las variables categricas se refieren solamente a la presencia o ausencia de una variable se las llama dicotmicas o binarias, por ejemplo: ser argentino o no, ser ocupado o no, rendir o no rendir una materia, etc. Las variables categricas o cualitativas son policotmicas cuando enumeran o hacen referencia a todas las modalidades posibles. Por ejemplo si nos referimos al estado civil de una persona, mencionamos las posibles categoras que puede asumir: soltero, casado, viudo, divorciado, separado de hecho, otros. Estas clases o categoras deben ser mutuamente excluyentes: cada unidad de anlisis pertenece a una sola categora; y exhaustivas: ninguna unidad de anlisis debe quedar sin poder clasificarse, es decir deben haber tantas categoras como distintos casos se presenten. 5.2- Variables cuantitativas Aquellas variables que se expresan por medio de un nmero se las llama variables numricas o cuantitativas. As por ejemplo, la variable nivel econmico de la familia divide a la poblacin en las siguientes categoras o modalidades: alto, medio, y bajo. Mientras que la variable ingreso divide a la poblacin segn los valores numricos que asuma el ingreso correspondiente a cada una de las familias; por ejemplo la familia Prez tiene un ingreso de $ 2500; la familia Salinas tiene un ingreso de $ 4800, etc.

12

Lidia C. Diblasi

La variable N de hijos divide a la poblacin segn la cantidad de hijos de cada familia: 0; 1; 2; 5; 9, etc. O bien en clases como: familias sin hijos familias con 1 a 3 hijos familias con 4 a 6 hijos familias con 7 o ms hijos Son muchas las clasificaciones que se pueden hacer de las variables adems de la divisin entre variables cualitativas y cuantitativas. Veamos algunas: 5.2.1- Variables numricas: discretas y continuas a) Variables continua: son aquellas que pueden tomar cualquier valor entre Talla de los alumnos. 1,65 m Precio de un libro: $ 30 Edad de un nio-. 3 aos. 2 meses, 18 das Tasa de natalidad de una provincia o pas: 22.52 por mil Ingreso de una familia: $ 2.590,50 b) Variables discretas: son aquellas variables que slo pueden tomar algunos Alumnas solteras de esta facultad Dientes de un nio Hijos por familia Accidentes por da N de familias bajo la lnea de pobreza. %.

dos valores dados por ejemplo:

valores entre dos valores dados. Por ejemplo:

13

Lidia C. Diblasi

VARIABLES

Categricas o Cualitativas Dicotmicas Policotmicas

Numricas o Cuantitativas Continuas Discretas

5.3- Variables independientes y dependientes Se designa con el nombre de variable independiente la causa real o supuesta de un fenmeno (fenmeno antecedente); y con el de variable dependiente al fenmeno consecuente. Conviene tener presente que no siempre la relacin de implicacin entre ambas variables es de tipo causal, sino que en muchos casos esa relacin simplemente quiere decir que las variaciones producidas en una de las variables se acompaan de variaciones en otra". Por ejemplo, si decimos que grado de cohesin que hay "El nivel de participacin depende del el nivel de participacin en una comunidad",

est dependiendo del grado de cohesin; en este caso podemos decir que el grado de cohesin es la variable independiente. Generalmente tratamos de explicar las variaciones de un fenmeno en base a un conjunto de factores, por ejemplo podemos estudiar los factores que influyen en el xito o fracaso de los estudiantes universitarios o en el rendimiento acadmico. Aquella variable que atrae la atencin del investigador y cuya variacin intenta explicar, la llamamos variable dependiente, porque se supone que los valores que asume la variable dependen de los valores que presentan otras variables. A estas variables las llamamos independientes o explicativas, porque permiten conocer las variaciones de la variable dependiente en una

14

Lidia C. Diblasi

poblacin dada.

En esta relacin entre la variable dependiente y la

independiente, se suele introducir en las ciencias sociales, una variable que se denomina interviniente, porque se supone que tiene un efecto determinado sobre la variable dependiente, que puede ser controlado o modificado por la variable independiente. (Garca Ferrando, 1992; 42) 6- Escalas o niveles de medicin de las variables Definimos a la "medicin" como la asignacin de nmeros a las

caractersticas de las unidades de anlisis u objetos segn determinadas condiciones. Las variables se clasifican generalmente en cuatro tipos de escalas o niveles de medicin, basadas en las propiedades de orden y distancia. Si la variable est bien definida utilizaremos uno de estos niveles y para cada uno hay distintos modelos estadsticos apropiados. La escala de nivel ms elevada es la de razn o cociente y emplea condiciones ms restrictivas, y la escala de menor nivel es la nominal y a la vez la menos restrictiva. Cada nivel de medicin cumple las propiedades del anterior y una ms. 6.1- Escala nominal o de clasificacin: es la escala de nivel ms sencilla. Consiste en aplicar nmeros, letras u otros smbolos para clasificar algunas caractersticas de las unidades de anlisis. Estos nmeros, letras o smbolos son como etiquetas que identifican particularidades de las unidades de anlisis. Slo nombran particularidades, de ah su denominacin de escala nominal. Ejemplos: - los colores de los uniformes que se emplean para distinguir al personal de un centro mdico, - los nmeros que llevan en la espalda los jugadores de ftbol (con estos nmeros no se pueden hacer operaciones matemticas)

15

Lidia C. Diblasi

- la clasificacin de las Profesiones segn el ttulo universitario de los profesionales: ingenieros, socilogos, siclogos, arquitectos, trabajadores sociales, otros; - la clasificacin de los delitos cometidos por los reclusos de una crcel: contra la propiedad, contra las personas, contra la honestidad, otros. Entre las unidades de anlisis de cada clase o categora se puede aplicar la relacin matemtica de equivalencia en el sentido de pertenecer a la misma categora. Por ejemplo: para pertenecer a la clase de los ingenieros la nica condicin requerida es poseer el ttulo de ingeniero. Se pertenece a esa clase o no se pertenece, pero no podemos presuponer que unos sean "mayores que" o "mejores que" los otros. Esta escala permite una clasificacin, pero no una

medicin (se habla de un sistema de medicin propiamente dicho cuando se pueden ordenar las categoras del sistema de clasificacin). En ella se pueden hacer slo algunas operaciones estadsticas: podemos contar cuntos elementos hay en cada categoras (frecuencia), ver cul categora tiene la mayor frecuencia (llamada clase modal). En estas escalas no se pueden aplicar las operaciones aritmticas que se realizan generalmente con los nmeros como son, suma, resta multiplicacin y divisin. Se pueden obtener medidas de asociacin como el coeficiente Q de Yule, el coeficiente phi, el coeficiente de contingencia, el coeficiente Lambda. En algunos caos se puede aplicar la prueba estadstica no paramtrica x (chi cuadrado) Bajo ciertas condiciones que pueden crear variables ficticias y aplicar nmeros a las distintas categoras, por ejemplo el n 1 a una categora y el 0 a todas las dems. Volveremos sobre este tema al estudiar anlisis multivariado.

6.2- Escala ordinal o de rango: en esta escala las unidades de anlisis de cada categora deben cumplir la relacin de equivalencia, y adems, las categoras no

16

Lidia C. Diblasi

slo se diferencian unas de otras, sino que mantienen entre s una relacin de orden para poder indicar cul es la superior. Tal relacin se expresa con el

signo > (leer "mayor que") o por el signo < (leer menor que"). Esta escala nos permite ordenar a las categoras en estadios, pero no nos dice nada acerca de la magnitud de las diferencias o distancias entre esas categoras. En las Ciencias Sociales son muy comunes estas escalas, como por ejemplo la que divide a los sujetos segn el nivel socioeconmico o en clases sociales; nivel de religiosidad, opiniones, actitudes, etc. A las distintas respuestas del estilo alto medio, bajo muy de cuerdo, bastante de acuerdo, poco de acuerdo, en desacuerdo, se le pueden asignar rangos: a) rango 1 2 3 4 5 b) rango 1 2 3 clase social alta media alta media media baja baja actividad religiosa muy religioso moderadamente religioso no religioso

Este tipo de medicin es de ms alto nivel que el de la escala nominal ya que no slo se puede distribuir a los sujetos u objetos en categoras diferentes, sino que adems se las puede ordenar. En esta escala tampoco se pueden utilizar las operaciones aritmticas comunes como suma, resta, multiplicacin y divisin. En las escalas ordinales se puede hallar la clase mediana, percentiles y aplicar los coeficientes de correlacin basados en los rangos, tales como el coeficiente rho de Sperman, y el coeficiente tau de Kendall. Para probar hiptesis y tomar decisiones debe recurrirse a las pruebas estadsticas no paramtricas que emplean datos medidos en la escala ordinal.

17

Lidia C. Diblasi

6.3- Escala de intervalos iguales o intervalar: estas escalas se caracterizan porque poseen una unidad de medida y un origen (cero) arbitrario. En estas escalas se puede medir la distancia o la diferencia numrica entre dos medidas cualesquiera. Ejemplos: a) Escalas termomtricas: en un da determinado en una ciudad A la temperatura alcanza un valor de 20 C y en una ciudad B es de 40 C. Podemos deducir: - en A la temperatura es diferente a la de B (informacin nominal). - en B la temperatura es ms elevada que en A (informacin ordinal). - que la temperatura en B sobrepasa a la de A en 20 C (informacin intervalar). No podemos decir que la temperatura en B es doble a la de A porque el cero de la escala termomtrica es arbitrario. CI (coeficiente intelectual: edad mental /edad cronolgica). En un test no

podemos decir que un puntaje de 100 puntos equivale al doble de uno de 50 puntos porque no se parte de un cero que indique falta total de capacidad. No podemos decir que una persona con un coeficiente intelectual doble que otro, es doblemente inteligente. En las escalas de intervalos iguales se pueden hallar el (Mo) modo, la (Me) mediana, la media aritmtica (x ), la varianza (s), el desvo tipo (s). Se puede aplicar coeficiente r de correlacin de Pearson. No se puede aplicar el coeficiente de variacin, ya que ste slo se debe calcular con los datos de una escala de razn, o sea en aquellas que poseen un cero absoluto. Se pueden aplicar las pruebas estadsticos paramtricas comunes como el test "t" de Student, test "F" de Fisher, siempre que se cumplan las exigencias requeridas en los supuestos de la poblacin.

18

Lidia C. Diblasi

Hay ciertos casos especiales que surgen cuando en la escala de orden existe cierto acuerdo respecto a la distancia que separa una categora de otra. Por ejemplo al considerar el grado de conformidad de un individuo respecto a alguna situacin en particular y la variable de respuesta se mide como muy conforme, conforme, indiferente, disconforme, muy disconforme, algunos autores consideran a esta escala de medicin como ordinal y otras como intervalar, dado el punto cero convencional (indiferente) Blanch, N. y Joekes, S (II Mdulo pag. 11) 6.4- Escala de razn o cociente o proporcin: esta escala posee Un cero absoluto por origen. El cero absoluto significa ausencia de la variable. Las medidas del Sistema Mtrico Decimal son ejemplos de medidas de esta escala. Ejemplos: Longitudes. Un camino A tiene una longitud de 600 km y un camino B tiene una longitud de 100 km. Podemos deducir: - el camino A es diferente al camino B ( informacin nominal) - el camino A es ms largo que el camino B (informacin ordinal) - el camino A es 500 km ms largo que el camino B (informacin intervalar). - el camino A es 6 veces ms largo que el camino B. El cociente entre dos valores de una escala de razn tiene un significado que puede interpretarse correctamente, en cambio, el cociente entre dos valores de una escala intervalar no tiene significado. Con los datos de una escala de razn pueden hacerse todas las operaciones estadsticas usuales. Se calcula el coeficiente de variacin = s/x porque para calcularlo se necesita el cero verdadero o absoluto de la escala. CV =
s x

Cuanto ms se avanza en la escala de medida, stas

incorporan las

propiedades de las escalas menos avanzadas. Un nivel de medicin es ms avanzado en cuanto ms propiedades cumple. Cada nivel de medicin cumple las propiedades del anterior y una ms, por eso es posible tratar las escalas

19

Lidia C. Diblasi

ordinales como nominales; a los de intervalo como ordinales y nominales; a las de razn como de intervalo, ordinales o nominales. Diremos que, en general, las variables se definen dentro del contexto especfico de investigacin que integran. Por ejemplo: La variable coeficiente intelectual puede ser: d) una variable nominal, si decimos que un nio es normal o anormal; e) una variable ordinal, si decimos que un nio es: Dbil mental Normal Superdotado c) una variable intervalar si decimos que tiene un coeficiente intelectual entre: Hasta 69 debilidad mental bien definida 70 - 89 inteligencia lenta 90 - 109 inteligencia normal o media 110-119 inteligencia superior 120-139 inteligencia muy superior 140-149 casi genialidad 150 y ms genialidad Con los datos de una escala de razn se pueden aplicar pruebas estadsticas paramtricas y no paramtricas. La diferencia entre prueba estadstica paramtrica y no partamtrica reside en las exigencias que se requieren en las suposiciones de la poblacin. En las Ciencias Sociales y de la Educacin son muy comunes las mediciones nominales y ordinales que, en general, deben pruebas estadsticas no paramtricas. Los datos medidos con escalas intervalares o de razn deben analizarse por pruebas estadsticas paramtricas, si los supuestos de la poblacin as lo requieren. Si con estos datos se aplican pruebas estadsticas no paramtricas se obtienen resultados que no reflejan en su totalidad la informacin contenida en los mismos. analizarse por

20

Lidia C. Diblasi

Al utilizar cualquier tcnica estadstica hay que tener en cuenta correctamente cules son los supuestos que hay que adoptar. Por ello, una de las primeras cosas que hay que considerar acerca de los datos es el nivel de medicin que pueden adoptar legtimamente. En el siguiente esquema podemos observar el tipo de variable en que se pueden medir los datos y los niveles de medicin asociados a los tipos de variables:

Escala Nominal Variable categrica o cualitativa Escala Ordinal DATOS Escala de Intervalo Variable numrica o cuantitativa Escala de razn

7- LOS MODOS DE OPERAR EN ESTADSTICA Algunos autores no aceptan la divisin de la Estadstica en descriptiva e inferencial. Pero al solo efecto de la enseanza me parece importante distinguir los procedimientos descriptivos de los especficamente inferenciales. El anlisis estadstico es uno solo, donde se combinan las metodologas descriptivas y las inferenciales, por ello hablamos de ambos procedimientos. Es importante aclarar que la sistematizacin y descripcin de los datos es un paso previo para poder realizar, la operacin fundamental de la Estadstica, la inferencia.

21

Lidia C. Diblasi

7.1- Estadstica Descriptiva Anlisis exploratorio La primera funcin de la estadstica al servicio de la investigacin es la de proveer descripciones y sistematizaciones de conjuntos numerosos de datos que permiten una exploracin de caractersticas numerables o mensurables de las unidades de anlisis. A los mtodos estadsticos por medio de los cuales se logra esta funcin se los denomina estadstica descriptiva simple. Las medidas generalmente usadas son: razones tasas, porcentajes, distribuciones de frecuencias, medidas de tendencia central, medidas de dispersin, medidas de asimetra y

apuntalamiento. Estas medidas reunidas condensan masas de datos y proporcionan una informacin eficiente. A menudo, un conjunto numeroso de valores referidos a un conjunto numeroso de unidades de anlisis, en una variable, pueden ser sistematizados en unas pocas medidas condensadas que conservan toda la informacin esencial. Una extensin de los mtodos descriptivos ms simples es la descripcin de una caracterstica en diferentes momentos. Otra extensin es la construccin de medidas indirectas

compuestas, llamadas nmeros ndices. La descripcin de la distribucin de una variable no satisface en muchos casos los propsitos de la investigacin. Otra funcin de la estadstica consiste en medir la asociacin que existe entre dos o ms variables. Si para cualquier grupo de unidades de anlisis se tienen dos o ms conjuntos de enumeraciones o mediciones, existen mtodos mediante los cuales se puede averiguar y describir concisamente la existencia, direccin y grado de la asociacin entre dos o ms variables. 7.2 - Estadstica Inductiva o Inferencial - Anlisis confirmatorio A causa de consideraciones prcticas, muy frecuentemente resulta imposible analizar la totalidad de las unidades de anlisis que componen una

22

Lidia C. Diblasi

poblacin, razn por la cual slo se estudia un pequeo subconjunto. Cuando este es el caso, un nmero limitado de unidades, o sea una muestra, se escoge del conjunto total. El mtodo de la eleccin de la muestra para el estudio debe ser cuidadosamente planeado, a fin de que la muestra sea representativa del conjunto respecto de la caracterstica o caractersticas que se investigan. El

estudio de los mtodos estadsticos usados en funcin inductiva, se suele denominar Estadstica inductiva o ms comnmente Estadstica Inferencial. Estos mtodos permiten calcular a partir de los valores obtenidos para la muestra estimaciones de medidas resumidas para todo el conjunto (poblacin o universo) Si el procedimiento utilizado para seleccionar la muestra ha sido el azar, se est en condiciones de ofrecer una estimacin de precisin fijando dos valores, uno por encima y otro por debajo del valor estimado, que encierren al valor correspondiente al universo o poblacin, teniendo confianza que a la larga habremos dado una estimacin correcta en el 95% de los casos. Por lo tanto, y sintetizando, se pueden enunciar las siguientes funciones estadsticas bsicas: 1 Describir cuantitativamente un sector de la realidad. 2 Relacionar dos o ms variables y medir su dependencia 3 Dada una o ms variables predecir el comportamiento probable de las unidades de anlisis en trminos de otra u otras variables. 4 Estimar ciertas caractersticas de un conjunto conociendo tan solo los valores correspondientes a una muestra. 5 Probar hiptesis respecto a diferencias significativas o no entre dos o ms conjuntos de datos provenientes de muestras aleatorias.

23

Lidia C. Diblasi

NIVELES DE MEDICION Y ESTADSTICAS APROPIADAS A CADA NIVEL Tcnicas Estadsticas Apropiadas (ejemplos) Pruebas Estadsticas Apropiadas (ejemplos)

Escalas

Propiedades

Nominal

Equivalencia

Ordinal

Equivalencia -Mayor que

Intervalar

Equivalencia -Mayor que - Razn entre dos intervalos calculable

Modo Frecuencia Coeficiente de contingencia Lambda* Q** Phi** Mediana Percentil Spearman Kendall(Tau) Gamma G** Phi** Media aritmtica Desviacin estndar Correlacin de Pearson* Correlacin mltiple Phi** Media aritmtica Media geomtrica Desviacin estndar Correlacin de Pearson* Correlacin mltiple Phi**

Pruebas no paramtricas

Pruebas no paramtricas y Pruebas paramtricas

De razn

Equivalencia Mayor que Razn entre dos Intervalos Calculable Razn entre dos valores de la escala calculable

* variables del mismo nivel de medicin ** Para dicotomas en tablas de 2 x 2

24

Lidia C. Diblasi

EJERCICIOS PROPUESTOS

!- Diga cul es el nivel de medicin en el cul est expresada la variable ingreso diario promedio de las familias compuestas por cuatro miembros de la Provincia de Mendoza, y diferencie, en la informacin suministrada, la estructura tripartita del dato, definiendo cada uno de sus componentes. El ingreso diario promedio de un grupo de familias de un barrio urbano es de entre 45 y 85 pesos (informacin suministrada por un equipo interdisciplinario perteneciente a la SeCyT). 2- Defina dato y sus componentes. Identifique en el siguiente ejemplo los componentes de la estructura del dato: Camilo tiene 4 hermanos 3- Defina Estadstica y diga qu diferencia hay entre Estadstica Descriptiva e Inferencial 4- Diga cul es el nivel de medicin en el cul est expresada la variable Coeficiente Intelectual y diferencie, en la informacin suministrada, la estructura tripartita del dato, definiendo cada uno de sus componentes. El C. I. de un grupo de nios de una escuela urbana es de entre 95 y 105 puntos. (informacin suministrada por un equipo interdisciplinario perteneciente al Ministerio de Cultura y Educacin). 5- Defina dato y sus componentes. Identifique los componentes de la estructura del dato en los siguientes ejemplos: Camilo es mayor que sus hermanos La familia de Camilo tiene un ingreso menor a la de los dems compaeros de escuela 6- Diga cundo un dato es confiable, objetivo y vlido. 7- En los siguientes ejemplos determine el nivel de medicin de las variables: Mariana es empleada pblica Mariana tiene 15 materias rendidas 8- Explique los niveles de medicin de las variables y de dos ejemplos de cada uno. 9- Explique los conceptos : exhaustivos y excluyentes. De dos ejemplos de variables aplicando estos conceptos.

25

Lidia C. Diblasi

10- Exprese cmo trabajara para determinar el nivel de desercin en las diferentes unidades acadmicas de la UNCuyo, con una muestra o con una poblacin ?Justifique su respuesta 11- Defina con sus palabras lo que entendi por medicin. 12- Determine el nivel de medicin de las siguientes variables: - cantidad de poblacin desocupada por departamentos. - Ingreso per cpita de las personas ocupadas en un rea determinada - Nivel de influencia de una secta en un rea determinada. - Nivel de instruccin de las personas asistentes a una charla sobre temticas de salud - Nombre otorgado a los diversos partidos polticos - Porcentaje de mujeres analfabetas por departamentos - Costo de la canasta bsica de alimentos por provincia - Edades de los nios vacunados en una escuela primaria - Nmero de integrantes por familia en distintos sectores del Gran Mza. - Clasificacin de los centros deportivos segn la cantidad de afiliados 13- De dos ejemplos de variables: - cualitativas - dicotmicas - policotmicas - cuantitativas - discretas - continuas 14- Proponga tres ejemplos de cada una de las clasificaciones de las variables segn su nivel de medicin, asociadas a un tema de su inters.

26

Lidia C. Diblasi

BIBLIOGRAFIA CONSULTADA Ambrosi, Hugo O. La verdad de las Estadsticas. Aprender con los datos Ediciones Lumier S.A., Buenos Aires, 2008. Briones, Guillermo.- "Mtodos y Tcnicas de Investigacin para las Ciencias Sociales" Mxico, Trillas, 1982. Blalock, Hubert: "Estadstica Social", Mxico, Fondo de Cultura Econmica, 1966. Blanch, Nidia, Joekes, Silvia, Estadstica Aplicada a la Investigacin Ed. Cooperadora Fac.Cs. Econmicas, Unv. Nac. Crdoba, 1994. Cortada de Kohan Carro. "Estadstica Aplicada", EUDEBA, 1978 Daniel, Waine W.: "Estadstica con Aplicaciones a las Ciencias Sociales y a la Educacin", Ed. Mc Grau Hill, 1981. Garca Ferrando, Manuel, Sociolestadstica. Introduccin a la Estadstica en Sociologa, Alianza Universidad Textos, Madrid, 1992 Haber Runyon: "Estadstica General" Ed. Fondo Educativo Interamericano, 1973. Prez Juste, R. Pedagoga Experimental 1989, Pg. 12, Madrid, UNED Sidney Siegel., "Estadstica no paramtrica", Ed. T'rillas, 1976. Sierra Bravo R.: "Tcnicas de Investigacin Social" Ed. Paraninfo, 1979. Yule. G. U. y Kendal, M. G.: "Introduccin a la Estadstica Matemtica", Madrid, 1962. Diblasi, Lidia y Romagnili, E. R.. Conceptos introductorios , mimeo Apuntes de ctedra Fac. de Ciencias Polticas y Sociales, UNCuyo, 1 edidin 1991 y 2 edicin 2001.

27

También podría gustarte