Está en la página 1de 225

FILOSOFA DE LA CIENCIA, EPISTEMOLOGA, METODOLOGA

Muchos autores franceses e ingleses utilizan el trmino epistemologa para designar a la "teora del conocimiento" o "gnoseologa", es decir, un sector de la filosofa que examina el problema del conocimiento en general: el ordinario, el filosfico, el cientfico, etc. Pero, en general, el trmino epistemologa es empleado en un sentido ms restringido, referido exclusivamente a los problemas del conocimiento cientfico, tales como las circunstancias histricas, psicolgicas y sociolgicas que llevan a su obtencin y los criterios con los cuales se lo justifica o invalida. La epistemologa es, entonces, el estudio de las condiciones de produccin y validacin del conocimiento cientfico. La epistemologa es una actividad crtica que se dirige a todo el campo de la ciencia. Estrechamente vinculada con la epistemologa, se halla la filosofa de la ciencia, que algunos autores idetifican con aquella. Sin embargo, no es conveniente hacerlo as, porque la filosofa de la ciencia, como la filosofa en general, abarca muchos problemas que no son estrictamente epistemolgicos. Un problema filosfico sera, por ejemplo, tratar de decidir si la realidad objetiva existe o es una ilusin de los sentidos. Los presupuestos filosficos que existen en la ciencia influiran de un modo esencial en la adopcin de ste o aqul mtodo epistemolgico. De manera que el trmino "filosofa de la ciencia" es ms amplio que el trmino "epistemologa", y sta sera tal vez una disciplina independiente de aquella, si bien las conexiones entre ambas y las presuposiciones epistemolgicas constituyen de por s un asunto de inters filosfico. Una tercera palabra, la metodologa, suele ser confundida con la epistemologa. En general,el metodlogo no pone en tela de juicio el conocimiento ya obtenido y aceptado por la comunidad cientfica. Su problema es la bsqueda de estrategias para incrementar el conocimiento. Por ejemplo, est fuera de discusin para el metodlogo la importancia de la estadstica,pues sta constituye un camino posible para obtener, a partir de datos y muestras, nuevas hiptesis. En cambio,el epistemlogo podra formularse, a modo de problema, la pregunta por el pretendido valor atribuido a datos y muestras.

BIBLIOGRAFA: Klimovsky, Gregorio - Las desventuras del conocimiento cientfico - AZ Editores - Bs. As. - 1995

MTODO Y METODOLOGA

La ciencia es un tipo particular y especfico de conocimiento. Para lograr un conocimiento de tal naturaleza, o sea, para hacer ciencia, es preciso sseguir determinados procedimientos que nos permian alcanzar el fin que procuramos: no es posible obtener un conocimiento racional, sistemtico y organizado actuando de cualquier modo; es necesario seguir un mtodo, un camino que nos aproxime a esas determinada meta.

El mtodo cientfico es el procedimiento o conjunto de procedimientos que se utilizan para obtener conocimientos cientficos, el modelo de trabajo o pauta general que orienta la investigacin. El estudio del mtodo - o de los mtodos, si se quiere dar al concepto un alcance ms general - se denomina metodologa, y abarca la justificacin y la discusin de su lgica interio, el anlisis de los diversos procedimientos concretos que se emplean en las investigaciones y la discusin acerca de sus caractersticas, cualidades y debilidades. Sin embargo, se suele utilizar la palabra metodologa en sentidos diferentes, opuestos a veces al anterior: se habla as de "metodologa de la investigacin" para hacer referencia a los pasos y procedimienntos que se han seguido en una indagacin determinada, para designar los modelos concretos de trabajo que se aplican en una determinada disciplina o especialidad y tambin para hacer referencia al conjunto de procedimientos y recomendaciones que se transmiten al estudiante como parte de la docencia en estudios superiores. Tambin suelen designarse como mtodos los estilos de trabajo peculiares de cada disciplina (por ejemplo: "el mtodo antropolgico") y las formas particulares de investigacin que se utilizan para resolver problemas especficos de indagacin, como cuando se habla del "mtodo cualitativo", el "mtodo experimental" o el "mtodo estadstico". El mtodo se refiere directamente a la lgica interior del proceso de descubrimiento cientfico, y a l le corresponde no solamente orientar la seleccin de los instrumentos y tcnicas especficos de cada estudio, sino tambin, fundamentalmente, fijar los criterios de verificacin y demostracin de lo que se afirme en la investigacin. No existe un nico mtodo de la ciencia, ya que no investigan del mismo modo el astrnomo y el economista, el historiador y el qumico, el antroplogo y el bioqumico. La experiencia histrica muestra, adems, que los procedimientos de la ciencia cambian, porque son distintos los problemas que se van planteando y los instrumentos evolucionan. La investigacin es un proceso creativo, plago de dificultades imprevistas, de prejuicios invisibles y de obstculos de todo tipo. Por ello, la nica manera de abordar el problema del mtodo cientfico, en un sentido general, es buscar las orientaciones epistemolgicas - los criterios comunes - que guan los trabajos de investigacin. Uno de los elementos ms significativos en todo el pensar cientfico es el esfuezo por la claridad en la conceptualizacin. Adems, el mtodo de la ciencia se asienta en dos pilares fundamentales: en un constante tomar en cuenta la experiencia, los datos de la realidad, y en una prpeocupacin por construir modelos tericos, abstracciones generales capaces de expresar las conexiones entre los datos conocidos. Toda investigacin parte de un conjunto de ideas y proposiciones que versan sobre la realidad y sus descripciones y explicaciones; el cientfico, por ms que est persuadido de la verdad de estas proposiciones, no las podr sostener hasta que, de algn modo, puedan ser verificadas en la prctica. Una proposicin es verificable cuando es posible encontrar un conjunto de hechos, previamente delimitados, que sean capaces de determinar si es o no verdadera. Otro elemento del proceder cientfico es el uso sistemtico de la inferencia, o razonamiento deductivo. Inferir significa sacar consecuencias de un principio o supuesto. La inferencia opera durante la investigacin y, por lo general, de la siguiente manera: una vez formulada una hiptesis se deducen de ella posibles consecuencias prcticas, que luego son sometidas, a su vez, a verificacin.

BIBLIOGRAFA: CARLOS A. SABINO. El proceso de investigacin. Buenos Aires, Editorial Lumen - Humanitas, 1996

EL CONOCIMIENTO CIENTFICO

El conocimiento como problema. Los seres humanos utilizan, para desarrollar su vida y realizar actividades, un conjunto amplio de conocimientos. Pero este conocimiento debe ser encontrado por medio de un trabajo indagatorio sobre los objetos que se intenta conocer. Por ejemplo: si un profesor nos dice (o leemos en un libro o peridico) que la economa del pas crece a un ritmo del 4% anual, esta afirmacin (cierta o falsa) podemos utilizarla y recordarla, al mismo tiempo que se incorpora y relaciona con otros conocimientos que poseemos de antemano. Pero resulta evidente que alguien es el responsable de esa afirmacin; alguien, de algn modo, ha estudiado la economa y ha determinado por algn procedimiento que su crecimiento es de un 4% Cmo lo ha hecho? De qu recursos se ha valido? Cuando comenzamos a preocuparnos del modo en que se ha adquirido un conocimiento, o cuando intentamos encontrar un conocimiento nuevo, se nos presentan cuestiones de variada ndole, muchas de las cuales integran el campo de la Metodologa. El conocimiento como proceso. Desde que la especie humana comenz a crear cultura, es decir, a modificar y remodelar el ambiente que la rodeaba para sobrevivir y desarrollarse, fue necesario tambin que comprendiera la naturaleza y las mutaciones de los objetos que constituan su entorno. Tareas que hoy resultan sencillas, como edificar una vivienda precaria, domesticar animales o trabajar la tierra, slo pudieron ser emprendidas despus de cuidadosas observaciones de todo tipo: el ciclo de los das y las noches, el de las estaciones del ao, la reproduccin de los animales y vegetales, el estudio del clima y de las tierras, el conocimiento elemental de la geografa, etc. El conocimiento de esas pocas no se circunscribi exclusivamente al conocimiento instrumental, aplicable al mejoramiento de las condiciones materiales. Apareci simultneamente la inquietud por conocer el sentido general del cosmos y de la vida y la toma de conciencia del hombre de su propia muerte originaron los primeros intentos de elaborar explicaciones globales de toda la naturaleza. As aparecen la magia, posteriormente las explicaciones religiosas y ms tarde los sistemas filosficos. Todas estas construcciones del intelecto pueden verse como parte de un amplio proceso de adquisicin de conocimientos que muestra lo dificultosa que resulta la aproximacin a la verdad: en la historia del pensamiento nunca ha sucedido que de pronto alguien haya alcanzado la verdad pura y completa sin antes pasar por el error. Esto implica decir que el conocimiento llega a todos nosotros como un proceso, no como un acto nico donde se pasa de una vez de la ignorancia a la verdad, adems de serlo desde el punto de vista histrico. Diferentes tipos de conocimiento.

Si concebimos al hombre como un ser complejo, dotado de una capacidad de raciocinio, pero tambin de una poderosa afectividad, veremos que ste tiene muchas maneras distintas de aproximarse a los objetos de su inters. Ante una cadena montaosa, por ejemplo, puede dejarse llevar por sus sentimientos y maravillarse frente a la majestuosidad del paisaje, o bien puede tratar de estudiar su composicin mineral y sus relaciones con las zonas vecinas, puede emocionarse y ver que lo que tiene ante s es la obra de Dios o tambin puede detenerse a evaluar sus posibilidades de aprovechamiento. El producto de cualquiera de estas actitudes ser, en todos los casos, algn tipo de conocimiento. El conocimiento cientfico es uno de los modos posibles de conocimiento, quiz el ms til o adecuado, ero no el nico, ni el nico capaz de proporcionarnos respuestas para nuestros interrogantes. El conocimiento cientfico y sus caractersticas. La ciencia es una de las actividades que el hombre realiza, un conjunto de acciones encaminadas y dirigidas hacia determinado fin, que es el de obtener un conocimiento verificable sobre los hechos que lo rodean. El pensamiento cientfico se ha ido gestando y perfilando histricamente, por medio de un proceso que se acelera notablemente a partir del Renacimiento. La ciencia se va distanciando de lo que algunos autores denominan "conocimiento vulgar", estableciendo una gradual diferencia con el lenguaje que se emplea en la vida cotidiana. Porque la ciencia no puede permitirse designar con el mismo nombre fenmenos que, aunque aparentemente semejantes, son de naturaleza diferente. Otras cualidades especficas de la ciencia, que permiten distinguirla del pensar cotidiano y de otras formas de conocimiento son: Objetividad: se intenta obtener un conocimiento que concuerde con la realidad del objeto, que lo describa o explique tal cual es y no como desearamos que fuese. Lo contrario es subjetividad, las ideas que nacen del prejuicio, de la costumbre o la tradicin. Para poder luchar contra la subjetividad, es preciso que nuestros conocimientos puedan ser verificados por otros. Racionalidad: la ciencia utiliza la razn como arma esencial para llegar a sus resultados. Los cientficos trabajan en lo posible con conceptos, juicios y razonamientos, y no con las sensaciones, imgenes o impresiones. La racionalidad aleja a la ciencia de la religin y de todos los sistemas donde aparecen elementos no racionales o donde se apela a principios explicativos extra o sobrenaturales; y la separa tambin del arte donde cumple un papel secundario subordinado, a los sentimientos y sensaciones. Sistematicidad: La ciencia es sistemtica, organizada en sus bsquedas y en sus resultados. Se preocupa por construir sistemas de ideas organizadas coherentemente y de incluir todo conocimiento parcial en conjuntos ms amplios. Generalidad: la preocupacin cientfica no es tanto ahondar y completar el conocimiento de un solo objeto individual, sino lograr que cada conocimiento parcial sirva como puente para alcanzar una comprensin de mayor alcance. Falibilidad: la ciencia es uno de los pocos sistemas elaborados por el hombre donde se reconoce explcitamente la propia posibilidad de equivocacin, de cometer errores. En esta conciencia de sus limitaciones, es donde reside la verdadera capacidad para autocorregirse y superarse.

MTODO CIENTFICO

El objetivo del mtodo cientfico es establecer unos criterios seguros que nos permitan distinguir entre lo que es ciencia y lo que se presenta como cientfico sin serlo y, con ello, poder fijar la superioridad epistemolgica de la ciencia sobre otras formas de conocimiento. El conocimiento cientfico se caracteriza por el mtodo adoptado y no tanto por el objeto de estudio, de tal manera que cuando el mtodo aplicado por el investigador es el hipottico deductivo (con todas sus implicaciones) se deslinda con claridad entre conocimiento cientfico y no cientfico. En dicho mtodo, se etablecen una serie de momentos y reglas que deben seguirse en cada caso. No obstante, cabra distinguir por un lado un mtodo general que sirve de gua a todas aquellas disciplinas que aspiren a la categora de cientficas y, por otro, unos mtodos particulares o tcticas diferenciadas en funcin del objeto y complejidad de estudio. Hay que indicar que "mtodo", en sentido propio, es aquel conjunto de operaciones tericas, lgico epistemolgicas y prcedimentales que permiten validar o justificar las teoras cientficas. La esencia del mtodo general (hipottico deductivo) reside en la posibilidad de anticipar los conocimientos (an aquellos ms ocultos a la experiencia directa). sta es la funcin de las hiptesis formalmente deducidas de un cuerpo terico, que posteriormente se tratarn de confirmar o refutar con datos de la realidad. Cualquier otra modalidad de conocimiento no deja de ser una matizacin ms o menos empirista. Los conocimientos as adquiridos (cientficos, lo que llamamos ciencia) se distinguen porque se manifiestan a dos niveles bien interconectados: por un lado, un conjunto de conocimientos presentados mediante conceptos (elementos de las leyes y teoras) y, por otro, una integracin lgica de dichos conceptos (teoras) que nos conducen a conocimientos nuevos. La integracin lgica aplicada a la totalidad de los conocimientos produce un sistema terico que supera a la suma de los conocimientos aislados. Dicho sistema, a su vez, permite sacar nuevas conclusiones sobre la realidad. ste sera el proceso y el producto del mtodo cientfico. De esta manera, el mtodo hipottico - deductivo posibilita el ordenamiento coherente de conocimientos al aplicar la racionalidad a los pasos lgicos que conducen a este objetivo. En cuanto a los mtodos particulares, cabra aadir, adems de lo expresado para el mtodo general, que se trata de herrramientas tiles que el investigador utiliza para comprobar hiptesis de investigacin objetivas, deducidas desde el esquema del mtodo general. En este sentido, tanto la tctica experimental como la selectiva, la observacional y las distintas tcnicas de recogida de informacin y procedimentales, tambin son objeto, al ser mtodos y tcnicas de investigacin de la metodologa y su validez viene determinada en funcin del grado de adecuacin de stas con la formulacin de las hiptesis que se someten a prueba. El uso de una tcnica frente a otra, en s misma no concede status cientfico a los datos obtenidos por ella.

LAS HIPTESIS

Podemos definir la hiptesis como un intento de explicacin o una respuesta "provisional" a un fenmeno. Su funcin consiste en delimitar el problema que

se va a investigar segn algunos elementos tales como el tiempo, el lugar, las caractersticas de los sujetos, etc.

Llegar a comprobar o rechazar la hiptesis que se ha elaborado previamente, confrontando su enunciado terico con los hechos empricos, es el objetivo primordial de todo estudio que pretenda explicar algn campo de la realidad.

Para plantear una hiptesis adecuada, debemos tener en cuenta los siguientes puntos:

1. Los trminos que se empleen deben ser claros y concretos para poder definirlos de manera operacional, a fin de que cualquier investigador que quiera replicar la investigacin, pueda hacerlo. Una hiptesis sin referencia emprica constituye un juicio de valor. Si una hiptesis no puede ser sometida a verificacin emprica, desde el punto de vista cientfico no tiene validez. 2. Las hiptesis deben ser objetivas y no llevar algn juicio de valor; es decir, no debe definirse el fenmeno con adjetivos tales como "mejor" o "peor", sino solamente tal y como pensamos que sucede en la realidad. 3. Las hiptesis deben ser especficas, no slo en cuanto al problema, sino a los indicadores que se van a emplear para medir las variables que estamos estudiando. 4. Las hiptesis deben estar relacionadas con los recursos y las tcnicas disponibles. Esto quiere decir que cuando el investigador formule su hiptesis debe saber si los recursos que posee son adecuados para la comprobacin de la misma. 5. La hiptesis debe estar directamente relacionada con el marco terico de la investigacin y derivarse de l.

Las hiptesis deben ser producto de la observacin objetiva y su comprobacin, estar al alcance del investigador.

Requisitos de las hiptesis:

Las hiptesis deben:

Establecer las variables a estudiar, es decir, especificar las variables a estudiar, fijarles lmite. Establecer relaciones entre variables, es decir, la hiptesis debe ser especificada de tal manera que sirva de base a inferencias que nos ayuden a decidir si explica o no los fenmenos observados. Las hiptesis deben establecer relaciones cuantitativas entre variables. Mantener la consistencia entre hechos e hiptesis, ya que stas se cimentan, al menos en parte, sobre hechos ya conocidos. Por tanto, las hiptesis no deben establecer implicaciones contradictorias o inconsistentes con lo ya verificado en forma objetiva.

Tipos de hiptesis:

Hiptesis nula. Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer una hiptesis nula.

La hiptesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos. Por ejemplo, supongamos que un investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo recibi. Una hiptesis nula es importante por varias razones: 1. Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin. 2. El hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al azar. No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis nula es aquella por la cual indicamos que la informacin a obtener es contraria a la hiptesis de trabajo.

Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema flucta, por tanto, debe rechazarse como tal. Otro ejemplo: Hiptesis: el aprendizaje de los nios se relaciona directamente con su edad. Hiptesis nula: no existe diferencia significativa entre el aprendizaje en nios de diversas edades.

Hiptesis conceptual. Es la hiptesis que se formula como resultado de las explicaciones tericas aplicables a nuestro problema. Nos ayuda a explicar desde el punto de vista terico el fenmeno que estamos investigando.

Es la hiptesis orientadora de la investigacin, intenta enfocar el problema como base para la bsqueda de datos. No puede abarcar ms de lo propuesto en los objetivos de la investigacin o estar en desacuerdo con ellos. Podemos enunciarla como una relacin causal o determinante proveniente del planteamiento del problema, de donde se desprenden las variables.

Hiptesis de trabajo. Es aquella que le sirve al investigador como base de su investigacin, o sea, trata de dar una explicacin tentativa al fenmeno que se est investigando. sta es la hiptesis que el investigador tratar de aceptar como resultado de su investigacin, rechazando la hiptesis nula.

Se dice que la hiptesis de trabajo es operacional por presentar cuantitativamente (en trminos medibles) la hiptesis conceptual o general.

Hiptesis alternativa. Al responder a un problema, es muy conveniente proponer otras hiptesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en bsquedas intiles, es necesario hallar diferentes hiptesis alternativas como respuesta a un mismo problema y elegir entre ellas cules y en qu orden vamos a tratar su comprobacin.

Las hiptesis, naturalmente, sern diferentes segn el tipo de investigacin que se est realizando. En los estudios exploratorios, a veces, el objetivo de la investigacin podr ser simplemente el de obtener los mnimos conocimientos que permitan formular una hiptesis. Tambin es aceptable que, en este caso, resulten poco precisas, como cuando afirmamos que "existe algn tipo de problema social en tal grupo", o que los planetas poseen algn tipo de atmsfera, sin especificar de qu elementos est compuesta.

Los trabajos de ndole descriptiva generalmente presentan hiptesis del tipo "todos los X poseen, en alguna medida, las caracterstica Y". Por ejemplo, podemos decir que todas las naciones poseen algn comercio internacional, y dedicarnos a describir, cuantificando, las relaciones comerciales entre ellas. Tambin podemos hacer afirmaciones del tipo "X pertenece al tipo Y", como cuando decimos que una tecnologa es capital - intensiva. En estos casos, describimos, clasificndolo, el objeto de nuestro inters, incluyndolo en un tipo ideal complejo de orden superior. Por ltimo, podemos construir hiptesis del tipo "X produce (o afecta) a Y", donde estaremos en presencia de una relacin entre variables.

Slo en los casos de investigaciones explicativas es necesario formular claramente cules son las hiptesis de la investigacin. En las investigaciones descriptivas y, con ms razn, en las exploratorias, es posible omitir las hiptesis, ya sea porque stas son tan amplias y poco definidas que dicen muy poco a quien lee el informe de investigacin, o porque no es posible o necesario verificarlas.

Dificultades para la formulacin de hiptesis:

Falta de conocimientos o ausencia de claridad en el marco terico. Falta de aptitud para la utilizacin lgica del marco terico. Desconocimiento de las tcnicas adecuadas de investigacin para redactar hiptesis en debida forma.

Utilidad de las hiptesis:

El uso y formulacin correcta de las hiptesis le permiten al investigador poner a prueba aspectos de la realidad, disminuyendo la distorsin que pudieran producir sus propios deseos o gustos. Pueden ser sometidas a prueba y

demostrarse como probablemente correctas o incorrectas sin que interfieran los valores o creencias del individuo.

Estructura de las hiptesis:

Una hiptesis generalmente se especifica por la estructura SI - ENTONCES (cuando intervienen dos variables).

Cuando las variables son ms de dos, las estructuras ms frecuentes son:

Si P, entonces Q, bajo las condiciones R y S. Si P1, P2 y P3, entonces Q.

Bibliografa: Tenorio Bahena, Jorge. INVESTIGACIN DOCUMENTAL. 3 ed. Mxico (1988). Ed. Mac Graw - Hill. Pick, Susan y Lpez, Ana Luisa. CMO INVESTIGAR EN CIENCIAS SOCIALES. 5 ed. Mxico (1994). Ed. Trillas S.A. Tamayo y Tamayo, Mario. EL PROCESO DE LA INVESTIGACIN CIENTFICA. 3 ed. Mxico (1998). Ed. Limusa S.A. Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.

POBLACIN Y MUESTRA

Una poblacin est determinada por sus caractersticas definitorias. Por lo tanto, el conjunto de elementos que posea esta caracterstica se denomina poblacin o universo. Poblacin es la totalidad del fenmeno a estudiar, donde las unidades de poblacin poseen una caracterstica comn, la que se estudia y da origen a los datos de la investigacin. Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una poblacin. Cuando seleccionamos algunos elementos con la intencin de averiguar algo sobre una poblacin determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la poblacin en su conjunto. La exactitud de la informacin recolectada depende en gran manera de la forma en que fue seleccionada la muestra.

Cuando no es posible medir cada uno de los individuos de una poblacin, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las caractersticas que definen la poblacin de la que fue extrada, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la muestra. Leyes del mtodo de muestreo. El mtodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientfico, las cuales son: Ley de los grandes nmeros: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si ste se repite una gran cantidad de veces, la relacin entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez ms a la probabilidad P. Clculo de probabilidades: La probabilidad de un hecho o suceso es la relacin entre el nmero de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El mtodo de establecer la probabilidad es lo que se denomina clculo de probabilidad.

De estas dos leyes fundamentales de la estadstica, se infieren aquellas que sirven de base ms directamente al mtodo de muestreo: Ley de la regularidad estadstica: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las caractersticas del grupo ms grande. Ley de la inercia de los grandes nmeros: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayora de los fenmenos, cuando una parte vara en una direccin, es probable que una parte igual del mismo grupo, vare en direccin opuesta. Ley de la permanencia de los nmeros pequeos: si una muestra suficientemente grande es representativa de la poblacin, una segunda muestra de igual magnitud deber ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con caractersticas raras, es de esperar encontrar igual proporcin en la segunda muestra.

Tipos de muestras. Muestreo aleatorio simple: la forma ms comn de obtener una muestra es la seleccin al azar. es decir, cada uno de los individuos de una poblacin tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitucin una tabla de nmeros aleatorios. Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la poblacin. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la poblacin en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la seleccin de los elementos o unidades representantes, se utiliza el mtodo de muestreo aleatorio. Muestreo por cuotas: se divide a la poblacin en estratos o categoras, y se asigna una cuota para las diferentes categoras y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la poblacin, y en ella debern tenerse en

cuenta las diferentes categoras. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la seleccin de las categoras. Muestreo intencionado: tambin recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la poblacin que se investiga. Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y despus aplicar el muestreo por cuotas. Muestreo tipo: la muestra tipo (master simple) es una aplicacin combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituir el mdulo general del cual se extraer la muestra definitiva conforme a la necesidad especfica de cada investigacin.
Bibliografa: EL PROCESO DE LA INVESTIGACIN CIENTFICA, Mario Tamayo y Tamayo, 1998 .

LAS VARIABLES

Se pueden definir como todo aquello que vamos a medir, controlar y estudiar en una investigacin o estudio. Por lo tanto, es importante, antes de iniciar una investigacin, que sepamos cules son las variables que vamos a medir y la manera en que lo haremos. Es decir, las variables deben ser susceptibles de medicin. Variable es todo aquello que puede asumir diferentes valores, desde el punto de vista cuantitativo o cualitativo. Las variables pueden ser definidas conceptual y operacionalmente. La definicin conceptual es de ndole terica, mientras que la operacional nos da las bases de medicin y la definicin de los indicadores. Para definir las variables, nos podemos basar en los indicadores, que constituyen el conjunto de actividades o caractersticas propias de un concepto. Por ejemplo, si hablamos de inteligencia, podemos decir que est compuesta por una serie de factores como la capacidad verbal, capacidad de abstraccin, etc. Cada factor puede ser medido a travs de indicadores. En otras palabras, los indicadores son algo especfico y concreto que representan algo ms abstracto o difcil de precisar. No todos los indicadores tienen el mismo valor. Es decir, aunque haya varios indicadores para un mismo fenmeno, habr algunos ms importantes que otros, y por lo general cualquier indicador que se tenga est basado en una probabilidad de que realmente represente al fenmeno. Algunos criterios para escoger los indicadores:

Se debe tener el menor nmero de indicadores de una variable, siempre y cuando stos sean realmente representativos de la misma. Se deben poseer formas de medicin especficas para cada indicador. Hay que tener en cuenta que los indicadores slo poseen una relacin de probabilidad con respecto a la variable.

Variable independiente y variable dependiente. La variable independiente es aquella propiedad de un fenmeno a la que se le va a evaluar su capacidad para influir, incidir o afectar a otras variables. La variable independiente por manipulacin es la que el investigador aplica segn su criterio, se hace en estudios de carcter experimental. Todo aquello que el experimentador manipula, debido a que cree que existe una relacin entre sta y la variable dependiente. La variable independiente asignada o seleccionada es la que el investigador no puede modificar, pero se desea saber si influye sobre la variable dependiente. No son manipulables. La variable dependiente puede ser definida como los cambios sufridos por los sujetos como consecuencia de la manipulacin de la variable independiente por parte del experimentador. Variable inter y variable intra. Las variables inter son aquellas que estudian simultneamente varios grupos de sujetos.Las comparaciones se establecen entre (inter) los grupos. Las variables intra son aquellas que pueden estudiar al mismo grupo en diferentes perodos. O sea, las comparaciones se establecen dentro de un mismo grupo. Variables extraas. Son todas aquellas variables que el investigador no controla directamente, pero que pueden influir en el resultado de su investigacin. Deben ser controladas, hasta donde sea posible, para asegurarnos de que los resultados se deben al manejo que el investigador hace de la variable independiente, ms no a variables extraas, no controladas. Algunos mtodos para realizar este control son los siguientes: Eliminacin. Cuando sabemos que existe una variable extraa que puede alterar los resultados de la investigacin, podemos controlarla mediante la eliminacin. Constancia de condiciones. Si, por ejemplo, en un estudio experimental deseamos estudiar dos o ms grupos de sujetos, stos se deben someter exactamente a las mismas condiciones, tanto fsicas como de lugar, manteniendo, de esta manera, constantes las circunstancias bajo las cuales se investiga. Balanceo. Cuando tenemos una variable extraa puede influir de manera definitiva en nuestro estudio y, si no la podemos eliminar ni igualar las condiciones de los grupos, deberemos recurrir al balanceo. Este mecanismo distribuye en forma equitativa la presencia de la variable extraa entre los grupos.

Contrabalanceo. En algunas investigaciones se pide a los sujetos que respondan varias veces a un mismo estmulo o a varios estmulos diferentes. Esta serie de respuestas puede provocar en los mismos dos reacciones: por un lado, fatiga, porque los sujetos se cansan de estar respondiendo; por otro lado, aprendizaje, ya que despus de presentar 2 o 3 veces el mismo estmulo el sujeto ya sabe cmo responder. Para evitar estos problemas, los grupos se pueden subdividir en subgrupos para que los efectos de la fatiga y/o aprendizaje queden anulados. Aleatorizacin. Este mtodo de control es uno de los ms sencillos y ms utilizados en ciencias sociales, sobre todo cuando se llevan a cabo estudios experimentales. Se parte del postulado de que si la seleccin y distribucin de sujetos en grupos de control fue hecha al azar, podemos inferir que las variables extraas, desconocidas por el investigador, se habrn repartido tambin al azar en ambos grupos, y as quedarn igualadas. Variables continuas y variables discretas. Una variable continua es aquella que puede asumir cualquier valor numrico y que puede cambiar en cualquier cantidad. Una variable discreta es aquella que tiene valores numricos enteros previamente establecidos, los cuales no pueden cambiarse arbitrariamente Causalidad. Al hablar de variables independientes y dependientes, debemos tener cuidado de no caer en el error de afirmar que la variable dependiente es causada por la variable independiente. A este tipo de conclusiones se puede llegar en muy contadas situaciones. En ciencias sociales, es conveniente hablar de relaciones entre variables, y no de causas.

BIBLIOGRAFA: Susan Pick y Ana Luisa Lpez -CMO INVESTIGAR EN CIENCIAS SOCIALES - Ed. Trillas - 1998

LA OBSERVACIN

Se utiliza para recolectar los datos necesarios para un estudio. La observacin es un mtodo clsico de investigacin cientfica; adems, es la manera bsica por medio de la cual obtenemos informacin acerca del mundo que nos rodea. Principios bsicos para realizar una observacin:

1. Debe tener un propsito especfico. 2. Debe ser planeada cuidadosa y sistemticamente.

3. Debe llevarse, por escrito, un control cuidadoso de la misma. 4. Debe especificarse su duracin y frecuencia. 5. Debe seguir los principios bsicos de confiabilidad y validez.
Entre las ventajas de la observacin, tenemos que determinada conducta se describe en el momento exacto en que est ocurriendo. Adems, las observaciones se pueden realizar independientemente de que las personas estn dispuestas a cooperar o no, a diferencia de otros mtodos en los que s necesitamos de la cooperacin de las personas para obtener la informacin deseada. En contraposicin, tambin existen algunas desventajas, tales como la dificultad para observar un comportamiento especfico en el momento de efectuar la observacin. Adems, las conductas que se encuentran sujetas a observacin, generalmente son limitadas. es difcil poder observar la interaccin familiar, por ejemplo, al acostarse o levantarse. La observacin, debido a su utilidad, es un mtodo que se puede utilizar, junto con otros, para recabar informacin. Por ejemplo, se puede emplear la observacin en un estudio exploratorio, y para el estudio final se pueden usar otros mtodos tales como cuestionarios, entrevistas, etc. Observacin participante: Este tipo de observacin est determinado por el hecho de que el observador participa de manera activa dentro del grupo que se est estudiando; se identifica con l de tal manera que el grupo lo considera uno ms de sus miembros. es decir, el observador tiene una participacin tanto externa, en cuanto a actividades, como interna, en cuanto a sentimientos e inquietudes. Con este tipo de observacin, los investigadores pueden influir en la vida del grupo. Un problema del registro de la observacin es que el observador puede perder su objetividad. Para resolver este problema es conveniente que ms de una persona observe el mismo fenmeno, con el fin de comparar las observaciones realizadas. Observacin no participante: En este tipo de observacin el investigador no participa de manera activa dentro del grupo que observa. Se limita a mirar y a tomar notas sin relacionarse con los miembros del grupo. Dependiendo de los objetivos que persiga la investigacin, se emplear uno u otro tipo de observacin. La observacin participante nos puede dar una idea ms clara acerca de lo que sucede dentro de un grupo, puesto que si los sujetos ven al observador como un miembro ms del grupo se comportarn normalmente. En cambio, aplicando la observacin no participante, probablemente no se comportarn normalmente. Por otro lado, es probable que el investigador, al no participar en la vida del grupo observado, pueda mantener ms facilmente su objetividad. Observacin libre o no estructurada: Generalmente se lleva a cabo en un estudio piloto, cuando no se conoce muy bien la muestra que se va a estudiar. Puntos a considerar:

La poblacin que vamos a estudiar: quines son, cmo se relacionan entre s, edad, sexo, nivel socioeconmico, etc. Las variables que son relevantes para nuestro estudio, as como la frecuencia y duracin de las mismas.

La mejor manera de registrar esta informacin es hacindolo en el momento y situacin en que se est manifestando la conducta, puesto que as tendremos menos prejuicios, seremos menos selectivos y, en genral, ms objetivos al registrar la informacin tal y como se presenta en la realidad. Sin embargo, esto no siempre se puede realizar, puesto que al estar tomando notas se puede distorsionar la conducta; adems, las personas pueden comportarse de manera poco diferente cuando saben que las estn observando, y sobre todo si alguien est tomando notas en relacin con su comportamiento. Por otro lado, es difcil tomar notas y observar al mismo tiempo. Si se trata de guardar todo en la memoria, probablemente la observacin no pueda ser muy exacta. Lo que se puede hacer es escribir solamente palabras claves mientras se realiza la observacin. Cuando se redacten los resultados finales, se debe utilizar una forma organizada y sistemtica, como, por ejemplo, una tabla de frecuencias. Observacin estructurada: Es aquella que se lleva a cabo cuando se pretende probar una hiptesis, o cuando se quiere hacer una descripcin sistemtica de algn fenmeno. es decir, cuando estamos realizando un estudio o invetigacin en el que sabemos exactamente lo que vamos a investigar y tenemos un diseo de investigacin. Se diferencia de la observacin no estructurada en el sentido de que en esta ltima slo poseemos una idea vaga acerca de lo que vamos a observar, mientras que en la estructurada ya tenemos ms claramente definidos los objetivos que nos ayudarn a clasificar y concretar el fenmeno en cuestin. En este tipo de observacin nos basamos en tablas de frecuencias. La observacin estructurada presenta menos problemas prcticos en cuanto a la forma de registro y utilizamos formas estandarizadas. Existen menos probabilidades de que los observadores sean subjetivos.

GUA PARA ELABORAR UNA TESIS

Elaboracin de un plan de trabajo. Para iniciar una investigacin, es necesario organizar adecuadamente las actividades y tener un conocimiento amplio sobre el tema u objeto de estudio. Hay que distinguir aquellas actividades que requerirn de mayor tiempo para su concrecin y aquellas que demandan un esfuerzo personal ms especfico. Elaboracin de un anteproyecto. Antes de elaborar este anteproyecto, debe realizarse una amplia bsqueda bibliogrfica, que brindar una idea ms clara del tema. Tambin es importante relacionarse con personas que traten o trabajen en el tema.

Esquema. 1. Definicin del problema: ttulo descriptivo del proyecto, formulacin del problema. Formular un problema es caracterizarlo, definirlo, enmarcarlo tericamente. La caracterizacin o definicin del problema nos lleva a otorgarle un ttulo en el que de manera clara indiquemos los elementos esenciales. La formulacin del problema es la estructuracin de toda la informacin. Se debe sintetizar la cuestin proyectada para investigar a travs de un interrogante. 2. Justificacin: una vez que se ha seleccionado el tema de investigacin, definido por el planteamiento del problema, y establecido los objetivos, se debe indicar las motivaciones que llevan al investigador a desarrollar el proyecto. Responde a la pregunta: por qu se investiga? 3. Definiciones. 4. Objetivos: es el propsito de la investigacin. Responde a la pregunta para qu? Un objetivo debe redactarse con verbos en infinitivo. 5. Hiptesis: es una proposicin de carcter afirmativo enunciada para responder tentativamente a un problema. Toda hiptesis constituye un juicio, o sea una afirmacin o una negacin de algo. 6. Limitaciones y delimitaciones: es pertinente precisar los lmites del problema, su alcance, para ello es necesario tener en cuenta la viabilidad, lugar, tiempo y financiacin. 7. Marco de referencia: fundamentos tericos, antecedentes del problema. Debe ser una bsqueda detallada y concreta, donde el tema y la temtica del objeto a investigar tenga un soporte terico, que se pueda debatir, ampliar, conceptualizar y concluir. Ninguna investigacin debe privarse de un fundamento o marco terico o de referencia. Estos fundamentos tericos permiten presentar una serie de conceptos, que constituyen un cuerpo unitario y no un simple conjunto arbitrario de definiciones. 8. Metodologa: diseo de tcnicas de recoleccin, poblacin y muestras, tcnicas de anlisis, ndice analtico tentativo, gua de trabajo de campo. 9. Cronograma: es un plan de trabajo o plan de actividades, que muestra la duracin del proceso investigativo. 10. Presupuesto. 11. Bibliografa.

Elaboracin de la tesis.
Bsqueda de la informacin. Puede iniciarse con los resultados obtenidos en la bsqueda bibliogrfica, consultando anteriores investigaciones y los mtodos aplicados por ellas. Organizacin. Pueden utilizarse tanto archivos fsicos como lgicos. Los archivos fsicos corresponden a fotocopias, manuscritos, recortes, fotografas, etc., que es conveniente guardar en carpetas y rotular el tema o captulo de investigacin. Los archivos lgicos comprenden documentos

guardados en procesadores de textos, convenientemente clasificados y con referencias bibliogrficas. Redaccin. Es imprescindible prestar la debida atencin a la redaccin, prolijidad, ortografa y presentacin. Estilo. El texto debe ser claro y fcil de leer, aunque no debe obviarse la escritura cientfica, que es muy importante. Las referencias bibliogrficas son el modo adecuado de documentar conceptos que no son propios (deben anotarse como pies de pgina). Debe utilizarse siempre la vos activa y el modo impersonal. Estructura de la tesis. La pgina del ttulo debe contener como mnimo los siguientes datos: Ttulo. Autor. Institucin. Fecha.

El ndice de contenido debe contener los subttulos de cada captulo, as como el ttulo del captulo. La introduccin comienza en la pgina 1. Las pginas iniciales deben estar numeradas con nmeros romanos. La introduccin es la presentacin del trabajo, por lo que deber exponer el problema. Las conclusiones son las contribuciones del autor de la confirmacin o rechazo de la hiptesis planteada en la introduccin. Los resultados y las discusiones deben ofrecer suficiente evidencia cientfica como para respaldar a las conclusiones. Las conclusiones siempre se escriben el el captulo final y se recomienda que no sean superiores a 10. Es conveniente que las referencias bibliogrficas se presenten en ordene alfabtico. Si la tesis incluye materiales o mtodos que deben incluirse, pero que impediran una lectura gil de la misma, es conveniente utilizar apndices. Presentacin. Es importante no redundar en explicaciones que las mismas ilustraciones muestran, adems no se deben incluir ms ilustraciones que las pertinentes. El texto debe referirse a ellas cuando se trate de aclarar lo que no resulta obvio. No dejar grandes espacios de papel con el fin de hacer la tesis ms voluminosa.

Evitar las ideas vagas e innecesarias.

OBTENCIN Y ORDENAMIENTO DE DATOS

POBLACIN Y MUESTRA. Marco de referencia de un estudio estadstico:

1. Definir la unidad de observacin (elemento sobre el que vamos a registrar los datos). Las unidades de observacin pueden tener existencia natural, como una persona o una cosa elementos tangibles -, o pueden estar definidas artificialmente, como las distintas reas de una empresa.

2. Determinar qu vamos a medir (lo que vamos a observar).

3. Definir si el relevamiento de datos se hace sobre la totalidad ( poblacin) o sobre una muestra. Si el anlisis se realiza en base a una muestra, el objetivo es obtener conclusiones acerca de la poblacin. Por lo tanto, la muestra debe ser representativa de la poblacin de la cual fue extraida.

ORDENAMIENTO DE DATOS.

Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una coleccin de datos se conoce como conjunto de datos, y una sola observacin es un punto de dato.

Para que los datos sean tiles, necesitamos organizar nuestras observaciones, de modo que podamos distinguir patrones y llegar a conclusiones lgicas.

Recoleccin de datos:

Los especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos relevantes estn representados en los datos.

Los datos pueden provenir de observaciones reales o de registros que se mantienen para otros propsitos.

Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones bien pensadas acerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones dadas. Tambin el conocimiento de tendencias adquirido de la experiencia previa puede permitir estar al tanto de posibles resultados y actuar en consecuencia.

Cuando los datos son ordenados de manera compacta y til, los responsables de tomar decisiones pueden obtener informacin confiable sobre el ambiente y usarla para tomar decisiones inteligentes. Los administradores deben tener mucho cuidado y asegurar que los datos utilizados estn basados en suposiciones e interpretaciones correctas. Para ello, se utilizan las pruebas para datos:

1. De dnde vienen los datos? La fuente es parcial? Es posible que haya un inters en proporcionar datos que conduzcan a una cierta conclusin ms que a otras? 2. Los datos comprueban o contradicen otras evidencias que se poseen? 3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una conclusin diferente? 4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea estudiar? 5. La conclusin es lgica? Se ha llegado a conclusiones que nuestros datos no confirman?

Vale la pena usar los datos o debemos esperar y recabar ms informacin antes de actuar?

Diferencia entre muestras y poblaciones:

Muestra y poblacin son trminos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.

Estudiaremos muestras con el fin de ser capaces de describir poblaciones.

El estudio de muestras es ms sencillo que el estudio de la poblacin completa, cuesta menos y lleva menos tiempo. Adems, se ha probado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.

Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Debemos definir dicha poblacin de modo que quede claro cundo un cierto elemento pertenece o no a la poblacin.

Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos. Cualquier grupo que cumple con los requisitos de la poblacin, puede constituir una muestra, siempre y cuando el grupo sea una fraccin de la poblacin completa.

Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones en que estn incluidas en tal poblacin.

Bsqueda de un patrn significativo en los datos:

Existen muchas formas de organizar los datos. Podemos slo colectarlos y mantenerlos en orden; o si las observaciones estn hechas con nmeros, entonces podemos hacer una lista de los puntos de dato de menor a mayor segn su valor numrico. Pero si los datos son trabajadores especializados o los distintos tipos de automviles que ensamblan todos los fabricantes, debemos organizarlos de manera distinta. Necesitaremos presentar los puntos de dato en orden alfabtico o mediante algn principio de organizacin. Una forma comn de organizar los datos consiste en dividirlos en categoras o clases parecidas y luego contar el nmero de observaciones que quedan dentro de cada categora. Este mtodo produce una distribucin de frecuencias.

El objetivo de organizar los datos es permitirnos ver rpidamente algunas de las caractersticas de los datos que hemos recogido: el alcance (los valores mayor y menor), patrones evidentes, alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con mayor frecuencia, etc.

RECOMENDACIONES:

Al plantear un estudio estadstico, definir claramente la poblacin objeto de anlisis.

Si se trabaja con muestras, definir las condiciones que deben reunir antes de extraerlas.

Especificar qu se va a medir, las unidades a usar y la forma de registro.

Datos sin procesar:

La informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin procesar puesto que an no han sido tratados mediante ningn mtodo estadstico.

La cantidad de datos ms grande y los detalles ms minuciosos pueden no contener la informacin ms til para la toma de decisiones administrativa. Una parte importante de la planeacin de sistemas de informacin administrativa consiste en resumir y presentar los datos de modo que se pueda obtener la informacin crtica de manera rpida y sencilla.

Ordenamiento de datos utilizando su arreglo y distribucin de frecuencias:

La ordenacin de datos es una de las formas ms sencillas de presentarlos, los forma en orden ascendente o descendente.

Ventajas:

1. 2. 3. 4.

Podemos notar rpidamente los valores mayor y menor de los datos. Podemos dividir fcilmente los datos en secciones. Podemos ver si algunos de los valores aparecen ms de una vez en ese ordenamiento. Podemos observar la distancia entre valores sucesivos de datos.

En ocasiones, un ordenamiento de datos no resulta til. Debido a que da una lista de todos los valores, es una forma incmoda de mostrar grandes cantidades de datos.

La distribucin de frecuencias.

Una forma en que podemos comprimir los datos es la tabla de frecuencias o distribucin de frecuencias. Las distribuciones de frecuencias sacrifican algunos detalles, pero ofrecen nuevas perspectivas sobre los patrones de datos.

Una distribucin de frecuencias es una tabla en la que los datos se organizan en clases, es decir, en grupos de valores que describen una caractersticas de los datos.

Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases.

Caractersticas de las distribuciones de frecuencias relativas.

Tambin podemos expresar la frecuencia de cada valor como una fraccin o un porcentaje del nmero total de observaciones. Para obtener este valor, dividimos la frecuencia de esa clase entre el nmero total de observaciones del conjunto de datos. La respuesta se puede expresar como una fraccin, un nmero decimal o un porcentaje.

La suma de todas las frecuencias relativas es igual a 1,00 o a 100%. Esto es as debido a que una distribucin de frecuencias relativas aparea a cada clase con su fraccin o porcentaje apropiados del total de datos. Por consiguiente, las clases que aparecen en cualquier distribucin de frecuencias, ya sean relativas o simples, son completamente inclusivas. Todos los datos caen en una u otra categora. Las clases son mutuamente exclusivas, es decir, ningn punto de dato cae en ms de una categora.

En las distribuciones de frecuencias no aparecen clases que se traslapen.

Podemos, tambin, clasificar la informacin de acuerdo con caractersticas cualitativas, como raza, religin y sexo, que no entran de manera natural en clasificaciones numricas. Como clases de atributos cuantitativos, stas deben ser completamente inclusivas y mutuamente exclusivas.

La categora "otros" se conoce como clase de extremo abierto cuando permite que el extremo inferior o el superior de una clasificacin cuantitativa no est limitado.

Los esquemas de clasificacin pueden ser tanto cuantitativos como cualitativos y tanto discretos como continuos. Las clases discretas son entidades separadas que no pasan de una clase discreta a otra sin que haya un rompimiento. Los datos discretos son aquellos que pueden tomar slo un nmero limitado de valores.

Los datos continuos pasan de una clase a otra sin que haya un rompimiento. Implican mediciones numricas. Los datos continuos pueden expresarse con nmeros fraccionarios o con enteros.

Las variables discretas son cosas que se pueden contar y las continuas son cosas que aparecen en algn punto de una escala.

Construccin de una distribucin de frecuencias:

Pasos:

1. Decidir el tipo y nmero de clases para dividir los datos. De acuerdo con la medida cuantitativa o un atributo cualitativo. Necesitamos decidir cuntas clases distintas usar y el alcance que cada clase debe cubrir. el alcance total debe dividirse entre clases iguales, esto es, el ancho del intervalo, tomado desde el principio de una clase hasta el principio de la clase siguiente, necesita ser el mismo para todas las clases.

El nmero de clases depende del nmero de puntos de dato y del alcance de los datos recolectados. Cuantos ms puntos de dato se tengan o cuanto ms grande sea el alcance, ms clases se necesitarn para dividir los datos. Como regla general, los estadsticos rara vez utilizan menos de 6 y ms de 15 clases.

Debido a que necesitamos hacer los intervalos de clase de igual tamao, el nmero de clases determina el ancho de cada clase.

Ancho de los intervalos de clase = (valor unitario siguiente despus del valor ms grande de los datos valor ms pequeo de los datos) / nmero total de intervalos

Debemos utilizar el siguiente valor ms alto de las mismas unidades, ya que estamos midiendo el intervalo entre el primer valor de una clase y el primer valor de la siguiente.

2. Clasificar los puntos de dato en clases y contar el nmero de datos que hay en cada clase.

3. Ilustrar los datos en un diagrama.

Representacin grfica de las distribuciones de frecuencias:

Las grficas dan los datos en un diagrama de dos dimensiones. Sobre el eje horizontal podemos mostrar los valores de la variable (la caracterstica que estamos midiendo). Sobre el eje vertical sealamos las frecuencias de las clases mostradas en el eje horizontal.

Las grficas de distribuciones de frecuencias simples y de distribuciones de frecuencias relativas son de utilidad debido a que resaltan y aclaran los patrones que no se pueden distinguir fcilmente en las tablas. Atraen la atencin del que las observa hacia los patrones existentes en los datos. Las grficas pueden tambin ayudarnos a resolver problemas concernientes a las distribuciones de frecuencias. Nos permitirn estimar algunos valores con slo una mirada y nos proporcionarn una verificacin visual sobre la precisin de nuestras soluciones.

Histogramas.

Un histograma consiste en una serie de rectngulos, cuyo ancho es proporcional al alcance de los datos que se encuentran dentro de una clase, y cuya altura es proporcional al nmero de elementos que caen dentro de cada clase. Si las clases que utilizamos en la distribucin de frecuencias son del mismo ancho, entonces las barras verticales del histograma tambin tienen el mismo ancho. La altura de la barra correspondiente a cada clase representa el nmero de

observaciones de la clase. Como consecuencia, el rea contenida en cada rectngulo (ancho por altura) ocupa un porcentaje del rea total de todos los rectngulos igual al porcentaje de la frecuencia de la clase correspondiente con respecto a todas las observaciones hechas.

Un histograma que utiliza las frecuencias relativas de los puntos de dato de cada una de las clases, en lugar de usar el nmero real de puntos, se conoce como histograma de frecuencias relativas. Este tipo de histograma tiene la misma forma que un histograma de frecuencias absolutas construido a partir del mismo conjunto de datos. Esto es as debido a que en ambos, el tamao relativo de cada rectngulo es la frecuencia de esa clase comparada con el nmero total de observaciones.

Polgonos de frecuencias.

Son otra forma de representar grficamente distribuciones tanto de frecuencias simples como relativas. Para construir un polgono de frecuencias sealamos stas en el eje vertical y los valores de la variable que estamos midiendo en el eje horizontal. A continuacin, graficamos cada frecuencia de clase trazando un punto sobre su punto medio y conectamos los resultantes puntos sucesivos con una lnea recta para formar un polgono.

Se aaden dos clases, una en cada extremo de la escala de valores observados. Estas dos nuevas clases que contienen cero observaciones permiten que el polgono alcance el eje horizontal en ambos extremos de la distribucin.

Un polgono de frecuencias es slo una lnea que conecta los puntos medios de todas las barras de un histograma. Por consiguiente, podemos reproducir el histograma mediante el trazado de lneas verticales desde los lmites de clase y luego conectando tales lneas con rectas horizontales a la altura de los puntos medios del polgono.

Un polgono de frecuencias que utiliza frecuencias relativas de puntos de dato en cada una de las clases, en lugar del nmero real de puntos, se conoce como polgono de frecuencias relativas. Este polgono tiene la misma forma que el polgono de frecuencias construido a partir del mismo conjunto de datos, pero con una escala diferente en los valores del eje vertical.

Ventajas de los histogramas:

Los rectngulos muestran cada clase de la distribucin por separado. El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmero total de observaciones que se encuentran en esa clase.

Ventajas de los polgonos de frecuencias:

Es ms sencillo que su correspondiente histograma. Traza con ms claridad el perfil del patrn de datos. Se vuelve cada vez ms liso y parecido a una curva conforme aumentamos el nmero de clases y el nmero de observaciones.

Un polgono alisado mediante el aumento de clases y de puntos de dato se conoce como curva de frecuencias. Ojivas.

Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por encima de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hay dentro de los intervalos.

La grfica de una distribucin de frecuencias acumuladas se conoce como ojiva.

En ocasiones, la informacin que utilizamos se presenta en trminos de frecuencias acumuladas "mayores que". La ojiva adecuada para tal informacin tendra una inclinacin hacia abajo y hacia la derecha, en lugar de tener una inclinacin hacia arriba y a la derecha.

Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma manera en que trazamos la ojiva de una distribucin de frecuencias absolutas. Slo habr un cambio: la escala del eje vertical.

Del ordenamiento de datos podemos construir distribuciones de frecuencias. A partir de las distribuciones de frecuencias podemos construir distribuciones de frecuencias acumuladas. A partir de stas podemos trazar una ojiva. Y de esta ojiva podemos aproximar los valores que tenemos en el ordenamiento de datos. Sin embargo, no podemos recobrar de manera normal los datos originales exactos a partir de cualquiera de las representaciones grficas que hemos analizado.

Tratamiento de una variable discreta:

Se utilizan los diagramas de barras, la diferencia con el histograma es que los rectngulos no se tocan entre s; esto se debe a que, al ser la variable discreta, entre los valores sucesivos no hay valores intermedios.

Las frecuencias acumuladas se grafican por medio de una ojiva en forma de escalera, debido a que la frecuencia aumenta de a saltos.

RECOMENDACIONES:

Cuando se trabaja con muestras, recopilar el mayor nmero de datos posible.

Usar 5 clases como mnimo y 15 como mximo para agrupar los datos, en funcin del nmero de datos disponibles.

Trabajar con intervalos de clase de igual longitud.

Tener cuidado con la clasificacin automtica que hacen los paquetes estadsticos.

Al calcular frecuencias relativas como proporcin trabajar con cuatro dgitos despus de la coma, para evitar errores de redondeo en la suma.

Al dibujar un grfico, no exagerar la escala vertical u horizontal. Un grfico desproporcionado complica su interpretacin y puede resultar engaoso a simple vista.

CONCEPTOS:

Unidad de observacin: persona o casa sobre la que se mide una o varias caractersticas de inters.

Caracteres: propiedades o rasgos que se miden en cada unidad de observacin.

Variable numrica: VARIABLE. Carcter cuantitativo.

Variable categrica: ATRIBUTO. Carcter cualitativo.

Poblacin: conjunto formado por todas las unidades objeto de un estudio estadstico. Coleccin de todos los elementos que se estn estudiando y sobre los cuales intentamos llegar a conclusiones.

Muestra: subconjunto representativo de la poblacin. Coleccin de algunos elementos, pero no de todos, de la poblacin bajo estudio, utilizada para describir poblaciones.

Muestra representativa: muestra que contiene las caractersticas importantes de la poblacin en las mismas proporciones en que estn contenidas en la poblacin.

Datos: coleccin de cualquier nmero de observaciones relacionadas sobre una o ms variables.

Punto de dato: una sola observacin de un conjunto de datos.

Arreglo de datos: organizacin de los datos sin procesar por observacin, tomados en orden ascendente o descendente.

Clase de extremo abierto: clase que permite que el extremo superior o inferior de un esquema de clasificacin cuantitativo no tenga lmite.

Conjunto de datos: una coleccin de datos.

Curva de frecuencias: polgono de frecuencias alisado mediante el aumento de clases y puntos de dato a un conjunto de datos.

Datos continuos: datos que pueden pasar de una clase a la siguiente sin interrumpirse y que pueden expresarse mediante nmeros enteros o fraccionarios. Datos numricos que admiten infinitos valores entre dos valores cualesquiera; generalmente surgen de una medicin.

Datos discretos: datos que no pasan de una clase a la siguiente sin que haya una interrupcin; esto es, donde las clases representan categoras o cuentas distintas que pueden representarse mediante nmeros enteros. Datos numricos que no admiten valores intermedios entre dos valores sucesivos; generalmente surgen de un conteo.

Datos sin procesar: informacin antes de ser organizada o analizada por mtodos estadsticos. Conjunto de datos que no han recibido ningn tratamiento estadstico.

Datos tratados: conjunto de datos que ha sido objeto de algn tipo de ordenamiento o procesamiento.

Intervalo de clase: agrupamiento de valores de una variable.

Alcance de los datos: diferencia entre el mayor y menor valor de la serie.

Distribucin de frecuencias: despliegue organizado de datos que muestran el nmero de observaciones del conjunto de datos que entran en cada una de las clases de un conjunto de clases mutuamente exclusivas y colectivamente exhaustivas. Asignacin de frecuencias a cada uno de los valores de una variable o atributo.

Tabla de frecuencias: tabla donde se asienta la distribucin de frecuencias.

Distribucin de frecuencias acumuladas: despliegue de datos en forma de tabla que muestra cuntos datos estn por encima o por debajo de ciertos valores.

Distribucin de frecuencias relativas: despliegue de un conjunto de datos en el que se muestra la fraccin o porcentaje del total del conjunto de datos que entra en cada elemento de un conjunto de clases mutuamente exclusivas y colectivamente exhaustiva.

Histograma: grfica de un conjunto de datos compuesta de una serie de rectngulos, cada uno con un ancho proporcional al alcance de los valores de cada clase y altura proporcional al nmero de elementos que entran en la clase, o altura proporcional a la fraccin de elementos de la clase. Representacin grfica de la distribucin de frecuencias (absoluta o relativa) de una variable continua.

Ojiva: grfica de una distribucin de frecuencias acumuladas absolutas o relativas.

Polgono de frecuencias: lnea que une los puntos medios de cada clase de un conjunto de datos, trazada a la altura correspondiente a la frecuencia de datos. Representacin grfica de la distribucin de frecuencias en forma suavizada de una variable continua.

Diagrama de barras: representacin grfica de la distribucin de frecuencias de un atributo o de una variable discreta.

Frecuencia absoluta: nmero de veces que se repite un determinado valor de una variable o atributo.

Frecuencia relativa: proporcin o porcentaje de veces que se repite un valor.

BIBLIOGRAFA: RICHARD I. LEVIN - DAVID S. RUBIN, ESTADSTICA PARA ADMINISTRADORES, ED. PRENTICE HALL, SEXTA ED., 1996

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

Estadstica sumaria. Podemos usar una serie de nmeros conocidos como estadstica sumaria para describir las caractersticas del conjunto de datos. Dos de estas caractersticas son de particular importancia para los responsables de tomar decisiones: la de tendencia central y la de dispersin.

Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin.

Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen.

Sesgo: las curvas que representan los puntos de datos de un conjunto de datos pueden ser simtricas o sesgadas. Las curvas simtricas, tienen una forma tal que una lnea vertical que pase por el punto ms alto de la curva dividir el rea de sta en dos partes iguales. Cada parte es una imagen espejo de la otra. En las curvas sesgadas, los valores de su distribucin de frecuencias estn concentrados en el extremo inferior o en el superior de la escala de medicin del eje horizontal. Los valores no estn igualmente distribuidos. Las curvas pueden estar sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda (negativamente sesgadas).

Curtosis: cuando medimos la curtosis de una distribucin, estamos midiendo su grado de agudeza.

La media aritmtica.

Cuando nos referimos al "promedio" de algo, estamos hablando de la media aritmtica.

Para encontrar la media aritmtica, sumamos los valores y el resultado lo dividimos entre el nmero de observaciones.

Smbolos convencionales.

Una muestra de una poblacin consiste en n observaciones, con una media de x (lase equis testada). Las medidas que calculamos para una muestra se conocen como estadstica.

La notacin es diferente cuando calculamos medidas para la poblacin entera, es decir, para el grupo que contiene a todos los elementos que estamos describiendo. La media de una poblacin se simboliza con (letra griega mi). El nmero de elementos de una poblacin se denota con la letra mayscula cursiva N. Por lo general, en estadstica utilizamos letras del alfabeto latino para simbolizar la informacin sobre las muestras y letras del griego para referirnos a la informacin sobre poblaciones.

Clculo de la media a partir de datos no agrupados.

Media de la poblacin:

= x / N

x = x / n

Para calcular esta media, sumamos todas las observaciones. Los estadsticos se refieren a este tipo de datos como datos no agrupados.

Clculo de la media de datos agrupados:

Una distribucin de frecuencias consta de datos agrupados en clases. Cada valor de una observacin cae dentro de alguna de las clases. No sabemos el valor individual de cada observacin. A partir de la informacin de la tabla, podemos calcular fcilmente una estimacin del valor de la media de estos datos agrupados.

De haber usado los datos originales sin agrupar, podramos haber calculado el valor real de la media.

Para encontrar la media aritmtica de datos agrupados, primero calculamos el punto medio de cada clase. Para lograr que los puntos medios queden en cifras cerradas, redondeamos las cantidades. Despus, multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos todos los resultados y dividimos esta suma entre el nmero total de observaciones de la muestra.

x = (f x) / n

f = frecuencia de observaciones de cada clase

x= punto medio de cada clase de la muestra

n = nmero de observaciones de la muestra

Codificacin:

Mediante esta tcnica, podemos eliminar el problema de tener puntos medios muy grandes o inconvenientes. En lugar de utilizar los puntos medios reales para llevar a efecto nuestros clculos, podemos asignar enteros consecutivos de valor pequeo, conocidos como cdigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier punto medio, pero para que nuestros enteros sean pequeos, asignaremos cero al punto medio de la parte media de la distribucin (o la parte ms cercana a sta). Podemos asignar enteros negativos a los valores menores a dicho punto medio y enteros positivos a los valores ms grandes.

Los estadsticos usan xo para representar el punto medio al que se le ha asignado el cdigo 0 y u para el punto medio codificado:

x = xo + w [(u f)] / n

w = ancho numrico del intervalo de clase

u = cdigo asignado a cada punto medio de clase

Ventajas y desventajas de la media aritmtica.

La media aritmtica, en su carcter de un solo nmero que representa a un conjunto de datos completo, tiene importantes ventajas:

1. Se trata de un concepto familiar para la mayora de las personas y es intuitivamente claro. 2. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es nica debido a que cada conjunto de datos posee una y slo una media. 3. Es til para llevar a cabo procedimientos estadsticos como la comparacin de medias de varios conjuntos de datos.

Desventajas:

1. Puede verse afectada por valores extremos que no son representativos del resto de los datos. 2. Resulta tedioso calcular la media debido a que utilizamos cada uno de los puntos de dato de nuestro clculo. 3. Somos incapaces de calcular la media para un conjunto de datos que tiene clases de extremo abierto, ya sea en el inferior o en el superior de la escala.

SUGERENCIA:

La media aritmtica, a menudo, puede mal interpretarse si los datos no entran en un grupo homogneo.

La mediana.

La mediana es un solo valor calculado a partir del conjunto de datos que mide la observacin central de stos. Esta sola observacin es la ms central o la que est ms en medio en el conjunto de nmeros. La mitad de los elementos estn por encima de este punto y la otra mitad est por debajo.

Clculo de la mediana a partir de datos no agrupados:

Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el de en medio en el arreglo es la mediana. Si hay un nmero par de observaciones, la mediana es el promedio de los dos elementos de en medio.

Mediana = (n + 1) / 2

Clculo de la mediana a partir de datos agrupados:

1. Encontrar qu observacin de la distribucin est ms al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento ms central. 3. Determinar el nmero de elementos de la clase y la localizacin de la clase que contiene al elemento mediano. 4. Determinar el ancho de cada paso para pasar de una observacin a otra en la clase mediana, dividiendo el intervalo de cada clase entre el nmero de elementos contenido en la clase. 5. Determinar el nmero de pasos que hay desde el lmite inferior de la clase mediana hasta el elemento correspondiente a la mediana. 6. Calcular el valor estimado del elemento mediano multiplicando el nmero de pasos que se necesitan para llegar a la observacin mediana por el ancho de cada paso. Al producto sumarle el valor del lmite inferior de la clase mediana. 7. Si existe un nmero par de observaciones en la distribucin, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso nmero 6.

Un mtodo ms sencillo:

m = {[(n + 1) / 2 (F + 1)] / fm} w + Lm

m = mediana de la muestra n = nmero total de elementos de la distribucin F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana

fm = frecuencia de la clase mediana w = ancho de intervalo de clase Lm = lmite inferior del intervalo de clase mediano

Ventajas y desventajas de la mediana:

Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fcil de entender y se puede calcular a partir de cualquier tipo de datos incluso a partir de datos agrupados con clases de extremo abierto a menos que la mediana entre en una clase de extremo abierto.

Podemos encontrar la mediana incluso cuando nuestros datos son descripciones cualitativas, en lugar de nmeros.

Ciertos procedimientos estadsticos que utilizan la mediana son ms complejos que aquellos que utilizan la media. Debido a que la mediana es una posicin promedio, debemos ordenar los datos antes de llevar a cabo cualquier clculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran nmero de elementos. Por consiguiente, si deseamos utilizar una estadstica de muestra para estimar un parmetro de poblacin, la media es ms fcil de usar que la mediana.

La moda.

La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la mediana, pues en realidad no se calcula mediante algn proceso aritmtico ordinario. La moda es aquel valor que ms se repite en el conjunto de datos.

En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el valor ms frecuente del conjunto de datos. Es por esta razn que rara vez utilizamos la moda de un conjunto de datos no agrupados como medida de tendencia central.

Por esta razn, siempre que utilizamos la moda como medida de tendencia central de un conjunto de datos, debemos calcular la moda de datos agrupados (buscar la clase modal).

Clculo de la moda de datos agrupados:

Cuando los datos ya se encuentran agrupados en una distribucin de frecuencias, podemos poner que la moda est localizada en la clase que contiene el mayor nmero de elementos, es decir, en la clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase modal:

Mo = Lmo + [d1 / (d1 + d2 )] w

Lmo = lmite inferior de la clase modal. d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por debajo de ella. d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por encima de ella. w = ancho del intervalo de la clase modal.

Ventajas y desventajas de la moda:

La moda, al igual que la mediana, se puede utilizar como una posicin central para datos tanto cualitativos como cuantitativos.

Tambin, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos. Incluso si los valores extremos son muy altos o muy bajos, nosotros escogemos el valor ms frecuente del conjunto de datos como el valor modal. Podemos utilizar la moda sin importar qu tan grandes o qu tan pequeos sean los valores del conjunto de datos, e independientemente de cul sea su dispersin.

La podemos utilizar aun cuando una o ms clases sean de extremo abierto.

Muy a menudo, no existe un valor modal debido a que el conjunto de datos no contiene valores que se presenten ms de una vez. En otras ocasiones, cada valor es la moda, pues cada uno

de ellos se presenta el mismo nmero de veces. Otra desventaja consiste en que cuando los datos contienen dos, tres o ms modas, resultan difciles de interpretar y comparar.

Comparacin entre la media, la mediana y la moda.

Cuando trabajamos un problema de estadstica, debemos decidir si vamos a utilizar la media, la mediana o la moda como medidas de tendencia central. Las distribuciones simtricas que slo contienen una moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia central, pues ya est hecha la seleccin.

En una distribucin positivamente sesgada (es decir, sesgada hacia la derecha), la moda todava se encuentra en el punto ms alto de la distribucin, la mediana est hacia la derecha de la moda y la media se encuentra todava ms a la derecha de la moda y la mediana.

En una distribucin negativamente sesgada, la moda sigue siendo el punto ms alto de la distribucin, la mediana est hacia la izquierda de ella y la media se encuentra todava ms a la izquierda de la moda y la mediana.

Cuando la poblacin est sesgada negativa o positivamente, con frecuencia la mediana resulta ser la mejor medida de posicin, debido a que siempre est entre la moda y la media. La mediana no se ve altamente influida por la frecuencia de aparicin de un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores extremos como la media.

SUGERENCIA

La seleccin de la media, la mediana o la moda, en ocasiones, depende de la prctica comn de una industria en particular (salario medio de los obreros, precio mediano de una casa, familia modal para el diseo de automviles).

La dispersin.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad.

La dispersin es importante porque:

1. Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. 2. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas. 3. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes.

Medidas de dispersin.

La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto de datos. Las medidas de distancia son: el alcance, el alcance interfractil y el alcance intercuartil.

Alcance.

Es la diferencia entre el ms alto y el ms pequeo de los valores observados.

Alcance = valor de la observacin ms alta valor de la observacin ms pequea

El alcance es fcil de entender y de encontrar, pero su utilidad como medida de dispersin es limitada. Slo toma en cuenta los valores ms alto y ms bajo de una distribucin y no considera ninguna otra observacin del conjunto de datos. Ignora la naturaleza de la variacin entre todas las dems observaciones, y se ve muy influido por los valores extremos.

Las distribuciones de extremo abierto no tienen alcance, pues no existe un valor ms alto o ms bajo en la clase de extremo abierto.

Alcance interfractil.

En una distribucin de frecuencias, una fraccin o proporcin dada de los datos cae en un fractil o por debajo de ste. La mediana, por ejemplo, es el fractil 0,5, puesto que la mitad de los datos es menor o igual a este valor. Los fractiles son parecidos a los porcentajes. En una distribucin cualquiera, el 25% de los datos est en el fractil 0,25 o por debajo de ste; igualmente, 25% de los datos cae en el vigsimo quinto percentil o por debajo de ste. El alcance interfractil es una medida de la dispersin entre dos fractiles de una distribucin de frecuencias, es decir, la diferencia entre los valores de los dos fractiles.

Los fractiles tienen nombres especiales, dependiendo del nmero de partes iguales en que se dividen los datos. Los fractiles que los dividen en 10 partes iguales se conocen como deciles. Los cuartiles dividen los datos en cuatro partes iguales. Los percentiles dividen el conjunto de datos en 100 partes iguales.

Alcance intercuartil.

El alcance intercuartil mide aproximadamente qu tan lejos de la mediana tenemos que ir en cualquiera de las dos direcciones antes de que podamos recorrer una mitad de los valores del conjunto de datos. Para calcular este alcance, dividimos nuestros datos en cuatro partes, cada una de las cuales contiene 25% de los elementos de la distribucin. Los cuartiles son, entonces, los valores ms alto y ms bajo de estas cuatro partes, y el alcance intercuartil es la diferencia entre los valores del primer cuartil y el tercer cuartil.

SUGERENCIA

El punto fractil es siempre el punto en el o debajo del cual cae la proporcin establecida de valores.

Medidas de desviacin promedio.

Las descripciones ms comprensivas de la dispersin son aquellas que tratan con la desviacin promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son la varianza y la desviacin estndar. Ambas medidas nos dan una distancia promedio de cualquier observacin del conjunto de datos con respecto a la media de la distribucin.

Varianza de la poblacin.

Cada poblacin tiene una varianza, que se simboliza con 2 (sigma cuadrada). Para calcular la varianza de una poblacin, dividimos la suma de las distancias al cuadrado entre la media y cada elemento de la poblacin entre el nmero total de observaciones de dicha poblacin.

2 = (x - )2 / N

2 = varianza de la poblacin.
x = elemento u observacin. = media de la poblacin. N = nmero total de elementos de la poblacin.

Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son intuitivamente claras o fciles de interpretar. Por esta razn, tenemos que hacer un cambio significativo en la varianza para calcular una medida til de la desviacin, que sea menos confusa. Esta medida se conoce como la desviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar, entonces, est en las mismas unidades que los datos originales.

Desviacin estndar de la poblacin.

La desviacin estndar de la poblacin, o , es simplemente la raz cuadrada de la varianza de la poblacin. Como la varianza es el promedio de las distancias al cuadrado que van desde las observaciones a la media, la desviacin estndar es la raz cuadrada del promedio de las distancias al cuadrado que van desde las observaciones a la media. La desviacin estndar est en las mismas unidades que las que se usaron para medir los datos.

La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando tomamos la raz cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente consideran la raz cuadrada positiva.

Para calcular la varianza o la desviacin estndar, construimos una tabla utilizando todos los elementos de la poblacin.

Usos de la desviacin estndar.

La desviacin estndar nos permite determinar, con un buen grado de precisin, dnde estn localizados los valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice que no importa qu forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2 desviaciones estndar a partir de la media de la distribucin, y al menos 89% de los valores caen dentro de + 3 desviaciones estndar a partir de la media.

Con ms precisin:

Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a partir de la media. Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la media. Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones estndar por debajo de la media hasta tres desviaciones estndar por arriba de la media.

Resultado estndar:

La desviacin estndar es tambin til para describir qu tan lejos las observaciones individuales de una distribucin de frecuencias se apartan de la media de la distribucin. Una medida que se conoce como resultado estndar nos da el nmero de desviaciones estndar que una observacin en particular ocupa por debajo o por encima de la media:

Resultado estndar = (x - ) /

Clculo de la varianza y la desviacin estndar utilizando datos agrupados:

2 = f(x - )2 / N

2 = varianza de la poblacin.
x = punto medio de cada una de las clases. = media de la poblacin. N = nmero total de elementos de la poblacin. f = frecuencia de cada una de las clases.

= 2

desviacin estndar de una muestra:

Para calcular la varianza y la desviacin estndar de una muestra, utilizamos las mismas frmulas, sustituyendo por x y N con n 1.

s2 = (x - x)2 / (n 1)

Por qu utilizamos n 1 como denominador en lugar de N? Los especialistas en estadstica pueden demostrar que si tomamos muchas muestras de una poblacin dada, si encontramos la varianza de la muestra para cada muestra y promediamos los resultados, entonces este promedio no tiende a tomar el valor de la varianza de la poblacin, a menos que tomemos n 1 como denominador de los clculos.

Al igual que utilizamos la desviacin estndar de la poblacin para derivar los resultados estndar de la misma, podemos tambin usar la desviacin estndar de la muestra para calcular los resultados estndar de la muestra. Estos resultados indican a cuntas desviaciones estndar se halla una observacin en particular por arriba o por debajo de la media de la muestra.

Resultado estndar de la muestra = (x x) / s

SUGERENCIAS

Las letras griegas siempre se refieren a parmetros de la poblacin y las letras latinas se refieren a estadsticas de la muestra.

Recordar utilizar N como denominador cuando se calcula la desviacin estndar de la poblacin, pero n 1 para calcular la desviacin estndar de la muestra.

Dispersin relativa: el coeficiente de variacin.

La desviacin estndar es una medida absoluta de la dispersin que expresa la variacin en las mismas unidades que los datos originales.

La desviacin estndar no puede ser la nica base para la comparacin de dos distribuciones. Si tenemos una desviacin estndar de 10 y una media de 5, los valores varan en una cantidad que es el doble de la media misma. Si, por otro lado, tenemos una desviacin estndar de 10 y una media de 5.000, la variacin con respecto a la media es insignificante. En consecuencia, no podemos conocer la dispersin de un conjunto de datos hasta que conocemos su desviacin estndar, su media y cmo se compara la desviacin estndar con respecto a la media.

Lo que necesitamos es una medida relativa que nos proporcione una estimacin de la magnitud de la desviacin con respecto a la magnitud de la media. El coeficiente de variacin es una de estas medidas relativas de dispersin. Se relaciona la desviacin estndar y la media, expresando la desviacin estndar como porcentaje de la media.

Coeficiente de variacin = ( / ) * 100

CONCEPTOS:

Alcance: distancia entre los valores ms bajo y ms alto de un conjunto de datos.

Alcance intercuartil: diferencia entre los valores del primer y tercer cuartiles; eta diferencia representa el alcance de la mitad central del conjunto de datos.

Alcance interfractil: medida de la dispersin entre dos fractiles de una distribucin; es decir, la diferencia entre los valores de dos fractiles.

Clase mediana: clase de una distribucin de frecuencias que contiene el valor mediano de un conjunto de datos.

Codificacin: mtodo para calcular la media de datos agrupados mediante la recodificacin de los valores de los puntos medios de las clases a valores ms sencillos.

Coeficiente de variacin: medida relativa de la dispersin, comparable por medio de distribuciones diferentes, que expresa la desviacin estndar como porcentaje de la media. Proporcin o porcentaje de la media que representa la desviacin estndar.

Cuartiles: fractiles que dividen los datos en cuatro partes iguales.

Curtosis: el grado de agudeza de una distribucin de puntos.

Deciles: fractiles que dividen los datos en diez partes iguales.

Desviacin estndar: raz cuadrada positiva de la varianza; medida de dispersin con las mismas unidades que los datos originales.

Dispersin: la extensin o variabilidad de un conjunto de datos.

Distribucin bimodal: distribucin de puntos de datos en la que dos valores se presentan con ms frecuencia que los dems elementos del conjunto de datos.

Estadstica (o estimador): medidas numricas que describen las caractersticas de una muestra, representadas por caracteres latinos.

Estadstica sumaria: nmeros solos que describen ciertas caractersticas de un conjunto de datos.

Fractil: en una distribucin de frecuencias, es la posicin de un valor en, o por encima de, una fraccin dada de los datos.

Media: medida de tendencia central que representa el promedio aritmtico de un conjunto de observaciones.

Mediana: punto situado a la mitad de conjunto de datos, medida de localizacin que divide al conjunto de datos en dos partes iguales.

Medida de dispersin: medida que describe cmo se dispersan o distribuyen las observaciones de un conjunto de datos. Cantidades que describen la variabilidad de los datos.

Medida de distancia: medida de dispersin en trminos de la diferencia entre dos valores del conjunto de datos.

Medida de tendencia central (o de posicin): medida que indica el valor esperado de un punto de datos tpico o situado en el medio. Cantidades numricas que dan una idea sobre la ubicacin de la distribucin de frecuencias.

Moda: el valor que ms a menudo se repite en un conjunto de datos. Est representado por el punto ms alto de la curva de distribucin de un conjunto de datos.

Parmetros: valores numricos que describen las caractersticas de una poblacin completa, representados generalmente por letras griegas.

Percentiles: fractiles que dividen los datos en 100 partes iguales.

Resultado estndar: expresin de una observacin en trminos de unidades de desviacin estndar por encima o por debajo de la media; es decir, la transformacin de una observacin al restarle la media y dividirla entre la desviacin estndar.

Sesgo: grado en que una distribucin de puntos est concentrada en un extremo o en el otro; falta de simetra. Asimetra en distribuciones de frecuencias no simtricas.

Simtrica: caracterstica de una distribucin en la que cada mitad es la imagen especular de la otra.

Teorema de Chebyshev: no importa qu forma tenga la distribucin, al menos 75% de los valores de la poblacin caern dentro de dos desviaciones estndar a partir de la media, y al menos 89% caer dentro de tres desviaciones estndar.

Varianza: medida de la distancia cuadrada promedio entre la media y cada observacin de la poblacin. Promedio de los desvos cuadrticos con respecto a la media.

RECOMENDACIONES PRCTICAS:

Revisar cuidadosamente los datos antes de usarlos; verificar que no contengan errores; chequear en particular los valores extremos.

Elaborar histogramas o cualquier otro tipo de grficos que permita visualizar la forma y las caractersticas principales de la distribucin de frecuencias.

Diferenciar con precisin cundo se hace referencia a un parmetro poblacional y cundo a un estadstico muestral.

Usar en forma conjunta una media de posicin y una de dispersin (como mnimo) para analizar el comportamiento de la variable.

Prestar atencin a las ventajas y desventajas de las distintas medidas de posicin y dispersin, para decidir correctamente su eleccin.

Calcular la media aritmtica con los datos en bruto sin agrupar siempre que se requiera su valor exacto.

Dar preferencia al clculo de la mediana como medida de posicin, cuando la serie tiene pocos datos e incluye valores extremos.

No tiene sentido calcular la moda en series de datos sin agrupar.

Tanto la mediana como la moda son valores de la variable (no confundir con las frecuencias a las que estn asociadas).

Comparar, siempre que se pueda, media, mediana y moda para determinar el sesgo de la distribucin.

El rango o alcance es una medida de dispersin poco apropiada para describir series con muchos datos.

La desviacin estndar es preferible a la varianza porque se expresa en las mismas unidades de la variable.

BIBLIOGRAFA: RICHARD I. LEVIN - DAVID S. RUBIN, ESTADSTICA PARA ADMINISTRADORES, ED. PRENTICE HALL, SEXTA ED., 1996

PROBABILIDAD

Historia de la probabilidad.

Jacob Berooulli (1654 - 1705), Abraham de Moivre (1667 - 1754), el reverendo Thomas Bayes (1702 - 1761) y Joseph Lagrange (1736 - 1813) desarrollaron frmulas y tcnicas para el clculo de la probabilidad. En el siglo XIX, Pierre Simon, marqus de Laplace (1749 - 1827), unific todas estas primeras ideas y compil la primera teora general de la probabilidad.

La teora de la probabilidad fue aplicada con xito en las mesas de juego y, lo que es ms importante, en problemas sociales y econmicos. La industria de seguros requera un conocimiento preciso acerca de los riesgos de prdida. Muchos centros de aprendizaje estudiaron la probabilidad como una herramienta para el entendimiento de los fenmenos sociales.

Nuestra necesidad de tratar con total incertidumbre nos lleva a estudiar y utilizar la teora de la probabilidad. Al organizar la informacin y considerarla de manera sistemtica, seremos capaces de reconocer nuestras suposiciones, comunicar nuestro razonamiento a otras personas y tomar una decisin ms slida.

Conceptos bsicos sobre probabilidad.

La probabilidad es la posibilidad de que algo pase. Las probabilidades se expresan como fracciones o como decimales que estn entre uno y cero. Tener una probabilidad de cero significa que algo nuca va a suceder; una probabilidad de uno indica que algo va a suceder siempre.

En la teora de la probabilidad, un evento es uno o ms de los posibles resultados de hacer algo.

La actividad que origine uno de dichos eventos se conoce como experimento aleatorio.

Al conjunto de todos los resultados posibles de un experimento se le llama espacio muestral del experimento.

Se dice que dos eventos son mutuamente excluyentes si uno y slo uno de ellos puede tener lugar a un tiempo.

Cuando en una lista de los posibles eventos que pueden resultar de un experimento se incluyen todos los resultados posibles, se dice que la lista es colectivamente exhaustiva. En una lista colectivamente exhaustiva se presentan todos los resultados posibles.

Tres tipos de probabilidad.

Existen tres maneras bsicas de clasificar la probabilidad. Estas tres formas presentan planteamientos conceptuales bastante diferentes:

Planteamiento clsico. Planteamiento de frecuencia relativa. Planteamiento subjetivo.

Probabilidad clsica.

Se define la probabilidad de que un evento ocurra como:

Nmero de resultados en los que se presenta el evento / nmero total de resultados posibles

Cada uno de los resultados posibles debe ser igualmente posible.

La probabilidad clsica, a menudo, se le conoce como probabilidad a priori, debido a que si utilizamos ejemplos previsibles como monedas no alteradas, dados no cargados y mazos de barajas normales, entonces podemos establecer la respuesta de antemano, sin necesidad de lanzar una moneda, un dado o tomar una carta. No tenemos que efectuar experimentos para poder llegar a conclusiones.

Este planteamiento de la probabilidad tiene serios problemas cuando intentamos aplicarlo a los problemas de toma de decisiones menos previsibles. El planteamiento clsico supone un mundo que no existe, supone que no existen situaciones que son bastante improbables pero que podemos concebir como reales. La probabilidad clsica supone tambin una especie de simetra en el mundo.

Frecuencia relativa de presentacin.

En el siglo XIX, los estadsticos britnicos, interesados en la fundamentacin terica del clculo del riesgo de prdidas en las plizas de seguros de vida y comerciales, empezaron a recoger datos sobre nacimientos y defunciones. En la actualidad, a este planteamiento se le llama frecuencia relativa de presentacin de un evento y define la probabilidad como:

La frecuencia relativa observada de un evento durante un gran nmero de intentos, o La fraccin de veces que un evento se presenta a la larga, cuando las condiciones son estables.

Este mtodo utiliza la frecuencia relativa de las presentaciones pasadas de un evento como una probabilidad. Determinamos qu tan frecuente ha sucedido algo en el pasado y usamos esa cifra para predecir la probabilidad de que suceda de nuevo en el futuro.

Cuando utilizamos el planteamiento de frecuencia relativa para establecer probabilidades, el nmero que obtenemos como probabilidad adquirir mayor precisin a medida que aumentan las observaciones.

Una dificultad presente con este planteamiento es que la gente lo utiliza a menudo sin evaluar el nmero suficiente de resultados.

Probabilidades subjetivas.

Las probabilidades subjetivas estn basadas en las creencias de las personas que efectan la estimacin de probabilidad. La probabilidad subjetiva se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga disponible. Esa evidencia puede presentarse en forma de frecuencia relativa de presentacin de eventos pasados o puede tratarse simplemente de una creencia meditada.

Las valoraciones subjetivas de la probabilidad permiten una ms amplia flexibilidad que los otros dos planteamientos. Los tomadores de decisiones puede hacer uso de cualquier evidencia que tengan a mano y mezclarlas con los sentimientos personales sobre la situacin.

Las asignaciones de probabilidad subjetiva se dan con ms frecuencia cuando los eventos se presentan slo una vez o un nmero muy reducido de veces.

Como casi todas las decisiones sociales y administrativas de alto nivel se refieren a situaciones especficas y nicas, los responsables de tomar decisiones hacen un uso considerable de la probabilidad subjetiva.

SUGERENCIA.

En la resolucin de problemas de probabilidad clsica, tener cuidado de asegurarse de si la situacin descrita es "con sustitucin" o "sin sustitucin" despus de cada intento.

Reglas de probabilidad.

La mayora de los administradores que utilizan la probabilidad se preocupan por dos condiciones:

El caso en que un evento u otro se presente. La situacin en que dos o ms eventos se presenten al mismo tiempo.

La probabilidad de un evento A se expresa como:

P (A)

Una probabilidad sencilla quiere decir que slo un evento puede llevarse a cabo. Se le conoce como probabilidad marginal o incondicional.

Usamos una representacin grfica, conocida como diagrama de Venn. El espacio muestral completo se representa mediante un rectngulo y los eventos se representan como partes de ese rectngulo. Si dos eventos son mutuamente excluyentes, las partes correspondientes de stos en el rectngulo, no se traslaparn. Si dos eventos no son mutuamente excluyentes, sus partes correspondientes en el rectngulo s se traslapan.

Debido a que las probabilidades se comportan en mucho como si fueran reas, tomaremos el rea del rectngulo como la unidad. Entonces la probabilidad de que suceda un evento es su rea que le corresponde dentro del rectngulo.

Regla de la adicin para eventos mutuamente excluyentes.

A menudo, estamos interesados en la probabilidad de que una cosa u otra suceda. Si estos dos eventos son mutuamente excluyentes, podemos expresar esta probabilidad haciendo uso de la regla de adicin para eventos mutuamente excluyentes:

P (A o B) = P (A) + P (B)

Existe un caso especial, para cualquier evento A, tenemos que ste sucede o no sucede. De modo que los eventos A y no A son mutuamente excluyentes y exhaustivos:

P(A) + P(no A) = 1

P(A) = 1 - P(no A)

Regla de adicin para eventos que no son mutuamente excluyentes.

Si dos eventos no son mutuamente excluyentes, es posible que ambos se presenten al mismo tiempo. En tales casos, debemos modificar la regla de la adicin para evitar el conteo doble:

P(A o B) = P(A) + P(B) - P(AB)

Probabilidades bajo condiciones de independencia estadstica.

Cuando se presentan dos eventos, el resultado del primero puede tener un efecto en el resultado del segundo, o puede no tenerlo. Esto es, los eventos pueden ser dependientes o independientes. Existen tres tipos de probabilidades que se presentan bajo independencia estadstica:

Marginal. Conjunta. Condicional.

Probabilidades marginales bajo independencia estadstica.

Una probabilidad marginal o incondicional es la probabilidad simple de presentacin de un evento.

Probabilidades conjuntas bajo condiciones de independencia estadstica.

La probabilidad de dos o ms eventos independientes que se presentan juntos o en sucesin es el producto de sus probabilidades marginales:

P (AB) = P(A) X P(B)

Un rbol de probabilidad muestra los resultados posibles y su respectiva probabilidad.

Probabilidades condicionales bajo independencia estadstica.

Simblicamente, la probabilidad condicional se escribe:

P(B/A)

Y se lee "la probabilidad de que se presente el evento B, dado que el evento A se ha presentado".

La probabilidad condicional es la probabilidad de que un segundo evento (B) se presente, si un primer evento (A) ya ha sucedido.

Para eventos estadsticamente independientes, la probabilidad condicional de que suceda el evento B dado que el evento A se ha presentado, es simplemente la probabilidad del evento B:

P(B/A) = P(B)

SUGERENCIA:

Una buena verificacin de los clculos para obtener la probabilidad conjunta consiste en recordar que para cada intento, el total de probabilidades resultantes debe sumar 1.

Probabilidades bajo condiciones de dependencia estadstica.

La dependencia estadstica existe cuando la probabilidad de que se presente algn suceso depende o se ve afectada por la presentacin de algn otro evento. Los tipos de probabilidad bajo condiciones de dependencia estadstica son:

Condicional. Conjunta. Marginal.

Probabilidad condicional bajo dependencia estadstica.

P(B/A) = P(BA) / P(A)

Probabilidades conjuntas bajo condiciones de dependencia estadstica.

P(BA) = P(B/A) x P(A)

P(BA) = P(A/B) x P(B)

Probabilidades marginales bajo condiciones de dependencia estadstica.

Las probabilidades marginales bajo dependencia estadstica se calculan mediante la suma de las probabilidades de todos los eventos conjuntos en los que se presenta el evento sencillo.

SUGERENCIA:

Hacer la diferencia necesaria entre probabilidad condicional y probabilidad conjunta mediante el uso correcto de los trminos "dado que..." y "tanto... como": P(A/B) es la "probabilidad de que se presente el evento A dado que ya se ha presentado B" y P(AB) es la "probabilidad de que tanto A como B se presenten". Y la probabilidad marginal P(A) es la "probabilidad de que se presenta A, haya sucedido o no el evento B".

Conceptos:

rbol de probabilidades: representacin grfica que muestra los resultados posibles de una serie de experimentos y sus respectivas probabilidades.

Complemento de un evento: elementos del espacio muestral no incluidos en el evento considerado.

Dependencia estadstica: condicin en la que la probabilidad de presentacin de un evento depende de la presentacin de algn otro evento, o se ve afectada por sta.

Diagrama de Venn: representacin grfica de los conceptos de probabilidad en la que el espacio muestral est representado por un rectngulo y los eventos que suceden en el espacio muestral se representan como partes de dicho rectngulo.

Espacio muestral: conjunto de todos los resultados posibles de un experimento aleatorio.

Evento: uno o ms de los resultados posibles de hacer algo, o uno de los resultados posibles de realizar un experimento.

Eventos exhaustivamente colectivos: lista de eventos que representa todos los resultados posibles de un experimento.

Eventos mutuamente excluyentes: eventos que no se pueden presentar juntos.

Experimento aleatorio actividad que tiene como resultado o que produce un evento. Prueba donde existen dos o ms resultados posibles, y no se pude anticipar cul de ellos va a ocurrir.

Frecuencia relativa de presentacin: fraccin de veces que a la larga se presenta un evento cuando las condiciones son estables, o frecuencia relativa observada de un evento en un nmero muy grande de intentos o experimentos.

Independencia estadstica: condicin en la que la presentacin de algn evento no tiene efecto sobre la probabilidad de presentacin de otro evento.

Probabilidad: la posibilidad de que algo suceda.

Probabilidad clsica: nmero de resultados favorables a la presentacin de un evento dividido entre el nmero total de resultados posibles. Asignacin de probabilidad "a priori", si necesidad de realizar el experimento.

Probabilidad condicional: probabilidad de que se presente un evento, dado que otro evento ya se ha presentado.

Probabilidad conjunta: probabilidad de que se presenten dos o ms eventos simultneamente o en sucesin.

Probabilidad marginal: probabilidad incondicional de que se presente un evento; probabilidad de que se presente un solo evento. Probabilidad simple, o probabilidad de un evento cualquiera.

Probabilidad subjetiva: probabilidad basada en las creencias personales de quien hace la estimacin de probabilidad. Asignacin de probabilidad en forma intuitiva, en base a la experiencia o el conocimiento.

Producto de probabilidades: probabilidad de la interseccin de dos o ms eventos.

Suma de probabilidades: probabilidad de la unin de dos o ms eventos.

RECOMENDACIONES PRCTICAS:

Cuando se aplica la regla de la suma de probabilidades, determinar previamente si los eventos son excluyentes o no.

Cuando se usa la regla del producto, averiguar si los eventos son dependientes o independientes. Siempre que sea posible, apoyar la interpretacin del problema mediante el empleo de diagramas de Venn. La probabilidad es un nmero que nunca puede tener valor negativo, ni ser mayor que 1.

VARIABLE ALEATORIA

Introduccin a las distribuciones de probabilidad.

Las distribuciones de probabilidad estn relacionadas con las distribuciones de frecuencias. Una distribucin de frecuencias terica es una distribucin de probabilidades que describe la forma en que se espera que varen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos tiles para hacer inferencias y para tomar decisiones en condiciones de incertidumbre.

Una distribucin de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que se presentaron realmente cuando se efectu el experimento, mientras que una distribucin de probabilidad es un listado de las probabilidades de todos los posibles resultados que podran obtenerse si el experimento se lleva a cabo.

Las distribuciones de probabilidad pueden basarse en consideraciones tericas o en una estimacin subjetiva de la posibilidad. Se pueden basar tambin en la experiencia.

Tipos de distribuciones de probabilidad.

Las distribuciones de probabilidad se clasifican como continuas y discretas. En la distribucin de probabilidad discreta est permitido tomar slo un nmero limitado de valores.

En una distribucin de probabilidad continua, la variable que se est considerando puede tomar cualquier valor dentro de un intervalo dado.

Las distribuciones continuas son una forma conveniente de presentar distribuciones discretas que tienen muchos resultados posibles, todos muy cercanos entre s.

Variables aleatorias.

Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Puede ser discreta o continua. Si puede tomar slo un nmero limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua.

Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentacin a otra, sin seguir una secuencia predecible. Los valores de una variable aleatoria son los valores numricos correspondientes a cada posible resultado de un experimento aleatorio.

La distribucin de probabilidad de una variable aleatoria proporciona una probabilidad para cada valor posible, y estas probabilidades deben sumar 1.

Valor esperado de una variable aleatoria.

El valor esperado es una idea fundamental en el estudio de las distribuciones de probabilidad.

Para obtener el valor esperado de una variable aleatoria discreta, se multiplica cada valor que la variable puede tomar por la probabilidad de presentacin de ese valor y luego se suman esos productos. Es un promedio pesado de los resultados que se esperan en el futuro. El valor esperado pesa cada resultado posible con respecto a la frecuencia con que se espera se que

presente. En consecuencia, las presentaciones ms comunes tienen asignadas un peso mayor que las menos comunes.

El valor esperado tambin puede ser obtenido a partir de estimaciones subjetivas. En ese caso, el valor esperado no es ms que la representacin de las convicciones personales acerca del resultado posible.

En muchas situaciones, encontraremos que es ms conveniente, en trminos de los clculos que se deben hacer, representar la distribucin de probabilidad de una variable aleatoria de una manera algebraica. Al hacer esto, podemos llevar a cabo clculos de probabilidad mediante la sustitucin de valores numricos directamente en una frmula algebraica.

SUGERENCIA:

El valor esperado de una variable aleatoria discreta es un promedio pesado del valor de cada resultado posible multiplicado por la probabilidad de dicho resultado. Aunque existen muchos valores diferentes posibles que la variable aleatoria puede tomar, el valor esperado es slo un nmero.

TRATAMIENTO DE VARIABLES ALEATORIAS.

Variables aleatorias discretas.

Sean x1, x2, x3, ... xn los distintos valores que puede tomar la variable aleatoria.

Y p(x1), p(x2),... p(xn) su probabilidad.

Los pares de valores (xj, p(xj)) constituyen la distribucin de probabilidades de la variable aleatoria.

p(x) se denomina funcin de probabilidad, y debe cumplir con las siguientes propiedades:

0 < p(xj) < 1 (p(x) es una probabilidad, y por lo tanto debe tomar valores entre 0 y 1). p(xj) = 1 (la suma de probabilidades repartidas entre todos los valores de la variable debe ser igual a 1).

De la misma manera que calculamos frecuencias acumuladas, podemos acumular probabilidades, obteniendo la funcin de distribucin de probabilidades:

F(x) = p(xj)

Esta funcin representa la probabilidad de que la variable aleatoria sea menor o igual que un determinado valor:

F(xj) = P (X < xj)

Grficamente, la funcin aumenta de "a saltos", ya que entre dos valores consecutivos de una variable discreta, no puede tomar valores intermedios.

Variables aleatorias continuas.

En este caso, en lugar de trabajar con la probabilidad de valores particulares de la variable, resulta ms apropiado calcular probabilidades asociadas a intervalos. Para distribuir propiedades se usa una funcin que mide "concentracin" de probabilidades alrededor de un punto, que se denomina funcin de densidad de probabilidad (fdp) y se denota como f(x).

Una funcin de densidad de probabilidad debe cumplir con las siguientes propiedades:

F(x) > 0 (la funcin es no negativa para cualquier valor de x, f(x) no es una probabilidad, y puede valer ms de 1). f(x) dx = 1 (la acumulada para todos los valores de la variable suma 1, el rea bajo la curva de la funcin vale 1).

La funcin de distribucin para una variable aleatoria continua se calcula:

F(a) = P(X < a) = f(x) dx

La probabilidad de que la variable est dentro de un intervalo [a - b] se calcula:

P (a< x < b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar como:

F(c) - F(c) = 0

Esto explica la idea de que para el caso de una variable aleatoria continua no tiene sentido trabajar con la probabilidad de un valor particular.

Medidas caractersticas de una distribucin de probabilidades.

El valor esperado es un operador matemtico, cuya frmula de clculo depende del tipo de variable aleatoria:

Variable aleatoria discreta: E (X) = xj p (xj) Variable aleatoria continua: x f(x) dx Para caracterizar correctamente a la distribucin, adems de determinar su posicin es necesario calcular alguna medida que cuantifique su variabilidad. Una cantidad muy til

para evaluar la dispersin de la variable aleatoria es el operador varianza, que se calcula:

Variable aleatoria discreta: Var (X) = (xj - E(X))2 p (xj) Variable aleatoria continua: Var (X) = x - E(X))2 f(x) dx

Conceptos:

Variable aleatoria: variable que cuantifica los resultados de un experimento aleatorio. Variable que toma diferentes valores como resultado de un experimento aleatorio.

Distribucin de probabilidades: modelo terico que describe la forma en que varan los resultados de un experimento aleatorio. Lista de los resultados de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

Variable aleatoria discreta: variable que toma un nmero finito o infinito de valores numerables. Variable aleatoria que puede tomar slo un nmero limitado de valores.

Variable aleatoria continua: variable que toma un valor infinito de valores no numerables. Variable aleatoria que puede tomar cualquier valor dentro de un intervalo dado de valores.

Funcin de probabilidad: funcin que asigna probabilidades a cada uno de los valores de una variable aleatoria discreta.

Funcin de densidad de probabilidad: funcin que mide concentracin de probabilidad alrededor de los valores de una variable aleatoria continua.

Funcin de distribucin: funcin que acumula probabilidades asociadas a una variable aleatoria.

Valor esperado: operador matemtico que caracteriza la posicin de la distribucin de probabilidades. Promedio pesado de los resultados de un experimento.

Varianza: operador que caracteriza la dispersin de la distribucin

DISTRIBUCIONES DE PROBABILIDAD

Introduccin.

Un modelo es una simplificacin de la realidad. Un modelo probabilstico es un modelo matemtico que describe el comportamiento de una variable aleatoria. Es una funcin que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una poblacin en particular y que se denominan parmetros del modelo.

En el proceso de modelacin, es necesario seguir los siguientes pasos:

1. 2. 3. 4.

Seleccionar el modelo ms apropiado. Ajustar el modelo (calcular el valor de sus parmetros). Verificar el modelo. Decidir su aceptacin o volver al paso 1.

Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de probabilidad, desarrollados para representar distintos tipos de variables y diferentes fenmenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo ms apropiado para el caso en estudio.

Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la poblacin en estudio y calcular las cantidades necesarias como para evaluar los parmetros del modelo.

La distribucin binomial.

Esta distribucin describe una variedad de procesos de inters para los administradores y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli.

Uso del proceso de Bernoulli.

Podemos describir el proceso de la manera siguiente:

1. Cada intento tiene slo dos resultados posibles. 2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo. 3. Los intentos son estadsticamente independientes.

Frmula binomial:

Probabilidad de r xitos en n ensayos = n! / [r! (n - r)!] pr qn - r

p = probabilidad caracterstica o probabilidad de tener xito q = 1 - p = probabilidad de fracaso r = nmero de xitos deseados n = nmero de intentos hechos

Generalizaciones:

Cuando p es pequea (0,1), la distribucin binomial est sesgada hacia la derecha. Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable. Cuando p = 0,5, la distribucin binomial es simtrica. Cuando p es mayor que 0,5, la distribucin est sesgada hacia la izquierda. Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7, excepto que los valores de p y q estn invertidos. Esto es cierto para cualquier pareja de valores p y q complementarios.

Medidas de tendencia central y de dispersin para la distribucin binomial.

La distribucin binomial tiene un valor esperado o media y una desviacin estndar.

Valor esperado o media: = np

Desviacin estndar: = npq

Cumplimiento de las condiciones del proceso de Bernoulli.

Necesitamos ser cuidadosos en el uso de la distribucin binomial de la probabilidad y asegurar que se cumplen las tres condiciones necesarias, en particular las condiciones 2 y 3. La condicin 2 requiere que la probabilidad del resultado de cualquier intento permanezca fija en el tiempo. La condicin 3 requiere que los ensayos o intentos de un proceso de Bernoulli sean estadsticamente independientes, es decir, que el resultado de un intento no puede afectar de ningn modo el resultado de cualquier otro intento.

La distribucin de Poisson.

La distribucin de Poisson se utiliza para describir cierto tipo de procesos, entre los que se encuentran la distribucin de llamadas telefnicas que llegan a un conmutador, la demanda (necesidades) de los pacientes que requieren servicio en una institucin de salud, las llegadas de camiones a una caseta de cobro y el nmero de accidentes registrados en una cierta interseccin de calles. Estos ejemplos tienen en comn un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma valores enteros (0, 1, 2...).

Caractersticas de los procesos que producen una distribucin de probabilidad de Poisson.

1. El promedio (la media) del nmero de eventos que se producen por hora, puede estimarse a partir de datos que se tengan disponibles. 2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno, encontraremos que las siguientes afirmaciones son verdaderas:

La probabilidad de que exactamente un evento ocurra por segundo es muy pequea y es constante para cada intervalo de un segundo. La probabilidad de que dos o ms eventos ocurran en un intervalo de un segundo es tan pequea que le podemos asignar un valor cero. El nmero de eventos que ocurren en un intervalo de un segundo es independiente del tiempo en que dicho intervalo se presente en la hora pico. El nmero de eventos en un intervalo de un segundo no depende del nmero de ocurrencias en cualquier otro intervalo de un segundo.

Clculo de la probabilidad de Poisson.

La letra X por lo general representa a una variable discreta y puede tomar valores enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x para sealar un valor especfico que esta variable pueda tomar. La probabilidad de tener exactamente x presentaciones en una distribucin de Poisson se calcula con la frmula:

La distribucin de Poisson como una aproximacin a la distribucin binomial.

La distribucin de Poisson puede ser un razonable aproximacin a la binomial, pero slo bajo ciertas condiciones. Tales condiciones se presentan cuando n es grande y p es pequea, esto es, cuando el nmero de ensayos es grande y la probabilidad binomial de tener xito es pequea. La regla que utilizan con ms frecuencia los estadsticos es que la distribucin de Poisson es una buena aproximacin de la distribucin binomial cuando n es igual o mayor que 20 y p es igual o menor que 0,05. En los casos en que se cumplen estas condiciones, podemos sustituir la media de la distribucin binomial (np) en lugar de la media de la distribucin de Poisson ( ).

SUGERENCIA:

El uso de una distribucin para aproximar a otra es una prctica bastante comn en probabilidad y estadstica. La idea consiste en buscar situaciones en las que una distribucin (como la de Poisson), cuyas probabilidades son relativamente fciles de calcular, tiene valores que se encuentran razonablemente cercanos a las de otra distribucin (como la binomial) cuyas probabilidades implican clculos ms complicados.

RECOMENDACIONES PRCTICAS:

Frente a un problema concreto, analice detenidamente todas sus caractersticas, y al elegir el modelo apropiado, verifique que se cumplan todos los supuestos del mismo.

Habituse a utilizar las tablas provistas por la bibliografa para calcular probabilidades. Ahorrar tiempo y evitar errores de clculo.

No olvide emplear la distribucin de Poisson a la binomial en aquellos casos en que p es pequeo y n es grande.

Para calcular probabilidades acumuladas, del tipo P(X > x), P(X < x) o P(x < X < x), tambin existen valores tabulados en textos especializados.

En el caso de variables aleatorias discretas, es importante diferenciar si la probabilidad deseada incluye o no el valor particular de la variable. Es decir, que P(X > x) no es lo mismo que P(X > x) y P (X < x) es distinto de P(X < x).

La distribucin normal: distribucin de una variable aleatoria continua.

La variable puede tomar cualquier valor que est en un intervalo de valores dado, y la distribucin de probabilidad es continua.

Las razones bsicas de la importancia de la distribucin normal son:

1. Tiene algunas propiedades que la hacen aplicable a un gran nmero de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. La distribucin normal es una til distribucin de muestreo. 2. La distribucin normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenmenos, incluyendo caractersticas humanas (pesos, alturas), resultados de procesos fsicos (dimensiones y rendimientos) y muchas otras medidas de inters para los administradores.

Caractersticas de la distribucin normal de probabilidad.

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de campana. 2. La media de una poblacin distribuida normalmente cae en el centro de su curva normal. 3. Debido a la simetra de la distribucin normal de probabilidad, la mediana y la moda se encuentran tambin en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor. 4. Los dos extremos de la distribucin normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal.

La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas direcciones; pero en estas poblaciones, la distribucin normal es una aproximacin conveniente. No hay una sola distribucin normal, sino una familia de curvas normales. Para definir una distribucin normal de probabilidad necesitamos definir slo dos parmetros: la media y la desviacin estndar.

La curva normal puede describir un gran nmero de poblaciones, diferenciadas solamente por la media, la desviacin estndar o por ambas.

reas bajo la curva normal.

No importa cules sean los valores de y para una distribucin de probabilidad normal, el rea bajo la curva es 1,00, de manera que podemos pensar en reas bajo la curva como si fueran probabilidades. Matemticamente:

1. Aproximadamente el 68% de todos los valores de una poblacin normalmente distribuida se encuentran dentro + 1 desviacin estndar de la media. 2. Aproximadamente 95,5% de todos los valores de una poblacin normalmente distribuida se encuentran dentro de + 2 desviaciones estndar de la media. 3. Aproximadamente 99,7% de todos los valores de una poblacin normalmente distribuida se encuentran dentro de + 3 desviaciones estndar de la media.

Las tablas estadsticas indican porciones del rea bajo la curva normal que estn contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a partir de la media.

No es posible ni necesario tener una tabla distinta para cada curva normal posible. En lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar para encontrar reas bajo cualquier curva normal. Con esta tabla podemos determinar el rea o la probabilidad de que la variable aleatoria distribuida normalmente est dentro de ciertas distancias a partir de la media. Estas distancias estn definidas en trminos de desviaciones estndar.

Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el mismo nmero de desviaciones estndar a partir de la media contendrn la misma fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.

Uso de la tabla de distribucin de probabilidad normal estndar.

En esta tabla, el valor z est derivado de la frmula:

z = (x - ) /

en la que:

x = valor de la variable aleatoria que nos preocupa = media de la distribucin de la variable aleatoria = desviacin estndar de la distribucin z = nmero de desviaciones estndar que hay desde x a la media de la distribucin.

Por qu utilizamos z en lugar del nmero de desviaciones estndar? Las variables aleatorias distribuidas normalmente tienen unidades diferentes de medicin: dlares, pulgadas, partes de milln, kilogramos, segundos, etc. Como vamos a utilizar una tabla, hablamos en trminos de unidades estndar (que en realidad significa desviaciones estndar), y denotamos a stas con el smbolo z.

La tabla de distribucin de probabilidad normal estndar da los valores de nicamente la mitad del rea bajo la curva normal, empezando con 0,0 en la media. Como la distribucin normal de probabilidad es simtrica, los valores verdaderos para una mitad de la curva son verdaderos para la otra.

Defectos de la distribucin normal de probabilidad.

Los extremos de la distribucin normal se acercan al eje horizontal, pero nunca llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequea) de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos mucha precisin al ignorar valores tan alejados de la media. Pero a cambio de la conveniencia del uso de este modelo terico, debemos aceptar el hecho de que puede asignar valores empricos imposibles.

La distribucin normal como una aproximacin de la distribucin binomial.

Aunque la distribucin normal es continua, resulta interesante hacer notar que algunas veces puede utilizarse para aproximar a distribuciones discretas.

La aproximacin normal a la distribucin binomial resulta muy conveniente, pues nos permite resolver el problema sin tener que consultar grandes tablas de la distribucin binomial. Pero se necesita tener algo de cuidado al utilizar esta aproximacin, que es bastante buena, siempre que np y nq sean al menos de cinco.

SUGERENCIA:

La distribucin normal es otra funcin algebraica con propiedades matemticas bien conocidas, y es una buena aproximacin para muchos problemas binomiales que impliquen nmeros grandes. Pero, no olvide la regla de que tanto np y nq deben ser de al menos , y sea cauteloso acerca de la aplicacin de la aproximacin normal a situaciones en las que la probabilidad de un evento es muy pequea. Los valores de la aproximacin normal provenientes de los extremos de la distribucin no son muy exactos.

Este modelo se aplica generalmente en el caso de variables que presentan las siguientes caractersticas:

Son variables dimensionales, que surgen como resultado de la medicin sobre alguna escala continua: kgs., cms., $, T, etc. Son variables que pueden pensarse como el resultado de la suma de muchos pequeos efectos.

Estos elementos son slo orientativos, y proporcionan un primer indicio para iniciar la bsqueda del modelo ms apropiado.

Distribucin exponencial.

Procesos donde se estudian fenmenos como tiempo entre o distancia entre dos eventos cualquiera, se pueden modelas mediante la distribucin exponencial, que tiene la siguiente funcin de densidad:

donde es el parmetro del modelo. Sus principales propiedades son:

E (X) = Var (X) = 2

El parmetro representa el valor esperado de la variable.

La funcin de distribucin es la siguiente:

F(X) = 1 - e-x/

Teorema del lmite central.

Este teorema explica la vinculacin que existe entre diversas distribuciones de probabilidad y la normal. Especifica las condiciones bajo las cuales puede esperarse que una variable aleatoria tenga distribucin normal.

Si sumamos variables aleatorias del mismo tipo, si el nmero de trminos de la suma es suficientemente grande, el resultado que se obtiene es una variable con distribucin normal.

En la prctica, si todas las variables que sumamos tienen la misma distribucin, no es necesario que n sea demasiado grande para que se verifique la normalidad de la suma.

Una aplicacin inmediata de este teorema es la interpretacin de la media aritmtica: para calcular un promedio, sumamos variables que provienen de la misma poblacin, y por lo tanto tienen igual distribucin. La media obtenida seguramente va a tener distribucin normal, an para valores bajos de n.

Otro aspecto importante es la siguiente extensin del teorema: no es estrictamente necesario que todas las variables tengan la misma distribucin. Basta con que sean independientes, y tengan esperanza y varianza finitas, para que si n es lo suficientemente grande, el resultado de la suma tenga aproximadamente distribucin normal:

Y - N ( , 2)

Se asume que cada trmino de la suma aporta un efecto del mismo orden de magnitud, y que es poco probable que un valor individual haga una gran contribucin a la suma.

Este teorema explica por qu algunos modelos tienden a la normal, bajo ciertas condiciones:

Modelo binomial: es la suma de n variables - tipo Bernoulli -, y si n tiende a infinito, las probabilidades se pueden aproximar mediante la normal.

Modelo de Poisson: es una extensin de la binomial, y por tanto, se verifica que para = np suficientemente grande, se pueden aproximar sus probabilidades con la normal.

RECOMENDACIONES PRCTICAS:

En el caso de distribuciones continuas, no tiene sentido calcular la probabilidad asociada a un valor particular de la variable. Siempre se trabaja con la probabilidad asociada a intervalos de valores de la variable. Como la probabilidad de un valor particular no existe, en la prctica, son vlidas cualquiera de las siguiente expresiones:

P (a<X<b); P (a<X<b); P (a<X<b); P (a<X<b) Usar la aproximacin normal a la binomial (inclusive a Poisson) en aquellos casos en que las condiciones del problema lo permitan. En estos casos, hay que realizar la correccin por continuidad, para obtener resultados ms aproximados. Como dato orientativo, la aproximacin normal a la binomial anda bien cuando tanto np como n(1 - p) son mayores que 5. Si p es cercano a 0,5, la aproximacin anda bien para cualquier valor de n; en caso contrario, n debe ser suficientemente grande, no menor a 50.

Identificacin del modelo apropiado.

La seleccin depende, entre otros, de los siguientes factores:

Un adecuado anlisis del problema considerado: qu tipo de variable se estudia, qu fenmeno se desea modelar, etc. Los resultados de la descripcin de los datos disponibles: forma de la distribucin, propiedades de la variable. La disponibilidad y manejo de un buen nmero de modelos de probabilidad que permitan describir diferentes tipos de situaciones.

Una vez identificado el modelo apropiado, hay que calcular sus parmetros, en base a las observaciones que se dispongan de la variable en estudio.

Si planeamos utilizar una probabilidad para describir una situacin, debemos escoger con cuidado la correcta. La distribucin binomial se aplica cuando el nmero de ensayos est fijo antes de que empiece el experimento, y cada ensayo es independiente y puede tener slo dos resultados mutuamente excluyentes. Al igual que la distribucin binomial, se aplica cuando cada ensayo es independiente de los dems. Pero, aunque la probabilidad de Poisson se aproxima a cero despus de los primeros valores, el nmero de valores posibles es infinito. No se conoce el lmite de dos resultados mutuamente excluyentes. En ciertas condiciones, la distribucin de Poisson se puede utilizar como aproximacin de la binomial, pero no siempre es posible hacerlo. Todas las suposiciones que conforman la base de una distribucin deben cumplirse, si la intencin del uso de dicha distribucin es producir resultados significativos.

Conceptos.

Aproximaciones a la normal: empleo de la distribucin normal para aproximar el clculo de probabilidades de otros modelos, que por aplicacin del Teorema del Lmite Central, bajo determinadas condiciones, tienden a la normal.

Distribucin binomial: modelo para variable aleatoria discreta que permite calcular la probabilidad de obtener x xitos en n ensayos repetidos de tipo Bernoulli. Distribucin discreta que describe los resultados de un experimento conocido como proceso de Bernoulli.

Distribucin continua de probabilidad: distribucin de probabilidad en la que la variable tiene permitido tomar cualquier valor dentro de un intervalo dado.

Distribucin discreta de probabilidad: distribucin de probabilidad en la que la variable tiene permitido tomar solamente un nmero limitado de valores.

Distribucin normal: modelo para variable aleatoria continua que permite representar un gran nmero de fenmenos fsicos. Distribucin de una variable aleatoria continua que tiene una curva de un solo pico y con forma de campana. La media cae en el centro de la distribucin y la curva es simtrica respecto a una lnea vertical que pase por la media. Los dos extremos se extienden indefinidamente, sin tocar nunca el eje horizontal.

Distribucin exponencial: modelo para variable aleatoria continua que permite representar variables del tipo "tiempo entre" o "distancia entre" dos eventos y vida til de ciertos componentes.

Distribucin de Poisson: modelo para variable aleatoria discreta que permite calcular la probabilidad de obtener x xitos en un intervalo continuo. Distribucin discreta en la que la probabilidad de presentacin de un evento en un intervalo muy pequeo es un nmero tambin muy pequeo, la probabilidad de que dos o ms eventos se presenten dentro del mismo intervalo es efectivamente igual a cero, y la probabilidad de presentacin del evento dentro del perodo dado es independiente de cundo se presenta dicho perodo.

Distribucin de probabilidad: lista de los resultados de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

Distribucin de probabilidad normal estndar: distribucin normal de probabilidad con una media = 0 y una desviacin estndar = 1.

Factor de correccin de continuidad: correcciones utilizadas para mejorar la precisin de la aproximacin de una distribucin binomial mediante una distribucin normal.

Modelo o distribucin de probabilidades: funcin que distribuye probabilidades entre los valores de una variable aleatoria.

Parmetros: cantidades que aparecen en la formulacin de un modelo, relacionadas con las propiedades de la variable aleatoria en estudio.

Proceso de Bernoulli: experimento aleatorio que tiene slo dos resultados posibles (xito o fracaso), cuyas probabilidades permanecen constantes cualquiera sea el nmero de intentos.

Proceso de Poisson: Proceso de Bernoulli desarrollado en un intervalo continuo de tiempo o espacio.

Teorema del Lmite Central: teorema que especifica las condiciones bajo las cuales puede esperarse que una variable aleatoria tenga distribucin normal.

Valor esperado: promedio pesado de los resultados de un experimento.

Valor esperado de una variable aleatoria: la suma de los productos de cada valor de la variable aleatoria por la correspondiente probabilidad de presentacin de dicho valor.

Variable aleatoria: variable que toma diferentes valores como resultado de un experimento aleatorio.

Variable aleatoria continua: variable aleatoria que puede tomar infinitos valores dentro de un rango cualquiera.

Variable aleatoria discreta: variable que toma un nmero finito o infinito de valores numerables.

VARIABLE ALEATORIA

Introduccin a las distribuciones de probabilidad.

Las distribuciones de probabilidad estn relacionadas con las distribuciones de frecuencias. Una distribucin de frecuencias terica es una distribucin de probabilidades que describe la forma en que se espera que varen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos tiles para hacer inferencias y para tomar decisiones en condiciones de incertidumbre.

Una distribucin de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que se presentaron realmente cuando se efectu el experimento, mientras que una distribucin de probabilidad es un listado de las probabilidades de todos los posibles resultados que podran obtenerse si el experimento se lleva a cabo.

Las distribuciones de probabilidad pueden basarse en consideraciones tericas o en una estimacin subjetiva de la posibilidad. Se pueden basar tambin en la experiencia.

Tipos de distribuciones de probabilidad.

Las distribuciones de probabilidad se clasifican como continuas y discretas. En la distribucin de probabilidad discreta est permitido tomar slo un nmero limitado de valores.

En una distribucin de probabilidad continua, la variable que se est considerando puede tomar cualquier valor dentro de un intervalo dado.

Las distribuciones continuas son una forma conveniente de presentar distribuciones discretas que tienen muchos resultados posibles, todos muy cercanos entre s.

Variables aleatorias.

Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Puede ser discreta o continua. Si puede tomar slo un nmero limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua.

Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentacin a otra, sin seguir una secuencia predecible. Los valores de una variable aleatoria son los valores numricos correspondientes a cada posible resultado de un experimento aleatorio.

La distribucin de probabilidad de una variable aleatoria proporciona una probabilidad para cada valor posible, y estas probabilidades deben sumar 1.

Valor esperado de una variable aleatoria.

El valor esperado es una idea fundamental en el estudio de las distribuciones de probabilidad.

Para obtener el valor esperado de una variable aleatoria discreta, se multiplica cada valor que la variable puede tomar por la probabilidad de presentacin de ese valor y luego se suman esos productos. Es un promedio pesado de los resultados que se esperan en el futuro. El valor esperado pesa cada resultado posible con respecto a la frecuencia con que se espera se que presente. En consecuencia, las presentaciones ms comunes tienen asignadas un peso mayor que las menos comunes.

El valor esperado tambin puede ser obtenido a partir de estimaciones subjetivas. En ese caso, el valor esperado no es ms que la representacin de las convicciones personales acerca del resultado posible.

En muchas situaciones, encontraremos que es ms conveniente, en trminos de los clculos que se deben hacer, representar la distribucin de probabilidad de una variable aleatoria de una manera algebraica. Al hacer esto, podemos llevar a cabo clculos de probabilidad mediante la sustitucin de valores numricos directamente en una frmula algebraica.

SUGERENCIA:

El valor esperado de una variable aleatoria discreta es un promedio pesado del valor de cada resultado posible multiplicado por la probabilidad de dicho resultado. Aunque existen muchos valores diferentes posibles que la variable aleatoria puede tomar, el valor esperado es slo un nmero.

TRATAMIENTO DE VARIABLES ALEATORIAS.

Variables aleatorias discretas.

Sean x1, x2, x3, ... xn los distintos valores que puede tomar la variable aleatoria.

Y p(x1), p(x2),... p(xn) su probabilidad.

Los pares de valores (xj, p(xj)) constituyen la distribucin de probabilidades de la variable aleatoria.

p(x) se denomina funcin de probabilidad, y debe cumplir con las siguientes propiedades:

0 < p(xj) < 1 (p(x) es una probabilidad, y por lo tanto debe tomar valores entre 0 y 1). p(xj) = 1 (la suma de probabilidades repartidas entre todos los valores de la variable debe ser igual a 1).

De la misma manera que calculamos frecuencias acumuladas, podemos acumular probabilidades, obteniendo la funcin de distribucin de probabilidades:

F(x) = p(xj)

Esta funcin representa la probabilidad de que la variable aleatoria sea menor o igual que un determinado valor:

F(xj) = P (X < xj)

Grficamente, la funcin aumenta de "a saltos", ya que entre dos valores consecutivos de una variable discreta, no puede tomar valores intermedios.

Variables aleatorias continuas.

En este caso, en lugar de trabajar con la probabilidad de valores particulares de la variable, resulta ms apropiado calcular probabilidades asociadas a intervalos. Para distribuir propiedades se usa una funcin que mide "concentracin" de probabilidades alrededor de un punto, que se denomina funcin de densidad de probabilidad (fdp) y se denota como f(x).

Una funcin de densidad de probabilidad debe cumplir con las siguientes propiedades:

F(x) > 0 (la funcin es no negativa para cualquier valor de x, f(x) no es una probabilidad, y puede valer ms de 1). f(x) dx = 1 (la acumulada para todos los valores de la variable suma 1, el rea bajo la curva de la funcin vale 1).

La funcin de distribucin para una variable aleatoria continua se calcula:

F(a) = P(X < a) = f(x) dx

La probabilidad de que la variable est dentro de un intervalo [a - b] se calcula:

P (a< x < b) = F(b) - F(a)

La probabilidad de que la variable tome un valor particular se puede expresar como:

F(c) - F(c) = 0

Esto explica la idea de que para el caso de una variable aleatoria continua no tiene sentido trabajar con la probabilidad de un valor particular.

Medidas caractersticas de una distribucin de probabilidades.

El valor esperado es un operador matemtico, cuya frmula de clculo depende del tipo de variable aleatoria:

Variable aleatoria discreta: E (X) = xj p (xj) Variable aleatoria continua: x f(x) dx Para caracterizar correctamente a la distribucin, adems de determinar su posicin es necesario calcular alguna medida que cuantifique su variabilidad. Una cantidad muy til para evaluar la dispersin de la variable aleatoria es el operador varianza, que se calcula:

Variable aleatoria discreta: Var (X) = (xj - E(X))2 p (xj) Variable aleatoria continua: Var (X) = x - E(X))2 f(x) dx

Conceptos:

Variable aleatoria: variable que cuantifica los resultados de un experimento aleatorio. Variable que toma diferentes valores como resultado de un experimento aleatorio.

Distribucin de probabilidades: modelo terico que describe la forma en que varan los resultados de un experimento aleatorio. Lista de los resultados de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

Variable aleatoria discreta: variable que toma un nmero finito o infinito de valores numerables. Variable aleatoria que puede tomar slo un nmero limitado de valores.

Variable aleatoria continua: variable que toma un valor infinito de valores no numerables. Variable aleatoria que puede tomar cualquier valor dentro de un intervalo dado de valores.

Funcin de probabilidad: funcin que asigna probabilidades a cada uno de los valores de una variable aleatoria discreta.

Funcin de densidad de probabilidad: funcin que mide concentracin de probabilidad alrededor de los valores de una variable aleatoria continua.

Funcin de distribucin: funcin que acumula probabilidades asociadas a una variable aleatoria.

Valor esperado: operador matemtico que caracteriza la posicin de la distribucin de probabilidades. Promedio pesado de los resultados de un experimento.

Varianza: operador que caracteriza la dispersin de la distribucin

DISTRIBUCIONES DE PROBABILIDAD

Introduccin.

Un modelo es una simplificacin de la realidad. Un modelo probabilstico es un modelo matemtico que describe el comportamiento de una variable aleatoria. Es una funcin que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una poblacin en particular y que se denominan parmetros del modelo.

En el proceso de modelacin, es necesario seguir los siguientes pasos:

1. 2. 3. 4.

Seleccionar el modelo ms apropiado. Ajustar el modelo (calcular el valor de sus parmetros). Verificar el modelo. Decidir su aceptacin o volver al paso 1.

Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de probabilidad, desarrollados para representar distintos tipos de variables y diferentes fenmenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo ms apropiado para el caso en estudio.

Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la poblacin en estudio y calcular las cantidades necesarias como para evaluar los parmetros del modelo.

La distribucin binomial.

Esta distribucin describe una variedad de procesos de inters para los administradores y describe datos discretos, no continuos, que son resultado de un experimento conocido como proceso de Bernoulli.

Uso del proceso de Bernoulli.

Podemos describir el proceso de la manera siguiente:

1. Cada intento tiene slo dos resultados posibles. 2. La probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo. 3. Los intentos son estadsticamente independientes.

Frmula binomial:

Probabilidad de r xitos en n ensayos = n! / [r! (n - r)!] pr qn - r

p = probabilidad caracterstica o probabilidad de tener xito q = 1 - p = probabilidad de fracaso r = nmero de xitos deseados n = nmero de intentos hechos

Generalizaciones:

Cuando p es pequea (0,1), la distribucin binomial est sesgada hacia la derecha. Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable. Cuando p = 0,5, la distribucin binomial es simtrica. Cuando p es mayor que 0,5, la distribucin est sesgada hacia la izquierda. Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7, excepto que los valores de p y q estn invertidos. Esto es cierto para cualquier pareja de valores p y q complementarios.

Medidas de tendencia central y de dispersin para la distribucin binomial.

La distribucin binomial tiene un valor esperado o media y una desviacin estndar.

Valor esperado o media: = np

Desviacin estndar: = npq

Cumplimiento de las condiciones del proceso de Bernoulli.

Necesitamos ser cuidadosos en el uso de la distribucin binomial de la probabilidad y asegurar que se cumplen las tres condiciones necesarias, en particular las condiciones 2 y 3. La condicin 2 requiere que la probabilidad del resultado de cualquier intento permanezca fija en el tiempo. La condicin 3 requiere que los ensayos o intentos de un proceso de Bernoulli sean estadsticamente independientes, es decir, que el resultado de un intento no puede afectar de ningn modo el resultado de cualquier otro intento.

La distribucin de Poisson.

La distribucin de Poisson se utiliza para describir cierto tipo de procesos, entre los que se encuentran la distribucin de llamadas telefnicas que llegan a un conmutador, la demanda (necesidades) de los pacientes que requieren servicio en una institucin de salud, las llegadas de camiones a una caseta de cobro y el nmero de accidentes registrados en una cierta interseccin de calles. Estos ejemplos tienen en comn un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma valores enteros (0, 1, 2...).

Caractersticas de los procesos que producen una distribucin de probabilidad de Poisson.

1. El promedio (la media) del nmero de eventos que se producen por hora, puede estimarse a partir de datos que se tengan disponibles. 2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno, encontraremos que las siguientes afirmaciones son verdaderas:

La probabilidad de que exactamente un evento ocurra por segundo es muy pequea y es constante para cada intervalo de un segundo. La probabilidad de que dos o ms eventos ocurran en un intervalo de un segundo es tan pequea que le podemos asignar un valor cero. El nmero de eventos que ocurren en un intervalo de un segundo es independiente del tiempo en que dicho intervalo se presente en la hora pico. El nmero de eventos en un intervalo de un segundo no depende del nmero de ocurrencias en cualquier otro intervalo de un segundo.

Clculo de la probabilidad de Poisson.

La letra X por lo general representa a una variable discreta y puede tomar valores enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x para sealar un valor especfico que esta variable pueda tomar. La probabilidad de tener exactamente x presentaciones en una distribucin de Poisson se calcula con la frmula:

La distribucin de Poisson como una aproximacin a la distribucin binomial.

La distribucin de Poisson puede ser un razonable aproximacin a la binomial, pero slo bajo ciertas condiciones. Tales condiciones se presentan cuando n es grande y p es pequea, esto es, cuando el nmero de ensayos es grande y la probabilidad binomial de tener xito es pequea. La regla que utilizan con ms frecuencia los estadsticos es que la distribucin de Poisson es una buena aproximacin de la distribucin binomial cuando n es igual o mayor que 20 y p es igual o menor que 0,05. En los casos en que se cumplen estas condiciones, podemos sustituir la media de la distribucin binomial (np) en lugar de la media de la distribucin de Poisson ( ).

SUGERENCIA:

El uso de una distribucin para aproximar a otra es una prctica bastante comn en probabilidad y estadstica. La idea consiste en buscar situaciones en las que una distribucin (como la de Poisson), cuyas probabilidades son relativamente fciles de calcular, tiene valores que se encuentran razonablemente cercanos a las de otra distribucin (como la binomial) cuyas probabilidades implican clculos ms complicados.

RECOMENDACIONES PRCTICAS:

Frente a un problema concreto, analice detenidamente todas sus caractersticas, y al elegir el modelo apropiado, verifique que se cumplan todos los supuestos del mismo.

Habituse a utilizar las tablas provistas por la bibliografa para calcular probabilidades. Ahorrar tiempo y evitar errores de clculo.

No olvide emplear la distribucin de Poisson a la binomial en aquellos casos en que p es pequeo y n es grande.

Para calcular probabilidades acumuladas, del tipo P(X > x), P(X < x) o P(x < X < x), tambin existen valores tabulados en textos especializados.

En el caso de variables aleatorias discretas, es importante diferenciar si la probabilidad deseada incluye o no el valor particular de la variable. Es decir, que P(X > x) no es lo mismo que P(X > x) y P (X < x) es distinto de P(X < x).

La distribucin normal: distribucin de una variable aleatoria continua.

La variable puede tomar cualquier valor que est en un intervalo de valores dado, y la distribucin de probabilidad es continua.

Las razones bsicas de la importancia de la distribucin normal son:

1. Tiene algunas propiedades que la hacen aplicable a un gran nmero de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. La distribucin normal es una til distribucin de muestreo. 2. La distribucin normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenmenos, incluyendo caractersticas humanas (pesos, alturas), resultados de procesos fsicos (dimensiones y rendimientos) y muchas otras medidas de inters para los administradores.

Caractersticas de la distribucin normal de probabilidad.

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de campana.

2. La media de una poblacin distribuida normalmente cae en el centro de su curva normal. 3. Debido a la simetra de la distribucin normal de probabilidad, la mediana y la moda se encuentran tambin en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor. 4. Los dos extremos de la distribucin normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal.

La mayor parte de las poblaciones reales no se extienden de manera indefinida en ambas direcciones; pero en estas poblaciones, la distribucin normal es una aproximacin conveniente. No hay una sola distribucin normal, sino una familia de curvas normales. Para definir una distribucin normal de probabilidad necesitamos definir slo dos parmetros: la media y la desviacin estndar.

La curva normal puede describir un gran nmero de poblaciones, diferenciadas solamente por la media, la desviacin estndar o por ambas.

reas bajo la curva normal.

No importa cules sean los valores de y para una distribucin de probabilidad normal, el rea bajo la curva es 1,00, de manera que podemos pensar en reas bajo la curva como si fueran probabilidades. Matemticamente:

1. Aproximadamente el 68% de todos los valores de una poblacin normalmente distribuida se encuentran dentro + 1 desviacin estndar de la media. 2. Aproximadamente 95,5% de todos los valores de una poblacin normalmente distribuida se encuentran dentro de + 2 desviaciones estndar de la media. 3. Aproximadamente 99,7% de todos los valores de una poblacin normalmente distribuida se encuentran dentro de + 3 desviaciones estndar de la media.

Las tablas estadsticas indican porciones del rea bajo la curva normal que estn contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a partir de la media.

No es posible ni necesario tener una tabla distinta para cada curva normal posible. En lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar para encontrar reas bajo cualquier curva normal. Con esta tabla podemos determinar el rea o la probabilidad de que la variable aleatoria distribuida normalmente est dentro de ciertas distancias a partir de la media. Estas distancias estn definidas en trminos de desviaciones estndar.

Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el mismo nmero de desviaciones estndar a partir de la media contendrn la misma fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.

Uso de la tabla de distribucin de probabilidad normal estndar.

En esta tabla, el valor z est derivado de la frmula:

z = (x - ) /

en la que:

x = valor de la variable aleatoria que nos preocupa = media de la distribucin de la variable aleatoria = desviacin estndar de la distribucin z = nmero de desviaciones estndar que hay desde x a la media de la distribucin.

Por qu utilizamos z en lugar del nmero de desviaciones estndar? Las variables aleatorias distribuidas normalmente tienen unidades diferentes de medicin: dlares, pulgadas, partes de milln, kilogramos, segundos, etc. Como vamos a utilizar una tabla, hablamos en trminos de unidades estndar (que en realidad significa desviaciones estndar), y denotamos a stas con el smbolo z.

La tabla de distribucin de probabilidad normal estndar da los valores de nicamente la mitad del rea bajo la curva normal, empezando con 0,0 en la media. Como la distribucin normal de probabilidad es simtrica, los valores verdaderos para una mitad de la curva son verdaderos para la otra.

Defectos de la distribucin normal de probabilidad.

Los extremos de la distribucin normal se acercan al eje horizontal, pero nunca llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequea) de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos mucha precisin al ignorar valores tan alejados de la media. Pero a cambio de la conveniencia del uso de este modelo terico, debemos aceptar el hecho de que puede asignar valores empricos imposibles.

La distribucin normal como una aproximacin de la distribucin binomial.

Aunque la distribucin normal es continua, resulta interesante hacer notar que algunas veces puede utilizarse para aproximar a distribuciones discretas.

La aproximacin normal a la distribucin binomial resulta muy conveniente, pues nos permite resolver el problema sin tener que consultar grandes tablas de la distribucin binomial. Pero se necesita tener algo de cuidado al utilizar esta aproximacin, que es bastante buena, siempre que np y nq sean al menos de cinco.

SUGERENCIA:

La distribucin normal es otra funcin algebraica con propiedades matemticas bien conocidas, y es una buena aproximacin para muchos problemas binomiales que impliquen nmeros grandes. Pero, no olvide la regla de que tanto np y nq deben ser de al menos , y sea cauteloso acerca de la aplicacin de la aproximacin normal a situaciones en las que la probabilidad de un evento es muy pequea. Los valores de la aproximacin normal provenientes de los extremos de la distribucin no son muy exactos.

Este modelo se aplica generalmente en el caso de variables que presentan las siguientes caractersticas:

Son variables dimensionales, que surgen como resultado de la medicin sobre alguna escala continua: kgs., cms., $, T, etc. Son variables que pueden pensarse como el resultado de la suma de muchos pequeos efectos.

Estos elementos son slo orientativos, y proporcionan un primer indicio para iniciar la bsqueda del modelo ms apropiado.

Distribucin exponencial.

Procesos donde se estudian fenmenos como tiempo entre o distancia entre dos eventos cualquiera, se pueden modelas mediante la distribucin exponencial, que tiene la siguiente funcin de densidad:

donde es el parmetro del modelo. Sus principales propiedades son:

E (X) = Var (X) = 2

El parmetro representa el valor esperado de la variable.

La funcin de distribucin es la siguiente:

F(X) = 1 - e-x/

Teorema del lmite central.

Este teorema explica la vinculacin que existe entre diversas distribuciones de probabilidad y la normal. Especifica las condiciones bajo las cuales puede esperarse que una variable aleatoria tenga distribucin normal.

Si sumamos variables aleatorias del mismo tipo, si el nmero de trminos de la suma es suficientemente grande, el resultado que se obtiene es una variable con distribucin normal.

En la prctica, si todas las variables que sumamos tienen la misma distribucin, no es necesario que n sea demasiado grande para que se verifique la normalidad de la suma.

Una aplicacin inmediata de este teorema es la interpretacin de la media aritmtica: para calcular un promedio, sumamos variables que provienen de la misma poblacin, y por lo tanto tienen igual distribucin. La media obtenida seguramente va a tener distribucin normal, an para valores bajos de n.

Otro aspecto importante es la siguiente extensin del teorema: no es estrictamente necesario que todas las variables tengan la misma distribucin. Basta con que sean independientes, y tengan esperanza y varianza finitas, para que si n es lo suficientemente grande, el resultado de la suma tenga aproximadamente distribucin normal:

Y - N ( , 2)

Se asume que cada trmino de la suma aporta un efecto del mismo orden de magnitud, y que es poco probable que un valor individual haga una gran contribucin a la suma.

Este teorema explica por qu algunos modelos tienden a la normal, bajo ciertas condiciones:

Modelo binomial: es la suma de n variables - tipo Bernoulli -, y si n tiende a infinito, las probabilidades se pueden aproximar mediante la normal.

Modelo de Poisson: es una extensin de la binomial, y por tanto, se verifica que para = np suficientemente grande, se pueden aproximar sus probabilidades con la normal.

RECOMENDACIONES PRCTICAS:

En el caso de distribuciones continuas, no tiene sentido calcular la probabilidad asociada a un valor particular de la variable. Siempre se trabaja con la probabilidad asociada a intervalos de valores de la variable. Como la probabilidad de un valor particular no existe, en la prctica, son vlidas cualquiera de las siguiente expresiones:

P (a<X<b); P (a<X<b); P (a<X<b); P (a<X<b) Usar la aproximacin normal a la binomial (inclusive a Poisson) en aquellos casos en que las condiciones del problema lo permitan. En estos casos, hay que realizar la correccin por continuidad, para obtener resultados ms aproximados. Como dato orientativo, la aproximacin normal a la binomial anda bien cuando tanto np como n(1 - p) son mayores que 5. Si p es cercano a 0,5, la aproximacin anda bien para cualquier valor de n; en caso contrario, n debe ser suficientemente grande, no menor a 50.

Identificacin del modelo apropiado.

La seleccin depende, entre otros, de los siguientes factores:

Un adecuado anlisis del problema considerado: qu tipo de variable se estudia, qu fenmeno se desea modelar, etc. Los resultados de la descripcin de los datos disponibles: forma de la distribucin, propiedades de la variable. La disponibilidad y manejo de un buen nmero de modelos de probabilidad que permitan describir diferentes tipos de situaciones.

Una vez identificado el modelo apropiado, hay que calcular sus parmetros, en base a las observaciones que se dispongan de la variable en estudio.

Si planeamos utilizar una probabilidad para describir una situacin, debemos escoger con cuidado la correcta. La distribucin binomial se aplica cuando el nmero de ensayos est fijo antes de que empiece el experimento, y cada ensayo es independiente y puede tener slo dos resultados mutuamente excluyentes. Al igual que la distribucin binomial, se aplica cuando cada ensayo es independiente de los dems. Pero, aunque la probabilidad de Poisson se aproxima a cero despus de los primeros valores, el nmero de valores posibles es infinito. No se conoce el lmite de dos resultados mutuamente excluyentes. En ciertas condiciones, la distribucin de Poisson se puede utilizar como aproximacin de la binomial, pero no siempre es posible hacerlo. Todas las suposiciones que conforman la base de una distribucin deben cumplirse, si la intencin del uso de dicha distribucin es producir resultados significativos.

Conceptos.

Aproximaciones a la normal: empleo de la distribucin normal para aproximar el clculo de probabilidades de otros modelos, que por aplicacin del Teorema del Lmite Central, bajo determinadas condiciones, tienden a la normal.

Distribucin binomial: modelo para variable aleatoria discreta que permite calcular la probabilidad de obtener x xitos en n ensayos repetidos de tipo Bernoulli. Distribucin discreta que describe los resultados de un experimento conocido como proceso de Bernoulli.

Distribucin continua de probabilidad: distribucin de probabilidad en la que la variable tiene permitido tomar cualquier valor dentro de un intervalo dado.

Distribucin discreta de probabilidad: distribucin de probabilidad en la que la variable tiene permitido tomar solamente un nmero limitado de valores.

Distribucin normal: modelo para variable aleatoria continua que permite representar un gran nmero de fenmenos fsicos. Distribucin de una variable aleatoria continua que tiene una curva de un solo pico y con forma de campana. La media cae en el centro de la distribucin y la curva es simtrica respecto a una lnea vertical que pase por la media. Los dos extremos se extienden indefinidamente, sin tocar nunca el eje horizontal.

Distribucin exponencial: modelo para variable aleatoria continua que permite representar variables del tipo "tiempo entre" o "distancia entre" dos eventos y vida til de ciertos componentes.

Distribucin de Poisson: modelo para variable aleatoria discreta que permite calcular la probabilidad de obtener x xitos en un intervalo continuo. Distribucin discreta en la que la probabilidad de presentacin de un evento en un intervalo muy pequeo es un nmero tambin muy pequeo, la probabilidad de que dos o ms eventos se presenten dentro del mismo intervalo es efectivamente igual a cero, y la probabilidad de presentacin del evento dentro del perodo dado es independiente de cundo se presenta dicho perodo.

Distribucin de probabilidad: lista de los resultados de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

Distribucin de probabilidad normal estndar: distribucin normal de probabilidad con una media = 0 y una desviacin estndar = 1.

Factor de correccin de continuidad: correcciones utilizadas para mejorar la precisin de la aproximacin de una distribucin binomial mediante una distribucin normal.

Modelo o distribucin de probabilidades: funcin que distribuye probabilidades entre los valores de una variable aleatoria.

Parmetros: cantidades que aparecen en la formulacin de un modelo, relacionadas con las propiedades de la variable aleatoria en estudio.

Proceso de Bernoulli: experimento aleatorio que tiene slo dos resultados posibles (xito o fracaso), cuyas probabilidades permanecen constantes cualquiera sea el nmero de intentos.

Proceso de Poisson: Proceso de Bernoulli desarrollado en un intervalo continuo de tiempo o espacio.

Teorema del Lmite Central: teorema que especifica las condiciones bajo las cuales puede esperarse que una variable aleatoria tenga distribucin normal.

Valor esperado: promedio pesado de los resultados de un experimento.

Valor esperado de una variable aleatoria: la suma de los productos de cada valor de la variable aleatoria por la correspondiente probabilidad de presentacin de dicho valor.

Variable aleatoria: variable que toma diferentes valores como resultado de un experimento aleatorio.

Variable aleatoria continua: variable aleatoria que puede tomar infinitos valores dentro de un rango cualquiera.

Variable aleatoria discreta: variable que toma un nmero finito o infinito de valores numerables.

INFERENCIA ESTADSTICA

Introduccin al muestreo.

Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos enumeracin completa o censo. Utilizamos el muestreo cuando no es posible contar o medir todos los elementos de la poblacin.

Los estadsticos usan la palabra poblacin para referirse no slo a personas sino a todos los elementos que han sido elegidos para un estudio, y emplean la palabra muestra para describir una porcin elegida de la poblacin.

Condiciones que debe reunir una muestra:

Homogeneidad: debe ser extrada de la misma poblacin. Independencia: las observaciones no deben estar mutuamente condicionadas entre s. Representatividad: la muestra debe ser el mejor reflejo posible del conjunto del cual proviene.

Estadsticas y parmetros.

Matemticamente, podemos describir muestras y poblaciones al emplear mediciones como la media, la mediana, la oda y la desviacin estndar. Cuando estos trminos describen las caractersticas de una poblacin, se llaman parmetros. Cuando describen las caractersticas de la muestra, se llaman estadsticos. Una estadstica es una caracterstica de una muestra y un parmetro es una caracterstica de la poblacin.

Se emplean letras latinas minsculas para denotar estadsticas de muestra y letras griegas o latinas maysculas para representar parmetros de poblacin.

Poblacin Definicin

Muestra

Coleccin de elementos considerados Parte o porcin de la poblacin seleccionada para su estudio Estadsticas Tamao de la muestra: n Media de la muestra: x Desviacin estndar: s

Caractersticas Parmetros Tamao de la poblacin: N Smbolos Media de la poblacin: Desviacin estndar:

Parmetros y estimadores.

Una poblacin queda caracterizada a travs de ciertos valores denominados parmetros, que describen las principales propiedades del conjunto.

Un parmetro es un valor fijo (no aleatorio) que caracteriza a una poblacin en particular. En general, una parmetro es una cantidad desconocida y rara vez se puede determinar exactamente su valor, por la dificultad prctica de observar todas las unidades de una poblacin. Por este motivo, tratamos de estimar el valor de los parmetros desconocidos a travs del empleo de muestras. Las cantidades usadas para describir una muestra se denominan estimadores o estadsticos muestrales.

Ahora bien, es razonable pensar que si tomamos diferentes muestras de la misma poblacin y calculamos los diferentes estadsticos de cada una, esos valores van a diferir de muestra a muestra. Por lo tanto, un estadstico no es un valor fijo, sino que presenta las siguientes caractersticas:

Puede tener varios resultados posibles. No se puede predecir de antemano su valor.

Estas son las condiciones que definen a una variable aleatoria. Un estadstico, entonces, es una variable aleatoria, funcin de las observaciones muestrales.

A los estadsticos muestrales se los designa con las letras latinas (x, s 2), o letras griegas "con sombrero" ( ^, ^2).

Si un estadstico es una variable aleatoria, entonces es posible determinar su distribucin de probabilidades y calcular sus principales propiedades.

Muestreo aleatorio.

Muestreo aleatorio simple.

Selecciona muestras mediante mtodos que permiten que cada posible muestra tenga igual probabilidad de ser seleccionada y que cada elemento de la poblacin total tenga una oportunidad igual de ser incluido en la muestra.

Una poblacin infinita es aquella en la que es tericamente imposible observar todos los elementos. Aunque muchas poblaciones parecen ser excesivamente grandes, no existe una poblacin realmente infinita de objetos fsicos. Con recursos y tiempo ilimitados, podramos enumerar cualquier poblacin finita. Como cuestin prctica, entonces, utilizamos el trmino poblacin infinita cuando hablamos acerca de una poblacin que no podra enumerarse en un intervalo razonable.

Cmo hacer un muestreo aleatorio.

La forma ms fcil de seleccionar una muestra de manera aleatoria es mediante el uso de nmeros aleatorios. Estos nmeros pueden generarse ya sea con una computadora programada para resolver nmeros o mediante una tabla de nmeros aleatorios (tabla de dgitos aleatorios).

Muestreo sistemtico.

En el muestreo sistemtico, los elementos son seleccionados de la poblacin dentro de un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio.

El muestreo sistemtico difiere del aleatorio simple en que cada elemento tiene igual probabilidad de ser seleccionado, pero cada muestra no tiene una posibilidad igual de ser seleccionada (Por ejemplo: tomar cada elemento de 10 en 10: el N 1, 11, 21...)

En este tipo de muestreo, existe el problema de introducir un error en el proceso de muestreo.

An cuando este tipo de muestreo puede ser inapropiado cuando los elementos entran en un patrn secuencial, este mtodo puede requerir menos tiempo y algunas veces tiene como resultado un costo menor que el mtodo aleatorio simple.

Muestreo estratificado.

Dividimos la poblacin en grupos relativamente homogneos, llamados estratos. Despus, se utiliza uno de estos planteamientos:

Seleccionamos aleatoriamente de cada estrato un nmero especfico de elementos correspondientes a la fraccin de ese estrato en la poblacin como un todo. Extraemos un nmero igual de elementos de cada estrato y damos peso a los resultados de acuerdo con la porcin del estrato con respecto a la poblacin total.

Con cualquiera de estos planteamientos, el muestreo estratificado garantiza que cada elemento de la poblacin tenga posibilidad de ser seleccionado.

Este mtodo resulta apropiado cuando la poblacin ya est dividida en grupos de diferentes tamaos y deseamos tomar en cuenta este hecho (por ejemplo: categoras profesionales de la poblacin).

La ventaja de las muestras estratificadas es que, cuando se disean adecuadamente, reflejan de manera ms precisa las caractersticas de la poblacin de la cual fueron elegidas.

Muestreo de racimo.

Dividimos la poblacin en grupos, o racimos, y luego seleccionamos una muestra aleatoria de estos racimos. Suponemos que estos racimos individualmente son representativos de la poblacin como un todo (Por ejemplo: las cuadras o barrios de un pueblo). Un procedimiento de racimo bien diseado puede producir una muestra ms precisa a un costo considerablemente menor que el de un muestreo aleatorio simple.

Tanto en el muestreo estratificado como en el de racimo, la poblacin se divide en grupos bien definidos. Usamos el muestreo estratificado cuando cada grupo tiene una pequea variacin dentro de s mismo, pero hay una amplia variacin dentro de los grupos. Usamos el muestreo de racimo en el caso opuesto, cuando hay una variacin considerable dentro de cada grupo, pero los grupos son esencialmente similares entre s.

Base de la inferencia estadstica: muestreo aleatorio simple.

El muestreo sistemtico, estratificado y el de racimo intentan aproximarse al muestreo aleatorio simple. Todos son mtodos que han sido desarrollados por su precisin, economa o facilidad fsica.

Los principios del muestreo aleatorio simple son la base de la inferencia estadstica, el proceso de hacer inferencias acerca de poblaciones a partir de informacin contenida en muestras.

SUGERENCIAS:

El uso de muestras en un estudio estadstico permite ahorrar mucho esfuerzo y dinero, y generalmente proporciona informacin muy precisa sobre las principales propiedades de la poblacin. Para seleccionar una muestra, usar tcnicas que permitan garantizar que se cumplan las propiedades de homogeneidad, independencia y representatividad. La tcnica de muestreo utilizada depende de los objetivos del estudio, de las caractersticas de la poblacin y de las disponibilidades de materiales. Cada dato cuesta dinero, as que para elegir el tamao de la muestra hay que compatibilizar la precisin requerida con la variabilidad de los datos y los recursos disponibles.

Introduccin a las distribuciones de muestreo.

Si tomamos varias muestras de una poblacin, las estadsticas que calcularamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra.

Una distribucin de probabilidad de todas las medias posibles de las muestras es una distribucin de las medias de las muestras. Los estadsticos la conocen como distribucin de muestreo de la media.

Tambin podramos tener una distribucin de muestreo de una porcin. Si trazamos una distribucin de probabilidad de porciones posibles de un evento en todas las muestras, obtendramos una distribucin de las porciones de las muestras. A esto se lo conoce como distribucin de la porcin.

Descripcin de las distribuciones de muestreo.

Cualquier distribucin de probabilidad (y, por tanto, cualquier distribucin de muestreo) puede ser descripta parcialmente por su media y su desviacin estndar.

Concepto de error estndar.

En vez de decir "la desviacin estndar de la distribucin de las medias de la muestra" para describir una distribucin de medias de la muestra, los estadsticos se refieren al error estndar de la media. De manera similar, la "desviacin estndar de la distribucin de las proporciones de la muestra" se abrevia como error estndar de la proporcin. El trmino error estndar se utiliza porque da a entender un significado especfico. La variabilidad en las estadsticas de muestras proviene de un error de muestreo debido al azar; es decir, hay diferencias entre cada muestra y la poblacin, y entre las diversas muestras, debido nicamente a los elementos que decidimos escoger para las muestras.

La desviacin estndar de la distribucin de las medias de las muestras mide el grado hasta el que esperamos que varen las medias de las diferentes muestras debido a este error fortuito

cometido en el proceso de muestreo. Por tanto, la desviacin estndar de la distribucin de una estadstica de muestra se conoce como el error estndar de la estadstica.

El error estndar indica no slo el tamao del error de azar que se ha cometido, sino tambin la probable precisin que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de poblacin. Una distribucin de medias de muestra que est menos extendida (y que tiene un error estndar pequeo) es un mejor estimador de la media de la poblacin que una distribucin de medias de muestra que est ampliamente dispersa y que tiene un error estndar ms grande.

Uso del error estndar.

Siempre que usamos pruebas, tenemos que tratar con el error estndar. Especficamente, necesitamos cierta medicin de la precisin del instrumento de prueba, generalmente representado por el error estndar.

SUGERENCIA:

El conocimiento de la distribucin de muestreo permite a los estadsticos planear muestras de tal forma que los resultados sean significativos. Debido a que resulta caro recabar y analizar muestras grandes, los administradores siempre procuran obtener la muestra ms pequea que proporcione un resultado confiable.

Base conceptual para muestrear distribuciones.

En la terminologa estadstica, la distribucin de muestreo que obtendramos al tomar todas las muestras de un tamao dado constituye una distribucin terica de muestreo. En casi todos los casos, los responsables de las decisiones slo toman una muestra de la poblacin, calculan estadsticas para esa muestra y de esas estadsticas infieren algo sobre los parmetros de toda la poblacin.

Muestreo de poblaciones normales.

Si extraemos muestras de una poblacin normalmente distribuida y calculamos sus medias, debido a que estamos promediando para obtener cada media de muestra, se promediaran hacia abajo valores muy grandes de la muestra y hacia arriba valores muy pequeos. El razonamiento consistira en que nos estaramos extendiendo menos entre las medias de muestra que entre los elementos individuales de la poblacin original. Esto es lo mismo que afirmar que error estndar de la media, o la desviacin estndar de la distribucin de muestreo, sera menor que la desviacin estndar de los elementos individuales en la poblacin.

El error estndar de la media obtenido para situaciones en las que la poblacin es infinita es:

x = / n

Para convertir cualquier variable aleatoria normal en una variable aleatoria normal estndar, debemos sustraer la media de la variable que se est estandarizando y dividir el resultado entre el error estndar (la desviacin estndar de dicha variable). En este caso particular:

Muestreo de poblaciones no normales.

Cuando una poblacin est distribuida normalmente, la distribucin de muestreo de la media tambin es normal.

Incluso en el caso en el que una poblacin no est normalmente distribuida, x, la media de la distribucin de muestreo, sigue siendo igual a la media de la poblacin, . Es decir, la

distribucin de muestreo de la media se acerca a la normalidad, sin importar la forma de la distribucin de la poblacin.

El teorema del lmite central.

La media de la distribucin de muestreo de la media ser igual a la media de la poblacin. Al incrementarse el tamao de la muestra, la distribucin de muestreo de la media se acercar a la normalidad, sin importar la forma de la distribucin de la poblacin.

Esta relacin entre la forma de la distribucin de la poblacin y la forma de la distribucin de muestreo se denomina teorema del lmite central, que es tal vez el ms importante de toda la inferencia estadstica. Nos asegura que la distribucin de muestreo de la media se aproxima a la normal al incrementarse el tamao de la muestra. Hay situaciones tericas en las que el teorema del lmite central no se cumple, pero casi nunca se encuentran en la toma de decisiones prctica. Una muestra no tiene que ser muy grande para que la distribucin de muestreo de la media se acerque a la normal. Los estadsticos utilizan la distribucin normal como una aproximacin a la distribucin de muestreo siempre que el tamao de la muestra sea al menos de 30, pero la distribucin de muestreo de la media puede ser casi normal con muestras incluso de la mitad de ese tamao. La importancia del teorema del lmite central es que nos permite usar estadsticas de muestra para hacer inferencias con respecto a los parmetros de poblacin sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin ms que lo que podamos obtener de la muestra.

SUGERENCIA:

El teorema del lmite central nos permite utilizar las propiedades de la distribucin normal en muchos casos en los que los datos subyacentes no estn normalmente distribuidos. El hecho de que la distribucin de muestreo sea aproximadamente normal es la base de una amplia variedad de pruebas estadsticas diferentes.

Relacin entre el tamao de la muestra y el error estndar.

El error estndar es una medicin de la dispersin de las medias de muestras alrededor de la media de la poblacin. Si la dispersin disminuye (si x se hace ms pequea), entonces los valores tomados por la media de la muestra tienden a agruparse ms cercanamente alrededor de . Y a la inversa, si la dispersin se incrementa (si x se agranda), los valores tomados por la media de la muestra tienden a agruparse menos cercanamente alrededor de . Al disminuir el error estndar, el valor de cualquier media de muestra probablemente se acercar al valor de la media de la poblacin. Los estadsticos describen este fenmeno diciendo: al disminuir el error estndar, se incrementa la precisin con que se puede usar la media de muestra para estimar la media de poblacin.

Debido al hecho de que x vara inversamente con la raz cuadrada de n, hay una utilidad decreciente en el muestreo.

Es cierto que al muestrear ms elementos disminuye el error estndar, pero este beneficio puede no valer el costo. El aumento de precisin puede no valer el costo del muestreo adicional.

Sea X una variable aleatoria con distribucin normal, con parmetros , 2. Si sacamos muestras de tamao n, y calculamos la media aritmtica, se demuestra que bajo ciertas condiciones, X tambin es una variable aleatoria con distribucin normal, con parmetros , 2 /n. Es decir:

Si X - N ( , 2), entonces X - N ( , 2/n)

Las dos distribuciones tienen la misma media, pero la dispersin de la media aritmtica es menor, tanto ms pequea cuando mayor sea el tamao de la muestra.

Como en un proceso de inferencia es un parmetro desconocido, al extraer una muestra en particular y calcular x, no podemos determinar exactamente qu tan cerca estuvo esa estimacin del valor verdadero del parmetro.

De lo nico que podemos estar seguros es que, al aumentar el tamao de la muestra, la distribucin de la media aritmtica tiende a concentrarse ms y ms alrededor de la media poblacional y, por tanto, las estimaciones van a estar ms prximas al valor del parmetro (desconocido).

Lo ms relevante de la media aritmtica es que, an cuando la variable en estudio no tenga distribucin normal, o su distribucin sea desconocida, si el nmero de elementos de la

muestra es suficientemente grande, por aplicacin del Teorema del Lmite Central, la media aritmtica igualmente va a tener aproximadamente distribucin normal.

Por ltimo, es interesante remarcar la idea de que la media aritmtica es conceptualmente una variable aleatoria hasta el instante previo a calcular efectivamente su valor. Despus de efectuar ese clculo, tenemos un valor fijo (no aleatorio), y por lo tanto, deja de tener sentido hablar de la "probabilidad de la media aritmtica".

El clculo de probabilidades con la media aritmtica tiene entonces validez en trminos tericos, es decir, representa "lo que se espera" que ocurra con dicha variable antes de tomar una muestra y calcular efectivamente su valor.

El multiplicador de la poblacin finita.

Para calcular el error estndar de la media, utilizamos la ecuacin:

x = / n

esta ecuacin est diseada para situaciones en las que la poblacin es infinita, o en las que tomamos muestras de una poblacin infinita con reemplazo.

La frmula diseada para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace sin reemplazo es:

x = / n x (N - n) / (N - 1)

donde:

N = tamao de la poblacin n = tamao de la muestra

Este nuevo factor que aparece en la ecuacin y se multiplica al error estndar original se conoce como multiplicador de la poblacin finita.

Cuando muestreamos una pequea fraccin de la poblacin entera (es decir, cuando el tamao de la poblacin N es muy grande en relacin con el tamao de la muestra n), el multiplicador de la poblacin finita toma un valor cercano a 1. Los estadsticos se refieren a la fraccin n/N como la fraccin de muestreo, porque es la fraccin de la poblacin N contenida en la muestra.

Cuando la fraccin de muestreo es pequea, el error estndar de la media para poblaciones finitas es tan cercano a la media para poblaciones infinitas, que bien podramos utilizar la misma frmula para ambas desviaciones. La regla generalmente aceptada es: si la fraccin de muestreo es menor a 0,05, no se necesita usar el multiplicar para la poblacin finita.

Cuando utilizamos la ecuacin para poblaciones infinitas, es constante y, por tanto, la medida de la precisin de muestreo, x, depende solamente del tamao de la muestra n y no de la fraccin de poblacin muestreada. Es decir, para hacer x ms pequea slo es necesario agrandar n. En consecuencia, resulta que el tamao absoluto de la muestra es el que determina la precisin del muestreo, no la fraccin de la poblacin muestreada.

SUGERENCIAS:

Cuando desee calcular probabilidades con la media aritmtica, no olvide que al calcular la variable estandarizada, debe dividir por el desvo o error estndar de la media. Los resultados sern inexactos si omite este punto. Para verificar el funcionamiento de un proceso, medir el rendimiento de un mtodo, etc. necesitamos conocer su valor medio. Si debemos estimar ese valor a travs de la muestra, recuerde que la precisin de la estimacin aumenta con el incremento del tamao muestral. Evite realizar inferencias utilizando una sola observacin. La aplicacin del Teorema del Lmite Central hace de la media aritmtica una herramienta til, an en aquellos casos en que la distribucin de la variable en estudio no es conocida, o no es normal. La disminucin del error estndar no es directamente proporcional al tamao de la muestra, as que es conveniente compatibilizar precisin con costos.

Conceptos.

Censo: medicin o examen de cada elemento de la poblacin.

Distribucin de muestreo de la media: una distribucin de probabilidad de todas las medias posibles de muestras de un tamao dado, n, de una poblacin.

Distribucin de muestreo de una estadstica: para una poblacin dada, distribucin de probabilidad de todos los valores posibles que puede tomar una estadstica, dado un tamao de la muestra.

Error de muestreo: error o variacin entre estadsticas de muestra debido al azar, es decir, diferencias entre cada muestra y la poblacin, y entre varias muestras, que se deben nicamente a los elementos que elegimos para la muestra.

Error estndar: la desviacin estndar de la distribucin de muestreo de una estadstica.

Error estndar de la media: la desviacin estndar de la distribucin de muestreo de la media, una medida del grado en que se espera que varen las medias de las diferentes muestras de la media de la poblacin, debido al error aleatorio en el proceso de muestreo.

Estadsticas: mediciones que describen las caractersticas de una muestra.

Estimador o estadstico: cantidad que caracteriza a una muestra, y que sirve para aproximar el valor de un parmetro desconocido. Variable aleatoria, funcin de las observaciones muestrales, a travs de la cual tratamos de inferir el valor de un parmetro poblacional.

Estimacin: valor particular de un estimador, que caracteriza a una muestra especfica.

Estratos: grupos dentro de una poblacin formados de tal manera que cada grupo es relativamente homogneo, aunque existe una variabilidad ms amplia entre los diferentes grupos.

Fraccin de muestreo: la fraccin o porcin de la poblacin contenida en una muestra.

Inferencia estadstica: proceso de anlisis que consiste en inferir las propiedades de una poblacin en base a la caracterizacin de la muestra.

Muestra: subconjunto de la poblacin seleccionado mediante algn criterio particular. Porcin de elementos de una poblacin elegidos para su examen o medicin directa.

Muestreo no aleatorio: conformacin de la muestra en base al conocimiento o experiencia del observador.

Muestreo aleatorio: conformacin de la muestra usando mtodos al azar. Muestreo aleatorio simple: mtodos de seleccin de muestras que permiten a cada muestra posible una probabilidad igual de ser elegida y a cada elemento de la poblacin completa una oportunidad igual de ser incluido en la muestra.

Muestreo con reemplazo: procedimiento de muestreo en el que los elementos se regresan a la poblacin despus de ser elegidos, de tal forma que algunos elementos de la poblacin pueden aparecer en la muestra ms de una vez.

Muestreo de juicio: mtodo para seleccionar una muestra de una poblacin en el que se usa el conocimiento o la experiencia personal para identificar aquellos elementos de la poblacin que deben incluirse en la muestra.

Muestreo de probabilidad o aleatorio: mtodo para seleccionar una muestra de una poblacin en el que todos los elementos de la poblacin tienen igual oportunidad de ser elegidos en la muestra.

Muestreo estratificado: la poblacin se divide en estratos, y luego se muestra en forma proporcional en cada estrato. Mtodo de muestreo aleatorio en el que la poblacin se divide en grupos homogneos, o estratos, y los elementos dentro de cada estrato se seleccionan al azar de acuerdo con una de dos reglas: 1) un nmero

especfico de elementos se extrae de cada estrato correspondiente a la porcin de ese estrato en la poblacin; 2) igual nmero de elementos se extraen de cada estrato, y los resultados son valorados de acuerdo con la porcin del estrato de la poblacin total.

Muestreo de racimo (o por conglomerados): la poblacin se divide en racimos y luego se elige aleatoriamente una muestra de racimos. Mtodo de muestreo aleatorio en el que la poblacin se divide en grupos o racimos de elementos y luego se selecciona una muestra aleatoria de estos racimos.

Muestreo sin reemplazo: procedimiento de muestreo en el que los elementos no se regresan a la poblacin despus de ser elegidos, de tal forma que ningn elemento de la poblacin puede aparecer en la muestra ms de una vez.

Muestreo sistemtico: los elementos de la muestra son elegidos a intervalos fijos. Mtodo de muestreo aleatorio usado en estadstica en el que los elementos que se muestrearn se seleccionan de la poblacin en un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio.

Multiplicador de la poblacin finita: factor que se utiliza para corregir el error estndar de la media en el estudio de una poblacin de tamao finito, pequeo con respecto al tamao de la muestra.

Parmetro: valor fijo que caracteriza a una poblacin. Valores que describen las caractersticas de una poblacin.

Poblacin: conjunto de elementos que son objeto de un estudio estadstico.

Poblacin finita: poblacin que tiene un tamao establecido o limitado.

Precisin: el grado de exactitud con el que la media de la muestra puede estimar la media de la poblacin, segn revela el error estndar de la media.

Racimos: grupos dentro de una poblacin que son esencialmente similares entre s, aunque los grupos mismos tengan amplia variacin interna.

Teorema del lmite central: resultado que asegura que la distribucin de muestreo de la media se acerca a la normalidad cuando el tamao de la muestra se incrementa, sin importar la forma de la distribucin de la poblacin de la que se selecciona la muestra.

ESTIMACIN.

El material sobre teora de la probabilidad constituye la base de la inferencia estadstica, rama de la estadstica que tiene que ver con el uso de los conceptos de la probabilidad para tratar con la toma de decisiones en condiciones de incertidumbre. La inferencia estadstica est basada en la estimacin y en la prueba de hiptesis.

Tipos de estimacin.

Podemos hacer dos tipos de estimaciones concernientes a una poblacin:

Una estimacin puntual: es slo u nmero que se utiliza para estimar un parmetro de poblacin desconocido. Una estimacin puntual a menudo resulta insuficiente, debido a que slo tiene dos opciones: es correcta o est equivocada. Una estimacin puntual es mucho ms til si viene acompaada por una estimacin del error que podra estar implicado. Una estimacin de intervalo: es un intervalo de valores que se utiliza para estimar un parmetro de poblacin. Esta estimacin indica el error de dos maneras: por la extensin del intervalo y por la probabilidad de obtener el verdadero parmetro de la poblacin que se encuentra dentro del intervalo.

Estimador y estimaciones.

Un estimador es una estadstica de muestra utilizada para estimar un parmetro de poblacin. La media de la muestra puede ser un estimador de la media de la poblacin, y la porcin de la

muestra se puede utilizar como estimador de la porcin de la poblacin. Tambin podemos utilizar el alcance de la muestra como un estimador del alcance de la poblacin.

Cuando hemos observado un valor numrico especfico de nuestro estimador, nos referimos a ese valor como una estimacin. Una estimacin es un valor especfico observado de una estadstica. Hacemos una estimacin si tomamos una muestra y calculamos el valor que toma nuestro estimador en esa muestra.

Criterios para seleccionar un buen estimador.

1. Imparcialidad. Se refiere al hecho de que una media de muestra es un estimador no sesgado de una media de poblacin, porque la media de distribucin de muestreo de las medias de muestras tomadas de la misma poblacin es igual a la media de la poblacin misma. Podemos decir que una estadstica es un estimador imparcial (o no sesgado) si, en promedio, tiende a tomar valores que estn por encima del parmetro de la poblacin y la misma extensin con la que tiende a asumir valores por debajo del parmetro de poblacin que se est estimando. 2. Eficiencia. Se refiere al tamao del error estndar de la estadstica. Si comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el menor error estndar o la menor desviacin estndar de la distribucin de muestreo. Tiene sentido pensar que un estimador con un error estndar menor (con menos desviacin) tendr una mayor oportunidad de producir una estimacin ms cercana al parmetro de poblacin que se est considerando. 3. Coherencia. Una estadstica es un estimador coherente de un parmetro de poblacin si al aumentar el tamao de la muestra, se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente, se vuelve ms confiable si tenemos tamaos de muestras ms grandes. 4. Suficiencia. Un estimador es suficiente si utiliza una cantidad de la informacin contenida en la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin.

Una estadstica de muestra dada no siempre es el mejor estimador de su parmetro de poblacin correspondiente. Considere una poblacin distribuida simtricamente, en la que los valores de la mediana y de la media coinciden. En este caso, la media de la muestra sera un estimador imparcial de la mediana de la poblacin debido a que asumira valores que en promedio seran iguales a la mediana de la poblacin. Tambin, la media de la muestra sera un estimador consistente de la mediana de la poblacin, puesto que, conforme aumenta el tamao de la muestra, el valor de la media de la muestra tender a acercarse bastante a la mediana de la poblacin. Y la media de la muestra sera un estimador ms eficiente de la mediana de la poblacin que la mediana misma, ya que en muestras grandes, la media de la muestra tiene una desviacin estndar menor que la mediana de la muestra. Al mismo tiempo, la mediana de la muestra de una distribucin distribuida simtricamente sera un estimador

imparcial y consistente de la media de la poblacin, pero no el ms eficiente estimador, porque en muestras grandes su error estndar es mayor que el de la media de la muestra.

Estimaciones puntuales.

La media de la muestra es el mejor estimador de la media de la poblacin. Es imparcial, coherente, el estimador ms eficiente y, siempre y cuando la muestra sea la suficientemente grande, su distribucin de muestreo puede ser aproximada por la distribucin normal.

Si conocemos la distribucin de muestreo de la media, podemos llegar a conclusiones con respecto a cualquier estimacin que podamos hacer a partir de la informacin de muestreo.

Estimacin puntual de la varianza y de la desviacin estndar de la poblacin.

El estimador utilizado con ms frecuencia para hacer la estimacin de la desviacin estndar de la poblacin, es la desviacin estndar de la muestra:

s2 = (x - x)2 / (n - 1)

Al utilizar un divisor n - 1, nos da un estimador imparcial de 2.

Estimacin puntual de la porcin de la poblacin.

La porcin de unidades de una poblacin dada que posee una caracterstica particular se representa mediante el smbolo p. Si conocemos la porcin de unidades de una muestra que

tiene la misma caracterstica, podemos utilizar esa p como estimador de p. Se puede mostrar que p tiene todas las caractersticas deseables: es imparcial (no sesgado), coherente, eficiente y suficiente.

SUGERENCIA:

Incluso cuando estamos utilizando el mejor estimador de un parmetro de poblacin, aceptamos que puede estar implicado algo de error. Afirmamos que la estimacin puntual y la medida de la varianza proporcionan informacin til para las decisiones.

Estimaciones de intervalo.

El propsito de tomar muestras es para conocer ms acerca de una poblacin. Podemos calcular esa informacin a partir de las muestras como estimaciones puntuales, o como estimaciones de intervalo. Una estimacin de intervalo describe un intervalo de valores dentro del cual es posible que est un parmetro de poblacin.

Si seleccionamos y representamos grficamente un gran nmero de medias de muestras de una poblacin, la distribucin de tales medias se aproximar a la curva normal. Adems, la media de las medias de muestra ser la misma media de la poblacin.

Probabilidad de que el verdadero parmetro de la poblacin est dentro de la estimacin de intervalo.

En lo que concierne a cualquier intervalo particular, ste contiene a la media de la poblacin o no la contiene, pues la media de la poblacin es un parmetro fijo, y no vara.

Cuando las organizaciones informan la precisin de encuestas de opinin como "estos resultados son precisos en ms menos tres puntos", por lo general no establecen el nivel de confianza que estn utilizando para hacer la estimacin de intervalo. Una afirmacin ms completa tendra la forma. "existe un 95% de probabilidad de que la verdadera opinin de la poblacin caiga dentro del intervalo comprendido entre ..... y ........"

Estimaciones de intervalo e intervalos de confianza.

La probabilidad que asociamos con una estimacin de intervalo se conoce como nivel de confianza. Esta probabilidad indica qu tanta confianza tenemos de que la estimacin de intervalo incluya al parmetro de poblacin. Una probabilidad ms alta indica ms confianza.

El intervalo de confianza es el alcance de la estimacin que estamos haciendo. Expresaremos el intervalo de confianza en trminos de errores estndar, ms que con valores numricos. Los lmites de confianza son los lmites superior e inferior del intervalo de confianza

Relacin entre el nivel de confianza e intervalo de confianza.

Podra pensarse que deberamos utilizar un nivel alto de confianza en todos los problemas sobre estimaciones. En la prctica, sin embargo, altos niveles de confianza producen intervalos de confianza grandes, y stos no son precisos, dan estimaciones bastante imprecisas.

Uso del muestreo y de la estimacin de intervalos de confianza.

A menudo resulta difcil o caro tomar ms de una muestra de una poblacin. Basados en solamente una muestra estimamos el parmetro de poblacin.

El intervalo de confianza quiere decir que si seleccionamos muchas muestras aleatorias del mismo tamao y si calculamos un intervalo de confianza para cada una de las muestras, tendremos un porcentaje de confianza determino de que en todos los casos la media de la poblacin caer dentro del intervalo.

Por otro lado, existe un cierto equilibrio entre la certidumbre de la estimacin y el ancho de un intervalo de confianza.

Clculo de estimaciones de intervalo de la media a partir de muestras grandes.

Se calcula el error estndar de la media para una poblacin infinita:

x = / n

Posteriormente, se establecen los lmites de confianza superior e inferior, considerando el porcentaje de confianza requerido.

Cuando no se conoce la desviacin estndar.

Cuando no se conoce la desviacin estndar de la poblacin, utilizamos la desviacin estndar de la muestra para estimar la desviacin estndar de la poblacin:

s2 = [(x - x)2 / (n - 1)]

La frmula para derivar el error estndar de la media de poblaciones finitas es:

x = { / n} x (N - n) / N - 1)

A partir de esto, podemos calcular el error estndar de la media mediante la desviacin estndar de la poblacin:

x = { x/ n} x (N - n) / N - 1)

SUGERENCIA:

Cuando tenemos muestras grandes, utilizamos el Teorema del Lmite Central, nuestro conocimiento de la curva normal y nuestra habilidad para hacer correcciones para poblaciones finitas.

Determinacin del tamao de la muestra.

Siempre que tomamos una muestra, perdemos algo de informacin til con respecto a la poblacin. El error de muestre se puede controlar si seleccionamos una muestra cuyo tamao sea el adecuado. En general, cuanta ms precisin se quiera, ms grande ser el tamao de la muestra necesaria.

Para calcular el tamao de muestra, podemos utilizar la frmula del error estndar de la media:

x = / n

Si no conocemos la desviacin estndar de la poblacin, podemos utilizar el alcance de la poblacin para obtener una estimacin burda pero manejable de la desviacin estndar. Sabemos que ms menos tres desviaciones estndar incluyen 99,7% del rea total bajo la curva normal, esto es, ms tres desviaciones estndar y menos tres desviaciones estndar de la media incluyen casi toda el rea de la distribucin.

SUGERENCIAS:

Un estimador es una variable aleatoria, y por lo tanto es posible asociarle probabilidades, lo que resulta de suma utilidad como herramienta auxiliar para la toma de decisiones bajo condiciones de incertidumbre. Una estimacin, en cambio, es un valor particular del estimador, calculado en base a una muestra dada. Por tanto, constituye un valor fijo (no aleatorio) que caracteriza a esa muestra en particular, pero que se usa para inferir el valor de un parmetro desconocido. Entre un estimador puntual y uno por intervalos, es preferible usar este ltimo porque tiene asociado una probabilidad que contempla el error que se puede cometer en la aproximacin.

Conceptos.

Estimacin: valor especfico de un estimador, calculado en base a una muestra dada.

Estimacin de intervalo: intervalo de valores utilizado para estimar un parmetro de poblacin desconocido.

Estimacin de parmetros: Aproximacin del valor de parmetros poblacionales desconocidos mediante el empleo de estadsticos muestrales.

Estimacin puntual: un solo nmero que se utiliza para estimar un parmetro de poblacin desconocido.

Estimador: estadstica de muestra utilizada para estimar un parmetro de poblacin. Conceptualmente es una variable aleatoria.

Estimador coherente: estimador que produce valores que se acercan ms al parmetro de la poblacin conforme aumenta el tamao de la muestra.

Estimador eficiente: estimador con un menor error estndar que algn otro estimador del parmetro de la poblacin, esto es, cuanto ms pequeo sea el error estndar de un estimador, ms eficiente ser ese estimador.

Estimador imparcial: estimador de un parmetro de poblacin que, en promedio, asume valores por encima del parmetro de la poblacin con la misma frecuencia, y al mismo grado, con que tiende a tomarlos por debajo del parmetro de la poblacin.

Estimador suficiente: estimador que utiliza toda la informacin disponible en los datos correspondientes a un parmetro.

Intervalo de confianza: intervalo de valores que tiene designada una probabilidad de que incluya el valor real del parmetro de la poblacin.

Lmites de confianza: lmites inferior y superior de un intervalo de confianza.

Nivel de confianza: probabilidad que los estadsticos asocian con una estimacin de intervalo de un parmetro de poblacin, sta indica qu tan seguros estn de que la estimacin de intervalo incluir el parmetro de la poblacin. Probabilidad, designada de antemano, de que un intervalo de confianza incluya al valor del parmetro desconocido.

Propiedades de un buen estimador: caractersticas deseables de un estimador, para lograr la mejor aproximacin posible de un parmetro poblacional.

PRUEBAS DE HIPTESIS.

Una hiptesis es una afirmacin acerca de algo. En estadstica, puede ser una suposicin acerca del valor de un parmetro desconocido.

Pasos en la prueba de hiptesis:

1. 2. 3. 4. 5. 6.

Definir la hiptesis nula: suponer una hiptesis acerca de una poblacin. Formular una hiptesis alternativa: es una contra-hiptesis. Definir un criterio de decisin para rechazar o no la hiptesis nula. Recabar datos de la muestra. Calcular una estadstica de muestra. Utilizar la estadstica de muestra para evaluar la hiptesis.

Generalmente, se habla de "no rechazar" una hiptesis en lugar de "aceptar", ya que las pruebas no son concluyentes.

Introduccin.

La prueba de hiptesis comienza con una suposicin, llamada hiptesis, que hacemos con respecto a un parmetro de poblacin. Despus recolectamos datos de muestra, producimos estadsticas de muestra y usamos esta informacin para decidir qu tan probable es que sea correcto nuestro parmetro de poblacin acerca del cual hicimos la hiptesis.

Debemos establecer el valor supuesto o hipotetizado del parmetro de poblacin antes de comenzar a tomar la muestra. La suposicin que deseamos probar se conoce como hiptesis nula, y se simboliza H0.

Siempre que rechazamos la hiptesis, la conclusin que s aceptamos se llama hiptesis alternativa y se simboliza H1.

Interpretacin del nivel de significancia.

El propsito de la prueba de hiptesis no es cuestionar el valor calculado de la estadstica de muestra, sino hacer un juicio respecto a la diferencia entre esa estadstica de muestra y un parmetro de poblacin hipotetizado. El siguiente paso despus de establecer la hiptesis nula alternativa consiste en decidir qu criterio utilizar para decidir si aceptar o rechazar la hiptesis nula.

Si suponemos que la hiptesis es correcta, entonces el nivel de significancia indicar el porcentaje de medias de muestra que est fuera de ciertos lmites.

Siempre que afirmemos que aceptamos la hiptesis nula, en realidad lo que queremos decir es que no hay suficiente evidencia estadstica para rechazarla. El empleo del trmino aceptar, en lugar de rechazar, se ha vuelto de uso comn. Significa simplemente que cuando los datos de la muestra n hacen que rechacemos una hiptesis nula, nos comportamos como si fuera cierta.

Seleccin del nivel de significancia.

Nuestra eleccin del estndar mnimo para una probabilidad aceptable, o el nivel de significancia, es tambin el riesgo que asumimos al rechazar una hiptesis nula cuando es cierta. Mientras ms alto sea el nivel de significancia que utilizamos para probar una hiptesis, mayor ser la probabilidad de rechazar una hiptesis nula cuando es cierta.

Errores tipo I y tipo II.

El rechazo de una hiptesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es tambin el nivel de significancia) se simboliza como . El hecho de aceptar una hiptesis nula cuando es falsa se denomina error de tipo II, y su probabilidad se simboliza como . La probabilidad de cometer un tipo de error puede reducirse slo si deseamos incrementar la probabilidad de cometer el otro tipo de error. Con el propsito de obtener una baja, tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel de significancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores.

Pruebas de hiptesis de dos extremos y de un extremo.

Una prueba de dos extremos de una hiptesis, rechazar la hiptesis nula si la media de muestra es significativamente mayor o menor que la media de la poblacin hipotetizada. Existen dos regiones de rechazo.

Hay situaciones en las que no es apropiada una prueba de dos extremos, por lo que debemos usar una prueba de un extremo, que pueden ser de extremo izquierdo (o inferior) o extremo derecho (o superior).

La nica forma de probar una hiptesis nula es conociendo el parmetro de poblacin, y eso no es posible al tomar una muestra. Por consiguiente, aceptamos la hiptesis nula y nos comportamos como si fuera cierta, simplemente porque no podemos encontrar evidencia para rechazarla.

Medicin de la potencia de una prueba de hiptesis.

Idealmente, tanto como (las probabilidades de los errores tipo I y II deben ser pequeas. Una vez que decidimos el nivel de significancia, no hay nada que podamos hacer con respecto a.

Cuando la hiptesis nula es falsa, (la media de la poblacin cierta) no es igual a la media hipotetizada.

Puesto que rechazar una hiptesis nula cuando es falsa es exactamente lo que debe hacer una buena prueba, un valor alto de 1 - significa que la prueba est trabajando bastante bien (est rechazando la hiptesis nula cuando es falsa. Puesto que 1 - es la medida de qu tan bien trabaja la prueba, se la conoce como la potencia de la prueba. Si representamos grficamente los valores 1 - por cada valor de para el que la hiptesis alternativa es cierta, la curva resultante se conoce como curva de potencia.

SUGERENCIAS:

Conviene plantear la hiptesis nula siempre por la igualdad. Adapte la contrahiptesis de acuerdo con el objetivo del problema. Formule la hiptesis en base a los objetivos del estudio, pero siempre antes de extraer la muestra y calcular el estimador puntual del parmetro desconocido, para no verse influenciado por este resultado.

Tenga en cuenta que si bien la hiptesis nula es la que se pone bajo prueba, eso no significa que deba ser siempre la suposicin que el experimentador desea que se compruebe. Como en todo proceso de inferencia, existe algn grado de subjetividad en la realizacin de una prueba, particularmente en la eleccin del nivel de significancia y del tamao de la muestra. Trate de que la eleccin de estos valores responda a un anlisis cuidadoso del problema en cuestin. Una vez fijadas las condiciones de la prueba, el resultado de la misma es totalmente objetivo. Para fijar el nivel de significancia de la prueba, hay que tener en cuenta que cuando la probabilidad del error tipo I aumenta, la del error tipo II disminuye. La forma de minimizar el error tipo II independientemente del nivel de significancia, es aumentando el tamao de la muestra. Como las probabilidades de los errores tipo I y II estn relacionadas entre si, pero el experimentador puede fijar la primera, antes de elegir el nivel de significancia hay que ver cul de los dos tipos de errores resulta ms crtico.

Conceptos:

Alfa: probabilidad de cometer un error de tipo I.

Beta: probabilidad de cometer un error de tipo II.

Curva de potencia: grfica de los valores de la potencia de una prueba por cada valor de , u otro parmetro de poblacin, para el que la hiptesis alternativa es cierta.

Error de tipo I: rechazo de una hiptesis nula cuando es cierta.

Error de tipo II: aceptacin de una hiptesis nula cuando es falsa.

Escala estandarizada: medicin en desviaciones estndar a partir de la media de la variable.

Escala sin procesar: medicin en las unidades originales de la variable.

Hiptesis: suposicin o especulacin que hacemos con respecto a un parmetro de poblacin.

Hiptesis alternativa: conclusin que aceptamos cuando los datos no respaldan la hiptesis nula. Hiptesis estadstica: afirmacin acerca del valor de un parmetro desconocido, o sobre la distribucin de una variable.

Hiptesis nula: hiptesis o suposicin con respecto a un parmetro de poblacin que deseamos probar.

Nivel de significancia: valor que indica el porcentaje de valores de muestra que estn fuera de ciertos lmites, suponiendo que la hiptesis nula es correcta, es decir, se trata de la probabilidad de rechazar la hiptesis nula cuando es cierta.

Potencia de prueba de hiptesis: probabilidad de rechazar la hiptesis nula cuando es falsa, es decir, una medida de qu tan bien funciona la prueba de hiptesis.

Prueba de hiptesis: experimento que pone bajo prueba una hiptesis estadstica, para decidir si es verdadera o falsa.

Prueba de dos extremos: prueba de hiptesis en la que la hiptesis nula se rechaza si el valor de muestra es significativamente menor o mayor que el valor hipotetizado del parmetro de poblacin, prueba que involucra dos regiones de rechazo.

Prueba de extremo inferior: prueba de hiptesis de un extremo en la que un valor de la muestra que se encuentra significativamente por debajo del valor de la poblacin hipotetizada, nos llevar a rechazar la hiptesis nula.

Prueba de extremo superior: prueba de hiptesis de un extremo en la que un valor de muestra significativamente superior al valor de poblacin hipotetizado nos llevar a rechazar la hiptesis nula.

Prueba de un extremo: prueba de hiptesis en la que slo hay una regin de rechazo, es decir, slo nos interesa si el valor observado se desva del valor hipotetizado en una direccin.

Valor crtico: valor de la estadstica estndar (z) ms all del cual rechazamos la hiptesis nula; el lmite entre las regiones de aceptacin y rechazo.

INTRODUCCIN A LA ESTADSTICA NO PARAMTRICA.

Las pruebas de hiptesis hacen inferencias respecto a los parmetros de la poblacin, como la media. Estas pruebas paramtricas utilizan la estadstica paramtrica de muestras que provinieron de la poblacin que se est probando. Para formular estas pruebas, hicimos suposiciones restrictivas sobre las poblaciones de las que extraamos las muestras. Por ejemplo: suponamos que las muestras eran grandes o que provenan de poblaciones normalmente distribuidas. Pero las poblaciones no siempre son normales.

Los estadsticos han desarrollado tcnicas tiles que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones. stas se conocen como pruebas sin distribucin, o pruebas no paramtricas. Las hiptesis de una probabilidad no paramtrica se refieren a algo distinto del valor de un parmetro de poblacin

Ventajas de los mtodos no paramtricos.

1. No requieren que hagamos la suposicin de que una poblacin est distribuida en forma de curva normal u otra forma especfica. 2. Generalmente, son ms fciles de efectuar y comprender. 3. Algunas veces, ni siquiera se requiere el ordenamiento o clasificacin formal.

Desventajas de los mtodos no paramtricos.

1. Ignoran una cierta cantidad de informacin 2. A menudo, no son tan eficientes como las pruebas paramtricas. Cuando usamos pruebas no paramtricas, efectuamos un trueque: perdemos agudeza al estimar intervalos, pero ganamos la habilidad de usar menos informacin y calcular ms rpidamente.

PRUEBA DE KOLMOGOROV.SMIRNOV.

Se trata de un mtodo no paramtrico sencillo para probar si existe una diferencia significativa entre una distribucin de frecuencia observada y otra frecuencia terica. Es otra medida de la bondad de ajuste de una distribucin de frecuencia terica.

Se basa en la comparacin de distribuciones acumuladas: la distribucin acumulada de los datos observados y la distribucin acumulada terica correspondiente al modelo elegido.

Tiene varias ventajas: es una prueba poderosa y fcil de utilizar, puesto que no requiere que los datos se agrupen de determinada manera.

Es particularmente til para juzgar qu tan cerca est la distribucin de frecuencias observada de la distribucin de frecuencias esperada, porque la distribucin de probabilidad Dn depende del tamao de muestra n, pero es independiente de la distribucin de frecuencia esperada (Dn es una estadstica de distribucin libre).

Para calcular la estadstica K-S, simplemente se elige Dn (la desviacin absoluta mxima entre las frecuencias observadas y tericas).

Una prueba K-S siempre debe ser una prueba de un extremo.

Luego se busca el valor crtico en la tabla, para las n observaciones, considerando el nivel de significancia adoptado.

Si el valor de la tabla es mayor que el valor de Dn, entonces aceptaremos la hiptesis nula.

SUGERENCIAS:

La prueba de Kolmogorov puede usarse con muestras muy pequeas, en donde no se pueden aplicar otras pruebas paramtricas. Podemos usar la prueba de Kolmogorov para verificar la suposicin de normalidad subyacente en todo anlisis de inferencia. Si bien constituye una prueba de implementacin sencilla, tenga en cuenta que carga con las desventajas de los mtodos no paramtricos en general, en el sentido de producir resultados menos precisos que los procedimientos convencionales. Cuando trabaje con muestras pequeas, recuerde usar la frecuencia cumulada experimental.

Conceptos:

Pruebas de bondad de ajuste: pruebas de hiptesis que ponen bajo prueba una afirmacin acerca de la distribucin de una variable aleatoria.

Prueba de Kolmogorrov-Smirnov: prueba no paramtrica que no requiere que los datos se agrupen de ninguna manera para determinar si existe diferencia significativa entre la distribucin de frecuencia observada y la distribucin de frecuencia terica.

Pruebas no paramtricas: tcnicas estadsticas que no hacen suposiciones restrictivas respecto a la forma de la distribucin de poblacin al realizar una prueba de hiptesis.

NMEROS NDICES

Definicin de un nmero ndice.

Un nmero ndice mide qu tanto una variable ha cambiado con el tiempo. Calculamos un nmero ndice encontrando el cociente del valor actual entre un valor base. Luego multiplicamos el nmero resultante por 100, para expresar el ndice como un porcentaje. Este valor final es el porcentaje relativo. El nmero ndice para el punto base en el tiempo siempre es 100.

Tipos de nmeros ndice.

El ndice de precios compara niveles de precios de un perodo a otro. El ndice de precios al consumidor (IPC) mide los cambios globales de precios de una variedad de bienes de consumo y de servicios, y se le utiliza para definir el costo de vida.

El ndice de cantidad mide qu tanto cambia el nmero o la cantidad de una variable en el tiempo.

El ndice de valor mide los cambios en el valor monetario total. Esto es, mide los cambios en el valor en pesos de una variable. Combina los cambios en precio y cantidad para presentar un ndice con ms informacin.

Por lo general, un ndice mide el cambio en una variable durante un cierto perodo, como en una serie temporal. Sin embargo, tambin se le puede utilizar para medir diferencias en una variable dada en diferentes lugares. Esto se lleva a cabo recolectando datos de manera simultnea en los diferentes lugares y luego comprndolos.

Un solo nmero ndice puede reflejar a una variable compuesta o a un grupo de stas. El IPC mide el nivel general de precios para bienes y servicios especficos en la economa. Combina los precios individuales de bienes y servicios para conformar un nmero de ndice de precios compuestos.

Usos de los nmeros ndice.

Los nmeros de ndice pueden utilizarse de diferentes maneras. Es ms comn usarlos por s mismos, como un resultado final.

En la administracin se utilizan como parte de un clculo intermedio para entender mejor otra informacin.

Problemas relacionados con los nmeros ndice.

Existen varias cosas que pueden distorsionar los nmeros ndice:

En ocasiones, hay dificultad para hallar datos adecuados para calcular un ndice. La incomparabilidad de ndices se presenta cuando se hacen intentos para comparar un ndice con otro despus de que ha habido un cambio bsico en lo que se ha estado midiendo. La ponderacin no apropiada de factores puede distorsionar un ndice. Al desarrollar un ndice compuesto, como el IPC, debemos tomar en cuenta que los cambios en ciertas variables son ms importantes que en otras. La distorsin de los nmeros ndice tambin se puede presentar cuando se selecciona una base no apropiada. Siempre debemos considerar cmo y por qu el perodo base fue seleccionado antes de aceptar una aseveracin basada en el resultado de comparar nmeros ndice.

ndice de agregados no pesados.

No pesados quiere decir que todos los valores considerados son de igual importancia. Agregado significa que agregamos o sumamos todos los valores. La principal ventaja es su simplicidad.

Se calcula mediante la suma de todos los elementos del compuesto, para el perodo dado, y luego dividiendo este resultado entre la suma de los mismos elementos durante el perodo base.

( Q1/ Q0) x 100

Como el cociente es multiplicado por 100, tcnicamente, el ndice resultante es un porcentaje. Sin embargo, se acostumbra referirse solamente al valor y omitir el signo del porcentaje cuando se analizan nmeros ndice.

La principal desventaja de un ndice no pesado es que no le da mayor importancia o peso al cambio de precio de un producto de uso comn que el que le da a uno de uso poco comn. Un cambio sustantivo en el precio de productos de lento movimiento puede distorsionar por completo un ndice. Por esta razn, no es prctica comn utilizar un ndice simple no pesado en anlisis importantes.

Un ndice no pesado puede verse distorsionado por un cambio en unos cuantos productos, lo cual puede no ser representativo de la situacin que se est estudiando.

ndice de agregados pesados.

A menudo tenemos que asignar una importancia mayor a los cambios que se dan en algunas variables que a los que se presentan en otras cuando calculamos un ndice. Esta ponderacin nos permite incluir ms informacin, aparte del mero cambio de los precios en el tiempo. Nos permite mejorar la precisin de la estimacin. El problema est en decidir cunto peso asignar a cada una de las variables en la muestra

La frmula general para calcular un ndice de precios de agregados pesados es:

( P1Q/ P0Q) x 100

Tpicamente, la administracin utiliza la cantidad consumida de un producto como la medida de su importancia cuando se calcula un ndice de agregados pesados.

Existen tres formas de pesar un ndice:

1. Mtodo Laspeyres: utiliza las cantidades consumidas durante el perodo base, es el ms usado, debido a que requiere medidas de cantidades de nicamente un perodo. Como cada nmero ndice depende de los mismos precio y cantidad base, la administracin puede comparar el ndice de un perodo directamente con el ndice de otro. Una ventaja de este mtodo es la comparabilidad de un ndice con otro. El uso de la misma cantidad de perodo base nos permite hacer comparaciones de manera directa. Otra ventaja es que muchas medidas de cantidad de uso comn no son tabuladas cada ao. La principal desventaja es que no toma en cuenta los cambios de los patrones de consumo. 2. Mtodo de Paasche: es un proceso parecido al seguido para encontrar un ndice de Laspeyres. La diferencia consiste en que los pesos utilizados en el mtodo Paasche son las medidas de cantidad correspondientes al perodo actual. Es particularmente til porque combina los efectos de los cambios de precio y de los patrones de consumo, as, es un mejor indicador de los cambios generales de la economa que el mtodo Laspeyres. Una de las principales desventajas es la necesidad de tabular medidas de cantidad para cada perodo examinado. Cada valor de un ndice de precios Paasche es el resultado tanto de cambios en el precio como en la cantidad consumida correspondiente al perodo base. Como las medidas de cantidad utilizadas por un perodo de ndice, por lo general son diferentes de las medidas de cantidad de otro perodo de ndice, resulta imposible atribuir la diferencia entre los dos ndices solamente a cambios de precio. En consecuencia, es difcil comparar ndices de diferentes perodos con el mtodo Paasche. 3. Mtodo de agregados de peso fijo: en lugar de utilizar pesos de perodo base o de perodo actual, utiliza pesos tomados de un perodo representativo. Los pesos representativos se conocen como pesos fijos. Estos ltimos y los precios base no tienen que provenir del mismo perodo. La principal ventaja es la flexibilidad al seleccionar el precio base y el peso fijo (cantidad).

Mtodos de promedio de relativos.

Mtodo de promedio no pesado de relativos.

Como una alternativa del mtodo de agregados, podemos utilizar el mtodo de promedio de relativos.

Cuando tenemos ms de un producto (o actividad), primero encontramos el cociente del precio actual entre el precio base para cada producto y multiplicamos cada cociente obtenido por 100. Luego sumamos los porcentajes relativos resultantes y dividimos el resultado entre el nmero de productos.

[(Q1/ Q0) x 100] / n

Con el mtodo de promedio no pesado de relativos, calculamos el promedio de los cocientes de los precio para cada producto. Con el mtodo de agregados no pesados, calculamos el cociente de las sumas de los precios de cada producto. No es lo mismo que asignar a algunos productos ms peso que a otros. El mtodo de promedio de relativos convierte cada elemento a una escala relativa en la que los elementos estn representados como un porcentaje ms que como una cantidad. Debido a esto, cada uno de los elementos del compuesto se mide con respecto a una base de 100.

Mtodo de promedio pesado de relativos.

Con los mtodos de promedio pesado de relativos existen varias formas de determinar un valor pesado. Como en el mtodo de Laspeyres, podemos utilizar el valor base que encontramos multiplicando la cantidad base por el precio base. El uso del valor base producir exactamente el mismo resultado que si estuviramos calculando el ndice con el mtodo de Laspeyres. Usamos el mtodo Laspeyres cuando los datos de cantidad se obtienen con mayor facilidad.

{[(Q1/ Q0) x 100] PnQn} / PnQn

Si deseamos calcular un ndice de promedio pesado de realativos usando valores base, la ecuacin a utilizar sera:

{[(Q1/ Q0) x 100] P0Q0} / P0Q0

Cuando utilizamos valores actuales, no podemos comparar de manera directa valores de perodos diferentes, ya que tanto los precios como las cantidades pueden haber cambiado. As que por lo general utilizamos valores base o valores fijos cuando calculamos un ndice de promedio pesado de relativos.

ndices de cantidad y valor.

ndices de cantidad.

Tambin podemos utilizar nmeros ndice para describir cambios en cantidades y en valores.

En tiempos de inflacin, un ndice de cantidad proporciona una medida ms confiable de la produccin real de materias primas y bienes terminados que el correspondiente ndice de valores. De manera parecida, la produccin agrcola se mide mejor si se utiliza un ndice de cantidad, debido a que ste elimina los efectos engaosos producidos por la fluctuacin de precios. A menudo usamos un ndice de cantidad para medir mercancas que estn sujetas a una variacin considerable de precios.

Cualquiera de los mtodos analizados para determinar ndices de precios, puede utilizarse para calcular ndices de cantidad. Cuando deseamos calcular ndices de precios, usamos cantidades o valores como pesos. Ahora que queremos calcular ndices de cantidad, utilizamos precios o valores como pesos.

ndices de valor.

Un ndice de valor mide cambios generales en el valor total de alguna variable. Como el valor est determinado tanto por el precio como por la calidad, un ndice de valor realmente mide los efectos combinados de los cambios de precios y cantidad. La principal desventaja de un ndice de valor es que no hace diferencia alguna entre los efectos de estados dos componentes.

Sin embargo, un ndice de valor resulta til al medir cambios globales.

Problemas en la construccin y en el uso de nmeros ndice.

Problemas en la construccin.

1. Seleccin de un elemento para ser incluido en un compuesto: casi todos los ndices se construyen para responder a una cierta pregunta en particular. Los elementos incluidos en el compuesto dependen de la pregunta en cuestin. 2. Seleccin de los pesos apropiados: los pesos seleccionados deberan representar la importancia relativa de los diferentes elementos. Desafortunadamente, lo que resulta apropiado en un perodo puede volverse inapropiado en un lapso muy corto. 3. Seleccin de un perodo base: el perodo base seleccionado debe ser un perodo normal, preferentemente un perodo bastante reciente. Normal significa que el perodo no debe estar en un pico o en una depresin de una fluctuacin. Una tcnica para evitar la eleccin de un perodo irregular consiste en promediar los valores de varios perodos consecutivos.

Advertencia en la interpretacin de un ndice.

1. Generalizacin a partir de un ndice especfico: generalizacin de los resultados. 2. Falta de conocimiento general con respecto a ndices publicados: es la falta de conocimiento de qu es lo que miden los diferentes ndices. 3. Efecto del paso del tiempo en un ndice: los factores relacionados con un ndice tienden a cambiar con el tiempo, en particular, los pesos apropiados. A menos que se cambien los pesos de acuerdo a las circunstancias, el ndice se vuelve cada vez menos confiable. 4. Cambios de calidad: los nmeros ndice no reflejan los cambios en la calidad de los productos que miden. Si la calidad ha cambiado realmente, entonces el ndice sobrestima o subestima los cambios en los niveles de precios.

Conceptos:

ndice de agregados no pesados: utiliza todos los valores considerados y asigna igual importancia a cada uno de estos valores.

ndice de agregados pesados: utilizando todos los valores considerados, este ndice asigna pesos a estos valores.

ndice de cantidad: compara niveles de precios de un perodo a otro.

ndice simple: nmero que relaciona un solo valor de la variable con una cantidad base.

ndice compuesto: nmero que relaciona un conjunto de valores agregados de la variable, con relacin al agregado de los valores base.

Mtodo de agregados de pesos fijos: para pesar un ndice de agregados, este mtodo utiliza como pesos cantidades consumidas durante algn perodo representativo.

Mtodo de Laspeyres: para pesar un ndice de agregados, este mtodo utiliza como pesos las cantidades consumidas durante el perodo base.

Mtodo de Paasche: en el pesado de un ndice de agregados, este mtodo utiliza como pesos las cantidades consumidas durante el perodo actual.

Mtodo de promedio no pesado de relativos: para construir un nmero ndice, este mtodo encuentra el cociente del precio actual entre el precio base para cada producto, suma los porcentajes relativos resultantes y posteriormente divide el resultado entre el nmero de productos.

Mtodo de promedio pesado de relativos: para construir un nmero ndice, este mtodo pondera la importancia del valor de cada elemento del compuesto.

Nmero ndice: cociente que mide cunto cambia una variable con el tiempo, o en distintos lugares.

Porcentaje relativo: cociente de un valor actual entre un valor base cuyo resultado es multiplicado por 100.

REGISTRO DE LA INFORMACIN. MODELOS DE FICHAS.

Cuando una publicacin ingresa a una biblioteca se registra, se anotan los datos ms importantes para localizarla fcilmente.

El criterio que se sigue en las bibliotecas para clasificar libros, revistas, tesis y artculos sueltos, es el siguiente:

Por autor. Por ttulo. Por tema.

Ficha bibliogrfica.

Los ndices que se refieren a los libros se encuentran generalmente en cajones que contienen tarjetas de 3 x 5 pulgadas, ordenadas alfabticamente.

Los datos que se enumeran a continuacin son los que se registran en las fichas:

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.

Autor. Apellido, nombre Ttulo (siempre va subrayado) Subttulo (si lo hay) Traductor, prologuista, etc. (si el original se escribi en otro idioma) Edicin (si es la primera no se anota, se anota a partir de la segunda) Nmero de volumen (si cuenta con ms de uno) Lugar (donde se edit la obra) Editorial Fecha Nmero total de pginas, lminas, ilustraciones Coleccin o serie.

Los datos que corresponden a 7, 8 y 9 se conocen como pie de imprenta.

Entre parntesis rectangulares o corchetes, se anotan los datos que se deseen agregar: si contiene mapas, ilustraciones, comentarios o apreciaciones personales sobre el libro.

Cuando no aparecen algunos datos indispensables, se usan las siguientes abreviaturas:

[et. al]: cuando son varios autores se anotan los datos del primero y esta abreviatura significa: y otros. [s. tr.]: sin traductor [s. l.]: sin lugar [s. f.]: sin fecha [s. e.]: sin editorial [s. p. i.]: sin pie de imprenta.

Las anotaciones particulares, hechas por el investigador para su empleo personal, se encierran tambin entre corchetes.

En algunas fichas se incluye tambin un breve resumen del libro y/o un ndice de contenido. A este fichero se recurre cuando se conoce el nombre del autor del libro que se desea consultar.

Otras veces se recurre a ficheros clasificados por temas y por ttulo, porque se desconoce el nombre del autor. En ocasiones, cuando no hay referencias en el fichero sobre el concepto investigado, se deben buscar sinnimos o temas afines.

Ficha de diarios y revistas.

En las bibliotecas existen generalmente dos formas de clasificar las revistas: por tema y por artculo.

La clasificacin por temas es muy general y se refiere principalmente a disciplinas tan amplias como la psicologa, la sociologa, la economa, la antropologa, etc.

A la clasificacin que con mayor frecuencia se recurre en relacin con las revistas, es a la clasificacin por ttulos, ya que es la manera ms prctica de hacerlo.

Una ficha, cuando el dato se toma de diarios y revistas, debe contener:

1. 2. 3. 4. 5. 6. 7. 8.

Nombre del autor Ttulo y subttulo del artculo (entre comillas) Ttulo y subttulo del peridico o revista (subrayado). Institucin que la publica Nmero del columen, ao, tomo (con nmeros romanos) Nmero del fascculo (con nmeros arbigos) Fecha Nmero de pgina o pginas que ocupa el artculo o dato Informacin (dato). Cuando aparece sin datos de lo que trata el artculo, se le conoce como ficha de artculo.

En ocasiones se recorta el artculo o parte de l. En estos casos, los datos de esta ficha se anotan en la hoja o tarjeta en donde se peg el recorte.

Ficha de tesis.

Las tesis se encuentran archivadas en un fichero especial y estn clasificadas de la misma manera que los libros, es decir, tanto por tema como por autor.

Los datos que deben contener son:

1. 2. 3. 4. 5. 6. 7.

Autor Ttulo Tesis (se menciona al grado que se aspira con ella) Lugar (colegio o institucin donde se presenta) Editor (si lo hay) Fecha Nmero de pginas (cuando el texto est escrito por un solo lado de la hoja, se usar la abreviatura h, en lugar de p).

Ficha de publicacin oficial.

1. 2. 3. 4. 5. 6.

Pas Dependencia Ao Ttulo (poca que comprende el trabajo, ensayo, memoria, etc.) Editorial (o los talleres donde se imprimi) Nmero de pginas (si la dependencia que la publica no es la responsable del contenido, el registro se iniciar con el nombre del autor.

Ficha de textos jurdicos.

1. Territorio en donde se aplican 2. Referencia al tipo de normas de que trata 3. Nombre de la ley o decreto (subrayado)

4. Editor o talleres donde se imprimi (o el conducto por el cual se dio a conocer) 5. Fecha 6. Nmero de pginas.

Ficha de documentos nacionales.

1. 2. 3. 4. 5. 6. 7. 8. 9.

Ttulo (o asunto de que trata) Lugar Fecha Archivo Legajo Foja Dems especificaciones Nmero de pginas Caractersticas de inters particular, si el investigador juzga indispensable registrarlas)

Ficha de documentos internacionales.

1. 2. 3. 4. 5. 6.

rgano responsable Ttulo (o asunto) Nmero, clave o codificacin Lugar donde se public Editor (o conducto por el que se da a conocer Fecha

Ficha de registro de obras de recopilacin de constituciones o leyes.

1. 2. 3. 4. 5. 6. 7.

Nombre del compilador o editor Referencia al tipo de norma o documento (subrayado) Nmero de volumen (con nmeros romanos) Lugar Editor Fecha Nmero de pginas en donde est comprendido.

Ficha de registro de pactos, acuerdos o tratados internacionales.

1. 2. 3. 4. 5. 6. 7.

Pas u organismo (con maysculas) Tipo de norma o documento Autor del prlogo, comentario o nota Lugar Editor Fecha Nmero de pginas en donde est comprendido.

Ficha de artculos contenidos en libros o enciclopedias.

1. 2. 3. 4. 5. 6.

Autor del captulo o artculo Ttulo del captulo o artculo (entre comillas) Pginas en que est comprendido Autor de la obra que contiene el artculo o captulo Ttulo de la obra (subrayado) Dems datos de la ficha bibliogrfica de la obra.

Ficha de campo.

1. 2. 3. 4. 5. 6. 7.

Tema de investigacin Nombre del investigador Institucin Lugar Fecha Hora Datos de la fuente (edad, sexo, ocupacin).

Ficha de noticiario.

1. 2. 3. 4. 5. 6.

Agencia noticiosa / comentarista Nombre del noticiario Nmero / horario Estacin / canal / cine Lugar Fecha

7. Noticia o comentario

Ficha de institucin.

1. 2. 3. 4. 1. 2. 3. 4.

Nombre de la institucin (subrayado) Institucin de la que forma parte Objetivos que tiene en su funcin Ubicacin Direccin Lugar que ocupa en la disciplina a la que pertenece o practica

Funciones y servicios Informacin que puede proporcionar Conexin, nexos, relacin con otras fuentes similares Forma de acceso (procedimientos para obtener sus servicios, o persona u oficina por cuyo conducto se pueden obtener sus servicios). 5. Publicaciones que emite 6. Otros datos importantes.

Ficha para registrar informacin que aparece en mapas, dibujos, fotografas, etc.

1. 2. 3. 4.

Nombre (de lo que se trata, subrayado) Autor Fuente (lugar, libro, revista, museo, etc., dnde est) Descripcin del objeto (colores, medidas, material de que est hecho, datos indispensables para tener nocin de cmo es) 5. Contenido (descripcin de lo que se ilustra o representa) 6. Otros datos que interesen al investigador (fecha, sala, en el caso de museos, exposicin, etc.)

FICHA DE TRABAJO.

Es aquella donde se registran los datos que interesan al investigador.

Cuando el dato est contenido en ms de una tarjeta, las tarjetas que ocupe constituirn una sola ficha. En estos casos, conviene marcar las tarjetas con el nmero de ficha y una letra (ej.: 5a y 5b).

Una ficha debe contener un solo dato, ste puede ser un solo detalle (una fecha, un nombre, un acontecimiento, etc.) o estar formado por ms informacin (una carta, la descripcin de un hecho, una biografa, etc.). Para saber qu informacin debe registrarse en una ficha de trabajo, en el momento de hacer la anotacin debe pensarse si esa informacin va a aparecer en un solo lugar o hay detalles que se utilizarn en otros lugares del escrito; en el primer caso se tratar de una ficha; en el segundo, ser necesario hacer una ficha por cada informacin que aparecer en distintas partes del escrito.

El regesto es el asunto, tema o ttulo del contenido de la ficha de trabajo. Debe ser breve y reflejar fielmente la informacin anotada.

La informacin (dato) puede registrarse textualmente o resumirse.

Datos fundamentales:

1. 2. 3. 4.

Autor Ttulo (entre comillas) Nmero de pgina (s) donde aparece el dato Regesto (asunto, tema; va subrayado)

Datos complementarios: 1. Fecha en que se recogi el dato 2. Razn o motivo por el que se recab la informacin.

Ficha de transcripcin textual.

Como su nombre lo indica, es aquella a la que se traslada ntegramente el texto tomado de la fuente, por lo que esta informacin siempre ir entre comillas.

Ficha de sntesis.

Es la que se utiliza para consignar, en pocas palabras, el extracto del texto consultado. Se debe tener cuidado de no omitir o tergiversar el contenido

No es necesario utilizar una tarjeta especial para los comentarios personales acerca de la fuente, puesto que es conveniente incluirlos en la misma ficha que la registra. Se escriben entre corchetes.

Fichas metodolgicas.

Se refieren a aquellos puntos obtenidos de las lecturas, concretamente relacionados con notas metodolgicas, es decir, con qu sujetos se hizo la investigacin, cmo se eligieron stos, qu hiptesis se emplearon, cmo se analizaron los datos, algn instrumento original que se utiliz, alguna cuestin interesante que se investig, es decir, con las cuestiones operativas del estudio. El origen de estas fichas, al igual que en los casos anteriores, debe identificarse utilizando la abreviacin de la fuente original y el nmero de pgina.

BIBLIOGRAFA: TENORIO BAHENA, JORGE, Tcnicas de investigacin documental, 3ra. edicin, Mxico, Ed.Mc. Graw Hill, 1998 PICK, Susan (et. al.), Cmo investigar en ciencias sociales, 3ra edicin, Mxico, Editorial Trillas, 1998.

MARCO TERICO

En el planteamiento de una investigacin es necesario hacer explcito aquello que nos proponemos conocer, por eso es imprescindible definir el problema que se va a investigar.

Del planteamiento del problema surgen, por lo tanto, los objetivos internos y externos de la investigacin.

Ningn hecho o fenmeno de la realidad puede abordarse sin una adecuada conceptualizacin. El investigador que se plantea un problema, no lo hace en el vaco, como si no tuviese la menor idea del mismo, sino que siempre parte de algunas ideas o informaciones previas, de algunos referentes tericos y conceptuales, por ms que stos no tengan todava un carcter preciso y sistemtico.

El marco terico, marco referencial o marco conceptual tiene el propsito de dar a la investigacin un sistema coordinado y coherente de conceptos y proposiciones que permitan abordar el problema. De ste depender el resultado del trabajo. Significa poner en claro para el propio investigador sus postulados y supuestos, asumir los frutos de investigaciones anteriores y esforzarse por orientar el trabajo de un modo coherente.

El fin que tiene el marco terico es el de situar a nuestro problema dentro de un conjunto de conocimientos, que permita orientar nuestra bsqueda y nos ofrezca una conceptualizacin adecuada de los trminos que utilizaremos.

El punto de partida para construir un marco de referencia lo constituye nuestro conocimiento previo de los fenmenos que abordamos, as como las enseanzas que extraigamos del trabajo de revisin bibliogrfica que obligatoriamente tendremos que hacer.

Veamos un ejemplo... Si deseamos conocer las causas de la delincuencia juvenil, ser conveniente aproximarnos al tema desde varios aspectos: desde el plano psicolgico, psicosocial, econmico, legal, etc. Tambin ser necesario esbozar la concepcin que tenemos de sociedad y de delicuencia juvenil (el fenmeno en estudio), porque nuestra comprensin del fenmeno variar si partimos de apreciarlo como una conducta disfuncional (por ejemplo) que afecta a individuos impropiamente integrados a sus grupos de referencia o, por el contrario, como una expresin de una contracultura que se origina en una crisis de valores de la sociedad existente.

En muchos trabajos de investigacin no se presenta una seccin aparte denominada "marco terico", sino que se exponen sus caractersticas dentro de lo que se denomina "revisin bibliogrfica" o "antecedentes".

En otras ocasiones, cuando se trata de una investigacin donde el marco referencial se reduce a algunas pocas proposiciones, stas pueden insertarse al comienzo del trabajo, sin merecer una aclaracin mayor. Es el caso de estudios aplicados o de investigaciones que buscan extender conceptos bien conocidos o nuevos estudios.

En sntesis, el marco terico responde a la pregunta: qu antecedentes existen? Por ende, el marco terico tiene como objeto dar a la investigacin un sistema coordinado y coherente de conceptos, proposiciones y postulados, que permita obtener una visin completa del sistema terico, sobre el conocimiento cientfico, que se tiene acerca del tema. La conclusin del marco terico debe ser que existe un problema cientfico y se es el que los investigadores van a abordar.

Es ac donde se realiza la descripcin y anlisis de las investigaciones previas o de los antecedentes tericos que llevan al planteamiento del problema.

En general, se podra afirmar que el marco terico tiene como funciones:

Orientar hacia la organizacin de datos y hechos significativos para descubrir las relaciones de un problema con las teoras ya existentes. Evitar que el investigador aborde temticas que, dado el estado del conocimiento, ya han sido investigadas o carecen de importancia cientfica. Guiar en la seleccin de los factores y variables que sern estudiadas en la investigacin, as como sus estrategias de medicin, su validez y confiabilidad. Prevenir sobre los posibles factores de confusin o variables extraas que potencialmente podran generar sesgos no deseados.

Recordar!!! No puede haber un marco terico que no tenga relacin con el problema.

Cmo se debe leer para formular un marco terico.

Una vez que se ha seleccionado el tema y se ha establecido el problema, se debe realizar una lectura sistemtica. Qu quiere decir esto? La sistematizacin se refiere fundamentalmente a la necesidad de leer, a fin de desarrollar el marco terico de la investigacin, teniendo en cuenta el problema que se va a investigar.

Esto tiene tres razones:

Para poder concretar el marco terico. Para que sea relevante el tema de nuestra investigacin. Para ahorrar tiempo e incrementar nuestra eficiencia.

Si nos dedicamos a hacer referencia a ciertos artculos, o a consultar libros como si estuviramos leyendo por placer, lo ms probable es que obtengamos resmenes muy extensos que comprendan la mayora de los puntos de la lectura en cuestin o, por el contrario, pequeos resmenes irrelevantes o ininteligibles.

Qu hacer para evitar esto? La primera regla que debemos aprender es tener siempre presente el problema que se va a investigar. As, si el libro que estamos consultando se refiere en general a la "toma de decisiones", y nuestro estudio es "la toma de riesgos", nos interesarn nicamente aquellos captulos, fragmentos o frases relacionados con estos ltimos.

Otra sugerencia importante es leer con sentido crtico, tanto para obtener aquella informacin importante para nuestra investigacin, como para aprender de los errores tericos o metodolgicos de otros autores. De este modo, evitaremos tener que descartar material que nos pareci importante durante su lectura, pero que ms tarde consideramos repetitivo o irrelevante.

Por supuesto, existen diferencias obvias entre los temas de investigacin que hacen ms o menos importante esta parte de la investigacin, o que la convierten en una tarea fcil o dificultosa. En una investigacin donde el objetivo fundamental es, por ejemplo, determinar el grado de adaptacin de una especie Z a una zona ms desrtica que la de origen, los problemas del marco terico pueden ser resueltos con bastante simplicidad. En cambio, estos problemas pueden ser esenciales y habr que dedicarles el mayor esfuerzo intelectual y tiempo a un estudio que intentase determinar los valores que predominan en el sistema educativo.

Por ello, es recomendable que el investigador, al comenzar a estudiar su tema, trate de poner al da sus conocimientos por medio de una sistemtica y amplia consulta bibliogrfica. En general, se recurre a alguno de los siguientes lugares:

Una biblioteca (privada o pblica) Una librera Una hemeroteca Redes informticas.

La recapitulacin no debe ser pasiva, ser conveniente formular redes esquemticas, comparar puntos de vista, establecer anlisis y sntesis, confeccionar fichas.

Integracin del material.

Una vez terminadas nuestras lecturas, as como la elaboracin y clasificacin de las fichas, estaremos en posicin de elaborar nuestro marco terico, que se basar en la integracin de las fichas.

El orden que llevar la integracin estar determinado por el objetivo del marco terico. Si, por ejemplo, es de tipo histrico, recomendaramos un orden cronolgico de las teoras y/o de los hallazgos empricos. Si la investigacin se relaciona con una serie de variables y tenemos informacin de teora, as como de estudios previos de cada una de esas variables y de la relacin entre ellas, sera conveniente delimitar secciones que abarcaran cada uno de los aspectos relevantes, a fin de integrar aquellos datos pertinentes a nuestro estudio.

Es en esta fase de la investigacin donde la identificacin de las fichas nos permitir hacer referencia a stas para poder extender o aclarar algn punto. Adems, la correcta identificacin de las fichas y del tema a que se refieren, nos permitir reunir todas las tarjetas que se relacionan con un mismo tema y leer cada una de stas para su integracin, en lugar de leer varias veces todas las tarjetas que fueron recopiladas.

Es fundamental en toda investigacin que el autor incorpore sus ideas, crticas y conclusiones con respecto tanto al problema como al material recopilado. Tambin es importante que se relacionen las cuestiones ms sobresalientes, yendo de lo general a lo concreto, es decir, mencionando primero generalidades del tema, hasta llegar a lo que especficamente est relacionado con nuestra investigacin.

Definicin de trminos bsicos.

Todo investigador debe hacer uso de conceptos para poder organizar sus datos y percibir las relaciones que hay entre ellos.

Un concepto es una abstraccin obtenida de la realidad y, por tanto, su finalidad es simplificar resumiendo una serie de observaciones que se pueden clasificar bajo un mismo nombre.

Algunos conceptos estn estrechamente ligados a objetos y a los hechos que representan, por eso cuando se define se busca asegurar que las personas que lleguen a una investigacin conozca<n perfectamente el significado con el que se va a utilizar el trmino o concepto a travs de toda la investigacin.

El problema que nos lleva a la definicin de conceptos es el de que muchos de los trminos que se utilizan en las ciencias sociales son tomados del lenguaje vulgar y, generalmente, el investigador los utiliza en otro sentido.

La definicin conceptual es necesaria para unir el estudio a la teora y las definiciones operacionales son esenciales para poder llevar a cabo cualquier investigacin, ya que los datos deben ser recogidos en trminos de hechos observables.

De acuerdo con la idea del realismo cientfico, los objetos de estudio existen en el mundo emprico (tangible) pero la teora pertenece al mundo conceptual del pensamiento. Si el investigador acepta esta visin, debe hacer lo posible para que existan conexiones entre estos dos mundos. Si el investigador y el lector y usuario del estudio en su forma escrita han de tener la misma nocin del objeto, son necesarias normas fijadas y no ambiguas de correspondencia para establecer el modelo terico con el objeto emprico. Estas son las definiciones de conceptos tericos que sirven de puentes entre teora y empiria.

Hay dos tipos de definiciones:

Definiciones empricas que anuncian cmo se va a observar o medir el concepto en el mundo real, o en la empiria, como se le suele llamar. Dado que la definicin explica las operaciones para la observacin, es llamada a veces definicin operacional.

No es necesario definir todas nuestros conceptos tericos directamente con definiciones empricas, que son a veces difciles de construir. En muchos casos es un sucedneo aceptable una definicin nominal, que describe el sentido del concepto usando otros conceptos que han sido ya adecuadamente definidos (emprica o nominalmente).

Si, por ejemplo, hemos definido operativamente dos variables, "distancia" medida en kms. y "duracin" medida en minutos, podemos usarlas para definir nominalmente un tercer concepto, "velocidad" = "distancia" / "duracin".

No es necesario definir continuamente palabras como "ser humano", "da" y "comprar" si son usadas en sus sentidos habituales indicados en los diccionarios corrientes. El uso de lenguaje comn y significados estndar de palabras tiene tambin la ventaja suplementaria de hacer el informe ms comprensible para el profano.

Sin embargo, cada campo de la ciencia tiene sus conceptos tericos especiales y para nombrarlos se necesitan algunas palabras especiales. A veces las palabras del lenguaje estndar han sido adoptadas para uso cientfico y han adquirido un significado especial, cuya definicin puede encontrarse en los manuales sobre ese campo. En ocasiones las palabras adecuadas se han tomado prestadas del griego o del latn. Y, finalmente, algunas palabras completamente nuevas se han acuado por investigadores con inventiva. En cualquier caso, cada investigador debe usar el vocabulario normal de su campo de investigacin tanto como le sea posible, para que pueda beneficiarse directamente de resultados anteriores y, a la inversa, sus nuevos resultados sean fciles de leer y as contribuyan de manera efectiva a la teora general de ese campo.

Otra regla general til dice que el investigador debe intentar operar con tan pocos conceptos y variables tericos como le sea posible. Esta recomendacin lleva el nombre de "navaja de Occam", y se remonta al siglo XIV, atribuyndose a Guillermo de Occam.

Definicin operacional.

Las definiciones operacionales constituyen un manual de instrucciones para el investigador. Deben definir las variables de las hiptesis de tal manera que stas puedan ser comprobadas.

Una definicin operacional asigna un significado a una construccin hipottica o variable, especificando las actividades u "operaciones" necesarias para medirla o manipularla.

Una definicin operacional es, esencialmente, aquella que indica que un cierto fenmeno existe, y lo hace especificando de manera precisa y, preferiblemente, en qu unidades puede ser medido dicho fenmeno. Esto es, una definicin operacional de un concepto, consiste en un enunciado de las operaciones necesarias para producir el fenmeno. Una vez que el mtodo de registro y de medicin de un fenmeno se ha especificado, se dice que ese fenmeno se ha definido operacionalmente.

Por tanto, cuando se define operacionalmente un trmino, se pretende sealar los indicadores que van a servir para la realizacin del fenmeno que nos ocupa, de ah que en lo posible se deban utilizar trminos con posibilidad de medicin.

Las definiciones operacionales pueden ser:

Medidas: cuando se observan y clasifican las variaciones. Experimentales: indican cmo manipular una variable.

Las definiciones operacionales son definiciones limitadas, cuyo propsito es permitir que el investigador se acerque a los aspectos de la realidad a estudiar. Siempre existe el peligro de fragmentar un concepto de tal forma que se aleje (o carezca de relevancia) respecto a su significado real. Pero se aproximan a aspectos significativos de la realidad conceptual.

Las definiciones operacionales establecen un puente entre los conceptos o construcciones hipotticas y las observaciones, comportamientos y actividades reales. Es decir, el cientfico o investigador opera en dos niveles: el de los conceptos e hiptesis (Nivel I) y el de la observacin y manipulacin (Nivel II). Los dos niveles estn conectados por una definicin operacional.

En las situaciones experimentales, las definiciones operacionales especifican lo que los experimentadores hacen para manipular una o ms variables independientes. Estas definiciones indican, literalmente, las operaciones involucradas.

Funcin de los conceptos o definiciones operacionales:

Ordenar la percepcin. Valorar lo percibido. Guiar la accin individual. Facilitar la comunicacin.

Requisitos de los conceptos:

Ha de existir acuerdo y continuidad en la atribucin de determinados contenidos figurativos o determinadas palabras. Deben estar definidos con precisin: contenido semntico exactamente establecido. Tienen que tener una referencia emprica: deben referirse a algo aprehensible, observable (aunque sea indirectamente).

Reglas para definir.

La funcin de la definicin consiste en presentar los rasgos principales de la estructura de un concepto para hacerlo ms preciso, delimitndolo de otros conceptos, a fin de hacer posible una exploracin sistemtica del objetivo que representa. Para ello es necesario tener en cuenta:

Validez significa que nuestra definicin se ajusta al concepto. Debe referise justamente a ese concepto y no a algo similar. Si nuestra definicin es vlida, estamos midiendo justamente lo que pretendemos medir y no otra cosa. Fiabilidad o reproductibilidad significa que si repetimos nuestra medicin o registro, el resultado ser siempre el mismo. Dar la esencia. La definicin debe dar la esencia de lo que se intenta definir, es decir, su naturaleza, sus notas caractersticas, sus lmites. Evitar tautologas. No debe directa o indirectamente contener el objetivo. Ejemplo: la economa es la ciencia que estudia los fenmenos econmicos. No debe ser circular. Es decir, se debe evitar, por ejemplo, definir al entendimiento como la capacidad de pensar y, a su vez, a la capacidad de pensar como a la actividad de entendimiento. Un crculo vicioso consiste en dos (o ms) definiciones nominales que se refieren la una a la otra mientras que los conceptos usados en estas definiciones no tienen definicin real para vincularlos a la empiria. Debe ser afirmativa. Toda definicin debe expresarse siempre en trminos afirmativos, nunca en trminos negativos. Empleo de lenguaje claro. Debe expresarse en palabras claras y asequibles, no debe contener metforas o figuras literarias. Significado preciso y unitario.

La fase de establecer "definiciones de trabajo" est estrechamente vinculada a la decisin que se tome con respecto a los instrumentos de recogida de datos que se utilizarn.

Las definiciones de trabajo son adecuadas si los instrumentos o procedimientos basados en ellas agrupan datos que constituyen indicativos satisfactorios de los conceptos que intentan representar.

Pueden modificarse las definiciones cuando el trabajo avanza? S, de hecho en investigacin cualitativa es habitual, porque la comprensin por parte del investigador de lo que est estudiando muchas veces se hace ms profunda cuando la investigacin avanza. Por otro lado, si las definiciones que han servido como base para mediciones cuantitativas se cambian despus de reunir datos empricos, se han desperdiciado los datos correspondientes a la vieja definicin que se haban reunido.

Esquema de la investigacin.

Es la estructura que permite ubicar el objeto de la investigacin en el marco que lo comprende y analizar las partes de que consta.

Se formula para:

Apreciar el objeto de estudio de forma total y en cada una de sus partes. Estructurar el escrito. Organizar el acopio de informacin. Planear nuestras actividades.

En el modelo que sigue se tratan los aspectos generales de una investigacin.

El trabajo ser ms fcil si se desglosan al mximo el objeto de estudio y los aspectos de la investigacin.

PREGUNTAS ORIENTADORAS

CONCEPTO

Qu conceptos vamos a utilizar?

1.

Definiciones. Qu criterios usaremos? Cul es nuestra concepcin del tema? Condiciones histricas que rodean el objeto de estudio. Marco histrico. Consideracin de los factores externos que tienen relacin con el objeto de la investigacin. Cul es el origen del objeto de la investigacin?

Consisten en la precisin de los conceptos, acepciones o criterios que vamos a utilizar.

Comprende el estado o hechos que prevalecen en el ambiente en que se presenta el objeto de estudio. Constituye el contexto histrico de la investigacin.

Antecedentes.

Qu evolucin ha tenido? Qu otras investigaciones similares se han hecho? Cmo es el rea que comprende?

Son el origen y el desarrollo del objeto de estudio. Conocer la evolucin de lo que estamos investigando nos facilita su comprensin.

Es la situacin del objeto de la

Ubicacin del objeto de estudio.

Cmo se manifiesta? Qu relacin guardan entre s las partes del rea? Cmo es el objeto de estudio?

investigacin en la disciplina, materia o especie que lo comprende.


Descripcin del objeto de investigacin.

Cules son sus partes? Qu relacin existe entre el objeto y su contexto? Cules y cmo son sus caractersticas intrnsecas? Qu efectos produce? En qu perodos se encuentra el fenmeno? Qu aspectos coordinados y subordinados presenta? Es la "diseccin", el anlisis, el estudio minucioso de las caractersticas, propiedades, relaciones, formas de manifestarse... el desglosamiento de lo que investigamos.

Qu circunstancias condicionan al objeto de la investigacin?

ticas. Geogrficas Econmicas Ecolgicas Tecnolgicas Tericas Culturales Religiosas Filosficas

Qu tesis existen al respecto? Qu teoras tratan de explicarlo?

1.

Marco terico.

Cul es la teora clsica? Cules son las teoras opuestas a la clsica? Cul es la teora predominante?

Es la consideracin de lo que se ha investigado (teoras, hiptesis, tesis) acerca del objeto de nuestra investigacin.

1.

Exposicin de datos.

Descripcin y/o provocacin del fenmeno. Aqu se muestra la informacin, directamente relacionada con la hiptesis, obtenida de la investigacin.

Valoracin e interpretacin del material obtenido.

Es el anlisis crtico de los datos obtenidos.

Resumen.

Es la parte del escrito que tiene como finalidad mostrar en qu se sustentan las conclusiones que se obtuvieron. Es el resultado de la investigacin.

Conclusiones y/o recomendaciones.

Bibliografa:

Tenorio Bahena, Jorge. INVESTIGACIN DOCUMENTAL. 3 ed. Mxico (1988). Ed. Mac Graw - Hill. Pick, Susan y Lpez, Ana Luisa. CMO INVESTIGAR EN CIENCIAS SOCIALES. 5 ed. Mxico (1994). Ed. Trillas S.A. Tamayo y Tamayo, Mario. EL PROCESO DE LA INVESTIGACIN CIENTFICA. 3 ed. Mxico (1998). Ed. Limusa S.A. Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen Humanitas.

EL PROBLEMA DE LA CAUSALIDAD

Una de las mayores preocupaciones de todo cientfico se refiere a las causas que originan los fenmenos. Encontrar las causas, las razones que producen determinados hechos es encontrar una explicacin para los mismos.

La relacin causal o relacin causa-efecto se presenta en las ciencias naturales. As, por ejemplo, siempre que un trozo de hierro (a presin atmosfrica) alcanza los 1.535 C, se funde, y siempre que se funde es que ha alcanzado esa temperatura.

En el rea de las ciencias humanas, los fenmenos ocurren en un marco muy complejo de variables interrelacionadas de tal modo que, al acontecer el fenmeno en estudio, no slo percibimos la presencia de una, dos o tres variables, sino de una multiplicidad de ellas, que a su vez que modifican en influencia entre s.

Muchas veces se habla del carcter histrico, irrepetible, de todos los acontecimientos humanos, pretendiendo que es imposible abstraer, a partir de ellos, leyes generales. ste es un argumento poco slido pues, en esencia, los hechos fsicos son tambin irrepetibles. Si fundimos una barra de hierro, ese hecho, en s mismo, es tambin nico, ya que podemos volver a hacer esa misma operacin con otro trozo de metal o con el mismo trozo despus de un tiempo, pero se tratar de hechos muy similares, casi idnticos, pero nunca el mismo echo.

En cada operacin en que se repite un experimento, el investigador puede regular con relativa precisin el comportamiento de muchas variables que podran intervenir: controla la presin, la composicin qumica del material que va a fundir y de la atmsfera en que se encuentra, el tamao del objeto, etc. Este tipo de control, que consiste en aislar el fenmeno de la influencia de los muchos factores que no nos interesan como posibles causas, es lo que es prcticamente imposible de realizar en el campo de lo social.

Si dijramos que las depresiones se producen cada vez que la oferta de bienes y servicios excede a la demanda en una cierta proporcin, encontraramos que esta relacin no puede adoptar la forma cerrada de un modelo causal. Si bien es cierto que ambas variables estn estrechamente ligadas dentro de una economa de libre mercado, no podemos negar que existen muchas otras influencias y circunstancias que inciden directamente: el tipo de control que puede ejercer el Estado sobre la economa, la tasa de inversin, el tipo de tecnologa empleado, factores psicosociales, polticos, etc. son variables capaces de estimular, reducir, desencadenar o impedir ese fenmeno, segn su peso relativo.

Por esto, la relacin de causa ha sido suplantada por el concepto ms abierto de determinacin. Decir que A determina a B significa tan slo expresar que ejerce una influencia, que es capaz de alterar o modificar el comportamiento de B. No diramos as que A es causa de B - por cuanto B puede estar determinado adems por muchos otros elementos -, sino que A lo determina en alguna medida que es preciso evaluar.

Decir que el subdesarrollo es la causa de los cinturones de miseria que se forman alrededor de muchas ciudades latinoamericanas, resulta una aseveracin excesivamente terminante, dado que "subdesarrollo" es una categora demasiado amplia. Proponer, en cambio, que esas reas "marginales" tienen cierta correlacin con una determinada forma de industrializacin, con migraciones interiores y con problemas de tipo cultural - por ejemplo - es introducir un enfoque ms rico y matizado del problema.

Tipos de determinacin:

Condiciones necesarias: son aquellas sin las cuales es imposible que ocurra un determinado fenmeno, aunque esto no quiere decir que cada vez que se encuentre ocurra el fenmeno. Por ejemplo, para que en un pas se produzca un golpe militar es condicin necesaria que exista un ejrcito organizado. Pero esto no quiere decir que, habiendo un ejrcito organizado, esto provoque un golpe militar. Condiciones suficientes: se refieren a circunstancias que, siempre que aparecen, desencadenan el fenmeno en estudio, aunque no es necesario que ellas estn presentes para producirlo. Por ejemplo, es condicin suficiente para producir la muerte, que se paralice durante un cierto perodo el funcionamiento del corazn, pero el deceso de una persona puede producirse por muchas otras razones. Condiciones contribuyentes: son aquellas que favorecen de una manera decisiva el suceso investigado y que generalmente suelen producirlo, aunque no alcancen un determinismo que pueda considerarse como necesario o suficiente. Por ejemplo: tanto el riego como la radiacin solar contribuyen al crecimiento de los vegetales, pero lo hacen de modo diverso segn la especie considerada. Condiciones contingentes: son circunstancias que, pudiendo favorecer la ocurrencia del hecho estudiado, se presentan slo eventualmente, pudiendo estar por completo ausentes en la mayora de los casos. El embargo petrolero decretado por los pases rabes en 1973 fue una contingencia que redujo la oferta de ese producto, promoviendo un aumento notable de los precios, pero la disminucin en la oferta de los bienes se produce normalmente por muchas otras circunstancias.

Solamente en aquellos casos en que se pueda sostener que una condicin es a la vez necesaria y suficientes, podemos decir que estamos en presencia de la causa de un hecho. Es decir, C es la causa de F cuando siempre que se presenta C, aparece F, y cada vez que ocurre F es que est presente C.

Bibliografa: Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.

LAS VARIABLES

Una vez que alcanzamos un conocimiento relativamente amplio del tema que se va a investigar, debemos dedicarnos a aislar, dentro del problema, los factores ms importantes que en l intervienen.

Por ejemplo: si se trata de un problema de comercializacin, los aspectos fundamentales que deberemos estudiar sern la oferta y la demanda, las motivaciones del consumidor, la distribucin, la publicidad y otros factores semejantes.

Gracias a estos factores, estaremos en condiciones de construir el marco terico dentro del que se inserta el fenmeno de nuestro inters.

En aquellos casos en que sea posible llegar a un grado de aislamiento de los factores involucrados en el problema, resulta til realizar un esquema de variables que nos permitir organizar mejor nuestro marco terico.

Una variable es cualquier caracterstica o cualidad de la realidad que es susceptible de asumir diferentes valores, ya sea cuantitativa o cualitativamente.

Es decir, que puede variar. Aunque para un objeto determinado pueda tener un valor fijo. Por ejemplo: una mesa; no puede ser, en s, una variable. Pero, si nos referimos a la altura de una mesa, estamos en presencia de una variable. O sea, que esa cualidad de la mesa (la altura) puede asumir diferentes valores. No quiere decir que la altura de una mesa determinada deba variar, sino que el concepto genrico "altura de una mesa" puede variar de un caso a otro.

Las variaciones puede tambin producirse para un mismo objeto, y no slo entre diferentes objetos. Por ejemplo: el caudal de un ro.

El tiempo es siempre considerado una variable.

Tambin podemos decir que una variable es todo aquello que vamos a medir, controlar y estudiar en una investigacin o estudio.

Las variables pueden ser definidas conceptual y operacionalmente.

Clases de variables:

Cualitativas. Sobre ellas no se construye una serie numrica. Por ejemplo: colores.

Cuantitativas. Admiten una escala numrica de medicin.

Todos los valores que llega a tener una variable pueden entenderse como una serie, una sucesin ms o menos ordenada de posibilidades:

Continuas. Cuando entre uno y otro valor existen infinitas posibilidades intermedias. Por ejemplo: la altura de una persona, el peso de un objeto, el rendimiento de un estudiante.

Discretas. Cuando estas posiciones intermedias carecen de sentido, pues la variable se modifica de "a saltos" entre un valor y otro, y no en forma paulatina. Por ejemplo: la cantidad de hijos que puede tener una persona, el nmero de pases que intervienen en una conferencia. Sin embargo, s tiene sentido, y se emplea usualmente, calcular promedios sobre estas variables.

Un caso particular de las variables discretas, es la variable dicotmica, que es aquella que slo admite dos posibilidades: muerto/vivo; hombre/mujer.

Otra clasificacin:

Categricas. Tienen la caracterstica de que todos los miembros de una categora se consideran iguales en lo que se refiere a esa variable. Por ejemplo: las mujeres. Medidas. Se pueden asignar numerales a las personas u objetos en base a que poseen cantidades de alguna caracterstica o propiedad. Experimentales o manipuladas. Cuando los investigadores establecen condiciones experimentales, crean o producen variables.

Variables y dimensiones.

En la prctica, muchas de las caractersticas que nos interesan estudiar no son tan simples... Resulta muy sencillo medir y comparar la variable "cantidad de hijos que posee una persona", pero nos enfrentamos con una dificultad mayor si pretendemos conocer el "rendimiento de un estudiante".

Cuando nos hallamos frente a variables complejas que resumen o integran una multiplicidad de aspectos diversos, debemos recurrir a subdividir o descomponer la variable en cualidades ms simples y fciles de medir. A estas sub - cualidades que en conjunto integran la variable se las denomina dimensiones de la misma.

Dimensin es un componente significativo de una variable, que posee una relativa autonoma.

As, el patriarcalismo de una sociedad es una sntesis de un cierto tipo de organizacin familiar, determinados valores individuales y pautas definidas de organizacin econmica.

Un ejemplo ms simple: el tamao de un objeto est determinado por su altura, largo y ancho.

Cuando hablamos de "relativa autonoma", hacemos referencia a que las dimensiones pueden presentar diferentes valores unas de otras, pero siempre dentro de ciertos lmites de congruencia. Si el largo de un objeto se modificara al variar su altura, no estaramos en presencia de dos dimensiones de una misma variable, sino frente a dos variables diferentes, una de las cuales influye sobre la otra.

Una misma cualidad puede considerarse como una variable en s o como una dimensin de una variable mayor, segn el enfoque y los propsitos que guen cada investigacin, pues se trata de definiciones de carcter instrumental que el cientfico realiza de acuerdo con la naturaleza del problema planteado.

Si nos interesa conocer y distinguir a las personas de acuerdo a su nivel socio - econmico, podemos descomponer esta variable en dos dimensiones: el nivel social y el nivel econmico. pero, si estamos estudiando el ingreso de las familias, debemos manejar el concepto "nivel econmico" como una variable en s y nos veremos en la necesidad de descomponerla en algunas de las dimensiones que la integran.

Una calidad intervienen como variable en una investigacin cuando nos es til relacionarla como un todo con otra u otras variables. En cambio, debemos tomarla slo como una dimensin cuando su sentido como cualidad aislada sea poco significante y deba agruparse con otras cualidades para poder ser relevante.

Cada una de las variables y dimensiones que hemos aislado debe ser definida con la mayor rigurosidad posible, asignndole un sentido unvoco y claro para evitar que se originen ambigedades, distorsiones e innecesarias discusiones sobre la terminologa.

Relaciones entre variables.

Luego de haber precisado los factores que intervienen en un problema, de haberlos definido y analizado hasta determinar el tipo de condicionamiento que los une, habremos obtenido un conjunto de variables relacionadas entre s de una cierta manera. Debemos entonces organizar estas relaciones observadas de modo tal que podamos construir un esquema coherente que exprese el cuadro general del problema.

Una variable independiente es aquella que, dentro de la relacin establecida, no depende de ninguna otra, aunque pudiera estar dependiente si estudiramos otro problema. Son las condiciones manipuladas por el investigador a fin de producir ciertos efectos.

Una variable dependiente es aquella cuyos valores dependen de los que asuma otra variable. Por ejemplo, si el investigador sostiene la hiptesis de que si administra una determinada droga a un grupo de nios, el grado de aprendizaje de stos se incrementar. En este caso, la variable independiente estar representada por la droga manipulada por el experimentador, y la variable dependiente ser el grado de aprendizaje de los nios.

Una variable es interviniente cuando resulta un factor que interviene entre dos variables modificando o alterando con su propio contenido las relaciones que existen entre esos dos elementos. Por ejemplo:

Variable A: alimentacin que se recibe en la infancia (variable independiente). Variable B: nivel de inteligencia posterior de la persona (variable dependiente). Variable C: nivel socio - econmico (variable interviniente que influye a A).

Conviene analizar si la variable interviniente aparece a partir de la variable independiente, es decir, es posterior a ella y con anterioridad a la variable independiente, o si acta como factor concerniente en la relacin de variables.

Es normal que una variable no slo afecte a otra ms, sino a varias simultneamente, as como que una variable dependiente sea influida por dos, tres o ms variables independientes.

Adems de estas tres posiciones bsicas que las variables pueden adoptar al relacionarse entre s, existe una cuarta posibilidad que se refiere a las dos caractersticas del universo que ejercen una influencia de tipo difuso y general sobre todo el conjunto de los hechos considerados. Las variables contextuales indican el mbito general donde se desarrollan los fenmenos que se estudian. Por ejemplo: los valores presentes en una sociedad, el tipo de estructura econmica.

La variable antecedente es la que se supone como "antecedente" de otra. Ejemplo: para realizar el aprendizaje se supone un grado mnimo de inteligencia. Por lo tanto, la variable inteligencia es antecedente de la variable aprendizaje.

Cuando existe una variable independiente no relacionada con el propsito del estudio, pero que puede presentar efectos sobre la variable dependiente, tenemos una variable extraa. Por tal

razn, un estudio bien diseado es aquel que nos asegura que el efecto sobre la variable dependiente slo puede atribuirse a la variable independiente y no a variables extraas.

Ejemplo: si deseamos evaluar el efecto de determinado mtodo de enseanza, podemos considerar que la inteligencia es una variable extraa.

Otro ejemplo: si parte de la investigacin consiste en la aplicacin de pruebas psicolgicas, y en el momento de la aplicacin hay mucho ruido o se corta la luz, estas alteraciones pueden considerarse como variables extraas.

Bibliografa: Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas. Pick, Susan y Lpez, Ana Luisa. CMO INVESTIGAR EN CIENCIAS SOCIALES. 5 ed. Mxico (1994). Ed. Trillas S.A. Tamayo y Tamayo, Mario. EL PROCESO DE LA INVESTIGACIN CIENTFICA. 3 ed. Mxico (1998). Ed. Limusa S.A.

EL DISEO DE LA INVESTIGACIN

El diseo es una estrategia general de trabajo que el investigador determina una vez que ya alcanzado suficiente claridad respecto a su problema y que orienta y esclarece las etapas que habrn de realizarse posteriormente.

As, por ejemplo, si nuestra investigacin terica nos lleva a suponer que la esquizofrenia tiene un origen orgnico, tendremos que elaborar un mtodo para poder comprobar si tal afirmacin se corresponde o no con la realidad. Definir qu pruebas de laboratorio, qu observaciones y qu datos son los pertinentes para llegar a esa comprobacin, es lo que llamamos elaborar un diseo. Es el momento metodolgico de la investigacin; en l, ya no se trata de definir qu vamos a investigar, sino cmo vamos a hacerlo.

Realizar el diseo de una investigacin significa llevar a la prctica los postulados generales del mtodo cientfico, planificando una serie de actividades sucesivas y organizadas donde se encuentran las pruebas que se han de efectuar y las tcnicas que se van a utilizar para recolectar y analizar los datos.

Tipos de diseo.

En funcin del tipo de datos que han de ser recogidos, e posible categorizar los diseos en dos grandes tipos bsicos:

1. Diseos bibliogrficos. 2. Diseos de campo: 1. Experimental. 2. Post facto. 3. Encuesta. 4. Panel. 5. Estudio de casos.

Los diseos de campo son los que se refieren a los mtodos empleados cuando los datos de inters se recogen en forma directa de la realidad, mediante el trabajo concreto del investigador y su equipo; estos datos, obtenidos directamente de la experiencia emprica, son llamados datos primarios. Son datos de primera mano, originales, producto de la investigacin en curso sin intermediacin de ninguna naturaleza.

Cuando los datos ya han sido recolectados en otras investigaciones y son conocidos mediante los informes correspondientes, nos referimos a datos secundarios, porque han sido obtenidos por otros y nos llegan elaborados y procesados de acuerdo con los fines de quienes inicialmente los obtuvieron y manipularon. Como estas informaciones proceden siempre de documentos escritos (sa es la forma en que se emiten los informes cientficos), damos a estos diseos el nombre de bibliogrficos.

Todo trabajo bibliogrfico no deja por eso de referirse a la experiencia emprica tanto como los diseos de campo, porque los datos que nosotros tomamos

como secundarios han sido datos primarios para el investigador inicial, por ms que nos lleguen como experiencias ya analizadas y sintetizadas. De modo que el contacto con los hechos subsiste, aunque se trate de un contacto indirecto.

Algunas personas sostienen la opinin de que los trabajos bibliogrficos no pueden considerarse en un sentido estricto como verdaderas investigaciones, ya que, al faltar el contacto directo entre el estudioso y su mundo emprico, lo nico que podr hacer es reelaborar conocimientos ya obtenidos sin efectuar mayores aportes al respecto. Es una visin muy estrecha de las posibilidades que ofrece el trabajo bibliogrfico, pues el investigador que desarrolla este modelo puede realmente concebir y resolver problemas nuevos. Si tomamos datos de un censo sanitario, por ejemplo, y analizamos sus resultados de acuerdo con indicadores sociales y econmicos especficos, podremos obtener un conocimiento muy rico respecto a la relacin entre esos factores; estaremos en condiciones de corroborar hiptesis de un mayor nivel de generalidad y habremos alcanzado un conocimiento sinttico, interdisciplinario de suma utilidad.

Por ltimo, es preciso anotar que los diseos de campo tampoco pueden basarse exclusivamente en datos primarios. Siempre ser necesario ubicar e integrar nuestro problema y nuestros resultados dentro de un conjunto mayor (marco terico o referencial), para cuya elaboracin es imprescindible realizar consultas o estudios bibliogrficos.

DISEOS BIBLIOGRFICOS:

El principal beneficio que el investigador obtiene mediante una invetigacin bibliogrfica es que puede cubrir una amplia gama de fenmenos, ya que no slo tiene que basarse en los cuales l mismo tiene acceso, sino que puede extenderse para abarcar una experiencia mayor. Esta ventaja se hace particularmente valiosa cuando el problema requiere de datos dispersos en el espacio, que sera imposible obtener de otra manera: un investigador no puede ir recorriendo el planeta en busca de datos de produccin o poblacin para luego hacer anlisis comparativos; pero si tiene a su alcance una bibliografa adecuada no tendr obstculos para contar con toda la informacin necesaria.

El diseo bibliogrfico tambin es indispensable cuando hacemos estudios histricos; no hay otro modo, en general, de enterarnos de los hechos pasados si no es apelando a una gran proporcin de datos secundarios.

El diseo bibliogrfico tiene una dificultad que puede llegar a ser muy significativa: si nuestras fuentes han recogido o procesado defectuosamente su material primario, ya sea por error, subjetivismo o intencionalmente, todo nuestro trabajo habr de apoyarse sobre bases falsas, sobre una serie de errores que nosotros trasladaremos y amplificaremos.

La duda sobre la calidad del material secundario est siempre presente. Para reducir este margen de incertidumbre, conviene asegurarse de las condiciones concretas en que han sido obtenidos los datos, estudiar en profundidad cada informacin para descubrir incoherencias y contradicciones, utilizar a la vez varias fuentes distintas, cotejndolas cuidadosamente y, en general, regirse por una sana dosis de escepticismo. Todos estos recursos, si los aplicamos sistemticamente y con rigor, permiten incrementar nuestro margen de confianza hasta niveles razonables.

Otra observacin metodolgica que puede hacerse con respecto a este diseo es que, debido a que es el propio investigador quien define y selecciona los datos que va a utilizar, es posible que ste tome solamente en cuenta aquellos que concuerdan con sus hiptesis iniciales. Por eso, se recomienda que cualquier bsqueda de datos secundarios se haga con sistematicidad y orden, fijando categoras claras para las fuentes de datos y utilizando todas las informaciones disponibles.

No existe un camino preestablecido para el manejo de la informacin bibliogrfica, per algunas de las tareas bsicas a realizar son:

1. Conocer y explorar todo el conjunto de fuentes que pueden resultar de utilidad. La mejor manera de tener un panorama completo respecto de las publicaciones existentes es acudir a bibliotecas y centros de documentacin. Una alternativa complementaria es consultar a expertos y especialistas que pueden tener conocimiento del material existente. Por ltimo, recordemos que todo libro o trabajo serio incluye generalmente una serie de citas, referencias bibliogrficas y listas de material consultado que facilitan nuestros propsitos. 2. Leer todas las fuentes disponibles. No es preciso leer completamente cada uno de los trabajos escritos sobre el tema, sino utilizar un tipo de

3. 4. 5.

6.

lectura discriminatoria, que nos permita detenernos en los aspectos esenciales. De acuerdo con los resultados de esta lectura, se podr ir ordenando todo el material. Recoleccin de datos. Se puede realizar mediante ficha y otros procedimientos similares. De cada fuente se extraern los aspectos concretos que parezcan relevantes para la investigacin. Elaboracin de un esquema de exposicin del informe final. Segn este equema, se ordenarn las fichas de datos. Cotejo o comparacin de fichas. Se observan los puntos de contacto y oposicin entre ellas, tratando de evaluar la confiabilidad de la informacin, para realizar sntesis parciales y comparaciones particulares. Conclusiones. Se reelaborarn nuestros puntos de vista respecto a cada parte del estudio, teniendo especial cuidado en esclarecer la problemtica que previamente nos habamso planteado en la fase inicial de la investigacin.

DISEOS DE CAMPO.

Su valor reside en que le permiten al investigador cerciorarse de las verdaderas condiciones en que se han conseguido los datos, haciendo posible su revisin o modificacin en el caso de que surjan dudas con respecto a su calidad. No obstante, presentan la limitacin de su reducido alcance: son muchos los datos que no se pueden alcanzar por esta va, ya sea por restricciones espaciales o temporales, por carencia de recursos, etc.

Los diseos de campo ms frecuentes son el experimental, post facto, encuesta, panel y estudio de casos.

Diseo experimental.

Un experimento consiste en someter al objeto de estudio a la influencia de ciertas variables, en condiciones controladas y conocidas por el investigador, para observar los resultados que cada variable produce en el objeto.

La variable a cuya influencia se somete el objeto en estudio recibe el nombre de estmulo.

Cuando a travs de un experimento se pretende llegar a la causa de un fenmeno, se procede del siguiente modo: sea Z el fenmeno en estudio, que en condiciones no experimentales se presenta frente a los factores A, B y C. Nuestra primera prueba consiste en controlar - reduciendo a un valor 0 - cada uno de estos factores, para observar qu ocurre en los restantes. As tendramos por ejemplo que, efectuando algunas pruebas especficas, se obtiene que:

A y B no producen Z B y C producen Z A y C producen Z

De estas tres pruebas efectuadas podemos inferir, al menos, que C es necesario para que se produzca Z. Si comprobramos adems que con slo el factor C, y eliminando los restantes, tambin ocurre Z, podramos afirmar que C es condicin necesaria y suficiente del hecho Z, en otras palabras, su causa.

Cuando nuestros objetos de estudio son barras de metal, molculas, virus o ratas, no tenemos prcticamente ninguna limitacin en cuanto a las posibilidades de inventar estmulos diversos. Las limitaciones de la experimentacin en el campo de las ciencias sociales hacen que este mtodo slo pueda usarse en contados casos, pues diversas consideraciones ticas y humanas impiden su realizacin.

Si quisiramos conocer los efectos que la desnutricin aguda ejerce sobre la agresividad de los grupos humanos, deberamos buscar otras formas de comprobacin ajenas al experimento, pues no podemos aplicar el estmulo "desnutricin aguda" a un conjunto humano.

Hay otra cantidad de experimentos que son tericamente posibles, pero que en la prctica ningn investigador tiene opcin de realizar, porque para modificar

ciertas variables sera necesario alterar todo el curso de la sociedad o poseer la suma del poder poltico o econmico.

No se puede, por ejemplo, suprimir el uso de automviles ni cambiar las regulaciones legales vigentes; tampoco se puede modificar la forma en que se comportan los mercados ni las costumbres existentes en una cultura.

El diseo experimental slo se utiliza en las ciencias humanas para algunos problemas de psicologa social (estudios para medir actitudes, influencia de la propaganda, tipos de liderazgo, etc.), de sociologa del trabajo ( cambio de condiciones de produccin, tipos de organizacin laboral), de tcnicas pedaggicas (nuevas formas de enseanza o modalidades de aprendizaje) y en otros casos semejantes, como el estudio de mercados, problemas clnicos de psicologa, etc.

Existen diversos patrones segn los cuales se realizan los experimentos en las ciencias socilaes:

Antes y despus con un solo grupo. El objeto en estudio queda constituido por un grupo social, generalmente reducido, previamente definido en cuanto a sus caractersticas fundamentales. Supongamos que nos interesa medir el efecto de la iluminacin sobre la productividad de los trabajadores. Para ello, tomaramos un grupo de trabajadores que estn realizando sus tareas con una iluminacin determinada y mediramos (antes del experimento) su productividad. Luego introduciramos el estmulo, en este caso una mejor iluminacin, para despus volver a medir la productividad del grupo. Este modelo de experimentacin tropieza con la dificultad de que las modificaciones que se producen en la variable medida pueden tener su origen en el estmulo, o en alguna otra variable que no hemos tenido en cuenta. Con una repeticin suficientemente grande de experimentos, sin embargo, podemos lograr resultados confiables. Solamente despus con dos grupos. Debemos construir dos grupos, que se denominan grupo experimental (destinado a recibir el estmulo) y grupo de control (que nos sirve de punto de referencia para apreciar las variaciones que se produzcan en el anterior). Como es necesario efectuar las mediciones comparando los resultados entre los dos grupos, stos deben ser, en todas las caractersticas de relevancia que sea posible controlar, lo ms semejantes posibles. Esta tarea de igualacin de los grupos se denomina homogeneizacin, y para llevarla a cabo se apela a procedimientos de muestreo. No se realizan mediciones antes

de la aplicacin del estmulo: se aplica ste solamente al grupo experimental y se mide finalmente a ambos grupos. Antes y despus con un grupo de control. Se basa en los mismos principios que el mtodo anterior, pero las mediciones se hacen antes y despus del estmulo, a ambos grupos. Esto nos previene contra los posibles defectos de la igualacin y nos permite tambin tener en cuenta la influencia de cualquier situacin que pueda originar variaciones simultneas en ambos grupos y que de otro modo no detectaramos. Siempre es preciso tener el cuenta las posibles alteraciones que pueden producirse en la conducta de los grupos cuando stos conocen que se hallan en una situacin experimental.

Los esquemas vistos anteriormente son los ms simples que se emplean; existen modelos que se denominan "antes y despus con dos grupos de control", "antes y despus con tres grupos de control", y otras variaciones sobre estos modelos bsicos. Dan lugar, por lo general, a conocimientos ms precisos y valiosos, aunque su aplicacin es muy costosa y delicada.

Experimentos post - facto.

Experimento post - facto quiere decir experimento que se realiza despus de los hechos. No se trata de un verdadero experimento, porque el investigador no controla ni regula las condiciones de prueba. Pero el procedimiento lgico de que se vale es idntico al de los experimentos propiamente dichos.

Consiste en tomar como experimentales situaciones reales que se hayan producido espontneamente, trabajando sobre ellas como si efectivamente se hubieran dado bajo nuestro control.

Si en un pas tenemos dos regiones geogrficas A y B, por ejemplo, que en cuanto a una serie de variables tienen un comportamiento similar, y ocurre un hecho en una sola de ellas, digamos la apertura de una carretera troncal, las modificaciones que se produzcan en sta y no en la otra pueden ser atribuidas a este hecho, pues ha sido el nico factor de peso que hubo en un caso y no en otro, y porque consideramos previamente que ambos sujetos en estudio

eran homogneos. Podemos atribuir un incremento del comercio o un cambio en las pautas sociales a los efectos que produce esta va de comunicacin.

Casi todo el trabajo de comparaciones histricas, sociales y culturales se basa en una lgica de este tipo. As, por ejemplo, el estudio de los procesos de desarrollo econmico hechos por diversas escuelas del pensamiento social, como el anlisis comparativo de polticas pblicas, de tratamientos teraputicos y procedimientos administrativos, estn realizados bajo este tipo de diseo.

Encuestas.

Este diseo es exclusivo de las ciencias sociales y parte de la premisa de que, si queremos conocer algo sobre el comportamiento de las personas, lo mejor, lo ms directo y simple, es preguntrselo a ellas.

Se trata de requerir informacin a un grupo socialmente significativo de personas acerca de los problemas en estudio para luego, mediante un anlisis de tipo cuantitativo, sacar las conclusiones que correspondan con los datos recogidos.

Cuando se recaba informacin a todas las personas que estn involucradas en el problema en estudio, este diseo toma el nombre de censo. Los censos, por las dificultades materiales que implican su realizacin, casi siempre son trabajos emprendidos por el Estado o por instituciones de muchos recursos. Por la cantidad de personas que se deben entrevistar, no es factible obtener informacin muy detallada, pues se convertiran en trabajos desproporcionadamente difciles de ejecutar y analizar.

En su lugar, se realizan encuestas por muestreo, en las que se escoge, por procedimientos estadsticos, una parte significativa de todo el universo que se toma como objeto a investigar. Las conclusiones que se obtienen a partir de la muestra pueden generalizarse a todo el universo con un margen de error conocido y limitado previamente.

Una encuesta es slo uno de los mtodos posibles de estudio de la realidad social, que presenta puntos a favor y en contra.

Sus principales ventajas son:

1. Su conocimiento de la realidad es primario, no mediado, y por lo tanto, menos engaoso. 2. Como es posible agrupar los datos en forma de cuadros estadsticos, se hace ms accesible la medicin de las variables. 3. Es un mtodo de trabajo relativamente econmico y rpido.

Las desventajas ms frecuentes son:

1. La encuesta recoge la visin que la gente tiene de s misma: no es lo mismo lo que la gente hace, siente o cree, que lo que la gente "dice" que hace, siente o cree. Existen algunos recursos para reducir la magnitud de este serio problema, como omitir algunas preguntas que sabemos que las personas no quieren responder, cuidar la presentacin del entrevistador, etc. 2. La encuesta relata los hechos sociales desde el punto de vista de sus actores, pero no considera las relaciones sociales interpersonales o institucionales. 3. El diseo es bsicamente esttico. Tiende a dar una imagen instantnea de un determinado problema, pero no nos indica sus tendencias. 4. El tratamiento de la informacin es estadstico. Esto puede resultar muy democrtico y til, pero casi nunca se corresponde con la realidad de los hechos sociales, donde el liderazgo y la asimetra social son la norma.

Las encuestas resultan apropiadas para estudios de tipo descriptivo, pero no tanto para los explicativos. Son adecuadas para estudios de mercado masivo y opiniones electorales, pero no tanto para el estudio de tipos de liderazgo y a los problemas que se refieren a estructuras y relaciones sociales.

El panel.

Surge como respuesta al panorama esttico que ofrecen las encuestas y pretende superar esta dificultad a travs de la repeticin de mediciones normalizadas.

Se llama panel a toda sucesin de mediciones que se hacen en condiciones regulares y que se aplica a determinar los valores de una variable, para un cierto objeto. Es una forma de presentacin secuencial de datos de cualquier tipo, que tiene la ventaja de proporcionarnos informacin acerca de sus variaciones en el tiempo.

Es esencial que las mediciones se realicen siempre bajo las mismas condiciones, empleando para todos los casos un mismo instrumento de recoleccin de datos. Esto permite la exacta comparacin de los resultados y posibilita hacer una anlisis de tendencias.

Mucha informacin econmica se presenta de esta manera, ya que carece de sentido hablar del PBI o de la tasa de inversin de un pas o una regin si no ubicamos estos datos dentro de una perspectiva histrica.

Tambin se utiliza para reflejar el crecimiento de la poblacin urbana y rural, o la aceptacin de un candidato.

Un panel es algo as como una encuesta repetida: un mismo cuestionario que se administra a una misma muestra para observar la evolucin y las modificaciones de las respuestas. Las encuestas deben realizarse en lapsos prefijados y regulares.

Una dificultad que presenta este diseo es lo que se denomina mortandad del panel, que consiste en la progresiva reduccin de la muestra por diversas causas: traslados, fatiga y otros problemas. Al reducirse el nmero de entrevistados, el error muestral aumenta progresivamente.

Otro problema es la saturacin del panel, que consiste en una actitud de rechazo progresivo por parte de los entrevistados. Despus de ser sometida varias veces a las mismas preguntas, la gente empieza a cansarse de ellas: surgen respuestas estereotipadas, de mala voluntad, hay apresuramiento para

responder y otros problemas similares que aumentan sensiblemente los errores.

Para reducir el efecto de estos fenmenos, se puede reemplazar la muestra en parte, de medicin a medicin. Para ello, debemos seleccionar un nmero determinado de sub - muestras, lo ms parecidas posibles en todos sus aspectos fundamentales. Estos reemplazos reducen la mortandad del panel y eliminan todo efecto de saturacin.

Estudios de casos.

Es el estudio profundizado y exhaustivo de uno o muy pocos objetos de investigacin, lo que permite obtener un conocimiento amplio y detallado de los mismos. Se basa en la idea de que, si estudiamos con atencin cualquier unidad de un cierto universo, estaremos en condiciones de conocer algunos aspectos generales del mismo; por lo menos, tendremos una perspectiva, una resea general que orientar una bsqueda posterior.

As, si nuestro inters es conocer la estructura y funcionamiento de las universidades, podemos partir del supuesto de que todos los objetos que pertenecen a la categora "universidad" tienen algunas caractersticas en comn, que permiten ubicarlos dentro de una categora general. Si estudiamos una universidad cualquiera podremos, entonces, reconocer esas lneas comunes o por lo menos obtener un punto de partida para ello. Lgicamente, no estaremos a cubierto de la posibilidad de que la universidad elegida sea un caso anormal dentro de su especie.

La mayor limitacin de este tipo de investigacin es la absoluta imposibilidad de generalizar o extender a todo el universo los hallazgos obtenidos. Su principal ventaja es su relativa simplicidad y economa.

La utilidad de los estudios de casos es mayor cuando se trata de investigaciones exploratorias o para las fases iniciales de una investigacin sobre temas ms complejos, para formular hiptesis o reconocer cules son las principales variables involucradas en un problema. Tambin los estudios de casos son recomendables cuando el verdadero inters del investigador se

centra en algunos pocos objetos de estudio: resulta obvio que conviene estudiar los planetas del sistema solar o los ros de una regin como casos particulares.

Para seleccionar los casos de inters conviene seguir ciertos criterios:

Buscar casos tpicos: aquellos objetos que parecen ser la mejor expresin del tipo ideal. Seleccionar casos extremos. As, podramos considerar una universidad muy antigua y otra de reciente creacin. La ventaja de utilizar casos extremos reside en que, de este modo, probablemente, podamos tener una idea de los lmites dentro de los cuales nuestras variables pueden oscilar. Tomar casos desviados o marginales: es una forma muy utilizada por la medicina y la psiquiatra. Se trata de encontrar casos atpicos o anormales para, por contraste, conocer las cualidades propias de los casos normales y las posibles causas de su desviacin.

EL DISEO CONCRETO DE LA INVESTIGACIN.

Lo importante no es conocer toda la lista de posibles diseos, sino apelar al razonamiento lgico y a la experiencia para determinar, antes de recolectar los datos, qu informacin nos proporcionar un determinado mtodo y qu relevancia y confiabilidad puede asignrsele a la misma. Por ejemplo, un estudio que se hace sobre un solo caso puede estar antecedido por toda una seccin bibliogrfica y recoger gran parte de los datos a travs de encuestas por muestreo, si el caso que se va a investigar es una institucin o comunidad que integran varios centenares de individuos; una encuesta puede ser profundizada, en algunos aspectos de primordial inters, realizando estudios de casos sobre una sub - muestra de la misma, a la vez que se podr analizar con una secuencia tipo panel; un experimento se puede repetir a intervalos sucesivos (panel), o quizs sea necesario utilizar encuestas para medir las variables de un estudio post - facto en el campo de lo social.

LA RESEA DE PROCEDIMIENTOS Y EL PROYECTO DE INVESTIGACIN.

Una vez seleccionado el diseo concreto que se va a utilizar en la investigacin, se hace necesario poner en claro las formas especficas que ste habr de adoptar, definiendo las operaciones concretas para llevarla a cabo. A esta actividad la denominamos resea de procedimientos, y para realizarla es preciso detallar:

Las variables que se deben medir y su relacin con las otras variables que intervienen. Los esquemas lgicos de comprobacin y la interpretacin que puede drseles a los diversos resultados posibles. Los pasos necesarios para llevar a cabo el diseo de la investigacin, ordenada y explcitamente. Los recursos materiales y humanos necesarios. Cualquier otro elemento de importancia para la demarcacin de tareas: cronograma, presupuesto, lista de actividades y materiales, formas de registro, etc.

La resea de procedimientos debe ser completada, para mayor claridad, con un esquema de presentacin de la investigacin , que ser previo y provisional. Este esquema tiene por objeto proporcionar una visin general de cmo va a resultar, en conjunto, nuestro trabajo, lo que nos servir de orientacin acerca de sus posibles omisiones, incoherencias y contradicciones. Debe constar, cuando existen datos que se van a procesar estadsticamente, el plan de cuadros que se presentarn y, en todos los casos, del esquema de captulos o partes que se desarrollarn en el contenido del trabajo.

Estos esquemas son tentativos y, por lo tanto, estn sujetos a una cantidad de revisiones posteriores. Lo importante no es elaborar el plan perfecto, sino poseer de antemano una gua que haga posible una actividad ms organizada.

Estas tareas pueden desarrollarse antes o despus de encarar la operacionalizacin, pero es fundamental que estn concluidas antes de abordar la recoleccin de datos, ya que de otro modo trabaremos a ciegas durante toda esta etapa.

El proyecto de investigacin es un documento que elabora el investigador para especificar las caractersticas de la indagacin que va a realizar. Generalmente va antecedido de un anteproyecto, un documento similar pero

menos preciso que se elabora al comenzar la investigacin, apenas se hayan definido sus caractersticas principales.

En un anteproyecto deben exponerse las caractersticas del problema, su justificacin, los objetivos de la investigacin y (si las hubiere) las hiptesis a verificar. En un proyecto es preciso completar mucho ms la informacin, profundizando y definiendo mejor lo tratado en el anteproyecto y agregndole lo relativo al diseo de la investigacin, as como un marco terico que haga comprensible el sentido de lo que se proyecta.
Bibliografa: Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.

EL MUESTREO

Cuando un investigador realiza en ciencias sociales un experimento, una encuesta o cualquier tipo de estudio, trata de obtener conclusiones generales acerca de una poblacin determinada. Para el estudio de ese grupo, tomar un sector, al que se conoce como muestra.

Las poblaciones que el investigador puede estudiar son muy diversas, pero generalmente se relacionan con personas. Por ejemplo, puede estudiar la opinin de las amas de casa con respecto a ciertos mtodos de planificacin familiar, la edad promedio de los alumnos de una escuela, el coeficiente intelectual promedio de los universitarios, etc.

Desde luego, es de fundamental importancia que se empiece el estudio definiendo la poblacin que se va a estudiar. Las poblaciones suelen ser muy numerosas, por lo que es difcil estudiar a todos sus miembros; adems de que esto no es posible, no es necesario. Es como si quisiramos estudiar la composicin qumica del agua de un ro y para ello tratramos de analizar todo el lquido que corre por su cauce, cuando solamente necesitamos algunas

muestras para realizar ese estudio y para llegar a conclusiones generalizables con respecto a la composicin qumica del agua a todo el ro.

En ciencias sociales, las muestras no se obtienen tan fcilmente, puesto que los eventos se relacionan siempre con personas, las cuales son mucho menos estables en cuanto a sus pautas de actividades, valores, actitudes y conductas que algunos de los fenmenos que se estudian en las ciencias naturales.

El momento metodolgico de la investigacin est constituido por la definicin y especificacin del diseo que se va a utilizar y por la tarea de operacionalizacin de variables (convertir en operativos, en manejables, a los diversos elementos que intervienen en el problema que se va a investigar).

La operacionalizacin se refiere de dos tipos de elementos:

El universo, en tanto conjunto de unidades o fuentes de datos que es preciso reducir a proporciones manejables para poderlo explorar. Las variables, en tanto conceptos abstractos a los que es preciso dar contenido concreto para poder efectuar sobre ellos las mediciones correspondientes.

La operacionalizacin del universo es la tarea de encontrar una forma de obtener informacin relevante sin necesidad de acudir a la medicin de todo el universo posible de datos. Es el aspecto cuantitativo de la operacionalizacin y, para resolverlo, tendremos que apelar a la estadstica, mediante tcnicas de muestreo. La operacionalizacin de las variables, de naturaleza cualitativa, tiene por objeto encontrar los indicadores a travs de los cuales se expresa concretamente el comportamiento de las mismas.

La relacin que existe entre la operacionalizacin y el tipo de diseo se origina en que, de acuerdo con el mtodo general que se va a utilizar (o sea, el diseo), se requerir de uno u otro tipo de datos, operacionalizar de cierta manera o de otra. Inversamente, de acuerdo con las posibilidades concretas de operacionalizar en uno u otro sentido las variables y el universo considerado, ser ms o menos adecuado un cierto tipo de diseo. Por esta razn, ambas tareas deben encararse simultneamente.

Datos y unidades.

Un dato es cada uno de los elementos de informacin que se recoge durante el desarrollo de una investigacin y en base a los cuales, convenientemente sintetizados, podrn extraerse conclusiones en relacin con el problema inicial planteado.

Cualquier informacin, por ms pequea y fragmentaria que sea, puede considerarse como un dato, siempre y cuando pueda colaborar de algn modo a esclarecer los problemas que nos planteamos en un estudio. Saber, por ejemplo, que la persona N opina que las pruebas nucleares deben ser proscritas, es un dato. Esa informacin, por s sola, carece prcticamente de valor, pues poco nos dice de las reacciones que despiertan las pruebas de armas atmicas en la gente. Pero el valor del dato reside no en su alcance individual, en lo que nos expresa por s mismo, sino en su posibilidad de ser integrado en conjuntos mayores. Cuando agrupamos muchas informaciones de carcter similar, cada dato se hace valioso dentro de una perspectiva ms amplia. As, en nuestro ejemplo, si consultamos la opinin de muchas personas, podemos llegar a enunciar que un determinado tanto por ciento de ellas estn en contra de los ensayos nucleares e integrar esa informacin, a su vez, en un estudio sobre las opiniones de determinado conglomerado social.

Las fuentes de datos pueden ser personas, situaciones o hechos que se observan directamente, o materiales bibliogrficos de diversa naturaleza. Las llamamos unidades de datos y, a su conjunto, a la suma de todas las unidades, se le da el nombre de universo o poblacin. Podramos decir que una poblacin o universo es, entonces, el conjunto de todas las cosas que concuerdan con una determinada serie de especificaciones. En general, toda investigacin puede considerarse como una bsqueda de los datos apropiados que permitan resolver ciertos problemas de conocimiento. Estos datos son obtenidos a travs de un conjunto de unidades que constituyen el universo relevante para la investigacin.

Existen universos que resultan demasiado amplios para el investigador, pues ste no tienen ni el tiempo ni los recursos para abordar el estudio de cada una de las unidades que lo componen (el conjunto de ciudadanos de un pas, la flora de una regin o las innumerables galaxias). Para resolver este inconveniente, se acude a la operacionalizacin del universo mediante la extraccin de muestras.

Universo y muestra.

Una muestra es un conjunto de unidades, una porcin del total, que nos representa la conducta del universo en su conjunto.

Una muestra, en un sentido amplio, no es ms que eso, una parte del todo que llamamos universo y que sirve para representarlo.

Sin embargo, no todas las muestras resultan tiles para llevar a cabo un trabajo de investigacin. Lo que se busca al emplear una muestra es que, observando una porcin relativamente reducida de unidades, se obtengan conclusiones semejantes a las que lograramos si estudiramos el universo total. Cuando una muestra cumple con esta condicin, es decir, cuando nos refleja en sus unidades lo que ocurre en el universo, la llamamos muestra representativa. Por lo tanto, una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones en que estn incluidas en tal poblacin. Sus conclusiones son susceptibles de ser generalizadas al conjunto del universo, aunque para ello debamos aadir un cierto margen de error en nuestras proyecciones.

Las muestras pueden ser clasificadas, en una primera divisin en probabilsticas y no probabilsticas.

En las muestras probabilsticas, la caracterstica fundamental es que todo elemento del universo tiene una determinada probabilidad de integrar la muestra, y esa probabilidad puede ser calculada matemticamente con precisin. En las muestras no probabilsticas ocurre lo contrario y el investigador no tiene idea del error que puede estar introduciendo en sus apreciaciones.

Las muestras no probabilsticas ms usadas son:

Muestra accidental. Es aquella que se obtiene sin ningn plan preconcebido; las unidades elegidas resultan producto de circunstancias

fortuitas. Si entrevistamos a los primeros 50 transentes que pasan por cierta calle o medimos la profundidad del mar a lo largo de un trayecto entre dos puntos cualesquiera, estaremos en presencia de una muestra accidental; los datos obtenidos podrn o no representar al universo en estudio. El investigador no puede saber hasta qu punto sus resultados podrn proyectarse, con confiabilidad, hacia el conjunto ms amplio que desea conocer. Muestra por cuotas. Consiste en predeterminar la cantidad de elementos de cada categora que habrn de integrar la muestra. As podemos asignar una cuota de 50 hombres y 50 mujeres a una muestra de 100 individuos, asumiendo que sa es la distribucin de la poblacin total. Por ms que esa presuncin llegue a ser vlida, no deja de existir cierta arbitrariedad en este modo de proceder, por lo que la rigurosidad estadstica de las muestras por cuotas se reduce considerablemente. Muestra intencional. Las unidades se eligen en forma arbitraria, designando a cada unidad segn caractersticas que para el investigador resulten de relevancia. Se emplea, por lo tanto, el conocimiento y la opinin personal para identificar aquellos elementos que deben ser incluidos en la muestra. Se basa, primordialmente, en la experiencia de alguien con la poblacin. Estas muestras son muy tiles y se emplean frecuentemente en los estudios de caso, por ms que la posibilidad de generalizar conclusiones a partir de ellas, sea en rigor nula. En algunas oportunidades se usan como gua o muestra tentativa para decidir cmo tomar una muestra aleatoria ms adelante.

Muestras aleatorias.

Como dijimos, en ellas cada uno de los elementos del universo tiene una probabilidad determinada y conocida de ser seleccionado. Los procedimientos ms usuales para la obtencin de muestras aleatorias son:

Azar simple. Este procedimiento se inicia confeccionando una lista de todas las unidades que configuran el universo, numerando correlativamente cada una de ellas. Luego, mediante cualquier sistema (tabla de nmeros al azar, programas de computacin), se van sorteando al azar estos nmeros hasta completar el total de unidades que deseamos que entren en la muestra. De este modo, la probabilidad que cada elemento tienen de aparecer en la muestra es exactamente la misma. Si cada uno de los elementos que integran la poblacin no tiene la misma posibilidad de ser elegido, se habla entonces de una muestra

viciada. Este mtodo nos garantiza una seleccin completamente aleatoria, pero resulta muy lento y costoso, pues nos obliga a elaborar listas completas de todas las unidades de inters, lo que a veces es sencillamente imposible. Por este motivo, slo se emplea cuando los universos son relativamente pequeos. Este mtodo no ser adecuado si, por ejemplo, queremos sacar una muestra de todas las personas analfabetas que existen en un pas. En cambio, si nuestra intencin es extraer una muestra del universo de todos los alumnos que ingresan a una universidad en un determinado ao, resultar muy adecuado. Azar sistemtico. Tambin se requiere de un listado completo de las unidades que integran el universo en estudio. Luego se efectan las siguientes operaciones:

1. Se calcula la constante K, que resulta de dividir el nmero total de unidades que componen el universo por el nmero de unidades que habrn de integrar la muestra: K = N/n Donde: N = nmero total de unidades que componen e universo. n = nmero total de unidades que integrarn la muestra. 2. Se efecta un sorteo para elegir un nmero que sea inferior o igual al valor de K. Como primera unidad para integrar la muestra se elige aquella que, en la lista general, posea idntico nmero de orden al sorteado. Si designamos con A este primer valor, la segunda unidad elegida ser la que lleve el nmero A + K, la tercera corresponder a A + 2K y as sucesivamente hasta llegar a A + (n 1)K. Supongamos un universo constituido por 2.800 elementos, del que deseamos obtener una muestra de 70 casos. Tenemos entonces: N = 2.800 n = 70 K = 2.800 / 70 = 40 Ahora, mediante cualquier procedimiento, buscamos al azar un nmero entero cuyo valor figure entre los lmites de 1 y 40. En este caso, el nmero elegido es el 32. Entonces, las unidades que pasarn a formar parte de la muestra sern las que lleven los siguientes nmeros de orden:

1 unidad 2 unidad 3 unidad .... 70 unidad 32 + 2760 32 + 40 32 + 80

32 72 112

2.792

Las ventajas y desventajas de este procedimiento son casi idnticas a la de las muestras al azar simple. Los procedimientos computacionales hacen mucho ms fcil efectuar el sorteo de las unidades y no existe el riesgo de que la muestra quede sesgada por algn tipo de regularidad que no conocemos y que est presente en el universo.

Muestras por conglomerados. Esta tcnica tiene utilidad cuando el universo que se requiere estudiar admite ser subdividido en universos menores de caractersticas similares a las del universo total. Se procede a subdividir el universo en un nmero finito de conglomerados y, entre ellos, se pasa a elegir algunos que sern los nicos que se investigarn; esta eleccin puede realizarse por el mtodo del azar simple o por el del azar sistemtico. Una vez cumplida esta etapa, puede efectuarse una segunda seleccin, dentro de cada uno de los conglomerados elegidos, para llegar a un nmero an ms reducido de unidades muestrales. La ventaja de esta tcnica es que obvia la tarea de confeccionar el listado de todas las unidades del universo. Su desventaja mayor radica en que, al efectuarse el muestreo en dos etapas, los errores muestrales de cada una se van acumulando, lo que da un error mayor que para los mtodos anteriores. La tcnica de conglomerados suele utilizarse cuando queremos extraer muestras de los habitantes de un conjunto geogrfico amplio, por ejemplo, una gran ciudad o un conjunto de pueblos, por lo que se procede a tomar cada pueblo o grupo de manzanas como un conglomerado independiente; del mismo modo, se la utiliza para conocer las reservas forestales y marinas, para estudiar las estrellas y otros casos semejantes. Muestras estratificadas. Este mtodo supone que el universo puede desagregarse en sub conjuntos menores, homogneos internamente pero heterogneos entre s. Cada uno de estos estratos se toma luego como un universo particular, de tamao ms reducido, y sobre l se seleccionan muestras segn cualquiera de los procedimientos anteriores. Por ejemplo, si quisiramos estudiar las actitudes polticas de los estudiantes de una universidad, podramos subdividir en estratos de acuerdo con el tipo de estudios que cursen, suponiendo que estas actitudes van a ser diferentes entre quienes siguen Ingeniera, Letras,

Medicina u otras carreras. Luego, efectuaramos un muestreo dentro de cada sub universo as definido para, finalmente, realizar un anlisis integrando los resultados de todas las sub muestras.

Tanto en el muestreo estratificado como en el de conglomerados, la poblacin se divide en grupos bien definidos. Usamos el muestreo estratificado cuando hay una amplia variacin entre los grupos. Usamos el muestreo por conglomerados en el caso opuesto: cuando hay una variacin considerable dentro de cada grupo, pero los grupos son esencialmente similares entre s.

Tamao de la muestra y error muestral.

Recordemos que la muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las caractersticas que definen a la poblacin de la cual fue extrada, lo cual nos indica que es representativa. Es decir, que para hacer una generalizacin exacta de una poblacin, es necesario tomar una muestra representativa. Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la muestra.

Cuando trabajamos con muestras, generalmente se presentan dos tipos de errores:

Error sistemtico. Llamado de distorsin o sesgo de la muestra, se presentan por causas ajenas a la muestra: Situaciones inadecuadas: se presentan, por ejemplo, cuando el encuestador tiene dificultades para obtener la informacin y la sustituye por la que ms fcilmente est a su alcance, que no siempre es la ms confiable. Insuficiencia en la recoleccin de datos: hay distorsin por falta de respuestas, o respuestas inadecuadas, ya sea por ignorancia o falta de datos relativos a los elementos incluidos. Distorsiones del encuestador causadas por prejuicios, inters personal o por fallas en la aplicacin de instrumentos. Errores de cobertura a causa de que no se han incluido elementos importantes y significativos para la investigacin que se realiza.

Error de muestreo o muestral. Cualquiera sea el procedimiento utilizado y la perfeccin del mtodo empleado, la muestra diferir de la poblacin. A esta diferencia se la denomina error de muestreo.

Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella el error muestral. Este error indica el porcentaje de incertidumbre, es decir, el riesgo que se corre de que la muestra elegida no sea representativa. Si trabajamos con un error calculado en 5%, ello significa que existe un 95% de probabilidades de que el conjunto muestral represente adecuadamente al universo del cual ha sido extrado. A medida que incrementamos el tamao de la muestra, el error muestral tiende a reducirse, pues la muestra va acercndose ms al tamao del universo. Del mismo modo, para una muestra determinada, su error ser menor cuanto ms pequeo sea el universo a partir del cual se la ha seleccionado. As, para un universo de 10.000 casos, una muestra de 200 unidades tendr un error mayor que una de 300; una muestra de 200 casos, por otra parte, tendr un error mayor si el universo tiene 10.000 unidades que si ste posee solamente 2.000. Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso primero determinar el porcentaje de error que estamos dispuestos a admitir. Una vez hecho esto, debern realizarse las operaciones estadsticas correspondientes para poder calcular el tamao de la muestra que nos permite situarnos dentro del margen de error aceptado.

A veces, sin embargo, el tamao de la muestra queda determinado previamente por consideraciones prcticas; en tales casos, no hay otra alternativa que aceptar el nivel de error que su magnitud acarree.

Bibliografa: Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.

RECOLECCIN DE LOS DATOS

Indicadores, tcnicas e instrumentos.

Una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la investigacin, ser necesario definir las tcnicas de recoleccin de datos para construir los instrumentos que nos permitan obtenerlos de la realidad.

Un instrumento de recoleccin de datos es cualquier recurso de que se vale el investigador para acercarse a los fenmenos y extraer de ellos informacin .

Dentro de cada instrumento pueden distinguirse dos aspectos:

La forma: se refiere a las tcnicas que utilizamos para la tarea de aproximacin a la realidad (observacin, entrevista). El contenido: queda expresado en la especificacin de los datos que necesitamos conseguir. Se concreta en una serie de tems que no son otra cosa que los indicadores que permiten medir a las variables, pero que asumen ahora la forma de preguntas, puntos a observar, elementos para registrar, etc.

El instrumento sintetiza en s toda la labor previa de investigacin: resume los aportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables y conceptos utilizados; pero tambin sintetiza el diseo concreto elegido para el trabajo.

Mediante una adecuada construccin de los instrumentos de recoleccin, la investigacin alcanza la necesaria correspondencia entre teora y hechos.

Qu ocurre si en una investigacin los instrumentos son defectuosos?

Se producirn algunas de las siguientes dificultades:

Los datos recogidos no servirn para satisfacer los interrogantes iniciales; No se podrn obtener los datos que necesitamos, Los datos vendrn falseados o distorsionados.

En estos casos, habr habido, seguramente, uno o varios errores en las etapas anteriores del proceso de investigacin. Ser necesario, entonces, volver hacia atrs y revisar las diferentes etapas realizadas, hasta alcanzar una mejor aproximacin al problema-

Datos primarios y secundarios.

Ya hemos hablado de que los datos, segn su procedencia, pueden dividirse en primarios y secundarios.

Los datos primarios son aquellos que el investigador obtiene directamente de la realidad, recolectndolos con sus propios instrumentos. Los datos secundarios, por otra parte, son registros escritos que proceden tambin de un contacto con la prctica, pero que ya han sido elegidos y procesados por otros investigadores.

Los datos primarios y secundarios no son dos clases esencialmente diferentes de informacin, sino partes de una misma secuencia: todo dato secundario ha sido primario en sus orgenes, y todo dato primario, a partir del momento en que el investigador concluye su trabajo, se convierte en dato secundario para los dems.

Tcnicas de recoleccin de datos primarios.

1. La observacin. Consiste en el uso sistemtico de nuestros sentidos orientados a la captacin de la realidad que queremos estudiar. Es una tcnica antiqusima: a travs de sus sentidos, el hombre capta la realidad que lo rodea, que luego organiza intelectualmente. A travs de innumerables observaciones sistemticamente repetidas, mayas y caldeos lograron penetrar en los secretos del movimiento de los cuerpos celestes; observando miles de casos concretos Mendel pudo formular las leyes sobre la herencia. El uso de nuestros sentidos es una fuente inagotable de datos que, tanto para la actividad cientfica como para la vida prctica, resulta de inestimable valor.

2. La entrevista. Consiste en una interaccin entre dos personas, una de las cuales - el investigador - formula determinadas preguntas relativas al tema en investigacin, mientras que la otra - el investigado - proporciona verbalmente o por escrito la informacin que le es solicitada.

Existen adems otros procedimientos de recoleccin de datos primarios, entre los que figguran el llamado cuestionario de autoaplicacin, los tests, los diagramas sociomtricos, las escalas y diferenciales semnticos, etc. sin embargo, todos tienen su origen, en ltima instancia, en las dos principales tcnicas mencionadas.

LA OBSERVACIN CIENTFICA.

La observacin puede definirse como el uso sistemtico de nuestros sentidos en la bsqueda de los datos que se necesitan para resolver un problema de investigacin.

Dicho de otro modo, observar cientficamente es percibir activamente la realidad exterior con el propsito de obtener los datos que previamente han sido definidos de inters para la investigacin. La observacin que se realiza cotidianamente, como parte de nuestra experiencia vital, no puede ser considerada como cientfica pues no est orientada hacia objetos precisos de estudio, no es sistemtica y carece de controles o de mecanismos que nos pongan a cubierto de los errores que podemos cometer cuando la realizamos.

La observacin cientfica debe seguir algunos principios bsicos:

Debe tener un propsito especfico. Debe ser planeada cuidadosa y sistemticamente. Debe llevarse, por escrito, un control cuidadoso de la misma. Debe especificarse su duracin y frecuencia. Debe seguir los principios bsicos de validez y confiabilidad.

La principal ventaja de esta tcnica en el campo de las ciencias del hombre radica en que los hechos son percibidos directamente, sin ninguna clase de intermediacin, colocndonos ante una situacin tal como sta se da naturalmente. De este modo, no se presentan las distorsiones que son usuales en las entrevistas, como la subjetividad del objeto investigado.

Otra ventaja es que la conducta se describe en el momento exacto en que est ocurriendo. Por ejemplo, si queremos hacer un estudio de las diferentes formas que existen para educar a los nios entre las tribus primitivas, observaremos las conductas de las madres hacia sus hijos y las describiramos tal como se presentan en un momento dado.

Adems, las observaciones se pueden realizar independientemente de que las personas estn dispuestas a cooperar o no, a diferencia de otros mtodos en los que s necesitamos de la cooperacin de las personas para obtener la informacin deseada.

Su principal inconveniente reside en que la presencia del observador puede provocar, por s sola, una alteracin o modificacin en la conducta de los objetos observados, destruyendo la espontaneidad de los mismos y aportando datos, por lo tanto, poco fiables. Todos los seres humanos, al saberse observados, tienden naturalmente a alterar su conducta, pues hay muchas actividades, opiniones y actitudes que podemos tener en privado, pero nunca cuando sentimos que estamos siendo objeto de una observacin. Es dificil poder observar la interaccin familiar, por ejemplo, en el momento de acostarse o levantarse.

Esta reaccin frente a la presencia de terceros debe tenerse en cuenta siempre que se pretenda utilizar la tcnica de la observacin con seres humanos. Para evitar las perturbaciones mecionadas, se han diseado dos procedimientos:

Para evitar inhibiciones o alteraciones en la conducta de los sujetos observados, se trata de pasar lo ms desapercibidos posible, actuando de tal manera que el observador no aparezca con contornos ntidos ante los observados, sino ms bien como parte del "teln de fondo" de la situacin. Si logramos esto, lograremos observaciones confiables y de buena calidad. sta es la observacin simple. La otra forma de que las personas no se sientan observadas se basa en un procedimiento inverso: el observador, en vez de pasar desapercibido, trata de integrarse a la accin de los observados, de participar en ella como si se tratara de un miembro ms del grupo. Por ello, se la denomina observacin participante.

La observacin, debido a su utilidad, es una tcnica que se puede utilizar, junto con otras, para recabar informacin; por ejemplo, la observacin se puede utilizar en un estudio exploratorio, y para el estudio final se pueden usar otras tcnicas como cuestionarios, entrevistas, etc.

Observacin simple y participante.

La observacin simple resulta til y viable cuando se trata de conocer hechos o situaciones que de algn modo tienen un cierto carcter pblico, o que por lo menos no pertenecen estrictamente a la esfera de las conductas privadas de los individuos.

Es factible mediante este procedimiento conocer hbitos de compra, situndonos estratgicamente en los puntos de ventas, relevar formas de comportamiento poltico, mediante la asistencia a actos de esa naturaleza, y conocer otros aspectos de la conducta manifiesta de las personas: hbitos de vestimenta, de concurrencia a lugares pblicos, de trato social, etc. Casi siempre sus resultados apuntan a lo ms superficial o visible de la realidad social.

La observacin simple puede adquirir tambin un carcter indirecto, si apelamos al auxilio de instrumentos capaces de registrar informacin sobre el problema. El uso de vidrios polarizados, de cintas magnetofnicas, filmadoras, cmaras de televisin y otros aparatos es de indudable valor en el estudio de la conducta humana, por la exactitud de sus registros y por la confianza que proporcionan al investigador. Es conveniente utilizar estos auxiliares siempre y cuando las circunstancias lo permitan. Por supuesto, el uso de estos medios debe plantearse de modo tal que no perturben la accin o situacin, porque de lo contrario sus efectos seran ms bien contraproducentes.

La observacin participante, por otra parte, implica la necesidad de un trabajo ms dilatado y cuidadoso, ya que el investigador debe primeramente ingresar al grupo, comunidad o institucin en estudio para, una vez all, ir realizando la doble tarea de desempear roles dentro del conjunto y de ir recogiendo los datos que desea conseguir. Por lo tanto, es preciso confundirse con las personas sobre las que recae la investigacin, sin abandonar la actitud observadora. Con esto se consigue ser testigo de los hechos "desde adentro", y el observador no slo puede percibir las formas ms exteriores de la conducta sino tambin experimentar en carne propia las actitudes y valores que se relacionan con el comportamiento en estudio. Esta informacin resulta, por lo general, ms confiable que la que se obtiene por medio de entrevistas, ya que los hechos se observan a medida que se producen y tal como se producen.

La observacin participante puede llamarse natural cuando el investigador pertenece, de hecho, al conjunto humano que investiga. Si un estudiante quiere hacer una investigacin sobre estudiantes, prcticamente no necesita ningn esfuerzo para lograr su cometido, pues ya es estudiante y conoce el lenguaje, los modos de hacer y de comportarse del grupo que investiga.

La observacin participante, en cambio, se denomina artificial cuando la integracin del observador al grupo se hace con el objeto deliberado de desarrollar un trabajo de investigacin. Cuando la distancia social entre observador y observado es poca, la adecuacin no es difcil.

La observacin participante puede variar desde una afiliacin total al grupo hasta una participacin limitada y condicionada, tanto en cuanto al tiempo como en cuanto a las funciones asumidas por el observador. No es necesario que ste lleve a cabo exactamente las mismas actividades que realizan los dems miembros del grupo; en lugar de ello, puede buscarse algn papel que sea aceptable dentro de la comunidad y que el observador pueda desempear razonablemente bien. En todos los casos, es importante que no se divulgue la verdadera finalidad de su participacin y que cuide todos los detalles de su aspecto personal, de sus gestos y ademanes, de las palabras y opiniones que expresa, para no aparecer como un participante anmalo, porque esto puede generar hacia l una actitud de desconfianza o un trato atpico, bloqueando la informacin que recibe y llegando hasta a distorsionar las actividades que el grupo normalmente realiza.

En cuanto a las desventajas de la observacin participante, debemos mencionar que el excesivo compromiso que adopta el investigador frente al grupo puede llegar a provocar una identificacin tan intensa que altere su objetividad y distorsione su percepcin; que acepte, dentro del grupo investigado, una sola de las posiciones posibles; y los enormes costos que pueden estar asociados a trabajos de tan larga duracin.

En la prctica, es conveniente efectuar las tareas de observacin en equipo, para tener una mayor cobertura de los sucesos y para evitar los siempre posibles errores de percepcin. Los datos pueden ser as confrontados o cotejados luego de su obtencin par enmendar errores o superar los vacos que puedan existir. Cuando los sucesos de inters se dan dentro de colectividades pequeas o muy sensibles, es preferible reducir el nmero de observadores, pues una presencia colectiva puede causar ms daos que beneficios.

Debemos distinguir tambin entre observaciones de situaciones producidas espontneamente, en la misma vida social, de las que se llevan a cabo en condiciones controladas, experimentales, ya preparadas.

Registro y formalizacin de la observacin.

La tarea de observar no es una mera percepcin pasiva de hechos, situaciones o cosas...

Hablbamos de una percepcin activa, lo cual significa seleccionar, organizar y relacionar los datos referentes a nuestro problema. No todo lo que aparece en el campo del observador tiene importancia y, si la tiene, no siempre en el mismo grado; no todos los datos se refieren a las mismas variables o indicadores y es preciso estar alerta para discriminar adecuadamente todo este conjunto posible de informaciones.

Resulta indispensable registrar toda observacin que se haga, para poder organizar luego lo percibido en un conjunto coherente. Los medios ms comnmente utilizados son: cuadernos de campo, diarios, cuadros de trabajo, grficos y mapas.

El problema del registro puede llegar a ser sumamente delicado cuando se trata de la observacin de fenmenos de tipo social. En muchas circunstancias es prcticamente imposible tomar notas durante el transcurso de la observacin, pues ello originara sospechas y recelo. En situaciones extremas, no habr ms remedio que confiar en la memoria, con todas las limitaciones que esto supone. Este inconveniente se allana cuando los observadores son varios, ya que pueden redactar independientemente sus informes para luego compararlos entre s, completando y depurando los datos obtenidos.

En cuanto a los datos para registrar, es posible adoptar diversas posiciones. Puede actuarse con suma flexibilidad, recogiendo slo aquellos datos que van apareciendo, anotando las impresiones generales que causan los sucesos, de una manera espontnea y poco organizada. Se trata de una observacin no estructurado o no formalizada, que ofrece las ventajas de su gran capacidad de adaptacin frente a sucesos inesperados y de no pasar por alto ningn aspecto importante que pueda producirse.

Este tipo de observacin generalmente se lleva a cabo en un estudio piloto, cuando no se conoce muy bien la muestra que se va a estudiar.

Cuando establecemos de antemano una pauta de observacin explcita en que se detalla qu datos habremos de recoger, llamamos a la observacin estructurada o formalizada. Aqu la ventaja principal es que recogemos datos que pueden cuantificarse ms fcilmente, debido a su homogeneidad, y que podemos tener la certeza de no haber olvidado registrar ninguno de los aspectos principales del problema en estudio. Su desventaja radica en su poca flexibilidad frente a circunstancias no previstas pero que pueden llegar a ser interesantes o importantes para la investigacin.

La observacin estructurada se lleva a cabo cuando se pretende probar una hiptesis, o cuando se quiere hacer una descripcin sistemtica de un fenmeno; es decir, cuando estamos realizando un estudio o investigacin en el que sabemos exactamente lo que vamos a investigar.

Por ejemplo, si vamos a observar el grado de agresividad de un nio mediante la frecuencia con que se presenta la conducta, en sus diferentes grados, primero definiremos qu queremos decir con conducta agresiva y cules son sus manifestaciones:

Identificacin del nio: (se puede dar su nombre, o hacer referencia a alguna caracterstica fsica o a algn nmero que permita identificarlo).

1 Golpe a un nio cerca de l.

Golpe a un nio que estaba lejos de l.

Le dijo palabras insultantes a un nio cerca de l.

Le dijo palabras insultantes a un nio que estaba lejos de l.

Tambin pueden realizarse observaciones semiestructuradas, detallando ms o menos la pauta de observacin segn las necesidades y posibilidades.

LA ENTREVISTA.

La entrevista es una forma especfica de interaccin social que tiene por objeto recolectar datos para una indagacin.

El investigador formula preguntas a las personas capaces de aportarle datos de inters, estableciendo un dilogo, donde una de las partes busca recoger informaciones y la otra es la fuente de esas informaciones.

La ventaja esencial de la entrevista reside en que son los mismos actores sociales quienes proporcionan los datos relativos a sus conductas, opiniones, deseos, actitudes y expectativas. Nadie mejor que la misma persona involucrada para hablarnos acerca de aquello que piensa y siente, de lo que ha experimentado o piensa hacer.

Pero existe un importante inconveniente que limita sus alcances. Cualquier persona entrevistada podr hablarnos de aquello que le preguntemos pero siempre nos dar la imagen que tiene de las cosas, lo que cree que son, a travs de su carga subjetiva de intereses,

prejuicios y estereotipos. La propia imagen que el entrevistado tiene de s mismo podr ser radicalmente falsa y, en todo caso, estar siempre idealizada, distorsionada, mejorada o retocada.

Este problema nos obliga a dejar fuera de esta tcnica a problemas y temas que son mejor explorados por medio de otros procedimientos. Por otra parte, nos obliga a utilizar, a veces, caminos indirectos, mediante preguntas que alcancen nuestro objetivo elpticamente, utilizando rodeos. Es clsico el ejemplo de que las personas nunca contestan la verdad respecto de sus ingresos personales en dinero, ya sea porque los disminuyen (ante el temor de estar frente a algn inspector de impuestos), o porque los aumentan (con fines de ostentacin social o para reforzar su autoestima).

Para que una entrevista tenga xito, es preciso prestar atencin a una serie de factores: es importante que la apariencia exterior del entrevistador resulte adecuada al medio social donde habr de formular sus preguntas. El entrevistador habr de ser una persona de por lo menos una cultura media, que comprenda el valor y la importancia de cada dato recogido y la funcin que su trabajo desempea en el conjunto de la investigacin. Tendr que ser mentalmente gil, no tener prejuicios marcados frente a ninguna categora de personas y, sobre todo, ser capaz de dejar hablar libremente a los dems, eliminando por completo todo intento de convencerlos, apresurarlos, o agredirlos con sus opiniones. La entrevista habr de realizarse a las horas ms apropiadas para las personas que responden, teniendo en cuenta que su posible duracin no afecte la confiabilidad de los datos.

Lo que vulgarmente se llama entrevista es una tcnica que en realidad se denomina entrevista no estructurada, y lo que suele llamarse encuesta es igual a lo que denominamos, en metodologa, entrevista estructurada.

Las entrevistas ms estructuradas sern aquellas que predeterminen en una mayor medida las respuestas por obtener, que fijan de antemano sus elementos con ms rigidez, mientras que las entrevistas informales sern las que transcurran de un modo ms espontneo, libre, sin sujetarse a ningn canon establecido.

Entrevistas no estructuradas:

Una entrevista no estructurada o no formalizada es aquella en que existe un margen ms o menos grande de libertad para formular las preguntas y las respuestas. No se guan por un cuestionario o modelo rgido.

Entrevista formal: Es la modalidad menos estructurada posible de entrevista, ya que se reduce a una simple conservacin sobre el tema en estudio. Lo importante no es definir los lmites de lo tratado ni ceirse a algn esquema previo, sino "hacer hablar" al

entrevistado, de modo de obtener un panorama de los problemas ms salientes, de los mecanismos lgicos y mentales del respondente, de los temas que para l resultan de importancia.

Es de gran utilidad en estudios exploratorios y recomendable cuando se trata de abordar realidades poco conocidas por el investigador. Tambin suele utilizarse en las fases iniciales aproximativas - de investigaciones de cualquier naturaleza, recurriendo a informantes claves que pueden ser expertos sobre el tema en estudio, lderes formales o informales, personalidades destacadas o cualquier persona que posea informacin para la investigacin. Lo ms importante es dar al respondente la sensacin clara y definida de que puede hablar libremente, alentndolo y estimulndolo para que lo haga y cuidando de no influirlo demasiado con nuestras actitudes o las palabras que decimos. Entrevista focalizada: Es prcticamente tan libre y espontnea como la anterior, pero tiene la particularidad de concentrarse en un nico tema. El entrevistador deja hablar sin restricciones al entrevistado, proponindole apenas algunas orientaciones bsicas pero, cuando ste se desva del tema original, el entrevistador vuelve a centrar la conversacin sobre el primer asunto.

Se emplea normalmente con el objeto de explorar a fondo alguna experiencia vivida por el entrevistado o cuando nuestros informantes son testigos presenciales de hechos de inters o de acontecimientos histricos. Requiere de gran habilidad en su desarrollo, para evitar tanto la dispersin temtica como caer en formas ms estructuradas de interrogacin. Entrevista por pautas o guas: Se guan por una lista de puntos que se van explorando en el curso de la entrevista. Los temas deben guardar una cierta relacin entre s. El entrevistador hace muy pocas preguntas directas, y deja hablar al respondente siempre que vaya tocando alguno de los temas sealados en la pauta o gua.

Se usan en situaciones parecidas a las anteriores y cuando se presentan casos en que los sujetos investigados prefieren ms un desarrollo flexible que uno rgido, por sus propias actitudes culturales o necesidades. Todas estas formas de entrevistas (que tienen en comn su poca formalizacin) poseen la ventaja de permitir un dilogo ms profundo y rico, de presentar los hechos en toda su complejidad, captando no slo las respuestas a los temas elegidos sino tambin las actitudes, valores y formas de pensar de los entrevistados.

Su principal inconveniente radica en que es poco prctico sistematizar un gran nmero de entrevistas de este tipo, organizndolas estadsticamente, pues pueden tener muy pocos puntos de contacto entre s. Otra dificultad es su costo, pues involucran la presencia de personal altamente especializado durante tiempos relativamente largos.

Los problemas de registro pueden ser importantes, pues existe un gran nmero de palabras que es casi imposible de registrar en su totalidad. Pueden utilizarse grabadores, aunque es preciso determinar previamente si la presencia de estos aparatos cohibe o no a los informantes.

Entrevistas formalizadas:

Se desarrollar en base a un listado fijo de preguntas cuyo orden y redaccin permanece invariable. Comnmente se administran a un gran nmero de entrevistados para su posterior tratamiento estadstico.

Entre sus principales ventajas, podemos mencionar su rapidez y el hecho de que pueden ser llevadas a cabo por personas con mediana preparacin, lo cual redunda en su bajo costo. Otra ventaja es su posibilidad de procesamiento matemtico.

Su mayor desventaja radica en que reducen grandemente el campo de informacin, limitando los datos a los que surgen de una lista taxativa de preguntas.

Esta lista de preguntas, que es el instrumento concreto de recoleccin empleado en este caso, recibe el nombre de cuestionario y puede ser administrado sin que necesariamente medie una entrevista. Debe ser cuidadosamente redactado, evitando preguntas demasiado generales, confusas o de doble sentido, y tratando de conservar un orden lo ms natural posible.

Las preguntas suelen dividirse en dos grandes tipos:

Preguntas de alternativas fijas o cerradas: Formalizan ms el cuestionario, pues en ellas slo se otorga al entrevistado la posibilidad de elegir entre un nmero limitado de respuestas posibles. Si se pregunta "cree usted en los OVNIS, s o no?", estamos realizando una pregunta cerrada. No importa la cantidad de alternativas ofrecidas, si el respondente no puede elegir una respuesta que est fuera de la lista, la pregunta se considera cerrada. Hay que tener sumo cuidado en la redaccin de estas alternativas, procurando especialmente que sean exhaustivas y mutuamente excluyentes, y evitando que estimulen a responder en un sentido determinado.

Preguntas de final abierto o abiertas: Proporcionan una variedad ms amplia de respuestas. Su redaccin debe ser muy cuidadosa para evitar respuestas errneas o confusas, y para evitar que ellas predispongan al entrevistado en uno u otro sentido. Un ejemplo de pregunta abierta sera: "Qu opina usted acerca de los OVNIS?". La informacin que se obtendr ser mucho ms completa y valiosa, pero el trabajo de procesamiento de los datos tendr que ser mucho mayor.

Una vez que se redacta el conjunto de preguntas que constituyen un cuestionario, es necesario revisarlas para asegurarse de su consistencia y eliminar los posibles errores y omisiones. Casi siempre se realiza una prueba piloto, que consiste en administrar el cuestionario a un conjunto reducido de personas para calcular su duracin, conocer sus dificultades y corregir sus defectos, antes de aplicarlo a la totalidad de la muestra.

EL CUESTIONARIO AUTOADMINISTRADO.

Al cuestionario lo podemos definir como un mtodo para obtener informacin de manera clara y precisa, donde existe un formato estandarizado de preguntas y donde el informante reporta sus respuestas.

Es un instrumento indispensable para llevar a cabo entrevistas formalizadas, pero puede usarse independientemente de stas. En tal caso, se entregar al respondente el cuestionario para que ste, por escrito, consigne por s mismo las respuestas.

Es claro que no se trata de una entrevista, pues no existe el elemento de interaccin personal que la define.

La elaboracin del cuestionario requiere un conocimiento previo del fenmeno que se va a investigar. Del mismo modo, la experiencia del investigador es imprescindible para la construccin de cuestionarios, los que deben ser adaptados a las necesidades del investigador y a las caractersticas de la comunidad en la que se realiza la investigacin.

En el desarrollo de un cuestionario se debe considerar los siguientes puntos:

1. El nivel educacional de la poblacin, para saber qu clase de vocabulario se va a utilizar en la redaccin de las preguntas. 2. Los cuestionarios deben ser autoexplicativos en cuanto a lo que requieren del informante. Los que los responden no deben necesitar la ayuda directa del investigador y/o sus colaboradores. 3. Deben contener preguntas concretas que no den lugar a respuestas vagas. 4. Al informante se le deben explicar los objetivos de la investigacin, es decir, par qu queremos la informacin que estamos solicitando. 5. El orden de presentacin de las preguntas es muy importante: deben ir de las ms fciles a las ms difciles. 6. Preguntar primero si el informante est consciente o ha pensado en el problema que se est investigando, y despus hacer las preguntas especficas. 7. Las preguntas deben ser redactadas de manera que no se suponga que los informantes tienen la "obligacin" de poseer o conocer la informacin que buscamos, ya que si es as se pueden sentir presionados y se rehusarn a contestar. 8. No se deben presentar preguntas dobles o que requieran de dos respuestas a la vez, por ejemplo: "Tiene el nio problemas emocionales y de aprendizaje?". 9. Las preguntas no deben redactarse de manera que exista una doble negacin. 10. Es importante obtener datos del informante(edad, sexo, ocupacin, nivel educativo). Estas preguntas generalmente aparecen al final del cuestionario y precedidas de una pequea introduccin, debido a que muchas personas evitan responder este tipo de preguntas. 11. Cuando preguntamos sobre modos de comportamientos habituales, debemos especificar el perodo a que nos estamos refiriendo. Por ejemplo: la semana pasada, el ltimo mes, en los ltimos seis meses, etc. 12. Todas las preguntas deben ser elaboradas de manera neutra, evitando sugerir de manera directa la respuesta. Por ejemplo: "Qu opina usted de los programas de TV para nios que se emiten de 3 a 5 de la tarde?", en lugar de algo as como: "Segn se dice, los programas de TV para nios que se emiten diariamente de 3 a 5 de la tarde son fabulosos, usted qu opina?".

La principal ventaja de los cuestionarios autoadministrados reside en la gran economa de tiempo y personal que implican, ya que pueden enviarse por correo, dejarse en algn lugar apropiado o administrarse directamente a grupos reunidos al efecto.

Otra ventaja es que la calidad de los datos obtenidos se incrementa, ya que al desaparecer la situacin de interaccin, se eliminan las posibles distorsiones que la presencia del entrevistador puede traer, ya sea por la forma de hablar, de enfatizar las palabras u oraciones, de dirigir inconscientemente las respuestas, ya sea por su misma presencia fsica, que puede retraer o inhibir al entrevistado.

Su desventaja est en que impide conocer las reacciones reales del informante ante cada pregunta. Tambin las confusiones o malentendidos pueden multiplicarse, pues no existe la posibilidad de consultar sobre dudas especficas o de orientar una respuesta hacia su mayor profundizacin o especificacin. Otro inconveniente es que el respondente puede consultar con otras personas antes de expresar sus opiniones.

Otro problema es el relacionado con el "prestigio", puesto que muchas preguntas tienen una connotacin social. La mayora de la gente tender a contestar algunas preguntas de manera que muestren conductas o actitudes socialmente aceptables: probablemente dirn que leen ms de lo que en realidad lo hacen, que asisten a espectculos culturales con mayor

frecuencia de lo que en realidad sucede, que compran su ropa en comercios de prestigio, etc. Esto se puede solucionar aplicando preguntas que nos permitan detectar mentiras, por ejemplo: colocar dos preguntas similares y separarlas lo ms posible dentro del cuestionario.

El empleo de los cuestionarios autoadministrados se hace especialmente recomendable en aquellos casos en que es factible reunir de una sola vez a un cierto nmero de personas. Tambin es conveniente cuando, por el tipo de informacin, se produzcan normalmente omisiones o falsedades deliberadas ante la presencia del entrevistador, como en los cuestionarios sobre salud, problemas sexuales, experiencias con drogas, comisin de delitos, etc.

Por otra parte, muchas personas adoptan una actitud irresponsable o pierden el inters frente a cuestionarios autoadministrados, lo que es otro factor negativo de esta tcnica.

Tipos de cuestionarios.

La forma o tipo de cuestionario depende tanto de los objetivos que persiga la investigacin, como de los informantes:

Cuestionarios abiertos. Son aquellos en los que se pregunta al sujeto algo y se le deja en libertad de responder como quiera. Este tipo de cuestionario es muy til y proporciona mucha informacin, pero requiere ms tiempo por parte del informante y es ms difcil de analizar y codificar por parte del investigador. Generalmente, se aplican en estudios pilotos con el fin de obtener ms datos.

Seran ejemplos de preguntas abiertas: Qu piensa usted de la planificacin familiar? Cul es su opinin acerca del presidente X? Qu le parecen los productos Y? Cuestionarios cerrados. Estn estructurados de tal manera que al informante se le ofrecen slo determinadas alternativas de respuesta. Es ms fcil de codificar y contestar. Como desventaja, podemos mencionar que las categoras que se ofrecen pueden no ser las ms adecuadas, o que la persona no haya pensado sus respuestas en trminos de las categoras que se le ofrecen. Otra desventaja es que, al ofrecerle categoras al informante, se le estn "sugiriendo" las respuestas. Entre los cuestionarios cerrados, tenemos:

a. Preguntas con opciones: el sujeto tiene dos o ms opciones para contestar. Por ejemplo:

Prefiere algn perfume en especial?

S NO o Los negros son superiores a los blancos:

Correcto Incorrecto o Indique los artculos que ms han aumentado de precio:

Automviles Casas Comida Electricidad Ropa Combustible Gas Otros a. Listas de preferencias y ordenamientos de opciones: al sujeto se le presenta una serie de afirmaciones, frases, opciones, etc. y l las debe ordenar segn su grado de preferencia. Por ejemplo:

Coloque en orden de mayor a menor las actividades que prefiere realizar en su tiempo libre: Leer Ir al teatro Ver TV Descansar Salir con amigos Otras Ir al cine Con respecto a los cuestionarios enviados por correo, el punto ms importante que debe considerarse es que, por lo general, el porcentaje de personas que lo devuelven es muy reducido y, adems, la muestra que contesta los cuestionarios, est sesgada; es decir, puede tener alguna caracterstica en comn, por ejemplo, cierto inters en el tema, y dar un tipo especial de respuestas.

SOCIOGRAMA.

Consiste en un grfico en que se expresan las atracciones y repulsiones que los miembros de un determinado grupo experimentan entre s, siendo por ello de suma utilidad para detectar fenmenos tales como liderazgo, existencia de subgrupos internos y anomia.

Se construye pidiendo a cada miembro que seale a las personas que ms congenian con l y las que menos lo atraen. Esta informacin se recoge mediante el uso de breves cuestionarios de dos o tres preguntas, y luego es procesada para construir el diagrama correspondiente.

TESTS PSICOLGICOS.

Emplean una gran variedad de tcnicas especficas. Una buena proporcin de ellos utiliza la formulacin de preguntas anotadas en algn formulario apropiado (el test) y que por lo general se autoadministra. En otros casos, se propone a la persona la realizacin de ciertas actividades pautadas y se observa su desarrollo. Se registra el tiempo empleado en su ejecucin, las reacciones que se producen, el desempeo de ciertos roles, etc.

Desde un punto de vista general, estos tests pueden considerarse como observaciones realizadas en condiciones artificiales, preparadas y definidas de antemano.

TCNICAS PROYECTIVAS.

Se basan en presentar algn estmulo definido a los sujetos para que ellos expresen libremente, a partir de estos estmulos, lo que piensan, sienten o ven.

Generalmente, se trata de dibujos, manchas, fotografas u otros elementos similares, aunque tambin se apela a veces a estmulos verbales o auditivos. La recoleccin de datos, normalmente, se hace por medio de entrevistas poco formalizadas.

ESCALAS Y DIFERENCIALES SEMNTICOS.

En las escalas, se pide al entrevistado que se site, segn su opinin o actitud, en una escala grfica. Se trata de un segmento de dimensiones fijas y conocidas, sobre el cual el respondente marcar algn signo que indique la posicin en que se sita. Midiendo luego la distancia en centmetros que separa la marca hecha por el respondente respecto a uno cualquiera de los extremos, se podr obtener un valor numrico, que corresponde a un punto determinado de la escala.

Tambin es posible sealar previamente en el segmento las posiciones intermedias, o utilizar otros recursos grficos que no sean segmentos: caras serias o alegres, termmetros, rectngulos o cualquier otro elemento grfico capaz de reflejar una gradacin y que resulte atractivo a la vez que preciso.

En los diferenciales semticos, lo que aparece en cada posicin, son oraciones que sealan conductas o actitudes tpicas, entre las cuales el entrevistado podr elegir las que ms coinciden con sus opiniones.

Por ejemplo:

Las siguientes escalas fueron diseadas para estudiar la opinin de las personas con respecto a diferentes marcas de jabones de tocador:

Limpia Huele bien Caro Fuerte Masculino Elegante

Deja sucio Huele mal Barato Suave Femenino Comn

ANLISIS DE CONTENIDO.

Es una tcnica que se basa en el estudio cuantitativo del contenido manifiesto de la comunicacin.

Es usada especialmente en sociologa, psicologa, ciencias polticas y literatura, e incluye normalmente la determinacin de la frecuencia con que aparecen en un texto ciertas categoras previamente definidas, tales como ideas, trminos o vocablos, o elementos grficos de diversa naturaleza. Estas categoras son las variables o indicadores que intervienen en el problema de investigacin planteado.

El anlisis de contenido es til, especialmente, para establecer comparaciones y estudiar en profundidad diversos materiales: registros de entrevistas en estudios de psicologa clnica o evolutiva, editoriales de peridicos o revistas, programas o declaraciones polticas, entrevistas focalizadas o abiertas, etc.

Gracias a la aplicacin de esta tcnica, es posible hacer apreciaciones sistemticas sobre la ideologa y el pensamiento poltico de diversos rganos de difusin, encontrar coincidencias y discrepancias en entrevistas y, en general, obtener un tipo de informacin bastante profunda sobre temas complejos y difciles de estudiar. Tambin es posible realizar anlisis de contenido de materiales propagandsticos, cuantificndose el espacio en centmetros dedicado a ciertos temas o elementos grficos, as como la frecuencia de aparicin de ciertas palabras o frases.

La principal ventaja que posee el anlisis de contenido es que tiene una base emprica clara y perfectamente accesible, por lo que puede analizarse un texto con menos subjetividad que por otros medios.

Su principal inconveniente estriba en su costo, pues slo puede hacer un anlisis de contenido de cierta calidad un personal de alta calificacin.

Esta tcnica tiene adems una limitacin intrnseca que el investigador tiene que tener presente: como el anlisis abarca solamente el contenido manifiesto de la informacin (lo denotativo) pero no mide ni evala los contenidos latentes o implcitos (lo connotativo), no puede afirmarse que por medio de esta tcnica pueda tenerse una visin completa de los documentos en estudio.

Los pasos concretos que se siguen para efectuar un anlisis de contenido son:

1. Despus de definir las variables que intervienen en el problema, es preciso encontrar para stas indicadores verbales o grficos que puedan encontrarse en los documentos investigados. 2. Es necesario hacer un arqueo de los documentos relevantes para la investigacin. Si las unidades detectadas son muchas, ser preciso proceder a la extraccin de una muestra. 3. Conviene realizar una revisin somera del contenido de los materiales. El objetivo es encontrar los aspectos concretos que puedan identificarse con las variables y los indicadores ya definidos. 4. Marcar la aparicin de cada elemento de inters, utilizando la forma de registro apropiada. Luego debe tabularse la informacin obtenida. Finalmente, habr que analizar los cuadros elaborados con los datos, de modo de obtener las conclusiones.

Los programas de computacin llamados procesadores de textos facilitan enormemente la aplicacin de esta tcnica.

Algunos investigadores tambin realizan un anlisis de contenido cualitativo. En esencia, consiste en establecer categoras de estudio, con el fin de determinar los puntos ms salientes del documento. Las categoras dependern del documento que se analiza. Por ejemplo: los enfoques polticos, los tipos de propaganda, las contradicciones que se encuentren en el documento, etc. Otras categoras que frecuentemente se utilizan son aquellas que se refieren a la intensidad de alguna actitud determinada, es decir, hacen referencia a qu tan fuerte o dbilmente se manifiestan las reacciones personales.

RECOLECCIN DE DATOS SECUNDARIOS.

Las bibliotecas son la mejor opcin que se presenta al investigador, en especial en cuanto se refiere a libros, revistas cientficas y boletines informativos. Tampoco deben dejarse de registrar otros lugares que pueden reunir informacin de este tipo: archivos y bibliotecas privadas, de organismos e instituciones pblicas o privadas, libreras, puestos de venta de peridicos, etc. Tambin las redes informticas hacen posible una bsqueda sistemtica de los materiales bibliogrficos existentes.

Las bibliotecas ofrecen tres tipos de ficheros que, si son adecuadamente usados, proporcionan un cuadro completo de la informacin existente sobre un tema:

Ficheros por autor.

Ficheros temticos. Ficheros de ttulos de libros y artculos.

Para recolectar la informacin, el instrumento que se utiliza es la ficha.

Las fichas bibliogrficas son una simple gua para recordar cules libros o trabajos han sido consultados o existen sobre un tema. Las fichas textuales, adems de poseer los datos del libro, constan de prrafos o trozos seleccionados que aparecen en la obra, o de estadsticas, cuadros y otros datos semejantes. Estos fragmentos se repiten exactamente tal como han sido escritos, sin la menor alteracin, para respetar el trabajo creador de quien estamos citando, haciendo mencin explcita de la pgina en que aparecen. Las fichas de contenido, aparte de poseer los datos comunes a toda ficha, consisten en resmenes o sntesis de prrafos, captulos o an de la obra entera.

Las fichas son unidades de registro, no objetos fsicos de determinadas caractersticas. Por ello, son fichas las que se hacen en cartulinas, pero tambin deben considerarse como tales los registros que se hagan en cualquier clase de papel o las bases de datos que se manejan por computadora.

El valor de las fichas reside en que ellas permiten recopilar las informaciones que necesitamos para una determinada investigacin. Si las fichas son completas y reflejan fielmente los datos originales, ser posible desarrollar la investigacin con la seriedad que requiere todo trabajo cientfico.

Una vez concluido el trabajo de fichado de las fuentes, se estar en condiciones de continuar con las operaciones propias del diseo bibliogrfico: cotejo y evaluacin de las fuentes, anlisis, sntesis y redaccin del informe de investigacin.

Por otra parte, si definimos a los documentos como todos aquellos escritos que nos pueden servir como instrumentos en nuestra investigacin, debemos incluir a todos los documentos pblicos y privados.

Existen documentos pblicos que resumen informacin masiva sobre determinada poblacin (censos, archivos, registros de instituciones). Generalmente, la informacin que se recolecta en este tipo de documentos se utiliza con un propsito especfico y es difcil que se le pueda dar otro empleo.

Tambin existen documentos privados o personales que nos proporcionan informacin acerca de una persona determinada (cartas, diarios ntimos). El problema consiste en que no podemos saber qu tan fidedignos son los datos que estos documentos representan. por ejemplo, un diario ntimo nos puede proporcionar informacin acerca de los sentimientos y vivencias de la

persona, pero probablemente nos ofrecer pocos datos (o muy subjetivos) acerca de hechos externos a la persona.

Bibliografa:

Tenorio Bahena, Jorge. INVESTIGACIN DOCUMENTAL. 3 ed. Mxico (1988). Ed. Mac Graw - Hill. Pick, Susan y Lpez, Ana Luisa. CMO INVESTIGAR EN CIENCIAS SOCIALES. 5 ed. Mxico (1994). Ed. Trillas S.A. Tamayo y Tamayo, Mario. EL PROCESO DE LA INVESTIGACIN CIENTFICA. 3 ed. Mxico (1998). Ed. Limusa S.A. Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.

INDICADORES E NDICES

Supongamos que estamos interesados en conocer si existen o no prejuicios raciales dentro de una poblacin. Para ello, naturalmente, deberamos medir u observar, de algn modo, la presencia de dichos prejuicios. Pero los prejuicios no son objetos que puedan verse directamente, que puedan medirse como otros hechos del mundo fsico: slo podemos conocerlos a travs del modo en que se expresan o manifiestan en situaciones determinadas, a travs de hechos o acciones que podemos interpretar como originados en los prejuicios raciales.

Estos hechos que se corresponden con los conceptos tericos que nos interesan (correlatos empricos), son los indicadores de las variables que intentamos medir: sus expresiones concretas, prcticas, medibles. El proceso

de encontrar los indicadores que permiten conocer el comportamiento de las variables es lo que llamamos operacionalizacin.

En nuestro ejemplo, los indicadores de los prejuicios raciales sern la existencia o no de matrimonios interraciales, la distribucin de los empleos entre personas de las diferentes comunidades tnicas, las restricciones al uso de elementos comunitarios, las actitudes que se expresan en el trato cotidiano, giros o formas empleados en el lenguaje coloquial y en los medios de comunicacin, etc.

Como a veces no es posible incorporar a una investigacin todos los indicadores posibles de una determinada variable, ser necesario elegir aquellos que ms directamente reflejen el concepto que nos interesa y que por otra parte - resulten ms accesibles a los medios de que disponemos para medirlos.

Para operacionalizar una variable, es necesario partir de la definicin terica que ya se ha elaborado y, si se trata de una variable compleja, de las dimensiones en que puede descomponerse la misma. Luego, revisando los datos ya disponibles y analizando los conceptos en profundidad, podremos encontrar cierto conjunto de indicadores que - en principio - expresen consistentemente el comportamiento de la variable estudiada, con lo que habremos llegado a la definicin operacional de la misma.

As, la definicin terica de las migraciones dice que stas son los desplazamientos permanentes de la poblacin, pero la definicin operacional de ese concepto debiera hacer referencia, ms concretamente, a los saldos netos de las diferencias intercensales descontado el crecimiento vegetativo. Se trata de la misma idea, pero presentada ahora de una forma operacional que permite encontrar rpidamente los datos empricos correspondientes.

La tarea de bsqueda y seleccin de indicadores es una tarea delicada, que exige mucho cuidado y que requiere experiencia suficiente. Sucede a veces que existen muchos indicadores posibles para una misma variable y resulta difcil encontrar cules son los ms apropiados para describirla. En otros casos, los indicadores encontrados no son fciles de medir y deben ser suplantados por otros menos confiables pero ms asequibles a los medios disponibles por el investigador. En otras ocasiones, algunos de los indicadores sugeridos no miden exactamente la variable sino algn aspecto conexo o colateral, que en realidad posee menor relevancia.

Para actuar adecuadamente frente a esta tarea, que es eminentemente prctica, se requiere de una aguda intuicin y, ms que nada, de slidos conocimientos sobre el tema investigado. De otro modo, se corre el grave riesgo de realizar una seleccin subjetiva, con lo que puede invalidarse gran parte del trabajo terico previo.

Del mismo modo que las variables son susceptibles de ser operacionalizadas, a travs de los indicadores correspondientes, las hiptesis elaboradas tericamente como relaciones entre variables pueden tambin sufrir el mismo proceso. Para ello, se operacionalizan cada una de las variables que intervienen en la hiptesis, definiendo sus indicadores. Luego se procede a relacionar las definiciones operacionales de las variables entre s, del mismo modo en que se haca al formular la hiptesis general o terica. As se obtiene una hiptesis operacional, que puede ser directamente probada o refutada en la prctica.

Criterios a considerar para el uso de indicadores:

1. Se debe tener el menor nmero de indicadores de una variable, siempre y cuando stos sean realmente representativos de la misma. 2. Se deben poseer formas de medicin especficas para cada indicador. 3. Cada indicador posee slo una relacin de probabilidad con respecto a la variable, ya que en ciencias sociales es muy difcil saber con certeza cundo un indicador representa una variable.

Escalas de medicin.

La idea de medicin, de medida, es intrnsecamente comparativa. Medir algo, en el caso ms sencillo, es determinar cuntas veces una cierta unidad o patrn de medida cabe en el objeto medido. Para medir la longitud de un objeto fsico, desplazamos una regla graduada sobre el mismo, observando cuntas unidades (en este caso, centmetros o metros) abarca ese objeto. Es decir, comparamos el objeto con nuestro patrn de medicin para determinar cuntas unidades y fracciones del mismo incluye.

La medicin de variables no fsicas resulta, en esencia, un proceso idntico al anterior. La dificultad reside en que las variables de este tipo no pueden medirse con escalas tan sencillas como las lineales y en que, por otra parte, no existen para su comparacin patrones de medida universalmente definidos y aceptados. Si deseamos medir el peso de un objeto, podremos expresar el valor del mismo en kilogramos o libras. En cambio, para medir el grado de autoritarismo de un dirigente, no existe ni una unidad ni una escala generalmente reconocidas, por lo que el investigador se ve obligado a elegir alguna escala de las que se han utilizado en otros trabajos o a construir una adaptada a sus necesidades especficas.

Por esta razn, medir un concepto complejo implica realizar una serie de operaciones que no se hacen en el caso de variables como el peso o la longitud; ser necesario definir las dimensiones que integran las variables, encontrar diversos indicadores que la reflejen y construir luego una escala apropiada para el caso.

Puede decirse que una escala es un continuo de valores ordenados correlativamente, que admite un punto inicial y otro final. Si evaluamos el rendimiento acadmico de estudiantes, podemos asignar el valor cero al mnimo rendimiento imaginable al respecto. Al mayor rendimiento posible podemos atribuirle un valor 100, 20, 10 o 7 puntos, segn resulte ms prctico. Con estos dos valores tendramos ya marcados los lmites de nuestra escala. Para concluir de confeccionarla, ser necesario asignar a los posibles rendimientos intermedios puntajes tambin intermedios. Con ello obtendremos una escala capaz de medir la variable rendimiento acadmico a travs de los indicadores concretos de los trabajos presentados por los estudiantes, de sus exmenes, pruebas y otras formas de evaluacin posibles.

Para que una escala pueda considerarse como capaz de aportar informacin objetiva, debe reunir los siguientes requisitos bsicos:

Confiabilidad. Se refiere a la consistencia interior de la misma, a su capacidad para discriminar entre un valor y otro. Cabe confiar en una escala cuando produzca constantemente los mismos resultados al aplicarla a una misma muestra, es decir, cuando siempre los mismos objetos aparezcan valorados en la misma forma. Validez. Indica la capacidad de la escala para medir las cualidades para las cuales ha sido construida y no otras parecidas. Una escala confusa no puede tener validez; tampoco una escala que est midiendo, a la vez

e indiscriminadamente, distintas variables superpuestas. Una escala tiene validez cuando verdaderamente mide lo que afirma medir.

Clases de escalas.

Escalas nominales. Son aquellas en que slo se manifiesta una equivalencia de categoras entre los diferentes puntos que asume la variable. Es como una simple lista de las diferentes posiciones que puede adoptar la variable, pero sin que en ella se defina algn tipo de orden o relacin. Si en una investigacin sobre produccin agrcola queremos determinar los cereales que se cultivan en una cierta regin, tendremos una variable que se designar como "cereal cultivado". Los distintos valores que esa variable reconoce sern: trigo, maz, centeno, etc. Entre estos valores, no cabe obviamente ninguna jerarqua, no se puede trazar ningn ordenamiento. Sin embargo, a la enunciacin explcita de todas esas posibilidades la consideramos como una escala, pues de algn modo es til para medir el comportamiento de la variable, indicndonos en qu posicin se halla en cada caso. Escalas ordinales. Distinguen los diferentes valores de la variable jerarquizndolos simplemente de acuerdo con un rango. Establecen que existe una gradacin entre uno y otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el precedente y menor que el que le sigue a continuacin. Sin embargo, la distancia entre un valor y otro no queda definida sin que es indeterminada. En otras palabras, tales escalas nos esclarecen solamente el rango que las distintas posiciones guardan entre s. Un ejemplo de escala ordinal es el que suele usarse para medir la variable "grado de escolaridad": podemos decir que una persona que ha tenido 2 aos de instruccin escolar, ha recibido ms instruccin que quien slo tiene un ao, y menos que quien posee 3. Sin embargo, no puede afirmarse vlidamente que la diferencia entre quien posee 2 aos de instruccin y quien ha recibido un ao es igual a la diferencia entre quienes han recibido 16 y 17 aos de educacin formal. Escalas de intervalos iguales. Adems de poseer la equivalencia de categoras y el ordenamiento interno entre ellas, tienen la caracterstica de que la distancia entre sus intervalos est claramente determinada y que stos son iguales entre s. Un ejemplo tpico de las escalas de intervalos iguales est dado por las escalas termomtricas. Entre 23 y 24 C, por ejemplo, existe la misma diferencia que entre 45 y 46 C. Muchas otras escalas, como las que se utilizan en los tests psicolgicos y de rendimiento, pertenecen a este tipo. La limitacin que poseen es que no definen un cero absoluto, un valor lmite que exprese realmente la ausencia completa de la cualidad medida. Por ello no se pueden

establecer equivalencias matemticas como las de proporcionalidad: no puede afirmarse que 24 C es el doble de temperatura que 12 C, porque el cero de la escala es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable que se mide. Escalas de cocientes. Llamadas tambin de razones. En ellas se conservan tambin todas las propiedades de los casos anteriores, pero adems se aade la existencia de un valor cero real, con lo que se hacen posibles ciertas operaciones matemticas, tales como la obtencin de proporciones y cocientes. Esto quiere decir que un valor de 20 en una escala de este tipo es el doble de un valor de 10, o de las dos terceras partes de 30. Son escalas de cocientes las que miden la longitud, la masa, la intensidad de la corriente elctrica y otras variables del mundo fsico. Difcilmente las escalas que intervienen en las ciencias sociales son medidas con escalas de razones, ya que son contados los casos en que dichas variables pueden ser definidas con la exactitud y la precisin necesarias. La economa y la demografa son, entre estas disciplinas, las que ms utilizan escalas de razones.

Caractersticas de las escalas de medicin.

Sus intervalos deben ser mutuamente excluyentes. Cada dato recogido slo puede pertenecer a una y slo una de las categoras de la escala. Nunca se debe comenzar un intervalo con el mismo valor con que finaliza el anterior, porque aparecern datos que pueden incluirse en cualquiera de ambos:

Edades: 1) de 20 a 25 aos 2) de 25 a 30 aos Del mismo modo, deben evitarse las imprecisiones que produzcan el mismo fenmeno entre categoras verbales. Una escala donde se incluyen las siguientes posibilidades: 1. 2. 3. 4. Msica bailable Msica folclrica Msica clsica Msica moderna

No tiene categoras mutuamente excluyentes, pues hay msica folclrica que es a la vez bailable, msica clsica que es moderna o bailable, y varias otras posibilidades.

Las escalas deben ser exhaustivas. En ellas deben pode ubicarse todos los valores posibles de la variable que se va a medir. En el caso de que resulte difcil construir una escala con todas las posibilidades ser preciso agregar el cdigo "otros", para resumir all toda la informacin que no sea correcto ubicar en las restantes posiciones.

Los ndices.

Supongamos que se desee evaluar el comportamiento de una variable para la cual, una vez elaboradas las definiciones correspondientes, se hayan encontrado diversos indicadores capaces de expresar los valores que asume en distintos objetos. A travs de cada indicador, se podrn obtener los datos pertinentes, que debern ser llevados a escalas adecuadas para ordenarlos. Para cada indicador que utilicemos, ser necesario adoptar o construir una escala que cuantifique las observaciones realizadas. sta podr ser del tipo ms simple como la escala dicotmica "si/no", "0/1", de dos valores solamente o ms compleja, con varias posiciones posibles, lo que aumenta su sensibilidad o grado de discriminacin frente a los fenmenos medidos.

De acuerdo con los datos obtenidos, evaluaremos en cada escala el comportamiento que sigue cada indicador. No obstante, esto no nos permite todava medir claramente la variable, pues nos entrega informacin fragmentaria, que debe ser integrada o sintetizada para llegar a un valor nico, que exprese lo que en realidad ocurre con la variable. Para lograrlo, debemos sumar ponderadamente los valores de los indicadores, obteniendo un valor total que se denomina ndice, y que es el que nos dar la informacin relevante sobre el problema en estudio.

Analicemos un ejemplo. Variable a medir: "exposicin a los medios de comunicacin masivos".

Definicin operacional: intensidad del contacto que un individuo grupo posee con los medios masivos de comunicacin. Indicadores: como existen varios medios importantes de comunicacin, se referirn al grado de exposicin con respecto a cada uno de los medios. Despus de un anlisis del problema, el investigador llega a la conclusin de que los principales medios son: cine, radio, televisin y peridicos. Existen otros medios que tambin podran ser incluidos, como la propaganda mural y las revistas, pero se decide dejarlos de lado porque parecen de menor importancia.

Designados estos cuatro medios de comunicacin, habr que especificar los indicadores. As, tendramos:

Para el cine: frecuencia mensual de asistencia. Para la radio: promedio de horas semanales en que se escucha. Para la TV: promedio de horas semanales en que se ve . Para los peridicos: promedio semanal de peridicos ledos.

La razn de preferir estos indicadores sobre otros posibles surge de que cumplen con la condicin de ser perfectamente factibles de medir y de que, segn la experiencia, parecen ser los que mejor configuran la conducta respecto a cada caso. Ahora deberemos construir una escala que resulte til para medir cada indicador.

Tomemos el caso del cine. Podramos discriminar tres posiciones: la de quienes no estn expuestos para nada a la influencia del medio, la de quienes reciben una exposicin media y la de quienes reciben un alto grado de influencia. Estas tres conductas deben ser traducidas a conductas definidas cuantitativamente, buscando un equivalente entre los conceptos mencionados y las conductas correspondientes. Para concluir, es necesario buscar una equivalencia numrica dentro de la escala mencionada.

Conceptos

Conductas

Valores escalares

Exposicin baja Exposicin media

Va menos de una vez al mes Va de una a cuatro veces al mes Va ms de cuatro veces al mes

0 1

Exposicin alta

La escala podra tener ms o menos posiciones, y las conductas equivalentes podran variar segn como enfoquemos el problema. Aqu lo que priva es el criterio del investigador, basado indudablemente en su experiencia sobre el tema y complementado con consultas a otros especialistas o con trabajos anteriores sobre el mismo problema.

Para cada uno de los diferentes medios de comunicacin, tendremos que realizar una tarea semejante:

PARA LA RADIO Conceptos No est expuesto (no escucha radio) Exposicin dbil (escucha espordicamente) Exposicin media (escucha regularmente) Exposicin alta (escucha frecuentemente) Ms de 10 horas semanales 3 Ms de 3 horas y menos de 10 horas semanales 2 De 1 a 3 horas semanales 1 Menos de una hora semanal 0 conductas Valores escalares

PARA LA TV Conceptos No est expuesto Exposicin dbil Exposicin media Exposicin alta Exposicin muy alta Conductas Ve menos de 1 hora semanal De 1 a 3 horas por semana De 3,1 a 10 horas semanales De 10,1 a 20 horas semanales Ms de 20 horas por semana Valores escalares 0 1 2 3 4

PARA LOS PERIDICOS Conceptos Conductas Menos de un peridico ledo por semana De 1 a 4 peridicos semanales ledos De 5 a 8 peridicos semanales ledos Ms de 8 peridicos semanales ledos Valores escalares

No est expuesto

Exposicin dbil

Exposicin media

Exposicin alta

Tenemos ahora cuatro escalas, una para cada indicador, que son capaces de discriminarnos las conductas de los individuos de acuerdo con situaciones tpicas, sealadas por los conceptos tericos. Para llegar al ndice, que es el verdadero valor que nos ilustra acerca de la variable, ser preciso hacer dos operaciones ms:

1. Igualar las escalas entre s 2. Ponderar los indicadores.

Para igualar las escalas conviene tomar un valor nico, con el que haremos coincidir el mximo de cada una de ellas. El valor 100 es muy usado en estos casos por su practicidad. Entonces, la escala de exposicin al cine, que tena un mximo de 2 puntos, tendr ahora un mximo de 100; su mnimo seguir siendo el valor 0. El punto intermedio hallado ser, proporcionalmente, de 50 en la escala.

Escala original Escala equivalente

0 0

1 50

2 100

Para la radio y los peridicos, las proporciones seran:

Escala original Escala equivalente

0 0

1 33

2 67

3 100

Para la televisin, tendramos:

Esc. Original Esc. equivalente

0 0

1 25

2 50

3 75

4 100

El segundo paso, la ponderacin de indicadores, parte del hecho de que la influencia de cada medio de comunicacin sobre la poblacin es muy diferente. Es decir que, cualitativamente, la influencia de la exposicin a la TV es mayor que la que proporciona la radio, por ejemplo, porque se trata de un medio no slo auditivo sino tambin visual.

Ponderar significa asignar pesos, pesar la influencia relativa que cada indicador tiene con respecto a la variable tomada en su conjunto. Para hacerlo, otorgaremos valores numricos a los indicadores, de modo tal que reflejen la relacin que existe entre ellos, dando a los indicadores ms importantes valores mayores que a los menos importantes. Podramos asignar los siguientes valores relativos, que llamaremos coeficientes de ponderacin:

Para la TV Para los peridicos Para la radio Para el cine

10 7 4 3

Ahora supongamos que una persona haya expresado que:

Va a cine 2 veces promedio por mes Escucha 4 5 horas de radio por semana Ve unas 2 horas diarias de televisin (14 semanales) Lee 1 peridico al da (7 semanales)

En primer lugar, habra que convertir los valores originales de las escalas en sus correspondientes valores equivalentes y luego multiplicarlos por cada uno de los coeficientes de ponderacin. Sumando estos valores, y dividindolos luego por la suma de los coeficientes de ponderacin, obtendremos el valor ponderado total.

Medio

Valor en la escala original

Valores equivalentes (1)

Coeficientes de ponderacin (2) 10 3 4 7 24

(1) x (2)

TV Cine Radio Peridicos Totales

3 1 2 2 -

75 50 67 67 -

750 150 268 469 1.637

I = 1.637 / 24 = 68,2

ste es el valor que nos interesa. El ndice ponderado nos est expresando que, para la persona o promedio de personas considerados, existe un grado de exposicin de 68,2 sobre un mximo posible de 100 y un mnimo posible de 0 puntos. Este valor, dado que la escala va de 0 a 100, puede traducirse a porcentajes, diciendo que la exposicin a los medios de comunicacin masivos es, para este caso, de un 68% del mximo posible.

Finalmente, podemos decir que un ndice no es otra cosa que la combinacin de valores obtenidos por un individuo o elemento en cada uno de los indicadores propuestos para medir la variable.

En otras palabras, un ndice es el complejo de indicadores de dimensiones de una variable, el indicador total de una variable compleja.

Bibliografa: Sabino, Carlos A. EL PROCESO DE INVESTIGACIN. Argentina (1996). Ed. Lumen - Humanitas.