Está en la página 1de 3

INSTITUTO DE EDUCACION A DISTANCIA ADMINISTRACION FINANCIERA

Estadstica Inferencial

Una introduccin a la ESTADSTICA INFERENCIAL Jos Chacn Esta asignatura ha sido orientada a entender los principios en los que se basa la estadstica inferencial. Entender significa que es posible saber, en primer lugar, qu razones han llevado a elegir un determinado clculo y, no menos importante, la relevancia real de los resultados de ese clculo. La estadstica inferencial no es ms que un argumento. Un buen argumento hace creble una afirmacin. En nuestro caso, cualquier estudio necesitar, al menos dos argumentos slidos: el estadstico y el relativo al diseo de investigacin. Desde este punto de vista, nuestra tarea es poder entender (y calibrar) los argumentos estadsticos y tambin poder construirlos nosotros mismos. La estadstica inferencial es necesaria cuando queremos hacer alguna afirmacin sobre ms elementos de los que vamos a medir. La estadstica inferencial hace que ese salto de la parte al todo se haga de una manera controlada. Aunque nunca nos ofrecer seguridad absoluta, s nos ofrecer una respuesta probabilstica. Esto es importante: la estadstica no decide; slo ofrece elementos para que el investigador o el lector decidan. En muchos casos, distintas personas perciben diferentes conclusiones de los mismos datos. El proceso ser siempre similar. La estadstica dispone de multitud de modelos que estn a nuestra disposicin. Para poder usarlos hemos de formular, en primer lugar, una pregunta en trminos estadsticos. Luego hemos de comprobar que nuestra situacin se ajusta a algn modelo (si no se ajusta no tendra sentido usarlo). Pero si se ajusta, el modelo nos ofrecer una respuesta estadstica a nuestra pregunta estadstica. Es tarea nuestra devolver a la psicologa esa respuesta, llenndola de contenido psicolgico. 1. Definiciones e ideas previas En el mbito cientfico, la estadstica, en general, y la estadstica inferencial, en particular, es el camino que hay que recorrer para llegar de una pregunta a la respuesta adecuada. As, la estadstica no es ms que un argumento para defender nuestras ideas. Cundo es necesaria la estadstica inferencial? Cuando queremos hacer alguna afirmacin sobre ms elementos de los que vamos a medir. La estadstica descriptiva, como indica su nombre, tiene por finalidad describir. As, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de personas, la estadstica descriptiva nos puede ayudar. Lo primero ser tomar medidas, en todos los miembros del grupo, de esos aspectos o variables para, posteriormente, indagar en lo que nos interese. Por ejemplo, para saber cul es la edad del grupo, podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice, aproximadamente, alrededor de qu edad se sitan todos. Ya sabemos, pongamos, que la edad media es 40 aos. Pero adems podemos utilizar la desviacin tpica, si queremos saber si el grupo tiene edades muy dispares (por ejemplo, una desviacin tpica de 12 aos) o si, por el contrario, tienen edades parecidas (una desviacin tpica de 2 aos). Slo con esos indicadores ya podemos hacernos una idea, podemos describir a ese conjunto de personas, al menos en referencia a su edad. Pero el tamao de los grupos que suelen interesar es demasiado grande, a veces tan grande como todo el mundo. Y esto, ms que ser una rareza, es en muchos campos la norma. Por ejemplo, cuando se afirma que las personas tenemos una agudeza visual menor que la de los halcones, podemos estar seguros de que no hemos medido la agudeza visual de todos los humanos ni la de todos los halcones. Pues bien, la estadstica inferencial es la que va a permitir dar ese salto de los resultados obtenidos para un grupo a la totalidad. Planteemos una cuestin concreta: Un profesor de estadstica afirma que se aprende mejor estadstica inferencial utilizando los ordenadores para mostrar lo que se estudia. Cmo podemos decidir si esta afirmacin es cierta? Una posible forma sera seleccionando dos grupos de alumnos (equivalentes) que estudien estadstica inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idnticos ejercicios, etc., excepto que uno de ellos utilizan los ordenadores en su aprendizaje y otro no. Veamos las definiciones en relacin a este ejemplo, suponiendo que realizamos el estudio con los alumnos de los grupos F (con ordenador) y G (sin ordenador):

Poblacin: un conjunto de elementos (generalmente personas, en psicologa) que comparten al menos una caracterstica bien definida. Estudiantes de primero de psicologa que cursan estadstica inferencial con ordenador Estudiantes de primero de psicologa que cursan estadstica inferencial sin ordenador Muestra: es un subconjunto de elementos extrados de una poblacin. Los estudiantes de primero de psicologa de la UCM, grupo F Los estudiantes de primero de psicologa de la UCM, grupo G Variable: Caracterstica de los elementos de una poblacin que puede tomar diversos valores (al menos, dos). grupo F:Nivel de conocimientos en estadstica II, medidos a travs de un examen. grupo G :Nivel de conocimientos en estadstica II, medidos a travs de un examen. Datos: Valores obtenidos al medir una variable en una muestra. Conjunto de notas obtenidas en el examen de estadstica para los alumnos del grupo F Conjunto de notas obtenidas en el examen de estadstica para los alumnos del grupo G Estadstico: Es un valor numrico que expresa una caracterstica de una muestra. Formalmente, un estadstico es una funcin definida sobre una variable. Media ( X ) de las notas obtenidas en el examen de estadstica para alumnos del grupo F Media ( X ) de las notas obtenidas en el examen de estadstica para alumnos del grupo G Parmetro: Es un valor numrico que expresa una caracterstica de una poblacin. grupo F :Media ( ) de las notas obtenidas en el examen de estadstica para todos los estudiantes de primero de psicologa que cursan estadstica Inferencial con ordenador. grupo G: Media ( ) de las notas obtenidas en el examen de estadstica para todos los estudiantes de primero de psicologa que cursan estadstica inferencial sin ordenador. 2. El azar y la probabilidad La estadstica inferencial resulta de aplicar la probabilidad a los estadsticos que ya conocemos por la estadstica descriptiva. Los resultados de esa aplicacin vendrn expresados, pues, en lenguaje probabilstico. Y esto no ayuda precisamente a sentirse cmodo con la estadstica inferencial. Adems de ser matemtica, tiene la fea costumbre de no decir s o no. En lugar de ello, sus respuestas suenan a veces a excusas, eso s, muy diplomticas, como no hay suficiente evidencia o esa afirmacin es altamente improbable. Pero en lenguaje matemtico. El resultado es quizs extrao, difuso pero preciso; no se decanta pero nos da cuatro decimales: a partir de los datos que me ofrece, la probabilidad de que ocurra eso que usted afirma es 0.2381. Pero aun as nos permite incrementar nuestro conocimiento. Las afirmaciones anteriores pretenden ilustrar algo fundamental: las afirmaciones que nos permite hacer la estadstica inferencial tienen un riesgo, y quien la usa debe saberlo. No es difcil, de todas maneras, porque todas estas afirmaciones estn formuladas en trminos de riesgo, de seguridad e inseguridad: de probabilidad. El azar es, por definicin, lo impredecible. Cmo es posible entonces utilizarlo impredecible para obtener informacin? La clave est en que incluso lo impredecible, para poder serlo, ha de cumplir algunas normas. El conjunto de esas normas, y las tcnicas para extraer informacin del azar, es lo que llamamos probabilidad. No hay nada mgico en el azar; resulta de una sucesin de circunstancias no controlables que lleva a no poder predecir el resultado. Fijmonos en la moneda de toda la vida. Lo que hace que lanzarla sea un experimento aleatorio es que es imposible controlar la fuerza con la que se lanza, los giros que da y los ngulos con que golpea el suelo una y otra vez hasta detenerse2. Basta situar la moneda de canto en una mesa y empujarla deliberadamente en una direccin para que desaparezca el azar. Pero si estando de canto la hacemos girar rpidamente volvemos a disponer de un experimento aleatorio. Pero, podemos realmente utilizar esta informacin para decidir sobre algo real? Supongamos que lanzamos la moneda al aire. Cules son esas normas que podemos utilizar? En este caso, que la moneda tiene dos caras, y que no hay preferencia por una u otra a la hora de posarse. Es decir: las dos nicas posibilidades se reparten por igual el derecho a ser el resultado final. Si aplicamos los conceptos bsicos de la probabilidad, y recordando que la probabilidad total es 1, tenemos que las probabilidades de que salga cara o cruz son: P(cara)=0.5 P(cru)z = 0.5

Lo que suele ser difcil de digerir para nuestro entendimiento son cuestiones como, por ejemplo, que aunque un determinado suceso tenga una probabilidad nfima, como 0.01 (un 1 por ciento), tambin puede ocurrir. Aunque todo el que lea esto est realmente convencido de que es verdad, la experiencia demuestra que no aplicamos este conocimiento. Contraste de hiptesis Un contraste de hiptesis es un proceso de decisin en el que una hiptesis formulada en trminos estadsticos es puesta en relacin con los datos empricos para determinar si es o no compatible con ellos. Los datos empricos siempre provendrn de un muestra, un subconjunto limitado de la poblacin de referencia. Las hiptesis, por el contrario, siempre preguntarn acerca de la poblacin. Pinsese que es absurdo preguntar si una media obtenida en una muestra, por ejemplo, 58, es mayor que 5. Por supuesto que lo es, y nadie (exceptuando los que estudian estadstica) puede hacerse semejante pregunta seriamente. Lo que s es relevante preguntar es si la media poblacional, que no conocemos, es mayor que 5. En tanto no la conocemos, usaremos la media muestral como un estimador (una aproximacin) de esa media poblacional. 1 Las hiptesis estadsticas (la pregunta, formalizada) Una hiptesis estadstica es una afirmacin sobre una o ms distribuciones de probabilidad; ms concretamente, sobre la forma de una distribucin de probabilidad o sobre el valor de un parmetro de esa distribucin de probabilidad. En cuanto a nuestro ejemplo, nos centraremos en una distribucin de probabilidad con el parmetro media poblacional igual a 5. El contraste de hiptesis nos dir si es ms o menos probable, bajo esa distribucin de probabilidad, obtener en una muestra aleatoria una media igual a 58. Todo contraste necesita dos hiptesis: H0 y H1, que sern exhaustivas y mutuamente exclusivas. H0 es la hiptesis nula, y es la que se somete a contraste. H1 es la hiptesis alternativa a H0, y es la negacin de H0. Mientras que H0 es exacta, H1 suele ser inexacta. Un detalle importante: el signo = siempre va en la H0, sea exacta o inexacta. Es sobre este signo = sobre el que se construir el modelo probabilstico, como ya hemos visto. 2 Los supuestos (nuestra situacin se parece a la del modelo?) Son un conjunto de afirmaciones que necesitamos establecer (sobre la poblacin de partida y la muestra utilizada) para conseguir determinar la distribucin de probabilidad en la que se basar nuestra decisin sobre H0. Si nuestra situacin no se ajusta a estas condiciones, necesarias, entonces no debemos usar el modelo. La razn es obvia: el modelo no nos sirve, luego cualquier cosa que deduzcamos de l ser inexacta y/o errnea. 3. Contraste de hiptesis, El estadstico de contraste y su distribucin de probabilidad Un estadstico de contraste no es ms que un clculo o funcin que cumple lo siguiente: (1) expresa de forma adecuada nuestra pregunta psicolgica, (2) tiene una distribucin muestral (de probabilidad) conocida, y (3) viene traducido (o expresado) en la escala de esa distribucin de probabilidad. La decisin (H0 s o H0 no?) La decisin requiere, en primer lugar, trazar un punto de corte (o dos, en el contraste bilateral), que definir dos zonas, una de rechazo (o crtica) y otra de aceptacin. Ese punto de corte vendr dada por el nivel de confianza y el nivel de riesgo, . La decisin consiste en rechazar la H0 si el estadstico de contraste cae en la regin de rechazo, y mantenerla si cae en la regin de aceptacin. Mantener la H0 significa que la hiptesis es compatible con los datos. Rechazarla implica que ambos son incompatibles, luego consideramos la H0 falsa.

Actividad 1. Leer el texto anterior y presentar control de lectura en forma individual.