Está en la página 1de 7

Univ. Nacional de Entre Ros Fac.

de Ingeniera Probabilidad y Estadstica

INFERENCIA ESTADSTICA
Pensemos en los tres siguientes ejemplos:
Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinin sobre cambios generales que pretendemos hacer en diversas reas de la tienda. Despus de realizados los cambios, queremos hacer una segunda encuesta para saber cmo se modific la opinin sobre los cambios una vez hechos. Nos interesa la DIFERENCIA. Revisamos varias de nuestras ventas para ver los problemas que se presenten en la facturacin de las mismas. Esto lo realizamos antes de imponer algunas mejoras en el procedimiento de facturacin. Tenemos la intencin de realizar la misma investigacin despus de hechos los cambios para medir la DIFERENCIA. Queremos establecer estndares para el desempeo de los trabajadores a fin de poder ver como es el desempeo actual. De lo que encontremos se van a derivar varias acciones: o o se va a otorgar un estmulo para los trabajadores, se va a establecer una tabla comparativa de desempeo entre las diferentes unidades de la empresa y en base a ella se va a otorgar un estmulo a los gerentes, se va a comparar el desempeo contra el desempeo en los ltimos tres perodos anteriores.

Para establecer los estndares se van a seleccionar varios operarios de cada uno de los dos turnos y se va a medir su rendimiento durante tres das especficos de una semana. Estamos interesados en conocer un VALOR general.

En los tres ejemplos anteriores se tienen muestras obtenidas, quiz al azar, y se trata de conocer valores de la poblacin en base a los de la muestra.
La decisin de si a los clientes les gustaron los cambios la vamos a tomar sobre los valores en la muestra. La mejora en las facturas la vamos a constatar en base a las que observamos. El estndar de desempeo lo vamos a fijar en base a los trabajadores estudiados.

Pero en los tres casos vamos a extender el valor de la muestra o las muestras a la poblacin. Este proceso se llama inferencia.

Errores en la inferencia y qu hace la estadstica con ellos


En todo caso el proceso de inferencia est sujeto a errores. No existe magia alguna que haga que el valor de la muestra coincida con el de la poblacin y si afirmsemos lo contrario seramos unos charlatanes. La diferencia entre los valores de la muestra y los de la poblacin crea incertidumbre acerca de los valores muestrales. Se necesita una manera de establecer las limitaciones del proceso de inferencia. Los procedimientos estadsticos no eliminan los errores en la inferencia. Lo que hacen es que los valores de los errores sean cuantificables mediante afirmaciones de probabilidad. Se dice que los procedimientos estadsticos son medibles porque es posible medir (en trminos de probabilidad) la magnitud del error que cometen.

Tipos de Inferencia

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica En el ejemplo de los clientes del establecimiento, si obtuvimos una muestra estadstica, podemos decir no slo cul es el porcentaje de clientes indiferente a los cambios (por ejemplo 20%, valor en la muestra) sino, adems, cul es la probabilidad de que el porcentaje real sea menor que alguna cantidad (por ejemplo la probabilidad de que sea menor que 25%) o mayor que alguna otra cantidad (por ejemplo mayor que 10%) o que se encuentre entre dos valores (entre 18% y 23%, por ejemplo). Afirmaciones como las anteriores se basan en el hecho de que por haber seleccionado al azar, hay un mecanismo objetivo de generacin de la incertidumbre y mediante deducciones matemticas es posible encontrar las probabilidades mencionadas. Si la seleccin se hubiese hecho ``a juicio'', dependera del buen juicio y no de las matemticas el tamao del error en la inferencia. La medicin de la incertidumbre sera muy complicada y nada confiable. En la mayora de las veces que hacemos inferencia, las probabilidades las calculamos con el modelo normal. En algunos casos este modelo normal es el modelo exacto para la inferencia, pero muy frecuentemente es slo un modelo aproximado.

Estimacin y Prueba de Hiptesis


En la estadstica hay dos formas principales de inferir:
Estimacin y Prueba de hiptesis

La estimacin parte desde suponer un modelo estadstico para la distribucin de la caracterstica que nos interesa en la poblacin. Esta caracterstica es, generalmente, numrica y distinguimos a las variables en continuas y discretas. Si nos interesa el rendimiento o eficiencia de los trabajadores, como en el tercer ejemplo, tendremos el tiempo de realizacin de una tarea especfica (variable continua). En el segundo ejemplo nos interesar el nmero y tipo de errores cometidos en la factura (variable discreta). En el primero nos interesa la opinin que mediremos como favorable o desfavorable (variable discreta = nmero de personas a favor o en contra). Si tiene Ud. inclinaciones ms poticas, recuerde a la reina de las hadas y su problema de enamorarse del primero que vea al despertar; ah tenemos el mismo tipo de situacin: el amado ser guapo o no guapo, y el parmetro desconocido es la ``densidad'' de guapos alrededor de la reina dormida.

I Estimacin
Para estimar partimos de un modelo probabilstico de cmo se distribuye la caracterstica en la poblacin o de cmo se realiz el muestreo. Este modelo incluye cantidades que desconocemos y que llamamos parmetros Por ejemplo, en la encuesta para saber la opinin de los clientes, el nmero de clientes a favor es un parmetro, y la probabilidad de que obtengamos al azar a una persona que Tipos de Inferencia 2

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica est a favor es la proporcin de personas a favor en la poblacin (que desconocemos). Esto se parece al lo de la reina de las hadas. Para los tiempos de realizacin de la tarea, en el tercer ejemplo, podemos suponer una distribucin normal con una media y una desviacin estndar desconocidas; nuestro inters se centrara en el valor del promedio de la poblacin. De la muestra estimamos los valores de los parmetros en la poblacin y esto lo hacemos:
mediante un valor fijo y entonces decimos que tenemos un estimador puntual o mediante un intervalo de posibles valores y le llamamos estimacin por intervalo o intervalo de confianza.

Los mtodos de estimacin puntual pueden tener varias caractersticas estadsticas entre las que sobresalen:
1. 2. 3. 4. Insesgamiento. Que el valor del parmetro coincida con el valor promedio del estimador. Esta propiedad la tienen la mayora de los estimadores usados en la prctica. Consistencia. Que el valor de la muestra se acerque al valor del parmetro al aumentar el tamao de la muestra. Suficiencia. Que el estimador use toda la informacin que la muestra contiene respecto al parmetro de inters. Eficiencia. Que el estimador tenga menor variabilidad que otro posible.

Estimacin puntual y por intervalo


Los estimadores puntuales ms comunes son:
(A) La media de la muestra para estimar el valor promedio en la poblacin. (B) La proporcin en la muestra para estimar la proporcin en la poblacin. (C) La desviacin estndar de la muestra como estimacin de la desviacin estndar de la poblacin.

Es prctica comn hablar de 2 veces la desviacin estndar de un estimador como el error de estimacin. Este error usualmente depende del tamao de la poblacin de donde se saca la muestra, sin embargo esta dependencia es muy moderada para muestras pequeas en relacin al tamao de la poblacin. Algo de esto ya lo experimentamos cuando hablamos de muestreo. Es costumbre no hacer caso de esta correccin por poblacin finita. La otra forma de estimar es ms realista en cierto sentido. Estimamos usando un intervalo. Analicemos el siguiente ejemplo. De 400 entrevistados 220 estn a favor. Qu tan probable es tener 220 o ms a favor cuando las opiniones estn divididas igualmente entre a favor o en contra? Resulta 2.28% o 2.56% dependiendo de la frmula usada. Pero si hubieran sido 1100 de 2000 la probabilidad cambiara a cero (aunque la proporcin: 220 de 400 sea la Tipos de Inferencia 3

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica misma que 1100 de 2000). Si hubieran sido 55 de 100 la proporcin permanece pero la probabilidad aumenta a 15.87%. En estos ejemplos la estimacin puntual permanece igual, pero las probabilidades dan tantos tumbos que concluimos que no es posible que reportemos slo la estimacin puntual, Debemos mencionar el error de estimacin. Una manera muy compacta de hacerlo es un intervalo de confianza. ste consta de dos valores que encierran al parmetro con una probabilidad preestablecida arbitrariamente por nosotros. Lo comn es usar 90% 95% 99%. A esta probabilidad la llamamos confianza. Las frmulas para calcular los intervalos de confianza ms comunes las encontrar en el texto.

II Prueba de hiptesis
Veamos otra forma de hacer la inferencia. La forma de inferir a la que nos referimos se llama genricamente prueba de hiptesis. La palabra prueba aqu se debe entender como una puesta a prueba de la hiptesis para ver si la declaramos falsa o verdadera. Una prueba de hiptesis estadstica es una prueba fundamentalmente emprica. Se trata de confrontar la hiptesis con los hechos. La situacin es similar a la de la minera donde se ensayan muestras de mineral para determinar el grado de metal que contienen. De acuerdo al resultado de los ensayes, se establece si vale la pena la explotacin de la mina. Una hiptesis, de manera abstracta, en el contexto estadstico, es una afirmacin sobre el valor de un parmetro.
Para que la prueba tenga inters debe tratarse de un parmetro con un significado muy claro y, de preferencia, debe indicarnos alguna accin a seguir. La afirmacin puede ser falsa o verdadera, al proponer una hiptesis estadstica no estamos pensando que esa hiptesis sea verdadera. El objetivo de la prueba es, precisamente, decidir si la muestra indica que la hiptesis es falsa o es verdadera. Una prueba de hiptesis hace uso slo de la informacin que est en la muestra. Si en alguna situacin poseyramos informacin aparte de la muestra, hay que disear un mecanismo especfico para usar esa otra informacin. De acuerdo al smil con la minera, podemos equivocarnos. Una muestra, por azar, puede resultar alta en contenido de metal y llevarnos a excavar una mina pobre; de la misma forma, una muestra pobre en metal puede hacernos abandonar la idea de excavar en un sitio que sea muy rico.

Un ejemplo
Las hiptesis Veamos un ejemplo para precisar la idea de una prueba estadstica. Supongamos que la compaa, est contemplando una mejora en la rutina de produccin que nos va a volver ms competitivos porque va a permitir reducir los costos. La nueva rutina ha sido Tipos de Inferencia 4

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica probada en algunas otras partes y ha funcionado; adems, hace las cosas de una manera ms lgica que la rutina actual. Decidimos ponerla a prueba a ver si lo que esperamos de ella se verifica o no. Para que nos decidamos a implantarla de forma definitiva, requerimos ver resultados de ella. La prueba la vamos a hacer analizando si el costo promedio por artculo producido mejora y para eso, vamos a considerar el promedio de artculos producidos. Pero vamos a adoptar el nuevo mtodo slo si mejora en un 30% al promedio actual que es de 60.4 artculos, es decir slo cambiaramos la rutina si el promedio se eleva a 78.5 o ms. Para tener una mejor base de comparacin, vamos a repetir la operacin cincuenta veces y calcularemos el promedio de estas 50 veces. En el ejemplo tenemos una hiptesis: la media poblacional bajo el nuevo mtodo ser mayor que 78.5. Note que esta hiptesis puede resultar falsa en los hechos a pesar de los buenos augurios que tiene. Vamos a contrastarla contra otra: la media no rebasar 78.5. Al hacer la prueba, en realidad necesitamos las dos hiptesis, a una la llamamos nula y a la otra alternativa. En nuestro ejemplo la hiptesis nula es la media no pasa de 78.5. De ser cierta no vamos a hacer nada (por eso se escogi el calificativo NULA). La alternativa es que sea mayor que 78.5. La prueba La idea de la prueba es muy simple, en este caso. Vamos a evaluar la hiptesis nula en base a lo que observemos:
Si el rendimiento promedio de las cincuenta repeticiones es muy bajo, no podremos sostener la hiptesis alternativa y tendremos que quedarnos con la nula. Si el rendimiento promedio supera por mucho los 78.5, concluiremos que la alternativa es la correcta. Pero si supera por poco los 78.5, tendremos duda al respecto.

La regin crtica y los errores Vamos a tener que establecer una cota, por encima de los 78.5, y tomar la decisin de rechazar la nula si la media observada rebasa esa cota. En caso contrario diremos que la evidencia emprica no muestra que el nuevo mtodo sea mejor. Llamamos regin crtica o regin de rechazo a los valores del promedio que nos llevan a la decisin de rechazar la nula. Una consideracin importante para la prueba es que cualquiera que sea la decisin que tomemos nos puede acarrear problemas, ya que la decisin tomada puede ser errnea. Hay que recordar que la decisin la tomamos en base al resultado de una muestra y puede estar equivocado. Adems, como en realidad, estamos probando un par de hiptesis, podemos errar de dos maneras:
1. Podemos rechazar la nula cuando es cierta

Tipos de Inferencia

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica


2. Podemos no rechazarla cuando es falsa.

La numeracin del prrafo anterior no es casual, es convencin llamar a los errores por su nmero: error tipo 1 y error tipo 2. Lo bueno o malo de una prueba se califica en base a la probabilidad de cometer error tipo uno y dos. Llamamos significacin o nivel de significacin de la prueba a la probabilidad de cometer error tipo 1 y la denotamos con la letra griega alfa. Usamos la letra griega beta para denotar a la probabilidad de error tipo 2. En nuestro ejemplo la regin crtica est incompleta, falta especificar la cota de la que hemos hablado, es decir el nmero a partir del cual nuestra decisin ser adoptar el nuevo procedimiento. Para poder especificarla debemos considerar un elemento extrao: qu probabilidad de cometer un error de tipo 1 queremos? Sesgos Hay que reflexionar bien sobre esto ya que es una de las dificultades mayores en el uso de las pruebas de hiptesis. En prrafos anteriores nos hemos referido a la posibilidad de equivocarnos. En el ejemplo, podra pasar que el mtodo nuevo no fuera mejor. Aqu tenemos dos peligros que enfrentar:
El sesgo en la seleccin de la muestra. El azar en la seleccin de la muestra.

Primero hablemos sobre el sesgo al seleccionar. Es claro que queremos probar el nuevo sistema en nuestra propia empresa. Tambin es claro que no lo vamos a ensayar con todo el personal. Cmo escoger al personal para llevar a cabo el experimento? Los ms capaces? Aqu es donde se puede introducir un sesgo que destruya por completo la validez de la prueba. Pero no para ah el peligro. El procedimiento es nuevo; siempre hay un efecto de la novedad. Probablemente el personal har las cosas con ms entusiasmo que de costumbre. Adems, el personal que est probando el nuevo mtodo est percibiendo atencin extra de sus superiores, esto afecta su conducta. En contra se tiene el efecto del aprendizaje. Para poner las cosas de manera ms simple, acurdese lo que sucedi la primera vez que manej un auto. La manera de evitar los sesgos es mediante el control y la aleatorizacin. (Al menos eso dicen los enterados en el diseo de experimentos). En nuestro ejemplo esto se traduce en que evitemos los sesgos anteriores seleccionando al azar. Y esto nos lleva a considerar que la prueba puede fallarnos por mala suerte. Volvamos a considerar el error tipo 1. En nuestro ejemplo, este error consiste en que el mtodo nuevo no produzca la mejora esperada y que por casualidad la muestra tenga un promedio muy grande (es decir, que est en la regin crtica). Alfa Naturalmente que quisiramos que esto no pudiera pasar. Desafortunadamente no hay garantas, slo podemos lograr que la probabilidad del error tipo 1 sea pequea. El nivel

Tipos de Inferencia

Univ. Nacional de Entre Ros Fac. de Ingeniera Probabilidad y Estadstica de significacin se determina de forma arbitraria (as como el nivel de confianza en un intervalo) y la costumbre es usar 10%, 5% o 1%. Regresando a nuestro ejemplo, despus de hacer cuentas y consultar la tabla normal, resulta que si la media de la muestra de 50 rebasa a 78.5 + (0.23)s rechazaremos la nula. Esta regin crtica nos da un alfa = 0.05. Llamamos prueba de una cola a aquella cuya regin crtica se localiza en un extremo de la distribucin muestral ya sea la cola derecha como en nuestro ejemplo o la cola izquierda. No es raro que usemos tambin pruebas de dos colas, situando la regin crtica en ambos extremos de la distribucin muestral. Una prueba as sirve para detectar diferencias en cualquier sentido. A modo de ejemplo: El trabajo del Seor H es la enseanza. Un problema que se le presenta es la gran cantidad de reprobados en las materias que dicta. Revisando los archivos se da cuenta que el porcentaje de reprobados ha sido aproximadamente 60%. Tom un curso de didctica y se di cuenta de varios errores que comete al ensear. Este semestre espera haberlos corregido. Hace una prueba para saber si la proporcin de reprobados disminuy. La hiptesis nula es que la proporcin es 60%, la alterna que la proporcin disminuy. Un error tipo 1 es que su enseanza haya mejorado pero por azar el grupo elegido para este semestre, haya sido malo. Un error tipo 2 es que no haya mejorado su didctica (a pesar del curso) y por casualidad su grupo en este semestre haya tenido pocos reprobados.

Tipos de Inferencia

También podría gustarte