Está en la página 1de 9

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

USO DE LA SIMULACIN EN HOJA DE CLCULO COMO HERRAMIENTA PEDAGGICA PARA LA INFERENCIA

ESTADSTICA: APLICACIN A LAS PROPIEDADES CLSICAS DE LOS ESTIMADORES


Carlos Martnez de Ibarreta Zorita

Departamento de Mtodos Cuantitativos Universidad Pontificia Comillas (ICADE) de Madrid Resumen


En esta comunicacin se presenta y describe una aplicacin realizada en hoja de clculo (Excel) que, mediante el uso de mtodos de simulacin tipo Montecarlo, ilustra y permite experimentar con algunas de las propiedades clsicas (insesgo, eficiencia, consistencia) de diversos estimadores de parmetros poblacionales, as como las caractersticas de su distribucin muestral. El inters pedaggico de esta aplicacin, ampliamente utilizada por el autor en sus cursos de docencia universitaria, radica en los siguientes aspectos: (a) ofrecer una visin ms intuitiva, aplicada y complementaria de algunos de los conceptos tericos habitualmente enseados en los cursos de inferencia estadstica, lo que facilita su comprensin y asimilacin por parte de los alumnos, (b) mostrar una visin introductoria de las tcnicas de simulacin como herramienta de investigacin y anlisis, (c) permitir un aprendizaje ms activo del alumno en estas materias y, como objetivo de carcter secundario y transversal, (d) posibilitar la mejora en el uso de la hoja de clculo por el alumno como herramienta avanzada para el diseo, planteamiento y solucin de problemas de carcter estadstico. La comunicacin finaliza con posibles propuestas de extensin de esta aplicacin a mbitos diferentes al presentado.

Palabras clave: simulacin Montecarlo, inferencia estadstica, estimacin de parmetros, propiedades de estimadores, insesgo, eficiencia, consistencia, hoja de clculo.

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

1.- INTRODUCCIN En muchas de las licenciaturas universitarias existentes en la actualidad aparece alguna asignatura en la que se aborda el estudio de las nociones bsicas de la Inferencia Estadstica. Este es el caso de la licenciatura en Administracin y Direccin de Empresas (ADE) que se imparte en la Universidad Pontificia Comillas (ICADE), especialidad E-2 en la que tales conceptos aparecen en la asignatura denominada Estadstica Empresarial de tercer curso. La experiencia docente del autor constata la dificultad inicial que suelen tener los alumnos para la comprensin de los conceptos bsicos. Las explicaciones tericas complementadas con ejercicios tradicionales a veces no bastan para que los alumnos interioricen dichos conceptos y no se limiten a la memorizacin de definiciones y frmulas, sin conseguir un aprendizaje efectivo. Por ejemplo, es frecuente que al preguntar a un alumno Qu significa para Vd. que un estimador sea insesgado?, su respuesta, si es un alumno aplicado, sea aquel cuya esperanza coincide con el parmetro al que estima, pero interrogado por lo que entiende de esa definicin, no sea capaz de ir ms all. En este punto, se plantea el uso pedaggico de ejercicios de simulacin realizados en hoja de clculo para intentar cubrir esas lagunas de aprendizaje y comprensin, tendiendo puentes entre la teora y la prctica y como mtodo complementario a la docencia tradicional. El desarrollo de las sesiones de simulacin en hoja de clculo, en lugar de en otra aplicacin estadstica ms especfica, responde a diversas razones, entre las que pueden destacarse las siguientes: (a) ser un programa del que disponen la mayora de ordenadores, (b) su facilidad de aprendizaje y uso, al menos en un nivel bsico,(c) su gran flexibilidad para poder adaptar lo previamente diseado para un problema a otros parecidos y finalmente, (d) por los beneficios aadidos que puede aportar a los alumnos un mayor conocimiento y dominio de esta herramienta ofimtica tanto para otras asignaturas como para su futura vida laboral. Por consiguiente, el inters pedaggico de las sesiones de simulacin, ampliamente utilizadas por el autor en sus cursos de docencia universitaria, radica en los siguientes aspectos: (a) ofrecer una visin ms intuitiva, aplicada y complementaria de algunos de los conceptos tericos habitualmente enseados en los cursos de inferencia estadstica, 2
XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

lo que facilita su comprensin y asimilacin por parte de los alumnos, (b) mostrar una visin introductoria de las tcnicas de simulacin como herramienta de investigacin y anlisis, (c) permitir un aprendizaje ms activo del alumno en estas materias y, como objetivo de carcter secundario y transversal, (d) posibilitar la mejora en el uso de la hoja de clculo por el alumno como herramienta avanzada para el diseo, planteamiento y solucin de problemas de carcter estadstico. El resto de esta comunicacin se estructura como sigue: en primer lugar se describen el planteamiento y los objetivos perseguidos de un problema concreto al que se van a aplicar las tcnicas de simulacin, en segundo lugar, se describe el diseo de la hoja de clculo correspondiente, finalmente, se exponen las conclusiones obtenidas as como posibles propuestas de extensin de esta aplicacin a mbitos diferentes al presentado.

2.- PLANTEAMIENTO DE LA SESIN DE SIMULACIN El ejemplo de simulacin desarrollado en esta comunicacin est centrado en el anlisis emprico del desempeo de dos diferentes estimadores de la media de una poblacin normal con varianza conocida, a travs de la estimacin del mismo en un nmero muy grande de muestras aleatorias simuladas en hoja de clculo. El objetivo pretendido consiste en comparar ambos estimadores respecto de algunas de las propiedades clsicas de los estimadores: insesgo , eficiencia (relativa) y consistencia, as como comparar de forma grfica las distribuciones empricas de ambos, como aproximacin a sus distribuciones de probabilidad tericas. Los estimadores propuestos son la media muestral, ax, y un estimador naive , que ser denominado hx, definido como la semisuma del primer y el ltimo valor de la muestra, es decir: hx =
x1 + x n 2

Se han considerado dos razones para la eleccin de estos dos estimadores: 1) La existencia de grandes diferencias respecto a su desempeo. Si bien ambos son estimadores insesgados, la media muestral presenta una varianza mucho menor que hx, siendo por tanto eficiente en trminos relativos y adems, hx no es un estimador consistente de la media poblacional mientras que ax s.

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

2) La deduccin terica de todos los resultados es bastante sencilla, pudiendo ser realizada previamente incluso por los propios alumnos. En la hoja de clculo Excel, una vez fijados los valores de los parmetros poblacionales, se generan muestras aleatorias de diferentes tamaos, en este caso de tamaos 10, 20 y 100 procedentes de dicha poblacin. Para cada una de ellas se calculan los valores de cada uno de los dos estimadores. Tras obtener los valores correspondientes a un nmero elevado de muestras ( se han generado 10000 para cada uno de los tamaos muestrales considerados), se procede al clculo de sus valores resumen y a la representacin grfica de la distribucin emprica de ambos estimadores.

3.- DISEO DE LA HOJA DE CLCULO En primer lugar, se establecen en las celdas correspondientes, los valores de los parmetros poblacionales: media y desviacin tpica. En este caso, y con el fin de que el ejemplo no resulte demasiado abstracto para los alumnos, se ha pensado que la poblacin represente el peso de una naranja, fijndose un valor medio de 120 gramos y una desviacin tpica de 20 gramos. Seguidamente se procede a la generacin de una muestra aleatoria de tamao 10, otra de tamao 20 y una tercera de tamao 100. Esto se realiza con facilidad usando las funciones estadsticas de las que dispone la hoja de clculo. Por una parte, la funcin ALEATORIO() proporciona un nmero pseudoaleatorio siguiendo la ley uniforme {0,1}, y por otra, la funcin DISTR.NORM.INV(probabilidad acumulada; media; desviacin tpica) permite obtener el valor de una distribucin normal con valores paramtricos cualesquiera que acumula una cierta probabilidad. La combinacin de ambas funciones permite obtener cualquier nmero aleatorio normal en una celda. Esa frmula copiada al resto de celdas permite obtener una muestra simulada. Hay que sealar que la funcin ALEATORIO() de la hoja de clculo Excel es de carcter voltil, esto es, su valor es diferente cada vez que se emplea, y adems, siempre que se introduce cualquier cambio en la hoja, todas las celdas que dependan de esta funcin se recalculan. Esta caracterstica, que puede ser engorrosa en ciertos momentos, en especial cuando se desea conservar algn resultado, es la llave que permite realizar la

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

simulacin tipo Montecarlo, al permitir generar diferentes muestras simuladas mediante un simple reclculo de la hoja1. Una vez generada una muestra de cada tamao, se calculan en distintas celdas los valores de las estimaciones realizadas por los dos estimadores. La Figura 1 muestra la organizacin de todo lo comentado hasta ahora. Figura 1. Diseo de la hoja para generar muestras aleatorias.

Si se ha usado la opcin de bloquear el clculo, basta presionar la tecla de funcin F9 para obtener muestras diferentes y, por consiguiente, nuevos valores de estimacin. Parece claro que si los valores de los estimadores se van conservando de alguna forma y se repite este proceso muchas veces, se acabar teniendo una distribucin emprica de valores de los mismos que estar cercana a la forma de su distribucin terica de probabilidad. Como la repeticin de este proceso de forma manual es inabordable para un nmero de iteraciones alto, se ha programado una sencilla macro en el lenguaje de programacin Visual Basic que la hoja incorpora, para que todo esto se haga de forma automtica. En la Figura 2 se muestra la programacin usada para este caso concreto. Bsicamente lo

Es posible evitar el reclculo no deseado si en el men Herramientas Opciones, en la ventana Calcular se elige el clculo manual. En este caso, slo se realizan clculos en la hoja al presionar la tecla de funcin F9. XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

que hace esta macro es realizar 10000 veces la misma operacin: recalcular la hoja y copiar los valores de las estimaciones en la columna correspondiente a los resultados de cada estimador, cada vez una fila ms abajo. Se ha aadido un contador como mecanismo de control del funcionamiento de la macro. Figura 2. Programacin de la macro para realizar las iteraciones.

Finalmente, se ha elaborado la tabla de frecuencias para cada uno de los estimadores, junto con sus estadsticos resumen (media y desviacin tpica), as como su representacin grfica. Hay que sealar que la tabla de frecuencias y el grfico estn elaborados con intervalos vinculados a los valores especificados en cada caso para los parmetros poblacionales, de forma que queden centrados en torno a la media de las distribuciones. La representacin grfica final tras las 10000 iteraciones aparece reflejada en la Figura 3. Se ha considerado conveniente representar las seis distribuciones muestrales en el mismo grfico, para poder compararlas entre s, y poder alcanzar ms fcilmente los objetivos pedaggicos propuestos.

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

Figura 3. Resultados de la simulacin.

Finalmente, conviene destacar que se ha considerado ms didctico realizar esta sesin de forma que el grfico de las distribuciones de frecuencias se vaya rehaciendo a medida que se van realizando las iteraciones, en lugar de realizar primero todos los clculos y posteriormente el grfico. Esta opcin, no obstante, consume ms recursos de ordenador y puede hacer que todo el proceso lleve bastante ms tiempo, sobre todo en equipos no demasiado potentes.

4.- CONCLUSIONES Y POSIBLES EXTENSIONES De los resultados obtenidos en esta sesin de simulacin, parece interesante destacar a efectos pedaggicos las siguientes cuestiones: a) El hecho de que los estimadores, como estadsticos, i.e. funciones de la muestra, son aleatorios, es decir, cada muestra diferente da una estimacin diferente de un nico parmetro poblacional. b) La nocin intuitiva de estimador insesgado, en el sentido de que la media de muchsimas estimaciones coincide aproximadamente con el

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

verdadero valor del parmetro. En este caso, los dos estimadores propuestos cumplen dicha propiedad. c) La nocin intuitiva de eficiencia relativa. Entre dos estimadores insesgados, ser eficiente en trminos relativos aquel cuya distribucin presente una menor variabilidad en torno a la media, lo que indica que va a ser menos probable que en otros obtener estimaciones que se alejen demasiado en uno o en otro sentido del verdadero valor del parmetro poblacional. En la sesin planteada se aprecia que para cualquiera de los tres tamaos muestrales considerados, la dispersin de la distribucin de valores generados de hx es muy superior a la de la media muestral, tal y como puede apreciarse muy claramente en las representaciones grficas. d) La nocin intuitiva de estimador consistente, en el sentido de que, la distribucin muestral del estimador va teniendo menor dispersin respecto de la media a medida que el tamao muestral va siendo cada vez mayor. Conviene destacar que tener una muestra mayor es disponer de mayor informacin potencial para poder estimar el parmetro poblacional, sin embargo, el estimador hx no hace uso de dicha mayor informacin, pues sea cual sea el tamao muestral slo utiliza dos elementos muestrales. La media muestral ax por el contrario, si aprovecha dicha mayor informacin. Como posibles extensiones de esta aplicacin, se sugieren entre otras las siguientes variantes: distribucin muestral de otros estadsticos o estimadores de distribucin conocida o no, realizacin de contrastes de hiptesis, obteniendo niveles de significacin empricos o construccin de curvas de potencia de contraste, etc. La experiencia docente del autor muestra que, una vez realizada por el profesor una sesin de simulacin, es posible encargar a los alumnos la realizacin como trabajo personal (de carcter voluntario, obviamente) de algunas de estas extensiones sugeridas. Los resultados obtenidos son altamente positivos en general: adems de servir para una comprensin ms profunda y complementaria de los conceptos tericos, se desarrolla el pensamiento cientfico y analtico y se mejoran las capacidades de modelizacin de problemas.

XII jornadas de ASEPUMA

Uso de la simulacin en hoja de clculo como herramienta pedaggica para la inferencia estadstica.

REFERENCIAS BIBLIOGRFICAS PELOSI, M.K. y SANDIFER, T.M. (2000), Doing statistics for business with Excel. Ed Wiley.

XII jornadas de ASEPUMA

También podría gustarte