Está en la página 1de 5

Modelos estadsticos

Un modelo estadstico es una expresin simblica en forma de igualdad o ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta.

En alguna ocasin, un director de estudios en una empresa de investigacin de mercados, fsico de profesin y con una prepotencia digna de l mismo, me explicaba que los modelos de mercadeo y, en general, de cualquier campo son acepciones de la realidad que buscan describirla ms no explicarla a cabalidad. Es as como el modelo astronmico de Tolomeo describa con gran precisin la posicin de los planetas en la bveda celeste, aunque como bien lo sabemos no era un modelo que explicara la realidad porque simplemente la tierra no es el centro del universo. Sin embargo era un mal modelo? Seguramente no, el modelo lograba su funcin y desde un punto de vista pragmtico, era lo que se tena en esa poca y funcionaba bien. Steele compara la nocin general de un modelo cualquiera con un modelo estadstico y empieza por considerar dos ejemplos concretos:
1. Modelos arquitectnicos: Planos o maquetas hechos a escala que son fundamentales en la etapa de diseo y el proceso de construccin de cualquier obra. 2. Modelos de ingeniera: Tneles de viento o simulacin de corrientes fluviales.

Steeles piensa que un modelo debe ser visto como un mapa. Incluso el mapa ms barato de una ciudad puede responder a todas las preguntas razonables que uno pueda imaginar acerca del posicionamiento de la ciudad: dnde queda el aeropuerto? Qu tan lejos estoy

de la alcalda? Etc. Un buen mapa turstico es capaz de ubicar sitios histricos que ni siquiera, hoy en da, existen. Sin embargo, la construccin de un modelo estadstico requiere otro tipo de abstracciones. Los estadsticos usamos la palabra modelo de una forma bien diferente a los anteriores ejemplos, ya lo dira G.E.P Box al exclamar:
Todos los modelos son errados, pero algunos son tiles

Es comn considerar la bondad del ajuste del modelo. Tpicamente, un modelo estadstico se considera adecuado si, despus de haber sido calibrado con los datos reales, cumple significativamente con los supuestos considerados en el diseo del estudio. Podramos objetar esta definicin. En particular, parece muy ingenuo ignorar que el comportamiento de las unidades seleccionadas en la muestra, en algunas ocasiones diverge radicalmente, del comportamiento de las unidades que no estn en la muestra, o que fueron seleccionadas en la muestra pero para las cuales existe ausencia de respuesta. Ahora, si el modelos falla en la incorporacin de toda la informacin relevante Debera ser considerado como un modelo no adecuado? Steeles propone cambiar la popular frase bondad del ajuste (goodness of fit, por su traduccin al ingls) por algo ms terrenal como ajuste selectivo (fitness for purpose). Desde mi punto de vista personal, estoy de acuerdo con esta filosofa, no se puede dejar de lado que el usuario de los modelos estadsticos (o de sus primos: los modelos estocsticos o economtricos) tiene unos objetivos claros y definidos al iniciar la investigacin. El estadstico debe formular el modelo que mejor ajuste consiga de manera selectiva con los objetivos de la investigacin, teniendo en cuenta los fundamentos tericos y supuestos del modelo (tarea nada fcil).

Mtodos estadsticos Estudios experimentales y observacionales


Un objetivo comn para un proyecto de investigacin estadstica es investigar la causalidad, y en particular extraer una conclusin en el efecto que algunos cambios en los

valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadsticos para estudiar causalidad: estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo. Un estudio experimental implica tomar mediciones del sistema bajo estudio, manipular el sistema y luego tomar mediciones adicionales usando el mismo procedimiento para determinar si la manipulacin ha modificado los valores de las mediciones. En contraste, un estudio observacional no necesita manipulacin experimental. Por el contrario, los datos son recogidos y las correlaciones entre predictores y la respuesta son investigadas. Un ejemplo de un estudio experimental es el famoso experimento de Hawthorne el cual pretenda probar cambios en el ambiente de trabajo en la planta Hawthorne de la Western Electric Company. Los investigadores estaban interesados en si al incrementar la iluminacin en un ambiente de trabajo, la produccin de los trabajadores aumentaba. Los investigadores primero midieron la productividad de la planta y luego modificaron la iluminacin en un rea de la planta para ver si cambios en la iluminacin afectaran la productividad. La productividad mejor bajo todas las condiciones experimentales. Sin embargo, el estudio fue muy criticado por errores en los procedimientos experimentales, especficamente la falta de un grupo control y seguimiento. Un ejemplo de un estudio observacional es un estudio que explora la correlacin entre fumar y el cncer de pulmn. Este tipo de estudio normalmente usa una encuesta para recoger observaciones acerca del rea de inters y luego produce un anlisis estadstico. En este caso, los investigadores recogeran observaciones de fumadores y no fumadores y luego miraran los casos de cncer de pulmn en ambos grupos. Los pasos bsicos para un experimento son:

Planeamiento estadstico de la investigacin, lo cual incluye encontrar fuentes de informacin, seleccin de material disponible en el rea y consideraciones ticas para la investigacin y el mtodo propuesto. Se plantea un problema de estudio, Disear el experimento concentrndose en el modelo y la interaccin entre variables independientes y dependientes. Se realiza un muestreo consistente en la recoleccin de

datos referentes al fenmeno o variable que deseamos estudiar. Se propone un modelo de probabilidad, cuyos parmetros se estiman mediante estadsticos a partir de los datos de muestreo. Sin embargo, se mantiene lo que se denominan hiptesis sostenidas (que no son sometidas a comprobacin). Se valida el modelo comparndolo con lo que sucede en la realidad. Se utiliza mtodos estadsticos conocidos como test de hiptesis o prueba de significacin. Se producen estadsticas descriptivas. Inferencia estadstica. Se llega a un consenso acerca de qu dicen las observaciones acerca del mundo que observamos. Se utiliza el modelo validado para tomar decisiones o predecir acontecimientos futuros. Se produce un reporte final con los resultados del estudio.

[editar] Niveles de medicin

Hay cuatro tipos de mediciones o escalas de medicin en estadstica. Los cuatro tipos de niveles de medicin (nominal, ordinal, intervalo y razn) tienen diferentes grados de uso en la investigacin estadstica. Las medidas de razn, en donde un valor cero y distancias entre diferentes mediciones son definidas, dan la mayor flexibilidad en mtodos estadsticos que pueden ser usados para analizar los datos. Las medidas de intervalo tienen distancias interpretables entre mediciones, pero un valor cero sin significado (como las mediciones de coeficiente intelectual o temperatura en grados Celsius). Las medidas ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden interpretable para sus valores. Las medidas nominales no tienen ningn rango interpretable entre sus valores. La escala de medida nominal, puede considerarse la escala de nivel ms bajo. Se trata de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la propiedad de orden de los nmeros. La escala de intervalos iguales est caracterizada por una unidad de medida comn y constante. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, permite determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. La escala de coeficientes o Razones es el nivel de medida ms elevado y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.

[editar] Tcnicas de anlisis estadstico

Algunos tests y procedimientos para investigacin de observaciones bien conocidos son:


Prueba t de Student Prueba de Anlisis de varianza (ANOVA) U de Mann-Whitney Anlisis de regresin Correlacin Iconografa de las correlaciones Frecuencia estadstica Anlisis de frecuencia acumulada Prueba de la diferencia menos significante de Fisher Coeficiente de correlacin producto momento de Pearson Coeficiente de correlacin de rangos de Spearman Anlisis factorial exploratorio Anlisis factorial confirmatorio