Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. ESTIMACION o INFERENCIA
En los dos primeros mdulos aplicamos los conocimientos de estadstica descriptiva, para justamente poder realizar una descripcin de diferentes caractersticas de un determinado concepto de la realidad. Al final de un diseo descriptivos, viendo como se comportan ciertas variables se pueden terminar haciendo propuestas causales o hiptesis, las cuales debern ser verificadas mediante otra clase de diseo que es el que veremos en los siguientes captulos A partir de esas hiptesis, se intentar conformar teoras explicativas sobre los fenmenos y sus causas. Teoras que slo sern propuestas sobre la realidad, ya que el mtodo probabilstico slo permite aceptar o rechazar estas hiptesis con una seguridad determinada. Por eso una hiptesis repetidamente verificada, igual no da absoluta garanta de su generalizacin ya que, como se dijo siempre hay una posibilidad de error. El mtodo cientfico no garantiza que la generalizacin de una hiptesis confirmada pueda generalizarse a todos los casos, pero s permite la refutacin de una hiptesis con una sola evidencia en contra de ella. El mtodo cientfico slo nos permite ir sabiendo con cierta seguridad como el mundo no es. En base a las hiptesis verificadas igualmente se va armando un modelo o representaciones grficas explicativas de cmo se relacionan los diferentes conceptos que intervienen en un problema. El principal modelo que sustenta muchos de los abordajes estadsticos es; una relacin lineal, directa y en un solo sentido entre causa y efecto. Desgraciadamente ese modelo fue muy til para explicar las enfermedades e ndole microbiana; la causa estaba representada por el microbio y el efecto era una enfermedad especfica. Este modelo result no ser suficiente para explicar muchas de las enfermedades crnicas con un importante factor social y cultural en su intervencin. Se propusieron entonces diferentes modelos con mayor nmero de componentes y una estructura de relaciones ms complicada, modelos que luego tambin se aplicaron inclusive a las enfermedades infecciosas. Por estas razones, cada vez surgen propuestas de anlisis estadsticos ms avanzados, que permiten considerar en conjunto las mltiples causas que muchas veces se relacionan con un evento determinado.
Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida del grado de fiabilidad en el intervalo. En medicina se utiliza generalmente un intervalo con un nivel de confianza de 95%, que significa que existe un 95% de confianza para asegurar que dentro de ese intervalo se encuentra el verdadero valor de la media poblacin. Lo cual es lo mismo que decir que del 95% de todas las muestras se obtendra un valor del estadstico muestral, tal que si
se armara en base a l un intervalo de confianza incluiran al valor verdadero valor poblacional. Slo el 5% de las muestras podra producir un intervalo errneo que no lo incluyera. Por ejemplo en la figura se grafican los intervalos de confianza obtenidos en 11 muestras, todos tienen la misma longitud pero algunos estn ms desviados de la linea central que representara el verdadero valor poblacional. Se puede observar que slo 2 muestras no incluiran al valor poblacional .
El intervalo de confianza se construye en base al estimador muestral, sumndole y restndole dos errores estndar, luego se ver como se obtienen este valor y que significado tiene.
c. A continuacin se listan todas las muestras posibles y su promedio. Luego se realizara una distribucin de las frecuencias de esos promedios muestrales 4
distribucin de frecuencias
(x-X)
-2 -1 0 0 1 2
( x-X)2
4 1 0 0 1 4 S2=10/5:2
valor
0 1 2 3 4 5
frecuencia
0 1 1 2 1 1
d. La media de la distribucin muestral de medias se obtiene por la sumatoria de todos los promedios (18) dividido el nmero de datos (6). El resultado 18/6=3, es el promedio de todos los promedios muestrales e. La desviacin estndar de toda la distribucin muestral de medias, se obtiene de sacar la raz cuadrada de la varianza de todos los promedios muestrales. Esta varianza se obtiene por la sumatoria de la distancia de cada uno de los promedios a ese promedio general, elevado al cuadrado y dividido 6. El D.E por lo tanto es la 2 =1,41. Este valor es menor que el valor, del desvo poblacional que era de 2,236. El resultado del promedio de la poblacin y el promedio de todos los promedios de las muestras es el mismo y eso es as en todos los casos. La distribucin muestral de medias tiene una media igual a la media poblacional. No ocurre lo mismo con el desvo. La curva que se formara al graficar las frecuencias de los valores x, sera ms extendida que la que se obtendra al graficar la frecuencia de los promedios muestrales de x (X). Por lo tanto al ser mas dispersa es mayor el desvo estndar de la distribucin de frecuencias de x (datos) que la distribucin de frecuencias de X (promedios muestrales), el cual se denomina error estndar de la media. La relacin entre ambos desvos depende del tamao de las muestras sobre las cuales se extrajeron los promedios. Cuando mayor es el tamao muestral menor ser el desvo de esos promedios del verdadero valor poblacional. Se observa en la figura 3 curvas donde se evidencia que a mayor tamao de la muestra la curva de la distribucin de promedio, va siendo cada vez ms empinada. Ya tenemos el concepto de error estndar de la media y se entiende claramente que depende de la dispersin de los datos ( ) y en relacin inversa del tamao de la muestra de la cual se extrajo ese estadstico (n), su valor se obtiene dividiendo el valor del desvo poblacional sobre la raz cuadrada del tamao muestral El intervalo de confianza del 95% con un tamao muestral 2, sera muy grande, un gran nivel de incertidumbre, por eso es necesario trabajar con tamaos muestrales de mayor tamao
El intervalo de confianza de 95% por lo tanto es un concepto que se refiere a lo que sucedera si se tuvieran que construir un gran nmero de intervalos semejantes. Ahora bien, el investigador slo saca una muestra, pero sabe por el teorema central, que el intervalo que arme a partir del valor del estadstico obtenido en esa muestra tiene el 95% de probabilidad de contener el valor poblacional, y el 5% de no contenerlo. Por esta cuestin, por ms que se cumpla adecuadamente con todos los pasos, toda estimacin conlleva un error posible, cuyo tamao depender de diversos factores.
N 1 2 3 4 5 6 7 8 9 10
N 1 2 3 4 4
Promedio de las medias muestrales: 30/ 10= 3 Rango: 1,5 a 4,5: 3 E.S.M: 0,91