Estadística inferencial

La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). • La Teoría de muestras. • La estimación de parámetros. • El Contraste de hipótesis. • El Diseño experimental. • La Inferencia bayesiana. • Los métodos no paramétricos

Inferencia Estadística
La Inferencia Estadística es la parte de la estadística matemática que se encarga del estudio de los métodos para la obtención del modelo de probabilidad (forma funcional y parámetros que determinan la función de distribución) que sigue una variable aleatoria de una determinada población, a través de una muestra (parte de la población) obtenida de la misma.

Los dos problemas fundamentales que estudia la inferencia estadística son el "Problema de la estimación" y el "Problema del contraste de hipótesis" Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadística paramétrica ; por el contrario cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadística no paramétrica. En lo que sigue nos vamos a limitar a problemas de inferencia estadística paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución normal, y sólo tendremos que tratar de estimar los parámetros que la determinan, la media y la desviación típica. Esta situación se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribución de probabilidad, por consideraciones teóricas, quedando únicamente indeterminados los parámetros que determinan la función de distribución. Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la población En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la "Teoría de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teoría de Muestras" (procedimientos para tomar muestras de manera apropiada).

la teoría de muestras estudia las técnicas y procedimientos que debemos emplear para que las muestras sean representativas de la población que pretendemos estudiar. pero. Después de cada extracción el individuo seleccionado se devuelve a la población para que pueda volver a ser elegido. clases o estratos. En este tipo de muestreo los estratos se deben elegir de manera que sean lo más homogeneos posible respecto a la variable aleatoria a estudiar y que entre ellos exista la mayor diferencia posible. Vamos a describir dos de las más utilizadas. la muestra tiene que ser representativa de la población. . de forma que los errores en la determinación de los parámetros de la población objeto de estudio sean mínimos. ¿cuál es su media? y ¿cuál es su desviación típica?. Mediante un programa de ordenador o una tabla de generación de números aleatorios. Como es imposible estudiar el peso de todos los niños recién nacidos. La distribución que sigue esta variable aleatoria es normal. y proceder a lo que se llama un muestreo aleatorio estratificado. Afijación Uniforne : Consiste en tomar para la muestra el mismo número de individuos por cada estrato. esta característica depende de múltiples factores y se puede considerar una variable aleatoria. Una caractetrística medible de los individuos de esta población es su peso. seleccionamos a los n individuos que formarán la muestra.Teoría de Muestras Consideremos la población compuesta por los niños españoles al nacer. tenemos que recurrir a la toma de muestras Pues bien. Para conseguirlo. Muestreo Aleatorio Simple Para efectuar este tipo de muestreo en una población con N individuos:   Numeramos de 1 a N los N individuos de la población. Para que la extracción de la muestra sea representativa se deben cumplir dos principios básicos:   Que haya independencia en la selección de los individuos que forman la muestra Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra Para conseguir estos objetivos se emplean distintas técnicas de muestreo. conviene distinguir en ella. Afijación: Es el reparto del tamaño de la muestra entre los diferentes estratos en que hemos dividido la población. para mejorar las estimaciones. Muestreo Aleatorio Estratificado Cuando la población no es homogenea respecto a la variable aleatoria objeto de estudio.

Como el número total de alumnos son 820 y la muestra debe estar formada por 50 alumnos. Se pretende valorar las faltas de ortografía que cometen los alumnos del centro mediante una prueba-dictado de un texto de 20 líneas. se procede a la selección de individuos de cada estrato por muestreo aleatorio simple.Afijación Proporcional : Consiste en distribuir los individuos que forman la muestra proporcionalmente al número de individuos de cada estrato. el cálculo del número de alumnos que se han de tomar de cada estrato es: Ciclos de grado superior : Bachillerato : Ciclos de grado medio : . ciclos de grado medio. bachillerato y 2º ciclo de enseñanza secundaria obligatoria. Dividimos la población en cuatro estratos : ciclos de grado superior. Ciclos de grado medio : 210 alumnos 2º ciclo de enseñanza secundaria obligatoria : 338 alumnos. para minimizar el costo en tiempo y medios. la prueba se pasará a una muestra de 50 alumnos. En esta situación parece conveniente utilizar para la extración de la muestra el muestreo aleatorio estratificado con afijación proporcional. En un isntituto de enseñanza secundaria en que se ofertan los siguientes tipos de enseñanza :     Ciclos de grado superior : 110 alumnos. Una vez determinado el número de individuos que deben pertenecer a cada estrato. Bachillerato : 162 alumnos. Ejemplo práctico.

. error. valor crítico y valor α Contraste de hipótesis Para conocer el tamaño de la muestra en un estudio de investigación en el que queremos conocer las diferencias existentes entre dos hipótesis. variabilidad del parámetro. Si la hipótesis es unilateral o bilateral: El planteamiento de una hipótesis bilateral o "de dos colas" requiere mayor tamaño muestral. cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto. a partir de los valores observados en la muestra estudiada. Además hay que establecer el riesgo que se acepta de cometer un error tipo II. de qué manera. Para el cálculo del tamaño de la muestra en una estimación de parámetros son necesarios los conceptos de Intervalo de confianza. para medir el efecto que tienen en otra variable de interés. utilizando la inferencia estadística. mayor espacio muestral. En un diseño experimental se manipulan deliberadamente una o más variables.2º ciclo de Enseñanza Secundaria Obligatoria Estimación de parámetros La estimación de parámetros consiste en el cálculo aproximado del valor de un parámetro en la población. Normalmente de forma arbitraria se acepta un riesgo del 5%. menor tamaño muestral. nivel de confianza. vinculadas a las causas. y a menor diferencia.    Diseño experimental El diseño experimental es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. Conocer la variabilidad del criterio de evaluación en la población. Definir la Magnitud de la diferencia efecto o asociación que se desea detectar: A mayores diferencias preestablecidas en el planteamiento de la hipótesis. que suele ser entre el 5 y el 20%. debemos conocer previamente:  error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se está dispuesto a aceptar. El diseño experimental prescribe una serie de pautas relativas qué variables hay manipular.

Evidencia y creencias cambiantes La inferencia bayesiana utiliza aspectos del método científico. que implica recolectar evidencia que se considera consistente o inconsistente con una hipótesis dada. uno de los campos de aplicación es en la teoría de la decisión. el sol ha salido después de haberse puesto. Así. . Con evidencia suficiente. visión artificial (simulación de la percepción en general) y reconocimiento de patrones por ordenador. Qué es lo atractivo de la Estadística Bayesiana? i) Construcción axiomática ii) Una sola regla de decisión iii) La única que ofrece solución para ciertos problemas Axiomas de coherencia i) Comparación ii) Transitividad iii) Dominancia-Sustitución iv) Referencia Ejemplos de inferencia Un ejemplo de inferencia bayesiana es el siguiente:  Durante miles de millones de años. Sin embargo. Hay una probabilidad muy alta (o 'Yo creo firmemente que' o 'es verdad que') el sol va a volver a salir mañana. A medida que la evidencia se acumula.Inferencia bayesiana La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta. El sol se ha puesto esta noche. los detractores dicen que este método de inferencia puede estar afectado por un prejuicio debido a las creencias iniciales que se deben sostener antes de comenzar a recolectar cualquier evidencia. los que sostienen la inferencia bayesiana dicen que puede ser utilizada para discriminar entre hipótesis en conflicto: las hipótesis con un grado de creencia muy alto deben ser aceptadas como verdaderas y las que tienen un grado de creencia muy bajo deben ser rechazadas como falsas. El teorema de Bayes se ha derivado del trabajo realizado por el reverendo Thomas Bayes. a menudo podrá hacerse muy alto o muy bajo. El nombre «bayesiana» proviene de uso frecuente que se hace del teorema de Bayes durante el proceso de inferencia. el grado de creencia en una hipótesis se va modificando. Hoy en día. Existe una probabilidad muy baja (o 'yo no creo de ningún modo que' o 'es falso que') el sol no salga mañana.

algunos estadísticos bayesianos creen que las probabilidades pueden tener un valor objetivo y por lo tanto la inferencia bayesiana puede proveer un método objetivo de inducción. E. P(H0) se llama la probabilidad a priori de H0. Se la puede calcular como la suma del producto de todas las hipótesis mutuamente excluyentes por las correspondientes probabilidades condicionales: . dada una nueva evidencia. Multiplicando la probabilidad a priori de la hipótesis por este factor va a resultar en una gran probabilidad a posteriori dada la evidencia. (Ver método científico. en el proceso de inducción y no necesariamente declara proveer un método objetivo de inducción. por lo tanto.La inferencia bayesiana usa un estimador numérico del grado de creencia en una hipótesis aún antes de observar la evidencia y calcula un estimador numérico del grado de creencia en la hipótesis después de haber observado la evidencia. En la inferencia bayesiana. Definiciones formales A pesar de todo. el teorema de Bayes mide cuánto la nueva evidencia es capaz de alterar la creencia en la hipótesis. o probabilidades subjetivas. Se llama también la función de verosimilitud cuando se expresa como una función de E dado H0. P(E) se llama la probabilidad marginal de E: la probabilidad de observar la nueva evidencia E bajo todas las hipótesis mutuamente excluyentes. resultara disponible.) El teorema de Bayes ajusta las probabilidades.  El factor P(E | H0) / P(E) representa el impacto que la evidencia tiene en la creencia en la hipótesis. Si es posible que se observe la evidencia cuando la hipótesis considerada es verdadera. de la siguiente manera: donde     H0 representa una hipótesis. que ha sido inferida antes de que la nueva evidencia. La inferencia bayesiana generalmente se basa en grados de creencia. entonces este factor va a ser grande. llamada hipótesis nula. P(H0 | E) se llama la probabilidad a posteriori de H0 dado E. P(E | H0) se llama la probabilidad condicional de que se cumpla la evidencia E dado que la hipótesis H0 es verdadera. .