Estadística inferencial

La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). • La Teoría de muestras. • La estimación de parámetros. • El Contraste de hipótesis. • El Diseño experimental. • La Inferencia bayesiana. • Los métodos no paramétricos

Inferencia Estadística
La Inferencia Estadística es la parte de la estadística matemática que se encarga del estudio de los métodos para la obtención del modelo de probabilidad (forma funcional y parámetros que determinan la función de distribución) que sigue una variable aleatoria de una determinada población, a través de una muestra (parte de la población) obtenida de la misma.

Los dos problemas fundamentales que estudia la inferencia estadística son el "Problema de la estimación" y el "Problema del contraste de hipótesis" Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadística paramétrica ; por el contrario cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadística no paramétrica. En lo que sigue nos vamos a limitar a problemas de inferencia estadística paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución normal, y sólo tendremos que tratar de estimar los parámetros que la determinan, la media y la desviación típica. Esta situación se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribución de probabilidad, por consideraciones teóricas, quedando únicamente indeterminados los parámetros que determinan la función de distribución. Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la población En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la "Teoría de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teoría de Muestras" (procedimientos para tomar muestras de manera apropiada).

pero. Vamos a describir dos de las más utilizadas. Una caractetrística medible de los individuos de esta población es su peso. Para conseguirlo. La distribución que sigue esta variable aleatoria es normal. Mediante un programa de ordenador o una tabla de generación de números aleatorios. conviene distinguir en ella. y proceder a lo que se llama un muestreo aleatorio estratificado. esta característica depende de múltiples factores y se puede considerar una variable aleatoria. . Como es imposible estudiar el peso de todos los niños recién nacidos. Afijación: Es el reparto del tamaño de la muestra entre los diferentes estratos en que hemos dividido la población. ¿cuál es su media? y ¿cuál es su desviación típica?. Después de cada extracción el individuo seleccionado se devuelve a la población para que pueda volver a ser elegido.Teoría de Muestras Consideremos la población compuesta por los niños españoles al nacer. la teoría de muestras estudia las técnicas y procedimientos que debemos emplear para que las muestras sean representativas de la población que pretendemos estudiar. Afijación Uniforne : Consiste en tomar para la muestra el mismo número de individuos por cada estrato. clases o estratos. En este tipo de muestreo los estratos se deben elegir de manera que sean lo más homogeneos posible respecto a la variable aleatoria a estudiar y que entre ellos exista la mayor diferencia posible. Muestreo Aleatorio Simple Para efectuar este tipo de muestreo en una población con N individuos:   Numeramos de 1 a N los N individuos de la población. para mejorar las estimaciones. seleccionamos a los n individuos que formarán la muestra. de forma que los errores en la determinación de los parámetros de la población objeto de estudio sean mínimos. Muestreo Aleatorio Estratificado Cuando la población no es homogenea respecto a la variable aleatoria objeto de estudio. tenemos que recurrir a la toma de muestras Pues bien. Para que la extracción de la muestra sea representativa se deben cumplir dos principios básicos:   Que haya independencia en la selección de los individuos que forman la muestra Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra Para conseguir estos objetivos se emplean distintas técnicas de muestreo. la muestra tiene que ser representativa de la población.

Dividimos la población en cuatro estratos : ciclos de grado superior. el cálculo del número de alumnos que se han de tomar de cada estrato es: Ciclos de grado superior : Bachillerato : Ciclos de grado medio : . la prueba se pasará a una muestra de 50 alumnos. Ciclos de grado medio : 210 alumnos 2º ciclo de enseñanza secundaria obligatoria : 338 alumnos. Bachillerato : 162 alumnos. se procede a la selección de individuos de cada estrato por muestreo aleatorio simple.Afijación Proporcional : Consiste en distribuir los individuos que forman la muestra proporcionalmente al número de individuos de cada estrato. Una vez determinado el número de individuos que deben pertenecer a cada estrato. Ejemplo práctico. Como el número total de alumnos son 820 y la muestra debe estar formada por 50 alumnos. para minimizar el costo en tiempo y medios. En un isntituto de enseñanza secundaria en que se ofertan los siguientes tipos de enseñanza :     Ciclos de grado superior : 110 alumnos. bachillerato y 2º ciclo de enseñanza secundaria obligatoria. En esta situación parece conveniente utilizar para la extración de la muestra el muestreo aleatorio estratificado con afijación proporcional. ciclos de grado medio. Se pretende valorar las faltas de ortografía que cometen los alumnos del centro mediante una prueba-dictado de un texto de 20 líneas.

nivel de confianza. Conocer la variabilidad del criterio de evaluación en la población. a partir de los valores observados en la muestra estudiada. cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto. valor crítico y valor α Contraste de hipótesis Para conocer el tamaño de la muestra en un estudio de investigación en el que queremos conocer las diferencias existentes entre dos hipótesis. error. mayor espacio muestral. Si la hipótesis es unilateral o bilateral: El planteamiento de una hipótesis bilateral o "de dos colas" requiere mayor tamaño muestral. variabilidad del parámetro. utilizando la inferencia estadística. que suele ser entre el 5 y el 20%. Para el cálculo del tamaño de la muestra en una estimación de parámetros son necesarios los conceptos de Intervalo de confianza. Definir la Magnitud de la diferencia efecto o asociación que se desea detectar: A mayores diferencias preestablecidas en el planteamiento de la hipótesis. vinculadas a las causas. y a menor diferencia. Además hay que establecer el riesgo que se acepta de cometer un error tipo II. En un diseño experimental se manipulan deliberadamente una o más variables.2º ciclo de Enseñanza Secundaria Obligatoria Estimación de parámetros La estimación de parámetros consiste en el cálculo aproximado del valor de un parámetro en la población. de qué manera. menor tamaño muestral.    Diseño experimental El diseño experimental es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. debemos conocer previamente:  error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se está dispuesto a aceptar. Normalmente de forma arbitraria se acepta un riesgo del 5%. El diseño experimental prescribe una serie de pautas relativas qué variables hay manipular. para medir el efecto que tienen en otra variable de interés. .

. que implica recolectar evidencia que se considera consistente o inconsistente con una hipótesis dada. Hoy en día. el grado de creencia en una hipótesis se va modificando. Sin embargo. Hay una probabilidad muy alta (o 'Yo creo firmemente que' o 'es verdad que') el sol va a volver a salir mañana. El teorema de Bayes se ha derivado del trabajo realizado por el reverendo Thomas Bayes. uno de los campos de aplicación es en la teoría de la decisión. El nombre «bayesiana» proviene de uso frecuente que se hace del teorema de Bayes durante el proceso de inferencia. Con evidencia suficiente. Qué es lo atractivo de la Estadística Bayesiana? i) Construcción axiomática ii) Una sola regla de decisión iii) La única que ofrece solución para ciertos problemas Axiomas de coherencia i) Comparación ii) Transitividad iii) Dominancia-Sustitución iv) Referencia Ejemplos de inferencia Un ejemplo de inferencia bayesiana es el siguiente:  Durante miles de millones de años. a menudo podrá hacerse muy alto o muy bajo.Inferencia bayesiana La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta. los que sostienen la inferencia bayesiana dicen que puede ser utilizada para discriminar entre hipótesis en conflicto: las hipótesis con un grado de creencia muy alto deben ser aceptadas como verdaderas y las que tienen un grado de creencia muy bajo deben ser rechazadas como falsas. visión artificial (simulación de la percepción en general) y reconocimiento de patrones por ordenador. Evidencia y creencias cambiantes La inferencia bayesiana utiliza aspectos del método científico. Existe una probabilidad muy baja (o 'yo no creo de ningún modo que' o 'es falso que') el sol no salga mañana. A medida que la evidencia se acumula. los detractores dicen que este método de inferencia puede estar afectado por un prejuicio debido a las creencias iniciales que se deben sostener antes de comenzar a recolectar cualquier evidencia. el sol ha salido después de haberse puesto. El sol se ha puesto esta noche. Así.

P(H0 | E) se llama la probabilidad a posteriori de H0 dado E.  El factor P(E | H0) / P(E) representa el impacto que la evidencia tiene en la creencia en la hipótesis. de la siguiente manera: donde     H0 representa una hipótesis. por lo tanto.La inferencia bayesiana usa un estimador numérico del grado de creencia en una hipótesis aún antes de observar la evidencia y calcula un estimador numérico del grado de creencia en la hipótesis después de haber observado la evidencia. en el proceso de inducción y no necesariamente declara proveer un método objetivo de inducción. o probabilidades subjetivas. entonces este factor va a ser grande. resultara disponible. Si es posible que se observe la evidencia cuando la hipótesis considerada es verdadera. Se llama también la función de verosimilitud cuando se expresa como una función de E dado H0.) El teorema de Bayes ajusta las probabilidades. dada una nueva evidencia. En la inferencia bayesiana. La inferencia bayesiana generalmente se basa en grados de creencia. llamada hipótesis nula. P(E | H0) se llama la probabilidad condicional de que se cumpla la evidencia E dado que la hipótesis H0 es verdadera. Se la puede calcular como la suma del producto de todas las hipótesis mutuamente excluyentes por las correspondientes probabilidades condicionales: . Definiciones formales A pesar de todo. E. (Ver método científico. P(H0) se llama la probabilidad a priori de H0. algunos estadísticos bayesianos creen que las probabilidades pueden tener un valor objetivo y por lo tanto la inferencia bayesiana puede proveer un método objetivo de inducción. que ha sido inferida antes de que la nueva evidencia. P(E) se llama la probabilidad marginal de E: la probabilidad de observar la nueva evidencia E bajo todas las hipótesis mutuamente excluyentes. Multiplicando la probabilidad a priori de la hipótesis por este factor va a resultar en una gran probabilidad a posteriori dada la evidencia. . el teorema de Bayes mide cuánto la nueva evidencia es capaz de alterar la creencia en la hipótesis.