Estadística inferencial

La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra). • La Teoría de muestras. • La estimación de parámetros. • El Contraste de hipótesis. • El Diseño experimental. • La Inferencia bayesiana. • Los métodos no paramétricos

Inferencia Estadística
La Inferencia Estadística es la parte de la estadística matemática que se encarga del estudio de los métodos para la obtención del modelo de probabilidad (forma funcional y parámetros que determinan la función de distribución) que sigue una variable aleatoria de una determinada población, a través de una muestra (parte de la población) obtenida de la misma.

Los dos problemas fundamentales que estudia la inferencia estadística son el "Problema de la estimación" y el "Problema del contraste de hipótesis" Cuando se conoce la forma funcional de la función de distribución que sigue la variable aleatoria objeto de estudio y sólo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadística paramétrica ; por el contrario cuando no se conoce la forma funcional de la distribución que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadística no paramétrica. En lo que sigue nos vamos a limitar a problemas de inferencia estadística paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución normal, y sólo tendremos que tratar de estimar los parámetros que la determinan, la media y la desviación típica. Esta situación se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribución de probabilidad, por consideraciones teóricas, quedando únicamente indeterminados los parámetros que determinan la función de distribución. Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la población En todos estos problemas que estudia la inferencia estadística juega un papel fundamental la "Teoría de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teoría de Muestras" (procedimientos para tomar muestras de manera apropiada).

Muestreo Aleatorio Simple Para efectuar este tipo de muestreo en una población con N individuos:   Numeramos de 1 a N los N individuos de la población. . Para que la extracción de la muestra sea representativa se deben cumplir dos principios básicos:   Que haya independencia en la selección de los individuos que forman la muestra Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra Para conseguir estos objetivos se emplean distintas técnicas de muestreo. Afijación: Es el reparto del tamaño de la muestra entre los diferentes estratos en que hemos dividido la población. En este tipo de muestreo los estratos se deben elegir de manera que sean lo más homogeneos posible respecto a la variable aleatoria a estudiar y que entre ellos exista la mayor diferencia posible. Para conseguirlo. Una caractetrística medible de los individuos de esta población es su peso. ¿cuál es su media? y ¿cuál es su desviación típica?. la muestra tiene que ser representativa de la población. Vamos a describir dos de las más utilizadas. La distribución que sigue esta variable aleatoria es normal. la teoría de muestras estudia las técnicas y procedimientos que debemos emplear para que las muestras sean representativas de la población que pretendemos estudiar. Muestreo Aleatorio Estratificado Cuando la población no es homogenea respecto a la variable aleatoria objeto de estudio. Mediante un programa de ordenador o una tabla de generación de números aleatorios. Afijación Uniforne : Consiste en tomar para la muestra el mismo número de individuos por cada estrato. conviene distinguir en ella. esta característica depende de múltiples factores y se puede considerar una variable aleatoria. pero. Después de cada extracción el individuo seleccionado se devuelve a la población para que pueda volver a ser elegido. clases o estratos. seleccionamos a los n individuos que formarán la muestra. Como es imposible estudiar el peso de todos los niños recién nacidos.Teoría de Muestras Consideremos la población compuesta por los niños españoles al nacer. de forma que los errores en la determinación de los parámetros de la población objeto de estudio sean mínimos. y proceder a lo que se llama un muestreo aleatorio estratificado. tenemos que recurrir a la toma de muestras Pues bien. para mejorar las estimaciones.

bachillerato y 2º ciclo de enseñanza secundaria obligatoria. Bachillerato : 162 alumnos. Dividimos la población en cuatro estratos : ciclos de grado superior. se procede a la selección de individuos de cada estrato por muestreo aleatorio simple. Ejemplo práctico. para minimizar el costo en tiempo y medios. Una vez determinado el número de individuos que deben pertenecer a cada estrato. Ciclos de grado medio : 210 alumnos 2º ciclo de enseñanza secundaria obligatoria : 338 alumnos.Afijación Proporcional : Consiste en distribuir los individuos que forman la muestra proporcionalmente al número de individuos de cada estrato. En un isntituto de enseñanza secundaria en que se ofertan los siguientes tipos de enseñanza :     Ciclos de grado superior : 110 alumnos. la prueba se pasará a una muestra de 50 alumnos. Se pretende valorar las faltas de ortografía que cometen los alumnos del centro mediante una prueba-dictado de un texto de 20 líneas. ciclos de grado medio. Como el número total de alumnos son 820 y la muestra debe estar formada por 50 alumnos. En esta situación parece conveniente utilizar para la extración de la muestra el muestreo aleatorio estratificado con afijación proporcional. el cálculo del número de alumnos que se han de tomar de cada estrato es: Ciclos de grado superior : Bachillerato : Ciclos de grado medio : .

error.    Diseño experimental El diseño experimental es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. que suele ser entre el 5 y el 20%. Definir la Magnitud de la diferencia efecto o asociación que se desea detectar: A mayores diferencias preestablecidas en el planteamiento de la hipótesis. El diseño experimental prescribe una serie de pautas relativas qué variables hay manipular. debemos conocer previamente:  error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se está dispuesto a aceptar. valor crítico y valor α Contraste de hipótesis Para conocer el tamaño de la muestra en un estudio de investigación en el que queremos conocer las diferencias existentes entre dos hipótesis. En un diseño experimental se manipulan deliberadamente una o más variables. vinculadas a las causas. utilizando la inferencia estadística. Para el cálculo del tamaño de la muestra en una estimación de parámetros son necesarios los conceptos de Intervalo de confianza. para medir el efecto que tienen en otra variable de interés. mayor espacio muestral. y a menor diferencia. . Conocer la variabilidad del criterio de evaluación en la población. Si la hipótesis es unilateral o bilateral: El planteamiento de una hipótesis bilateral o "de dos colas" requiere mayor tamaño muestral. a partir de los valores observados en la muestra estudiada. Normalmente de forma arbitraria se acepta un riesgo del 5%. cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto. menor tamaño muestral. nivel de confianza.2º ciclo de Enseñanza Secundaria Obligatoria Estimación de parámetros La estimación de parámetros consiste en el cálculo aproximado del valor de un parámetro en la población. de qué manera. variabilidad del parámetro. Además hay que establecer el riesgo que se acepta de cometer un error tipo II.

Con evidencia suficiente. Existe una probabilidad muy baja (o 'yo no creo de ningún modo que' o 'es falso que') el sol no salga mañana. los que sostienen la inferencia bayesiana dicen que puede ser utilizada para discriminar entre hipótesis en conflicto: las hipótesis con un grado de creencia muy alto deben ser aceptadas como verdaderas y las que tienen un grado de creencia muy bajo deben ser rechazadas como falsas. que implica recolectar evidencia que se considera consistente o inconsistente con una hipótesis dada. el grado de creencia en una hipótesis se va modificando. a menudo podrá hacerse muy alto o muy bajo. uno de los campos de aplicación es en la teoría de la decisión. A medida que la evidencia se acumula. visión artificial (simulación de la percepción en general) y reconocimiento de patrones por ordenador. Evidencia y creencias cambiantes La inferencia bayesiana utiliza aspectos del método científico. El teorema de Bayes se ha derivado del trabajo realizado por el reverendo Thomas Bayes. el sol ha salido después de haberse puesto. Hoy en día. Así. Hay una probabilidad muy alta (o 'Yo creo firmemente que' o 'es verdad que') el sol va a volver a salir mañana.Inferencia bayesiana La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta. Qué es lo atractivo de la Estadística Bayesiana? i) Construcción axiomática ii) Una sola regla de decisión iii) La única que ofrece solución para ciertos problemas Axiomas de coherencia i) Comparación ii) Transitividad iii) Dominancia-Sustitución iv) Referencia Ejemplos de inferencia Un ejemplo de inferencia bayesiana es el siguiente:  Durante miles de millones de años. Sin embargo. El sol se ha puesto esta noche. . El nombre «bayesiana» proviene de uso frecuente que se hace del teorema de Bayes durante el proceso de inferencia. los detractores dicen que este método de inferencia puede estar afectado por un prejuicio debido a las creencias iniciales que se deben sostener antes de comenzar a recolectar cualquier evidencia.

En la inferencia bayesiana. . Multiplicando la probabilidad a priori de la hipótesis por este factor va a resultar en una gran probabilidad a posteriori dada la evidencia. resultara disponible. (Ver método científico. Si es posible que se observe la evidencia cuando la hipótesis considerada es verdadera. P(E | H0) se llama la probabilidad condicional de que se cumpla la evidencia E dado que la hipótesis H0 es verdadera. en el proceso de inducción y no necesariamente declara proveer un método objetivo de inducción. de la siguiente manera: donde     H0 representa una hipótesis. algunos estadísticos bayesianos creen que las probabilidades pueden tener un valor objetivo y por lo tanto la inferencia bayesiana puede proveer un método objetivo de inducción.  El factor P(E | H0) / P(E) representa el impacto que la evidencia tiene en la creencia en la hipótesis. E. llamada hipótesis nula. entonces este factor va a ser grande. el teorema de Bayes mide cuánto la nueva evidencia es capaz de alterar la creencia en la hipótesis. P(E) se llama la probabilidad marginal de E: la probabilidad de observar la nueva evidencia E bajo todas las hipótesis mutuamente excluyentes. que ha sido inferida antes de que la nueva evidencia.) El teorema de Bayes ajusta las probabilidades. P(H0 | E) se llama la probabilidad a posteriori de H0 dado E. o probabilidades subjetivas. La inferencia bayesiana generalmente se basa en grados de creencia. por lo tanto. Definiciones formales A pesar de todo.La inferencia bayesiana usa un estimador numérico del grado de creencia en una hipótesis aún antes de observar la evidencia y calcula un estimador numérico del grado de creencia en la hipótesis después de haber observado la evidencia. Se la puede calcular como la suma del producto de todas las hipótesis mutuamente excluyentes por las correspondientes probabilidades condicionales: . Se llama también la función de verosimilitud cuando se expresa como una función de E dado H0. dada una nueva evidencia. P(H0) se llama la probabilidad a priori de H0.

Sign up to vote on this title
UsefulNot useful