Inferencia Estadística

APORTE TRABAJO COLABORATIVO #2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

Inferencia Estadística INTRODUCCIÓN Con el propósito de aplicar y comprender más a fondo los conceptos estudiados en la Unidades correspondientes del Curso de Inferencia Estadística . se propone el desarrollo de las siguientes .

 Realizar lecturas que permitan conceptualizar lo referente a telemática .Inferencia Estadística OBJETIVOS  Motivar al estudiante en el abordaje de los temas referentes a familiarizarse con conceptos básicos abordados a lo largo de la Unidad.

está incluido el 95. Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas. R// El nivel de confianza: que queramos que alcancen nuestros result ados también influye en el tamaño que debamos dar a la muestra. Explique los criterios que tiene un investigador para la determinación de estos factores. (la confiabilidad. El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos aceptar para dar como válida nuestra hipótesis del investigador. El tamaño de una muestra para realizar inferencia estadística depen de de unos factores. sin embargo los resultados obtenidos de esta manera nunca serán exactamente iguales. Esto quiere decir que tenemos una probabilidad de que 955/1000 c oincidan con los de la población total. Bugeda (1974) recoge tablas que permiten determinar el volumen de l a muestra y el nivel de estimación para los niveles de confianza del 99. pero no siempre podemos acceder todos. debemos idealmente estudiar a todos los individuos que la conforman. por ello se conocen también como de distribución libre (distribution free). a los que se obtendrían de estudiar a toda la población. la varianza y el error de estimación). pruebas parámetricas y pruebas No parámetricas. Pruebas parámetricas: requieren de variables medidas en la escala de razón o intercalar y de análisis de un parámetro de la población y otros requisitos que dependen de la prueba en específico. que la determinan. antes de realizar el estudio debemos plantearnos. entonces tenemos que escoger una muestra. donde se entiende por sensibilidad a la capacidad de una prueba para detectar diferencias. Entre +2 y -2 sigmas de la curva de distribución normal de Gauss. En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de procedimientos de ordenación y recuento. Estas pruebas comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. pero naturalmente tendremos que elevar el número de elementos de la muestra. es decir. por lo que su base lógica es de fácil comprensión. R// Cuando planteamos un estudio sobre una población. Para determinar el volumen de la muestra. puede interpretarse como la probabilidad de rechazar de manera correcta una hipótesis nula falsa. 2. La variancia y la desviación estándar te dan una idea . siempre va a haber un margen de error. a partir de la media. Pruebas no parámetricas: requieren de que los datos estén en escala nominal u ordinal. Por ello. de acuerdo con el nivel de confianza. En estas pruebas no se presupone una distribución de probabilidad para los datos. La varianza es la desviación estándar al cuadrado. Establezca la diferencia entre: Nivel de significación y potencia de una prueba. existen tablas.5% de la población.Inferencia Estadística 1. Potencia de una prueba: es una medida muy descriptiva y concisa de la sens ibilidad de una prueba estadística.7% y del 95%. que proporción de error estamos dispuestos a aceptar para da r por válido nuestro resultado. en cuyo caso el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de la población sean distintos será de 997/100.

y de ella se saca una ficha. Por ejemplo. Lo puedes usar para detectar outliers (valores fuera de lo normal).10 Cual es la probabilidad de cometer el error tipo II? La probabilidad de cometer el error tipo II es : = P(aceptar Ho/H1 es verdadera) = P(sacar una ficha de 1 o de 10 de la caja B) = 60/100} = 0. 3. Cuan do la varianza es muy grande. tu muestra raramente tendrá una distribución normal. que es la probabilidad de que ocurra este error. caja A y caja B. Es equivalente a la probabilidad de un resultado falso negativo. 50 fichas con el número 10 y 10 fichas con el número 1. se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Hemos de indicar el máximo error tolerable. porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe.Inferencia Estadística de tu muestra y de su distribución (teniendo en cuenta que sea no rmal) (en caso de no ser normal estaríamos hablando de Mediana y Espacio intercuartil IQR) . Error de estimación. es el error que se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Usted no sabe si es la caja A o la caja B. ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad. Es equivalente a encontrar un resultado falso positivo. Se elige una caja al azar.. 50 fichas con el número 10 y 10 fichas con el número 100. Es lógico pensar que no haya una coincidencia total entre los datos de la población y los de la muestra. Ejemplo: se tienen dos cajas. un valor que sea mayor a la Media + 3 SD ya empieza a considerase un outlier. FICHAS # DE FICHAS EN LA CAJA A 40 50 10 # DE FICHAS EN LA CAJA B 10 50 40 1 10 100 Cuál es la probabilidad de cometer el error tipo I? La probabilidad de cometer el error tipo I es el nivel de significación : = P(rechazar Ho/Ho es verdadera) = P(sacar una ficha de 100 de la caja A) = 10/100 = 0.60 .. La caja A tiene 40 fichas con el número 1. que suele establecerse en el 5%. Qué significan el error tipo I y el error tipo II. Pero si queremos rebajar ese error tendremos que aumentar el volumen de la muestra. Explique su interpretación con un ejemplo R// Error de tipo I: también llamado error de tipo alfa. Se tiene las hipótesis: ü Ho: la caja es la A ü H1: la caja es la B Se establece la regla de decisión: rechazar la hipótesis nula si la ficha es de 100. La caja B tiene 40 fichas con el número 100. Error de tipo II: también llamado error de tipo beta (aunque beta es la probabilidad de que exista éste error).

Comprueben a partir de dos muestras independientes de igual tamaño de hombres y mujeres. Interprete los resultados a que diere lugar este caso. Como ejemplo.Inferencia Estadística 4. Para dar respuesta a este caso utilice los pasos para el contraste de una hipótesis. Independencia de las observaciones. la opinión de acuerdo o desacuerdo con algún tema de su interés. La técnica fundamental consiste en la separación de la suma de cuadrados (SS. Rechazar H0 implica aceptar una hipótesis alternativa (H1). puede resultar apropiado un análisis de regresión lineal) SSTotal = SSError + SSFactores El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribución chi -cuadrado describe la suma de cuadrados asociada. en la se establezca si existen diferencias de opinión entre los hombres y mujeres sobre el tema de interés consultado. que puede ser cierta o no. homocedasticidad. mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. Homocedasticidad: homogeneidad de las varianzas. La distribución de los residuales debe ser normal. que deben cumplirse para validar un análisis de varianzas. R// Una hipótesis estadística es una asunción relativa a una o varias poblaciones. (Si los niveles son cuantitativos y los efectos son lineales. R// El ANOVA parte de algunos supuestos que han de cumplirse: ‡ ‡ ‡ ‡ La variable dependiente debe medirse al menos a nivel de intervalo. glTotal = glError + glFactores 5. La situación se puede esquematizar: H0 cierta H0 rechazada H0 no rechazada Error tipo I (a ) Decisión correcta H0 falsa H1 cierta Decisión correcta (*) Error tipo II (b ) . La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Explique cuáles son los supuestos de homogeneidad. independencia y Normalidad. a través del contraste de una hipótesis.

en base a dicha distribución. Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas. y en los otros dos de lateral (derecho en el 2º caso. 5. o equivalentemente. la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica. Establezca las consideraciones que deben hacerse para seleccionar ent re un modelo paramétrico o su correspondiente No paramétrico. d ependiendo del interés del investigador en el primer caso se habla de contraste bilateral o de dos colas. . Establecer la hipótesis nula en términos de igualdad 2. produciendo así modelos no muy confiables que generan sesgos y deterioran la calidad de los pronósticos. que puede hacerse de tres maneras. Los pasos necesarios para realizar un contraste relativo a un parámetro q son: 1. Por otro lado. Se pueden usar con datos cualitativos. Cuando no se recha za. En el campo no paramétrico se evita este problema al permitir una forma funcional flexible. u otro más alejado de la H0. por eso es necesario que tenga la igualdad. simplemente no se ha podido rechazar. Consideraciones de las pruebas no parametricas sobre las pruebas parametricas: Por lo general. si el estadístico cayera en la misma. aumentando n. o izquierdo en el 3º) o una cola. son fáciles de usar y entender. Elegir un nivel de significación: nivel crítico para a 4. R//. Obsérvese que. Establecer la hipótesis alternativa. calcular el "valor p" del estadístico (probabilidad de obtener ese valor. en consecuencia. Los métodos paramétricos en muchas ocasiones no cumplen con los supuestos acerca de la forma funcional del conjunto de var iables aleatorias de las cuales provienen los datos. 6.Inferencia Estadística (*) Decisión correcta que se busca a = p(rechazar H0|H0 cierta) b = p(aceptar H0|H0 falsa) Potencia =1-b = p(rechazar H0|H0 falsa) Detalles a tener en cuenta 1 a y b están inversamente relacionadas. Se pueden usar con muestras pequeñas. se rechazaría H0. se está más seguro cuando se rechaza una hipótesis que cuando no. la decisión se toma en base a la distribución muestral en H0. Los métodos no paramétricos tienen ventajas sobre los paramétrico. no se ha demostrado nada. 2 Só lo pueden disminuirse las dos. de esta manera. Por eso se fija como H0 lo que se quiere rechazar. y no u n conjunto pequeño de modelos rígidos como lo hacen los paramétricos. si H0 fuera cierta) y compararlo con a. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer. 3.

R//. R// CHI ± CUADRADO Se utiliza cuando: ‡ ‡ ‡ ‡ Cuando los datos puntualizan a las escalas nominal u ordinal. Es importante observar. Poblaciones pequeñas. Una de las opciones que tiene la estadística para realizar inferencia sobre los parámetros de una población es la prueba de hipótesis. Se utiliza solo la frecuencia. En otras palabras es verificar el proceso y ver si está la bien. etc. 7. La prueba de hipótesis es planear una hipótesis y saber si la hipótesis nula es verdadera o no. como también si se acepta mejor la hipótesis alternativa. 8. . No son tan eficientes com o las paramétricas.Inferencia Estadística Consideraciones de las pruebas parametricas sobre las pruebas no parametricas: A veces. Explique en que condiciones debe usarse cada uno de ellos. Explique las ventajas y desventajas con respecto al otro método de estimación. Cuando se desconocen los parámetros media. que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la población que se muestrea. Por lo general. ignoran. Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II). desperdician o pierden información. moda. También que la prueba de hipótesis que vimos hoy es que se tomaba 2 observaciones para ver si son las mismas. muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada. Los dos métodos No paramétricos para realizar una bondad de ajuste de los datos de una variable con respecto a una distribución de probabilidad son: El de Chi ± cuadrado y el de Kolmogorov ± Smirnov. las pruebas paramétricas son más poderosas que las pruebas no paramétricas y deben usarse siempre que sea posi ble.

Cuando se utiliza la técnica anova se deben cumplir los siguientes supuestos: 1. También se usa para probar hipótesis acerca de distribuciones discretas. 2. Se basa en calcular las diferencias. 3. El análisis de varianza es una técnica estadística utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones re alizadas una experimentación. en cada clase. ‡ Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias. ‡ ‡ ‡ Cuando la muestra es seleccionada no probabilísticamente. aunque se aceptan ligeras desviaciones de las condiciones ideales: 1. Cuando se quiere contrastar o comparar hipótesis. X2 permite establecer diferencias entre f y se utiliza solo en escala nominal. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio. Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis.muestras pequeñas no representativas >5. Población > a 5 y < a 20. 3. . Cada conjunto de datos debe ser independiente del resto. a partir de poblaciones normalmente distribuidas. Los resultados obtenidos para cada conjunto deben seguir una distribución normal. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta técnica.Inferencia Estadística ‡ ‡ ‡ Cuando los datos son independientes. KOLMOGOROV ± SMIRNOV La prueba KOLMOGOROV ± SMIRNOV se aplica a distribuciones de tipo ordinal. en valor absoluto. 2. Investigaciones de tipo social . entre las frecuencias acumuladas relativas observadas y las esperadas. La varianza de los subgrupos debe ser homogénea. Las muestras que constituyen los grupos deben ser independientes. 9. R//.

Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. generen estimaciones de varianza independiente s. Explique el significado de cada uno de ellos en un análisis de varianza. 10. Existen dos tipos de modelo de análisis de varianza: de efectos fijos y de efectos aleatorios. cada uno de los cuales le afecta sólo a la media. y que por lo tanto. permaneciendo la "variable respuesta" con una distribución normal.Inferencia Estadística Amenos de que las muestras sean independientes. la razón de las varianzas inter e intra no adoptará la distribución F. El ejemplo más simple es el de estimar la media desconocida de una población compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medición. R// Los modelos de efectos fijos y aleatorios difieren en la concepción de la población de estudio de partida. El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a vari os factores. .

Inferencia Estadística CONCLUSIÓN Este trabajo fue de gran ayuda ya que nos permitió trabajar la unidad del modulo de Inferencia Estadística y de esta manera trabajar en los puntos que ahí se plantean. esto con el fin de afianzar nuestros conocimientos y de que hiciéramos cada uno de los p untos planteados. .

es/personal2/jpb00000/tinferencia.htm .Inferencia Estadística BIBLIOGRAFÍA y y Modulo de Inferencia estadística http://www.terra.

Sign up to vote on this title
UsefulNot useful