P. 1
Copia de 56299268 Trabajo Colaborativo2 Final Infer en CIA a Infer en CIA a

Copia de 56299268 Trabajo Colaborativo2 Final Infer en CIA a Infer en CIA a

|Views: 579|Likes:
Publicado porAlonso Arroyave

More info:

Published by: Alonso Arroyave on Jul 01, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

05/25/2013

pdf

text

original

Inferencia Estadística

APORTE TRABAJO COLABORATIVO #2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

se propone el desarrollo de las siguientes .Inferencia Estadística INTRODUCCIÓN Con el propósito de aplicar y comprender más a fondo los conceptos estudiados en la Unidades correspondientes del Curso de Inferencia Estadística .

Inferencia Estadística OBJETIVOS  Motivar al estudiante en el abordaje de los temas referentes a familiarizarse con conceptos básicos abordados a lo largo de la Unidad.  Realizar lecturas que permitan conceptualizar lo referente a telemática .

por lo que su base lógica es de fácil comprensión. pero naturalmente tendremos que elevar el número de elementos de la muestra. siempre va a haber un margen de error. a los que se obtendrían de estudiar a toda la población. puede interpretarse como la probabilidad de rechazar de manera correcta una hipótesis nula falsa. El tamaño de una muestra para realizar inferencia estadística depen de de unos factores. entonces tenemos que escoger una muestra. R// El nivel de confianza: que queramos que alcancen nuestros result ados también influye en el tamaño que debamos dar a la muestra. por ello se conocen también como de distribución libre (distribution free). La variancia y la desviación estándar te dan una idea . R// Cuando planteamos un estudio sobre una población. la varianza y el error de estimación). que la determinan. Pruebas parámetricas: requieren de variables medidas en la escala de razón o intercalar y de análisis de un parámetro de la población y otros requisitos que dependen de la prueba en específico. En la mayor parte de ellas los resultados estadísticos se derivan únicamente a partir de procedimientos de ordenación y recuento. donde se entiende por sensibilidad a la capacidad de una prueba para detectar diferencias. 2. Esto quiere decir que tenemos una probabilidad de que 955/1000 c oincidan con los de la población total. Por ello. Si queremos alcanzar una mayor certidumbre hemos de abarcar entre +3 y -3 sigmas. Potencia de una prueba: es una medida muy descriptiva y concisa de la sens ibilidad de una prueba estadística. Pruebas no parámetricas: requieren de que los datos estén en escala nominal u ordinal. pero no siempre podemos acceder todos. sin embargo los resultados obtenidos de esta manera nunca serán exactamente iguales.7% y del 95%.5% de la población. en cuyo caso el riesgo de que exista diferencia entre los estadísticos de la muestra y los parámetros de la población sean distintos será de 997/100. que proporción de error estamos dispuestos a aceptar para da r por válido nuestro resultado. Bugeda (1974) recoge tablas que permiten determinar el volumen de l a muestra y el nivel de estimación para los niveles de confianza del 99. En estas pruebas no se presupone una distribución de probabilidad para los datos. Establezca la diferencia entre: Nivel de significación y potencia de una prueba. es decir. Explique los criterios que tiene un investigador para la determinación de estos factores. La varianza es la desviación estándar al cuadrado. está incluido el 95. a partir de la media. pruebas parámetricas y pruebas No parámetricas. de acuerdo con el nivel de confianza. debemos idealmente estudiar a todos los individuos que la conforman. (la confiabilidad. existen tablas.Inferencia Estadística 1. Para determinar el volumen de la muestra. Estas pruebas comparan los grupos a través de una medida de tendencia central (parámetro): la media aritmética. El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos aceptar para dar como válida nuestra hipótesis del investigador. antes de realizar el estudio debemos plantearnos. Entre +2 y -2 sigmas de la curva de distribución normal de Gauss.

Es lógico pensar que no haya una coincidencia total entre los datos de la población y los de la muestra.60 . Es equivalente a la probabilidad de un resultado falso negativo. Pero si queremos rebajar ese error tendremos que aumentar el volumen de la muestra. La caja A tiene 40 fichas con el número 1. es el error que se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Error de estimación... que es la probabilidad de que ocurra este error. un valor que sea mayor a la Media + 3 SD ya empieza a considerase un outlier. Qué significan el error tipo I y el error tipo II. Se tiene las hipótesis: ü Ho: la caja es la A ü H1: la caja es la B Se establece la regla de decisión: rechazar la hipótesis nula si la ficha es de 100. FICHAS # DE FICHAS EN LA CAJA A 40 50 10 # DE FICHAS EN LA CAJA B 10 50 40 1 10 100 Cuál es la probabilidad de cometer el error tipo I? La probabilidad de cometer el error tipo I es el nivel de significación : = P(rechazar Ho/Ho es verdadera) = P(sacar una ficha de 100 de la caja A) = 10/100 = 0.Inferencia Estadística de tu muestra y de su distribución (teniendo en cuenta que sea no rmal) (en caso de no ser normal estaríamos hablando de Mediana y Espacio intercuartil IQR) . que suele establecerse en el 5%. caja A y caja B. y de ella se saca una ficha. Por ejemplo. Ejemplo: se tienen dos cajas. Se elige una caja al azar. se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Error de tipo II: también llamado error de tipo beta (aunque beta es la probabilidad de que exista éste error). 3. 50 fichas con el número 10 y 10 fichas con el número 1.10 Cual es la probabilidad de cometer el error tipo II? La probabilidad de cometer el error tipo II es : = P(aceptar Ho/H1 es verdadera) = P(sacar una ficha de 1 o de 10 de la caja B) = 60/100} = 0. Cuan do la varianza es muy grande. Usted no sabe si es la caja A o la caja B. Es equivalente a encontrar un resultado falso positivo. ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad. La caja B tiene 40 fichas con el número 100. tu muestra raramente tendrá una distribución normal. porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe. Explique su interpretación con un ejemplo R// Error de tipo I: también llamado error de tipo alfa. 50 fichas con el número 10 y 10 fichas con el número 100. Lo puedes usar para detectar outliers (valores fuera de lo normal). Hemos de indicar el máximo error tolerable.

homocedasticidad. La situación se puede esquematizar: H0 cierta H0 rechazada H0 no rechazada Error tipo I (a ) Decisión correcta H0 falsa H1 cierta Decisión correcta (*) Error tipo II (b ) . La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. R// El ANOVA parte de algunos supuestos que han de cumplirse: ‡ ‡ ‡ ‡ La variable dependiente debe medirse al menos a nivel de intervalo. (Si los niveles son cuantitativos y los efectos son lineales. Interprete los resultados a que diere lugar este caso. Comprueben a partir de dos muestras independientes de igual tamaño de hombres y mujeres. Explique cuáles son los supuestos de homogeneidad. 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error.Inferencia Estadística 4. R// Una hipótesis estadística es una asunción relativa a una o varias poblaciones. la opinión de acuerdo o desacuerdo con algún tema de su interés. La distribución de los residuales debe ser normal. puede resultar apropiado un análisis de regresión lineal) SSTotal = SSError + SSFactores El número de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribución chi -cuadrado describe la suma de cuadrados asociada. Independencia de las observaciones. La técnica fundamental consiste en la separación de la suma de cuadrados (SS. Homocedasticidad: homogeneidad de las varianzas. Para dar respuesta a este caso utilice los pasos para el contraste de una hipótesis. a través del contraste de una hipótesis. que deben cumplirse para validar un análisis de varianzas. Como ejemplo. Rechazar H0 implica aceptar una hipótesis alternativa (H1). independencia y Normalidad. que puede ser cierta o no. en la se establezca si existen diferencias de opinión entre los hombres y mujeres sobre el tema de interés consultado. mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. glTotal = glError + glFactores 5.

si el estadístico cayera en la misma. y no u n conjunto pequeño de modelos rígidos como lo hacen los paramétricos. 6. en base a dicha distribución. 5. se rechazaría H0. 3. la decisión se toma en base a la distribución muestral en H0. Los métodos paramétricos en muchas ocasiones no cumplen con los supuestos acerca de la forma funcional del conjunto de var iables aleatorias de las cuales provienen los datos. en consecuencia. Por eso se fija como H0 lo que se quiere rechazar. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica. o equivalentemente. que puede hacerse de tres maneras. Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas. son fáciles de usar y entender. 2 Só lo pueden disminuirse las dos. produciendo así modelos no muy confiables que generan sesgos y deterioran la calidad de los pronósticos. o izquierdo en el 3º) o una cola. Establecer la hipótesis nula en términos de igualdad 2. calcular el "valor p" del estadístico (probabilidad de obtener ese valor. aumentando n. Obsérvese que. y en los otros dos de lateral (derecho en el 2º caso. se está más seguro cuando se rechaza una hipótesis que cuando no. Consideraciones de las pruebas no parametricas sobre las pruebas parametricas: Por lo general. simplemente no se ha podido rechazar. En el campo no paramétrico se evita este problema al permitir una forma funcional flexible. de esta manera. Se pueden usar con muestras pequeñas. si H0 fuera cierta) y compararlo con a. Establecer la hipótesis alternativa. Establezca las consideraciones que deben hacerse para seleccionar ent re un modelo paramétrico o su correspondiente No paramétrico. la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y. Los métodos no paramétricos tienen ventajas sobre los paramétrico. d ependiendo del interés del investigador en el primer caso se habla de contraste bilateral o de dos colas. . Elegir un nivel de significación: nivel crítico para a 4. R//. Por otro lado. u otro más alejado de la H0. no se ha demostrado nada. Los pasos necesarios para realizar un contraste relativo a un parámetro q son: 1.Inferencia Estadística (*) Decisión correcta que se busca a = p(rechazar H0|H0 cierta) b = p(aceptar H0|H0 falsa) Potencia =1-b = p(rechazar H0|H0 falsa) Detalles a tener en cuenta 1 a y b están inversamente relacionadas. Se pueden usar con datos cualitativos. por eso es necesario que tenga la igualdad. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer. Cuando no se recha za.

En otras palabras es verificar el proceso y ver si está la bien. . R// CHI ± CUADRADO Se utiliza cuando: ‡ ‡ ‡ ‡ Cuando los datos puntualizan a las escalas nominal u ordinal. Una de las opciones que tiene la estadística para realizar inferencia sobre los parámetros de una población es la prueba de hipótesis.Inferencia Estadística Consideraciones de las pruebas parametricas sobre las pruebas no parametricas: A veces. como también si se acepta mejor la hipótesis alternativa. R//. Los dos métodos No paramétricos para realizar una bondad de ajuste de los datos de una variable con respecto a una distribución de probabilidad son: El de Chi ± cuadrado y el de Kolmogorov ± Smirnov. 8. Por lo general. las pruebas paramétricas son más poderosas que las pruebas no paramétricas y deben usarse siempre que sea posi ble. Explique las ventajas y desventajas con respecto al otro método de estimación. 7. desperdician o pierden información. ignoran. moda. Cuando se desconocen los parámetros media. Se utiliza solo la frecuencia. etc. muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada. Explique en que condiciones debe usarse cada uno de ellos. Poblaciones pequeñas. que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la población que se muestrea. Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II). Es importante observar. También que la prueba de hipótesis que vimos hoy es que se tomaba 2 observaciones para ver si son las mismas. La prueba de hipótesis es planear una hipótesis y saber si la hipótesis nula es verdadera o no. No son tan eficientes com o las paramétricas.

La varianza de los subgrupos debe ser homogénea. 2. Cuando se utiliza la técnica anova se deben cumplir los siguientes supuestos: 1.Inferencia Estadística ‡ ‡ ‡ Cuando los datos son independientes. a partir de poblaciones normalmente distribuidas. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. X2 permite establecer diferencias entre f y se utiliza solo en escala nominal. Investigaciones de tipo social . aunque se aceptan ligeras desviaciones de las condiciones ideales: 1. Cuando se quiere contrastar o comparar hipótesis. en valor absoluto. ‡ Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias.muestras pequeñas no representativas >5. 2. 9. 3. 3. KOLMOGOROV ± SMIRNOV La prueba KOLMOGOROV ± SMIRNOV se aplica a distribuciones de tipo ordinal. Se basa en calcular las diferencias. El análisis de varianza es una técnica estadística utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones re alizadas una experimentación. Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis. Las muestras que constituyen los grupos deben ser independientes. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta técnica. También se usa para probar hipótesis acerca de distribuciones discretas. R//. en cada clase. Población > a 5 y < a 20. entre las frecuencias acumuladas relativas observadas y las esperadas. Los resultados obtenidos para cada conjunto deben seguir una distribución normal. ‡ ‡ ‡ Cuando la muestra es seleccionada no probabilísticamente. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio. . Cada conjunto de datos debe ser independiente del resto.

10. cada uno de los cuales le afecta sólo a la media. Explique el significado de cada uno de ellos en un análisis de varianza. permaneciendo la "variable respuesta" con una distribución normal.Inferencia Estadística Amenos de que las muestras sean independientes. . y que por lo tanto. R// Los modelos de efectos fijos y aleatorios difieren en la concepción de la población de estudio de partida. generen estimaciones de varianza independiente s. El ejemplo más simple es el de estimar la media desconocida de una población compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medición. Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. Existen dos tipos de modelo de análisis de varianza: de efectos fijos y de efectos aleatorios. la razón de las varianzas inter e intra no adoptará la distribución F. El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a vari os factores.

esto con el fin de afianzar nuestros conocimientos y de que hiciéramos cada uno de los p untos planteados. .Inferencia Estadística CONCLUSIÓN Este trabajo fue de gran ayuda ya que nos permitió trabajar la unidad del modulo de Inferencia Estadística y de esta manera trabajar en los puntos que ahí se plantean.

htm .terra.Inferencia Estadística BIBLIOGRAFÍA y y Modulo de Inferencia estadística http://www.es/personal2/jpb00000/tinferencia.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->