P. 1
Trabajo Colaborativo II Inferencia Estadistica

Trabajo Colaborativo II Inferencia Estadistica

|Views: 7|Likes:
Publicado porcargonque

More info:

Published by: cargonque on Sep 30, 2013
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

09/30/2013

pdf

text

original

TRABAJO COLABORATIVO 2

1. Establezca la diferencia entre: Nivel de significación y potencia de una prueba; pruebas parametricas y pruebas No parametricas. En la práctica, es frecuente un nivel de significación de 0,05 ó 95% de nivel de confianza, si se escoge el nivel de significación 0,05 (ó 5%), entonces hay unas cinco oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado, en este caso tenemos un 95% de confianza de que la decisión es correcta, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa. La prueba de hipótesis es un procedimiento de toma de decisiones, relacionada principalmente con la elección de una acción entre dos conjuntos posibles de valores del parámetro, es decir, en dos hipótesis estadísticas, que son la Hipótesis nula H0 y la Hipótesis alternativa H1 Se denominan pruebas parametricas se basan en distribución de probabilidad normal, del modelo probabilístico depende la elección del estimador y el calculo de la estimación. Se denominan pruebas no parametricas aquellas que no presuponen una distribución de probabilidad para los datos, por ello se conocen también como de distribución libre.

2. El tamaño de una muestra para realizar inferencia estadística depende de unos factores, (la confiabilidad, la varianza y el error de estimación), Explique los criterios que tiene un investigador para la determinación de estos factores. Siempre que tomamos una muestra, perdemos algo de información útil con respecto a la población. El error de muestreo se puede controlar si seleccionamos una muestra cuyo tamaño sea el adecuado. En general, cuanta más precisión se quiera, más grande será el tamaño de la muestra necesaria. Para determinar la confiabilidad, la varianza y el error de estimación se debe tener en cuenta:  Un estimador es una variable aleatoria, y por lo tanto es posible asociarle probabilidades, lo que resulta de suma utilidad como herramienta auxiliar para la toma de decisiones bajo condiciones de incertidumbre.  Una estimación, en cambio, es un valor particular del estimador, calculado en base a una muestra dada. Por tanto, constituye un valor fijo (no aleatorio) que caracteriza a esa muestra en particular, pero que se usa para inferir el valor de un parámetro desconocido. Entre un estimador puntual y uno por intervalos, es preferible usar este último porque tiene asociado una probabilidad que contempla el error que se puede cometer en la aproximación. Es indispensable entender que es el objetivo de la propuesta de investigación quién guiará los supuestos para determinar el tamaño de muestra, así como lo hace con otros aspectos metodológicos, entre ellos el tipo de estudio. Además es importante asegurarse de que el estudio tendrá suficiente tamaño de muestra para responder a la pregunta de investigación

 

La decisión tomada no esta libre de error. existen factores específicos que intervienen en el cálculo del tamaño muestral: 3. Qué significan el error tipo I y el error tipo II.α ) Probabilidad de acertar el Ho cuando es verdadera. pues. con el propósito de definir las pruebas o medidas que se utilizarán. Rechazar una hipótesis no significa que ésta sea falsa. (Rechazamos una hipótesis cuando debiera ser aceptada). como ejemplifica en el siguiente cuadro. porque ellas serán indispensables en la determinación de la muestra. Igualmente importante es prever un plan de análisis estadístico. Explique su interpretación con un ejemplo. Probabilidad de cometer el error tipo I α Probabilidad de rechazar Ho cuando es verdadera. . (1 . Error I: Rechazar una hipótesis que es verdadera. como tampoco el no rechazarla significa que sea verdadera.

en la se establezca si existen diferencias de opinión entre los hombres y mujeres sobre el tema de interés consultado. independencia y Normalidad. Comprueben a partir de dos muestras independientes de igual tamaño de hombres y mujeres. La falta de homocedasticidad se denomina heterocedasticidad. Cuando se desea conocer la homogeneidad que existe entre tres o más medias muéstrales. técnica que se conoce como . Establecer la hipótesis alternativa. La falta de independencia. La homocedasticidad es que la varianza de los residuos es constante y no varía en los diferentes niveles del factor. se produce fundamentalmente cuando se trabaja con variables aleatorias que se observan a lo largo del tiempo y tiene una gran influencia en las conclusiones del estudio.Error II: No rechazar una hipótesis que es falsa (Aceptamos una hipótesis que debiera ser rechazada). homocedasticidad. (1 . Para dar respuesta a este caso utilice los pasos para el contraste de una hipótesis. La falta de normalidad afecta poco a la tabla ANOVA y a los contrastes de igualdad de medias. o izquierdo en el 3º) o una cola. Establecer la hipótesis nula en términos de igualdad 2. se procede a determinar la variabilidad entre esas medias. pero si afecta a la estimación de 2. Los pasos necesarios para realizar un contraste relativo a un parámetro q son: 1.análisis de varianza. 4. Los contrastes para detectar la dependencia se pueden clasificar en dos tipos: los basados en rachas que se utilizan básicamente cuando se dispone de pocas observaciones y los basados en los coeficientes de auto correlación. y en los otros dos de lateral (derecho en el 2º caso. 3. Interprete los resultados a que diere lugar este caso. la opinión de acuerdo o desacuerdo con algún tema de su interés. 5. que puede hacerse de tres maneras. dependiendo del interés del investigador en el primer caso se habla de contraste bilateral o de dos colas. que deben cumplirse para validar un análisis de varianzas. invalidándolas en la mayoría de los casos. a través del contraste de una hipótesis.β ) Probabilidad de rechazar Ho cuando es falsa. Elegir un nivel de significación: nivel crítico para a . Explique cuales son los supuestos de homogeneidad. Probabilidad de cometer el error tipo II β Probabilidad de aceptar Ho cuando es falsa.

en consecuencia. o pruebas no paramétricas. o equivalentemente. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica. 5. si el estadístico cayera en la misma. Las pruebas de hipótesis hacen inferencias respecto a los parámetros de la población. por eso es necesario que tenga la igualdad. de esta manera. 6. punto que se llama potencia del contraste. En general el único supuesto que se debe cumplir en la mayoría de las pruebas no paramétricas para confiar en ellas. Las hipótesis de una probabilidad no paramétrica se refieren a algo distinto del valor de un parámetro de población. Una de las opciones que tiene la estadística para realizar inferencia sobre los parámetros de una población es la prueba de hipótesis. si H0 fuera cierta) y compararlo con a. simplemente no se ha podido rechazar. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer. Éstas se conocen como pruebas sin distribución. convencionalmente 0. Establezca las consideraciones que deben hacerse para seleccionar entre un modelo paramértico o su correspondiente No paramétrico. En los modelos paramétricos las poblaciones no siempre son normales. u otro más alejado de la H0. la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y. El otro método de estimación (además del tradicional) es el método del valor P: En contrastes de hipótesis. la decisión se toma en base a la distribución muestral en H0. como la media. Se rechaza la hipótesis nula si el valor P asociado al resultado observado es igual o menor que el nivel de significación establecido. Explique las ventajas y desventajas con respecto al otro método de estimación. es que la muestra haya sido seleccionada en forma probabilística 7.01. no se ha demostrado nada. se está más seguro cuando se rechaza una hipótesis que cuando no. conviene utilizar pruebas no paramétricas. Los estadísticos han desarrollado técnicas útiles que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones.4. Es fundamental tener en cuenta que el p-valor está basado en la asunción de la hipótesis de partida (o hipótesis nula). Obsérvese que. Cuando no se rechaza. Estas pruebas paramétricas utilizan la estadística paramétrica de muestras que provinieron de la población que se está probando. suponiendo que la hipótesis nula es cierta. el p-valor está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido. Por eso se fija como H0 lo que se quiere rechazar. en base a dicha distribución. se rechazaría H0. en Estadística. calcular el "valor p" del estadístico (probabilidad de obtener ese valor. al menos para corroborar los resultados obtenidos a partir de la utilización de la teoría basada en la normal. Es .05 ó 0. Por otro lado. Cuando trabajamos con muestras pequeñas (n < 10) en las que se desconoce si es válido suponer la normalidad de los datos.

Explique en que condiciones debe usarse cada uno de ellos. permite medir el grado de concordancia existente entre la distribución de un conjunto de datos y una distribución teórica específica. 8. Así. el p-valor nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que la hipótesis nula es cierta. Mediante la prueba se compara la distribución acumulada de las frecuencias teóricas (ft) con la distribución acumulada de las frecuencias observadas (f obs). se suele decir que valores altos de valor P aceptan la H0 o. simplemente la rechaza o no la rechaza. no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. Sin embargo. El método tradicional Basa su estudio en el estadístico prueba.decir. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables. es decir. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida.Smirnov. mientras que el otro método se apoya en el estadístico prueba y el valor P. Los dos métodos No paramértico para realizar una bondad de ajuste de los datos de una variable con respecto a una distribución de probabilidad son: El de Chi-cuadrado y el de Kolmogorov .05 es usado en investigaciones habituales sociológicas mientras que p-valores de 0. es decir que la tacha de verosímil (lo que no significa obligatoriamente que sea cierta. esto reduce la posibilidad de que el dato obtenido sea casualmente raro. en las que cometer un error puede acarrear consecuencias más graves. Es importante recalcar que un contraste de hipótesis nula no permite aceptar una hipótesis. por lo que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. un p-valor de 0. dicho de forma correcta. Su objetivo es señalar si los datos provienen de una población que tiene la distribución teórica especificada. El análisis de varianza es una técnica estadística utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones . para lo cual se dibuja una gráfica que incluye el estadístico prueba. los valores críticos y la región crítica. 9. pero no indica el grado o el tipo de relación. es decir. nos permite determinar si existe una relación entre dos variables categóricas. EL DE KOLMOGOROV . Valor P es un valor de probabilidad por lo que oscila entre 0 y 1. simplemente es lo más probable que sea cierta que sea falsa) o inverosímil. por lo que se rechaza. no permiten rechazar la H0. Si el p-valor es inferior a la potencia del contraste nos indica que lo más probable es que la hipótesis de partida sea falsa. EL DE CHI CUADRADO La prueba de independencia Chi-cuadrado. De igual manera. se encuentra el punto de divergencia máxima y se determina qué probabilidad existe de que una diferencia de esa magnitud se deba al azar.SMIRNOV La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste".01 se utilizan en investigaciones médicas. Este tipo de errores se puede subsanar rebajando el p-valor. valores bajos de valor P rechazan la H0. también es posible que estemos ante una observación atípica.

 le respuesta es la misma para todas las poblaciones. ANALISIS DE VARIANZA DE EFECTOS FIJOS Es cuando los resultados obtenidos sólo son válidos para esos determinados niveles del factor estudiado y lo que ocurra a otros niveles del factor puede ser diferente.  Las observaciones deben ser independientes. ANALISIS DE VARIANZA DE EFECTOS ALEATORIOS Es cuando los resultados obtenidos son válidos para cualquier nivel del factor estudiado. Explique el significado cada uno de ellos en un análisis de varianza. pues se desperdicia información importante que tiene que ver con la interacción entre las dos variables. Una de las principales condiciones que se deben imponer a las variables tiene que ver con interacción entre los dos factores. Existen dos tipos de modelo de análisis de varianza: de efectos fijos y de efectos aleatorios. El análisis de varianza admite las siguientes suposiciones:  Para cada población la variable de respuesta está normalmente distribuida. no es correcto realizar las dos pruebas ANOVA a los factores por separado. cambia en las diferentes categorías del otro factor. 10. .realizadas una experimentación. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta técnica. Hay interacción entre dos factores si el efecto de uno de los factores. Es decir.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->