Está en la página 1de 5

Qu es un modelo estadstico lineal?

Un modelo lineal es una relacin entre variables matemticas cuantitativas y/o cualitativas (explicativas) y un vector aleatorio de inters Qu es una regresin lineal simple? Tiene como objeto estudiar cmo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido En qu consiste el mtodo de mnimos cuadrados? Es una tcnica de anlisis numrico encuadrada dentro de la optimizacin matemtica, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la funcin, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico. En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias en las ordenadas (llamadas residuos) entre los puntos generados por la funcin elegida y los correspondientes valores en los datos. Especficamente, se llama mnimos cuadrados promedio (LMS) cuando el nmero de datos medidos es 1 y se usa el mtodo de descenso por gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado esperado, con el mnimo de operaciones (por iteracin), pero requiere un gran nmero de iteraciones para converger. Qu supuestos se deben cumplir para usar el modelo de regresin lineal simple? 1. NORMALIDAD. Para cada valor de X, Y es una variable aleatoria con distribucin Normal con media x. [La distribucin de la DFC para cada dosis de la droga es Normal con media x]. 2. HOMOSCEDASTICIDAD. Todas las distribuciones poblacionales tienen la misma varianza. [La varianza de DFC es la misma para todas las dosis]. 3.LINEALIDAD. Las medias x de las distintas poblaciones estn relacionadas linealmente con X. [La media poblacional en la DFC cambia linealmente con la dosis]. x = E(Y/ X= x ) = o + 1 x o = ordenada al origen = MEDIA POBLACIONAL de la variable resultante (DFC) cuando la variable regresora (dosis) toma valor 0. 1 = pendiente = cambio en la MEDIA POBLACIONAL de la variable resultante (DFC) cuando la variable regresora (dosis) aumenta en 1 unidad. 4. INDEPENDENCIA. Los valores de Y son estadsticamente independientes.

[Este supuesto no se cumple, por ejemplo, si para algunos de los individuos tenemos observaciones repetidas]. Qu hiptesis se deben probar en un anlisis de regresin? H0 : Beta 1 = 0 H0: Beta 1 es diferente a cero Qu intervalos de confianza se pueden establecer en un anlisis de regresin? Regularmente se utiliza el 95% Qu supuestos se deben cumplir para usar el anlisis de varianza? La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas. En qu consiste el diseo completamente aleatorizado? esta centrado en comparar los tratamientos en cuanto a sus medais poblacionales y se utiliza cuand el objetivo es comparar mas de dos tratamientos A qu se le llama factor? Variable manipulada o registrada en el experimento. A qu se le llama nivel? Cada uno de los valores o calidades con que se aplica el factor A qu se le llama bloque? Se utiliza para controlar la influencia de un factor que puede afectar en la variable respuesta. Para ello se utiliza el concepto de bloque, que se basa en seleccionar niveles de esta variable y aplicar en cada uno de ellos todos los niveles del factor principal, de esta forma disminuye la variabilidad residual o no explicada. Por tanto, un factor-bloque es un factor cuyo control puede reducir significativamente la variabilidad no explicada y que no interacciona con los factores principales. Qu distribucin se est usando al hacer una anova y qu se compara? Se usa Z y se compara con F Qu describe una salida de anova de cualquier paquete estadstico? Describen La fuente de variacion, grados de libertad, SS, MS Y F Cules son las pruebas post hoc y para qu sirven?

Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de rango post hoc permiten determinar qu medias difieren. La prueba de rango post hoc identifica subconjuntos homogneos de medias que no se diferencian entre s. Prueba de Tukey Se conoce como Tukey-Kramer cuando las muestras no tienen el mismo nmero de datos Dado que el anlisis de varianza acuse un efecto significativo, la prueba de Tukey provee un nivel de significancia global de cuando los tamaos de las muestras son iguales y de a lo sumo a cuando no son iguales. Se basa en la construccin de intervalos de confianza de las diferencias por pares. Si estos intervalos incluyen al 0, entonces no se rechaza la hiptesis nula Mtodo de la Diferencia Mnima de Fisher Utiliza el estadstico F Calcula una diferencia crtica a la que se comparan cada par de promedios Se pueden construr tambin intervalos de confianza para las diferencias por pares Sin embargo, el riesgo global , tiende a crecer con este mtodo (este mtodo utiliza tasas de error individuales). Prueba del Rango Mltiple (Duncan) Se prueban las diferencias entre las medias empezando con la media ms grande contra la segunda ms grande, y as sucesivamente, comparando en cada caso con un valor crtico obtenido por tablas. Muy eficaz y popular debido a su poder de discriminacin. Si el nivel de proteccin es , entonces las pruebas de las medias tienen un nivel de significacin igual o mayor que . Bonferroni Se basa en la distribucin t de Student. Controla la tasa de error dividiendo el nivel de significacin entre el nmero de comparaciones Qu relacin tiene el anlisis de regresin con el anlisis de varianza? el anlisis de la varianza te ayuda a saber que tan valida y que tanto explica tu regresin la prueba F, la R etc

No parametrica Cmo sabemos que debemos optar por la estadstica no paramtrica? Cuando las varianzas no Sean iguales debemos usar no parametricas o cuando no sepamos si la distribucion es normal Qu son las pruebas no paramtricas y cundo se usan? Cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo. Prueba de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogrov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Prueba de los signos Coeficiente de correlacin de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los rangos con signo de Wilcoxon Cules son las ventajas y las desventajas de usar pruebas no paramtricas? ventajas no se requiere de una distribucion normal no se requieere que las varianzas sean iguales

Desventajas Tienen menos potencia (probabilidad de rechazar H0 cuando es falsa) Cules son las pruebas no paramtricas que corresponden a las pruebas paramtricas t, t pareada y anova? T Mann y Witnney T pareada Wiilcoxon ANOCA Kruskal - Wallis Grficas x y, grafica del modelo, coeficientes del modelo, modelo, intervalo de confianza para , coef- ee intervalo de confianza inferior del coeficiente coef +ee intervalo de confianza superior del coeficiente intervalo de confianza para , coef- ee intervalo de confianza inferior del coeficiente coef +ee intervalo de confianza superior del coeficiente intervalo de confianza para Y|xo no se sacarlo representado en la grfica del modelo, coeficiente de regresin, una prueba de hiptesis acerca de el coeficiente regresin (no importa contra qu valor), es f de anova coeficiente de determinacin y anlisis de varianza. R cuadrada TODO CON DISCUSIN Y CONCLUSIONES.

También podría gustarte