Está en la página 1de 13

ESTADISTICA INFERENCIAL

ZARATE TREJO OLIVIA


I N S T I T U T O UNIDAD V TAREA DE T E C N O L O G I C O INVESTIGACION S U P E R I O R D E CATEDRATICO: INGENIERO JUAN MANUEL HUAUCHINAN GO

23/11/2011

-----------------------------------VARIABLE DEPENDIENTES--------------------------Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los valores de las variables independientes. Se define como propiedad o caracterstica que se trata de cambiar mediante la manipulacin de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente. Es la que explica y condiciona determinada por la variable independiente, la variable dependiente en un experimento es la medida por un investigador para determinar el efecto de la variable independiente. -----------------------------VARIABLE INDEPENDIENTE: -------------------------------Se denomina variable independiente a aqulla que es manipulada por el investigador en un experimento con el objeto de estudiar cmo incide sobre la expresin de la variable dependiente. La variable independiente tambin se conoce con el nombre de variable explicativa, y la variable dependiente se conoce tambin como variable explicada. Esto significa que las variaciones en la variable independiente repercutirn en variaciones de la variable dependiente. As, en el ejemplo de aos de educacin y salario, suponemos que al aumentar los aos de educacin correlativamente aumentan los salarios de las personas, de modo que aos de educacin es la variable independiente o explicativa, ya que ella podra explicar en cierta medida el cambio en el salario de las personas (la variable dependiente). En todo caso hay que tener cuidado con la causalidad, ya que el hecho de que una persona tenga mayor salario que otra no slo depende necesariamente de que una tenga ms educacin que otra; tambin pueden intervenir otros factores, como la suerte, la familia de la que procede, etc.

El nmero de variables que se incluyan en una investigacin depende del objetivo del estudio, definido por la persona que elabora el estudio, y del fenmeno que se estudie. Por supuesto, mientras ms variables independientes se agreguen quiz se obtenga una mejor explicacin de los cambios en la variable dependiente (por ejemplo: si se quiere explicar el cambio en el salario de las personas, puede tomar variables como la edad, el sexo, los aos de educacin, el estrato en que vive, su estado civil, porque si slo utiliza una variable ser difcil creer que el salario de la gente depende por ejemplo slo de si es soltero o casado y, por consiguiente, la explicacin no ser tan evidente como se esperaba originalmente.

------------------------ANALISIS DE CORRELACION---------------------------------------La correlacin estadstica determina la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas. Coeficiente de correlacin El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.

Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin. 3. El coeficiente de correlacin lineal es un nmero real comprendido entre menos 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

Ejercicios Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son: Estatura (X) Pesos (Y) 186 85 189 85 190 86 192 90 193 87 193 91 198 93 201 103 203 100 205 101

Calcular el coeficiente de correlacin:

xi 186 189 190 192 193 193 198 201 203 205 1 950 85 85 86 90 87 91 93

yi

xi2 34 596 35 721 36 100 36 864 37 249 37 249 39 204 40 401 41 209 42 025 380 618

yi2 7 225 7 225 7 396 8 100 7 569 8 281 8 649 10 609 10 000 10 201 85 255

xi yi 15 810 16 065 16 340 17 280 16 791 17563 18 414 20 703 20 300 20 705 179 971

103 100 101 921

Correlacin positiva muy fuerte.

Los valores de dos variables X e Y se distribuyen segn la tabla siguiente: Y/X 100 50 14 1 1 0 18 2 3 0 22 0 1 2 25

Obtener e interpretar el coeficiente de correlacin lineal.

Convertimos la tabla de doble entrada en una tabla simple. xi 100 100 50 50 50 25 yi 14 18 14 18 22 22 fi 1 2 1 3 1 2 10 x i fi 100 200 50 150 50 50 600 x i 2 fi 10 000 20 000 2 500 7 500 2 500 1 250 43 750 y i fi 14 36 14 54 22 44 184 yi2 fi 196 648 196 972 484 968 3 464 x i y i fi 1 400 3 600 700 2 700 1 100 1 100 10 600

Es una correlacin negativa dbil.

-------------------------DIAGRAMA DE DISPERSION--------------------------------Un diagrama de dispersin es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical. Un diagrama de dispersin se llama tambin grfico de dispersin. Descripcin Un diagrama de dispersin se emplea cuando existe una variable que est bajo el control del experimentador. Si existe un parmetro que se incrementa o disminuye de forma sistemtica por el experimentador, se le denomina parmetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. Si no existe una variable dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersin mostrar el grado de correlacin (no causalidad) entre las dos variables. Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlacin puede ser positiva (aumento), negativa (descenso), o nula (las variables no estn correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea de tendencia") con el fin de estudiar la correlacin entre las variables. Una ecuacin para la correlacin entre las variables puede ser determinada por

procedimientos de ajuste. Para una correlacin lineal, el procedimiento de ajuste es conocido como regresin lineal y garantiza una solucin correcta en un tiempo finito. Uno de los aspectos ms poderosos de un grfico de dispersin, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Adems, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos. En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin.

Ejemplo: Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas Fsica 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10

Diagrama de dispersin ------------------------------COEFICIENTE DE DETERMINACION ----------------------En Estadstica, se llama coeficiente de determinacin a la proporcin de la varianza de la variable dependiente que est explicada por un modelo estadstico. Una importante medida estadstica igual al cuadrado del coeficiente de correlacin. Se utiliza a menudo como medida de la eficacia de la cobertura en cuyo caso se mide el porcentaje de la variacin en el precio de una posicin al contado explicada por la variacin en el precio del instrumento de cobertura. Se puede obtener como R2 a partir de una regresin lineal sencilla.

Medida

del

grado

de

dependencia

entre

variables.

Coeficiente que mide el grado de dependencia entre variables, tomando el valor 0 en caso de correlacin nula o el valor 1 en caso de correlacin total. Equivale al cuadrado del coeficiente de correlacin. ------------------------------------MINIMOSCUADRADOS-----------------------------------

Mnimos cuadrados es una tcnica de anlisis numrico encuadrada dentro de la optimizacin matemtica, en la que, dados un conjunto de pares. Se

intenta encontrar la funcin que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico. En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la funcin y los correspondientes en los datos. Especficamente, se llama mnimos cuadrados promedio (LMS) cuando el nmero de datos medidos es 1 y se usa el mtodo de descenso por gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado esperado, con el mnimo de operaciones (por iteracin), pero requiere un gran nmero de iteraciones para converger. Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria. El teorema de Gauss-Mrkov prueba que los estimadores mnimos cuadrticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribucin normal. Tambin es importante que los datos recogidos estn bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en particular, vase mnimos cuadrados ponderados). La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados, minimizando la energa o maximizando la entropa. ---------------------------ECUACION DE REGRESION LINEAL SIMPLE---------------La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple.

"Y es una funcin de X" Como Y depende de X, Y es la variable dependiente, y X es la variable independiente.

Y = f(X)

En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente. En el Modelo de Regresin Simple se establece que Y es una funcin de slo una variable independiente, razn por la cual se le denomina tambin Regresin Divariada porque slo hay dos variables, una dependiente y otra independiente y se representa as: Y = f (X) "Y est regresando por X" La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama regresando variable de respuesta. La variable independiente x se le denomina variable explicativa regresor y se le utiliza para explicar.

ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE En el estudio de la relacin funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de prediccin y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notacin: Y=a+bX+e Donde: a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje Y. b es el coeficiente de regresin poblacional (pendiente de la lnea recta) e es el error

SUPOSICIONES DE LA REGRESIN LINEAL 1. Los valores de la variable independiente X son fijos, medidos sin error. 2. La variable Y es aleatoria
3. Para cada valor de X, existe una distribucin normal de valores de Y

(subpoblaciones Y) 4. Las variancias de las subpoblaciones Y son todas iguales. 5. Todas las medias de las subpoblaciones de Y estn sobre la recta. 6. Los valores de Y estn normalmente distribuidos y son estadsticamente independientes. ESTIMACIN DE LA ECUACIN DE REGRESIN MUESTRAL Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir, encontrar los valores de a y b con los datos observados de la muestra. El mtodo de estimacin es el de Mnimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuacin de regresin muestral estimada es

Que se interpreta como: a es el estimador de a. Es el valor estimado de la variable Y cuando la variable X = 0 b es el estimador de b, es el coeficiente de regresin. Est expresado en las mismas unidades de Y por cada unidad de X. Indica el nmero de unidades en que vara Y cuando se produce un cambio, en una unidad, en X (pendiente de la recta de regresin). Un valor negativo de b sera interpretado como la magnitud del decremento en Y por cada unidad de aumento en X.

Este modelo puede ser expresado como:

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error estndar del estadstico.

Donde

es la desviacin estndar de la poblacin de donde se toman las

muestras, n es el tamao de la muestra y N el de la poblacin.

También podría gustarte