Objetivos de la asignatura
Conocimiento de herramientas y principios del anlisis estadstico de seales. Descubrir las posibles relaciones estadsticas existentes entre distintas variables/seales aleatorias (independencia, correlacin,...) y como aprovechar su conocimiento (estimacin, prediccin, etc.) Aplicacin de los conceptos tratados a otras disciplinas y problemas reales.
MSc. Patricia Castillo Aranbar
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Introduccin
En el capitulo de Estadstica Descriptiva el alumno estudi las tcnicas para resumir informacin del conjunto de datos para una variable X. Ahora bien, los datos que tratamos de estudiar pueden incluir valores de varias variables relacionadas entre si. Por ejemplo: en un individuo su altura, su peso y su edad, en un gas su presin, su volumen y su temperatura, en un vehculo su potencia, su velocidad y su consumo, etc.
Por ello en este capitulo estudiaremos las tcnicas para resumir informacin de la distribucin del conjunto de datos de los que se conocen dos variables X e Y , llamadas distribuciones bidimensionales o bivariadas.
MSc. Patricia Castillo Aranbar
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Diagramas de dispersin
Al igual que ocurre en el caso unidimensional, tambin es posible hacer grficos de distribuciones de frecuencias bidimensionales. Hay un grafico bidimensional especialmente til; este es el diagrama de dispersin que es simplemente un dibujo cartesiano de la muestra observada. La figura proporciona el diagrama de dispersin de los datos de la muestra de 33 alumnos donde se han medido su altura X y su peso Y . A la vista del diagrama de dispersin de la figura parece constatarse que el peso aumenta con la altura.
MSc. Patricia Castillo Aranbar
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Covarianza
En las siguientes figuras se muestran cuatro diagramas de dispersin. En algunos se aprecia que los puntos estn ms alineados que en otros, es decir, en algunos de ellos hay mayor grado de asociacin lineal.
Correlacin Lineal Correlacin Inversa Correlacin fuerte Correlacin dbil Correlacin Nula
Covarianza
La medida de asociacin lineal ms simple entre dos variables es la covarianza. Viene definida por:
Covarianza: Ejemplo
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Coeficiente de correlacin
El inconveniente de la covarianza como medida de la asociacin lineal entre dos variables es que depende de las unidades de X e Y , por ello se define el coeficiente de correlacin entre dos variables rxy, por:
El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1. 1 r 1 Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.
MSc. Patricia Castillo Aranbar
3)
4)
5)
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Rectas de regresin
Los modelos de regresin provienen de los trabajos de Galton en biologa a finales del siglo XIX. Galton estudi la dependencia de la estatura de los hijos (y) respecto a la de sus padres (x), encontrando lo que denomin regresin a la media. Los padres bajos tienen hijos bajos, pero en promedio ms altos que sus padres, y los padres altos tienen hijos altos, pero en promedio ms bajos que sus padres.
La recta de regresin corresponde a la recta.
que mejor se aproxima a los puntos del diagrama de dispersin para la altura X y el peso Y .
MSc. Patricia Castillo Aranbar
Rectas de regresin
Dada la recta de regresin, a la recta y = a x + b que mejor se aproxima a la nube de puntos del diagrama de dispersin. Para hallar a y b se impone el criterio de que las suma de las distancias cuadrticas di2 sea mnima, donde para cada valor de xi, di es la diferencia entre el valor observado yi y el valor que predice la recta i = axi + b. Como tenemos dos variables, segn se tome x o y como variable independiente, tenemos dos rectas:
Las dos rectas de regresin se cortan en el punto de las medias de las variables (x, y). El producto de las pendientes de las rectas es el cuadrado del coeficiente de correlacin.
Las rectas de regresin se usan para predecir el valor de una variable cuando se conoce la otra, y se debe cumplir que el coeficiente de correlacin sea prximo a -1 o a 1.
Ejemplo 1
En el ao 2000 los ingresos de determinadas empresas, en millones de soles y de empleados en miles, fue:
Determinar el coeficiente de correlacin y la recta de regresin de los ingresos respecto de los empleados. Sea x los empleados e y los ingresos,
Ejemplo 2
El ndice de mortalidad y de una muestra de poblacin que consuma diariamente x cigarrillos aparece en la tabla adjunta, donde se estudiaron siete muestras distintas de poblacin que consuma distinto nmero de cigarrillos:
Estudiar la correlacin. Qu ndice de mortalidad se podra predecir para un consumidor de 32 cigarrillos diarios?
Ejemplo 2
Ejemplo 3
Ejemplo 3
Para una edad de x = 60 aos el modelo lineal predice una presin arterial de:
Ejemplo 4
Hallar a y b.
Ejercicios 8
Ejercicio 8. Se observaron las edades de 5 nios y sus pesos respectivos, obtenindose la tabla:
a) Hallar el coeficiente de correlacin y las dos rectas de regresin b) Qu peso corresponder a un nio de 5 aos? c) Qu edad corresponder a un nio de 22 kg?
Ejercicios 9
Ejercicio 9. Los ingresos en determinadas empresas en miles de euros y de empleados en miles es el siguiente:
a) Estudiar la correlacin entre las variables. b) Hallar la recta de regresin de los ingresos, en miles de euros, respecto de los empleados, en miles.
Ejercicios 10
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones mustrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Parmetros y estadsticos
Los parmetros como la media , la desviacin tpica o la proporcin p son caractersticas constantes de una poblacin. Los estadsticos como la media x, la desviacin tpica Sx o la proporcin |p| son caractersticas de las muestras y son variables aleatorias.
Ejemplo Si por ejemplo decimos que el 42% de los escolares de la comunidad suelen perder al menos un da de clase a causa de gripes y catarros, nos referimos a la poblacin y la proporcin la designamos por p = 0.42. Sin embargo, si observamos 1000 escolares donde 540 han perdido clase nos referimos a la muestra y la proporcin la designamos por |p| = 0.54.
Contenido
Introduccin Diagramas de dispersin Covarianza Coeficiente de correlacin Rectas de regresin Parmetros y estadsticos Distribuciones muestrales Intervalos de Confianza Contrastes de hiptesis
MSc. Patricia Castillo Aranbar
Distribuciones muestrales
Si en una poblacin conocemos la proporcin p de los individuos que tienen cierta caracterstica, podemos elegir aleatoriamente muestras de tamao n y obtener la proporcin en cada muestra
Ejemplo 1
Si por ejemplo sabemos que el 40% de los escolares de nuestro instituto tienen laptop en casa, podemos preguntar aleatoriamente a grupos de tamao n = 50 y obtener la proporcin de los que tienen ordenador en cada muestra.
El n de xitos x de una muestra de tamao n se distribuye de forma binomial B(n; p), si lo aproximamos a la distribucin normal N(np;(npq)) y si se divide x por n se obtiene:
MSc. Patricia Castillo Aranbar
Ejemplo 2
Ejemplo 3
El 42% de los habitantes de un municipio es contrario a la gestin del alcalde y el resto son partidarios de este. Si se toma una muestra de 64 individuos, cul es la probabilidad de que ganen los que se oponen al alcalde?
Si cierta caracterstica x en una poblacin es una variable aleatoria normal N(; ), podemos elegir aleatoriamente muestras de tamao n y obtener en cada muestra la media, por ejemplo
Si por ejemplo sabemos que el peso de los libros de texto en el instituto se distribuye de forma normal y su peso medio es de = 400 g y su desviacin tipica = 50 g, podemos tomar aleatoriamente muestras de tamao n = 16 y obtener el peso medio
El peso de los libros de texto en el instituto se distribuye de forma normal con un peso medio de = 400 g y una desviacin tipica = 50 g. Si tomamos una muestra aleatoria de tamao n = 16, hallar la probabilidad de que el peso medio est entre 375 y 425 g.
Bibliografa
Probabilidad y Estadstica para Ingenieros - 6ta Edicion - Ronald E. Walpole , Raymond H. Myers & Myers. P. Z. Peebles Jr., Probability, Random Variables and Random Signal Principles, cuarta edicin, McGrawHill, 2001. A. Papoulis, Probability, Random Variables and Stochastic Processes, cuarta edicin, McGrawHill, 2002.
MSc. Patricia Castillo Aranbar
GRACIAS
Estadstica Inferencial