Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Bidimensional
1. Distribuciones bidimensionales
2. Diagramas de dispersión
3. Parámetros marginales de una distribución bidimensional
4. Parámetros que miden las dos variables conjuntamente
5. Rectas de regresión
1. Distribuciones bidimensionales
A partir de esta muestra, pretendemos extraer conclusiones que sirvan para todo el
colectivo de alumnas de 1º bachillerato. En concreto, pretendemos dar respuesta a dos
cuestiones:
1) Saber si existe correlación lineal entre ambas variables; es decir, si los valores que
toma una variable dependen (linealmente) de los que toma la otra, y precisar qué grado
tiene esa dependencia lineal.
2. Diagramas de dispersión
40,5
40
39,5
39
38,5
Zapato 38
37,5
37
36,5
36
35,5
156 158 160 162 164 166 168 170 172 174
Altura
0
0 2 4 6 8 10 12
Correlación no lineal
40
35
30
25
20
15
10
5
0
0 2 4 6 8 10 12
Media aritmética. Nos indica en torno a qué valor central se distribuyen los
valores de cada variable.
Ejemplo conductor:
Varianza. Nos indica el grado de dispersión que tienen los valores de cada
variable respecto de su media. Su símbolo es la letra sigma minúscula al cuadrado
Ejemplo conductor: Para estos cálculos conviene hacer una tabla de este tipo:
La última fila recoge las sumas de los elementos de cada columna. de esa manera:
Desviación típica. La varianza presenta un problema. Si los datos vienen dados por
ejemplo en cm., la varianza vendría en cm2. Para evitar esto se define este nuevo
parámetro como la raíz cuadrada del anterior.
Ejemplo conductor:
Ejemplo conductor:
Observando los resultados del coeficiente de variación, nos damos cuenta que el
conjunto más disperso es el que mayor CV, o sea, ¡el de números de zapatos!
Covarianza. Es una medida que nos hablará de la variabilidad conjunta de las dos
variables numéricas Se define como:
Significado de la covarianza:
Si sxy 0 hay dependencia directa
(positiva), es decir a grandes valores de x
corresponden grandes valores de y.
La gráfica de la derecha representa una
situación de este tipo. En ella se ha centrado
le gráfica en el centro de gravedad.
Si sxy 0 las variables están incorreladas,
es decir no hay relación lineal.
Ejemplo conductor:
Coeficiente de determinación.
Cuando r está próximo a 1 o a - 1, la correlación lineal es fuerte. esto significa que los
cambios de la variable Y se explican, en gran medida, por los cambios de la variable X.
En consecuencia, se pueden hacer estimaciones fiables de Y a partir de X.
Ejemplo conductor:
El 75, 22% de los cambios que se producen en el número de zapato, se explican por los
cambios que se producen en la altura.
5. Rectas de regresión
Al ser una recta ideal, no tiene por qué pasar por ninguno de los puntos dados pero sí lo
más cerca posible de todos ellos. Se trata de aquella recta que haga que la suma de las
desviaciones de los puntos de la nube respecto de los correspondientes de la recta sea lo
menor posible.
2) Su pendiente ha de ser
2) Su pendiente ha de ser
Las rectas de regresión de Y sobre X y de X sobre Y son distintas, por eso hay que
saber qué valor es la dependiente, pues X e Y no son intercambiables.
Ejemplo conductor:
Cuestión 1. ¿Qué número de zapato usará una alumna de 1ºbachillerato que mida 181
cm?
Nos han dado el valor de x y queremos saber el de y, luego primero hay que calcular la
recta de regresión de Y sobre X
Ahora nos dan la y para calcular la x, luego hay que calcular la recta de regresión de X
sobre Y
3) La proximidad del valor x0, para el que quiere hacerse la estimación, a la media .A
medida que nos alejamos de la media, la estimación se hace más arriesgada.
A continuación tienes otro ejemplo. Intenta hacerlo antes sin mirar la resolución,
apoyándote en el ejemplo conductor de todo el tema.
Nº de comerciales 1 2 3 4 5 6
Solución:
2 17 4 289 34
3 30 9 900 90
4 28 16 784 112
5 39 25 1521 195
6 47 36 2209 282
Medias:
Desviaciones típicas:
Covarianza:
Coeficiente de correlación:
Coeficiente de determinación:
El 94% de los cambios producidos en las ventas del mes viene determinado por el
número de comerciales.
b) Hay que obtener la recta de regresión de X sobre Y (ya que nos na dado un valor de
Y y nos piden la estimación de la X)