Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tanto en el caso de dos variables (regresión simple) como en el de mas de dos variables
(regresión múltiple), el análisis de regresión lineal puede utilizarse para explorar y cuantificar
la relación entre una variable llamada dependiente o criterio (Y) y una o mas variables
llamadas independientes o predictorias (X1, X2,….., Xk), así como para desarrollar una
ecuación lineal con fines predictivos. Además, el análisis de regresión lleva asociados una
serie de procedimientos de diagnóstico (análisis de los residuos, puntos de influencia) que
informan sobre la estabilidad e idoneidad del análisis y que proporcionan pistas sobre como
perfeccionarlo.
Se considera que un diagrama de dispersión ofrece una idea bastante aproximada sobre el
tipo de relación que existe entre dos variables. Pero, además, un diagrama de dispersión
también puede utilizarse como una forma de cuantificar el grado de correlación lineal
existente entre dos variables; basta con observar el grado en que la nube de puntos se ajusta a
una línea recta.
Ahora bien, aunque un diagrama de dispersión permite formarse una primera impresión muy
rápida sobre el tipo de relación existente entre dos variables, utilizarlo como una forma de
cuantificar esa relación tiene un serio inconveniente; la relación entre dos variables no
siempre es perfecta o nula; de hecho, habitualmente no es ni lo uno ni lo otro.
El eje vertical muestra el numero de calorías (por cada tercio de litro) y el horizontal el
contenido de alcohol (expresado en porcentaje). A simple vista, parece existir una relación
positiva entre ambas variables: conforme aumenta el porcentaje de alcohol, también aumenta
el numero de calorías. En esta muestra no hay cervezas que teniendo alto contenido de
alcohol tengan pocas calorías y tampoco hay cervezas que teniendo muchas calorías tengan
poco alcohol. La mayor parte de las cervezas de la muestra se agrupan entre el 4.5% y el 5%
de alcohol, siendo relativamente pocas las cervezas que tienen un contenido de alcohol
inferior a ese. Podríamos haber extendido el rango de la muestra incluyendo cervezas sin
alcohol, pero el rango de calorías y alcohol considerados parece bastante apropiado: no hay,
por ejemplo, cervezas con un contenido de alcohol del 50%, o cervezas sin calorías.
¿Cómo podríamos describir los datos que acabamos de proponer? Podríamos simplemente
que el aumento del porcentaje de alcohol va acompañado de un aumento en el número de
calorías; pero esto, aunque correcto, es poco especifico. ¿Cómo podríamos obtener una
descripción mas concreta de los resultados? Podríamos, por ejemplo, listar los datos
concretos de que disponemos; pero esto, aunque preciso, no resulta demasiado informativo.
Podríamos hacer algo mas interesante. Por ejemplo, describir la pauta observada en la nube
de puntos mediante una función matemática simple, tal como una línea recta. A primera vista,
una línea recta podría ser un buen punto de partida para describir resumidamente la nube de
puntos de la figura anterior.
Yi = Bo + Bi Xi
• Media aritmética
• Media ponderada
• Mediana
• Moda
- Cuartiles
- Deciles
- Percentiles
Ejemplos:
7 9 10 12 13 14 17 18 19
3 9 11 15 la mediana es (9 + 11) / 2 = 10
b) Para series
agrupadas:
donde:
Md: mediana
Md = Li + i N / 2 - faa
Fi i: ancho de intervalo
________________________________
0-2 2 2 N / 2 = 35/2 =
17.5
4-6 14 21 a 17.5
6-8 8 29
8-10 6 35___
35
Aplicando la fórmula.
Md = 4 + 2 ( 17.5 - 7) = 5.5
14
El valor de la mediana es 5.5
a) En series simples
Ejs: 1. En un concurso de belleza, en relación con la medida
de la cintura de las candidatas, se obtuvieron los resultados
siguientes:
________________________
No. De Tamaño de
Candidata la cintura__
18 20 La moda
en el concurso fue de 24 pulgadas
392 22 de
cintura, ya que habían 933 candidatas
933 24 que
tenían dicha medida.
564 26
159 28
41 30
19 32______
b) En series agrupadas
Existen tres métodos:
• Método crudo o simple inspección
_______________
Clases fi___
50-54 1
30-
34 11 2
25-29 13
20-24 9
15-19 6
10-14 4
5-9 2____
Mo = 3Md – 2
Mo = 3(27.3) – 2(25.88)
Mo = 81 - 51.76
Mo = 29.24
• Método de diferencias
______________________
Clases fi_______ Δ1
1–3 1
4–6 4
7–9 9
10 – 12 6 Δ1 = 9 – 4 = 5
13 – 15 2 Δ2 = 9 – 6 = 3
16 – 18 3________
25
Mo = 7 + 2 ( 5 ) = 7 + 2(0.625) = 8.25
5+3
a) En series simples:
EJERCICIOS:
a) 3, 5, 8, 3, 7, 2 R/ Mg = 4.14
b) En series agrupadas:
Ejemplo: de los datos de la siguiente tabla encontrar la Mg
_____________________________
50 3 1.698970 5.096910 Mg =
antilog 64.883466
75 6 1.875061 11.250366
32
32 64.883466 calculadora
Cuartiles (Q)
____25%________|_____50%_______|_____75%_______|____100%______
_
Q1 Q2 Q3
D1 D2 D3 D4 D5 D6 D7
D8 D9
__1%__|__2%__|__3%__|__4%__|_..................................._|_100%_
P1 P2 P3 P4 …………………………….. P99