Está en la página 1de 30

Universidad Católica Boliviana ‘San Pablo’

PROBABILIDAD Y ESTADÍSTICA 1

Vivian Espinoza Romano


§ DOS VARIABLES CUALITATIVAS:
§ Ejemplo: A: Género de la persona
§ B: Modelo de automóviles
§ UNA VARIABLE CUALITATIVA Y UNA CUANTITATIVA (MIXTA):
§ Ejemplo: A: Carrera profesional
§ X: Ingresos/mes
§ DOS VARIABLES CUANTITATIVAS:
§ Ejemplo: X: Estatura
§ Y: Peso
§ Más que analizar lo que pasa con dos variables de tipo cualitativo, la idea es
analizar la relación conjunta que presentan ambos atributos:
§ Tablas de contingencia:

§ Las tablas de contingencia con una buena manera de representar las frecuencias
marginales y conjuntas, éstas pueden ser absolutas(ni) o relativas (hi%), y
también frecuencias acumulativas si es que los atributos son ordinales.
§ Se puede calcular la moda de ambas variables.

§ Y la mediana si son ordinales.

§ No se puede calcular promedios.

§ No se puede calcular varianzas, ni desviaciones estándar.

§ No se puede calcular Coeficientes de asimetría, ni Curtosis.


En este tipo de distribuciones se tiene una mezcla entre una variable (cuantitativa)
y un atributo (cualitativo).
Tablas de contingencia:
En el siguiente ejercicio se verá cómo se obtienen algunos datos informativos a
partir del siguiente ejemplo:
§ En una fábrica se hizo en examen psicotécnico a 22 operarios, clasificándolos
según los resultados en Buenos, Normales y Malos, también se observaron los
errores cometidos por estos operarios al realizar un ensamblaje de ciertas piezas,
durante cierto periodo de tiempo:
TABLAS DE CONTINGENCIA:

Tabla de distribución de frecuencias absolutas: nij

NOTA: Asimismo, se pueden calcular frecuencias relativas hij%


y acumulativas (Nij, Hij%) en caso de ser ordinales
§ Gráfico de barras conjuntos.

§ Modas de ambas variables.

§ Promedio, varianza, desviación estándar de la variable cuantitativa.


§ Todo lo visto anteriormente en estadística Unidimensional, aplica para dos variables
(Estadística Descriptiva Bidimensional), pero lo que importa es cómo se relacionan las
dos variables cuantitativas X,Y.
§ Medidas Marginales :
§ à Promedios: 𝑥,̅ 𝑦
$
§ à Varianzas y Desviaciones estándar: 𝑠!" , 𝑠#" , 𝑠! , 𝑠#
§ Medidas Conjuntas :
§ à Recta de Regresión: 𝑦 = 𝑎 + 𝑏𝑥
§ à Coeficientes de Correlación y Determinación: 𝑟 , 𝑅
§ à Covarianza: 𝐶𝑜𝑣 𝑥, 𝑦 = 𝑆!#
"
§ à Varianza residual: 𝑆#!
§ à Error típico de estimación: 𝑆#!
ANÁLISIS DE REGRESIÓN Y
CORRELACIÓN

Fuente: Elaboración propia


Ciencias Exactas - UCB - Vivian Espinoza R. 12
9

8
Nube de puntos (Datos)

0
0 1 2 3 4 5 6 7 8 9 10

Ciencias Exactas - UCB - Vivian Espinoza R. 13


Fuente: Elaboración propia
§ Lineal simple: y = a + bx
§ Lineal inversa: y = a + b/x
§ Lineal logarítmica: y = a + b ln(x)
§ Exponencial: y = a. bx ó 𝑦 = 𝑎𝑒 !"
§ Potencial: y = a. xb
§ Lineal múltiple: y = a + b1x1 +b2x2 + …+bkxk
§ Lineal polinomial: y = a + b1x1 +b2x22+ …+bkxkk

Ciencias Exactas - UCB - Vivian Espinoza R. 14


16 12

14
10

12
8
10

8 6

6
4

2
2

0 0

y
y

0 2 4 6 8 10 12 0 2 4 6 8 10 12

x x

Dependencia Lineal Directamente proporcional Dependencia Lineal Inversamente proporcional

Ciencias Exactas - UCB - Vivian Espinoza R. 15


Fuente: Elaboración propia
12 10

10
8

8
6

2
2

0 0

y
y

0 2 4 6 8 10 12 0 2 4 6 8 10

x x

Dependencia parabólica No existe dependencia


Ciencias Exactas - UCB - Vivian Espinoza R. 16
Fuente: Elaboración propia
12 12

10 10

8 8

6 6

4 4

2 2

0 0

y
y

0 2 4 6 8 10 12 0 2 4 6 8 10 12

x x

Dependencia exponencial Dependencia logarítmica


Ciencias Exactas - UCB - Vivian Espinoza R. 17
Fuente: Elaboración propia
§ min 𝑧 = ∑$
!"# 𝑒!
% = ∑$ (𝑦 − 𝑦 )%
!"# ! &
'( '( '(
§ =0; =0; = 0 ;…
') '* '+

§ ei: Error o residuo de la i-ésima observación (variables dependientes).

§ yi: Valores observados de la variable dependiente (datos).

§ ye: Valores estimados de la variable dependiente con la ecuación de regresión.


§ a: Constante o intercepto.

§ b, c, d,…: Coeficientes de regresión de las variables independientes.


§ à “Ecuaciones Normales”

Ciencias Exactas - UCB - Vivian Espinoza R. 18


§ Lineal: 𝒚𝒆 = 𝒂 + 𝒃𝒙

∑! 𝑦! = 𝑛𝑎 + 𝑏 ∑! 𝑥! (1)
∑! 𝑥! 𝑦! = 𝑎 ∑! 𝑥! + 𝑏 ∑! 𝑥! % (2)

§ Parabólico: 𝒚𝒆 = 𝒂 + 𝒃𝒙 + 𝒄𝒙𝟐

∑! 𝑦! = 𝑛𝑎 + 𝑏 ∑! 𝑥! + 𝑐 ∑! 𝑥! % (1)
∑! 𝑥! 𝑦! = 𝑎 ∑! 𝑥! + 𝑏 ∑! 𝑥! % + 𝑐 ∑! 𝑥! . (2)
∑! 𝑥! % 𝑦! = 𝑎 ∑! 𝑥! % + 𝑏 ∑! 𝑥! . + 𝑐 ∑! 𝑥! / (3)

Ciencias Exactas - UCB - Vivian Espinoza R. 19


§ Exponencial: 𝒚𝒆 = 𝒂𝒃𝒙
Se aplica logaritmos: ln 𝑦& = ln 𝑎 + 𝑥 ln 𝑏 y las ecuaciones normales son:

∑! 𝑙𝑛𝑦! = 𝑛𝑙𝑛𝑎 + 𝑙𝑛𝑏 ∑! 𝑥! (1)


∑! 𝑥! 𝑙𝑛𝑦! = 𝑙𝑛𝑎 ∑! 𝑥! + 𝑙𝑛𝑏 ∑! 𝑥! % (2)

§ Múltiple: 𝒚𝒆 = 𝒂 + 𝒃𝒙𝟏 + 𝒄𝒙𝟐

∑! 𝑦! = 𝑛𝑎 + 𝑏 ∑! 𝑥#! + 𝑐 ∑! 𝑥%! (1)


∑! 𝑥#! 𝑦! = 𝑎 ∑! 𝑥#! + 𝑏 ∑! 𝑥#! % + 𝑐 ∑! 𝑥#! 𝑥%! (2)
∑! 𝑥%! 𝑦! = 𝑎 ∑! 𝑥%! + 𝑏 ∑! 𝑥#! 𝑥%! + 𝑐 ∑! 𝑥%! % (3)

Ciencias Exactas - UCB - Vivian Espinoza R. 20


Un coeficiente de correlación, mide el grado de relación o asociación existente generalmente
entre dos variables aleatorias. No es conveniente identificar correlación con dependencia
causal.

𝑺"𝒚𝒆 𝒓=
𝑺𝒙𝒚
Caso general 𝒓 = Caso lineal 𝑺𝒙 ∗𝑺𝒚
𝑺"𝒚

Ciencias Exactas - UCB - Vivian Espinoza R. 21


POBLACIONAL MUESTRAL
§ Este coeficiente mide la proporción (%), de variabilidad que ha sido
estadísticamente explicada, respecto a la variabilidad total; a través de la ecuación
de regresión.
𝑺𝟐𝒚𝒆
§ 𝑹= 𝑹 = 𝒓𝟐
𝑺𝟐𝒚

Donde las varianzas se definen como sigue:


#
§ Varianza Total (VT) en y: 𝑆3% = ∑$! (𝑦! − 𝑦)
= %
$
#
§ Varianza Explicada (VE) en y: 𝑆3%$ = ∑$! (𝑦& − 𝑦)
= %
$
#
§ Varianza No Explicada (VNE) en y: 𝑆3%%$ = ∑$! (𝑦! − 𝑦& )%
$
Notamos que se debe cumplir:
𝑺𝟐𝒚 = 𝑺𝟐𝒚𝒆 + 𝑺𝟐𝒚𝒏𝒆

Ciencias Exactas - UCB - Vivian Espinoza R. 23


§ Mide la covariación conjunta de dos variables.
§ Sies positiva nos dará la información de que a valores altos de una
de las variables hay una mayor tendencia a encontrar valores altos
de la otra variable y a valores bajos de una de las variables,
correspondientemente valores bajos (relación directamente
proporcional).
§ Sila covarianza es negativa, la covariación de ambas variables será
en sentido inverso: a valores altos le corresponderán bajos, y a
valores bajos, altos (relación inversamente proporcional).
§ Si la covarianza es cero no hay una covariación clara en ninguno de
los dos sentidos. Esto significa, que si dos variables son
independientes su covarianza es cero.

Ciencias Exactas - UCB - Vivian Espinoza R. 24


§ Poblacional:
∑𝒏
𝒊(𝟏 𝒙𝒊 𝒚𝒊 𝒏𝒊
§ 𝑪𝒐𝒗 𝒙, 𝒚 = s𝒙𝒚 = − (µ9 )(µ3 )
𝑵

§ Muestral:
𝟏
§ 𝑪𝒐𝒗 𝒙, 𝒚 = 𝑆𝒙𝒚 = ∑𝒏𝒊"𝟏 𝒙𝒊 𝒚𝒊 𝒏𝒊 − (𝑥)(
̅ 𝑦)𝒏
=
𝒏:𝟏

§ Solo se calcula la covarianza para variables cuantitativas!

Ciencias Exactas - UCB - Vivian Espinoza R. 25


Ciencias Exactas - UCB - Vivian Espinoza R. 27
§ Pronosticar la demanda, si se tiene la
información de las ventas de la
empresa Agitec durante los últimos 10
trimestres se muestran en la tabla a
lado.
§¿ Cuál es la relación entre las ventas y
el tiempo?
§¿ El modelo lineal encontrado, se
ajusta bien a los datos?
§ ¿Cómo pronosticar la demanda de los
trimestres 13, 14 y 15 a través de
un análisis de regresión lineal?

Ciencias Exactas - UCB - Vivian Espinoza R. 28


§ Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina
en pesetas (Y ) en la década de los 80 en España fueron:

§ Ajusta los datos a una recta de regresión.


§ Interpreta el coeficiente de correlación.
§ Qué % de variabilidad se rescata con el modelo?

§ Cuánto costaría el kilo de harina si la producción de trigo fue de 20 Tn?

Ciencias Exactas - UCB - Vivian Espinoza R. 29


30

Ciencias Exactas - UCB - Vivian Espinoza R.

También podría gustarte