Está en la página 1de 26

UNIVERSIDAD NACIONAL DEL CALLAO

MAESTRÍA EN CIENCIAS DE LA ELECTRÓNICA CON


MENCIÓN EN TELECOMUNICACIONES

Dr. Enrique Díaz


Mg. Ricardo Gutiérrez

CALLAO – PERÚ
UNAC Procesos Estocásticos

Dr. Enrique Ubaldo Díaz Vega


Mg. Ricardo Augusto Gutiérrez Tirado

Página 2 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

INTRODUCCIÓN

En la teoría de la probabilidad, un proceso estocástico es un concepto


matemático que sirve para usar magnitudes aleatorias que varían con el
tiempo o para caracterizar una sucesión de variables aleatorias
(estocásticas) que evolucionan en función de otra variable, generalmente el
tiempo. Cada una de las variables aleatorias del proceso tiene su propia
función de distribución de probabilidad y pueden o no estar correlacionadas
entre sí.

Cada variable o conjunto de variables sometidas a influencias o efectos


aleatorios constituye un proceso estocástico. Un proceso estocástico Xt
puede entenderse como una familia uniparamétrica de variables aleatorias
indexadas mediante el tiempo t. Los procesos estocásticos permiten tratar
procesos dinámicos en los que hay cierta aleatoriedad.

Este curso se dicta en 8 sesiones de clase las cuales se dividen en 4


unidades de aprendizaje, en la unidad uno recordaremos conceptos
estadísticos, presentación de datos, gráficos e indicadores, en la unidad
dos revisaremos Regresión y correlación – Probabilidades, en la unidad
tres revisaremos Estimación y contrastación de hipótesis y finalmente en la
unidad cuatro discutiremos los procesos Estocásticos.

Dr. Enrique Díaz Vega Página 3


UNAC Procesos Estocásticos

Hasta ahora sólo hemos estudiado una característica cada individuo de una población o
muestra por separado. La estadística descriptiva bidimensional trata del estudio conjunto de
dos variables {X, Y} medidas sobre la misma población o muestra. Cada individuo aportará un
par de datos u observaciones.

Estas dos características de un mismo elemento de la población pueden ser


 Altura y peso de un niño,
 Las calificaciones de dos asignaturas de la maestría,
 Peso y producción lanar en ovejas
 Azúcar y las horas de insolación en las viñas.
 La dosis aplicada y respuesta a un medicamento, etc.

De forma general, si se estudian sobre una misma población y se miden por las mismas
unidades estadísticas una variable X y una variable Y, se obtienen series estadísticas de las
variables X e Y. Considerando simultáneamente las dos series, se suele decir que estamos
ante una variable estadística bidimensional.

Las variables pueden ser cualitativas o cuantitativas, y podrán agruparse o no según se


considere. Serán aplicables todas las medidas y gráficas del estudio unidimensional llamadas
ahora marginales: (media de X, media de Y, desviación típica de X,…, histograma de X…)

Distribución de Frecuencia Bidimensional – Tablas de doble entrada

Consideremos una población de N elementos sobre los que estudiamos conjuntamente dos
variables X e Y. Cada elemento vendrá dado por un par de valores (xi; yi), i = 1, … , N. Una
forma de disponer estos resultados es la conocida como tabla de doble entrada o tabla de
contingencia o tablas de correlación.

Supongamos que la variable X presenta k valores distintos, x 1, x2, x3, … , xk. y la variable Y
presenta p valores distintos. Y1, y2, y3,… , yp. La tabla de doble entrada queda como sigue:

X Y y1 y2 yi yp
x1 f11 f12 … f13 … f1p f1.
x2 f21 f22 … f23 … f2p f2.
‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬
xi fi1 fi2 … fi3 … fip fi.
‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬ ‫׃‬
xk fk1 fk2 … fk3 … fkp fk.
f.1 f.2 … f.3 … f.p N

Página 4 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Donde fij es la frecuencia absoluta del par (xi; yi), es decir, el número de elementos que
presenta las características xi e yi conjuntamente.
En este caso, f11 nos indica el número de veces que aparece x1 conjuntamente con y1
f12, nos indica la frecuencia conjunta de x1 con y2, etc,

Ejemplos:

Se ha medido en la escala decimal la apariencia personal (AP) y el coeficiente intelectual (CI)


de 20 alumnos de la asignatura de Estadística, obteniendo los siguientes resultados y
representados en la tabla de doble entrada:
Individuo CI(X) AP(Y)
1 6 6
2 7 8
3 8 8
4 7 8
5 8 9
6 6 7
7 8 10
X\Y 2 3 4 5 6 7 8 9 10
8 6 6
9 7 8 4 1 1
10 4 5 5 1 1 2 1 5
11 6 5 6 1 2 2 1 6
12 6 4 7 1 3 4
13 5 3 8 1 2 1 4
14 7 7 1 1 1 5 2 2 5 2 1 N=20
15 5 8
16 5 5
17 5 2
18 8 9
19 6 5
20 5 5

En la siguiente tabla se muestra los pesos y las alturas de los mismos 20 alumnos.

Altura \ Peso 45 - 55 55 - 65 65 - 75 75 - 85
1,55 - 1,65 3 1 0 0 4
1,65 - 1,75 1 4 3 1 9
1,75 - 1,85 1 0 1 4 6
1,85 - 1,95 0 0 1 0 1
5 5 5 5 N=20

Dr. Enrique Díaz Vega Página 5


UNAC Procesos Estocásticos

Distribuciones Marginales y Condicionales.

Distribuciones marginales.- Se llama distribución marginal a la que resulta de tomar la


totalidad de los valores de una variable y sus frecuencias sin importar el valor de la otra
variable.

Talla \peso 45 - 55 55 - 65 65 - 75 75 - 85
1,55 - 1,65 3 1 0 0 4
1,65 - 1,75 1 4 3 1 9
1,75 - 1,85 1 0 1 4 6
1,85 - 1,95 0 0 1 0 1
5 5 5 5 N=20

Del cuadro de Talla- Peso se tienen las distribuciones marginales:

Para la Talla Para el Peso

Talla (X) f Peso (Y) f


1,55 - 1,65 4 45 - 55 5
1,65 - 1,75 9 55 - 65 5
1,75 - 1,85 6 65 - 75 5
1,85 - 1,95 1 75 - 85 5
N=20 N=20

Aquí será aplicables todas las medidas y gráficas del estudio unidimensional como la media
de X, media de Y, desviación típica de X,… , histograma de Y…

Distribuciones Condicionadas.- Se llama distribución condicionada a la que resulta de tomar


una de las variables que verifican una determinada condición en la otra variable. Se expresa
como:
(X/Y = yi) se lee: Distribución de X condicionada al valor yi de Y.
(Y/Y = xi) se lee: Distribución de Y condicionada al valor xi de X.

Del cuadro de Talla- Peso se tienen las distribuciones condicionadas:

Distribución de la Talla dado el peso Distribución de la Peso dada la Talla


comprendido entre 45 y 55 Kg. comprendido entre 1,75 y 1,85 m.

Talla (X) 45 - 55 Peso (Y) 1,75 – 1,85


1,55 - 1,65 3 45 - 55 1
1,65 - 1,75 1 55 - 65 0
1,75 - 1,85 1 65 - 75 1
1,85 - 1,95 0 75 - 85 4
5 6

Página 6 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Medidas de Asociación

Uno de los motivos por los que estudiamos conjuntamente dos variables es para ver si existe
relación entre ellas, pudiendo predecir, en caso de haberla, valores de una a partir de la otra.
Una forma de detectar la posible relación entre las variables es gráficamente y el gráfico más
usado es el diagrama de dispersión o nube de puntos. Otra forma, es a través de medidas
numéricas como la covarianza y el coeficiente de correlación lineal.

Diagrama de dispersión.- Este gráfico se consigue representando en ejes coordenados, una


de las dos variables en el eje X, y la otra en el eje Y. Para indicar el número de coincidencias, o
bien ponemos símbolos diferentes, o bien indicamos entre paréntesis, el número fij.
Proporciona una buena descripción de la relación entre las variables.

A B
10 10
8 8
6 6
4 4
2 2
0 0
0 2 4 6 8 10 0 5 10 15 20

C D
10 15
8
10
6
4 5
2
0 0
0 2 4 6 8 10 0 2 4 6 8 10

En (A) la relación es lineal positiva (Directamente proporcional).


En (B) la relación es lineal negativa (Inversamente proporcional).
En (C) la relación es fuerte, pero no es lineal.
En (D) no existe asociación entre las variables (son independientes).

Dr. Enrique Díaz Vega Página 7


UNAC Procesos Estocásticos

La covarianza.-

A partir de las distribuciones marginales de X y de Y se pueden calcular las medidas


descriptivas de las variables X e Y. De entre las medidas descriptivas bidimensionales, la más
utilizada es la Covarianza entre X e Y que se calcula de la siguiente forma:

1) Si los datos se tabulan en dos columnas (o dos filas), la covarianza entre X e Y es:

∑(𝑥𝑖 − 𝜇𝑥 )(𝑦𝑖 − 𝜇𝑦 ) ∑ 𝑥𝑖 ∙ 𝑦𝑖
𝜎𝑥𝑦 = = − 𝜇𝑥 ∙ 𝜇𝑦
𝑁 𝑁 . . . Poblacional

∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) ∑ 𝑥𝑖 ∙ 𝑦𝑖 − (𝑥̅ ∙ 𝑦̅ ∙ 𝑛)


𝑠𝑥𝑦 = = . . . Muestral
𝑛−1 𝑛−1

Dónde:
𝜇: Media Poblacional 𝑥̅ : Media muestral
𝑥𝑖 , 𝑦𝑖 : Valores observados
𝑁: Tamaño de la población 𝑛: Tamaño de la muestra

2) Si los datos se organizan en una tabla de doble entrada, la covarianza entre X e Y es:

∑ ∑(𝑥𝑖 − 𝜇𝑥 )(𝑦𝑗 − 𝜇𝑦 )𝑓𝑖𝑗 ∑ ∑ 𝑥𝑖 ∙ 𝑦𝑗 ∙ 𝑓𝑖𝑗


𝜎𝑥𝑦 = = − 𝜇𝑥 ∙ 𝜇𝑦 . . . Poblacional
𝑁 𝑁

∑ ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅)𝑓𝑖𝑗 ∑ ∑ 𝑥𝑖 ∙ 𝑦𝑗 ∙ 𝑓𝑖𝑗 − 𝑥̅ ∙ 𝑦̅ ∙ 𝑛


𝑠𝑥𝑦 = =
𝑛−1 𝑛−1 . . . Muestral

Dónde:
𝜇: Media Poblacional 𝑥̅ : Media muestral
𝑥𝑖 : Es la marca de clase de las clases de la variable X
𝑦𝑗 : Es la marca de clase de las clases de la variable Y
𝑁: Tamaño de la población 𝑛: Tamaño de la muestra
𝑓𝑖𝑗 : Es la frecuencia absoluta conjunta de la variable bidimensional (Xi ; Yi)

Página 8 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

El coeficiente de correlación lineal de Pearson.- Es una medida adimensional del grado de


asociación lineal existente entre dos variables. Se calcula dividiendo la covarianza por el
producto de las desviaciones típicas marginales de ambas variables.

𝜎𝑥𝑦 . . . Poblacional 𝑠𝑥𝑦 . . . Muestral


𝜌= 𝑟=
𝜎𝑥 ∙ 𝜎𝑦 𝑠𝑥 ∙ 𝑠𝑦

Dónde: 𝜎𝑥𝑦 Es la covarianza poblacional;


𝑠𝑥𝑦 Es la covarianza muestral

2
Una regla práctica es que existe una relación si: |𝑟 | ≥
√𝑛

El coeficiente de correlación varía desde -1 hasta +1.

a) Si r = 1 entonces existe una dependencia lineal directa exacta entre las variables X e Y. Los
puntos del diagrama de dispersión están sobre una línea recta de pendiente positiva.
b) Si r = −1 entonces existe dependencia lineal inversa exacta entre X e Y. Los puntos del diagrama
de dispersión están sobre una línea recta de pendiente negativa.
c) Si r = 0, no existe dependencia lineal entre X e Y; pero puede existir otro tipo de dependencia.
d) Cuanto más se aproxime r a −1 o a +1, más dependencia lineal existe entre X e Y. Si esto ocurre
diremos que la relación lineal es fuerte, el diagrama de dispersión se aproxima a una línea
recta.
e) Cuanto más se aproxime r a 0, más independencia lineal existe entre X e Y. Si esto ocurre
diremos que la relación lineal es débil, el diagrama de dispersión no se aproxima a una recta.
f) Si r es positivo, entonces al aumentar el valor de la variable X, aumenta el valor de la variable Y.
g) Si r es negativo, entonces al aumentar el valor de la variable X, disminuye el valor de la variable
Y.

yi yi yi

r = - 0,8 xi r = - 0,4 xi r= 0 xi

yi yi yi

r = 0,4 xi r = 0,8 xi r= 1 xi

Dr. Enrique Díaz Vega Página 9


UNAC Procesos Estocásticos

Ejemplo: Una compañía manufacturera desea estudiar la relación entre el número de


trabajadores (X) y el número de mesas producidas (Y) en una de sus plantas. Para ello ha
tomado una muestra aleatoria de 10 horas de producción, como se muestra en la tabla:

N°Trab(X) 12 30 15 24 14 18 28 26 19 27
N° Mesas(Y) 20 60 27 50 21 30 61 54 32 57

Calcule la covarianza y el coeficiente de correlación de Pearson para la siguiente distribución


y haga un breve análisis de la relación.

Solución

Los cálculos se pueden resumir construyendo una tabla como se muestra a continuación:

N°Trab(X) (xi - x) (xi - x)2 (yi - y) (yi - y)2 (xi - x)(yi - y)
Mesas(Y)
12 20 -9,3 86,49 -21,2 449,44 197,16
30 60 8,7 75,69 18,8 353,44 163,56
15 27 -6,3 39,69 -14,2 201,64 89,46
24 50 2,7 7,29 8,8 77,44 23,76
14 21 -7,3 53,29 -20,2 408,04 147,46
18 30 -3,3 10,89 -11,2 125,44 36,96
28 61 6,7 44,89 19,8 392,04 132,66
26 54 4,7 22,09 12,8 163,84 60,16
19 32 -2,3 5,29 -9,2 84,64 21,16
27 57 5,7 32,49 15,8 249,64 90,06
x = 21,3 y = 41,2 378,1 2505,6 962,4

De donde la varianza es:


∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 962,4
𝑠𝑥𝑦 = = = 𝟏𝟎𝟔, 𝟗𝟑
𝑛−1 9

las desviaciones típicas marginales son:


∑(𝑥𝑖 − 𝑥̅ )2 378,1
𝑠𝑥 = √ =√ = √42,01
𝑛−1 9

∑(𝑦𝑖 − 𝑦̅)2 2505,6


𝑠𝑦 = √ =√ = √278,4
𝑛−1 9

y el coeficiente de correlación de Pearson es:


𝑠𝑥𝑦 106,93
𝑟= = = 𝟎, 𝟗𝟖𝟗
𝑠𝑥 ∙ 𝑠𝑦 √42,01 ∙ √278,4

Llegamos a la conclusión de que existe una fuerte relación lineal positiva entre el número de
trabajadores y el número de mesas producidas por hora.

Página 10 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Los mismos cálculos se pueden hacer aún más rápido si usamos el segundo criterio para el
cálculo de la covarianza y de las desviaciones típicas como se ve a continuación:

N°Trab(X) N° Mesas(Y) (xi)2 (yi)2 (xi)(yi)


12 20 144 400 240
30 60 900 3600 1800
15 27 225 729 405
24 50 576 2500 1200
14 21 196 441 294
18 30 324 900 540
28 61 784 3721 1708 213
𝑥̅ = = 21,3
26 54 676 2916 1404 10
19 32 361 1024 608
412
27 57 729 3249 1539 𝑦̅ = = 41,2
10
213 412 4915 19480 9738

De donde la covarianza es:


∑(𝑥𝑖 )(𝑦𝑖 ) − 𝑥̅ ∙ 𝑦̅ ∙ 𝑛 9738 − 21,3 ∙ 41,2 ∙ 10
𝑠𝑥𝑦 = = = 𝟏𝟎𝟔, 𝟗𝟑
𝑛−1 9

las desviaciones típicas marginales son:


∑(𝑥𝑖 )2 − 𝑛𝑥̅ 2 4915 − 10 ∙ 21,32
𝑠𝑥 = √ = √ = √42,01
𝑛−1 9

∑(𝑦𝑖 )2 − 𝑛𝑦̅ 2 19480 − 10 ∙ 41,22


𝑠𝑦 = √ =√ = √278,4
𝑛−1 9

y el coeficiente de correlación de Pearson es:


𝑠𝑥𝑦 106,93
𝑟= = = 𝟎, 𝟗𝟖𝟗
𝑠𝑥 ∙ 𝑠𝑦 √42,01 ∙ √278,4

Obteniendo de esta manera los mismos resultados que se obtuvieron antes. El diagrama de
dispersión es:
Producción de mesas por hora según número de trabajadores
70
60
N° de mesas

50
40
30
20
10
0
0 5 10 15 20 25 30 35
N° de Trabajadores

Dr. Enrique Díaz Vega Página 11


UNAC Procesos Estocásticos

REGRESIÓN LINEAL.

Como ya hemos visto se puede medir la relación lineal entre dos variables y saber que tan
fuerte es. Ahora veremos cómo construir un modelo matemático que nos permita predecir el
comportamiento de una variable dado un valor específico de la otra. Para investigar la
dependencia de una variable dependiente Y en función de una variable independiente X,
usaremos el siguiente modelo:

̂ = 𝑨 + 𝑩𝑿
𝒀 . . . Modelo de Regresión estimada

̂ : Variable de respuesta que se desea explicar o predecir, también se llama “Y estimada”.


𝒀
X : Variable regresora, también se llama variable explicativa, regresor o predictor
A : Es la ordenada en el origen-
B : Es la pendiente de la recta, o sea, la variación que experimenta Y por cada variación unitaria de X.
y
𝑌 = 𝐴 + 𝐵𝑋

𝑦̅
𝑠𝑥𝑦
𝐵=
A 𝑠𝑥2

x
𝑥̅
Para hallar los valores A y B se utiliza el método de regresión por Mínimos Cuadrados donde:
𝑠𝑥𝑦 𝑠𝑦
𝐵= = 𝑟 𝐴 = 𝑦̅ − 𝐵𝑥̅
𝑠𝑥2 𝑠𝑥

La relación entre X y Y se representa por medio de una línea recta que pasa por el Centro de
Gravedad, atraviesa la nube de puntos y, si es representativa (r está próxima a +1 o -1),
constituye un modelo de los mismos. Cabe mencionar que la regresión lineal no es la única
forma de regresión, por el contrario, hay muchas más llamadas curvilíneas, entre las que
podemos citar a las exponenciales, logarítmicas, polinómicas, etc.

Análogamente, la ecuación de la recta de regresión mínimo cuadrática de X sobre Y es:

̂ = 𝑨∗ + 𝑩∗ 𝒀
𝑿
Donde:
𝑠𝑥𝑦 𝑠𝑥
𝐵∗ = = 𝑟 𝐴∗ = 𝑥̅ − 𝐵 ∗𝑦̅
𝑠𝑦2 𝑠𝑦

Página 12 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Coeficiente de Determinación.- En el caso del ajuste lineal (ajuste a una recta), el coeficiente
de determinación es igual a:
2
2
𝑠𝑥𝑦
𝑅 = 2 2
𝑠𝑥 𝑠𝑥

El coeficiente determinación mide la proporción de la variación total debida al modelo.


 R2 toma valores en [0,1]. El valor 0 indica nula representatividad y el 1 máxima
representatividad.
 R2 es una medida adimensional y así lo definimos como medida de bondad de ajuste
de regresión.
 Se verifica que R2=r2 siendo r el coeficiente de correlación lineal de Pearson.

Ejemplo: En el caso de la compañía manufacturera, estime el número esperado de mesas si


la compañía decide emplear 25 trabajadores.
Solución
Del ejemplo anterior se tiene:
𝑠𝑥𝑦 = 𝟏𝟎𝟔, 𝟗𝟑
𝑥̅ = 𝟐𝟏, 𝟑 𝑦̅ = 𝟒𝟏, 𝟐
𝑠𝑥 = √42,01 ⟹ 𝑠𝑥 2 = 𝟒𝟐, 𝟎𝟏 𝑠𝑦 = √278,4 ⟹ 𝑠𝑦 2 = 𝟐𝟕𝟖, 𝟒
𝑟 = 𝟎, 𝟗𝟖𝟗
Primero calculamos B:
𝑠𝑥𝑦 106,93
𝐵= = = 𝟐, 𝟓𝟒𝟓
𝑠𝑥2 42,01
Ahora calculamos A:
𝐴 = 𝑦̅ − 𝐵𝑥̅ = 41,2 − 2,545(21,3) = −𝟏𝟑, 𝟎𝟐

De esta manera la recta de regresión lineal estimada es:


𝑌 = 𝐴 + 𝐵𝑋
̂ = 𝑨 − 𝟏𝟑, 𝟎𝟐 + 𝟐, 𝟓𝟒𝟓𝑿
𝒀
De donde podemos esperar que se produzcan:
𝑌 = 𝐴 − 13,01 + 2,545(𝟐𝟓) = 𝟓𝟎, 𝟔𝟐 mesas
O sea, alrededor de 50 mesas.

Dr. Enrique Díaz Vega Página 13


UNAC Procesos Estocásticos

Producción de mesas por hora según número de trabajadores


80
70
60
N° de mesas

50
y = 2.5454x - 13.016
40
R² = 0.9777
30
20
10
0
0 5 10 15 20 25 30 35
N° de Trabajadores

La covarianza muestra que el sentido de la relación es positivo; la correlación r es bastante


próxima a +1 e indica que los puntos de los datos están cerca de una recta ascendente, como
se muestra en la gráfica.

No siempre se puede introducir cualquier valor para X en una recta de regresión y tomar una
decisión razonable, por ejemplo, en el caso de la planta manufacturera si su capacidad
máxima de trabajadores es 30, sería inútil estimar la producción de mesas para 80
trabajadores.

El objetivo del presente texto es aprender a describir datos numéricamente y no el realizar


un sofisticado análisis estadístico. Muchas veces el tamaño de la muestra hace que los
cálculos sean tediosos. Por ello, es bueno utilizar la tecnología, con un software adecuado y
su correcto uso podríamos realizar cálculos más realistas y con tamaños de muestras más
grandes y procesar la información en un menor tiempo con mayor exactitud.

Página 14 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Trabajo Académico N° 06

1. Se supone que el alargamiento de un cable de acero está relacionado linealmente con la


intensidad de la fuerza aplicada. Cinco especímenes idénticos de cable dieron los
resultados siguientes:

Fuerza (X) 1,0 1,5 2,0 2,5 3,0


Alargamiento(Y) 3 3,5 5,4 6,9 8,4

a) Estudia el grado de asociación lineal entre ambas variables.


b) Predice el alargamiento para una fuerza de 2.2. ¿En qué medida es fiable tal
predicción?.

2. Se está estudiando la relación existente entre los años de estudios realizados por los
padres (X) y los años de estudios realizados por los hijos (Y). En una muestra de tamaño 7
se obtienen los siguientes resultados.

xi 12 6 8 12 10 16 9
yi 12 6 10 11 8 11 8

a) Dibujar el diagrama de dispersión o nube de puntos.


b) Hallar la covarianza entre las dos variables.
c) Hallar el coeficiente de correlación lineal.
d) Hallar la ecuación de la recta de regresión mínimo cuadrática de Y sobre X.
e) Predecir el número de años de estudio de un hijo cuyo padre ha estudiado 14 años.
f) Decir si esta predicción es fiable.
g) Hallar la ecuación de la recta de regresión mínimo cuadrática de X sobre Y.
h) Predecir el número de años de estudio de un padre cuyo hijo ha estudiado 15 años.

3. Una factoría de una cierta marca de refrescos ha tomado al azar 18 semanas de un año,
observando la temperatura media, en grados centígrados correspondiente a cada una de
ellas y la cantidad de refrescos pedidos durante cada uno de dichos periodos, en miles.
La información obtenida es la siguiente:

T(°C) 10 28 12 31 30 19 24 5 9 15
Pedidos (en miles) 21 65 19 72 75 39 67 11 12 24

a) Dibujar el diagrama de dispersión.


b) Hallar el coeficiente de correlación lineal r.
c) Predecir la temperatura media de una semana en la que se hubiesen pedido 50.000
refrescos. Decir si esta predicción es fiable.
d) Predecir el número de refrescos pedidos en una semana en la que la temperatura
media fuese de 20°C .

Dr. Enrique Díaz Vega Página 15


UNAC Procesos Estocásticos

4. El precio, en soles, (X) y el número de páginas (Y) de los libros contenidos en un catálogo
vienen dados por:

xi yi xi yi xi yi xi yi
200 496 275 392 210 240 120 342
99 208 125 200 150 278 210 340
175 300 250 280 275 420 170 207
150 448 80 120 105 128 350 440
120 200 59 220 99 249 75 88
300 288 100 200 350 392 210 351
325 324 325 468 200 400 250 292
350 525 240 539 275 300 372 464
375 384 300 400 150 240 240 344
250 250 300 320 160 230 125 130
180 200 350 736 120 144 225 382
150 224 220 516 380 336 250 403
300 384 375 700 378 550 200 249
250 256 200 400 300 478 180 182
175 215 300 656 172 437 385 458
170 278 95 191 100 288 40 63
200 376 195 464 185 496 300 400
225 421 205 348 180 236 215 278
325 450 300 352 120 143 275 508
300 243 325 598 170 284 160 256
120 202 275 392 280 520 305 368
150 251 240 472 385 758 150 275
210 320 365 591 250 413 125 112
350 460 145 282 275 394 380 458
120 342 210 340 170 207 75 83
a) Agrupar los datos de ambas variables en intervalos de clase.
b) Determinar la distribución bidimensional de frecuencias, así como las distribuciones
marginales de X y de Y.
c) Hallar el coeficiente de correlación lineal.
d) Predecir el precio de un libro que tuviera 205 páginas.
e) Decir si esta predicción es fiable.

5. Las calificaciones obtenidas por un grupo de alumnos en Biología y Física son:

Biología 06 08 12 14 10 16 14 06 10 08 16 10 10 16 16 16 10
Física 10 10 16 14 14 18 20 08 14 08 20 10 14 18 20 10 14
a) Escribir la tabla de doble entrada de frecuencias absolutas.
b) Hallar las distribuciones marginales, así como la media y la varianza de dichas
distribuciones unidimensionales.
c) ¿Existe relación lineal entre las calificaciones de Biología y Física?

Página 16 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

ÍNDICE

Un poco de historia

1. Definiciones y conceptos básicos.

Procedimientos para seguir un estudio estadístico.

Términos usados en estadística.

Tipos de variables.

Niveles de medición.

2. Descripción y clasificación de los datos.

Tablas de distribución de frecuencias.

Presentación de tablas y gráficos.

Tipos de gráficos.

3. Parámetros de una distribución.

Medidas de tendencia central.

Medidas de dispersión.

Medidas de posición.

4. Estadística Descriptiva bidimensional.

Distribución de frecuencias bidimensional – Tablas de doble entrada

Distribuciones marginales y condicionales.

Medidas de asociación.

Regresión lineal - Método de los mínimos cuadrados.

Dr. Enrique Díaz Vega Página 17


UNAC Procesos Estocásticos

Página 18 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Ejercicios para practicar.


1. Responda las siguientes preguntas
a) Si en una distribución todos los datos son iguales, ¿Qué sucede con el promedio?
b) Si tuviésemos 5 notas en total y una de ellas es muy baja respecto a las otras cuatro,
¿Cómo influye esta nota en el promedio?.
c) Si las notas fuesen 10 en total, ¿la nota baja influiría de la misma forma?

Durante una semana de vacaciones la asistencia de jóvenes a una discoteca ha sido:

d) ¿Cuál es el promedio diario de asistencia? ¿Está muy Día Jóvenes


distorsionada esta información? ¿Por qué? Lunes 57
Martes 72
Miércoles 65
e) ¿El administrador podría confiar en el promedio para Jueves 89
abastecer de refrescos a la discoteca diariamente? ¿y Viernes 348
semanalmente? Sábado 461
Domingo 49

2. Al calcular los estadísticos de una muestra con gran número de datos, podemos ahorrar
tiempo si tenemos los datos ordenados y calculadas las frecuencias correspondientes.

Ejemplo, los siguientes datos corresponden a los kilómetros


recorridos por los ciclistas participantes en una competencia
nacional, durante el entrenamiento:
KILÓMETROS RECORRIDOS
750 700 660 660 660 700 750 570 700 800 700 880 800
700 880 480 660 880 780 750 480 480 800 660 750 800
800 700 660 800 660 480 700 570 570 750 480 750 740
660 800 820 750 570 480 700 750 700 800 880 660 820

Organizar la información en la siguiente tabla de frecuencias y calcular promedio, la


desviación estándar y coeficiente de variación. Interprete.

Dr. Enrique Díaz Vega Página 19


UNAC Procesos Estocásticos

3. En una supuesta investigación estadística se han recogido los siguientes datos acerca de
las preferencias televisivas de los jóvenes:

Prefieren: Nº de Jóvenes
Películas 9.000
¿Cuál es la moda de la muestra?
Informativos 15.000
¿Tiene sentido calcular la media en la
Culturales muestra?. ¿Por qué?
Musicales 10.000
Teleseries 38.000
Deportivos 21.000
Otro tipo 7.000
4. En un país centroamericano se entrevistaron a 120 estudiantes para averiguar el tipo de
baile que preferían. El 35% de los jóvenes eligió el merengue, 30 estudiantes eligieron
baile moderno, la octava parte dijo preferir salsa y el resto se inclinó por la cumbia.

¿Cuál es la moda en la encuesta? ¿Podrás calcular la media en esta?


Realiza la misma encuesta en tu curso y compara los resultados. ¿La moda es la misma?

5. En la tabla siguiente aparecen la acciones más transadas durante la tercera semana del
mes de octubre de 2006, según información del diario “El Mercurio”. Determinar la
mediana de los precios.

Acciones más transadas Precio al cierre ($) Variación (%)


ENDESA 257,00 -0,68
CTC – A 2445,00 0,20
ENERSIS 246,00 -0,90
CHILECTRA 2220,00 -0,89
CHILGENER 2420,00 -0,62
IANSA 102,75 -0,24
EMEC 52,50 -1,87
VAPORES 330,00 0,00
SOQUIMICH – B 2425,00 0,41
SANTANDER 26.50 -0,93

Página 20 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

6. Un equipo de básquetbol ha obtenido los siguientes puntajes en un campeonato: 68 – 72


– 56 – 76 – 84 – 50 – 85 – 72 – 66 – 69 – 59

¿Cuál es la media aritmética de sus puntos? ¿Cuál es la mediana?

7. Si en la serie datos: 2-7-4-8-2-14-29, se cambia el 29 por 40, ¿cuál de las medidas (media,
moda y mediana) se ve afectada?

A) Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.


R. S = 13,76  3,71

b) Las alturas en cm de un grupo de 103 personas se distribuyen así:


Clases f
150 – 155 3
155 – 160 6
160 – 165 12
165 – 170 18
170 – 175 25
175 – 180 17
180 – 185 10
185 – 190 7
190 – 195 4
195 – 200 1
103
Resp: S = 9,56

Ejercicios Aplicados a las Finanzas


La Empresa Trout, inc cría truchas pequeñas en estanques especiales y las vende cuando adquieren
cierto peso. Se aisló una muestra de 10 truchas en un estanque y se les alimentó con una mezcla
especial denominada RT-10. Al final del período experimental los pesos de las truchas fueron (en
gramos):

124 125 125 123 120 124 127 125 126 121

Dr. Enrique Díaz Vega Página 21


UNAC Procesos Estocásticos

Ejercicios: Coeficiente de variación, Coeficiente de asimetría ( Pearson) y Deciles.

EJERCICIO 1

El analista de investigación para la empresa de corretaje de acciones Sidde Financial, desea


comparar la dispersión de las razones (o cocientes) precio - rendimiento en un grupo de
acciones comunes, con la dispersión de sus rendimientos sobre inversión. Para las razones
precio - rendimiento la media es 10,9 y la desviación estándar 1,8. El rendimiento medio sobre
inversión es 25% y la desviación estándar 5,2%.

a) Por que debe utilizarse el coeficiente de variación para comparar la dispersión

b) Compare la dispersión relativa de las razones precio - rendimiento, y el rendimiento sobre


inversión

Existe menor dispersión en el precio-rendimiento cuyo valor es 16,51% en relación al


rendimiento-inversión con su valor de 20,8%.

EJERCICIO 2

Se va a comparar la dispersión en los precios anuales de las acciones que se venden a menos
de $10 (dólares) y la dispersión en los precios de aquellas que se venden por arriba de $60. El
precio medio de las acciones que se venden a menos de $10 es 5,25 y la desviación estándar es
$1,52. El precio medio de las accciones que se negocian a más de $60 es $92,50 y su
desviación estándar es $5,28.

a) Porque debe utilizarse el coeficiente de variación para comparar la dispersión de los


precios?

Porque se puede comparar la dispersión relativa en términos de porcentajes

b) Calcule los coeficientes de variación. ¿Cuál es su conclusión?

Página 22 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

Se observa que las acciones a menos de $10 tienen una dispersión mayor relativa, en
comparación con las que se venden por arriba de los $60.

EJERCICIO 3

A continuación se presentan los sueldos iniciales en miles de dólares en una muestra de


contadores que terminaron sus estudios y empezaron a trabajar como contadores públicos el
año pasado.

36 26 33 28 31

a) Determine los valores de la media, mediana y desviación estándar

Dr. Enrique Díaz Vega Página 23


UNAC Procesos Estocásticos

b) Determine el coeficiente de asimetría usando el método de Pearson

c) Determine el coeficiente de asimetría usando el método de Software

EJERCICIO 4

La empresa Anderson es distribuidora de motores eléctricos pequeños. Al igual que en


cualquier negocio, es importante el tiempo que toman los clientes pra pagar sus facturas. A
continuación se presentan los tiempos en días ordenados de menor a mayor, de una muestra de
facturas de esa compàñia.

Página 24 Mg. Ricardo Gutiérrez Tirado


Procesos Estocásticos Unidad de Posgrado

13 13 13 20 26 27 31 34 34 34 35 35 36 37 38 41 41 41 45
a) Determine los cuartiles primero y tercero

b) Obtenga el segundo y el octavo decil

c) Determine el centil 67

Dr. Enrique Díaz Vega Página 25


UNAC Procesos Estocásticos

Página 26 Mg. Ricardo Gutiérrez Tirado

También podría gustarte