Está en la página 1de 2

Examen parcial I b) El coeficiente de determinación.

Comenta el resultado e indica el


porcentaje de la variación de Y que no está explicada por el
Probabilidad y estadística
modelo lineal de regresión.

Contesta las siguientes preguntas y entrega las respuestas el lunes 10 de


marzo
Esto indica que el modelo explica el 68% de la variabilidad de Y en
función de la de X. El resto, el 32% de la variabilidad queda sin
1) De una muestra de ocho observaciones conjuntas de valores de dos explicar
variables X e Y, se obtiene la siguiente información:
c) Si el modelo es adecuado, ¿cuál es la predicción ̂ para x=4.

̂ ( )
Calcula:
a. La recta de regresión de Y sobre X. Explique el significado de los
parámetros. 2) La tabla muestra la comprensión lectora (X) de dos grupos de sujetos
Se calculan las medias y la covarianza educados en niveles socioculturales altos (A) y bajos (B). Si a partir de la
puntuación X=19 se considera una comprensión lectora buena, calcular:
a) El porcentaje de personas en cada grupo con una buena
comprensión lectora. Es aquella proporción de personas que
sacaron una puntuación de 19 o más. Esto es, se tiene que obtener
el percentil correspondiente a una puntuación menor de 19

En el grupo A es:0.25+5*(0.475-0.25)/7 =0.41


El parámetro b es la pendiente de la recta de regresión. Mide la
variación de Y cuando X aumenta en una unidad. En este caso, El porcentaje de personas del grupo A con una buena comprensión
como la pendiente es negativa, cada vez que X aumenta una lectora es 0.59
unidad, Y disminuye 1,167 unidades.
Del mismo modo para B .3667+5*0.3/7 = 0.58

El porcentaje de personas del grupo B con una buena comprensión


lectora es 0.42

El parámetro (la ordenada al origen) se calcula: b) ¿ Cuál de los dos grupos presenta mayor variabilidad ? (Razona
adecuadamente tu respuesta
c)
Fronteras de clase xi FA FB F*A F*B xi*fA xi*fB
X fA fB -0.5 0 0 0 0 0
0-6 4 4 -0.5 6.5 3 4 4 0.1 0.1333 12 12 3386.88 2122.68
jul-13 6 7 6.5 13.5 10 10 11 0.25 0.3667 60 70 5762.4 2778.3
14-20 9 9 13.5 20.5 17 19 20 0.475 0.6667 153 153 1199.52 74.97
De este modo la ecuación de regresión está dada por: 21-27 12 8 20.5 27.5 24 31 28 0.775 0.9333 288 192 5080.32 11383.68
28-34 9 2 27.5 34.5 31 40 30 1 1 279 62 34997.76 13397.58
40 30 792 489 50426.88 29757.21
media 19.8 16.3 1293.00 1026.11 Var
35.96 32.03 d. e.
1.82 1.97 c. v.

Se tiene que obtener el coeficiente de variación de ambos grupos. En la tabla


anterior, se muestran los cálculos. Es el grupo B (1.97) el que presenta mayor
variabilidad. Esto también se aprecia en la gráfica y en la tabla. Hay mayor la media (12, 12 y 13.2) para la mediana y la moda aproximadas y
proporción de valores en el grupo B más alejados de la media.
la media respectivamente.
d) Dibuje el histograma de frecuencias acumuladas y la ojiva

3) Una variable X tiene como media 8 y varianza 4. ¿Qué transformación lineal


hemos de realizar con ella, para obtener una nueva variable Y que tenga por
media 42 y desviación típica 10 ?
El tipo de transformación que tenemos que hacer para cada xi es del tipo
e) Calcule el decil 2 y el percentil 62 e interprete los resultados en el
contexto del problema
D2 = 7 y P62 = 14.5 El 20% de los jóvenes de la muestra tiene
∑(( ) )
Por lo que ̅ ∑ ( ) y √ 7 o menos años. El 62% tiene 14.5 o menos

Desarrollando y despejando a y b se obtiene el sistema

Resolviendo el sistema resulta que a=2 y b=5

4) La siguiente gráfica representa el polígono de frecuencias de las edades de


jóvenes del barrio de Santo Domingo .

Conteste lo siguiente:

a) ¿Cuál es la longitud de los intervalos de clase? 5


b) ¿cuál es la clase mediana? La tercera clase
c) ¿Qué medida de tendencia central es más representativa de las
edades de los jóvenes? Justifique su respuesta La media, las tres
tiene valores muy cercanos. En esos casos, siempre hay que elegir