Está en la página 1de 3

Tema propuesto:

Opcion1.

Vamos a investigar el rendimiento del combustible en coches, medido en millas por galón, para
ello vamos a usar el conocido dataset publico mtcars. Pero nos vamos a centrar en averiguarlo
para coches de cambio automático comparado con coches de cambio manual.

Opcion2.

Los datos de una encuesta sobre la satisfacción de los pacientes en un hospital se muestran en la
siguiente tabla. Las variables independientes son la edad del paciente, un índice de gravedad de la
enfermedad (los valores más altos indican mayor gravedad), una variable indicadora que denota si
el paciente es un paciente médico (0) o un paciente quirúrgico (1) y, un índice de ansiedad (los
valores más altos indican mayor ansiedad). Los datos también se encuentran en el archivo
denominado “Datos_actividad.xlsx”.

Opción 3

https://www.kaggle.com/datasets/uciml/red-wine-quality-cortez-et-al-2009

Los dos conjuntos de datos están relacionados con variantes rojas y blancas del vino portugués
"Vinho Verde". Para más detalles, consulte la referencia [Cortez et al., 2009]. Debido a cuestiones
de privacidad y logística, solo están disponibles las variables fisicoquímicas (entradas) y sensoriales
(salida) (por ejemplo, no hay datos sobre tipos de uva, marca de vino, precio de venta del vino,
etc.).

Estos conjuntos de datos se pueden ver como tareas de clasificación o regresión. Las clases están
ordenadas y no equilibradas (por ejemplo, hay muchos más vinos normales que excelentes o
malos).

Demostración media condicional cero.

Basicamente el supuesto de media condicional zero lo que puede verificar es si los residuos (y por
implicación los errores que estiman) tienen una media constante; en promedio siguen siendo cero,
pero condicionalmente pueden tener medios a cierta distancia de cero.

La forma habitual de verificar eso es un gráfico de residualess contra los predictores, o si hay más
de un par de predictores, al menos contra valores ajustados. Aquí está la primera gráfica de
diagnóstico de las que R dará por defecto cuando graficas el resultado de una regresión:
Otra alternativa seria calcular los residuales del modelo de regresión lineal, calcular la media de
estos residuales y graficar en el eje x la variable predictora y en el eje y los residuales.
Independientemente del valor de x la media del error debe ser cero.

También podría gustarte