Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MATERIA:
Probabilidad y Estadística
CARRERA:
Ing. Electromecánica
DOCENTE:
Ing. Christhian Salvador Gómez Reynecke
UNIDAD 5:
Regresión y Correlación
ALUMNO:
De la Cruz de la Cruz Jesús Emilio
19500366
PERIODO:
Agosto-Diciembre 2020
Son controles o registros que podrían llamarse "herramientas para asegurar la calidad
de una fábrica".
Los datos se muestran como un conjunto de puntos, cada uno con el valor de una
variable que determina la posición en el eje horizontal y el valor de la otra variable
determinado por la posición en el eje vertical.
• Relaciones causa-efecto
• Relaciones entre dos efectos
• Posibilidad de utilizar un efecto como sustituto de otro
• Relaciones entre dos posibles causas
1. Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos
variables.
2. Obtener los pares de datos correspondientes a las dos variables.
3. Determinar los valores máximo y mínimo para cada una de las variables.
4. Decidir sobre qué eje se representará a cada una de las variables.
5. Trazar y rotular los ejes horizontal y vertical.
6. Marcar sobre el diagrama los pares de datos.
7. Rotular el gráfico.
La Regresión y la Correlación son dos técnicas estadísticas que se pueden utilizar para
solucionar problemas comunes en los negocios.
Se considera que dos variables cuantitativas están correlacionadas cuando los valores
de una de ellas varían sistemáticamente con respecto a los valores homónimos de la
otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A
lo hacen también los de B y viceversa.
14. ¿Cuál es el coeficiente de correlación más conocido?
Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una
correlación, son la fuerza, el sentido y la forma.
17. Éste tipo de componente de la correlación mide la variación de los valores de B con
respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al
crecer los valores de A disminuyen los de B, la relación es negativa.
El sentido.
19. Dadas dos variables aleatorias 𝑋(𝑥1, … , 𝑥𝑛 ) e 𝑌(𝑦1 , … , 𝑦𝑛 ), ¿Cómo puede ser encontrado
el coeficiente de correlación?
𝑋(𝑥1 − 𝑥̅ , … , 𝑥𝑛 − 𝑥̅ ) e
𝑌(𝑦1 − 𝑦̅, … , 𝑦𝑛 − 𝑦̅)
El coseno del ángulo alfa entre estos vectores es el coeficiente de correlación y es dado
por la fórmula siguiente:
∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ ) ⋅ (𝑦𝑖 − 𝑦
̅)
𝑟 = cos 𝛼 =
√∑𝑁 2 𝑁
̅)2
𝑖=1(𝑥𝑖 − 𝑥̅ ) ⋅ √∑𝑖=1(𝑦𝑖 − 𝑦
23. Existen casos en el que el coeficiente de correlación lineal mediría mal la intensidad de
la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más
apropiado. ¿Qué tipos de coeficientes pueden utilizarse?
Los valores que puede tomar el coeficiente de correlación “𝑟” son: −1 < 𝑟 < 1.
La correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlación es tanto más fuerte cuanto más se aproxime a 1.
La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
monotónica o la curva no monotónica.
29. ¿Qué forma de correlación se produce cuando “𝑟” > 0 en una correlación lineal?
La correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra).
La correlación negativa es tanto más fuerte cuanto más se aproxime a −1.
Un ejemplo es el peso y velocidad: los alumnos más gordos suelen correr menos.
No existe correlación lineal entre las variables. Aunque podría existir otro tipo de
correlación (parabólica, exponencial, etc.)
El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción
de variación de los resultados que puede explicarse por el modelo.
Se construye para explicar una variable aleatoria que llamaremos dependiente a través
de otras variables aleatorias a las que llamaremos factores. El máximo error cuadrático
medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos
primeros momentos es la varianza.
2
𝜎𝑟2
𝜌 =1− 2
𝜎
𝛼 es el llamado error aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo.
47. El intervalo de confianza se utiliza para evaluar la estimación del parámetro de población.
Menciona un ejemplo de esto.
Por ejemplo, un fabricante desea saber si la longitud media de los lápices que produce
es diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices
y determina que la longitud media de la muestra es 52 milímetros y el intervalo de
confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la
longitud media de todos los lápices se encuentra entre 50 y 54 milímetros.
Es la inexactitud que se acepta como inevitable, al comparar una magnitud con su patrón
de medida, el error de medida depende de la escala de medida empleada y tiene un
límite.
49. ¿Qué factores influyen en la observación para que se produzca un error en la medición?
Los factores que intervienen en la observación pueden depender del observador, método
de observación, objeto o elemento observado.
Entre los errores dependientes del observador pueden ocurrir por: el grado de
preparación o entrenamiento, el estado físico, el exceso de trabajo, las condiciones
ambientales de trabajo.
52. ¿De qué dependen que se produzcan más comúnmente los errores en las mediciones?
Fuera de la variabilidad real que presentan los individuos que se observan, hay también
una variabilidad sobreañadida dependiente de ellos mismos, debida a las condiciones y
tiempo en que se estudian.
El error sistemático es aquel que se produce de igual modo en todas las mediciones que
se realizan de una magnitud, puede estar originado en un defecto del instrumento, en
una particularidad del operador o del proceso de medición u observación, a este tipo de
error también se le llama sesgo.