Está en la página 1de 10

TECNOLÓGICO NACIONAL DE MÉXICO

INSTITUTO TECNOLÓGICO DE CERRO AZUL

MATERIA:
Probabilidad y Estadística

CARRERA:
Ing. Electromecánica

DOCENTE:
Ing. Christhian Salvador Gómez Reynecke

UNIDAD 5:
Regresión y Correlación

ALUMNO:
De la Cruz de la Cruz Jesús Emilio
19500366

PERIODO:
Agosto-Diciembre 2020

Cerro Azul, Ver.


CUESTIONARIO: UNIDAD 5

1. ¿A qué se refiere el control de calidad?

El control de calidad estadístico se refiere a la utilización de métodos estadísticos en el


seguimiento y mantenimiento de la calidad de los productos y servicios.

2. ¿Qué son los diagramas de diagnóstico?

Son controles o registros que podrían llamarse "herramientas para asegurar la calidad
de una fábrica".

3. ¿Cuáles son éstos?

Entre éstos se encuentran la hoja de control (hoja de recogida de datos), el histograma,


los diagramas de Pareto, el diagrama de causa y efecto, el análisis por Estratificación,
los diagramas de Dispersión y las gráficas de control.

4. ¿Qué es un diagrama de dispersión?

Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las


coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de
datos.

Los datos se muestran como un conjunto de puntos, cada uno con el valor de una
variable que determina la posición en el eje horizontal y el valor de la otra variable
determinado por la posición en el eje vertical.

5. Menciona algunas características de los diagramas de dispersión.

• Impacto visual. Un Diagrama de Dispersión muestra la posibilidad de la existencia


de correlación entre dos variables de un vistazo.
• Comunicación. Simplifica el análisis de situaciones numéricas complejas.

6. ¿Para qué puede se puede utilizar este tipo de diagrama?

Los diagramas de dispersión pueden utilizarse para examinar:

• Relaciones causa-efecto
• Relaciones entre dos efectos
• Posibilidad de utilizar un efecto como sustituto de otro
• Relaciones entre dos posibles causas

7. ¿Cómo se representa un diagrama de dispersión?


Se representa mediante un par de valores como las coordenadas de un punto (𝑥𝑖 , 𝑦𝑖 ), el
conjunto de todos ellos se llama nube de puntos o diagrama de dispersión representados
en un plano cartesiano.

8. ¿En qué consiste la regresión lineal simple?

La regresión lineal simple consiste en generar un modelo de regresión (ecuación de una


recta) (𝑌 = 𝛼 + βX) que permita explicar la relación lineal que existe entre dos variables.
A la variable dependiente o respuesta se le identifica como 𝑌 y a la variable predictora o
independiente como 𝑋.

9. ¿Cuáles son los pasos a seguir para elaborar un diagrama de dispersión?

Los pasos a seguir son:

1. Elaborar una teoría admisible y relevante sobre la supuesta relación entre dos
variables.
2. Obtener los pares de datos correspondientes a las dos variables.
3. Determinar los valores máximo y mínimo para cada una de las variables.
4. Decidir sobre qué eje se representará a cada una de las variables.
5. Trazar y rotular los ejes horizontal y vertical.
6. Marcar sobre el diagrama los pares de datos.
7. Rotular el gráfico.

10. ¿A qué se refiere Correlación en Probabilidad y Estadística?

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación


lineal y proporcionalidad entre dos variables estadísticas.

11. ¿Para qué se utilizan principalmente la Regresión y la Correlación?

La Regresión y la Correlación son dos técnicas estadísticas que se pueden utilizar para
solucionar problemas comunes en los negocios.

12. ¿Qué son los coeficientes de correlación?

Existen diversos coeficientes que miden el grado de correlación, adaptados a la


naturaleza de los datos.

13. ¿Cuándo se dice que dos variables están correlacionadas?

Se considera que dos variables cuantitativas están correlacionadas cuando los valores
de una de ellas varían sistemáticamente con respecto a los valores homónimos de la
otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A
lo hacen también los de B y viceversa.
14. ¿Cuál es el coeficiente de correlación más conocido?

El más conocido es el coeficiente de correlación de Pearson.

15. ¿Cómo se obtiene?

Este tipo de coeficiente de correlación se obtiene dividiendo la covarianza de dos


variables entre el producto de sus desviaciones estándar.

16. ¿Cuáles son los principales componentes de la correlación?

Los principales componentes elementales de una línea de ajuste y, por lo tanto, de una
correlación, son la fuerza, el sentido y la forma.

17. Éste tipo de componente de la correlación mide la variación de los valores de B con
respecto a A: si al crecer los valores de A lo hacen los de B, la relación es positiva; si al
crecer los valores de A disminuyen los de B, la relación es negativa.

El sentido.

18. ¿Para qué sirve el componente de fuerza de correlación?

Mide el grado en que la línea representa a la nube de puntos: si la nube es estrecha y


alargada, se representa por una línea recta, lo que indica que la relación es fuerte; si la
nube de puntos tiene una tendencia elíptica o circular, la relación es débil.

19. Dadas dos variables aleatorias 𝑋(𝑥1, … , 𝑥𝑛 ) e 𝑌(𝑦1 , … , 𝑦𝑛 ), ¿Cómo puede ser encontrado
el coeficiente de correlación?

Pueden construirse los "vectores centrados" como:

𝑋(𝑥1 − 𝑥̅ , … , 𝑥𝑛 − 𝑥̅ ) e
𝑌(𝑦1 − 𝑦̅, … , 𝑦𝑛 − 𝑦̅)

El coseno del ángulo alfa entre estos vectores es el coeficiente de correlación y es dado
por la fórmula siguiente:

∑𝑁
𝑖=1(𝑥𝑖 − 𝑥̅ ) ⋅ (𝑦𝑖 − 𝑦
̅)
𝑟 = cos 𝛼 =
√∑𝑁 2 𝑁
̅)2
𝑖=1(𝑥𝑖 − 𝑥̅ ) ⋅ √∑𝑖=1(𝑦𝑖 − 𝑦

20. ¿Qué tipo de coeficiente de correlación es éste?

cos(𝛼) es el coeficiente de correlación muestral de Pearson.

21. ¿Cómo se pueden distribuir los coeficientes de correlación?


El coeficiente de correlación muestral de una muestra es de hecho una variable aleatoria,
eso significa que si repetimos un experimento o consideramos diferentes muestras se
obtendrán valores diferentes y por tanto el coeficiente de correlación muestral calculado
a partir de ellas tendrá valores ligeramente diferentes.

22. ¿Para qué se utiliza un coeficiente de correlación lineal?

El coeficiente de correlación lineal mide el grado de intensidad de esta posible relación


entre las variables. Este coeficiente se aplica cuando la relación que puede existir entre
las variables es lineal (es decir, si representáramos en un gráfico los pares de valores de
las dos variables la nube de puntos se aproximaría a una recta).

23. Existen casos en el que el coeficiente de correlación lineal mediría mal la intensidad de
la relación las variables, por lo que convendría utilizar otro tipo de coeficiente más
apropiado. ¿Qué tipos de coeficientes pueden utilizarse?

En algunos casos pueden utilizarse coeficientes de correlación exponencial, parabólica,


etc.

24. ¿Cómo se puede saber cuando utilizar un coeficiente de correlación lineal?

Para ver si se puede utilizar el coeficiente de correlación lineal, lo mejor es representar


los pares de valores en un gráfico y ver qué forma describe.

25. ¿Cuál es la fórmula para calcular, también, el coeficiente de correlación lineal?

El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:


2
𝜎𝑋𝑌
𝑅2 =
𝜎𝑋2 𝜎𝑌2

26. ¿Cuál es el rango de valores que puede tomar el coeficiente de correlación?

Los valores que puede tomar el coeficiente de correlación “𝑟” son: −1 < 𝑟 < 1.

27. ¿Qué se describe cuando “𝑟” > 0 en una correlación lineal?

La correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlación es tanto más fuerte cuanto más se aproxime a 1.

28. ¿Qué establece el componente de forma en la correlación?

La forma establece el tipo de línea que define el mejor ajuste: la línea recta, la curva
monotónica o la curva no monotónica.
29. ¿Qué forma de correlación se produce cuando “𝑟” > 0 en una correlación lineal?

La correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra).
La correlación negativa es tanto más fuerte cuanto más se aproxime a −1.

30. Menciona un ejemplo de correlación lineal negativa.

Un ejemplo es el peso y velocidad: los alumnos más gordos suelen correr menos.

31. ¿Qué pasa si “𝑟” = 0?

No existe correlación lineal entre las variables. Aunque podría existir otro tipo de
correlación (parabólica, exponencial, etc.)

32. ¿Qué es el coeficiente de determinación?

En estadística, el coeficiente de determinación, denominado 𝑅² y pronunciado R


cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo principal
propósito es predecir futuros resultados o testear una hipótesis.

33. ¿Para qué sirve éste coeficiente?

El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción
de variación de los resultados que puede explicarse por el modelo.

34. ¿Qué característica posee el coeficiente de determinación?

𝑅² es simplemente el cuadrado del coeficiente de correlación de Pearson, lo cual es sólo


cierto para la regresión lineal simple. Si existen varios resultados para una única variable
el coeficiente de determinación resulta del cuadrado del coeficiente de determinación
múltiple. En ambos casos el 𝑅² adquiere valores entre 0 y 1, y en algunos casos puede
tomar, también, valores negativos.

35. ¿Para qué se puede utilizar un modelo estadístico?

Se construye para explicar una variable aleatoria que llamaremos dependiente a través
de otras variables aleatorias a las que llamaremos factores. El máximo error cuadrático
medio que podemos aceptar en un modelo para una variable aleatoria que posea los dos
primeros momentos es la varianza.

36. ¿Cómo se puede estimar un modelo estadístico?

Para estimar el modelo haremos varias observaciones de la variable a predecir y de los


factores. A la diferencia entre el valor observado de la variable y el valor predicho la
llamaremos residuo. La media cuadrática de los residuos es la varianza residual.
37. Si representamos por la varianza de la variable dependiente 𝜎 y la varianza residual por
𝜎𝑟 , ¿Cómo se puede obtener el coeficiente de determinación?

El coeficiente de determinación viene dado por la siguiente ecuación y se mide en tantos


por ciento:

2
𝜎𝑟2
𝜌 =1− 2
𝜎

38. ¿Qué porcentajes son más comunes en variables económicas y financieras?

En variables económicas y financieras, son comunes porcentajes menores a 30, suele


ser difícil conseguir un coeficiente de determinación mayor de un 30%.

39. ¿Qué es una distribución normal bidimensional?

Esta distribución es un caso particular de la distribución normal n-dimensional, que esta


a su vez es una generalización de la distribución normal univariante, para 𝑛 = 2.

Muestra de forma explícita dichos resultados sin recurrir a la notación matricial.

40. ¿En que situación se le denomina distribución normal bidimensional estándar?

Si 𝑚𝑋 y 𝑚𝑌 son cero 𝑠𝑋 y 𝑠𝑌 son 1 y 𝑟 es cero.

41. Menciona otras tres propiedades de una distribución normal bidimensional?

• Si (𝑋, 𝑌) tiene una distribución normal bidimensional y (𝑈, 𝑉) es una


transformación de ella del tipo 𝑈 = 𝑎𝑋 + 𝑏𝑌 + 𝑐 y 𝑉 = 𝑑𝑋 + 𝑒𝑌 + 𝑓 , de manera
que la matriz tiene determinante distinto de cero (rango dos). Entonces la variable
aleatoria (U,V) también sigue una distribución normal bidimensional.

• En particular, si (𝑋, 𝑌) tiene una distribución normal bidimensional estándar y


(𝑈, 𝑉) es una transformación de ella del tipo anterior (con 𝑟𝑔(𝐵) = 2) entonces
(𝑈, 𝑉) sigue una distribución normal bidimensional.

• Si (𝑋, 𝑌) tiene una distribución normal bidimensional, tanto 𝑋 como 𝑌 siguen


distribuciones normales, en concreto 𝑋 tiene una distribución 𝑁(𝑚𝑋 , 𝑠𝑋 ) e 𝑌 tiene
una distribución 𝑁(𝑚𝑌 , 𝑠𝑌 ).

42. ¿A qué se le llama intervalo de confianza?

En estadística, se llama intervalo de confianza a un par o varios pares de números entre


los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto.
43. ¿Para qué sirve este intervalo?

Formalmente, estos números determinan un intervalo, que se calcula a partir de datos


de una muestra, y el valor desconocido es un parámetro poblacional.

44. ¿A qué se le denomina nivel de confianza?

Se denomina nivel de confianza a la probabilidad de éxito en la estimación y se


representa con 1 − 𝛼.

45. ¿Qué significa 𝛼 en la representación 1 − 𝛼?

𝛼 es el llamado error aleatorio o nivel de significación, esto es, una medida de las
posibilidades de fallar en la estimación mediante tal intervalo.

46. ¿Cómo puede construirse un intervalo de confianza?

Para la construcción de un determinado intervalo de confianza es necesario conocer la


distribución teórica que sigue el parámetro a estimar, 𝜃. Es habitual que el parámetro
presente una distribución normal. También pueden construirse intervalos de confianza
con la desigualdad de Chebyshev.

47. El intervalo de confianza se utiliza para evaluar la estimación del parámetro de población.
Menciona un ejemplo de esto.

Por ejemplo, un fabricante desea saber si la longitud media de los lápices que produce
es diferente de la longitud objetivo. El fabricante toma una muestra aleatoria de lápices
y determina que la longitud media de la muestra es 52 milímetros y el intervalo de
confianza de 95% es (50,54). Por lo tanto, usted puede estar 95% seguro de que la
longitud media de todos los lápices se encuentra entre 50 y 54 milímetros.

48. ¿Qué son los errores de medición?

Es la inexactitud que se acepta como inevitable, al comparar una magnitud con su patrón
de medida, el error de medida depende de la escala de medida empleada y tiene un
límite.

49. ¿Qué factores influyen en la observación para que se produzca un error en la medición?

Los factores que intervienen en la observación pueden depender del observador, método
de observación, objeto o elemento observado.

50. ¿Qué aspectos se deben considerar al hacer mediciones?

Los errores de medición, determinan que ninguna medición es absolutamente exacta. Lo


anterior se debe tomar en cuenta cuando se comparan dos o más observaciones, con el
fin de no dar mayor importancia a la existencia de pequeñas diferencias, las cuales
pueden deberse simplemente, al proceso de medición utilizado.

51. ¿Cómo pueden ocurrir errores de medición por medio de un observador?

Entre los errores dependientes del observador pueden ocurrir por: el grado de
preparación o entrenamiento, el estado físico, el exceso de trabajo, las condiciones
ambientales de trabajo.

52. ¿De qué dependen que se produzcan más comúnmente los errores en las mediciones?

Errores dependientes del método de observación

Todos los métodos de observación, tienen errores de mayor o menor importancia y de


ahí surge la preocupación científica de mejorarlos o cambiarlos por otros más
convenientes.

Errores dependientes de los individuos observados

Fuera de la variabilidad real que presentan los individuos que se observan, hay también
una variabilidad sobreañadida dependiente de ellos mismos, debida a las condiciones y
tiempo en que se estudian.

53. ¿Es posible reducir los errores en las mediciones?

Si es posible, se logra de acuerdo a las causas que lo determinan. Aquellos dependientes


de los observadores, pueden reducirse aumentando su preparación y entrenamiento,
vigilando sus condiciones físicas y poniéndolos en condiciones óptimas de trabajo.

54. Si es posible, ¿Cómo pueden reducirse los errores dependientes de la observación?

Para disminuir los errores causados por el método de observación, se procura


seleccionar las mejores técnicas conocidas, estandarizar los métodos a emplear y
controlar constantemente el funcionamiento de los aparatos utilizados. Finalmente, se
debe procurar que los individuos estudiados se investiguen en las más favorables y
similares circunstancias con el fin de disminuir errores de lo que ello pueda depender.

55. ¿En qué consiste la medición de los errores?

Consiste en la evaluación de las diferentes técnicas y métodos de estudio de manera


conjunta. Cada investigador debiera estimar los errores de las técnicas e instrumentos
que utilizan, valorándose de manera conveniente los márgenes de error a que pueden
conducir su aplicación.

56. ¿Cuáles son los tipos de errores de medición?


Error aleatorio y error sistemático.

57. ¿En que consiste cada uno?

El error aleatorio es un error al azar, es inevitable, se produce por eventos únicos


imposibles de controlar durante el proceso de medición. En un estudio de investigación,
por lo general, el error aleatorio viene determinado por el hecho de tomar sólo una
muestra de una población para hacer inferencias.

El error sistemático es aquel que se produce de igual modo en todas las mediciones que
se realizan de una magnitud, puede estar originado en un defecto del instrumento, en
una particularidad del operador o del proceso de medición u observación, a este tipo de
error también se le llama sesgo.

58. ¿A qué se refiere con exactitud en los errores de medición?

Se refiere a que tan cerca se encuentra el valor medio de la distribución de la esperanza


matemática. Se relaciona con el sesgo de una estimación. A menor sesgo, más exacta
es la estimación. Sesgo: es la diferencia entre la esperanza matemática y el valor
característico de la población.

59. ¿Qué son los llamados valores anómalos?

También llamados atípicos u outliers, son aquellos casos u observaciones irregulares


que son numéricamente distantes de los datos que se están estudian y por otro no siguen
el mismo modelo.

60. En general, ¿Qué es la Regresión y Correlación?

La Regresión y la Correlación son dos técnicas estrechamente relacionadas y


comprenden una forma de estimación. El análisis de correlación produce un número que
resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar
a una ecuación matemática que describe dicha relación.

También podría gustarte