Está en la página 1de 12

Nombre de la Materia:Estadistica aplicada

Nombre de la Licenciatura o Maestría:Ingenieria


industrial y sistemas

Nombre del Alumno (a);Jose Elias Niño


Colunga
Matrícula:402442

Nombre de la Actividad:Módulo 3. Actividad


2. Análisis. Correlación y regresión

Módulo :2

Nombre del Profesor:ALEJANDRA


COLORADO SANCHEZ
Fecha
Introducción del negocio

El lugar de Max es un restaurante tradicional con aire informal en donde se sirve comida
corrida, antojitos mexicanos y burritos.

a) Investigación turística para realizar al menos dos correlaciones: una positiva y una
negativa.

El coeficiente de correlació n es la medida específica que cuantifica la intensidad de la relació n


lineal entre dos variables en un aná lisis de correlació n.

Para dos variables, la fó rmula compara la distancia de cada dato puntual respecto a la media de
la variable y utiliza esta comparació n para decirnos hasta qué punto la relació n entre las
variables se ajusta a una línea imaginaria trazada entre los datos. A esto nos referimos cuando
decimos que la correlació n examina las relaciones lineales.

La correlació n só lo se refiere a las dos variables dadas y no aporta informació n sobre las
relaciones má s allá de los datos bivariados. Esta prueba no puede detectar valores atípicos en
los datos (y por tanto estos sesgan los resultados) y tampoco puede detectar correctamente las
relaciones curvilíneas

El coeficiente de correlación r es un valor sin unidades entre -1 y 1. La significancia


estadística se indica con un valor p. Por lo tanto, usualmente las correlaciones se escriben con
dos números clave: r = y p =

-Cuanto má s se aproxima r a cero, má s débil es la relació n lineal.

-Los valores de r positivos indican una correlació n positiva, en la que los valores de
ambas variables tienden a incrementarse juntos.

- Los valores de r negativos indican una correlació n negativa, en la que los valores de una
variable tienden a incrementarse mientras que los valores de la otra variable descienden.

-Los valores 1 y -1 representan una correlació n "perfecta" positiva y negativa,


respectivamente. Dos variables perfectamente correlacionadas cambian conjuntamente a
una tasa fija. Decimos que tienen una relació n linear; cuando representados en un grá fico
de dispersió n, todos los puntos correspondientes a los datos pueden conectarse con una
misma línea recta

El valor p nos ayuda a determinar si podemos o no concluir de manera significativa que el coeficiente
de correlació n de la població n es diferente a cero, basá ndonos en lo que observamos en la muestra.

¿Có mo calculamos efectivamente el coeficiente de correlació n?

El coeficiente de correlació n de la muestra puede representarse con una

fó rmula: r=∑[(xi−¯¯¯x) (yi−¯¯¯y)] √ Σ(xi−¯¯¯x)2 ∗ Σ (yi −¯¯¯y)2

Los siguientes datos corresponden a la cantidad de personas contagiadas en la zona en miles y la


cantidad de trigo producida en toneladas al sembrar parcelas de 2 hectá reas cada una
Personas contagiadas (𝑥𝑥) 2 4 5 7 10 11 12 15
Ausentismo en comedor 8 9 11 11 12 14 15 16
N.º Contagio Ausentis × 2 2
𝑥
s mo 𝑥

() ( 𝑥)
1 2 8 16 4 64
2 4 9 36 16 81
3 5 11 55 25 121
4 7 11 77 49 121
5 10 12 120 10 144
0
6 11 14 154 12 196
1
7 12 15 180 14 225
4
8 15 16 240 22 256
5
TOTA 66 96 878 68 120
L 4 8

n = 8, ∑ 𝑥𝑥𝑥 = 878, ∑ 𝑥𝑥 = 66, ∑ 𝑥𝑥 = 96, ∑ 𝑥2 = 684, ∑ 𝑥2 = 1208


𝑥

66 ∑ 96
𝑥̅ = ∑ = = 8.25, 𝑥̅ = = = 12
𝑥

8 𝑥 8

COEFICIENTE DE CORRELACIÓN
∑ 𝑥𝑥𝑥𝑥 − 𝑥̅𝑥
878 − (8 × 8.25 × 12)
= =
√∑ 𝑥 − 𝑥𝑥̅ √∑ 𝑥 −
2 2 2
√684 − (8 × 8.252)√1208 − (8 × 122)
𝑥𝑥̅2
878 − 792 86 86
𝑥= = = = 0.973
√684 − (544.5) √1208 − (1152) √139.5√56 88.386

𝑥 = 0.973, esto significa que existe una excelente correlación o asociación positiva entre las
variables contagios y ausentismo en el comedor.

Esto quiere decir que a mayor cantidad de contagios mayo es el ausentismo en comedor.

Coeficiente de determinación: 𝑥 2 = (0.973) 2 = 0.947 94.7% son las variaciones


existentes en el ausentismo en comedor del restaurante que son explicadas por las
variaciones del número de contagios mientras que el 5.3% de las variaciones existentes en
el ausentismo del comedor son explicadas por otras variables que no están incluidas en el
modelo. Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o
predecir.

Estadísticas de la regresión

Coeficiente de correlación
múltiple 0,97301007
Coeficiente de determinación
R^2 0,94674859
R^2 ajustado 0,93787336
Error tipico 0,70499159
Observaciones 8

1. Un grupo de estudio tiene asignado obtener un modelo de regresió n lineal para


predecir las ventas semanales de una hamburguesa en funció n de la publicidad por la
radio, ha recopilado al azar los tiempos de duració n en minutos de la publicidad de 10
semanas y el respectivo nú mero de unidades vendidas del producto, los datos son los
siguientes.

N Publicidad Ventas
° X Y
1 20 50
2 30 73
3 30 69
4 40 87
5 50 108
6 60 128
7 60 135
8 60 132
9 70 148
1 80 140
0

SOLUCIÓN

N° Publicida Ventas Y 𝑥𝑥 2
dX × 𝑥2
𝑥 𝑥𝑥
𝑥𝑥
1 20 5 1000 4 2500
0 0
0
2 30 7 2190 9 5329
3 0
0
3 30 6 2070 9 4761
9 0
0
4 40 8 3480 1600 7569
7
5 50 1 5400 2500 1166
0 4
8
6 60 1 7680 3600 1638
2 4
8
7 60 1 8100 3600 1822
3 5
5
8 60 1 7920 3600 1742
3 4
2
9 70 1 1036 4900 2190
4 0 4
8
10 80 1 1120 6400 1960
4 0 0
0
tota 500 1070 5940 28400 1253
l 0 60
n =10, ∑ 𝑥𝑥𝑥𝑥 = 59400, ∑ 𝑥𝑥 = 500, ∑ 𝑥𝑥 = 1070, ∑ 𝑥2 = 28400, ∑ 𝑥2 = 125360

□ 𝑥

x̅ = ∑ xi = 500 = 50, y̅ = ∑ yi = 1070 = 107

n 10 n 10

, esto significa que existe una excelente correlación o asociación positiva entre
las variables publicidad en minutos y unidades de venta.

COEFICIENTE DE DETERMINACIÓN

94.2% son las variaciones existentes en las unidades de venta que son explicadas por las
variaciones de la publicidad en minutos mientras que el 5.8% de las variaciones existentes
en las unidades de venta son explicadas por otras variables que no están incluidas en el
modelo.
Por lo tanto, el modelo de regresión lineal simple es adecuado para estimar o predecir.

Estadísticas de la regresión

Coeficiente de correlación
múltiple
Coeficiente de determinación
R^2
R^2 ajustado 0,93461497
Error tipico 8,88653972
Observaciones 10

a) Realizar al menos dos aná lisis de regresió n lineal simple

1.-Los siguientes datos muestran las ventas de una orden de tacos con relación a los
minutos diarios que se dedica en radio a su promoción durante un mes

Minutos de Número de
promoción tacos
vendidos
Mes en radio (x) (y)
1 6.8 275
2 3.3 142
3 4.1 168
4 4.2 197
5 4.8 215
6 3.9 188
7 4.9 241
8 7.7 295
9 3.1 125
10 5.9 266
11 5 200

El modelo es y=36.413x+32.237

Con este modelo podemos realizar estimaciones de las ventas de los tacos en función del
número de minutos dedicados a su promoción en radio.

Estas estimaciones de las ventas son un buen referente para la toma de decisiones. Por
ejemplo, podemos obtener la estimación de las ventas mensuales cuando se dedican 8
minutos al día de anuncio publicitario por radio:

y=36.413x+32.237

y=36.413(8) +32.237
y= 323.541

Entonces, aproximadamente se venderían 324 libros.

Además de obtener el modelo, es muy importante su interpretación. Este modelo se podría


e interpretar así:

TACOS VENDIDOS = 36.413(MINUTOS) +32.237

Tacos y publicidad
350
300
250 f(x) = 36.41 x + 32.46
200
150
100
TACOS

50
0

2 3 4 5 6 7 8
MINUTOS DE PUBLICIDAD EN RADIO
X

El lugar de Max tiene ventas por internet, y ha encontrado que existe una relación entre el
número de catálogos que se reparten en físico (tiendas de conveniencia y domicilios
particulares) en las diversas ciudades en donde ofrecen servicio y el número de órdenes
recibidas. La empresa recibe los pedidos a través de su portal en Internet y hace la entrega a
domicilio. Los siguientes datos indican el número de catálogos repartidos y el número de
órdenes recibidas

No. de
catálogos No. de órdenes
repartidos recibidas
Ciudad (cientos) (x) (y)
1 7 260
2 3 160
3 6 230
4 2 150
5 11 320
6 8 250

El modelo es y=19.179x+110.06
Con base en este modelo, podemos estimar que en una ciudad donde se reparten 1500
catálogos, es decir, x=15:

y=19.179x+110.06

y=19.179(15)+110.06

y= 397.745

Entonces, aproximadamente se recibirían 398 órdenes.

Además de obtener el modelo, es muy importante su interpretación. Este modelo se podría


interpretar así:

ÓRDENES RECIBIDAS = 19.179(CATÁLOGOS EN CIENTOS) + 110.06

Catálogos y órdenes de compra


350
300
250 f(x) = 19.18 x + 110.06
200 R² = 0.98
150
100
50
ÓRDENES

0 2 4 6 8 10 12
CATÁLOGOS REPARTIDOS X

b) Consultar fuentes por ejemplo de la Secretaría de Turismo

Debes escribir el análisis de tus correlaciones y análisis de regresión. ¿Qué experiencia te


deja este análisis de datos para tu negocio relacionado con el turismo?
El análisis de regresión es quizá la técnica estadística más utilizada para investigar o
estimar la relación entre las variables dependientes y un conjunto de variables explicativas
independientes.

Este tipo de análisis de datos también se utiliza como término general para una variedad de
técnicas de análisis de datos que se utilizan en un método de investigación cualitativo para
modelar y analizar numerosas variables.

En el método de regresión, la variable dependiente es un predictor o un elemento


explicativo y la variable dependiente es el resultado o una respuesta a una consulta
específica.

Conclusión

Después de realizar los diferentes ejemplos sobre el coeficiente de correlación ya sea


positivo o negativo nos damos cuenta que nos ayuda mucho para la toma de decisiones en
las empresas en este trabajo lo hice sobre un restaurante típico mexicano.

El coeficiente de correlación es una herramienta estadística que posibilita entablar la fuerza


y dirección de una interacción lineal estadística entre 2 cambiantes desde una muestra
definida, bajo el supuesto de que ésta es representativa.

Hay casos en los cuales un coeficiente de correlación importante entre 2 cambiantes es


resultado de un tercer elemento distinto de ellas y no de la vida de una interacción lineal
con cualquier sentido en medio de las mismas bajo la importancia de alguna teoría popular
(por ejemplo, biológica, física, económica, entre otras). Una vez que esto ocurre, se plantea
que la correlación es espúrea. La correlaciones espúreas tienen la posibilidad de
manifestarse una vez que las cambiantes analizadas son medidas por medio de datos de
corte transversal o series de tiempo.
En medio de las primordiales razones de las correlaciones espúreas en un entorno de corte
transversal figuran la utilización de ratios, la existencia de datos atípicos y de equipos no
involucrados. Para la situación de correlaciones espúreas causadas por la utilización de
ratios, la detección involucra la exploración de la correlación y sentido de los elementos
cambiantes (numeradores) de los mismos. Para la situación de datos atípicos el gráfico de
dispersión es una herramienta bastante fundamental para identificarlos. Para la situación de
conjuntos no involucrados, es viable identificar la existencia de correlaciones espúreas
analizando el gráfico de dispersión y la composición de la muestra.

También podría gustarte