Está en la página 1de 13

¿Qué tipo de análisis de regresión se puede realizar con Minitab?

Investiga y explica cada una de ellas

MiniTab es una gran herramienta para los estadísticos, desde su

desarrollo como estudiante hasta cuando ya se encuentran en un área laboral

como bien se describen ciertas reseñas en institutos universitarios y negocios.

Existen diversos análisis de regresión en este programa, que nos ayudaran

dependiendo de lo que llevemos a cabo entre ellos tenemos que más destaco

son:

Regresion lineal: Este tipo de regresión también la podríamos

conseguir en libros, revistas o en internet u otra herramienta similar que

Minitab como regresión lineal simple, o también regresión lineal bivariada,

quise hacer un poco de énfasis aquí porque a nivel de investigación de este

trabajo me di cuenta a nivel de un foro que uno persona no conseguía la

regresión lineal y bien en aquella herramienta no era más que la regresión

lineal bivariada, y creía que había un tipo de diferencia en contra otras cosas.

Ahora de que va este tipo de regresión pues es aquella que vamos a utilizar

para los problemas de predicción de un valor en una variable, pero esto va a

depender en función del valor de una variable independiente. Ahora ¿Que es

esa variable dependiente? Bueno la podemos denominar como la variable de

resultado, o bien de objetivo o criterio del problema, por otro lado, la variable
independiente la denominamos como la variable predictora, explicativa o bien

regresiva. Es mucho donde aparecen estas variables y es por ello que lo mejor

es conocer que es cada una, y como puede denominarse. Quisiera hacer un

ejemplo de manera más acorde al mundo real. Por ejemplo podríamos usar la

regresión lineal para comprender la adrenalina que podrían experimentar los

jugadores de la selección Mexicana ante un partido de futbol, esto lo podemos

predecir en función del tiempo de partido, con esto podríamos decir que la

variable dependiente seria la “Adrenalina ante el partido importante” medida a

través de un índice de adrenalina, y la variable que denominamos

anteriormente como independiente no sería otra que “tiempo de revisión”, que

podemos medir en horas (Mejor aún si el partido se va al segundo tiempo

extra). Optativo a esto, podemos usar esa regresión lineal para comprender la

aceleración de la respiración (Aquí es donde la sangre moviliza más oxígeno y

desecha más dióxido de carbono) esto se puede predecir en función del tiempo

dedicado (La variable dependiente seria la “concentración de sangre” medida

en función a la volemia que es una fórmula de 70mL x peso de persona está a

su ves depende de la grasa corporal siendo más grasa equivalente a menos

sangre pero todo lo podemos formular en una variable. o bien pensé

formularlo asi con la información previa dada y la variable independiente seria

el “Tiempo que se dedique a la actividad”). Algo que me parece interesante


ya en este punto es la diversidad del programa en función a lo que podemos

conseguir a los libros. Por ejemplo, si nos conseguimos con el caso de que

tenemos ya sea dos o más variables ya aparece la regresión múltiple que

podemos usar en el programa, más adelante hablare de esta. Ahora si el caso

aparece que, si se quiere realizar una relación lineal, pero no buscamos hacer

una predicción, podemos usar algo llamado ‘Correlación de Pearson’. Si el

caso es que la variable dependiente es dicotómica es decir que hay solo dos

opciones ‘Si y no’, ‘Niño y niña’, podemos usar la opción de regresión

logística binomial me baso en la versión 19 del software.

Ahora quisiera hacer un poco más de énfasis porque a la hora de utilizar

este tipo de regresión hay que tener en cuenta algo 7 supuestos:

1. Que la variable dependiente debe medirse a nivel continuo ya sea

de intervalo o de una razón variable.

2. Que la variable independiente debe medirse a nivel continuo o

categórico.

3. Es necesario una relación lineal entre las variables dependientes e

independientes.

4. No deben existir valores atípicos significativos


5. Debemos tener independencia de las observaciones, esto la

herramienta nos da la facilidad de verificar con la estadistia de Durbin-Watson

6. Los datos deben mostrar Homocedasticidad.

7. Verificar los residuos es decir los errores

Regresion ortogonal: Este tipo de regresión es otra que podemos

conseguir con el nombre de regresión de Deming, aunque en justo en el

programa aparece ‘Regresion ortogonal’ pero es para cualquier caso que

tengamos que resolver es decir que en el libro o ejercicio aparezca regresión

de Deming y no como regresión ortogonal. Ahora bien esta regresión examina

la relación lineal entre dos variables continuas. Es muy usado para calcular

equivalencia de instrumentos en la parte clínica. A diferencia de la regresión

lineal simple, tanto la respuesta como el predictor en la regresión ortogonal


contienen un error de medición. En la regresión simple, solo la variable de

respuesta contiene un error de medición.

Regresión lineal múltiple: Esta sección de minitab en cuanto a

regresión múltiple no es más que una prueba de hipótesis que determina si

existe una correlación entre dos o más valores de X y la salida, Y, de datos

continuos. Es útil para determinar el nivel al que los cambios en Y pueden

atribuirse a una o más X. La regresión múltiple produce aquí algo que

denominamos una "ecuación de predicción" que estima el valor de Y que se

puede esperar para valores dados de uno o más valores de X dentro del rango

del conjunto de datos.

Un ejemplo seria para los conductores de trailers del país quisieran

probar el rendimiento de la gasolina pero que estuviera correlacionado con la

cantidad de zonas empinadas y uso del aire acondicionado, calcularíamos

aproximadamente cuantas zonas empinadas existen por donde este pasa y

tiempo de uso del aire acondicionado se requiere para lograr el rendimiento

optimo o deseado de la diésel.

Regresión de mínimos cuadrados: Para este caso son aquellos datos

que sugieren una relación lineal entre ‘X’ e ‘Y’, la línea para este caso que

mas ajusta es la línea de regresión con la ecuación ŷ = a + b x. Ahora la línea


de regresión de mínimos cuadrados hace la distancia vertical desde los puntos

de datos hasta la línea de regresión sea lo más pequeña posible. Ahora por que

a diferencia de las demás regresiones esta tiene un nombre tan en particular

como ‘mínimos cuadrados’ porque la mejor línea de ajuste es aquella que

minimiza la varianza es decir la suma de los cuadrados de los errores.

Resultaria un tanto complejo ver esto a primera vista al comienzo pero su

objetivo es aquella ecuación que se ajuste lo mas posible a los puntos

Regresión Logística: Bueno aquí nos encontramos con un método

estadístico que predice la probabilidad de que ocurra un evento ajustando los

datos a una curva logística utilizando una función logística. El análisis de

regresión utilizado aquí es para predecir el resultado de una variable

dependiente categórica, basado en una o más variables predictoras. La función

logística utilizada para modelar las probabilidades describe el posible

resultado de un solo ensayo en función de las variables explicativas. La

variable dependiente en una regresión logística puede ser binaria (por ejemplo,

1/0, sí / no, pasa / no pasa), nominal (azul / amarillo / verde) u ordinal

(satisfecho / neutral / insatisfecho). Se utiliza una regresión logística binomial

como dijimos anteriormente para predecir una variable dependiente

dicotómica (como el ejemplo de 1/0 si/no, entre otros) basada en una o más

variables independientes continuas o nominales. Es el tipo más común de


regresión logística como bien aparece en la comunidad y, a menudo, se

denomina simplemente regresión logística. Sin embargo, en Minitab se

refieren a ella como regresión logística binaria. En muchos sentidos, una

regresión logística binomial se puede considerar como una regresión lineal

múltiple dependiendo el caso, pero para una variable dependiente dicotómica

en lugar de continua aquí parte la diferencia.

Investigue la fórmula de regresión línea en Minitab y explica


cada uno de sus términos
y = b + m1 x1 + m2 x2 +… + Mn xn

Donde y es la variable dependiente y las diversas xi Son los independientes

variables. La constante, b, es la intersección en y para todo xi = 0, y los

diversos mi Son las pendientes/ coeficientes de las correspondientes variables

independientes, xi. A diferencia del caso bidimensional , y = mx + b, en el

que la variable independiente x es la única contribuyente a cambios


predecibles en la variable dependiente, en regresión múltiple, diferentes

variables independientes contribuyen de manera desigual a los cambios en la

dependencia variable. Por lo tanto, en cualquier regresión múltiple, es

importante evaluar las contribuciones y es asi como vamos poco a poco

desarrollando la formula y aprendemos lo que hace en cada paso y no solo

agregamos datos y ya. Otra manera de definirlo seria

y = b 0 + b 1 X 1 + b 2 X 2 + ... + b k X k

En la ecuación de regresión, las letras representan lo siguiente:

y es la variable de respuesta

b 0 es la constante

b 1 , b 2 , ..., b k son los coeficientes

X 1 , X 2 , ..., X k son los valores del término

Dos características principales en MatLab son

 Como opción para estandarizar las variables continuas, Minitab usó

unidades codificadas para ajustar el modelo.

 Minitab no puede transformar los coeficientes codificados en

coeficientes no codificados para la ecuación de regresión porque el

modelo no es jerárquico. Para obtener una ecuación de regresión en


unidades no codificadas, especifique un modelo jerárquico o utilice

unidades no codificadas.

En el documento hay un ejemplo resuelto


¿Qué indican los resultados obtenidos en el cuadro de resumen
del modelo?
No es mas en resumen que el 63.61% de la variación de Y se debe a la

intervención de X y que el promedio de las desviaciones de las estimaciones

es de 0.11. R2(ajustado) muestra un porcentaje de la variación del modelo. R2

por su parte es el resultado de la suma de la resta de los ‘predictivos’ y el

ajustado es la suma de la raíz cuadrada de la diferencia entre el observador y

predictiva
Investigue por lo menos 3 Software para estadística y explica las
características más importantes de cada uno de ellos
Lenguaje R:
Este lenguaje es imposible dejarlo por fuera, dado que es un lenguaje

de programación con toda una interfaz y un entorno de software para la

computación estadística. No son solo los estadistas, se ha viralizado mucho

por toda la web y bien si entras a cualquier foro sobre minación de

criptomonedas puedes conseguirte un tutorial o todo una documentación

donde los mineros implementan el lenguaje para realizar análisis de datos

complejos. Dentro posee el lenguaje que es interpretado y la interfaz principal

con la que te encuentras es una línea de comandos, en su estructuración nativa

incluye vectores, escalares, matrices que bien en lo que programación se

refiere es parecido a una tabla en una base de datos relacional y a partir de ello

no necesita tantas cosas externas. Una de las razones por la que es piloto en su

estilo y tan popular es que cuando realizas operaciones aritméticas matricial

complejas puedes conseguir una velocidad comparable que la que puedes

conseguir con MatLab. Aquí también consigues lo que es la regresión lineal,

una documentación donde al comienzo te das cuenta que es un a de las

técnicas de modelado predictivo que mas se utiliza a nivel universal habla

como el objetivo es que encuentra la ecuación matemática para una variable


continua Y en una o más X variables, asi de este modo nos enseña que se

puede predecir ‘Y’ cuando solo conocemos ‘X’

SPSS:

Es un gran software que al igual que MinTab ofrece análisis

estadísticos que hacen de lo complejo algo más simple a la hora del análisis

gráfico. También ofrece un apartado que donde es aplicable a proyectos o

resolución de ejercicios de cualquier nivel de complejidad. Cuando buscas su

objetivo o lo que lo caracteriza según ellos de otras empresas es que se maneja

de dos grandes ámbitos uno que mejora totalmente la eficiencia de uso y

minimizas en gran escala el riesgo general a partir de enfoque de generación

de hipótesis de abajo arriba. Es un programa versátil y receptivo diseñado para

realizar una variedad de procedimientos estadísticos. El software SPSS se usa

ampliamente en una variedad de disciplinas y su uso esta en escalas

exponenciales en todos los grupos de computadoras de escuelas de estadísticas

de las Universidad de Australia del Sur. El significado de las siglas son SPSS

(Statistical package for the social sciences). Pero La aplicación básica de este

programa es analizar datos científicos relacionados con las ciencias

sociales. Estos datos se pueden utilizar para estudios de mercado, encuestas,

minería de datos . Este software puede manejar y operar información

fácilmente con la ayuda de algunas técnicas. Estas técnicas se utilizan para


analizar, transformar y producir un patrón característico entre diferentes

variables de datos. Además, la salida se puede obtener a través de una

representación gráfica para que el usuario pueda comprender fácilmente el

resultado. Por ejemplo posee MANOVA (análisis multivariado de varianza) :

este método se utiliza para comparar datos de variables aleatorias cuyo valor

se desconoce. La técnica MANOVA también se puede utilizar para analizar

diferentes tipos de población y qué factores pueden afectar sus elecciones.

Stata:

Stata ofrece paquetes muy similares a los 2 software previamente

mencionados. Una cosa atractiva a nivel universal en el área de estadística es

su calidad/precio y que posee una documentación extensa pero más allegada a

las personas que incursionan en el uso de software estadístico. Hay tantas

opciones para crear un gráfico. Se tarda menos de un minuto en copiar de una

plantilla y pegar los comandos en un proyecto que llevemos en ese momento.

De lo averiguado quisiera destacar unos aspectos que este software ofrece:

 El análisis se puede realizar utilizando menús desplegables o sintaxis,


para adaptarse tanto a usuarios principiantes como avanzados.
 El análisis se puede realizar utilizando menús desplegables o sintaxis,
para adaptarse tanto a usuarios principiantes como avanzados.
 Métodos estadísticos de vanguardia.
 Excelente soporte integrado para el modelado de ecuaciones

estructurales.
 Los modelos que realicemos se pueden especificar mediante sintaxis o

con un diagrama de ruta.

Una Comunidad en línea grande y activa; repositorios de paquetes aportados


por el usuario.

Referencia
La opinión personal a la hora de responder y una investigación ostentosa por
internet y opiniones en foro, las respuestas van a partir de un conocimiento
individual que de a poco he adquirido y adquirí nuevo a la hora de investigar y
por supuesto las clases y ejemplos impartidos por el profesor. Una porción de
la referencia de esta información es a partir de la siguiente obra:

Johnson R.A. (2012). Probabilidad para ingenieros. México: Pearson,


PRENTICE HALL.

También podría gustarte