Está en la página 1de 23

PROBLEMAS RESUELTOS CON STATGRAPHICS CENTURION XVI

1) Explique qu es el Anlisis de Correlacin Simple, Mltiple y Parcial. Cul


es el coeficiente de correlacin segn la naturaleza de las variables.
Graficar.

Correlacin es la medida del grado de relacin entre dos o ms variables.
Cuando analizamos variables nominales suele utilizarse el trmino asociacin
para indicar el grado de relacin entre las variables.
1.1. Anlisis de correlacin Simple: Se le llama as a la correlacin entre
dos variables cuantitativas para verificar su relacin. Donde se involucra
solo una variable independiente.
1.2. Anlisis de correlacin Mltiple: Se le llama as a la correlacin entre
varias variables independientes con una dependiente.
1.3. Anlisis de correlacin Parcial: Se le llama as a la correlacin de dos
variables manteniendo el resto constante.

Coeficiente de correlacin segn la naturaleza de las variables: El grado de
relacin entre variables depende de la naturaleza de las variables
involucradas en la investigacin; de esta manera las relaciones descritas que
se conocen son:
Con el estadstico Ji-cuadrado: Si ambas variables son nominales
Con el Coeficiente de correlacin de Spearman: Si ambas variables
son ordinales.
Con el coeficiente de Pearson: Si ambas variables son intercalares.
Con el coeficiente Omega Cuadrado: Si una variables es nominal y
la otra intervalar.
Con el coeficiente de Phi: Si ambas variables son dicotmicas o
binarias.
Graficar:


La correlacin tiene las mismas propiedades de los vectores: Magnitud, direccin y
sentido, es as que se habla de:
Correlacin positiva o Directa: Ambas variables presentan la misma
tendencia porque a medida que aumente se espera que la otra tambin
aumente. Aunque en el caso de los seres humanos cuando hablamos de
caractersticas o variables como la talla y el peso aparece una variable
reguladora como la edad.
Correlacin positiva o Indirecta: Se da a la inversa de la anterior mientras
una variable aumenta, la otra tiende a disminuir, mostrando tendencias
claramente opuestas; un ejemplo claro es el de la oferta y el precio (la oferta
aumenta, el precio tiende a bajar).

En este caso los diagramas de dispersin son de gran ayuda al analizar
visualmente el grado de relacin; en este caso las tendencias son muy claras.
As es como nos ayudaran estas graficas a analizar y sacar resultados acerca de
las tendencias que encontraremos en problemas resueltos con STATGRAPHICS
CENTURION XVI











2) Desarrolle adecuadamente si la Correlacin es una medida de
confiabilidad de un instrumento de medicin o test.
Variables independientes
entre s; no existe
correlacin.


La correlacin es la base utilizada para evaluar la confiabilidad de un
instrumento de medicin o test.

Por ejemplo:
Si los puntajes de un test fueron medidos en base a una escala tipo Likert
(escala psicomtrica utilizada en cuestionarios, que se usa mayormente en
encuestas para la investigacin); se utilizar el Coeficiente Croan Bach.
Pero si los puntajes provienen de alternativas dicotmicas o binarias (si, no) se
utilizara el coeficiente de Kuder-Richardson.

Una interrogante que salta a la mente de inmediato es Cmo analizar un
Test que tiene preguntas en escala (si, no) y en escala Likert?

Esta situacin nos conduce a trabajar en el sentido que se pueden aplicar dos
tipos de correlacin:
Coeficiente de correlacin de Pearson: En este caso debe aplicarse el
test en dos oportunidades diferentes y luego correlacionar mediante
coeficiente de correlacin de Pearson, la relacin de los puntajes totales de
la primera aplicacin con los de la segunda. Si se mantiene entre las dos
aplicaciones una correlacin que por lo menos es mayor que 0.7 se
concluye que el test es confiable.
Coeficiente de particin por mitades o correlacin de Sparman
Brown: Mide el grado de la segunda mitad del test, o entre pares e
impares es lo ms elevada posible y en todo caso mayor que 0.7, se
concluye igualmente el test es confiable.

La correlacin tambin hace posible el clculo del coeficiente de determinacin
R
2
que se utiliza como medida de la bondad de ajuste de un modelo de
regresin.
En general, si el valor de R-cuadrado es mayor en comparacin a otro modelo,
el modelo que posea un R-cuadrado mayor ser el de mayor ajuste. El R-
cuadrado, comienza a ser importante si sobrepasa el valor 0.70. Ya que este
coeficiente siempre es positivo.
3) Desarrolle 10 ejemplos de correlacin con Statgraphics Centurin XVI

Para hallar las correlaciones con Statgraphics Centurin XVI en los diferentes
ejemplos seguiremos los siguientes pasos:
Para un factor:
Relacionar Un factor Regresin Simple Variables (x, y) Modelo Lineal























Para dos o ms factores:
Relacionar Varios factores Anlisis Multivariado (Correlaciones)






















Ejercicio 1: Una compaa desea hacer predicciones del valor anual de sus
ventas totales en cierto pas a partir de la relacin de stas y la renta nacional.
Para investigar la relacin cuenta con los siguientes datos:

X 189 190 208 227 239 252 257 274 293 308 316
Y 402 404 412 425 429 436 440 447 458 469 469
X representa la renta nacional en millones de euros e Y representa las ventas
de la compaa en miles de euros en el periodo que va desde 1990 hasta
2000 (ambos inclusive). Calcular:
1. La recta de regresin de Y sobre X.

















2. El coeficiente de correlacin lineal e interpretarlo.


Como podemos observar en la tabla de anlisis de varianza hallado las
variables poseen un ndice de correlacin lineal de 0.9984

As mismo, si se decide realizar el anlisis como datos multivariados
optemos adems de una recta para cada variable que demuestra a simple
vista la relacin directa positiva y muy fuerte, casi perfecta que existe de
acuerdo a las definiciones de cada autor.

















Hernndez, 2003, p.532 y encontraremos otros parmetros de
interpretacin:
















3. Si en 2001 la renta nacional del pas fue de 325 millones de euros. Cul
ser la prediccin para las ventas de la compaa en este ao?
Ahora con el grafico de regresin obtenido para la pregunta 1, daremos
solucin a esta interrogante:



VENTAS
2001
= 301.654 + 0.534982 (325)
VENTAS
2001
= 117.0346 millones de euros

Ejercicio 2: La informacin estadstica obtenida de una muestra de tamao 12
sobre la relacin existente entre la inversin realizada y el rendimiento obtenido
en cientos de miles de euros para explotaciones agrcolas, se muestra en el
siguiente cuadro:

Inversin (X) 11 14 16 15 16 18 20 21 14 20 19 11
Rendimiento (Y) 2 3 5 6 5 3 7 10 6 10 5 6

Calcular:
1. La recta de regresin del rendimiento respecto de la inversin.










2. El coeficiente de correlacin lineal e interpretarlo.

El coeficiente de correlacin hallado fue de 0,6184; lo que de acuerdo a
Hernndez, 2003; representa una correlacin positiva media y cmo
podemos observar de la manera grfica los puntos se encuentran con
cierta tendencia que en varios puntos cambia. Es por esto que analizamos
de esa manera la relacin de nuestras variables.


3. La previsin de inversin que se obtendr con un rendimiento de 1 250 000
.
Como ya nos gener una ecuacin del rendimiento en funcin de la
inversin y lo que nosotros queremos hallar l lo contrario; seguimos el
mismo anlisis y obtenemos una nueva ecuacin que modela la regresin
entonces hallamos;




INVERSIN= 11.4636 + 0.84466 (1.25)
INVERSIN= 12.5194 cientos de millones de .

Ejercicio 3: El nmero de horas dedicadas al estudio de una asignatura y la
calificacin obtenida en el examen correspondiente, de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22
Calificacin (Y) 6.5 6 8.5 7 9 9.5 7.5 8
Se pide:
1. Recta de regresin de Y sobre X.

















2. El coeficiente de correlacin mltiple
















En este caso el coeficiente de relacin mltiple muestra cierta tendencia en
los datos adems podemos verificar que el 0,7924 lo que segn Hernndez,
2003; refiere que la correlacin de nuestras variables (Calificacin y horas)
es una correlacin positiva considerable.

3. Calificacin estimada para una persona que hubiese estudiado 28 horas.

CALIFICACIN: 4.13903 + 0.153061 (28)
CALIFICACIN= 8.43

Ejercicio 4: En la tabla siguiente se indica la edad (en aos) y la conducta
agresiva (medida en una escala de cero a 10) de 10 nios.
Edad 6 6 6.7 7 7.4 7.9 8 8.2 8.5 8.9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1

1. Obtener la recta de regresin de la conducta agresiva en funcin de la
edad.















Segn lo que nos bota el anlisis tenemos un coeficiente de correlacin de-
0.86 lo que nos indica una correlacin fuerte negativa











2. A partir de dicha recta, obtener el valor de la conducta agresiva que
correspondera a un nio de 7.2 aos.


CONDUCTA= 22.5121 - 2.34747 (7.2)
EDAD
CONDUCTA

CONDUCTA= 5.61

Ejercicio 5: Los valores de dos variables X e Y se distribuyen segn la tabla
siguiente:
Y/X 100 50 25
14 1 1 0
18 2 3 0
22 0 1 2

Se pide:
1. Calcular la covarianza.













2. Obtener e interpretar el coeficiente de correlacin lineal.












Ejercicio 6: Las puntuaciones obtenidas por un grupo de alumnos en una
batera de test que mide la habilidad verbal (X) y el razonamiento abstracto
(Y) son las siguientes:
Y/X 20 30 40 50
(25-35) 6 4 0 0
(35-45) 3 6 1 0
(45-55) 0 2 5 3
(55-65) 0 1 2 7
Se pide:
1. Existe correlacin entre ambas variables?









La correlacin entre variables se da en:
La correlacin entre habilidad verbal y el primer razonamiento abstracto es
una correlacin negativa fuerte considerable ya que es -0.9439.
La correlacin entre habilidad verbal y el segundo razonamiento abstracto
es una correlacin negativa considerable ya que es -0.7569.
La correlacin entre habilidad verbal y el tercer razonamiento abstracto es
una correlacin considerable fuerte positiva ya que es 0.9342.


Ejercicio 7: En una empresa de transportes trabajan cuatro conductores. Los
aos de antigedad de permisos de conducir y el nmero de infracciones
cometidas en el ltimo ao por cada uno de ellos son los siguientes:

Aos (X) 3 4 5 6
Infracciones (Y) 4 3 2 1

Calcular el coeficiente de correlacin lineal e interpretarlo.









Como tenemos un coeficiente de correlacin igual a -1.00 diremos que es una
correlacin perfecta negativa
Ejercicio 8: Una persona rellena semanalmente una quiniela y un boleto de
lotera primitiva anotando el nmero de aciertos que tiene. Durante las cuatro
semanas del mes de febrero, los aciertos fueron:

Quiniela (X) 6 8 6 8
Primitiva (Y) 1 2 2 1

Obtener el coeficiente de correlacin lineal e interpretarlo. Ofreceran
confianza las previsiones hechas con las rectas de regresin?










En este caso el coeficiente de correlacin es 1.00 lo que nos indica que la relacin
de las variables es una relacin positiva perfecta.
Ejercicio 9: Sea la determinacin de la correlacin entre los rdenes de llegada
14por dos jueces en 8 competencias de natacin.

Nadador 1 2 3 4 5 6 7
Juez 1 10 11 9 13 7 14 6
Juez 2 11 13 8 10 9 15 7

Existe relacin entre los puntajes puestos por los jueces?









El coeficiente de correlacin es 0.8030 lo que quiere decir que la decisin de los
jueces acerca de las 7 competencias tiene una relacin positiva considerable.

Ejercicio 10: De una muestra de 50 estudiantes se registr sus actitudes para
xito y fracaso, Tienen relacin estos datos?

Estudiantes 1 2 3 4 5
xito 19 15 18 13 20
Fracaso 1 5 6 7 0









Nuestro coeficiente de correlacin es de 0.3879 lo que quiere decir que
nuestras variables poseen una relacin positiva dbil. Ciertamente poseen un
mnimo de relacin.

4) Se puede analizar con Statgraphics Centurion XVI la Correlacin entre
una Variable Nominal de varias categoras y una Variable Intercalar (u
ordinal).
En los casos que se requiera la asociacin entre una variable nominal y otra
(intervalar u ordinal). Aparece el coeficiente de asociacin segn Weimer
(1996, p.624), el Omega cuadrado (

).
En este caso puede presentarse en el mbito de un ANOVA cuyo valor F haya
dado significativo y sabiendo segn este valor F que hay una relacin entre las
dos variables ahora nuestro inters radica en conocer el grado de intensidad
de la asociacin.
De esta manera, el estadstico omega cuadrado(

es un estimador comn de
la fuerza de las asociaciones entre las variables del tratamiento y la

dependiente en un arreglo de ANOVA de un solo criterio de clasificacin. Fue
derivado por Hays y tiene la siguiente formula:



Dnde:

= Omega cuadrado de Hays


SCTRAT= Suma de cuadrados entre tratamientos
CMERROR = Cuadrado medio del error
SCT=Suma de cuadrados totales
K= es el nmero de tratamientos

El estadstico (

) omega cuadrado de Hays no esta incorporado todava en


algunos software pero la mayora de ellos provee los insumos necesarios para
poder determinarlo en forma indirecta.
Para su interpretacin debe utilizarse el siguiente parmetro:
Rango (

de omega cuadrado Intensidad de relacin


0.00 a 0.29 Dbil
0.30 a 0.69 Moderada
0.70 a 1.00 Fuerte

Con el estadstico omega cuadrado de Hays no debe hablarse de
direccionalidad positiva o negativa porque no hay forma de saber la
direccionalidad.

De la siguiente manera podemos hallar un ANOVA simple para el ejemplo
siguiente:
Se realiz un experimento para determinar:
A) Si son distintas las medidas del nmero de cirugas de pacientes externos
realizadas (por semana) en tres hospitales: General del sur, Universitario y
Coromoto.

B) La intensidad de la relacin entre el nmero de cirugas por semana y el
tipo de hospital.

En STATGRAPHICS CENTURION XVI

















Hospital General
del Sur
Hospital Universitario
de Maracaibo
Hospital Coromoto
19
19
18
14
12
25
23
22
21
22
25
23
23
13
14

A pesar de tener la F de Fisher no significativa, utilizamos el clculo del omega
cuadrado como ejemplo didctico:




Entonces tenemos que el 43.57% de la varianza en el nmero de cirugas
puede ser atribuido a la variable del tipo de hospital. Las variables poseen una
intensidad moderada.
Cabe resaltar que el clculo del omega cuadrado se realiza cuando el
estadstico F halla resultado significativo.

5) Se aplica el Anlisis de Regresin no Lineal en el Diseo de
Experimentos. Explique y grafique con ejemplos en Software.
REGRESION NO LINEAL CON UNA VARIABLE
Para este captulo se trabajara sobre el StatFolio nonlinear reg.sgp recuerde
esta es la forma de acceder al mismo
RECUERDE: El procedimiento Regresin No Lineal ajusta una funcin
especificada por el usuario relacionando una sola variable dependiente Y con
una o ms variables independientes X. El modelo se estima usando cuadrados
mnimos no lineales

El modelo sobre el cual trabajaremos en esta ocasin es:




Una vez accede al modelo no lineal se despliega la siguiente ventana, en ella
debe tener presente los siguientes conceptos:

Variable Dependiente: columna numrica que contiene los n valores de Y.
Funcin: una expresin de STATGRAPHICS que representa la funcin a
ajustar.
Debe incluir uno o ms nombres de columnas numricas, que representen
a las variables independientes. Tambin puede incluir funciones tales como
RAIZ o EXP. Cualquier nombre desconocido se considera que representa
parmetros del modelo que tienen que ser estimados.
Peso: una columna numrica opcional que contiene los pesos o
ponderadores que se aplicarn al cuadrado de los residuos cuando se
realice un ajuste por mnimos cuadrados ponderados.
Seleccin: seleccin de un subgrupo de datos. En caso que no desee
realizar el anlisis con el total de datos.

















Una vez establecidos las condiciones STATGRAPHICS, el siguiente paso es
establecer los lineamientos de los parmetros establecidos en el modelo (valores
presentes en la determinacin del mismo pero no como un continuo de datos sino
como un valor preestablecido).
Por ejemplo en este caso, tenemos dos parmetros, a y b. Cada uno lo hemos
hecho valer 0.1 (Recuerde que en este caso, como en el caso de los intervalos de
confianza a mayor valor de los parmetros mayor margen de error, es decir 0.1
implica 0.9 de confiabilidad). Finalmente y tras aceptar en esta ltima ventana de
dialogo obtenemos el anlisis:











RESUMEN DE ANALISIS

Este contiene seis elementos principales de su inters:

5.2.1 Resumen de los Datos: un resumen de los datos que fueron ingresados.
5.2.2 Funcin a Estimar: la funcin que se ha de estimar y las estimaciones
inciales de los parmetros.
5.2.3 Estadsticas de la Estimacin: el mtodo empleado en la estimacin as
como el nmero de iteraciones y llamadas de la funcin que se llevaron a cabo.
5.2.4 Estimaciones de los Parmetros: los parmetros estimados con sus
respectivos intervalos de confianza aproximados. De esta manera intervalos que
no contienen al 0 indican que el parmetro del modelo es estadsticamente
significativo al nivel de confianza establecido.

5.2.5 Anlisis de Varianza: Este incluye descomposicin de la variabilidad de la
variable dependiente Y en una suma de cuadrados del modelo y una suma de
cuadrados residual o del error.
5.2.6 Estadsticas: estadsticas de resumen para el modelo ajustado, incluyendo:
R-Cuadrada - representa el porcentaje de la variabilidad en Y que ha sido
explicado por el modelo de regresin ajustado, que va de 0% a 100%
R-Cuadrada Ajustada el estadstico R-cuadrada, ajustado para el nmero de
coeficientes en el modelo. Error Estndar de Est. La desviacin estndar
estimada de los residuos (las desviaciones alrededor del modelo). Este valor
se usa para crear lmites de prediccin para nuevas observaciones.
Error Medio Absoluto el valor absoluto promedio de los residuos.
Estadstico Durbin-Watson una medida de la correlacin serial en los
residuos. Si los residuos varan aleatoriamente, este valor debiera ser cercano
a Un valor-P pequeo indica un patrn no aleatorio en los residuos. Para datos
registrados en el tiempo, un valor-P pequeo podra indicar que alguna
tendencia en el tiempo no ha sido explicada.
Autocorrelacin Residual de Retardo 1 la correlacin estimada entre
residuos consecutivos, en una escala de 1 a 1. Valores alejados del 0 indican
que en el modelo queda estructura significativa sin explicar.

GRAFICA DEL MODELO AJUSTADO:

La ventana Grfico del Modelo Ajustado grafica el modelo ajustado versus
cualquiera de las variables independientes, dndole a las otras variables los
valores establecidos en la caja de dialogo de opciones de ventana (Recuerde
acceder a l a travs del click derecho sobre el grfico).


















De esta manera podemos ver cmo es que se aplica el modelo de regresan no
lineal al diseo de experimentos.
REGRESION NO LINEAL CON DOS O MAS VARIABLES EN DISEO DE
EXPERIMENTO: