Está en la página 1de 53

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES


PROGRAMA DE PSICOLOGÍA
PSICOLOGÍA EVOLUTIVA

ESTADISTICA EVALUACION FINAL

ANA MILENA ALFARO LARRAHONDO


Código: 25365897
MINEIRA PAPAMIJA
Código: 1058967546
CAROL GUTIERREZ LUCUMI
Código: 29568711
IMELDA ESCOBAR

ALEJANDRO MENDEZ GONZALEZ


TUTOR

CODIGO DE GRUPO 204040A_72

NOVIEMBRE DE 2015
TABLA DE CONTENIDO
INTRODUCCION
JUSTIFICACION
OBJETIVOS
CONTENIDO
CONCLUSIONES
RECOMENDACIONES
PROPUESTA UNICA
INTRODUCCION

En este trabajo se realiza un análisis de todos los enunciados y talleres trabajados durante la
materia para resolver las dudas e incógnitas que hayan quedado durante la realización de cada
tema como son Conceptos preliminares y Etapas en una investigación estadística Medidas
Estadísticas Univariante, Regresión y determinación.

Se realizara una propuesta única que consolide una solución a las destreza de la disciplina que
se está formando.
JUSTIFICACION

La importancia de este trabajo es que nos permite la aplicación de los conceptos aprendidos de la
investigación realizada sobre regresión simple y regresión múltiple, identificando el problema
representándolo estadísticamente y su interpretación.

En este caso la problemática estudiada factores que influyen en el rendimiento académico de los
estudiantes de instituciones públicas y privadas del territorio nacional, se hace la identificación
del problema, la representación estadística se hace por medio de una gráfica llamada diagrama de
dispersión y su correspondiente interpretación.

De igual manera nos encontramos en un proceso de aprendizaje es necesario realizar actividades


como estas para practicar los conceptos adquiridos y saber manejar estos datos que son aplicables
en la vida cotidiana.
OBJETIVOS

General
Conocer y aplicar los diagramas para el estudio de problemas y recopilación de información y así
hacer entendible o de forma más sencilla la agrupación de la información a las personas

Específicos
 Identificar la relación existente entre dos variables.
 Adquirir habilidades en el estudio de estadísticas en la aplicación de problemas.
 Reconocimiento y aplicación de los ejercicios
 Conocer la importancia que tiene la aplicación de la estadística en la vida cotidiana.
TALLER MOMENTO 1

COCEPTOS BASICOS

Variable: cualquier carácter o fenómeno estadístico que pueda expresarse en valores numéricos y
estas se expresan en las ultimas letras del alfabeto (X, Y, Z).

Hay variable discreta cuando presenta un número finito de valores.

Variable cualitativa cualquier carácter o fenómeno estadístico que no pueda presentarse en


valores numéricos.

Población: al conjunto de elementos que poseen una misma característica. La población está
constituida por individuos y estos se denominan unidad estadística

Muestra: cualquier subconjunto de la población elegido en términos de representatividad.

Escalas de medidas hay tres niveles

1- escala nominal: la observación de un carácter viene expresada en escala nominal cuando no se


puede clasificar en varias categorías donde no hay una relación entre sí como el estado civil.

2- escala ordinal se puede establecer relaciones de orden entre las diferentes categorías existiendo
un origen de referencia como el nivel de estudio (medio, bajo, alto)

3-escala cuantitativa posee una escala de medida que caracteriza el fenómeno que se está
analizando

Frecuencia total (N) número total de observaciones


El número de veces que se repite x se denomina frecuencia absoluta

Unidimensional: observación exclusiva de una variable o producto

Unidad de investigación: el objeto o la causa que se va a evaluar

Ubicación: a que sector o a que está orientado

Espacio temporal: en qué tiempo o espacio refiriéndose a una fecha exacta

LABORATORIO DE DIAGRAMAS ESTADISTICOS

- La Agencia Especial de Alimentos y Bebidas en Ibagué, presenta un nuevo sabor de


Kola-sun, muy popular entre los clientes del Tolima. La compañía está interesada en
determinar la preferencia de consumo entre el mencionado producto, Coca-Cola, Pepsi y
Lima-limón. Se solicitó a 100 consumidores en forma aleatoria que degustaran cada una
de las bebidas y eligieran la bebida que más les gustara. Los resultados de la prueba se
resumen en la tabla 1.

Tabla 1

Bebida Número

Kola-sun 40

Coca-Cola 25

Pepsi 20

Lima-limón 15

Total 100
¿A qué tipo de variable corresponden los datos?

La variable es cualitativa.

Elabore una gráfica para describir la información.

PREFERENCIA DE CONSUMO

Kola-sun

Total Coca-Cola

Pepsi

Lima-limón

Mencione dos conclusiones a partir del gráfico.

De los consumidores que degustaron la que les gusta más es kola sun ya que es un nuevo sabor.

El sabor de la bebida que menos les gusta es lima limón.

- En un artículo de la revista “La Máquina” se presenta la información sobre el octanaje


de combustible para motores de varias marcas de gasolina.
88,5 93,4 91,1 93,2 91,1
94,7 96,1 90,5 88,6 86,7
84,3 89,6 100,3 88,7 89,7
90,1 90,4 87,6 92,7 93,3
89 91,6 92,7 89,3 87,4
89,8 90,7 87,9 91 92,2
91,6 88,6 93 87,5 96,5
90,3 88,3 94,4 87,8 84,3
90 94,2 90,4 88,3 89,9
91,5 85,3 91,2 89,2 91,8
89,9 90,1 86,7 92,3 92,2
98,8 89,3 94,2 88,9 88,2
88,3 91,1 90,8 89,8 92,6
90,4 92,2 90,1 92,7 91
91,2 83,4 91,8 93,3 87,7
90,6 91 88,4 86,7 88,5
93,7 90,9 104,5    

Realizar un histograma de frecuencias para la variable: octanaje


OCTANAGE DE COMBUSTIBLE
60

50

40

30

20

10

0
83,4 88,675 93,95 99,225 y mayor...

Realizar un polígono de frecuencias

OCTANAJE DE COMBUSTIBLE
60

50

40
frecuencia

30

20

10

0
83,4 88,675 93,95 99,225 y mayor...
intervalo 5

Mencione dos conclusiones a partir del gráfico.

En el intervalo de 90 - 93 se presenta mayor octanaje de combustible de motores.

En el intervalo de 93 - 96 se presenta menor octanaje de combustible de motores.

Las importaciones de un grupo de proveedores de motocicletas aparecen en la siguiente


distribución de frecuencias.
Tabla 2

Importaciones No de
(millones US) proveedores

2a5 6

5a8 13

8 a11 20

11 a 14 10

14 a 17 1

Construya un polígono de frecuencias para la variable importaciones.

IMPORTACIONES
25

20
frecuencia relativa

15

10

0
1 2 3 4 5
No provedores

Consigne dos conclusiones a partir del gráfico.


Entre 4 y 11 proveedores se presenta igual importaciones de las bicicletas

CARACTERIZACION DE VARIABLES CUALITATIVAS

Población: Estudiantes de Instituciones Públicas y Privadas del Municipio de San Sebastián de


Mariquita de los grados de básica primaria.

Muestra: 110 Estudiantes seleccionados de Instituciones Públicas y Privadas del Municipio de


San Sebastián de Mariquita de los grados de básica primaria.

Variables

Cualitativa: género de la población, grado cursado, grado escolaridad del acudiente, materia con
mayor dificultad, tipo de Institución.

Cuantitativa Discreta: estrato, numero de textos que posee en la casa, materias aprobadas,
numero de materias con desempeño bajo, numero de materias con desempeño básico.

Cuantitativa Continua: edad, estatura, peso, desempeño comportamiento.

Correlación de variables cualitativas

Genero

Grado cursado

Grado escolaridad acudiente

Materia con mayor dificultad

Tipo de institución

TABLAS Y GRAFICOS ESTADISTICOS


Genero de la Población

Genero f. a

Femenino 73

Masculino 37

total 110

Genero
120
110

100

80 73

60

40 37

20

0
Femenino Masculino total Genero
12

Moda: Matemáticas con frecuencia de1048.

0
Tipo de Institución

Tipo de
F.a
Institución

PUBLICA 47

PRIVADA 63

TOTAL 110

TIPO DE INSTITUCION
120
110

100

80
63
60
47
40

20

0
PUBLICA PRIVADA TOTAL
Moda: Institución Privada con frecuencia de 63.

TABLA DE CONTINGENCIA

Relación de variables cualitativas entre género y tipo de institución.

Cuenta de Tipo de
Institución Etiquetas de columna
Total
Etiquetas de fila Privado Público general
FEMENINO 43 30 73
MASCULINO 20 17 37

Total general 63 47 110

Esquema de trabajo para realizar la entrega


ESTUDIANTE-ROL ACTIVIDAD A REALIZAR

Portada
Introducción
Justificación
Objetivos
Caracterización del problema
Conceptos básicos ( población , muestra, etc)
Solución del laboratorio de regresión y correlación lineal.
Caracterización de variables cualitativas.
GRUPO Tablas y gráficos estadísticos.

IDENTIFICACIÓN DEL PROBLEMA


Se mira e identifican todas las variables posibles que nos da o
intervienen dentro del problema.
CLACIFICACIÓN
Se hace la debida separación y clasificación de las distintas
variables (variables cualitativas y cuantitativas).

ANÁLISIS GRÁFICOS
Se hacen el análisis del problema gráficamente (diagramas de
barras, histogramas, ojivas, diagramas de tallo y hojas entre
otros.)

CONCLUSIONES
De acuerdo al desarrollo llevado de este problema se dan las
distintos puntos de vistas u opiniones respectivas.

ENTREGAS
Entregas: Alertar sobre los tiempos de entrega de los
productos y enviar el documento en los tiempos

MINEIRA PAPAMIJA estipulados, utilizando los recursos destinados para el


Rol entregas envío, e indicar a los demás compañeros que se

TALLER MOMENTO 2

Hay dos tipos de variables las:

Cualitativas: que están representadas por una cualidad del producto u objeto de estudio

La variable cuantitativa: es la que se puede medir y esta se divide a su vez en:

Discreta: cuando su representación es exacta

Continuas: cuando sus unidades son enteros o decimales

Variables discretas:
1 número de textos escolares que posee en casa

2. materias aprobadas

3. numero de materias con bajo desempeño

4. numero de materias con básico desempeño

5. estrato

6. edad

Medidas univariantes

Son todas las tablas de distribución de frecuencia en presentaciones graficas

Variable central discreta

Estrato Ni Ni fi Fi

Nivel 1 16 16 0.145 0.145

Nivel 2 49 65 0.418 0.590

Nivel 3 45 110 0.409 1

110

Clase Frecuencia % acumulado


16 1 33,33%
65 2 100,00%
110 0 100,00%
y mayor... 0 100,00%
Histograma
2.5 120.00%

100.00%
2

80.00%
F r e cu e n cia

1.5
Frecuencia
60.00%
% acumulado
1
40.00%

0.5
20.00%

0 0.00%
16 65 110 y mayor...
estracto

ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Grafico
Versión Estudiantil de estracto
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
120
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
83
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Categorías

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
46
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
9
ersión Estudiantil Versión Estudiantil Versión
1 Estudiantil
2 Versión
3 Estudiantil
4 Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Clase Versión Estudiantil Versión Estudiantil
ersión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Rango recorrido R= x+-x-

R=45-16=29

Intervalos de la muestra K= 1+3,3 log n =1+3,3log 110 =

La amplitud se saca C=R/K =

N=110 osea que corresponde a la muestra de estudiantes coinciden en la frecuencia absoluta


acumulada

Frecuencia relativa y frecuencia relativa acumulada

Se halla de la siguiente manera f=ni/N =%

F=Ni/N = %

Grafico

Estracto de escolaridad
120

100

80

60

40

20

0
Estrato Nivel 1 Nivel 2 Nivel 3 total

Calcular las medidas de tendencia central: media, mediana, moda, los cuartiles, deciles 5 y 7 ;
percentiles 30 , 50 e interpretar sus resultados.

Media se suma toda la muestra y se divide por la cantidad de objetos ejemplo

1,2,2,3,3,4 6/8 =24/8=3

En el ejercicio vemos 110 muestras así 16 estudiantes en estrato 1, 49 en estrato 2 y 45 en estrato


3

En el estudio o caso planteado la media se saca 249/110= 2

Mediana:

Son todos los que ocupa la unidad central ejem 1,2,2,3,3,4 se toma la unidad central 3+3/2 = 6/2
=3

R: 249/110=2

Moda: es el que más veces se repite y es continua en la mitad de ejercicio o muestra

La moda del ejercicio es 2

Como hallar los deciles, percentiles y e interpretar sus resultados

MEDINA = Ni>=N/2

1 MITAD Ni >=N/4

2 MITAD Ni>=N/2

3 MITAD Ni>=N/3

Persentiles %

P Q1: 25/100 ¼ Q1:

Q2 50/100 2/4

Q3 75/100 ¾

La muestra es de 110

Cuartil:

Q1 = Ni >= Ni/4 Ni>= 125 (27.5) R = 2

Q2 = Ni>= Ni/2 Ni>=250 (55) R=2

Q3= Ni>= Ni/3 Ni>= 750 (75) R=3

Quintiles :

.q3 = Ni>=3N/5 Ni>=36.6 R= 2

. q4 = Ni>= 4N/5 NI>= 27.5 R= 2

Deciles

D5: Ni >= 5N/10 Ni>= R=2

D7: Ni>= 7N/10 Ni>= R= 2


Percentiles

30 y 70

P:30 Ni>= 30N/100 30*110/100 = 33

Donde P:30= 2

P:70 Ni>= 70N/100 70*110/100 = 77

2) Donde P:70 = 3 Elegir una variable Continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados, representarla gráficamente
por medio de un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de
tendencia central, determinar el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50
( Interpretar sus resultados).

Variable

ni Ni fi Fi
Edade
s

7 7 7 0.063 0.063

8 29 36 0.263 0.327

9 29 65 0.263 0.590

10 28 93 0.254 0.845

11 17 110 0.154 1

110

La primera columna es la variable estudiada, la segunda frecuencia absoluta y la tercera la


frecuencia relativa

F¡=ni/fi
Gráfico de probabilidad normal
12

10

8
Ed ad e s

0
10 30 50 70 90
Muestra percentil

Polígono de frecuencia

12

10

8
e d ad e s

0
10 30 50 70 90
percentil

Cuartiles y deciles 5 y 7

Q1 = Ni >= Ni/4 Ni>= 125 (27.5) R = 8

Q2 = Ni>= Ni/2 Ni>=250 (55) R=9

Q3= Ni>= Ni/3 Ni>= 750 (75) R = 10


D5: Ni >= 5N/10 Ni>= R=9

D7: Ni>= 7N/10 Ni>= R= 10

Percentiles 25 y 50 e interpretarlos

P:25 Ni>= 25N/100 25*110/100 = 27.5

Donde P:25= 8

P:50 Ni>= 50N/100 50*110/100 = 55

Donde P:50 = 9

. MEDIDAS UNIVARIANTES DE DISPERSION

Identificar las variables discretas dentro del problema de estudio y calcular las medidas invariantes
de dispersión más adecuadas, a aquellas que consideren sean relevantes para el problema de
estudio.

Las variables discretas son: Estrato


Número de Textos Escolares que posee en la casa
Materias Aprobadas
Número de materias con desempeño bajo
Número de materias con desempeño básico

Con la variable Discreta elegida calcular: rango, varianza, desviación típica y coeficiente de
variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio.

Rango

La muestra es de 110/110 =1

Varianza

Desviación típica y coeficiente de variación


Numero de textos escolares que posee en la casa

La media: 110/22= 5

numero de          
textos Fi Fi ni   Ni
3 3 3 2.72   2.72
4 4 7 3.63   6.35
5 10 17 4.54   10.89
6 7 24 6.36   17.25
7 7 31 6.36   23.61
8 13 44 11.81   35.42
9 3 47 2.72   38.14
10 10 57 4.54   42.68
11 1 58 0.90   43.58
12 18 76 16.36   59.94
13 3 79 11.81   71.75
14 3 82 11.81   83.56
15 6 88 5.45   89.01
18 3 91 2.72   91.73
20 7 98 6.36   98.09
22 1 99 0.90   98.99
10
23 2 1 1.81   100.8
10
25 4 5 3.63   104.43
10
28 1 6 0.90   105.33
10
30 1 7 0.90   106.23
10
35 2 9 1.81   108.04
11
40 1 0 0.90   110
Desviación típica

Fi X1 -X (X1 - X)2
3 3-5=-2 4
4 4-5=-1 1
10 10-5=5 25
7 2 4
7 2 4
13 8 64
3 -2 4
10 5 25
1 -4 16
18 13 169
3 -2 4
3 -2 4
6 1 1
3 -2 4
7 2 4
1 -4 16
2 -3 9
4 3 1
1 -4 16
1 -4 16
2 -3 9
1 -4 16
418

Sn = 418/22

Sn = 19 =9.5

La desviación típica es: 9.5


Coeficiente de variación:

Se obtiene de la suma de los datos dividido por la muestra

X= +Xi/110 =

Coeficiente en un número diferente de 0

Cambio de diferencia X

C.V= S/X x100%

CV = S/12x100%

CV= 110/12= 9.16

CV= 9.16

_ Con la variable Continua elegida calcular: rango, varianza, desviación típica y coeficiente de
variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio

TALLER MOMENTO 3

Laboratorio

Solución del laboratorio de regresión y correlación lineal:

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe
entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que
está presente en el condensador principal en un proceso de destilación, de acuerdo
con los siguientes datos:

X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
Y= a+bx y = 14,947x + 74,283
R² = 0,8774

Si es confiable

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables. R2 afirma que el modelo explica
R//El R2 afirma que el modelo explica el 87.74% de la información, el grado de

relación de las variables es de 93.66%

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


RTA: -1.13
Diagrama de Dispersion
105

100

95
Y (Pureza)
Pureza

f(x) = − 0.04 x + 92.64 Linear (Y (Pureza))


90 R² = 0.01

85

80
0 5 10 15 20 25
% Hidrocarburos

2. El número de libras de vapor (y) consumidas mensualmente por una planta química,
se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y consumos


de vapor.

Temperatura Consumo de
Mes
(oF) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. Es confiable?
Y= a+bx
Y= 9,2087x - 6,3184
R² = 0,9999
Es confiable por la correlación de las dos variables
R² = 0,9999*100= 99.99%

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

R//El R2 afirma que el modelo explica el 99.99% de la información, el grado de

relación de las variables es de 99.99%

d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?

RTA: el consumo de vapor es 637.69


Diagrama de Dispersion
800

700

600

500 f(x) = 17.32 x + 292.02 Consumo de vapor (Lb)


R² = 0.15 Linear (Consumo de vapor (Lb))
400

300

200

100

0
0 2 4 6 8 10 12 14

1. Los investigadores están estudiando la correlación entre la obesidad y la respuesta


individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y)
que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son
variables aleatorias

 
x
y (umbral de
(porcentaje
reflejo de
de
flexión
sobrepeso)
nociceptiva)
89 2
90 3 a. Realice el diagrama de dispersión y determine el tipo de
75 4 asociación entre las variables.
30 4,5
51 5,5 b. Ajuste un modelo matemático que permita predecir el
75 7 efecto de una variable sobre la otra. Es confiable?
62 9 Y= a + bX
45 13 y = -0,0629x + 11,642
90 15 R² = 0,1115
20 14
Es confiable un hay una buena relación entre las dos variables

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables?

R//El R2 afirma que el modelo explica el 11.15% de la información, el grado de

relación de las variables es de 33.39%

a- ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 40?

RTA: El umbral de reflejo de reflexión nociceptiva es de 9.12

Recuerde que r el coeficiente de correlación ( raíz cuadrada de R2), determina el grado de la


relación de las variables

Diagrama de Dispersion
16

14 f(x) = 1.53 x − 5.28


R² = 0.93
12
x (porcentaje de sobrepeso) y
(umbral de reflejo de flexión
10 nociceptiva)
Linear (x (porcentaje de
8 sobrepeso) y (umbral de reflejo
de flexión nociceptiva))
6

0
0 2 4 6 8 10 12 14
REGRESION Y CORRELACION LINEAL SIMPLE

Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas.

Rta: Estatura y peso

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre


las variables

Estatura
Peso (kg)
(M)
1,32 33,2
1,22 25,0
1,26 26,2
1,39 34,1
1,25 23,2
1,43 39,5
1,45 47,9
1,34 30,2
1,20 23,1
1,40 36,2
1,26 26,4
1,25 24,0
1,42 39,4
1,27 25,6
1,35 34,1
1,35 36,5
1,42 33,5
1,20 22,6
1,41 39,2
1,26 25,0
1,25 24,9
1,40 39,2
1,31 30,2
1,32 30,4
1,32 30,6
1,39 34,9
1,24 23,9
1,45 39,2
1,26 24,9
1,26 25,0
1,35 30,1
1,27 26,3
1,45 39,8
1,38 35,2
1,33 30,1
1,20 22,1
1,50 48,0
1,21 19,9
1,22 20,2
1,30 27,2
1,23 22,9
1,37 35,2
1,45 40,1
1,35 32,5
1,20 24,1
1,38 35,2
1,27 27,2
1,26 24,9
1,37 34,2
1,32 30,2
1,37 35,1
1,32 31,0
1,36 34,2
1,30 29,5
1,38 35,0
1,25 26,0
1,24 23,5
1,24 24,5
1,25 25,8
1,38 37,0
1,27 26,3
1,37 35,2
1,39 36,8
1,40 38,3
1,26 26,1
1,35 33,6
1,36 32,1
1,26 27,2
1,32 30,5
1,33 30,1
1,35 34,0
1,27 25,8
1,45 39,5
1,26 26,1
1,20 23,5
1,30 30,1
1,21 25,0
1,32 30,5
1,38 35,4
1,45 40,2
1,25 26,3
1,37 35,2
1,40 35,2
1,45 39,2
1,35 33,9
1,33 30,8
1,33 30,6
1,42 39,7
1,37 35,2
1,31 29,6
1,30 29,0
1,28 28,5
1,31 30,5
1,32 30,6
1,32 31,2
1,36 35,2
1,43 40,1
1,45 40,7
1,33 30,2
1,33 31,2
1,26 27,0
1,32 31,0
1,42 40,2
1,27 25,2
1,34 32,0
1,40 38,2
1,38 37,6
1,31 30,2
1,42 39,5
1,26 25,4
Diagra de estatura
12

10

4 f(x) = − 1.04 x + 5.78


R² = 0
2

0
1.15 1.2 1.25 1.3 1.35 1.4 1.45 1.5 1.55

fi Linear (fi)

Sxy -0,00672
Sx 0,08051435
Sy 2,71293199
-
Rxy 0,03076501

El modelo explica un 0,0009 de la información y el valor de r coeficiente de la relación es de


0,30% de la relación

Esta se saca de R2 *100=-0,03076501


Grafico de peso
9
8
7
6
5
4
3
2
1 f(x) = 0 x + 1.49
R² = 0
0
15 20 25 30 35 40 45 50

Linear () Linear ()

sxy 0,15443067
sx 6,06770437

sy 1,22802072
rxy 0,02072543

La grafica solo explica el 0,0004 de la información y a sí mismo es su relación es de 0,20%


Se observa que la relación entre las dos variables no es confiable en ninguno se los casos

REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

_ Identificar una variable cuantitativa dependiente y varias variables independientes del estudio
de investigación.

RTA: Variable independiente edad, estatura

Variable dependiente peso

- Realizar el diagrama de dispersión de dichas variables.


Edad Estatura
Peso (kg) x1y x2y x1^2 x2^2 y^2
(años) (M) x1x2
9 1,32 33,2 298,8 43,824 11,88 81 1,7424 1102,24
7 1,22 25,0 175 30,5 8,54 49 1,4884 625
8 1,26 26,2 209,6 33,012 10,08 64 1,5876 686,44
10 1,39 34,1 341 47,399 13,9 100 1,9321 1162,81
8 1,25 23,2 185,6 29 10 64 1,5625 538,24
11 1,43 39,5 434,5 56,485 15,73 121 2,0449 1560,25
11 1,45 47,9 526,9 69,455 15,95 121 2,1025 2294,41
9 1,34 30,2 271,8 40,468 12,06 81 1,7956 912,04
7 1,20 23,1 161,7 27,72 8,4 49 1,44 533,61
11 1,40 36,2 398,2 50,68 15,4 121 1,96 1310,44
8 1,26 26,4 211,2 33,264 10,08 64 1,5876 696,96
8 1,25 24,0 192 30 10 64 1,5625 576
11 1,42 39,4 433,4 55,948 15,62 121 2,0164 1552,36
8 1,27 25,6 204,8 32,512 10,16 64 1,6129 655,36
10 1,35 34,1 341 46,035 13,5 100 1,8225 1162,81
10 1,35 36,5 365 49,275 13,5 100 1,8225 1332,25
11 1,42 33,5 368,5 47,57 15,62 121 2,0164 1122,25
7 1,20 22,6 158,2 27,12 8,4 49 1,44 510,76
11 1,41 39,2 431,2 55,272 15,51 121 1,9881 1536,64
8 1,26 25,0 200 31,5 10,08 64 1,5876 625
8 1,25 24,9 199,2 31,125 10 64 1,5625 620,01
11 1,40 39,2 431,2 54,88 15,4 121 1,96 1536,64
9 1,31 30,2 271,8 39,562 11,79 81 1,7161 912,04
9 1,32 30,4 273,6 40,128 11,88 81 1,7424 924,16
9 1,32 30,6 275,4 40,392 11,88 81 1,7424 936,36
10 1,39 34,9 349 48,511 13,9 100 1,9321 1218,01
8 1,24 23,9 191,2 29,636 9,92 64 1,5376 571,21
11 1,45 39,2 431,2 56,84 15,95 121 2,1025 1536,64
8 1,26 24,9 199,2 31,374 10,08 64 1,5876 620,01
8 1,26 25,0 200 31,5 10,08 64 1,5876 625
9 1,35 30,1 270,9 40,635 12,15 81 1,8225 906,01
8 1,27 26,3 210,4 33,401 10,16 64 1,6129 691,69
11 1,45 39,8 437,8 57,71 15,95 121 2,1025 1584,04
10 1,38 35,2 352 48,576 13,8 100 1,9044 1239,04
9 1,33 30,1 270,9 40,033 11,97 81 1,7689 906,01
8 1,20 22,1 176,8 26,52 9,6 64 1,44 488,41
11 1,50 48,0 528 72 16,5 121 2,25 2304
8 1,21 19,9 159,2 24,079 9,68 64 1,4641 396,01
8 1,22 20,2 161,6 24,644 9,76 64 1,4884 408,04
10 1,30 27,2 272 35,36 13 100 1,69 739,84
8 1,23 22,9 183,2 28,167 9,84 64 1,5129 524,41
10 1,37 35,2 352 48,224 13,7 100 1,8769 1239,04
11 1,45 40,1 441,1 58,145 15,95 121 2,1025 1608,01
9 1,35 32,5 292,5 43,875 12,15 81 1,8225 1056,25
7 1,20 24,1 168,7 28,92 8,4 49 1,44 580,81
10 1,38 35,2 352 48,576 13,8 100 1,9044 1239,04
8 1,27 27,2 217,6 34,544 10,16 64 1,6129 739,84
8 1,26 24,9 199,2 31,374 10,08 64 1,5876 620,01
10 1,37 34,2 342 46,854 13,7 100 1,8769 1169,64
9 1,32 30,2 271,8 39,864 11,88 81 1,7424 912,04
9 1,37 35,1 315,9 48,087 12,33 81 1,8769 1232,01
9 1,32 31,0 279 40,92 11,88 81 1,7424 961
9 1,36 34,2 307,8 46,512 12,24 81 1,8496 1169,64
7 1,30 29,5 206,5 38,35 9,1 49 1,69 870,25
10 1,38 35,0 350 48,3 13,8 100 1,9044 1225
8 1,25 26,0 208 32,5 10 64 1,5625 676
8 1,24 23,5 188 29,14 9,92 64 1,5376 552,25
8 1,24 24,5 196 30,38 9,92 64 1,5376 600,25
8 1,25 25,8 206,4 32,25 10 64 1,5625 665,64
9 1,38 37,0 333 51,06 12,42 81 1,9044 1369
9 1,27 26,3 236,7 33,401 11,43 81 1,6129 691,69
10 1,37 35,2 352 48,224 13,7 100 1,8769 1239,04
10 1,39 36,8 368 51,152 13,9 100 1,9321 1354,24
10 1,40 38,3 383 53,62 14 100 1,96 1466,89
8 1,26 26,1 208,8 32,886 10,08 64 1,5876 681,21
9 1,35 33,6 302,4 45,36 12,15 81 1,8225 1128,96
10 1,36 32,1 321 43,656 13,6 100 1,8496 1030,41
8 1,26 27,2 217,6 34,272 10,08 64 1,5876 739,84
10 1,32 30,5 305 40,26 13,2 100 1,7424 930,25
10 1,33 30,1 301 40,033 13,3 100 1,7689 906,01
10 1,35 34,0 340 45,9 13,5 100 1,8225 1156
8 1,27 25,8 206,4 32,766 10,16 64 1,6129 665,64
11 1,45 39,5 434,5 57,275 15,95 121 2,1025 1560,25
8 1,26 26,1 208,8 32,886 10,08 64 1,5876 681,21
7 1,20 23,5 164,5 28,2 8,4 49 1,44 552,25
9 1,30 30,1 270,9 39,13 11,7 81 1,69 906,01
7 1,21 25,0 175 30,25 8,47 49 1,4641 625
9 1,32 30,5 274,5 40,26 11,88 81 1,7424 930,25
10 1,38 35,4 354 48,852 13,8 100 1,9044 1253,16
11 1,45 40,2 442,2 58,29 15,95 121 2,1025 1616,04
8 1,25 26,3 210,4 32,875 10 64 1,5625 691,69
10 1,37 35,2 352 48,224 13,7 100 1,8769 1239,04
10 1,40 35,2 352 49,28 14 100 1,96 1239,04
11 1,45 39,2 431,2 56,84 15,95 121 2,1025 1536,64
10 1,35 33,9 339 45,765 13,5 100 1,8225 1149,21
9 1,33 30,8 277,2 40,964 11,97 81 1,7689 948,64
9 1,33 30,6 275,4 40,698 11,97 81 1,7689 936,36
11 1,42 39,7 436,7 56,374 15,62 121 2,0164 1576,09
10 1,37 35,2 352 48,224 13,7 100 1,8769 1239,04
9 1,31 29,6 266,4 38,776 11,79 81 1,7161 876,16
9 1,30 29,0 261 37,7 11,7 81 1,69 841
9 1,28 28,5 256,5 36,48 11,52 81 1,6384 812,25
9 1,31 30,5 274,5 39,955 11,79 81 1,7161 930,25
9 1,32 30,6 275,4 40,392 11,88 81 1,7424 936,36
9 1,32 31,2 280,8 41,184 11,88 81 1,7424 973,44
10 1,36 35,2 352 47,872 13,6 100 1,8496 1239,04
11 1,43 40,1 441,1 57,343 15,73 121 2,0449 1608,01
11 1,45 40,7 447,7 59,015 15,95 121 2,1025 1656,49
9 1,33 30,2 271,8 40,166 11,97 81 1,7689 912,04
9 1,33 31,2 280,8 41,496 11,97 81 1,7689 973,44
8 1,26 27,0 216 34,02 10,08 64 1,5876 729
8 1,32 31,0 248 40,92 10,56 64 1,7424 961
10 1,42 40,2 402 57,084 14,2 100 2,0164 1616,04
9 1,27 25,2 226,8 32,004 11,43 81 1,6129 635,04
10 1,34 32,0 320 42,88 13,4 100 1,7956 1024
10 1,40 38,2 382 53,48 14 100 1,96 1459,24
10 1,38 37,6 376 51,888 13,8 100 1,9044 1413,76
9 1,31 30,2 271,8 39,562 11,79 81 1,7161 912,04
10 1,42 39,5 395 56,09 14,2 100 2,0164 1560,25
8 1,26 25,4 203,2 32,004 10,08 64 1,5876 645,16
1009 146,04 3450,6 32321,5 4626,215 1348,19 9405 194,4584 112053,28
Diagrama de Dispersion
60.00

50.00

40.00
Estatura (M)
Linear (Estatura (M))
Axis Title 30.00
Peso (kg)
Linear (Peso (kg))
20.00

10.00

0.00
6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5
Axis Title

-calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente


su relación.

Resumen

Estadísticas de la regresión
Coeficiente de correlación 0,9674006
múltiple 5
Coeficiente de determinación 0,9358640
R^2 1
R^2 ajustado 0,9346
1,5114155
Error típico 8
Observaciones 110

ANÁLISIS DE
VARIANZA
Suma de Promedio de los Valor crítico
Grados de libertad cuadrados cuadrados F de F
780,665034
Regresión 2 3566,666566 1783,333283 8 1,51337E-64
Residuos 107 244,4283435 2,284377042
Total 109 3811,094909      

Probabilida Superior Inferior Su


  Coeficientes Error típico Estadístico t d Inferior 95% 95% 95,0% 9
Intercepción -78,937361 4,539466054 -17,38912904 5,93986E-33 -87,93632302 -69,938399 -87,936323 -69
-
edad(años)x 0,1747301 1,1684610
1 -0,496865439 0,338781903 -1,466623321 0,145411474 -1,168461049 7 5 0,17
Estatura 97,398515 75,636912
(M)x2 86,5177139 5,488747523 15,76274251 1,16617E-29 75,63691209 7 1 97,3

y= a0+a1x1+a2x2

y= -78,9373+-0,4968x1+86,5177x2

Representación individual del segundo punto

Regresión y Correlación Lineal Múltiple

_ Identificar una variable cuantitativa dependiente y varias variables independientes del estudio
de investigación.

Las variables se dividen en cualitativas dependientes que representan las causas o factores que
influyen en ella como es el rendimiento académico de los estudiantes de instituciones públicas y
privadas del territorio nacional como son: nivel de estudio del acudiente, falta de libros
académicos, materias con mayor dificultad de aprendizaje, tipo de institución, genero, edad entre
otras

Las variables independientes son los síntomas encontrados para el problema planteado el cual es
la causa que influye para el rendimiento académico de los estudiantes de instituciones públicas y
privadas

- Realizar el diagrama de dispersión de dichas variables.

Edad, extracto, número de textos, materias aprobadas, número de materias de bajo desempeño,
desempeño del comportamiento y numero de materias con bajo desempeño. Calcular la recta de
regresión y el coeficiente de correlación para probar estadísticamente su relación.
Edad

grafica de la edad
35

30

25
f(x) = 1.5 x + 8.5
R² = 0.06
20

15

10

0
6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 11.5

Linear ()

sxy 3
1,4142135
sx 6
8,5556998
sy 5
0,2479423
rxy 5

Donde R2 es de 0,24794235 por lo cual la relación de edad es de 24%

Extracto
Grafica de estracto
70

60
f(x) = 24.5 x − 12.33
R² = 0.93
50

40

30

20

10

0
0.5 1 1.5 2 2.5 3 3.5

Linear ()

sxy 16,3333333
sx 0,81649658
sy 20,7257221
rxy 0,96518549

La relación es de 96% y R2 es igual a 0,96518549

Numero de textos
Grafico de numero de textos que posee en la cas
20
18
16
14
12
10
8
f(x) = − 0.2 x + 8.36
6 R² = 0.22
4
2
0
0 5 10 15 20 25 30 35 40 45

Linear ()

-
sxy 21,1904762
sx 10,3417784
sy 4,36019929
-
rxy 0,46993647

La relación es de 46% y la R2 es de -0,46993647


Gráfico de materias aprovadas
70

60

50 f(x) = 15.1 x − 83.7


R² = 0.82
40

30

20

10

0
5 5 6 6 7 7 8 8 9 9 10

Linear ()

sxy 30,2
sx 1,41421356
sy 23,5881326
rxy 0,90531222

La relación es de 90% y la R2 es de 0,90531222

Gráfico de materias con desempeño bajo


40

35 f(x) = − 7.31 x + 36.62


R² = 0.93
30

25

20

15

10

0
0 1 2 3 4 5 6

Linear ()
-
sxy 21,3333333
sx 1,70782513
sy 12,970051
rxy -0,963105

La relación es de 96% y R2 es de -0,963105

Gráfico de numero de materias con desempeño basico


45
40
35
30
25
f(x) = − 3.39 x + 29.29
20 R² = 0.22

15
10
5
0
0 1 2 3 4 5 6 7 8

Linear ()

-
sxy 13,5714286
sx 2
sy 14,5377763
-
rxy 0,46676425
La relación es de 46% y la R2 es de -0,46676425
Gráfico de desempeño del comportamiento
60

50

40
f(x) = 23.55 x − 79.45
R² = 0.67
30

20

10

0
2.5 3 3.5 4 4.5 5 5.5

Linear ()

sxy 6,84
sx 0,53888774
sy 15,5306149
rsx 0,81727675

La relación es de 81% y el R2 es igual a 0,81727675


RECOMENDACIONES

 Con respecto a los métodos de estudio se podría mejorar en el aspecto de conseguir

más análisis a fondo y un mejor desarrollo de cada uno de los puntos que se abordan

 Cuando no se desarrollan bien las actividades, podemos llegar a tener consecuencias

dentro de nuestro estudio y la aprobación del curso que estamos trabajando. Un mayor

esfuerzo sería fundamental para mejorar mucho más en las actividades.

 El trabajo en equipo es bueno ya que se manejan diferentes opiniones y puntos de

vista donde se aprende de forma individual y grupal con las dudas que se van

presentando.

 la elaboración de los diferentes ejercicios de estadística nos muestran que la

estadística nos sirve para diferentes situaciones o para todas las situaciones de nuestra

vida ya que nos sirve para el análisis y resoluciones de los problemas y como buscar

la solución a ellos .
PROPUESTA UNICA

Partiendo de la problemática planteada “Factores que Influyen en el Rendimiento Académico


de los estudiantes de Instituciones Públicas y Privadas del territorio Nacional”, durante todo
el curso y con base a los informes y análisis estadísticos realizados donde se estudiaron y se
desarrollaron temas como:

 Los conceptos básicos de estadística, donde se realizaron las definiciones de cada uno de
los ítems que se iban aplicar en el desarrollo de cada uno de los análisis, como fueron:
variable, población, muestra, escala de medidas, unidad de investigación, espacio
temporal entre otros.
 Etapas de la investigación estadística: planteamiento del problema, fijación de los
objetivos, delimitación del campo de investigación.
 Análisis univariado de tendencia central y dispersión
 Regresión lineal simple y regresión lineal múltiple.
 correlación lineal

DATOS ESTADISTICOS

Correlación de variables cuantitativas

Según el problema planteado

Genero de la población

Genero f. a

Femenino 73

Masculino 37

total 110

Hay mas poblacion femenina

Medidas univariantes de tendencia variables discretas

Según el problema planteado

Estrato, número de textos que posee en la casa, numero de materias aprobadas, numero de
materias con desempeño bajo, número de materias con desempeño básico.

MEDIA ARITMETICA X

No. DE TEXTOS QUE POSEEN EN LA CASA


XNUM TEXTO = suma de textos / numero estudiantes
XNUM TEXTO = 1321 / 110 = 12,009.
El número promedio de textos escolares que poseen en los estudiantes en sus casas es de 12
textos.

ESTRATO
X = 251 / 110 = 2.28181818
No. MATERIAS APROBADAS

X = 953 / 110 = 8

MEDIANA Me
La mediana es el valor que divide en dos la distribución o datos ordenados.
Me NUM TEXTO = 10. Me ESTRATO = 2. Me MATERIA APROB = 9.
Me MAT DESEM BAJO = 1. Me MAT DESEM BASICO = 3.
MODA Mo
La moda es el valor de mayor frecuencia en una distribución.
Mo NUM TEXTO = 12. Mo ESTRATO = 2. Mo MATERIA APROB = 9.
Mo MAT DESEM BAJO = 1. Mo MAT DESEM BASICO = 3.

Con la aplicación de la estadística podemos ordenar, analizar y representar un conjunto de datos,


con el de describir apropiadamente las características del problema planteado.
En otras palabras la estadística nos permite mediante ciertas técnicas resumir numéricamente la
información que proviene de un conjunto de datos, para luego analizarlos, describirlos
gráficamente y así poder sacar las conclusiones generales y dar solución al problema planteado

SOLUCION

Examinar la relación que existe entre cada una de las variantes expuesta en el problema con el fin
de proponer las soluciones metodológicas posibles en la solución del problema que se presenta
en los factores que influyen en el rendimiento académico de los estudiantes de escuelas privadas
y públicas del territorio nacional.
CONCLUSION

Con el trabajo realizado podemos concluir que se estudiaron casos estadísticos, aprendiendo a

analizar las variables cuantitativas, cualitativas, líneas de correlación, a dibujar graficas que son

las que nos permitieron un mejor desarrollo de cada uno de los puntos elaborados e infinidad de

términos que nos eran extraños en nuestros conocimientos.

Cada punto desarrollado permito concluir con respecto al trabajo, gracias a la estadística se
facilita el desarrollo de complejas actividades que requieren de mucho cuidado y comprensión.
REFERENCIAS BIBLIOGRÁFICAS

Contenidos de la unidad 1-2 y 3

Aportes colaborativos del grupo

También podría gustarte