Está en la página 1de 36

Unidad 2 - Fase 4 - Medidas estadísticas

Presentado por:

Angie Arango

Fernando enrique Vásquez Betancourt

Oscar Lifardo Amador

José Leonel Juagibioy

Jhon Carlos Silva Ruiz

Presentado a:

Rubén Darío Herrera

Estadística Descriptiva - (511004a764) _10

Universidad nacional abierta y a distancia

Programa de licenciatura en matemáticas

20 de noviembre, 2020
INTRODUCCION

A través de los tiempos el hombre ha sentido la necesidad de poder interpretar todos los

fenómenos que se desarrollan en su entorno para entenderlos y tener un control absoluto de cada

uno de ellos, lo cual lo ha llevado a desarrollar diferentes estudios e investigaciones que le han

exigido el análisis de datos.

Es por ello por lo que la estadística se ha convertido en una herramienta importante para

analizar e interpretar los datos contenidos en la información que recopila. En la actualidad el

hombre aplica el uso de la Estadística en los casos que van desde el cálculo más sencillo hasta el

más complejo conocimiento científico. La Estadística se encuentra relacionada con diferentes

ámbitos de la sociedad como político, investigativo, educativo, etc.


DEFINICIONES.

1. Defina y de un ejemplo de:

a) MEDIDAS DE DISPERSIÓN

Las medidas de dispersión son números que indican si una variable se mueve mucho,

poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer de manera

resumida una característica de la variable estudiada. En este sentido, deben acompañar a las

medidas de tendencia central. Juntas, ofrecen información de un sólo vistazo que luego

podremos utilizar para comparar y, si fuera preciso, tomar decisiones.

LAS MEDIDAS DE DISPERSIÓN MÁS CONOCIDAS SON:

 El rango: Es un valor numérico que indica la diferencia entre el valor máximo y

el mínimo de una población o muestra estadística. Su fórmula es:

R = Máx – Mínx

 Donde:

R → Es el rango.

Máx → Es el valor máximo de la muestra o población.

Mín → Es el valor mínimo de la muestra o población estadística.

x → Es la variable sobre la que se pretende calcular esta medida.

EJEMPLO:

Supongamos que tenemos una empresa que produce microchips para luego venderlos a

las principales marcas de computadoras. Esta empresa encarga a un economista que realice un

estudio sobre la evolución de las ventas (últimos 4 años) para, posteriormente, ofrecer consejos
que mejoren los resultados empresariales. Entre otras muchas métricas, se pide que se calcule el

rango de producción de microchips. A continuación, se muestra la siguiente tabla de datos:

Año 1 ….. 44.347

Año 2 ….. 12.445

Año 3 ….. 26.880

Año 4 ..... 23.366

R = Máx – Mínx

R = 44.347 – 12.445

R = 31.902

El mes que más microchips produjo la empresa (MÁXIMO) fue el Año 01 con 44.347

microchips producidos. Por su parte, el momento que menos microchips produjo tuvo lugar en el

Año 02 con 12.445 microchips producidos. Por tanto, el rango estadístico que es la diferencia

(44.347 – 12.445) se sitúa en 31.902

¿Cómo se interpreta esto? Esto quiere decir, que durante los últimos 4 años la variación

máxima que ha habido ha sido de 31.902microchips producidos.

 La varianza: Es una medida de dispersión que representa la variabilidad de una

serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al

cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:

X → Variable sobre la que se pretenden calcular la varianza

xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.


N → Número de observaciones.

x̄ → Es la media de la variable X.

EJEMPLO:

Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con

un salario diferente:

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

Miguel: 1.300 euros

Mateo: 1.800 euros

La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +

1.700 + 1.300 + 1.800) /5) 1.500 euros.

Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que

calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este

caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.
Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de

228 euros.

 La desviación típica:Es otra medida que ofrece información de la dispersión

respecto a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz

cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.

X → Variable sobre la que se pretenden calcular la varianza

xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.

N → Número de observaciones.

x̄ → Es la media de la variable X.

EJEMPLO:

Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con

un salario diferente:

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

Miguel: 1.300 euros

Mateo: 1.800 euros

La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 +

1.700 + 1.300 + 1.800) /5) 1.500 euros.


Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que

calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este

caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros.

Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de

228 euros.

 El coeficiente de variación: Su cálculo se obtiene de dividir la desviación típica

entre el valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su

mejor comprensión.

X → Variable sobre la que se pretenden calcular la varianza

σx → Desviación típica de la variable X.

| x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0


EJEMPLO:

Vamos a comprobar cómo, con cualquiera de las dos fórmulas expuestas, el resultado de

la desviación típica o desviación media es el mismo.

Según la fórmula de la varianza (raíz cuadrada):

Según la fórmula del valor absoluto:

Tal como dictaba el cálculo intuitivo. La desviación media es de 1. Pero, ¿no habíamos

dicho que la fórmula del valor absoluto y de la desviación típica daban valores diferentes? Así

es, pero hay una excepción. El único caso en que la desviación estándar y la desviación respecto

de la media ofrecen el mismo resultado es el caso en que todas las desviaciones son igual a 1.

b) MEDIDAS DE POSICIÓN

Son indicadores usados para señalar que porcentaje de datos dentro de una distribución

de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se

encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas

de Tendencia Central ". Pero estas medidas de posición de una distribución de frecuencias han de
cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a

la que resumen. Toda síntesis de una distribución se considerará como operativa si intervienen en

su determinación todos y cada uno de los valores de la distribución, siendo única para cada

distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación, se

describen las medidas de posición más comunes utilizadas en estadística, como lo son:

Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero,

segundo y tercer cuartil.

Formula de Q1 para series de Datos Agrupados en Clase.

Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). El

decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10

partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el

90% restante),

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero a

los noventa y nueve percentiles).

El percentil supera al uno por ciento de los valores y es superado por el noventa y nueve

por ciento restante para series de Datos Agrupados en Clase.


EJEMPLO:

En una serie de 32 términos se desea localizar el 4° sextil, 8° decil y el 95° percentil.

Esto significa que el 4° textil se encuentra localizado en el término número 21, es decir,

el que ocupa la 21° posición; el 8° decil se encuentra localizado entre el termino número 25° y

26° y el 95° percentil entre la posición 30° y 31°.

c) CORRELACIÓN LINEAL

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es

una medida de regresión que pretende cuantificar el grado de variación conjunta entre dos

variables. Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos

variables, es decir, si se representan en un diagrama de dispersión los valores que toman dos

variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de puntos

representados se aproxima a una recta.

De una forma menos coloquial, la podemos definir como el número que mide el grado de

intensidad y el sentido de la relación entre dos variables.

Siendo:

Cov (x;y): la covarianza entre el valor «x» e «y».

σ(x): desviación típica de «x».


σ(y): desviación típica de «y».

Valores que puede tomar la correlación

ρ = -1          Correlación perfecta negativa

ρ = 0           No existe correlación

ρ = +1         Correlación perfecta positiva

Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y

además con la misma intensidad (+1). En el caso opuesto, si siempre que el valor «x» sube, y el

valor «y» baja, y además con la misma intensidad, entonces estamos hablando de correlación

negativa (-1). Es importante saber que esto no quiere decir que lo hagan en la misma proporción

(salvo que tengan la misma desviación típica).

Representación gráfica de la correlación

Correlación perfecta positiva:

 No hay correlación:
Correlación perfecta negativa:

Consejo: en muchas ocasiones, no tenemos los medios o los datos suficientes para utilizar

esta fórmula. Por ello, si tenemos dos series de precios, podemos calcular el coeficiente de

correlación en Excel, usando la siguiente función: coef.de.correl(serie de precios x;serie de

precios y).

d) REGRESIÓN LINEAL

La regresión lineal es quizás el método más conocido para “predecir” el comportamiento

de los datos o intentar hacerlo. Es como el caballito de batalla en los métodos predictivos, en

Machine Learning (ML) es considerada como una de la técnica central del aprendizaje

supervisado.

Hago un ejemplo fácil con datos de la temperatura global. Los datos se pueden descargar

desde la página de Robert H. Shumway.

#Cargamos los datos

temperaturas.globales<-scan("data/globtemp.dat")

x=temperaturas.global[45:142]

#Asignamos los tiempos de nuestros datos

t=1900:1997

#Estimamos la recta que describe "mejor" nuestros datos


fit=lm(x~t)

plot(t,x,type="o",col="2",xlab="Años",ylab="Temperaturas globales",main="Ejemplo de

Regresión Lineal")

abline(fit)

e) DIAGRAMAS POSIBLES EN LA REGRESIÓN Y CORRELACIÓN

LINEAL.

En un estudio sobre el sexismo en el trabajo se contrastaron las variables sexo y nivel de

ingresos. Los resultados obtenidos sobre una muestra de 528 individuos se presentan en una tabla

de doble entrada:

Se pide:

a) Representar gráficamente las variables en estudio.


b) Calcular una medida descriptiva del nivel de asociación entre ambas variables.

Realizar un análisis gráfico y analizar los resultados.


EJERCICIOS RESUELTOS

2. A continuación, se presentan las puntuaciones de un examen de matemáticas

realizadas a 64 estudiantes de un determinado colegio:

65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71,

68, 66, 56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62,

50, 51, 67, 70, 54, 72, 65, 59, 60, 70, 66, 57, 71, 53

a. REALIZAR LA TABLA DE FRECUENCIA

PUNTUAION F
EXAMEN
50 1
51 1
53 2
54 1
55 1
56 1
57 3
58 2
59 3
60 4
61 4
62 4
63 5
64 6
65 6
66 5
67 4
68 2
69 2
70 3
71 2
72 2
4025
RANGO INTERVALOS AMPLITUD
R =72 – 50 K = 1+3,322Log n A = 22/7
R = 22 K = 1+3,322 Log 64 A=4
K=7
PUNTUACIO X f fr F
N EXAMENES
50 54 52 4 0,062 4
54 58 56 6 0,093 10
58 62 60 13 0,203 23
62 66 64 21 0,328 44
66 70 68 13 0,203 57
70 74 72 7 0,109 64
74 78 76 0 0
TOTAL 64 1

b. HALLAR LA MEDIA, MODA Y MEDIANA

MEDIA MEDIANA MODA

Xi
Me = ∑ Me = N/2 DATO QUE MAS SE
n

4025
∑ Me = 64/2 REPITE 63
64

Me = 62,89 Me = 32

c. HALLAR EL PRIMER Y TERCER CUANTIL

1∗64
=16 POSICION
4

F i -1 = 10 Li = 58

Fi = 23 A= 62 – 58 A=4

k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
Q 1=¿¿ 58+ 4 ( 16−10
23−10 )

Q
1=58+4 ( 136 )
Q 1=58+4∗0,461

Q 1=58+1,84

Q 1=59,8

Tercer cuartil

64
3* =48 POSICION
4

Fi -1 = 44 Li = 66

Fi = 57 A = 70 -66 A=4

k .n
Qk =Li + A
4
−f i−1
f i −f i−1 ( )
48−44
Q 3= 66+ 4 ( 57−44 )
Q 3=66 +4 ( 134 )
Q 3=66 +4∗0,30

Q 3=66 +1,2

Q 3=67,2

d. HALLAR EL CUARTO DECIL

64
4* =25,6 POSICION
10
Fi – 1 = 44 Li = 66

Fi = 57 A=4

k .n
Dk = Li + A (
10
−f i−1
f i −f i −1 )
D 4 =66+ 4 ( 25,6−44
57−44 )

D 4 =66+ 4 ( 18,4
13 )

D4 =66+ 4∗1,41

D4 =66+5,64

D4 =71,64

e. HALLAR EL 70 PERCENTIL

64
70* = 44 POSICION
100

P10=LS

P10=¿66

f. GRAFICA DE RESULTADOS EN EXCEL


3. Los siguientes datos representan la razón de precio-ganancia de un producto

determinado en una empresa.

3.46 8.90 8.64 3.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60

7.64 8.82 5.64 10.08 2.81 6.81 7.49 4.56 7.16 9.61 3.86 6.78 9.02 8.65 6.72 6.26 7.90 6.65 7.25

6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.77 6.25 7.63 6.73 7.60 8.14 6.93

7.82 6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 8.10 4.01 6.00 7.98

10.00

a. REALICE LA TABLA DE FRECUENCIA

Primero hallamos el rango

R=X max −X Min

R=10,34−2,81

R=7,53

Hallamos los intervalos con la regla de Sturges

K=1+ 3,322. log n

K=1+ 3,322log 76
K=7,25≃ 7

K=7

Hallamos la amplitud

R
A=
K

7,53
A=
7

A=1,07

Hallamos la marca de clase

Li + L s
x i=
2

2,81+ 3,91
x i= =3,36
2

3,91+ 5,01
x i= =4.46
2

5,01+ 6,11
x i= =5,56
2

6,11+7,21
x i= =6,66
2

7,21+ 8,31
x i= =7,76
2

8,31+9,41
x i= =8.86
2

9,41+10,51
x i= =9.96
2

Clase
xi f fr F
Li Ls
2,81 3,91 3,36 4 0,05 4
3,91 5,01 4,46 2 0,03 6
5,01 6,11 5,56 7 0,09 13
6,11 7,21 6,66 22 0,29 35
7,21 8,31 7,76 24 0,32 59
8,31 9,41 8,86 12 0,16 71
9,41 10,51 9,96 5 0,07 76
∑ 76 1  

b. HALLE LA MEDIANA Y MODA


Clase
xi f fr F xi . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44
3,91 5,01 4,46 2 0,03 6 8,92
5,01 6,11 5,56 7 0,09 13 38,92
6,11 7,21 6,66 22 0,29 35 146,52
7,21 8,31 7,76 24 0,32 59 186,24
8,31 9,41 8,86 12 0,16 71 106,32
9,41 10,51 9,96 5 0,07 76 49,8
∑ 76 1   550,16
Hallamos la media

x́=
∑ x1 . f
n

550,16
x́=
76

x́=7 , 24

Media x́=7 , 24 razón de precio-ganancia

Hallamos la moda

f i−f i−1
M o=Li + . Ai
( f i−f i−1 ) + ( f i−f i +1)

Buscamos el número mayor de la frecuencia M o=24


Clase
xi f fr F xi . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44
3,91 5,01 4,46 2 0,03 6 8,92
5,01 6,11 5,56 7 0,09 13 38,92
6,11 7,21 6,66 22 0,29 35 146,52
7,21 8,31 7,76 24 0,32 59 186,24
8,31 9,41 8,86 12 0,16 71 106,32
9,41 10,51 9,96 5 0,07 76 49,8
∑ 76 1   550,16

24−22
M o=7,21+ . 1,1
( 24−22 ) + ( 24−12 )

2
M o=7,21+ . 1,1
2+12

2
M o=7,21+ . 1,1
2+12

2
M o=7,21+ .1,1
14

M o=7,21+(0,14 . 1,1)

M o=7,21+0.15

M o=7,36

Moda M o=7,36 razón de precio-ganancia

c. HALLE EL PRIMER CUARTIL

Hallamos la posición del cuartil

k .n
Posición
4

k .n 1 .76 76
p= ⟹ p= ⟹ p= ⟹ p=19
4 4 4
k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=13

f 1=35

Li=6,11

A=Ls−Li=7,21−6,11=1,1

Q 1=6,11+ 1,1 ( 19−13


35−13 )

Q 1=6,11+ 1,1 ( 226 )


Q1=6,11+(1,1 . 0,27)

Q 1=6,11+ 0,3

Q1=6,41

d. HALLE EL SEGUNDO CUARTIL

Hallamos la posición del cuartil

k .n
Posición
4

k .n 2 .76 152
p= ⟹ p= ⟹ p= ⟹ p=38
4 4 4

k .n
Qk =Li + A (4
−f i−1
f i −f i−1 )
f i−1=35

f 1=59
Li=7,21

A=Ls−Li=8,31−7,21=1,1

Q 2=7,21+1,1 ( 38−35
59−35 )

Q 2=7,21+1,1 ( 243 )
Q 2=7,21+(1,1. 0,125)

Q 2=7,21+0,1375

Q 2=7,35

e. HALLE EL COEFICIENTE DE VARIACIÓN

Hallamos la varianza para la muestra

2 ∑ ( x−x́ )2 . f
S=
n−1

x́=
∑ x1 . f
n

550,16
x́=
76

x́=7 , 24

Clase
xi f fr F xi . f ( x− x́ )2 ( x− x́ )2 . f
Li Ls
2,81 3,91 3,36 4 0,05 4 13,44 15,05 60,22
3,91 5,01 4,46 2 0,03 6 8,92 7,73 15,46
5,01 6,11 5,56 7 0,09 13 38,92 2,82 19,76
146,5
6,11 7,21 6,66 22 35
0,29 2 0,34 7,40
186,2
7,21 8,31 7,76 24 59
0,32 4 0,27 6,49
106,3
8,31 9,41 8,86 12 71
0,16 2 2,62 31,49
9,41 10,51 9,96 5 0,07 76 49,8 7,40 36,99
550,1
∑ 76 1   6   177,81
2
S2=
∑ ( x−x́ ) . f
n−1

177,81
S2 =
76−1

177,81
S2 =
75

S2=2,37

Hallamos la desviación estándar

S= √ S2

S= √2.37 ⟹ S=1,54

Hallamos coeficiente de variación

s
C v = .100

1,54
C v= . 100
7,24

C v =0,2127 . 100

C v =21,27 %

El coeficiente de variación nos indica que los datos son homogéneos

f. COMPARE LOS VALORES DADOS ANTERIORMENTE EN UN

SOFTWARE (GEOGEBRA, EXCEL, R, RSTUDIO)


4. Una compañía asigna diferentes precios a un equipo de sonido particular en

ocho regiones diferentes del país.

 Tabla

Numero de ventas y precios


Ventas 402 381 350 430 441 380 405 420 421

Precio 45 66 70 90 75 45 65 70 65

Nota: La tabla adjunta muestra el número de unidades vendidas y los precios

correspondientes (en miles de pesos).

a) ESTIMAR LA ECUACIÓN DE REGRESIÓN LINEAL DE LAS VENTAS

SOBRE EL PRECIO QUE MEJOR SE AJUSTE.

Se denomina regresión lineal cuando la función es lineal, es decir, requiere la

determinación de dos parámetros: la pendiente y la ordenada en el origen de la recta de

regresión.[CITATION Reg \p 1 \l 9226 ]

Fórmula

  y=ax+ b

Tabla 2

Datos en ventas y precios de la compañía

Y X X*Y X2
402 45 18.090 2025
381 66 25.146 4356
350 70 24.500 4900
430 90 38.700 8100
441 75 33.075 5625
380 45 17.100 2025
405 65 26.325 4225
420 70 29.400 4900
421 65 27.365 4225
SUMATORIA 3.630 591 239.701 40.381
N: 9
Nota: Para completar la información se obtienen los siguientes valores ( x∗y ), ( x 2 ¿ y la

sumatoria.

 Para encontrar el valor de a y b de la fórmula y=ax+ b se utilizan las siguientes

fórmulas:

n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )

b=¿ ¿

Por lo que

n ∑ xi y i−∑ x i ∑ y i
a= 2
n ∑ x 2i −( ∑ x i )

9(239.701)−(591)(3,630)
a=
9 ( 40381 )−(591)2

2.157.309−2.145 .330
a=
363.429−349.281

11.979
a=
14.148

a=0.846692112

b=¿ ¿

(3.630)(40.381)−(591)(239.701)
b=
9 ( 40.381 )−( 591)2

146.583 .030−141.663.291
b=
363.429−349,281
4.919 .739
b=
14.148

b=347.73

Ecuación lineal que se aproxima a la relación precio-ventas:

y=ax+ b

y=0.846692112 x +347.73

b) DETERMINAR LAS VENTAS SI EL PRECIO ES DE 55, 58, 68, Y 70

MILES DE PESOS.

X =55

y=0.846692112(55)+ 347.73

y=394.2980662

X =58

y=0.846692112(58)+ 347.73

y=396.8381425

X =68

y=0.846692112(68)+347.73

y=405.3050636

X =70

y=0.846692112(70)+ 347.73

y=406.9984478

c) DETERMINAR R Y DAR UNA INTERPRETACIÓN


Tabla 3: Valores de y elevados al cuadrado

Y2
161.604
145.161
122.500
184.900
194.481
144.400
164.025
176.400
177.241
1.470.712

Nota: Se elevan los valores de Y para encontrar R

R=n ¿ ¿

9 ( 239.701 )−(591)( 3630)


R=
√ 9 ( 40.381 ) −(591)2 √ 9(1.470 .712)−(3.630)2
11.979
R=
(−228.138)(−8.764 .764)

11.979
R=
1.999575729

R=0.00000599077

d) COMPARE LOS VALORES DADOS ANTERIORMENTE EN UN SOFTWARE

(GEOGEBRA, EXCEL, R, RSTUDIO)

Figura 1

Valores anteriores en Excel


Nota: Se grafica en Excel los calores dados para corroborar la información.

5. Los datos de la siguiente tabla representan las alturas (X) cm. y los pesos (Y)

kg. de varios hombres.

a. ESTIMAR LA ECUACIÓN QUE MEJOR SE AJUSTE DE MODO QUE EL

PESO DEPENDA DE LA ALTURA.

Organizando los datos en una gráfica nos muestra que los puntos se ubican cerca de una

recta lo cual tenemos correlación lineal


90
80
70
60
50
40
30
20
10
0
120 130 140 150 160 170 180 190 200

Fórmula y=ax+ b 

Datos para desarrollar ecuación

ALTURA PES X*Y X2 Y2

X O

Y
126 53,5 6741 15876 2862,25
152 51,5 7828 23104 2652,25
155 56,5 8757,5 24025 3192,25
172 62,5 10750 29584 3906,25
185 40 7400 34225 1600
185 53,5 9897,5 34225 2862,25
187 82 15334 34969 6724
196 58 11368 38416 3364
SUMATORI

A 1358 457,5 78076 234424 209306,25


N=8

Para encontrar el valor de a y b de la fórmula y=ax+ b se utilizan las siguientes

fórmulas:

n ∑ xi y i − ∑ x i ∑ y i
a= 2
b=¿ ¿
n ∑ x 2i −( ∑ x i )
n ∑ xi y i−∑ x i ∑ y i 8(78076)−(1358)(457.5) 624608−621285 3323
a= 2 a= 2 a= a=
2
n ∑ x −( ∑ x i )
i
8 ( 234424 )−(1358) 1875392−1844164 31228

(457.5)(234424)−(1358)(78076) 107248980−106027208 1221772


a=0.1064b=¿ ¿b= 2 b= b=
8 ( 234424 )−(1358) 1875392−1844164 31228

b=39.124

Ecuación lineal:

y=ax+ b

y=0.1064 x+39.124

b. DETERMINAR EL PESO SI LA ALTURA ES DE 150, 153 Y 175 CM

x=150 y=0.1064∗150+ 39.124 y=15.96+ 39.124 y=55.084

x=153 y=0.1064∗153+ 39.124 y=16.2792+39.124 y=55.4032

x=175 y=0.1064∗175+ 39.124 y=18.62+39.124 y=57.744

c. DETERMINAR R Y DAR UNA INTERPRETACIÓN


8 ( 78076 )−(1358)(457.5)
R=n ¿ ¿ R=
√ 8 ( 234424 ) −(1358)2 √8 (209306.25)−( 457.5)2

624608−621285 3323
R= R=
√ 1875392−1844164 √ 1674450−209306.25 √ 30628 √ 1465143.75

3323 3323
R= R= R=0.5404
175.008∗1210.431 211835.108
REFERENCIA BIBLIOGRAFICA

Espejo, I., Fernández, F., López, M., Muñoz, M., Rodríguez, A., Sánchez, A., & Valero, C.

(2011). Estadística Descriptiva y Probabilidad: (Teoría y problemas). Cádiz : Universidad

de Cádiz, 2009. Recuperado de https://bibliotecavirtual.unad.edu.co/login?

url=http://search.ebscohost.com/login.aspx?

direct=true&db=edsbas&AN=edsbas.D638568B&lang=es&site=eds-live&scope=site

ey Graña, C., & Ramil Díaz, M. (2007). Introducción a la estadística descriptiva. Netbiblo.

Recuperado de https://bibliotecavirtual.unad.edu.co/login?

url=http://search.ebscohost.com/login.aspx?

direct=true&db=edsbas&AN=edsbas.94806AF0&lang=es&site=eds-live&scope=site

Leal-Cornejo, F., López-García, R. E., Martínez-Montiel, M. G., Tapia-Castillo, D. I., & León-

Vázquez, I. I. de. (2019). Regression and Linear Correlation Analysis ; Análisis de

Regresión y Correlación Lineal. https://doi-

org.bibliotecavirtual.unad.edu.co/10.29057/xikua.v7i13.3558

Gracia Cano, A., & González Herrera, A. (2018). Cálculo e interpretación del coeficiente de

correlación lineal. Recuperado de https://bibliotecavirtual.unad.edu.co/login?

url=http://search.ebscohost.com/login.aspx?

direct=true&db=edsbas&AN=edsbas.96DDFB2C&lang=es&site=eds-live&scope=site

Universidad Autónoma de Aguadulces (2015) México. Apuntes Definiciones Estadística

Descriptiva. MATEMÁTICAS IV. Estadística y Principios de Probabilidad. Recuperado

de https://www.uaa.mx/centros/cem/dmf/wp-
content/uploads/2015/apuntes/4.%20Estadistica%20y%20Principios%20de

%20Probabilidad/Apuntes%20Estadistica.pdf

González R., María Camila (2020). Implementación de la herramienta RStudio en estadística

[Archivo de video]. Recuperado de https://repository.unad.edu.co/handle/10596/30914

1.1. Historia—ESTADÍSTICA. (s. f.). Recuperado 19 de noviembre de 2020, de

https://sites.google.com/site/iniciacionestadistica/introduccion/1-1-historia

La estadística—Monografias.com. (s. f.). Recuperado 19 de noviembre de 2020, de

https://www.monografias.com/trabajos84/definicion-estadistica/definicion-

estadistica.shtml

También podría gustarte