Está en la página 1de 9

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

Año: 2020 Periodo: I PAO


Materia: Estadística I

Práctica: Estadística Descriptiva Multivariada

Fecha: Duración: 60
minutos

Práctica 4. Estadística Descriptiva Multivariada


Introducción
En la presente práctica se requerirá del uso del objeto matrix en Rstudio; previamente
conozcamos ciertos aspectos básicos sobre el manejo de matrices en el lenguaje R.
Instrucciones básicas:
 La función matrix() permite organizar los datos en una matriz con tantas filas
y columnas como se indique.
 x <- matrix (data= c(1,2,3,4), nrow=2, ncol=2) #Observemos que se ha
creado una matrix de 2x2 (2 filas y 2 columnas)
Si queremos que se rellene por filas hay que incluir el argumento byrow=T
en los argumentos de la función.
 Para añadir o modificar el nombre de filas y columnas de una matriz se hace
uso de las funciones colnames() y rownames().
 Obtener la dimensión de una matriz con dim(objeto).
 Dos funciones muy útiles, se utilizan muchísimo, cuando se trabaja con
matrices (o vectores o dataframes) son rbind y cbind. La función rbind
permite añadir filas, la función cbind permite añadir columnas.
 Operadores básicos entre elementos: Las operaciones algebraicas (+, -, , /, ^,
log(), sqrt(), ..) aplicadas a matrices se realizan componente a componente,
igual que para los vectores.
 Operadores básico entre matrices: Multiplicación matricial: "%%".
Transpuesta: t(x) Inversa: solve(x).

Para mayor información puede consultar:


https://www.uv.es/pjperez/curso_R/index.html
Tema 1.
A cinco estudiantes en “nivel superior” se les pregunta aplicando un cuestionario, su
edad en años, número de hermanos e ingreso promedio mensual de su hogar, en
dólares, respondiendo ellos de la siguiente manera:

a) Organice los datos en una Matriz de datos Y


#Vectores que constituyen la muestra:

X1=c(19,3,930)
X2=c(18,0,750)
X3=c(19, 4, 785)
X4=c(21, 1, 1230)
X5=c(20, 3, 955)
Y=matrix(c(X1,X2,X3,X4,X5),ncol=5,nrow=3, byrow = F)
class(Y)

## [1] "matrix"

## [,1] [,2] [,3] [,4] [,5]


## [1,] 19 18 19 21 20
## [2,] 3 0 4 1 3
## [3,] 930 750 785 1230 955

#segunda forma de crear la matriz de datos por unión de columnas


Y1=cbind(X1, X2, X3, X4, X5)
class(Y1)

## [1] "matrix"

Y1

## X1 X2 X3 X4 X5
## [1,] 19 18 19 21 20
## [2,] 3 0 4 1 3
## [3,] 930 750 785 1230 955

#tercera forma de crear la matriz de datos por ingreso de datos


Y2=matrix(scan(), ncol = 5) #recuerde que el ingreso es por columnas y f
inaliza con doble enter
Y2

## [,1] [,2] [,3] [,4] [,5]

#cuarta forma de crear la matriz de datos por lectura de un archivo.txt


Y3=read.table("datos_practica4_tema1.txt", header = T, sep="\t")
Y3=as.matrix(Y3)
class(Y3)

## [1] "matrix"

Y3

## Estudiante Edad Número.de.Hermanos Ingreso.Mensual


## [1,] 1 19 3 930
## [2,] 2 18 0 750
## [3,] 3 19 4 785
## [4,] 4 21 1 1230
## [5,] 5 20 3 955

b) Calcule el Vector de Medias Aritméticas.


#primera forma para obtener vector de medias operación matricial
U1=matrix(rep(1,5), ncol = 1)
U1

## [,1]
## [1,] 1
## [2,] 1
## [3,] 1
## [4,] 1
## [5,] 1

n=ncol(Y)
n

## [1] 5

V_medias1=((1/n)*Y)%*%U1
V_medias1

## [,1]
## [1,] 19.4
## [2,] 2.2
## [3,] 930.0

#segunda forma para calcular vector de medias


V_medias2=rowMeans(Y)
V_medias2

## [1] 19.4 2.2 930.0

c) Calcule la Matriz de Varianza y Covarianzas


#primera forma de calcular la matriz de varianza y covarianzas esquema ma
tricial
I=diag(5)
I

## [,1] [,2] [,3] [,4] [,5]


## [1,] 1 0 0 0 0
## [2,] 0 1 0 0 0
## [3,] 0 0 1 0 0
## [4,] 0 0 0 1 0
## [5,] 0 0 0 0 1

S=((1/(n-1))*Y)%*%( I-(1/n)*U1%*%t(U1) )%*%t(Y)


S

## [,1] [,2] [,3]


## [1,] 1.30 0.15 201.25
## [2,] 0.15 2.70 -51.25
## [3,] 201.25 -51.25 36012.50

#Segunda forma de calcular la matriz de varianza y covarianza

D=t(Y) #ordernar la matriz de tal forma que las columnas sean las variab
les
D

## [,1] [,2] [,3]


## [1,] 19 3 930
## [2,] 18 0 750
## [3,] 19 4 785
## [4,] 21 1 1230
## [5,] 20 3 955

S=var(D)
S

## [,1] [,2] [,3]


## [1,] 1.30 0.15 201.25
## [2,] 0.15 2.70 -51.25
## [3,] 201.25 -51.25 36012.50

d) Calcular el coeficiente de correlación


D=t(Y)
cor(D)

## [,1] [,2] [,3]


## [1,] 1.00000000 0.08006408 0.9301170
## [2,] 0.08006408 1.00000000 -0.1643559
## [3,] 0.93011699 -0.16435592 1.0000000

Tema 2.
En un anuncio de prensa se indica el número de detenidos liberados por caducidad de
la prisión preventiva, X1 entre octubre de 2007 y mayo de 2009. De igual manera se
da el número de reincidentes liberados, X2, por tipo de delitos. Los datos se presentan
a continuación:

a) Organice los datos en dos vectores de datos Solución:


X1=c(575,333,228,125,87,29,81,44,71,161)
X2=c(41,10,16,9,4,4,6,2,0,14)

b) Determine el total de personas liberadas en el período y calcule el máximo y el


mínimo de las dos variables presentadas.
Solución:
total=sum(X1)
min_lib=min(X1)
max_lib=max(X1)
min_rein=min(X2)
max_rein=max(X2)

c) Determine el promedio general y mensual, de liberados en el periodo.


Solución:
prom_g=mean(X1)
prom_m=total/20

d) Calcule la covarianza entre las variables y la correlación.


#Covarianza entre X1 y X2
n=length(X1)
X1m=mean(X1)
X2m=mean(X2)
S=(1/(n-1))*sum((X1-X1m)*(X2-X2m))
S

## [1] 1843.289
#covarianza forma directa por comando
cov(X1,X2)

## [1] 1843.289

#Correlación entre X1 y X2
rxy=sum((X1-X1m)*(X2-X2m))/sqrt( sum((X1-X1m)^2)*sum((X2-X2m)^2) )
rxy

## [1] 0.9222512

#correlación forma directa por comando


cor(X1,X2)

## [1] 0.9222512

Tema 3.
En este problema, la matriz de datos X en su primera columna presenta el “contenido
de SO2 en el aire” (en microgramos por m3) en 8 puntos de desarrollo industrial de un
país latinoamericano; la segunda columna es la “temperatura anual promedio” del lugar
(grados centígrados) y la tercera el “número de fábricas instaladas” en el área
consideradas:
A partir de estos datos, construya el Vector de medias de la muestra, la Matriz de
Varianza y Covarianza y la Matriz de Correlaciones de la muestra. Interprete resultados.
#Tema 3
x1= c(43,36,45,61,53,15,56,36)
x2= c(28,26,29,32,27,23,30,24)
x3= c(12,9,46,35,24,4,16,12)
a= matrix(c(x1,x2,x3), ncol = 3,nrow = 8,
byrow = F)
a
class(a)
#--------a---------#
#construya el Vector de medias de la
muestra
v_medias= rowMeans(a)
v_medias
#la Matriz de Varianza y Covarianza
mv= t(a)
mv
mcv= var(a)
mcv
#Matriz de Correlaciones de la muestra
ccr= t(a)
cor(ccr)

Tema 4.
Se entrevista a seis personas y se les pregunta, en ese orden, su edad en años X1, el
número de hijos que tiene X2, y el número de años de educación formal X3 que poseen.
Los resultados se los muestra en la siguiente matriz de datos.

Determine, utilizando matrices, la Media Aritmética de cada una de las variables


investigadas, así como la matriz de varianzas y convarianzas que corresponde a estos
datos. Interprete resultados.
#-------------TEMA 4-------------
#opcion a
x1=

c(23.6,41.3,33.2,28.5,21.6,36.7)
x2= c(0,2,2,1,0,3)
x3= c(15,10,14,17,15,17)
x1
x2
x3
m= matrix(c(x1,x2,x3),ncol = 3,nrow = 6,byrow = F)
m

#la Media Aritmética de cada una de las variables investigadas


mediam= colMeans(m)
mediam
#matriz de varianzas y convarianzas que corresponde a estos datos.
mv= var(m)
mv

También podría gustarte