Está en la página 1de 11

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

Año: 2020 Periodo: I PAO


Materia: Estadística I

Práctica: Medidas de tendencia central y dispersió n


Fecha: Duración 60
: minutos
Práctica y Tarea 1. Medidas de tendencia central y
dispersión
Introducción
Para la presente prá ctica utilizaremos los datos de 20 observaciones de la cantidad de
plantas nacidos por metro cuadrado(m2) y los tratamientos aplicados a las mismas.
Los datos inicialmente será n organizados en vectores y luego en un Dataframe.
Tema 1. Organización de datos
Dados los siguientes datos de cantidad de plantas y tratamientos, organícelas en
vectores y luego conforme un Dataframe:
Cantidad Plantes:15,16,18,18,12,12,25,10,15,22,14,14,16,4,8,5,7,3,9,12
Tratamientos: “s”,“s”,“s”,“s”,“s”,“s”,“s”,“s”,“s”,“s”,“n”,“n”,“n”,“n”,“n”,“n”,“n”,“n”,“n”,“n”
Comandos:

vector=c(elementos…) #instrucción para crear un vector de datos (colección de


elementos del mismo tipo)
tabla=data.frame(variables o atributos…) #instrucción para crear un “Dataframe”

Solución:
plantas = c(15,16,18,18,12,12,25,10,15,22,14,14,16,4,8,5,7,3,9,12)
tratamiento =
c("s","s","s","s","s","s","s","s","s","s","n","n","n","n","n","n","n","n"
,"n","n")
Datos = data.frame(tratamiento, plantas)
head(Datos,5) #5 primeros registros

## tratamiento plantas
## 1 s 15
## 2 s 16
## 3 s 18
## 4 s 18
## 5 s 12

tail(Datos,5) #5 últimos registros


## tratamiento plantas
## 16 n 5
## 17 n 7
## 18 n 3
## 19 n 9
## 20 n 12

Tema 2. Media aritmética y mediana.


Considerando los datos del tema anterior, calcule la media y mediana del nú mero de
plantas por metro cuadrado.
Comandos:

mean(observaciones) #media aritmética


median(observaciones) #mediana
x%%2 #operador matemático de residuo
x%/%2 #operador matemático de división entera
ifelse(prueba, caso verdad, caso falso) #instrucción selectiva if, según el valor lógico de
la prueba, entonces asigna una respuesta.

Solución:
#media
Xm=mean(Datos$plantas)
print(Xm)

## [1] 12.75

#otra forma de calcular la media


n=length(Datos$plantas) #cantidad de observaciones
s=sum(Datos$plantas) #suma de valores
p=s/n #promedio o media aritmética

#mediana
Xmed=median(Datos$plantas)
print(Xmed)

## [1] 13

#otra forma de calcular la mediana


obs=sort(Datos$plantas) #ordenar los datos "sort" y asignarlo en un
vector de nombre obs
n=length(obs)
ifelse(n%%2==0,(obs[n%/%2]+obs[n%/%2 + 1])*0.5,obs[n%/%2 + 1])

## [1] 13

Tema 3. Media cortada y media ponderada.


Considerando los datos del tema anterior: a) calcule la media cortada al 90% de la
cantidad plantas por metro cuadrado, el decir simplificació n del 10% de las
observaciones, 5% en cada extremo.
Comandos:

mean(obs, trim=p) #media truncada p, donde p representa la proporción de datos que se


simplifica en cada extremo. Recuerde que los datos previamente se ordenan.

Solución:
Xc=mean(Datos$plantas, trim=0.05)
print(Xc)

## [1] 12.61111

#otra forma de media truncada


obs=sort(Datos$plantas)
sumaT=sum(obs[2:19]) #suma truncada de 18 observaciones, descartando 1
en cada extremo
Xc2=sumaT/18
print(Xc2)

## [1] 12.61111

b) Si se tiene que todos los tratamientos “s” tienen una ponderació n de 0.06 y los
tratamientos “n” con una ponderació n de 0.04, calcule la media ponderada de la
cantidad de plantas.
Solución:
pond=c(rep(0.06,10),rep(0.04,10))
pond

## [1] 0.06 0.06 0.06 0.06 0.06 0.06 0.06 0.06 0.06 0.06 0.04 0.04 0.04
0.04 0.04
## [16] 0.04 0.04 0.04 0.04 0.04

#Mp=W1X1+W2X2+....+WnXn
Mp=sum(pond*Datos$plantas)
Mp

## [1] 13.46

Tema 4. Moda en un conjunto de datos.


Considerando los datos de la cantidad de plantas por m2 y tratamientos, determine la
moda de cada variable.
Comandos:

library(modeest) #libreria
res=mlv(observaciones, method = “mfv”) #función mlv para determinar la observación
con mayor frecuencia, en caso de ser datos numéricos el method debe ser “mfv”, caso
contrario no se requiere method
conteo=table(observaciones) #contar la ocurrencia de cada observación conteo
v_logico=conteo==max(conteo) #comparación entre la cada frecuencia con la max
frecuencia presentada
conteo[v_logico] #primer resultado es la observación y segundo es la frecuencia

Solución:
conteo=table(Datos$plantas) #contar la ocurrencia de cada observación
conteo

##
## 3 4 5 7 8 9 10 12 14 15 16 18 22 25
## 1 1 1 1 1 1 1 3 2 2 2 2 1 1

v_logico=conteo==max(conteo) #comparación entre la cada frecuencia con


la max frecuencia presentada
conteo[v_logico] #primer resultado es la observación y segundo es la
frecuencia

## 12
## 3

#otra forma
#install.packages("modeest")
library(modeest)

## Warning: package 'modeest' was built under R version 3.6.3

res=mlv(Datos$plantas, method = "mfv")


res

## [1] 12

#Para los tratamientos

conteo=table(Datos$tratamiento) #contar la ocurrencia de cada


observación
conteo

##
## n s
## 10 10

v_logico=conteo==max(conteo) #comparación entre la cada frecuencia con


la max frecuencia presentada
conteo[v_logico] #primer resultado es la observación y segundo es la
frecuencia
##
## n s
## 10 10

#otra forma
mlv(Datos$tratamiento)

## [1] n s
## Levels: n s

Tema 5. Varianza y desviación estándar.


Considerando los datos de la cantidad de plantas por m2, determine la varianza y
desviació n está ndar.
Comandos:

var(observaciones) #función para calcular la varianza


sd(observaciones) #función para calcular la desviación estándar

Solución:
var(Datos$plantas)

## [1] 33.46053

sd(Datos$plantas)

## [1] 5.784507

Tema 6. Estandarización de una muestra.


Dada la muestra de cantidad de plantas por m2, calcule su media y desviació n
está ndar, luego estandarice obteniendo una variable Yi=(Xi-Xmedia)/s
Solución:
X=Datos$plantas
X

## [1] 15 16 18 18 12 12 25 10 15 22 14 14 16 4 8 5 7 3 9 12

Xmedia=mean(X)
Xmedia

## [1] 12.75

s=sd(X)
s

## [1] 5.784507

Y=(X-Xmedia)/s
Y
## [1] 0.3889700 0.5618456 0.9075967 0.9075967 -0.1296567 -0.1296567
## [7] 2.1177257 -0.4754078 0.3889700 1.5990990 0.2160945 0.2160945
## [13] 0.5618456 -1.5126612 -0.8211589 -1.3397856 -0.9940345 -1.6855368
## [19] -0.6482834 -0.1296567

round(mean(Y),3)

## [1] 0

var(Y)

## [1] 1

Tema 7. Medidas de resumen


Se dispone de las calificaciones en los exá menes de Matemá tica, Física y Química de un
grupo de 10 estudiantes de un curso de nivelació n. Las calificaciones se encuentran
sobre 10 puntos.
  Est1 Est2 Est3 Est4 Est5 Est6 Est7 Est8 Est9 Est10
Matemátic
3 5 6 4 5 7 2 8 3 9
a
Física 5 4 1 2 6 7 6 8 5 6
Química 3 5 6 7 6 5 6 8 7 8

a)Organice los datos en una matriz denominada Notas, en donde las columnas sean las
materias y las filas los estudiantes.
Mat=c(3,5,6,4,5,7,2,8,3,9)
Fis=c(5,4,1,2,6,7,6,8,5,6)
Qui=c(3,5,6,7,6,5,6,8,7,8)

Notas=matrix(c(Mat,Fis,Qui),ncol=3, nrow = 10)


Notas

## [,1] [,2] [,3]


## [1,] 3 5 3
## [2,] 5 4 5
## [3,] 6 1 6
## [4,] 4 2 7
## [5,] 5 6 6
## [6,] 7 7 5
## [7,] 2 6 6
## [8,] 8 8 8
## [9,] 3 5 7
## [10,] 9 6 8

colnames(Notas)=c("Mat","Fis","Qui")
rownames(Notas)=c("est1","est2","est3","est4","est5","est6","est7","est8"
,"est9","est10")
Notas

## Mat Fis Qui


## est1 3 5 3
## est2 5 4 5
## est3 6 1 6
## est4 4 2 7
## est5 5 6 6
## est6 7 7 5
## est7 2 6 6
## est8 8 8 8
## est9 3 5 7
## est10 9 6 8

b) Determine la media y desviació n está ndar por cada materia


mean(Notas[,"Mat"])

## [1] 5.2

mean(Notas[,"Fis"])

## [1] 5

mean(Notas[,"Qui"])

## [1] 6.1

#vector de medias
v_medias=colMeans(Notas)
v_medias

## Mat Fis Qui


## 5.2 5.0 6.1

Mat_sd=sd(Notas[,"Mat"])
Fis_sd=sd(Notas[,"Fis"])
Qui_sd=sd(Notas[,"Qui"])
#vector de desviaciones
v_sd=c(Mat_sd,Fis_sd,Qui_sd)
v_sd

## [1] 2.299758 2.160247 1.523884

c) Calcule el coeficiente de variació n por materia


cv=(v_sd/v_medias)*100
cv

## Mat Fis Qui


## 44.22612 43.20494 24.98170
d) Determine el promedio de medias de notas (X_gmedias), la desviació n está ndar
de todos los datos (s), y los valores X_gmedias+2s/sqrt(n) y
X_gmedias-2s/sqrt(n)
X_gmedias=mean(v_medias)
s=sd(Notas)
lsup=X_gmedias+2*(s/sqrt(n))
linf=X_gmedias-2*(s/sqrt(n))

e) Construya un grá fico en el plano R2 en el que, el eje horizontal represente a los


estudiantes. Sobre el eje vertical señ ale con tres líneas los puntos lsup, linf y
X_gmedias, y luego grafique los puntos de las calificaciones de cada estudiante
obtuvo en las diferentes materias.
Comandos:

rep(x,n) #repite el elemento “x”, n veces.


plot(x,y) #plotea los puntos (x,y)
ylim=c(min,max) #limita la escala de valores del eje y, lo mismo se puede hacer con el eje
x, en ese caso xlim=c(min,max)
abline(h=valor) #traza una línea horizontal a nivel del valor indicado
abline(v=valor) #traza una línea vertical a nivel del valor indicado

Solución:
e=c(rep(1:10,3)) #vector de estudiantes triplicado
calif=c(Notas[,"Mat"],Notas[,"Fis"],Notas[,"Qui"]) #vector de
calificaciones en orden
plot(e, calif, main="Resultados de calificaciones", xlab = "Estudiantes",
ylab = "Notas", ylim = c(0,10))
abline(h=lsup, col="blue")
abline(h=linf, col="blue")
abline(h=X_gmedias, col="red")
SECCIÓN DE TAREA
Pegue los códigos usados para generar cada una de las respuestas y los gráficos en
cada respectivo ítem al igual que en los ejercicios guía anteriores. Las interpretaciones
son igual o má s importantes que los resultados. Use lenguaje no técnico de tal forma
que cualquier persona, sin conocimiento de Estadística, pueda entender lo expuesto.

Una vez que realice su tarea, pegue su link de RStudio Cloud aquí:

Tema 8. Ejercicios de conformación de palabras


Se pidió a un grupo de 36 sujetos distribuidos aleatoriamente en dos grupos de 18
personas, que en 2 minutos armaran la mayor cantidad de palabras posibles a partir
de un conjunto desordenado de letras. Se usó la cantidad de palabras correctas
armadas como indicador de la habilidad de cada sujeto. Los resultados fueron:
Grupo1: 6, 2, 4, 4, 7,3, 6, 7, 7, 5, 6, 5, 6, 5, 6, 1, 7, 3
Grupo2: 3, 9, 7, 4, 5, 6, 3, 4, 5, 6, 7, 4, 4, 4, 3, 8, 3, 5
Realice lo siguiente en Rstudio:
a) Determine para cada grupo la media, mediana, moda, varianza y desviació n
está ndar.
b) Determine el coeficiente de variació n para cada grupo. En cuá l grupo los
integrantes son má s parecidos en cuanto a la cantidad de palabras.
c) ¿A qué grupo pertenece el sujeto má s há bil? ¿A cuá l el menos há bil?
d) ¿Qué tipo de simetría o asimetría se presentan en cada grupo?

Tema 9. Ejercicio de tiempo de reacción en un chiste


El tiempo que transcurre entre la finalizació n de la presentació n de un chiste y el
momento en que una persona comienza a reírse se denomina tiempo de reacció n. En
este contexto, la presentació n de un chiste es un estímulo y la aparició n de la risa, la
reacció n. Se hizo una experiencia, con un denominada grupo 2, en el que se midió el
tiempo de reacció n de sus integrantes ante un chiste y se registraron los siguientes
datos en décimas de segundos (ds): 29, 34, 26, 31, 38, 35, 36, 32, 34, 33, 30
En una experiencia previa con un grupo 1, se tuvo, para este chiste, un tiempo de
reacció n medio 29,182 ds, una varianza 11,96 ds2 y una mediana 29 ds.
Conteste las siguientes preguntas:
a) Determine los valores de media, mediana, desviació n está ndar y varianza para
el segundo grupo de estudio.
b) ¿Cuá l de los grupos reacció n má s rá pido ante el estímulo?
c) ¿Cuá l de los grupos es má s homogéneo respecto de la característica estudiada?

Tema 10. A fin de controlar “en línea” la calidad de un producto, se monitorea un


proceso productivo cada hora, durante veinte horas, tomando una muestra de tamañ o
5 de la característica que define la calidad, obteniéndose de esta manera las siguientes
veinte muestras:
Número de la
X1 X2 X3 X4 X5
muestra
1 14 11 19 17 8
2 15 20 8 14 12
3 15 14 19 19 20
4 11 19 22 13 11
5 13 9 16 16 13
6 6 10 18 21 9
7 11 17 17 19 15
8 11 15 12 24 6
9 8 17 8 22 16
10 14 16 16 22 11
11 12 19 17 18 19
12 3 9 13 12 14
13 12 15 12 17 26
14 14 20 20 12 20
15 15 14 17 24 18
16 14 10 14 16 11
17 17 21 16 20 19
18 16 13 11 10 16
19 11 18 14 20 17
20 17 17 8 9 13

Utilizando RStudio realice lo siguiente:


a) Organice los datos en una matriz de orden 20x5, en donde las columnas representan
las 5 características medidas.
b) Calcule la Media aritmética, mediana, media truncada (10%), moda, varianza y
desviació n típica de cada característica (Xi), esto es, por columna.
c) Calcule las medias   x i para i=1 , … , 20 , es decir las medias para cada una de las 20
filas.
d) Calcule la gran Media de Medias X́ , esto es el promedio de las 20 medias calculadas en
el ítem c.
e) Calcule la media de los cien valores, y verifique que coincide con la gran media de
medias en el ítem d).
s s
f) Determine los valores X́ + así como X́ − ; siendo s la desviació n típica de los
√n √n
cien datos. Use n=100.
g) Construya un grá fico en el plano R2 en el que, el eje horizontal represente el tiempo en
el que se tomaron las veinte muestras. Sobre el eje vertical señ ale las líneas
s s
horizontales en los puntos X́ + , X́ − y en centro de los dos previos, ubique X́ .
√n √n
Grafique los puntos (i , x i ) para los i=1,2,….20.

Fuente: G.Zurita, Probabilidad y Estadística, Fundamentos y Aplicaciones, Ejercicios


Propuestos Capítulo I (1.49)

También podría gustarte