Está en la página 1de 9

CUALITATIVAS

Table<- frecuencia

Prop.table<- frecuencia relativa

Fr*100 __ porcentaje

Barplot--- diagrama de barras

Pie---- diagrana de pastel

#Tablas con k número de intervalos

CUANTITATIVAS

Plot<- histograma type= ‘fh’ ---- frecuencia

Plot<- type= ‘rfh’ --- frecuencia relativa

Plot<- rfph porcentaje

Plot <- type=’fp’ ----- polígono

GENERAL

Color=

Xlab= para nombrar eje x

Ylab= para nombrar eje y

Main= nombre de grafica

Base<- cargar librería

Mean = media en ingles

Median = mediana

Range = rango

Var = varianza

Sd= desviación

Hist

Sort de mayor a menor

Tabla_LP<-fdt(Base$Petal.Length,k=7)

Tabla_LP

FILTRAR

Versicolor<-Datos[Datos$Species== ‘versicolor’,]
Nombre que yo le quiera poner <- Nombre de la base [Nombre de la base$variable==’lo que
quiero filtrar’,]

#1.Cuartiles

resumen = summary(Datos$Sepal.Width)

resumen

Q1= resumen[2]

Q2= resumen[3]

Q3= resumen[5]

Hallar IQR= Cuartil3-Cuartil 1=Q3-Q1

limites

LI= Q1-1.5*IQR – Limite inferior

LS = Q3+1.5*IQR – Limite superior

Resumen Q1[numero]

Datos_inf= Datos[Datos$variable<LI,]

boxplot(Datos$Sepal.Width, col = 'blue')

##Filtrar los datos atípicos

Datos_inf= Datos[Datos$Sepal.Width<LI,]

Datos_sup= Datos[Datos$variable>LS,]

#Distribucion de probabilidad variables aletatorias discretas

x1 = 0

x2= 1

x3= 2

p1=1/4

p2= 1/2

p3=1/4

media = x1*p1+x2*p2+x3*p3

varianza = (x1-media)^2*p1+(x2-media)^2*p2+(x3-media)^2*p3

desviacion= sqrt(varianza)
PROBABILIDAD

P(x=k)= Dbinom (numero de exitos, numero de intentos, probabilidad de éxito)

Maximo – P(x <= 2) = P(x=0)+ P (X=1)+ P (x=2)

= sum (dbinom(0:2,5,0.7))

Mas de tantos – P (x>2) = P(x=3)+ P(x=4)+ P(x=5)

= sum(dbinom (3:5, 5, 0.7))

A lo sumo – P (x<=3) = P(x=0)+ P (X=1)+ P (x=2)+ P(x=3)

= sum (dbinom (2:3, 5, 0.7)

dpois ( 1,1.5)

Geometrica

NORMAL

Qnorm

pnorm
qt – cuantil t student

pt --- probabilidad t student

qnorm---- normal mean 0 sd 1

pnorm--- normal

pnorm(6,mean=5.7,sd=1/sqrt(9),lower.tail = FALSE)
=0.1840601 ---- central

#Intervalo de confianza

#Para la media poblacional, n>=30

n = 500 #tamaño muestral

desviacion = 112 #desviacion

x_barra = 501 #media muestral

confianza = 0.99 #nivel de confianza

z = qnorm ((1-confianza)/2, mean=0, sd= 1, lower.tail= FALSE)

z #cuantil

L.I = x_barra-z*desviacion/(sqrt(n))

L.I

L.S = x_barra+z*desviacion/(sqrt(n))

L.S

#Intervalo de confianza para la media n<30

Datos <-c(9.8,10.2,10.4,9.8,10,10.2,9.6)

media=mean(Datos)

desviacion=sd(Datos)

n= length(Datos)

confianza=0.95

t=qt((1-confianza)/2,n-1,lower.tail = FALSE)

L.I= media-t*desviacion/(sqrt(n))

L.I

L.S= media+t*desviacion/(sqrt(n))
L.S

#intervalo de confianza para la proporcion

#p:petalos rojos

n=100 #muestra

x= 58 #exitos

p_gorro= x/n #proporcion muestral

q_gorro= 1 - p_gorro

confianza= 0.95 #nivel de confianza

z = qnorm((1-0.95)/2, mean= 0, sd= 1, lower.tail = FALSE)

L.I= p_gorro-z*sqrt((p_gorro*q_gorro)/n)

L.I

L.S= p_gorro+z*sqrt((p_gorro*q_gorro)/n)

L.S

#Intervalo de confianza t-student media con datos

Datos <-c(0.90,0.97,1.03,1.10,1.04,1.00)

media=mean(Datos)

desviacion=sd(Datos)

n= length(Datos)

confianza=0.95

t=qt((1-confianza)/2,n-1,lower.tail = FALSE)

L.I= media-t*desviacion/(sqrt(n))

L.I

L.S= media+t*desviacion/(sqrt(n))

L.S

#Intervalo de confianza normal media con datos

x_barra=mean(Datos)
desviacion=sd(Datos)
n= length(Datos)
confianza=0.95
z = qnorm ((1-confianza)/2, mean=0, sd= 1, lower.tail= FALSE)
z
L.I = x_barra-z*desviacion/(sqrt(n))
L.I
L.S = x_barra+z*desviacion/(sqrt(n))
L.S

#Caso 3: Varianza poblacional desconocida y n>=30

#miu: promedio de ingesta diaria de sodio de los estadounidenses

#Ho: miu = 3300 vs Ha: miu > 3300

#Prueba cola a derecha

#Datos

mu0= 3300 #miu_0


n= 100 #muestra

xbarra= 3400 #media muestral

s= 1100 #desviacion muestral

alpha= 0.05 #nivel de significancia

#Estadistico de prueba

z = (xbarra-mu0)/(s/sqrt(n))

#valor p

valorp= pnorm (z,mean = 0,sd=1, lower.tail = FALSE)

valorp si el valor p es menor que el valor de signifcancia (0.005 )rechazo a H0

alpha= 0.05

cuantil= qnorm(alpha, mean=0,sd=1,lower.tail = FALSE)

cuantil

#R.R: Revhazo H0 si z>cuantil

#Conclusion: no rechazo H0 porque z<cuantil, por lo tanto no hay suficiente

#evidencia para probar que los estadounidenses estan excediendo una ingesta

#promedio diaria de 330 mg.

#prueba de hipótesis media t_studen

#Caso 2

#miu= peso promedio de los diamantes

#Ho: miu = 0.5 vs Ha: miu > 0.5

#Prueba cola a derecha

#Datos

Datos<-c(0.46,0.61,0.52,0.48,0.57,0.54)

mu0=0.5 #miu_0

n= length(Datos) #muestra

xbarra= mean(Datos) #media muestral

s= sd(Datos) #desviacion muestral

alpha= 0.05 #nivel de significancia


#Estadistico de prueba

t = (xbarra-mu0)/(s/sqrt(n))

#valor p

valorp= pt (t,n-1, lower.tail = FALSE)

valorp

#si el valor p es menor que el valor de signifcancia (0.005 )rechazo a H0

alpha= 0.05

cuantil= qt(alpha, n-1 ,lower.tail = FALSE)

cuantil

#R.R: Revhazo H0 si t>cuantil

#Conclusion: no rechazo H0 porque t<cuantil, por lo tanto no hay suficiente

#evidencia para probar que el peso promedio de los diamantes es mayor a 0.5 quilates

t.test(Datos, alternative = "greater", mu= 0.5, conf.level = 0.95)

#Ejercicio 7

#miu: media maxima de capacidad de respiracion

#Ho: miu = 110 vs Ha: miu diferente a 110

#Prueba de dos colas

#Datos

Datos<-c(132,33,91,108,67,169,54,203,190,133,96,30,187,21,63,166,84,110,157,138)

mu0 = 110 #miu_0

n = length(Datos) #muestra

xbarra = mean(Datos) #media muestral

xbarra

s = sd(Datos) #desviacion muestral

alpha = 0.01 #nivel de significancia


#Estadistico de prueba

t = (xbarra-mu0)/(s/sqrt(n))

#valor p

valorp= 2*pt(t,n-1, lower.tail = FALSE)

valorp

#si el valor p=0.9002 es mayor que el valor de signifcancia (0.001 )

#no rechazo a H0

cuantil= qt(alpha/2, n-1 ,lower.tail = FALSE)

cuantil

#R.R:Rechaza H0 si t>cuantil o t<-cuantil

#t = 0.1271<cuantil = 2.8609, no rechazo

t.test(Datos, alternative = "two.sided", mu= 110, conf.level = 0.95)

#Conclusion: no rechazo H0 porque t>cuantil, por lo tanto no hay suficiente evidencia estadistica

#para rechazar la hipotesis nula, es decir se puede asumir un promedio igual a 110

También podría gustarte