Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una Introduccion A R
Una Introduccion A R
W. N. Venables, D. M. Smith y
el R Equipo de Núcleo
Este manual es para R, versión 3.6.1 (2019-07-05).
Copyright 1990 W. N. Venables
§
c 1992 W. N. Venables & D. M.
Copyright Smith 1997 R. Señor & R. Ihaka
§
c 1997, 1998 M. Maechler
Copyright 1999–2018 R Equipo de Núcleo
§
c
Copyright
§
c
Copyright
§
c
El permiso está concedido para hacer y distribuir verbatim las copias de este
manual proporcionaron el aviso de copyright y este aviso de permiso están
preservados encima todas las copias.
El permiso está concedido para copiar y distribuir modificó versiones de este
manual bajo las condiciones para verbatim copiando, proporcionados que el
enteros resultando el trabajo derivado está distribuido bajo los plazos de un
aviso de permiso idéntico a este un.
El permiso está concedido para copiar y distribuir traducciones de este
manual a un- otra lengua, bajo el por encima de condiciones para modificó
versiones, exceptúa que este aviso de permiso puede ser declarado en una
traducción aprobada por el R Equipo de Núcleo.
i
Mesa de Contenidos
Prefacio ................................................................................................. 1
13 Paquetes ............................................................................................77
13.1 Paquetes estándares ...................................................................................................... 77
13.2 Contribuyó paquetes y CRAN ....................................................................................... 77
13.3 Namespaces ............................................................................................................... 78
14 OS Instalaciones ........................................................................ 79
14.1 Archivos y directorios ............................................................................................. 79
14.2 Filepaths ............................................................................................................... 79
14.3 El sistema manda ...................................................................................................... 80
14.4 Compresión y Archivos ........................................................................................... 80
Prefacio
Este introduction a R es derived de un original puesto de las notas que describen el
S y S-Plus environments escrito en 1990–2 by Bill Venables y D unvid M. Smith cuando
en el University de Adelaide. We hUnve hizo un number de pequeño changes a r eflect
diferencias between el R y S programas, y expandió algunos de el material.
Gustaríamos extender tibios gracias a Bill Venables (y David Smith) para conceder
permiso para distribuir esta versión modificada de las notas de este modo, y para ser un
seguidor de R de manera atrás.
Los comentarios y las correcciones son siempre bienvenidos. Complacer correspondencia de email de la
dirección a
R-core@r-project.org.
Sugerencias al lector
La mayoría de R los novatos empezarán con la sesión introductoria en Apéndice Un.
Esto tendría que dar alguna familiaridad con el estilo de R sesiones y más importantly
alguna retroalimentación de instante en qué de hecho pasa.
Muchos usuarios vendrán a R principalmente para sus instalaciones gráficas. Ve Capítulo
12 [Gráfico], página 63, los cuales pueden ser leídos en casi cualquier tiempo y necesita no
esperar hasta que todo las secciones de preceder han sido digeridas.
2
1 Yontroduction y preliminaries.
1.3 R Y estadística.
Nuestra introducción al R el entorno no mencionó estadística, aún así mucho uso de personas R
como sistema de estadísticas. Preferimos pensar de él de un entorno dentro de qué muchos
clásico y las técnicas estadísticas modernas han sido implementadas. Unos cuantos de estos está
construido a la base R entorno, pero muchos están suministrados como paquetes. hay
aproximadamente 25 paquetes suministraron con R (llamados “paquetes” estándares “y”
recomendables) y muchos más son disponibles a través del CRAN familia de sitios de Internet (vía
https://cran.r-project.org) y en otro lugar. Más los detalles en paquetes están dados
más tarde (ve Capítulo 13 [Paquetes], página 77).
La mayoría de estadística clásica y mucho de la metodología más tardía es disponible para
uso con R, pero los usuarios pueden necesitar ser preparados para hacer un poco trabajo para
encontrarlo.
Capítulo 1: Introducción y 3
preliminaries
Hay una diferencia importante en filosofía entre S (y por ello R) y los otros sistemas
estadísticos principales. En S un análisis estadístico es normalmente hecho como series
de pasos, con los resultados intermedios que son almacenados en objetos. Así mientras
que SAS y SPSS dará copious producción de una regresión o discriminant análisis, R
dará producción mínima y almacenar los resultados en un objeto de acceso para
interrogatorio subsiguiente por más lejano R funciones.
Las órdenes están separadas cualesquiera por un semi-colon (‘;'), o por un newline. Las
órdenes elementales pueden be grouped juntos ina un compound expresión by tirantes (‘{' y
‘ }'). Los comentarios pueden ser puestos casi2 anywhere, empezando con un hashmark (‘#'),
todo hasta el final de la línea es un comentario .
Si una orden no es completar al final de una línea, R dará un diferente puntual, por default
+
Encima segundo y líneas subsiguientes y continuar leer la entrada hasta la orden es
syntactically completo. Esto incita puede ser cambiado por el usuario. Generalmente
omitiremos la continuación puntual e indicar continuación por sencillo indenting.
Líneas de orden introdujeron en la consola está limitada 3 a aproximadamente 4095 bytes (no
caracteres).
5
El punto “principal” en este nombre de archivo lo hace invisible en listados de archivo normal en UNIX, y
en default GUI listados de archivo en macOS y Windows..
7
Qué ambos dan NaN desde el resultado no puede ser definido sensibly.
En resumen, is.na(xx) es CIERTO ambos para NA y NaN valores. Para diferenciar estos,
Es.nan(xx) Es sólo CIERTO para NaNs.
Los valores desaparecidos son a veces imprimidos tan <NA> cuándo vectores de carácter
están imprimidos sin cita.
Imprimirá él en forma de marco de los datos, el cual es bastante como una matriz, mientras que
> unclass(Invierno)
Lo imprimirá cuando una lista normal. Sólo en situaciones bastante especiales necesitas
utilizar esta facilidad, pero uno es cuándo tú está aprendiendo para venir a plazos con la
idea de clase y funciones genéricas. Clases y funciones genéricas serán habladas más allá
en Sección 10.9 [orientación de Objeto],
Página 48, pero sólo brevemente.
16
5 Arrays Y matrices.
5.1 Unrrays
Una variedad puede ser considerada como multiplicar subscripted colección de entradas
de datos, por ejemplo numéricos. R Deja instalaciones sencillas para crear y manejando
variedades, y en particular el caso especial de matrices.
Un vector de dimensión es un vector de enteros no negativos. Si su longitud es k entonces
la variedad es k-dimensional, p. ej. una matriz es una 2 -variedad dimensional. Las
dimensiones son indexed de uno hasta los valores dados en el vector de dimensión.
Un vector puede ser utilizado por R como una variedad sólo si tiene un vector de dimensión como su
dim atributo.
Supone, por ejemplo, z es un vector de 1500 elementos. La asignación
> dim(z) <- c(3,5,100)
Lo da el dim atributo que lo deja para ser tratado como 3 por 5 por 100 variedad.
Otras funciones como matriciales() y variedad() es disponible para más sencillo y
más natural mirando asignaciones, cuando veremos en Sección 5.4 [La variedad() función],
página 20.
Los valores en el vector de dato dan los valores en la variedad en el mismo orden
cuando ocurrirían en FORTRAN, aquello es columna “ orden importante,” con el primer
subíndice que mueve más rápido y el último subíndice más lento.
× ×
Por ejemplo si el vector de dimensión para una variedad, decir un, es c(3,4,2) entonces hay 3 4
2 = 24 entradas en un y el vector de dato les aguanta en el orden un[1,1,1],
un[2,1,1], ..., un[2,4,2], un[3,4,2].
Las variedades pueden ser unidimensionales: tales variedades son normalmente tratadas
en la misma manera como vectores (incluyendo cuándo impresión), pero las excepciones
pueden causar confusión.
Aun así una manera directa más sencilla de producir esta matriz es para utilizar mesa():
> N <- Mesa(bloques, variedades)
Matrices de índice tienen que ser numéricas: cualquiera otra forma de matricial (p. ej.
un lógico o matriz de carácter) suministró como matricial está tratado como un vector de
indexación.
6.1 Lists
Un R la lista es un objeto constando de una colección ordenada de los objetos sabidos como sus
componentes.
hay no necesidad particular para los componentes para ser del mismo modo o tipo, y,
por ejemplo, una lista podría constar de un vector numérico, un valor lógico, una matriz,
un vector complejo, una variedad de carácter, una función, y tan encima. Aquí es un
ejemplo sencillo de cómo para hacer una lista:
> Lst <- Lista(nombre="Fred", mujer="Mary",
no.Niños=3, niño.Edades=c(4,7,9))
Los componentes son siempre numerados y siempre puede ser referido a como tal. Así si
Lst es el nombre de una lista con cuatro componentes, estos pueden ser individualmente
referidos a tan Lst[[1]], Lst[[2]], Lst[[3]] y Lst[[4]] . Si, más allá, Lst[[4]] es un
vector subscripted variedad entonces Lst[[4]][1] es su primera entrada.
Si Lst es una lista, entonces la longitud de función(Lst) da el número de (nivel
superior) componentes tiene.
Componentes de las listas también pueden ser nombradas, y en este caso el
componente puede ser referido a cualquiera por dar el nombre de componente como
cuerda de carácter en sitio del número en paréntesis cuadrados dobles, o, más
oportunamente, por dar una expresión de la forma
> Nombre$nombre_de componente
Para la misma cosa.
Esto es una convención muy útil cuando lo haga más fácil de conseguir el
componente correcto si olvidas el número.
Tan en el ejemplo sencillo dado encima:
Lst$El nombre es el mismo tan Lst[[1]] y es la cuerda
"Fred", Lst$la mujer es el mismo tan Lst[[2]] y es
la cuerda "Mary",
Lst$Niño.Edades[1] es el mismo tan Lst[[4]][1] y es el número 4.
Además, uno también puede utilizar los nombres de los componentes de lista en
paréntesis cuadrados dobles, i.e., Lst[["nombre"]] es el mismo tan Lst$nombre. Esto
es especialmente útil, cuándo el nombre de el componente para ser extraído está almacenado
en otro variable cuando en
> x <- "Nombre"; Lst[[x]]
Es v ery important a disting uish Lst[[1]] de Lst[1] . ‘[[...]]' Es el o perator usod
para seleccionar un solo element, mientras que ‘[...]' Es un general subscripting
operator. Thnos El anterior es el primer objeto en la lista Lst, y si es una lista nombrada
el nombre no es incluido. El último es un sublist de la lista Lst constando de la
primera entrada sólo. Si es una lista nombrada , los nombres están transferidos al
sublist.
Los nombres de componentes pueden ser abreviados abajo al número mínimo de letras
necesitó identificarles singularmente. Así Lst$los coeficientes pueden ser minimally
especificados como Lst$coe y Lst$covarianza como Lst$cov.
El vector de nombres es de hecho sencillamente un atributo de la lista como cualquier otro
y puede ser manejado como tal. Otras estructuras además las listas pueden, naturalmente, de
modo parecido ser dados unos nombres atribuyen también.
Capítulo 6: Listas y marcos de 27
dato
> Sujeta(cualquiera.Viejo.Lista)
Cualquier cosa aquello ha sido sujetado puede ser detached por detach, por número de
posición o, preferir- ably, por nombre.
2
Ve la ayuda on-line para autoload para el significado del segundo plazo.
30
8 ProbDistribuciones de capacidad
> Sujeta(fiel)
> Resumen(erupciones)
Min. 1.º Qu. Median Malo 3.º Qu. Max.
1.600 2.163 4.000 3.488 4.454 5.100
> fivenum(Erupciones)
[1] 1.6000 2.1585 4.0000 4.4585 5.1000
> Raíz(erupciones)
de el | 16 | 070355555588
18 | 000022233333335577777777888822335777888
20 | 00002223378800035778
22 | 0002335578023578
24 | 00228
26 | 23
28 | 080
30 | 7
32 | 2337
34 | 250077
36 | 0000823577
38 | 2333335582225577
40 | 0000003357788888002233555577778
42 | 03335555778800233333555577778
44 | 02222335557780000000023333357778888
46 | 0000233357700000023578
48 | 00000022335800333
50 | 0370
Una raíz-y-parcela de hoja es como un histograma, y R tiene una función hist a histogramas de
parcela.
> hist(Erupciones)
## Marca los cubos más pequeños, marca una parcela de densidad
> hist(Erupciones, seq(1.6, 5.2, 0.2), prob=CIERTOS)
> Líneas(densidad(erupciones, bw=0.1))
> Alfombra(erupciones) # muestra los puntos de dato reales
Densidad más elegante las parcelas pueden ser hechas por densidad, y añadimos una
línea producida por
Densidad en este ejemplo. El ancho de banda bw estuvo escogido por prueba-y-error como
el default da
Capítulo 8: distribuciones de 35
Probabilidad
Histograma de erupciones
0.7
0.6
0.5
Frecuencia relativa
0.4
0.3
0.2
0.1
0.0
Erupciones
Podemos parcela la función de distribución acumulable empírica por utilizar la función ecdf.
> Parcela(ecdf(erupciones), .Los puntos=FALSOS, verticals=CIERTOS)
Esta distribución es evidentemente lejos de cualquier distribución estándar. Qué sobre
el modo derecho, decir erupciones de más largos que 3 minutos? Dejado nos cabido una
distribución normal y overlay el cabido CDF.
> Mucho tiempo <- erupciones[erupciones > 3]
> Parcela(ecdf(largo), .Los puntos=FALSOS, verticals=CIERTOS)
> x <- seq(3, 5.4, 0.01)
> Líneas(x, pnorm(x, malos=malos(largos), sd=sqrt(var(largos))), lty=3)
ecdf(Largo)
1.0
0.8
0.6
Fn(x)
0.4
0.2
0.0
Quantile-quantile (Q-Q) Las parcelas nos pueden ayudar examinar esto más cuidadosamente.
par(pty="s") # Arregla para una región de
figura cuadrada qqnorm(largo); qqline(largo)
Capítulo 8: distribuciones de 36
Probabilidad
Cuál muestra una acceso razonable pero la cola correcta más a escasa que uno esperarían
de una distribución normal. Dejado nos comparar esto con algunos dato simulado de un t
distribución
4.0
3.5
3.0
−2 −1 0 1 2
Teórico Quantiles
x <- rt(250, df = 5)
qqnorm(x); qqline(x)
Cuál normalmente (si es una muestra aleatoria ) muestra colas más largas que esperados
para un normales. Podemos hacer un Q-Q parcela contra la distribución de generar por
qqplot(qt(ppoints(250), df = 5), x, xlab = "Q-Q parcela para t
dsn") qqline(x)
Finalmente, podríamos querer una prueba más formal de acuerdo con normalidad (o
no). R Proporciona el Shapiro-Wilk prueba
> shapiro.Prueba(largo)
Uno-muestra Kolmogorov-Smirnov
B <-
Escáner() 79.98 79.97 79.97 80.03 79.95 79.97
80.02 79.94
boxplot(Un, B)
Cuál indica que el primer grupo tiende para dar resultados más altos que el segundo.
79.98 80.0280.00 80.04
79.96
79.94
1 2
Para probar para la igualdad del medio de los dos ejemplos, podemos utilizar un unpaired t-prueba
por
> t.Prueba(Un, B)
dato de prueba: Un y B.
t = 3.2499, df = 12.027, p-valor = 0.00694
Hipótesis alternativa: diferencia cierta en los medios no es iguales a 0
95 confianza de porcentaje intervalo:
0.01385526 0.07018320
Estimaciones de muestra:
Malo de x malo
de y 80.02077
79.97875
which does Indica un significant diferencia, suponiendo normality. Por default el R
function does no suponer equality de v ariances en el t wo muestras (en co ntrast a el
similares S-MÁS t.Función de prueba). We Puede utilizar el F prueba para probar
para equality en el variances, provided que el t wo las muestras son de normales
populations.
> var.Prueba(Un, B)
Dato: Un y B.
F = 0.5837, num df = 12, denom df = 7, p-valor = 0.3938
hipótesis alternativa: proporción cierta de las varianzas no es
iguales a 1.
95 confianza de porcentaje intervalo:
0.1251097 2.1052687
Estimaciones de muestra:
Proporción de varianzas.
0.5837405
Cuál No muestra ninguna evidencia de una diferencia significativa, y tan podemos utilizar el
clásicos t-probar aquello supone igualdad de las varianzas.
> t.Prueba(Un, B, var.Igual=CIERTO)
Dos Muestra t-
dato de prueba: Un y
B.
t = 3.4722, df = 19, p-valor = 0.002551
Hipótesis alternativa: diferencia cierta en los medios no es iguales a 0
95 confianza de porcentaje intervalo:
0.01669058 0.06734788
Estimaciones de muestra:
Malo de x malo
de y 80.02077
79.97875
Todas estas pruebas suponen normalidad de las dos muestras. El dos-muestra
Wilcoxon (o Mann- Whitney) prueba sólo supone una distribución continua común bajo
el null hipótesis.
> wilcox.Prueba(Un, B)
corrección de la continuidad: Un y B.
W = 89, p-valor = 0.007497
Hipótesis alternativa: cambio de ubicación cierta no es igual a 0
Advirtiendo mensaje:
No puede computar exacto p-valor con lazos en: wilcox.Prueba(Un, B)
Nota el aviso: hay varios lazos en cada muestra, el cual sugiere fuertemente que este
dato es de una distribución discreta (probablemente debido a redondear)..
Hay varias maneras de comparar graphically las dos muestras. Ya hemos visto un par
de boxplots. El siguiente
> Parcela(ecdf(Un), .Los puntos=FALSOS, verticals=CIERTOS, xlim=gama(Un, B))
> Parcela(ecdf(B), .Los puntos=FALSOS, verticals=CIERTOS, añade=CIERTO)
Mostrará el dos empírico CDFs, y qqplot actuará un Q-Q parcela de las dos muestras. El
Kolmogorov-Smirnov la prueba es de la distancia vertical máxima entre el dos ecdf es,
suponiendo una distribución continua común:
> ks.Prueba(Un, B)
Dos-muestra Kolmogorov-Smirnov
dato de prueba: Un y B.
D = 0.5962, p-valor = 0.05919
Capítulo 8: distribuciones de 39
Probabilidad
Hipótesis alternativa: dos-sided
39
Advirtiendo mensaje:
No puede computar correcto p-valores con lazos en: ks.Prueba(Un, B)
40
Aviso: para() los bucles están utilizados en R código mucho menos a menudo que
en compiló lenguas. Código que toma un ‘objeto entero' la vista probablemente puede
ser ambos más claro y más rápido en R.
Otro looping las instalaciones incluyen el
> Repite expr
Declaración y el
> Mientras (condición) expr
Declaración.
La declaración de rotura puede soler rescindir cualquier bucle, posiblemente
anormalmente. Esto es la manera única de rescindir repetir bucles.
La declaración próxima puede soler interrumpir uno ciclo particular y skip a el
“próximo”. Declaraciones de control son más a menudo utilizados en conexión con
funciones qué está hablado en
Capítulo 10 [Escribiendo vuestras funciones propias], página 42, y donde más ejemplos emergerán.
42
El clásico R función lsfit() este trabajo bastante bien, y más 1. Él en vuelta utiliza las
funciones qr() y qr.coef() En el ligeramente counterintuitive manera encima para hacer
esta parte del cálculo. De ahí hay probablemente algún valor en habiendo justo esto separa
aislado en un sencillo de utilizar función si va a ser en uso frecuente. Si tan, podemos
desear hacer lo un operador binario matricial para aún más uso conveniente.
Dónde Un = K−1/2NR−1/2. Una manera para escribir la función está dada abajo.
> bdeff <- Función(bloques, variedades) {
Bloques <- cuando.Factor(bloques) # movimiento de seguridad menor
b <- Longitud(niveles(bloques))
Variedades <- cuando.Factor(variedades) # movimiento de seguridad menor
v <- Longitud(niveles(variedades))
K <- Cuando.Vector(mesa(bloques)) # saca dim attr
R <- Cuando.Vector(mesa(variedades)) # saca dim attr
Capítulo 10: Escribiendo vuestras 45
funciones propias
10.7 Scope
La discusión en esta sección es un poco más technical que en otras partes de este
document. However, detalla uno de el m unjor diferencias between S-PLUS y R..
Los símbolos qué ocurrir en el cuerpo de una función puede ser dividido a tres clases;
parámetros formales, variables locales y variables libres. Los parámetros formales de una
función son aquellos ocurriendo en la lista de argumento de la función. Sus valores están
determinados por el proceso de obligatorio los argumentos de función reales a los
parámetros formales. Las variables locales son aquellas cuyos valores están determinados
por la evaluación de expresiones en el cuerpo de las funciones. Variables qué no es los
parámetros formales o las variables locales se apellidan variables libres. Las variables libres
devienen variables locales si están asignados a. Considerar la definición de función
siguiente.
f <- Función(x) {
y <- 2*x
impresión(x)
impresión(y)
impresión(z)
}
En esta función, x es un parámetro formal, y es una variable local y z es una variable libre.
En R las encuadernaciones variables libres están resueltas por primero mirando en el
entorno en qué la función estuvo creado. Esto se apellida alcance léxico. Primero definimos
una función cubo llamado.
Cubo <- función(n) {
sq <- función() n*n
n*sq()
}
El variable n en el f unction sq no es un argument a aquella función. Therefore Es
un libre variable y el scoping rules must be utilizó para constatar tél value then es a be
asnoociated con él. Bajo estático scope (S-PLUS) el value es que asnoociated con un
global variable nombró n. Bajo léxico scope (R) es t he parámetro a el cubo de función
desde aquel es el active atando para el variable n en el tiempo t funcione sq wcuando
Capítulo 10: Escribiendo vuestras 47
funcionesLa
definió. propias
diferencia between evaluatión en R y e valuation en S-EL PLUS es que S-
PLUS looks para un global variable llamó n mientras R primer looks para un variable
llamó n en el e nvironment creó cuándo cubo wcuando i nvoked.
Capítulo 10: Escribiendo vuestras 48
funciones propias
## Primera evaluación en S
S> Cubo(2)
Error en sq(): Objeto "n" no fundar
Vertido
S> n <- 3
S> Cubo(2)
[1] 18
## Entonces la misma función evaluada en R
R> Cubo(2)
[1] 8
El alcance léxico también puede soler dar funciones mutable estado. En el ejemplo
siguiente muestramos qué R puede soler mimic una cuenta de banco. Unas necesidades
de cuenta de banco de funcionamiento para tener un equilibrio o total, una función para
hacer retiradas, una función para hacer depósitos y una función para declarar el equilibrio
actual. Conseguimos esto por crear las tres funciones dentro cuenta y entonces
regresando una lista que les contiene . Cuándo la cuenta está invocada él toma un total
de argumento numérico y regresa una lista que contiene las tres funciones. Porque estas
funciones están definidas en un entorno qué contiene total, tendrán acceso a su valor.
El operador de asignación especial, <<-, suele cambio el valor asociado con total . Estas
miradas de operador atrás en encerrar entornos para un entorno que contiene el total de
símbolo y cuándo encuentra tal un entorno reemplaza el valor, en aquel entorno, con el
valor de lado de mano correcta. Si el global o entorno de nivel superior está logrado sin
encontrar el total de símbolo entonces que variable está creado y asignado a allí. Para
más usuarios <<- crea una variable global y asigna el valor del lado de mano correcto a él 2.
Sólo cuando <<- ha sido utilizado en una función que estuvo regresado como el valor de
otra función el comportamiento especial describió aquí ocurrir.
Abierto.Cuenta <- función(total)
{ lista(
Función = de
depósito(cantidad) {
si(cantidad <= 0)
Parón("los depósitos tienen que ser
positivos!\n") Total <<- cantidad +
total
Gato(cantidad, "depositó. Vuestro equilibrio es", total, "\n\n")
},
Retira = función(cantidad) {
si(total > de cantidad)
Parón("no tienes que mucho dinero!\n")
Total <<- total - cantidad
Gato(cantidad, "retirado. Vuestro equilibrio es", total, "\n\n")
},
Función = de equilibrio() {
Gato("Vuestro equilibrio es", total, "\n\n")
}
)
}
ross <-
Abierto.Cuenta(100)
robert <-
abierto.Cuenta(200)
ross$Retirar(30)
2
En algunos notan esto mimics el comportamiento en S-PLUS desde entonces en S-MÁS este operador
siempre crea o asigna a una variable global.
Capítulo 10: Escribiendo vuestras 49
funciones propias
ross$Equilibrio()
robert$equilibrio()
ross$Depósito(50)
ross$equilibrio()
ross$retirar(500)
No proveído para específicamente por la función genérica en cuestión, hay siempre un default acción
Proporcionado.
Unas cosas de marcas del ejemplo más claras. El mecanismo de clase ofrece el usuario la
facilidad de diseñar y escribiendo funciones genéricas para propósitos especiales. Entre las otras
funciones genéricas son parcela () para mostrar objetos graphically, resumen() para
summarizing análisis de varios tipos, y anova() para comparar modelos estadísticos.
El número de funciones genéricas que puede tratar una clase en una manera concreta
puede ser bastante grande. Por ejemplo, las funciones que puede acomodar en algunos
objetos de moda de dato "de clase.El marco" incluye
[ [[<- Cualq Cuando.Ma
uiera tricial
[<- Malo Parce Resumen
la
Una lista actualmente completa puede ser conseguida por utilizar los métodos() función:
> Métodos(dato="de clase.Marco")
En cambio el número de clases una función genérica puede manejar también puede ser
bastante grande. Por ejemplo la parcela() la función tiene un default método y variantes para
objetos de dato "de clases.Marco", "densidad", "factor", y más. Una lista completa
puede ser conseguida otra vez por utilizar los métodos() función:
> Métodos(parcela)
Para muchos funciones genéricas el cuerpo de función es bastante corto, por ejemplo.
> coef
Función (objeto, ...)
UseMethod("coef")
La presencia de UseMethod indica esto es una función genérica . Para ver lo que los métodos
son disponibles podemos utilizar métodos()
> Métodos(coef)
[1] coef.aov* coef.Arima* coef.default* coef.listof*
[5] coef.nls* coef.Resumen.nls*
> Consigue3método("coef",
"aov") función (objeto,
...)
{
z <-
Objetar$coef
z[!is.na(z)]
50
}
Una función nombró gen.cl Será invocado por el genérico gen para clase cl, así que no
nombra funciones en este estilo a no ser que están pretendidos para ser métodos.
El lector está referido al R Definición de Lengua para una discusión más completa de este
mecanismo.
51
11 Statistical Modelos en R
Esta sección presumes el lector tiene alguna familiaridad con metodología estadística, en
particular con análisis de regresión y el análisis de varianza. Más tarde hacemos algunos
bastante presunciones más ambiciosas, concretamente que algo es sabido
aproximadamente modelos lineales generalizados y nonlinear regresión.
Los requisitos para caber los modelos estadísticos son suficientemente bien definidos
para hacerlo posible para construir herramientas generales que aplica en un espectro
ancho de problemas..
R Proporciona un interlocking suite de instalaciones que la marca que cabe modelos
estadísticos muy sencillos. Cuando mencionamos en la introducción, la producción
básica es mínima, y uno necesita pedir los detalles por llamar extractor funciones.
y = Xβ + e
Dónde el y es el vector de respuesta, X es la matriz de modelo o matriz de diseño y tiene
columnas x0, x1, . . . , xp , las variables de determinar. Muy a menudo x0 será una columna de
unos definiendo un interceptar plazo.
Ejemplos
Antes de dar una especificación formal, unos cuantos ejemplos pueden útilmente puestos el cuadro.
Supone y, x, x0, x1, x2, . . . Es variables numéricas, X es un matricial y Un , B, C, . . . Es
factores. El siguiente formulae en el lado izquierdo abajo especifica modelos estadísticos
cuando descritos en el correctos.
y~x
y~1+x Tanto implicar el mismo modelo de regresión lineal sencillo de y en x. El
primero tiene un implícito intercepta plazo, y el segundo un explícito un.
y~0+x
~ y -1 +
x
y~x-1 regresión lineal Sencilla de y en x a través del origen (aquello es, sin un
interceptar plazo).
Registro(y) ~ x1 + x2
Regresión múltiple de la variable transformada, registro(y), en x1 y x 2 (con
un implícito intercepta plazo).
y ~ poly(x,2)
y ~ 1 + x + yo(x^2)
Regresión polinómica de y en x de grado 2. La primera forma utiliza ortogonal
polyno- mials, y los segundos usos poderes explícitos, cuando base.
y ~ X + poly(x,2)
Regresión múltiple y con matriz de modelo que consta de la matriz X así
como plazos polinómicos en x a grado 2.
Capítulo 11: modelos 52
Estadísticos en R
y ~ Un análisis de clasificación Solo de modelo de varianza de y , con las clases determinaron por Un .
y ~ Un + x análisis de clasificación Sola de modelo de covarianza de y , con las clases determinaron por
Un, y con covariate x.
y ~ Un*B
y ~ Un + B + Un:B
y ~ B En Un
y ~ Un/B Dos factor modelo no aditivo de y en Un y B . El primeros dos especifican
clasificación cruzada igual y el segundos dos especifican el mismo nested
clasificación. En abstracto denomina todo cuatro especifica el mismo modelo
subspace.
y ~ (Un + B + C)^2
y ~ Un*B*C - Un:B:C
Tres experimento de factor pero con un modelo que contiene efectos
principales y dos interacciones de factor sólo. Ambos formulae especificar el
mismo modelo.
y ~ Un *
x ~y
Un/x
y ~ Un/(1 + x) - 1
Modelos de regresión lineales sencillos separados de y en x dentro de los niveles
de Un , con codificaciones diferentes. La última forma produce estimaciones
explícitas de tan muchos diferentes intercepta y pendientes tan hay niveles en Un
.
y ~ Un*B + Error(C)
Un experimento con dos factores de tratamiento, Un y B , y estratos de error
determinaron por factor C. Por ejemplo un experimento de parcela de la
ruptura, con parcelas enteras (y de ahí también subplots), determinados por
factor C.
El operador ~ suele definir una fórmula de modelo en R. La forma, para un modelo
lineal normal, es
Respuesta ~ op_1 plazo_1 op_2 plazo_2 op_3 plazo_3 ...
Dónde
La respuesta es un vector o matriz, (o la expresión que evalúa a un vector o matricial)
definiendo la variable de respuesta(s).
op i Es un operador, cualquiera + o - , implicando la inclusión o exclusión de un
plazo en el modelo, (el primero es opcional).
Plazo i es tampoco
• Un vector o expresión matricial, o 1 ,
• Un factor, o
• Una expresión de fórmula que consta de factores, los vectores o las matrices conectaron
por
Operadores de fórmula.
En todos los casos cada plazo define una colección de columnas tampoco para
ser añadidos a o sacados de la matriz de modelo. Unas 1 posiciones para un
interceptar columna y es por default incluido en la matriz de modelo a no ser
que explícitamente sacó.
Los operadores de fórmula son similares en efecto al Wilkinson y Rogers la notación
utilizada por such programas como Glim y Genstat. Uno inevitable change es que el
operator ‘.' becomes ‘:' Desde el periodo es un carácter de nombre válido en R.
La notación es summarized abajo (basado en Cuartos & Hastie, 1992, p.29):
Y ~ M Y es modeled cuando M .
M_1 + M_2 Incluye M 1 y M 2.
Capítulo 11: modelos 53
Estadísticos en R
11.1.1 Contrastes
Necesitamos al menos alguna idea cómo el modelo formulae especificar las columnas de
la matriz de modelo. Esto es fácil si tenemos variables continuas, cuando cada cual
proporciona una columna de la matriz de modelo (y el intercepta proporcionará una
columna de unos si incluidos en el modelo).
Qué sobre un k-factor de nivel Un? La respuesta difiere para unordered y ordenó factores.
Para unordered factores
− k 1 columnas están generadas para los indicadores del segundo, . .
. , kth niveles del factor. (Por ello el implícito parameterization es para contrastar la
respuesta en cada nivel con aquel en el primero.) Para ordenó factores el k 1 columnas
son los polinomios ortogonales encima 1, .− . . , k, omitiendo el plazo constante.
A pesar de que la respuesta es ya complicada, no es la historia entera. Primero, si el
interceptar está omitido en un modelo que contiene un plazo de factor, el primer tal plazo
está codificado a k las columnas que dan los indicadores para todos los niveles. Segundo, el
comportamiento entero puede ser cambiado por las opciones que ponen para
contrastes. El default encuadre en R es
Opciones(contrastes = c("contr.Tratamiento", "contr.poly"))
La razón principal para mí ntioning esto es que R y S hunve different defaults para
unordered factores, S utilizando Helmert contrasts. Tan si y ou necesidad de comparar
ynuestros resultados a aquellos de un textobovale o pa per which utilizó S-PLUS, you
necesitará poner
Opciones(contrastes = c("contr.helmert", "contr.poly"))
Esto es una diferencia deliberada , cuando contrastes de tratamiento (R default) está
pensado más fácil para nuevo- comers para interpretar.
Todavía hemos acabado no, cuando el esquema de contraste para ser utilizado puede
ser puesto para cada plazo en el modelo que utiliza los contrastes de funciones y C .
No hemos considerado todavía plazos de interacción: estos generan los productos de
las columnas introdujeron para sus plazos de componente.
A pesar de que los detalles están complicados, modelo formulae en R normalmente
generará los modelos que un estadístico experto esperaría, proporcionado que marginality
está preservado. Cabiendo, por ejemplo, un modelo con una interacción pero no los efectos
principales correspondientes en general dirigirán a resultados sorprendentes, y es para
expertos sólo.
Capítulo 11: modelos 54
Estadísticos en R
Resumen(objeto)
Impresión un resumen comprensible de los resultados del análisis de regresión.
vcov(Objeto)
Regresos la varianza-matriz de covarianza de los parámetros principales de un
objeto de modelo cabido.
µ = m(η), η = m−1(µ) =
de enlace.
Estas suposiciones son bastante sueltas para abarcar una clase ancha de los modelos
útiles en práctica estadística, pero bastante estanco para dejar el desarrollo de una
metodología unificada de valoración e inferencia, al menos aproximadamente. El lector
está referido a cualquiera de los trabajos de referencia actuales en el tema para detalles
llenos, como McCullagh & Nelder (1989) o Dobson (1990).
Capítulo 11: modelos 57
Estadísticos en R
11.6.1 Families
La clase de modelos lineales generalizados manejó por las instalaciones suministraron en R
incluye gaussiano, binomio, poisson, inverse gaussiano y gamma distribuciones de respuesta
y también quasi-likelihood modelos donde la distribución de respuesta no es explícitamente
especificó. En el caso último la función de varianza tiene que ser especificada como función
del malo, pero en otros casos esta función está implicada por la distribución de respuesta.
Cada distribución de respuesta admite una variedad de funciones de enlace para
conectar el malo con el lineal predictor. Aquellos automáticamente disponibles está
mostrado en la mesa siguiente:
La familia gaussiana
Una llamada como
> fm <- glm(y ~ x1 + x2, familiar = gaussiano, ventas = de dato)
Consigue el mismo resultado cuando
> fm <- lm(y ~ x1+x2, ventas=de dato)
Pero mucho menos efficiently. Nota cómo la familia gaussiana no es automáticamente
proporcionado con una elección de enlaces, así que ningún parámetro está dejado. Si un
problema requiere una familia gaussiana con un nonstandard enlace, esto normalmente puede
ser conseguido a través del quasi familia, cuando veremos más tarde.
La familia binomial
Considerar un ejemplo pequeño, artificial, de Silvey (1970).
Capítulo 11: modelos 58
Estadísticos en R
En el Aegean isla de Kalythos los habitantes machos adolecen una enfermedad de ojo
congénita, los efectos del cual deviene más marcado con edad creciente. Muestras de
islander los machos de varias edades estuvieron probados para la ceguera y los resultados
grabaron. El dato está mostrado abajo:
Edad: 20 35 45 55 70
El núm. 50 50 50 50 50
probó:
El núm. 6 17 26 37 44
ciego:
El problema consideramos es para caber ambos logistic y probit modelos a este dato,
y para estimar para cada modelo el LD50, aquello es la edad en qué la posibilidad de la
ceguera para una habitante macho es 50%.
Si y es el número de ciego en edad x y n el número probó, ambos modelos tienen la forma
Dónde para el probit caso, F (z) = Φ(z) es la función de distribución normal estándar, y
en el logit caso (el default), F (z) = ez/(1 + ez). En ambos casos el LD50 es
LD50 = −β0/β1
Poisson Modelos
Con el Poisson familia el default el enlace es el registro , y en practicar el uso
importante de esta familia es para caber surrogate Poisson registro-modelos lineales a dato
de frecuencia, cuya distribución real es a menudo multinomial. Esto es un tema grande e
importante no hablaremos más allá aquí. Incluso forma una parte importante del uso de
no-gaussiano generalizó modelos en general.
Capítulo 11: modelos 59
Estadísticos en R
Quasi-likelihood Modelos
Para todas las familias la varianza de la respuesta dependerá de el malo y tendrá el
parámetro de escala como multiplier. La forma de dependencia de la varianza en el
malo es una característica de la distribución de respuesta; por ejemplo para el poisson
distribución Var[y] = µ.
Para quasi-likelihood valoración e inferencia la distribución de respuesta precisa no es
especificada, sino sólo una función de enlace y la forma de la función de varianza cuando
depende de el malo. Desde quasi-likelihood usos de valoración formalmente técnicas
idénticas a aquellos para la distribución gaussiana, esta familia proporciona una manera de
caber modelos gaussianos con enlace no estándar funciones o funciones de varianza,
adicionalmente.
Por ejemplo, considera caber la regresión no lineal
θ1z1
y= +e
z2 − θ2
Cuáles pueden ser escritos alternativamente cuando
1
y= +e
β1x1 + β2x2
Dónde x1 = z2/z1, x2 = − 1/z1, β1 = 1/θ1 y β 2 = θ2/θ1. Suponiendo un marco de dato
adecuado para ser instalado podríamos caber esto regresión no lineal cuando
> nlfit <- glm(y ~ x1 + x2 - 1,
Familiar = quasi(enlace=inverse, constante=de
varianza), dato = biochem)
El lector está referido al manual y el documento de ayuda para información más
lejana, cuando necesitó.
1.10, 1.10)
> y <- c(76, 47, 97, 107, 123, 139, 159, 152, 191, 201, 207, 200)
El criterio de acceso para ser minimizado es:
> fn <- Función(p) suma((y - (p[1] * x)/(p[2] + x))^2)
Para hacer el cabido necesitamos estimaciones iniciales de los parámetros. Una manera
para encontrar sensato empezando los valores es a parcela el dato, suposición algunos
valores de parámetro, y superponer la curva de modelo que utiliza aquellos valores.
> Parcela(x, y)
> xfit <- seq(.02, 1.1, .05)
> yfit <- 200 * xfit/(0.1 + xfit)
> Líneas(spline(xfit, yfit))
Podríamos hacer mejores, pero estos empezando valores de 200 y 0.1 parece adecuado. Ahora
hacer la acceso:
> Fuera <- nlm(fn, p = c(200, 0.1), hessian = CIERTO)
Después del cabiendo, fuera de$mínimo es el SSE, y fuera de$la estimación es el
menos cuadra estimaciones de los parámetros. Para obtener los errores estándares
aproximados (SE) de las estimaciones hacemos:
> sqrt(diag(2*fuera de$mínimo/(longitud(y) - 2) * soluciona(fuera de$hessian)))
El 2 cuál está restado en la línea encima representa el número de parámetros. Un 95%
intervalo de confianza sería la estimación de parámetro
± 1.96 SE. Podemos superponer el
menos cuadra cabido en una parcela nueva:
> Parcela(x, y)
> xfit <- seq(.02, 1.1, .05)
> yfit <- 212.68384222 * xfit/(0.06412146 + xfit)
> Líneas(spline(xfit, yfit))
El paquete estándar stats proporciona mucho más instalaciones extensas para caber
modelos no lineales por menos plazas. El modelo acabamos de caber es el Michaelis-
Menten modelo, así que podemos utilizar
> df <- Datos.Marco(x=x, y=y)
> Acceso <- nls(y ~ SSmicmen(x, Vm, K), df)
> Acceso
Nonlinear Modelo de modelo de
la regresión: y~
SSmicmen(x, Vm, K) dato:
df
Vm K
212.68370711 0.06412123
Suma residual-de-plazas: 1195.449
> Resumen(acceso)
Parámetros:
Estimación Std. Error t valor
Pr(>|t|) Vm 2.127e+02 6.947e+00
30.615 3.24e-11 K 6.412e-02 8.281e-03
7.743 1.57e-05
Parámetro:
Vm
Capítulo 11: modelos 61
Estadísticos
K 0.7651en R
Capítulo 11: modelos 62
Estadísticos en R
• Árbol-basó modelos. Más que buscar un modelo lineal global explícito para
predicción o interpretación, árbol-basó los modelos buscan a bifurcate el dato,
recursively, en puntos críticos de las variables de determinar para partición el dato
finalmente a grupos que es tan homogeneous tan posible dentro, y tan heterogéneo
como posible entre. Los resultados a menudo dirigen a ideas que otros métodos de
análisis del dato tienden no para ceder.
Los modelos son otra vez especificados en la forma de modelo lineal normal. El modelo
que cabe la función es árbol (), pero muchos otras funciones genéricas como
parcela() y texto() es bien adaptado a mostrar los resultados de un árbol-el modelo
basado cabido en una manera gráfica.
Modelos de árbol son disponibles en R vía el usuario-contribuyó paquetes rpart
(https: / / CRAN . R-Proyecto . org / Paquete=rpart) y árbol (https: / / CRAN . R-
Proyecto . org / Árbol=de paquete).
63
12 Graphical procedimientos
Las instalaciones gráficas son una componente importante y extremadamente versátil del
R entorno. Es posible de utilizar las instalaciones para mostrar una variedad ancha de
estadístico graphs y también para construir enteramente tipos nuevos de graph..
Las instalaciones de gráfico pueden ser utilizadas en ambos interactivos y modos de lote, pero
en más casos, el uso interactivo es más productivo. El uso interactivo es también fácil porque en
startup tiempo R inicia un conductor de dispositivo del gráfico qué abre una ventana de
gráfico especial para la exhibición de gráfico interactivo. A pesar de que esto está hecho
automáticamente, pueda útil de saber que la orden utilizó es X11() debajo UNIX,
ventanas() debajo Windows y cuarzo() bajo macOS. Un dispositivo nuevo siempre puede ser
abierto por dev.Nuevo().
Una vez el conductor de dispositivo está corriendo, R plotting las órdenes pueden
soler producir una variedad de exhibiciones gráficas y para crear enteramente clases
nuevas de exhibición..
Plotting Las órdenes están divididas a tres grupos básicos:
• Alto-nivelar plotting las funciones crean una parcela nueva en el dispositivo de gráfico,
posiblemente con hachas, etiquetas, títulos y tan encima.
• Abajo-nivelar plotting las funciones añaden más información a una parcela de
existir, como puntos extras, líneas y etiquetas..
• Funciones de gráfico interactivo te dejan interactivamente añadir información a, o
extracto infor- mation de, una parcela de existir, utilizando un dispositivo de señalar
como un ratón.
Además, R mantiene una lista de parámetros gráficos cuáles pueden ser manipulados para
personalizar vuestras parcelas.
Este manual único describes lo que un re known cuando ‘base' gráfico. Un gráfico
separado sub- el sistema en verja de paquete convive con base – es más potente pero más duro de
utilizar. Hay un enrejado de paquete recomendable (https://cran.r-
project.org/package=lattice) cuál construye encima verja y proporciona maneras de
producir multi-parcelas de tablero semejantes a aquellos en el sistema de Enrejado en S.
Parcela(df)
parcela(~
expr)
parcela(y ~
expr)
df Es un marco de dato, y es un ny object, expr es una lista de object los nombres
separaron by ‘+'
(P. ej., un + b + c). Las primeras dos formas producen parcelas distribucionales
de las variables en un marco de dato (primero forma) o de un número de nombró
objetos (forma de segundo). Las terceras parcelas de forma y contra cada objeto
nombrado en expr.
Registr
o="x"
registr
o="y"
Registro="xy" Causa el x, y o ambas hachas para ser logarítmicas. Esto trabajará
para muchos, pero no todo, tipos de parcela..
Tipo= El argumento= de tipo controla el tipo de parcela produjo, como sigue:.
Tipo="p" Parcela puntos individuales (el default)
Tipo="l" líneas de Parcela
Tipo="b" puntos de Parcela conectaron por líneas (ambos)
Tipo="o" puntos de Parcela overlaid por líneas
Tipo="h" Parcela líneas verticales de puntos al eje de cero (alto-densidad )
Tipo="s"
Tipo="S" Paso-parcelas de función. En la primera forma, la parte superior del
vertical define el punto; en el segundo, el fondo.
Tipo="n" No plotting en absoluto. Aun así las hachas son todavía dibujadas
(por default) y el sistema de coordenada está instalado según el
dato. Ideal para crear parcelas con funciones de gráfico de nivel
bajo subsiguientes.
xlab=Cuerda
ylab=cuerda
Etiquetas axiales para el x y y hachas. Uso estos argumentos para cambiar el
default etiquetas, normalmente los nombres de los objetos utilizaron en la
llamada al alto-nivelar plotting función.
Cuerda=principal
Título de figura, colocado en la parte superior de la parcela en una fuente grande.
sub=Cuerda
Sub-Título, colocado justo bajo el x-axial en una fuente más pequeña.
Capítulo 12: procedimientos 66
Gráficos
Título(principal, sub)
Añade un título principal hasta arriba de la parcela actual en una fuente
grande y (opcionalmente) un sub-título sub en el fondo en una fuente más
pequeña.
Eje(lado, ...)
Añade un axial a la parcela actual en el lado dado por el primer argumento (1 a 4,
contando en el sentido de las agujas del reloj de el fondo.) Otros argumentos
controlan el posicionamiento del axial dentro o junto a la parcela, y tick posiciones
y etiquetas. Útil para añadir hachas hechas de encargo después de llamar
parcela() con las hachas=argumento FALSO.
Abajo-nivelar plotting las funciones normalmente requieren alguna información de
posicionamiento (p. ej., x y y co- ordinates) para determinar dónde para colocar los
elementos de parcela nuevos. Las coordenadas están dadas en los plazos de usuario
coordina cuáles están definidos por la orden de gráfico de nivel alto anterior y está escogido
basado en el dato suministrado.
Dónde x y y los argumentos están requeridos, es también suficiente de suministrar un
argumento solo siendo una lista con los elementos nombraron x y y. De modo parecido
una matriz con dos columnas es también entrada válida. De este modo funciones como
locator() (ve abajo) puede soler especificar posiciones en una parcela interactivamente.
locator(n, tipo)
Esperas para el usuario para seleccionar ubicaciones en la parcela actual que
utiliza el botón de ratón izquierdo. Esto continúa hasta n (default 512) los
puntos han sido seleccionados, u otro botón de ratón está pulsado. El
argumento de tipo deja para plotting en el seleccionó puntos y tiene el mismo
efecto en cuanto a órdenes de gráfico de nivel alto; el default es no plotting.
locator() Regresa las ubicaciones de los puntos seleccionaron como lista con
dos componentes x y y.
locator() Es normalmente llamado sin argumentos. Es particularmente útil para
interactivamente seleccionando posiciones para elementos gráficos como leyendas o etiquetas
cuándo es difícil de calcular por adelantado dónde el gráfico tendría que ser colocado. Por
ejemplo, para colocar algunos texto informativo cerca un outlying punto, la orden.
> Texto(locator(1), "Outlier", adj=0)
Puede ser útil. (locator() Será ignorado si el dispositivo actual, como la posdata no
apoya interactiva señalando.)
Identifica(x, y, etiquetas)
Dejar el usuario para destacar cualquiera de los puntos definió por x y y
(utilizando el botón de ratón izquierdo) por plotting el componente
correspondiente de las etiquetas cercanas (o el número de índice del punto
si las etiquetas es ausentes). Regresos los índices del seleccionó puntos
cuándo otro botón está pulsado.
A veces queremos identificar puntos particulares en una parcela, más que sus
posiciones. Por ejemplo, podemos desear el usuario para seleccionar alguna observación
de interés de una exhibición gráfica y entonces manipular aquella observación en alguna
manera. Dado un número de ( x, y) coordenadas en dos vectores numéricos x y y,
podríamos utilizar el identificar() funciona como sigue:.
> Parcela(x, y)
> Identifica(x, y)
El identificar() las funciones actúa no plotting él, pero sencillamente deja el
usuario para mover el puntero de ratón y clic el botón de ratón izquierdo cerca un punto. Si
hay un punto cerca el ratón pointer lo be munrked con su índice number (then es, su
position en el x/y vectors) plotted cercano. Alternativamente, podrías utilizar algunos
cuerda informativa (como un nombre de caso) como punto destacado por utilizar el
argumento de etiquetas para identificar(), o inutilizar marcando altogether con la
parcela = argumento FALSO. Cuándo el proceso está rescindido (ve encima),
identifica() regresa los índices del seleccionó puntos; puedes utilizar estos índices para
extraer el seleccionó puntos de los vectores originales x y y.
par() Sin argumentos, regresa una lista de todos parámetros de gráficos y sus valores
para el dispositivo actual.
par(c("col", "lty"))
Con un argumento de vector del carácter, regresa sólo los parámetros de
gráfico nombrados (otra vez, como lista.)
par(col=4, lty=2)
Con nombró argumentos (o un argumento de lista solo), pone los valores de
los parámetros de gráfico nombrados, y regresa los valores originales de los
parámetros como lista.
Poniendo parámetros de gráfico con el par() la función cambia el valor de los parámetros
permanentemente, en el sentido que todas las llamadas futuras a funciones de gráfico (en el
dispositivo actual) será afectado por el valor nuevo. Puedes pensar de poner parámetros
de gráfico de este modo tan poniendo “default” valores para los parámetros, el cual será
utilizado por todas funciones de gráficos a no ser que un valor alternativo está dado.
Nota que llamadas a par() siempre afectar los valores globales de parámetros de
gráficos, incluso cuándo par() se apellida de dentro de una función. Esto es a menudo
comportamiento indeseable—normalmente queremos puestos algunos parámetros de gráfico,
algún plotting, y entonces restaurar los valores originales tan cuando no para afectar el
usuario R sesión. Puedes restaurar los valores iniciales por salvar el resultado de par()
cuándo haciendo cambios, y restaurando los valores iniciales cuándo plotting es completo.
> oldpar <- par(col=4, lty=2)
. . . plotting Órdenes . . .
> par(oldpar)
Para salvar y restaurar todo settable1 parámetros gráficos uso
> oldpar <- par(Ningún.readonly=CIERTO)
. . . plotting Órdenes . . .
> par(oldpar)
12.4.2 Temporary Cambios: Argumentos a funciones de gráfico
Parámetros de gráfico también pueden ser pasados a (casi) cualquier función de gráfico
cuando nombró argumentos. Esto tiene el mismo efecto cuando pasando los argumentos al
par() función, exceptúa que los cambios sólo último para la duración de la llamada de
función. Por ejemplo:.
> Parcela(x, y, pch="+")
Productos un scatterplot utilizando una señal de plus como el plotting carácter, sin
cambiar el default plotting carácter para parcelas futuras.
Desafortunadamente, esto no es implementado enteramente coherentemente y es a
veces necesario de poner y parámetros de gráfico de la reinicialización que utilizan
par().
cex.Axia
l
cex.Lab
oratori
o
cex.Prin
cipal
cex.sub La expansión de carácter para ser utilizado para anotación axial, x y y etiquetas,
principales y sub-títulos, respectivamente.
Laboratorio=c(5, 7, 12)
Los primeros dos números son el número deseado de tick intervalos en el x y
y hachas respectivamente. El tercer número es la longitud deseada de
etiquetas axiales, en caracteres (incluyendo el punto decimal.) Escogiendo un
demasiado-el valor pequeño para este parámetro puede resultar en todo tick
etiqueta ser redondeado al mismo número!
mgp=c(3, 1, 0)
Posiciones de componentes axiales. El primer componente es la distancia de
la etiqueta axial a la posición axial, en líneas de texto. El segundo
componente es la distancia a el tick etiquetas, y el componente final es la
distancia de la posición axial a la línea axial (normalmente cero). Medida de
números positivos fuera de la región de parcela, interior de números
negativos.
tck=0.01 Longitud de tick marcas, como fracción de la medida del plotting región. Cuándo
tck es pequeño (menos de 0.5) el tick marcas en el x y y las hachas están
forzadas para ser la misma medida. Un valor de 1 da líneas de verja. Los valores
negativos dan tick marcas fuera del plotting región. Uso tck=0.01 y mgp=c(1,-
1.5,0) para interno tick marcas.
xaxs="r"
yaxs="i" Estilos axiales para el x y y hachas, respectivamente. Con estilos "i"
(internos) y r "" (el default) tick marcas siempre caída dentro de la gama del
dato, aun así estilo "r" deja una cantidad pequeña de espacial en los bordes. (S
Tiene otros estilos no implementados en R.)
−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−− mar[3]
−−−−−−−−−−−−−−−−−−
−−−−−−−−−−−−−−−−−−
Región de parcela
mai[2]
3.0
1.5
mai[1] x
Marge
n
−1.5
−3.0
mar=c(4, 2, 2, 1)
Similar a mai , excepto la unidad de medida es líneas de texto .
mar Y mai es equivalente en el sentido que encuadre uno cambia el valor del otro. El
default los valores escogidos para este parámetro es a menudo demasiado grande; el margen
derecho es raramente necesitado, y tampoco es el margen superior si ningún título está
siendo utilizó. Los márgenes inferiores e izquierdos tienen que ser bastante grandes para
acomodar el axial y tick etiquetas. Además, el default está escogido sin considerar a la
medida de la superficie de dispositivo: por ejemplo, utilizando la posdata() conductor con la
altura=4 argumento resultará en una parcela qué es aproximadamente 50% margen a no ser que
mar o mai está puesto explícitamente. Cuándo las figuras múltiples son en uso (ve abajo) los
márgenes están reducidos, aun así esto no puede ser bastante cuándo muchas figuras comparten
la misma página.
Capítulo 12: procedimientos 73
Gráficos
omi[4]
mfg=c(3,2,3,2)
omi[1]
mfrow=c(3,2)
Los parámetros gráficos que relacionan a las figuras múltiples son como sigue:
mfcol=c(3, 2)
mfrow=c(2, 4)
Pone la medida de una variedad de figura múltiple. El primer valor es el número
de filas; el segundo es el número de columnas. La diferencia única entre estos
dos parámetros es que poniendo mfcol las causas representa para ser llenados
por columna; mfrow llena por filas.
El diseño en la Figura podría haber sido creado por poner mfrow=c(3,2); la
figura muestra la página después de que cuatro parcelas han sido dibujadas.
Poniendo tampoco de estos pueden reducir la medida de base de símbolos y
texto (controlados por par("cex") y el pointsize de el dispositivo). En un
diseño con exactamente dos filas y columnas la medida de base está reducida
por un factor de 0.83: si hay tres o más de cualesquier filas o columnas, el
factor de reducción es 0.66.
mfg=c(2, 2, 3, 2)
Posición de la figura actual en un entorno de figura múltiple. Los primeros dos
números son la fila y columna de la figura actual; el últimos dos son el número
de filas y columnas en la variedad de figura múltiple. Pone este parámetro para
saltar entre figuras en la variedad. Incluso puedes utilizar valores diferentes para los
últimos dos números que los valores ciertos para unequally-sized figuras en la
misma página.
Higo=c(4, 9, 1, 4)/10
Posición de la figura actual en la página. Los valores son las posiciones del
izquierdos, bien, fondo y bordes superiores respectivamente, como porcentaje de la
página medida de la esquina izquierda inferior. El valor de ejemplo sería para
una figura en el derecho inferior de la página. Pone este parámetro para
posicionamiento arbitrario de figuras dentro de una página. Si quieres añadir
una figura a una página actual, el uso nuevo=CIERTO también (a diferencia de
S)..
oma=c(2, 0, 3, 0)
omi=c(0, 0, 0.8, 0)
Medida de márgenes exteriores. Como mar y mai , las primeras medidas en
líneas de texto y el segundo en pulgadas, empezando con el margen inferior y
trabajando en el sentido de las agujas del reloj.
Capítulo 12: procedimientos 74
Gráficos
Los márgenes exteriores son particularmente útiles para página-títulos sensatos, etc. el
texto puede ser añadido a los márgenes exteriores con el mtext() función con el
argumento exterior=CIERTO. hay no márgenes exteriores por default, aun así, así que
les tienes que crear explícitamente utilizando oma u omi.
Más complicó los arreglos de figuras múltiples pueden ser producidos por la
ruptura.Pantalla() y diseño() funciones, así como por la verja y enrejado
(https://cran.r-project.org/ enrejado=de paquete) paquetes.
Sea overwritten. Esto es el caso incluso si el archivo era sólo creado más temprano en
el mismo R sesión.
Muchos usos de producción de Posdata serán para incorporar la figura en otro
documento. Esto trabaja más cuándo encapsulated la posdata está producida: R siempre
produce conformant producción, pero sólo marca la producción como tal cuando el
onefile=el argumento FALSO está suministrado. Estas raíces de notación inusuales
de S-compatibilidad: realmente significa que la producción será una página sola (cuál
es parte del EPSF especificación). Así para producir una parcela para inclusión utiliza a
algo le gusta
> Posdata("parcela1.eps", horizontal=FALSO, onefile=FALSO,
altura=8, ancho=6, pointsize=10)
dev.Luego(
) Regresos el número y nombre del dispositivo de gráfico luego a, o anterior al
dev.prev() dispositivo actual, respectivamente.
dev.Conjunto(qué=k)
Puede soler cambiar el dispositivo de gráfico actual al en posición k de la
lista de dispositivo. Regresos el número y etiqueta del dispositivo.
dev.Fuera(
k) Rescindir el dispositivo de gráfico en punto k de la lista de dispositivo. Para
algunos dispositivos, como dispositivos de posdata, esto tampoco
imprimirá el archivo inmediatamente o correctamente completar el archivo
para impresión más tardía, dependiendo de cómo el dispositivo estuvo
iniciado.
Capítulo 12: procedimientos 76
Gráficos
dev.Copia(dispositivo, ..., El
cual=k)
dev.Impresión(dispositivo, ...,
El cual=k)
Marca una copia del dispositivo k. Aquí el dispositivo es una función de dispositivo , como
posdata,
Con extra arguments, si necesitado, specified by ‘...'. dev.La impresión es
similar, pero el dispositivo copiado es inmediatamente cerrado, de modo que
acciones de fin, como imprimir hardcopies, es inmediatamente actuó.
Gráfico.Fuera()
Rescindir todos dispositivos de gráficos en la lista, excepto el null dispositivo.
13 Packages
Todo R funciones y datasets está almacenado en paquetes. Sólo cuándo un paquete es cargado
es sus contenidos disponibles. Esto está hecho ambos para eficacia (la lista llena tomaría más
memoria y tomaría más largo de buscar que un subconjunto), y a desarrolladores de paquete
de la ayuda, quiénes están protegidos de enfrentamientos de nombre con otro código. El proceso
de paquetes en desarrollo está descrito en la sección que “Crea R paquetes” en Escribir R
Extensiones. Aquí, les describiremos del punto de vista de un usuario..
Para ver qué paquetes están instalados en vuestro sitio, asunto la orden
> Biblioteca()
Sin argumentos. Para cargar un paquete particular (p. ej., la bota (https://CRAN.R-
Proyecto. org/Bota=de paquete) el paquete que contiene funciones de Davison &
Hinkley (1997)), uso un com- mand gusta
> Biblioteca(bota)
Los usuarios conectaron a el Internet puede utilizar el instalar.Paquetes() y
actualización.Paquetes() funciones (disponibles a través de la carta de Paquetes en el
Windows y macOS GUIs, ve Sección “Instalando paquetes” en R Instalación y Administración)
para instalar y paquetes de actualización.
Para ver qué paquetes son actualmente cargados, uso
> Búsqueda()
Para mostrar la lista de búsqueda. Algunos paquetes pueden ser cargados pero no disponibles
en la lista de búsqueda (ve Sección 13.3 [Namespaces], página 78): estos serán incluidos en
la lista dada por
> loadedNamespaces()
Para ver una lista de todos temas de ayuda disponibles en un paquete instalado, uso
> Ayuda.Inicio()
Para empezar el sistema de ayuda del HTML, y entonces navigate al listado de paquete en la
Referencia
Sección.
13.3 Namespaces
Paquetes haber namespaces, el cual tres cosas: dejan el escritor de paquete para esconder
funciones y dato que está significado sólo para uso interno, impiden funciones de
romper cuándo un usuario (u otro escritor de paquete) elige un nombre que
enfrentamientos con uno en el paquete, y proporcionan una manera de referir a un objeto
dentro de un paquete particular.
Por ejemplo, t() es el transpose función en R, pero los usuarios podrían definir su
función propia nombró t. Namespaces Impide la definición del usuario de tomar precedencia,
y rompiendo cada función que prueba a transpose una matriz.
Hay dos operadores que trabajo con namespaces. El operador de colon doble ::
selecciona definiciones de un particulares namespace. En el ejemplo encima, el transpose la
función siempre será disponible cuando base::t, porque está definido en el paquete
de base. Sólo funciona aquello está exportado de el paquete puede ser recuperado de este
modo..
El operador de colon triple ::: puede ser visto en unos cuantos sitios en R código: actúa
como el operador de colon doble pero también deja acceso a escondido objeta. Los usuarios
son más probablemente para utilizar el getAnywhere() función, el cual busca paquetes
múltiples.
Los paquetes son a menudo inter-dependientes, y cargando un puede causar otros para
ser automáticamente cargados. Los operadores de colon describieron encima también
causará automático cargando de el paquete asociado. Cuándo paquetes con namespaces
está cargado automáticamente no son añadidos a la lista de búsqueda.
79
14 OS Instalaciones
R Tiene instalaciones bastante extensas para acceder el OS debajo cuál está corriendo:
esto lo deja para ser utilizado como scripting lengua y que la capacidad es mucho
utilizada por R él, por ejemplo para instalar paquetes.
Porque R necesidad de guiones propios para trabajar a través de todas las plataformas, el
esfuerzo considerable ha ido a hacer el scripting instalaciones cuando plataforma-
independiente cuando es factible.
14.2 Filepaths
Con unas cuantas excepciones, R confía en el subyacente OS funciones para manipular
filepaths. Algunos aspectos de este está dejado para depender de el OS, y , incluso abajo
a la versión del OS. hay POSIX estándares para cómo OSes tendría que interpretar
filepaths y muchos R los usuarios suponen POSIX conformidad: pero Windows no
reclama para ser compliant y otro OSes puede ser menos de completamente compliant.
El siguiente es algunos emite cuáles han sido encontrados con filepaths.
• POSIX filesystems Es caso-sensible, tan foo.png Y Foo.PNG Es archivos diferentes.
Aun así, el defaults encima Windows y macOS es para ser caso-insensible, y GORDO
filesystems (com- monly utilizado en almacenamiento desmontable) no es normalmente
caso-sensible (y todo filepaths puede ser mapped para bajar caso).
• Casi todo el Windows' OS los servicios apoyan el uso de cuchillada o backslash como el
filepath separator, y R convierte las excepciones sabidas a la forma requerida por
Windows.
Capítulo 14: OS 80
instalaciones
bzip2 y xz las utilidades son también disponibles. Estos generalmente consiguen índices
más altos de compresión (dependiendo de el archivo, mucho más alto) a expensas de
descompresión más lenta y mucha compresión más lenta.
Hay alguna confusión entre xz y lzma compresión (ve https://en.wikipedia.
org/wiki/Xz Y https://en.wikipedia.org/wiki/lzma ): R puede leer los archivos comprimieron por
más versiones de cualquier..
Archivos de archivo son archivos solos qué contener una colección de archivos, la
mayoría de comunes unos siendo ‘tarballs' y la cremallera archiva tan utilizada para distribuir
R paquetes. R Puede listar y desempaquetar ambos (ve funciones untar y unzip ) y crear
ambos (para cremallera con la ayuda de un programa externo).
82
Apéndice B Invocando R
Usuarios de R encima Windows o macOS tendría que leer el OS-sección concreta primero,
pero orden-uso de línea es también apoyado.
--Codificando=enc
Especificar el codificando para ser supuesto para entrada de la consola o stdin .
Estas necesidades de ser un codificando sabidos a iconv : ver su página de
ayuda. (--Codificando enc es también aceptó.) La entrada es re-
codificado al locale R está corriendo en y necesidades de ser representables en
el últimos está codificando (así que p. ej. puedes no re-codificar texto griego en
un francés locale a no ser que aquel locale utiliza el UTF-8 codificando).
RHOME Imprime el camino al R “directorio de casa” a salida y producción estándares
éxito- plenamente. Aparte del frente-guión de concha del fin y la página de
hombre, R la instalación pone todo (executables, paquetes, etc.) a este directorio.
--Salvar
--No-salvar
Control si conjuntos de dato tendrían que ser salvados o no al final del R
sesión. Si tampoco está dado en una sesión interactiva, el usuario está pedido
el comportamiento deseado cuándo acabando la sesión con q() ; en uso no
interactivo uno de este mosto ser especificado o implicado por algunos otra
opción (ve abajo).
--No-environ
No lee cualquier archivo de usuario para poner variables de entorno.
--No-sitio-archivo
No lee el sitio-perfil ancho en startup.
--No-init-archivo
No lee el perfil del usuario en startup.
--Restaurar
--No-restaurar
--No-restaurar-datos
Control si salvó imágenes (archivo .RData En el directorio donde R estuvo
empezado) tendría que ser restaurado en startup o no. El default es para restaurar.
(--No-restaurar implica todo el concreto --no-restaurar-* opciones.)
--No-restaurar-historia
Control si el archivo de historia (normalmente archivo .Rhistory En el
directorio donde R estuvo empezado, pero puede ser puesto por la variable de
entorno R_HISTFILE) tendría que ser restaurado en startup o no. El default es
para restaurar.
--No-Rconsole
(Windows único) Impide cargar el Rconsole archivo en startup.
--
Vainilla Combina --no-salvar, --no-environ, --no-sitio-archivo, --no-init-archivo y --no-
restaurar. Debajo Windows, esto también incluye --no-Rconsole.
-f
Archivo
--Archivo=de archivo
(No Rgui.exe) TUnke entrada from file: ‘-' medio stdin. Implica --no-salvar a no ser que
--Salva ha sido puesto. En un Unix-parecido, concha metacharacters tendría que ser
evitado en
Archivo (pero los espacios están dejados).
-e Expresión
(No Rgui.exe) Expresión de uso como una línea de entrada. Uno o más -e las
opciones pueden ser utilizadas, pero no junto con -f o --archivo . Implica --no-
salvar a no ser que --salva ha sido puesto. ( Hay un límite de 10,000 bytes en
la longitud total de expresiones utilizó de este modo. Las expresiones que
contienen espacios o concha metacharacters necesitará ser citado.)
Apéndice B: 87
Invocando R
--No-readline
(UNIX único) Apaga orden-tacha editar vía readline. Esto es útil cuándo corrido-
ning R de dentro de Emacs utilizando el ESS (“Emacs Habla Estadística”)
paquete. Ve Apéndice C [La orden-editor de línea], página 92, para más
información. Orden- tacha editar está habilitado para default uso interactivo (ve --
interactivo). Esta opción también afecta tilde-expansión: ver la ayuda para
camino.Expande.
--min-vsize=N
--min-nsize=N
Para uso experto sólo: puesto las medidas de gatillo iniciales para colección de basura
de vector heap (en b ytes) y c ons cells (number) respectively. Sufijo ‘M'
specifies megabytes o millones de células respectivamente. El defaults es 6Mb y
350k respectivamente y también puede ser puesto por variables de entorno
R_NSIZE y R_VSIZE .
--max-ppsize=N
Especificar la medida máxima de la protección de puntero stack como N
ubicaciones. Este defaults a 10000, pero puede ser aumentado para dejar
grande y complicó cálculos para ser hechos. Actualmente el valor máximo
aceptó es 100000.
--max-mem-Medida=N
(Windows único) Especifica un límite para la cantidad de memoria para ser
utilizada ambos para R objetos y áreas laborables. Esto está puesto por
default al más pequeño de la cantidad de RAM física en la máquina y para
32-mordió R, 1.5Gb1, y tiene que ser entre 32Mb y el máximo dejado en
aquella versión de Windows..
--Tranquilo
--Silencioso
-q No imprime fuera de el copyright inicial y mensajes bienvenidos.
--Marca de esclavo R correr tan tranquilamente tan posible. Esta opción está pretendida
para apoyar programas qué uso R para computar resultados para ellos. Implica --
tranquilo y --no-salvar .
--Interactivo
(UNIX único) Afirma que R realmente está siendo corrido interactivamente incluso
si la entrada ha sido redirigida: uso si la entrada es de un FIFO o tubo y alimentado
de un programa interactivo. (El default es para deducir que R está siendo corrido
interactivamente si y sólo si stdin está conectado a un terminal o pty .) Utilizando
-e, -f o --el archivo afirma uso no interactivo incluso si --interactivo
está dado.
Nota que esto no gira encima orden-tacha editar.
--ess (Windows único) Puso Rterm arriba para uso por R-inferior-modo en ESS ,
incluyendo afirma- ing uso interactivo (sin la orden-editor de línea) y ningún
buffering de stdout .
--Verboso
Impresión más información aproximadamente progreso, y en particular puesto R la opción
verbosa a
CIERTO. R El código utiliza esta opción para controlar la impresión de mensajes de
diagnóstico.
--Nombre=de depurador
-d Nombre (UNIX único) Corrido R a través de nombre de depurador. Para más depuradores
(las excepciones son valgrind y versiones recientes de gdb ), opciones de línea
de orden más lejanas están desatendidas, y en cambio tendría que ser dado cuándo
empezando el R ejecutable de dentro del depurador.
--gui=Tipo
-Tipo de g (UNIX único) tipo de Uso como interfaz de usuario gráfico (nota que esto
también incluye en- teractive gráfico). Currently, possible values para t ype es
‘X11' (el default) y,
Apéndice B: 88
Invocando R
1
2.5Gb en versiones de Windows aquel soporte 3Gb por proceso y tener el soporte habilitó: ver el rw-FAQ
Q2.9; 3.5Gb encima la mayoría de 64-mordió versiones de Windows.
Apéndice B: 89
Invocando R
2.90 3.10 3.40 3.40 3.70 3.70 2.80 2.50 2.40 2.40 2.70 2.20
5.28 3.37 3.03 3.03 28.95 3.77 3.40 2.20 3.50 3.60 3.70 3.70
Y stdin() refiere al archivo de guión para dejar tal uso tradicional. Si quieres referir al proceso
stdin, uso "stdin" como conexión de archivo, p. ej. escáner("stdin", ...).
Otro wuny para escribir archivos de guión ejecutable (suggested by Fcorrióçois Pinard)
es para utilizar un élre a documento le gusta
#!/Cubo/sh
[Variables de entorno pueden ser
puestas aquí] R --esclavo [otras
opciones] <<EOF
R El programa va aquí...
EOF
Pero aquí stdin() refiere a la fuente de programa y stdin "" no será utilizable.
Los guiones cortos pueden ser pasados a Rscript en la orden-línea vía el -e bandera. (Los
guiones vacíos no son aceptados.)
Nota que en un Unix-parecido la entrada filename (como foo.R) No tendría que
contener espacios ni concha metacharacters.
92
C.1 Preliminaries
Cuándo el GNU readline la biblioteca es disponible en el tiempo R está configurado para
recopilación un- der UNIX, un inbuilt editor de línea de la orden que deja recuerda,
editando y re-la sumisión de órdenes previas está utilizada. Nota que otras versiones de
readline existir y puede ser utilizado por el inbuilt editor de línea de la orden: esto utilizó
para pasar en macOS.
Pueda ser inutilizado (útil para uso con ESS 1) utilizando el startup opción --no-readline.
Vientoows versions de R hunve un poco más sencillo comhombred-line editando: ve
‘Console' bajo la ‘Ayuda' menu de el GUyo, y el archivo README.Rterm Para orden-tacha editar
bajo Rterm.exe.
Cuándo utilizando R con GNU 2 readline capacidades, las funciones describieron abajo es
disponible, así como otros (probablemente) documentó en hombre readline o info
readline en vuestro sistema.
Muchos de este uso cualquier Control o Meta caracteres. Caracteres de control, como
Control-m, está obtenido por aguantar el CTRL abajo mientras pulsas el m llave, y está
escrito cuando C-m abajo. Meta Caracteres, como Meta-b, está escrito por aguantar abajo
META3 y prensado b, y escrito cuando M-b en el siguiente. Si vuestra terminal no tiene un
META la llave habilitó, todavía puedes escribir Meta los caracteres que utilizan secuencias
de dos caracteres que empiezan con ESC . Así, para introducir M-b, podrías escribir ESCb.
El ESC secuencias de carácter son también dejadas en terminales con reales Meta llaves.
Nota que el caso es significativo para Meta caracteres.
Algunos pero no todas las versiones 4 de readline reconocerá resizing de la ventana
terminal tan esto es más evitó.
Encima más terminales, también puedes utilizar el arriba y abajo llaves de flecha en vez
de C-p y C-n , respectivamente.
Editando y re-sumisión
El texto Inserta texto en el cursor.
C-f el texto Anexa texto después del cursor.
DEL Elimina el carácter anterior (dejado del cursor).
C-d Eliminar el carácter bajo el cursor.
M-d Eliminar el resto de la palabra bajo el cursor, y “salvarlo..
C-k Elimina de cursor para acabar de orden, y “salvarlo..
C-y Inserta (yank) el último “texto” salvado aquí.
C-t Transpose el carácter bajo el cursor con el próximo.
M-l Cambio el resto de la palabra para bajar
caso. M-c Cambio el resto de la palabra a caso
superior. RET Re-Entregar la orden a R.
El final RET rescinde la línea de orden que edita secuencia.
El readline las encuadernaciones claves pueden ser personalizadas en la manera habitual vía
un ~/.inputrc Archivo. Estos customizations puede ser condicionado encima aplicación R,
aquello es por incluir a una sección le gusta
$Si R
"\C-xd": "q('ningún')\n"
$endif
94
! ?
!.................................................. 9 ?.................................................. 4
!= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 ?? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
% ^
* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
^.................................................. 8
o .......................................................................... 21
& |
|.................................................. 9
&.................................................. 9 || . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
&& . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
* ~
*.................................................. 8 ~ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
+ Un
+.................................................. 8 abline ................................................................ 66
As ........................................................................ 61
– Añade1 ..................................................................... 56
anova ................................................................. 54, 55
-.................................................. 8 aov............................................................................ 55
aperm ....................................................................... 21
. Variedad ........................................................... 20
Cuando.Dato.Marco ......................................... 27
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Cuando.Vector ................................................. 24
.Primer .................................................... 48
Sujeta ................................................................ 28
.Último .......................................................... 48
attr ...................................................... 14
Atributos ....................................................... 14
/ avas...................................................................... 61
/.................................................. 8 Axial ................................................................. 67
: B
:.................................................. 8 boxplot ................................................................ 37
:: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 Rotura .................................................................. 41
::: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 bruto ................................................................. 61
<
<.................................................. 9
C
<<- . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 c ................................................................7, 10, 24, 27
<= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 cbind .................................................................... 24
coef ...................................................................... 54
Coeficientes .................................................. 54
= Contorno ............................................................. 65
== . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Contrastes ..................................................... 53
coplot ................................................................ 64
> cos ..........................................................................8
crossprod ........................................................ 19, 22
>.................................................. 9 Corte ................................................................. 25
>= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 C ........................................................................................ 53
Apéndice D: Función y índice variable 95
D K
Dato.................................................................. 31 ks.Prueba .....................................................36
Dato.Marco ...................................................... 27
Densidad .......................................................... 34 L
det .................................................................... 23
detach................................................................... 28 Leyenda ................................................................ 66
Determinante ................................................... 23 Longitud ........................................................... 8, 13
dev.Lista..................................................... 75 Niveles ........................................................... 16
dev.Luego ............................................................ 75 Líneas ............................................................. 66
dev.Fuera ......................................................... 75 Lista ............................................... 26
dev.prev ............................................................... 75 lm ...................................................................................... 54
dev.Conjunto ................................................... 75 lme ........................................................................... 61
deviance ............................................................... 54 locator ................................................................68
diag ...................................................................... 22 loess ...................................................................61
dim ........................................................................... 18 Registro .................................................................. 8
dotchart ............................................................ 65 lqs ................................................................... 61
Gota1 ....................................................................... 56 lsfit ................................................... 23
E M
ecdf ...................................................................... 35 mars.......................................................................... 61
Edita .............................................................. 32 max ..................................................................................... 8
eigen .................................................................... 23 Malo .................................................................................... 8
Más................................................................ 40 Métodos ................................................................... 49
Error ................................................................. 55 min ............................................................................. 8
Ejemplo ...................................................................... 4 Modo ................................................................................ 13
exp ............................................................................. 8
N
F NaN ..................................................................................... 9
NA ....................................................................................... 9
Factor ............................................................ 16 ncol ....................................................................... 22
FALSO ............................................................................... 9 Luego ................................................................... 41
fivenum ................................................................... 34 nlm ................................................................ 59, 60, 61
Para ............................................................... 40 nlme ......................................................................... 61
Fórmula ............................................................... 54 nlminb ...................................................................... 59
Función ............................................................ 42
nrow ......................................................................... 22
F .......................................................................................... 9
O
G
optim ........................................................................ 59
getAnywhere ............................................................ 49 Orden .................................................................. 8
Consigue3método ................................................... 49 Ordenado .............................................................. 17
glm ........................................................................... 57 Exterior..............................................................21
H P
Ayuda .................................................................... 4 Pares ............................................................... 64
Ayuda.Búsqueda ............................................... 4 par......................................................................... 68
Ayuda.Inicio ................................................ 4 Pasta ..................................................................10
hist .......................................................... 34, 64 Pdf ........................................................................ 74
persp ..................................................................... 65
Parcela ......................................................... 54, 63
Yo pmax ................................................................................... 8
Identifica ....................................................... 68 pmin ........................................................................... 8
Si ................................................... 40 png ........................................................................... 74
ifelse ........................................................... 40 Puntos ................................................................66
Imagen ..................................................................... 65 Polígono .................................................................. 66
is.na ................................................................. 9 Posdata ........................................................... 74
Es.nan............................................................ 10 Pronostica ..........................................................54
Impresión ....................................................... 54
prod ........................................................................ 8
J
jpeg ..................................................................... 74
Apéndice D: Función y índice variable 96
Q Resumen............................................................. 34, 54
qqline .............................................................. 35, 64 svd............................................................................ 23
qqnorm ................................................................ 35, 64
qqplot ................................................................... 64 T
qr .......................................................................... 23
t ................................................. 21
Cuarzo .............................................................. 74
t.Prueba ........................................... 37
Mesa ............................................................ 20, 25
R Bronceado .......................................................... 8
tapply .................................................................16
Gama ..................................................................... 8 Texto ............................................................. 66
rbind ................................................................. 24 Título .............................................. 67
Leído.Mesa ................................................... 30 Árbol .............................................................. 62
rep .......................................................................... 9 T .......................................................................................... 9
Repite ............................................................... 41 CIERTO .............................................................................. 9
resid ............................................................... 54
residuals ........................................................ 54
rlm ........................................................................... 61 U
rm ....................................................................................... 6 unclass .............................................................. 14
Actualización ...................................................... 55
S
Escáner ................................................................ 31
V
sd ............................................................................. 17 var..................................................................... 8, 17
Búsqueda ............................................................. 29 var.Prueba ...................................................38
seq .......................................................................... 8 vcov.......................................................................... 55
shapiro.Prueba .............................................. 36 Vector ................................................................. 7
Pecado ............................................................. 8
Fregadero ........................................................... 5 W
Soluciona ......................................................... 22
Clase ............................................................... 8 Mientras .............................................................. 41
Fuente ................................................................ 5 wilcox.Prueba ................................................ 38
Ruptura ................................................. 40 Ventanas ................................................................... 74
sqrt .................................................................. 8
Raíz ......................................................................... 34 X
Paso................................................................. 54, 56 X11 ................................................................................... 74
Suma................................................................................... 8
97
Un K
Accediendo builtin datasets ................................ 31 Kolmogorov-Smirnov Prueba ................................ 36
Modelos aditivos .................................................... 61
Análisis de varianza .............................................. 55
Funciones de aritmética y operadores ................. 7 L
Variedades .............................................................. 18 Menos cuadra caber................................................ 23
Asignación ................................................................ 7 Ecuaciones lineales ................................................. 22
Atributos .............................................................. 13 Modelos lineales ..................................................... 54
Listas ....................................................................... 26
B Local aproximando regresiones ............................. 61
Bucles y ejecución condicional ............................ 40
Operadores binarios ................................................ 43
Parcelas de caja ....................................................... 37
M
C Matrices ................................................................... 18
Multiplicación matricial ......................................... 22
Vectores de carácter ............................................ 10
Máximo likelihood .................................................. 61
Clases .................................................................. 14, 48
Valores desaparecidos ................................................ 9
Concatenando listas ................................................ 27
Modelos mixtos ....................................................... 61
Contrastes ............................................................ 53
Declaraciones de control..................................... 40
CRAN...................................................................... 77 N
Personalizando el entorno ...................................... 48
Nombró argumentos ............................................... 43
Namespace ............................................................... 78
D Nonlinear Menos cuadra ........................................ 59
El dato enmarca ...................................................... 27
Default Valora ............................................................ 43
Valoración de densidad .......................................... 34 O
Determinantes ......................................................... 23 Orientación de objeto .......................................... 48
Desviando entrada y producción ......................... 5 Objetos .................................................................... 13
Gráfico dinámico .................................................... 76 Uno- y dos-la muestra prueba ............................... 36
Ordenó factores ................................................. 16, 53
Productos exteriores de variedades .................... 21
E
Eigenvalues Y eigenvectors .................................. 23
Empírico CDFs ....................................................... 35 P
Paquetes .................................................................. 2, 77
Distribuciones de probabilidad ........................... 33
F
Factores ................................................................. 16, 53
Familias ................................................................... 57 Q
Formulae ..................................................................... 51 QR Descomposición ............................................... 23
Quantile-quantile Parcelas ..................................... 35
G
Modelos lineales generalizados ............................. 56 R
Generalizado transpose de una variedad .............. 21
Funciones genéricas ............................................... 48 Leyendo dato de archivos ..................................... 30
Conductores de dispositivo del gráfico ................. 74 Reciclando regla ................................................. 7, 20
Parámetros de gráfico ......................................... 68 Secuencias regulares ................................................. 8
Agrupó expresiones ................................................ 40 Sacando objetos ........................................................ 6
Regresión robusta ................................................... 61
Yo
Indexación de y por variedades ............................. 18
Vectores de indexación .......................................... 10
Apéndice E: índice de 98
Concepto
S U
Alcance .................................................................... 46 Actualizando cupo modelos ................................ 55
Camino de búsqueda .............................................. 29
Shapiro-Wilk Prueba .............................................. 36
Descomposición de valor singular ......................... 23
V
Modelos estadísticos .............................................. 51 Vectores .........................................................................7
Estudiantil t prueba ................................................. 37
W
Wilcoxon Prueba ................................................... 38
T Workspace.................................................................. 5
Tabulación ........................................................... 25 Escribiendo funciones ............................................. 42
Árbol-basó modelos ............................................... 62
99
Apéndice F Referencias
D. M. Bates Y D. G. Vatios (1988), Nonlinear Análisis de Regresión y Sus Aplicaciones. John
Wiley & Hijos, Nueva York.
Richard Un. Becker, John M. Cuartos y Allan R. Wilks (1988), El Nuevo S Lengua. Chap- Sala
& de hombre, Nueva York. Este libro es a menudo llamó el “Libro Azul ”.
John M. Cuartos y Trevor J. Hastie eds. (1992), Modelos Estadísticos en S. Chapman &
Sala, Nueva York. Esto es también llamó el “Libro Blanco ”.
John M. Cuartos (1998) Programación con Datos. Salmer, Nueva York. Esto es también
llamó el “Green Bo vale ”.
Un. C. Davison Y D. V. Hinkley (1997), Bootstrap Métodos y Sus Aplicaciones, Cambridge
Prensa Universitaria.
Annette J. Dobson (1990), Una Introducción a Modelos Lineales Generalizados,
Chapman y Sala, Londres.
Peter McCullagh y John Un. Nelder (1989), Modelos Lineales Generalizados. Segunda
edición, Chap- hombre y Sala, Londres.
John Un. Arroz (1995), Dato y Estadística Matemáticos Análisis. Segunda edición. Duxbury
Prensa, Belmont, CA.
S. D. Silvey (1970), Inferencia Estadística. Pingüino, Londres.