Está en la página 1de 3

INSTRUCCIONES PARA USO DEL SOFTWARE R

1. Para la elaboración del vector se debe digitar así:


>nombre= c (dato_1, dato_2;… dato_n)
Donde: “nombre” es el nombre que se le quiere dar al vector que se va a crear “c” es la instrucción que le
indica a R que se está definiendo un vector, siempre debe escribirse en minúscula.
Si los datos pertenecen a una variable categórica, deben escribirse entre comillas cada uno de ellos.

2. Para la elaboración de la tabla de frecuencias:


>fi=table (“nombre”)
> hi=fi/sum(fi)
>Tabla=cbind (fi, hi)
>Tabla

Donde, la instrucción “table (.)” crea una tabla en la que se registran diferentes categorías del vector con su
respectiva frecuencia absoluta. La instrucción “sum (.)” realiza la suma de las frecuencias en la tabla creada, y el
cociente registrado en “hi” denota la frecuencia relativa de cada una de las categorías del vector; por su parte
“cbind” es la encargada de construir la tabla a partir de los datos almacenados en las variables “fi” y “hi”
dispuestos en las columnas.

3. Elaboración de gráficas: para la elaboración de tablas o diagrama circular, se usa el vector “nombre” que se haya
definido y la instrucción “barplot” para construir el diagrama de barras y “pie” para construir el diagrama circular.
Para el primer caso se tiene:
> barplot ( table (nombre), “xlab” “nombre de la variable”, ylab= “Frecuencia”)
La instrucción “table” determina las frecuencias de cada categoría del vector “nombre”, “xlab” permite poner
nombre al eje horizontal y “ylab” permite poner nombre al eje vertical.

4. De la misma manera para construir el diagrama circular se tiene:


>pie ( table ( nombre), main= “nombre de la variable”)

Con “table” como es el caso de “barplot” y “main” para ponerle nombre al gráfico.

Cuando el conjunto de datos es grande, resulta que la instrucción short realiza un arreglo ordenado del vector
de interés.

Ejemplo para la variable “edad”, se crea el vector, y dando la instrucción antes mencionada se procede al arreglo
ordenado así:
>sort ( edad )

5. Para calcular la media aritmética de un conjunto de datos la instrucción en el software será “mean(.) y se aplicará
al vector de interés en cuestión:
Para el caso de la edad por ejemplo se tiene que:
>mean (edad)

6. Para hallar la mediana se usa la función “median(.)” por ejemplo para el vector edad:
> median( edad )

7. La moda en R puede observarse a partir de la instrucción “table”


> table ( edad )
8. Medidas de posición: para encontrar cualquier percentil en R bastará con hacer uso de la instrucción “quantile”,
cuyos argumentos principales son el vector de datos numérico y el percentil o percentiles a calcular escritos en
forma decimal, por ejemplo el percentil 35 (P35) para un conjunto de datos estará dado por:
> quantile ( edad, 0.35)
Si se desea encontrar múltiples percentiles, bastará con formar un vector con los percentiles deseados en forma
decimal, entonces se procede así:
> quantile ( edad, c (0.1, 0.25, 0.5, 0.6, 0.75)

Medidas de dispersión:

9. Para encontrar el rango se utiliza la instrucción “range” la cual tiene como argumento principal el vector de los
datos, y devuelve los valores mínimo y máximo en dicho vector, una vez ejecutada esta instrucción se aplica la
diferencia entre sus datos con la instrucción “diff” para obtener el rango. Se procede así:
> range (edad)
> diff ( range (edad)

Otra manera es la siguiente: mediante las instrucciones “min” para hallar el mínimo y “max” para hallar el
máximo, las cuales requieren un argumento básico que es el vector de interés. Ejemplo:
> min ( edad )
> max ( edad )
> Rango=max( edad )-min (edad)
> rango

10. Rango intercuartílico: es la diferencia entre el tercer cuartil y el primer cuartil, se denota por Q, por tanto Q= Q3-
Q1.
En el software se encuentra mediante la instrucción “IQR(.)” de la librería básica stat, esta instrucción requiere
de un argumento básico que es el vector de datos, se hallaría así:
> IQR ( edad ).

11. Varianza y Desviación Estándar: se pueden hallar mediante las instrucciones “var(.)” y “sd(.) respectivamente, las
cuales tienen como argumento principal un vector numérico, se procede así:
> var ( edad )
> sd ( edad )

12. Coeficiente de variación: se hará uso de las instrucciones definidas para hallar la media “mean” y la desviación
estándar “sd”, y seguidamente se aplica la definición.
> sd ( edad )
> mean ( edad )
> CV=sd ( edad )/mean( edad )*100
> CV

OBSERVACIÓN: el software dispone de la instrucción “summary” la cual vuelve un resumen de algunas medidas
descriptivas de un conjunto de datos. Esta instrucción depende de un argumento principal constituido por un
vector numérico en el que se desea encontrar rápidamente los cuartiles, la media aritmética, el máximo y el
mínimo. Por ejemplo para un vector edad se tiene que:
> summary ( edad )
Min. 1st qu. Median Mean 3rd. Qu. Max.

También podría gustarte