Estadistica Sof

FUNCIONES GRAFICAS
LOS GRAFICOS EN R
DE ALTO NIVEL
R dispone de múltiples funciones diseñadas
Estas funciones son las que generan gráficos
para la representación gráfica de datos.
completos. Entre las más utilizadas podemos
Estas funciones se dividen en dos grandes citar plot() (gráficos de nubes de puntos, entre
grupos: funciones gráficas de alto nivel y de otros), hist() (histogramas), barplot() (diagramas
bajo nivel. La diferencia fundamental es que de barras), boxplot() (diagramas de caja y
las funciones de alto nivel son las que bigote), pie() (diagrama de sectores) o pers()
generan gráficos completos, mientras que (superficies en 3D). Todas estas funciones
las de bajo nivel se limitan a añadir disponen de multitud de argumentos que
elementos a un gráfico existente (por tanto permiten controlar las etiquetas de los ejes, sus
límites, títulos, tamaño, colores, etc.:
creado por una función de alto nivel).
Funciones gráficas de bajo
nivel:
Permiten añadir líneas, puntos, etiquetas… a un gráfico ya existente. Son de gran utilidad para completar un
gráfico. Entre estas funciones cabe destacar:
• lines(): Permite añadir lineas (uniendo puntos concretos) a una gráfica ya existente.
• abline(): Añade lineas horizontales, verticales u oblicuas, indicando pendiente y ordenada.
• points(): Permite añadir puntos.
• legend(): Permite añadir una leyenda.
• text(): Añade texto en las posiciones que se indiquen.
• grid(): Añade una malla de fondo.
• title(): permite añadir un título o subtítulo.
Argumentos comunes a las funciones gráficas de alto
y bajo nivel
Los siguientes argumentos opcionales son comunes a muchas funciones gráficas de alto y bajo nivel. Sus valores por defecto pueden obtenerse
ejecutando la función par(). Se puede encontrar el significado y valores posibles de cada uno de estos argumentos (y muchos más) ejecutando
help(par).
• pch: Indica la forma en que se dibujaran los puntos (círculo, cuadrado, estrella, etc). El listado de valores y formas disponibles puede verse
mediante help(points)
• lty: Indica la forma en que se dibujan las líneas (continua, a trazos, …).
• lwd: Ancho de las líneas.
• col: Color usado para el gráfico (ya sea para puntos, líneas…). Puede vers un listado completo de los colores disponibles en R ejecutando la
función colors(). help(colors) explica como obtener aún más colores. Este documento contiene una muestra de cada color.
• font: Fuente a usar en el texto.
• las: Cambia el estilo de las etiquetas de los ejes (0 paralelo a los ejes, 1 siempre horizontales, 2, perpendiculares a los ejes, 3 siempre verticales)
Ejemplos de funciones gráficas
plot()
Esta función ofrece muchas variantes
dependiendo del tipo de objeto al que se
aplique. El caso más simple corresponde
a la representación de dos variables x e y.
En tal caso, plot(x,y) representa un
diagrama de dispersión de puntos de y
frente a x.
hist()
Esta función permite dibujar histogramas de

frecuencias para variables continuas. Por
ejemplo, el histograma de los niveles de
felicidad en los distintos países de la
muestra se obtiene fácilmente como:
hist(Happiness,col="darkolivegreen1")
barplot()()
Se utiliza para dibujar diagramas de

barras. El siguiente ejemplo muestra el
número de países en cada una de las 7
regiones en que se dividió el planeta
para el estudio de los niveles de
felicidad:
barplot(table(Region),xlab="Region",main=
"Happiness level by region",
col=rainbow(10))
pie()
Aporta la misma información que el

diagrama de barras, pero en forma de
diagrama de sectores:
pie(table(Region))
Funciones de localización e identificación
de puntos:
La función locator(): al situar el cursor sobre

la ventana de gráficos, cada vez que
pulsemos el botón izquierdo del ratón, se
almacenan en memoria las coordenadas del
punto que marquemos. Al pulsar la tecla <
ESC >, R nos muestra dichas coordenadas
en la consola
La función identify() permite identificar con

el ratón a qué posiciones dentro del conjunto
de datos corresponden los puntos que
señalemos en un gráfico
DISTRIBUCIÓN NORMAL
Las funciones relacionadas con la distribución normal se
Definición: describen en la siguiente tabla:
• La distribución normal o gaussiana es la
distribución más conocida e importante en
Estadística. En este tutorial aprenderás qué
son y cómo utilizar las funciones dnorm,
pnorm, qnorm y rnorm en R y las diferencias
entre ellas. En consecuencia, aprenderás
cómo crear y dibujar la distribución normal
en R o RStudio, calcular las probabilidades
bajo las curvas, los cuantiles, generación de
números pseudoaleatorios normales e
incluso cómo sombrear un área específica
bajo una curva normal.
Aunque trataremos en detalle cada función en su correspondiente
sección, en la siguiente ilustración puedes ver la relación entre las
funciones dnorm, pnorm y qnorm:
PRUEBA DE HIPÓTESIS
Definición:
• Una hipótesis es una decisión que toman los investigadores en base a los datos de la
población recolectados.
• Para realizar la prueba de hipótesis, se toma una muestra aleatoria de datos de la
población y se realiza la prueba. Según los resultados de las pruebas, la hipótesis se
selecciona o se rechaza.
• Para realizar la prueba T en R, se requieren datos distribuidos normalmente. Esta
prueba se usa para probar la media de la muestra con la población. Por ejemplo, la
altura de las personas que viven en un área es diferente o idéntica a la de otras
personas que viven en otras áreas.
Parámetros:
x: representa un vector numérico de datos
• mu: representa el valor verdadero de la media
• Para conocer más parámetros opcionales de t.test() , pruebe el siguiente comando:
ayuda("t.prueba")
EJEMPLO:
# Definición de vector de muestra
x <- norma(100)
# Prueba T de una muestra prueba
t(x, mu = 5)
datos: x
t = -49.504, gl = 99, valor p < 2.2 e-16
hipótesis alternativa: la verdadera media no es igual a 5
Intervalo de confianza del 95 por ciento:
-0.1910645 0.2090349
estimaciones de muestra: media de x 0.008985172
Chi- Cuadrado
Definición: Requerimientos para trabajar con la
distribución de chi-cuadrado:
El estadístico de chi-cuadrado, es útil • La muestra debe ser tomadas al azar
cuando estamos trabajando con • Variables medidas deben ser independientes
variables nominales, categóricas o • Los datos deben ser reportados en frecuencias
estamos trabajando con alguna clase de absolutas (no porcentajes)
clasificación. • Valores / categorías de variables deben ser
mutuamente excluyentes
• Frecuencias observadas no deben pequeñas.
Importancia de la prueba chi-cuadrado en la

investigación
El cálculo estadístico de Chi-Cuadrado y su
Su fórmula es la que podemos observar
comparación con un valor crítico de la distribución
en la diapositiva, Donde: O= se refiere a
Chi-Cuadrado permite al investigador evaluar si
las frecuencias observadas y E=
los recuentos de celdas observados son
frecuencias esperadas.
significativamente diferentes de los recuentos de
celdas esperados

Estadistica Sof

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Sof

Cargado por

Copyright:

Formatos disponibles

FUNCIONES GRAFICAS

• lwd: Ancho de las líneas.

• font: Fuente a usar en el texto.

Esta función permite dibujar histogramas de

Se utiliza para dibujar diagramas de

Aporta la misma información que el

La función locator(): al situar el cursor sobre

La función identify() permite identificar con

Importancia de la prueba chi-cuadrado en la

También podría gustarte