Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingenierı́a Electrónica
Materia Clave
Probabilidad y Estadı́stica AEE-1051 IE4A
Unidad 1
Estadı́stica descriptiva
Portafolio 1
Alumnos:
1. Introducción 1
2. Antecedentes 1
2.1. R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
4. Conclusiones 9
5. Referencias 10
i
Índice de figuras
1. Código en lenguaje R del ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . 2
2. Gráfico circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3. Código en lenguaje R del ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . 4
4. Gráfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5. Código en lenguaje R del ejemplo 1 (grafico circular y de barras) . . . . . . . 5
6. Comaparación entre gráfico circular y de barras . . . . . . . . . . . . . . . . 5
7. Código en lenguaje R del ejemplo 3 (grafico de barras) . . . . . . . . . . . . 6
8. Gráfico de barras de una tabla bidimencional . . . . . . . . . . . . . . . . . . 6
9. Código en lenguaje R del ejemplo 4 (histograma) . . . . . . . . . . . . . . . 7
10. Histograma (función de frecuencia acumulada) . . . . . . . . . . . . . . . . . 7
11. Código en lenguaje R del ejemplo 5 (gráfico de dispersión) . . . . . . . . . . 8
12. Gráfico de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
ii
Índice de tablas
iii
1. Introducción
2. Antecedentes
2.1. R
1
3. Procedimiento y descripción de actividades
3.1. Parte A
Seleccionar uno de los dos primeros capı́tulos del libro de Watkins y reproducir (utilizando
R) los diagramas allı́ presentados. Anotando en cada caso una reflexión de la actividad.
males <− c ( 5 8 , 1 8 , 1 6 , 7 , 1 )
p i e ( males )
c o l o r s <− c ( ” w h i t e ” , ” b l u e v i o l e t ” , ” cyan3 ” , ” d a r k o r c h i d 1 ” , ” brown4
” )
# Se c a l c u l a e l p o r c e n t a j e para cada c a t e g o r i a .
m a l e l a b e l s <− round ( males / sum ( males ) ∗ 1 0 0 , 1 )
# El 1 i n d i c a e l redondeo .
m a l e l a b e l s <− p a s t e ( m a l e l a b e l s , ” %”, s e p = ” ” )
# Se a g r e g a un e s p a c i o y s i m b o l o de p o r c e n t a j e .
t i t l e = p a s t e ( ” P r o p o r t i o n o f AIDS Cases among Males by\n ” ,
” T r a n s m i s s i o n Category Diagnosed − USA 2005” )
# Crea un g r a f i c o c i r c u l a r con un t i t u l o d e f i n i d o y c o l o r e s
personalizados
# y leyenda .
p i e ( males , main = t i t l e , c o l = c o l o r s , l a b e l s = m a l e l a b e l s ,
cex = 0 . 8 )
maleLegend = c ( ” Male−male c o n t a c t ” , ” I n j e c t i o n drug u s e (IDU) ” ,
” High−r i s k h e t e r o s e x u a l c o n t a c t ” ,
” Male−male c o n t a c t and IDU” , ” Other ” )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 8 , f i l l = c o l o r s )
2
Se puede observar el resultado de este programa en la figura 3.1.1
Este tipo de grafico es visualmente agradable, pero es deficiente para juzgar áreas relativas
(porcentajes) al aumentar las categorı́as que se están analizando o mostrando.
3
b a r p l o t ( males )
f e m a l e s <− c ( 0 , 7 1 , 2 7 , 0 , 2 )
h i v <− a r r a y ( c ( males , f e m a l e s ) , dim = c ( 5 , 2 ) )
# Genera l o s g r a f i c o s l a d o a l a d o y c r e a l a s e t i q u e t a s .
b a r p l o t ( hiv , main = t i t l e , y l a b = ” p e r c e n t ” , b e s i d e = T,
names . a r g = c ( ” Males ” , ” Females ” ) , c o l = c o l o r s )
l e g e n d ( x = 3 , y = 7 0 , l e g e n d = maleLegend , cex = 0 . 8 , f i l l =
colors )
Grafico generado
Para que sea más notorio la diferencia entre los dos tipos de gráficos, se compara el mismo
ejemplo con diferente gráficos
4
b a r p l o t ( males , main = t i t l e , c o l = c o l o r s )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 8 , f i l l = c o l o r s )
Como se muestra en la Figura 3.1.2, un gráfico de barras es más recomendable que los gráficos
circulares cuando se está mostrando datos categóricos ya que se muestran de una manera
más clara sus áreas relativas.
Tablas bidireccionales
En una tabla bidireccional, el total de las filas y columnas dan las distribuciones marginales.
5
Podemos crear un gráfico de barras segmentado de la siguiente manera
smoking<−matrix ( c ( 4 0 0 , 1 3 8 0 , 4 1 6 , 1 8 2 3 , 1 8 8 , 1 1 6 8 ) , n c o l =3)
colnames ( smoking )<−c ( ” 2 p a r e n t s ” , ” 1 p a r e n t ” , ”0 p a r e n t s ” )
rownames ( smoking )<−c ( ” smokes ” , ” d o e s not smoke ” )
smoking
b a r p l o t ( smoking , l e g e n d=rownames ( smoking ) )
Su grafica de barras se muestra en la Figura 3.1.2, como se puede apreciar esta tabla no es
posible representarse en un gráfico circular
6
# Histogram o f a g e s o f p r e s i d e n t s a t i n a u g u r a t i o n , p . 11
age <− c ( 5 7 , 6 1 , 5 7 , 5 7 , 5 8 , 5 7 , 6 1 , 5 4 , 6 8 , 5 1 , 4 9 , 6 4 , 5 0 , 4 8 , 6 5 , 5 2 , 5 6 , 4 6 ,
54 ,49 ,51 ,47 ,55 ,55 ,54 ,42 ,51 ,56 ,55 ,51 ,54 ,51 ,60 ,61 ,43 ,55 ,
56 ,61 ,52 ,69 ,64 ,46 ,54 ,47 ,70 )
h i s t ( age , b o r d e r = ” d a r k r e d ” ,
main = c ( ”Age o f P r e s i d e n t s a t t h e Time o f I n a u g u r a t i o n ” ) )
# C a l c u l a a y g r a f i c a l a f u n c i o n de f r e c u e n c i a acumulada .
p l o t ( s o r t ( age ) , 1 : l e n g t h ( age ) / l e n g t h ( age ) ,
type = ” s ” , ylim = c ( 0 , 1 . 0 5 ) ,
main = ”Age o f P r e s i d e n t s a t t h e Time o f I n a u g u r a t i o n ” ,
sub = ” E m p i r i c i a l Cumulative D i s t r i b u t i o n Function ” ,
x l a b = ” age ” , y l a b = ” c u m u l a t i v e f r a c t i o n ” ,
c o l = ” darkgreen ” )
grid ()
7
3.1.4. Gráfico de dispersión
femur<−c ( 3 8 , 5 6 , 5 9 , 6 4 , 7 4 )
humerus<−c ( 4 1 , 6 3 , 7 0 , 7 2 , 8 4 )
p l o t ( femur , humerus , main=c ( ” Bone Lengths f o r Archeopteryx ” ) )
8
4. Conclusiones
9
5. Referencias
[1]
10