Está en la página 1de 14

Tecnólogico Nacional de México

Instituto Tecnológico de Tijuana

Departamento de ingenierı́a Eléctrica y Electrónica

Ingenierı́a Electrónica

Materia Clave
Probabilidad y Estadı́stica AEE-1051 IE4A

Unidad 1
Estadı́stica descriptiva

Portafolio 1

Alumnos:

Nombre Número de control


Alvarez Ruiz Jonathan José 16212933
Pulido Luna Daniela Margarita 16212598
Sánchez Rivera Adrián 16212779

Profesor: M.C. Enrique Comer Barragan

Tijuana, BC, 7 de marzo de 2018.


Índice

1. Introducción 1

2. Antecedentes 1
2.1. R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3. Procedimiento y descripción de actividades 2


3.1. Parte A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.1.1. Gráficos circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
3.1.2. Gráficos de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.1.3. Histogramas y la función de distribución acumulativa empı́rica . . . . 6
3.1.4. Gráfico de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

4. Conclusiones 9

5. Referencias 10

i
Índice de figuras
1. Código en lenguaje R del ejemplo 1 . . . . . . . . . . . . . . . . . . . . . . . 2
2. Gráfico circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3. Código en lenguaje R del ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . 4
4. Gráfico de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5. Código en lenguaje R del ejemplo 1 (grafico circular y de barras) . . . . . . . 5
6. Comaparación entre gráfico circular y de barras . . . . . . . . . . . . . . . . 5
7. Código en lenguaje R del ejemplo 3 (grafico de barras) . . . . . . . . . . . . 6
8. Gráfico de barras de una tabla bidimencional . . . . . . . . . . . . . . . . . . 6
9. Código en lenguaje R del ejemplo 4 (histograma) . . . . . . . . . . . . . . . 7
10. Histograma (función de frecuencia acumulada) . . . . . . . . . . . . . . . . . 7
11. Código en lenguaje R del ejemplo 5 (gráfico de dispersión) . . . . . . . . . . 8
12. Gráfico de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

ii
Índice de tablas

iii
1. Introducción

2. Antecedentes

2.1. R

R es un lenguaje Orientado a Objetos: bajo este complejo termino se esconde la simplicidad y


flexibilidad de R. El hecho que R es un lenguaje de programación puede desaminar a muchos
usuarios que piensan que no tienen “alma de programadores”. Esto no es necesariamente
cierto por dos razones. Primero R es un lenguaje interpretado (como Java) y no compilado
(como C, C++, Fortran, Pascal,. . . ), lo cual significa que los comandos escritos en el teclado
son ejecutados directamente sin necesidad de construir ejecutables.
Como segunda medida, la sintaxis de R es muy simple e intuitiva. Para que una función sea
ejecutada en R debe estar siempre acompañada de paréntesis, inclusive en el caso que no
haya nada dentro de los mismos. Si se escribe el nombre de la función sin los paréntesis, R
mostrara el contenido (código) mismo de la función.
Orientado a Objetos significa que las variables, datos, funciones, resultados, etc., se guardan
en la memoria activa del computador en forma de objetos con un nombre especıfico. El
usuario puede modificar o manipular estos objetos con operadores (aritméticos, lógicos, y
comparativos) y funciones (que a su vez son objetos).
Todas las acciones en R se realizan con objetos que son guardados en la memoria activa del
ordenador, sin usar archivos temporales. La lectura y escritura de archivos solo se realiza para
la entrada y salida de datos y resultados. El usuario ejecuta las funciones con la ayuda de
comandos definidos. Los resultados se pueden visualizar directamente en la pantalla, guardar
en un objeto o escribir directamente en el disco (particularmente para gráficos). Debido a
que los resultados mismos son objetos, pueden ser considerados como datos y analizados
como tal. Archivos que contengan datos pueden ser leı́dos directamente desde el disco local
o en un servido remoto a través de la red.
Un objeto puede ser creado con el operador “assignar” el cual se denota como una flecha con
el signo menos y el sı́mbolo “¿” o “¡” dependiendo de la dirección en que asigna el objeto.

1
3. Procedimiento y descripción de actividades

3.1. Parte A

Seleccionar uno de los dos primeros capı́tulos del libro de Watkins y reproducir (utilizando
R) los diagramas allı́ presentados. Anotando en cada caso una reflexión de la actividad.

3.1.1. Gráficos circulares

Proporción de casos de SIDA entre hombres por categorı́a de transmisión diag-


nosticada - Estados Unidos, 2005

males <− c ( 5 8 , 1 8 , 1 6 , 7 , 1 )
p i e ( males )
c o l o r s <− c ( ” w h i t e ” , ” b l u e v i o l e t ” , ” cyan3 ” , ” d a r k o r c h i d 1 ” , ” brown4
” )
# Se c a l c u l a e l p o r c e n t a j e para cada c a t e g o r i a .
m a l e l a b e l s <− round ( males / sum ( males ) ∗ 1 0 0 , 1 )
# El 1 i n d i c a e l redondeo .
m a l e l a b e l s <− p a s t e ( m a l e l a b e l s , ” %”, s e p = ” ” )
# Se a g r e g a un e s p a c i o y s i m b o l o de p o r c e n t a j e .
t i t l e = p a s t e ( ” P r o p o r t i o n o f AIDS Cases among Males by\n ” ,
” T r a n s m i s s i o n Category Diagnosed − USA 2005” )
# Crea un g r a f i c o c i r c u l a r con un t i t u l o d e f i n i d o y c o l o r e s
personalizados
# y leyenda .
p i e ( males , main = t i t l e , c o l = c o l o r s , l a b e l s = m a l e l a b e l s ,
cex = 0 . 8 )
maleLegend = c ( ” Male−male c o n t a c t ” , ” I n j e c t i o n drug u s e (IDU) ” ,
” High−r i s k h e t e r o s e x u a l c o n t a c t ” ,
” Male−male c o n t a c t and IDU” , ” Other ” )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 8 , f i l l = c o l o r s )

Figura 1: Código en lenguaje R del ejemplo 1

2
Se puede observar el resultado de este programa en la figura 3.1.1

Figura 2: Gráfico circular

Este tipo de grafico es visualmente agradable, pero es deficiente para juzgar áreas relativas
(porcentajes) al aumentar las categorı́as que se están analizando o mostrando.

3.1.2. Gráficos de barras

Proporción de casos de SIDA por sexo y categorı́a de transmisión Diagnosticado


- EE. UU., 2005

3
b a r p l o t ( males )
f e m a l e s <− c ( 0 , 7 1 , 2 7 , 0 , 2 )
h i v <− a r r a y ( c ( males , f e m a l e s ) , dim = c ( 5 , 2 ) )
# Genera l o s g r a f i c o s l a d o a l a d o y c r e a l a s e t i q u e t a s .
b a r p l o t ( hiv , main = t i t l e , y l a b = ” p e r c e n t ” , b e s i d e = T,
names . a r g = c ( ” Males ” , ” Females ” ) , c o l = c o l o r s )
l e g e n d ( x = 3 , y = 7 0 , l e g e n d = maleLegend , cex = 0 . 8 , f i l l =
colors )

Figura 3: Código en lenguaje R del ejemplo 2

Grafico generado

Figura 4: Gráfico de barras

Para que sea más notorio la diferencia entre los dos tipos de gráficos, se compara el mismo
ejemplo con diferente gráficos

4
b a r p l o t ( males , main = t i t l e , c o l = c o l o r s )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 8 , f i l l = c o l o r s )

# Coloca ambas g r a f i c a s en l a misma imagen


par ( mfrow = c ( 1 , 2 ) )
p i e ( males , main = t i t l e , c o l = c o l o r s , l a b e l s = m a l e l a b e l s ,
cex = 0 . 8 )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 6 , f i l l = c o l o r s )
b a r p l o t ( males , main = t i t l e , c o l = c o l o r s )
l e g e n d ( ” t o p r i g h t ” , l e g e n d = maleLegend , cex = 0 . 6 , f i l l = c o l o r s )

Figura 5: Código en lenguaje R del ejemplo 1 (grafico circular y de barras)

Como se muestra en la Figura 3.1.2, un gráfico de barras es más recomendable que los gráficos
circulares cuando se está mostrando datos categóricos ya que se muestran de una manera
más clara sus áreas relativas.

Figura 6: Comaparación entre gráfico circular y de barras

Tablas bidireccionales
En una tabla bidireccional, el total de las filas y columnas dan las distribuciones marginales.

5
Podemos crear un gráfico de barras segmentado de la siguiente manera

smoking<−matrix ( c ( 4 0 0 , 1 3 8 0 , 4 1 6 , 1 8 2 3 , 1 8 8 , 1 1 6 8 ) , n c o l =3)
colnames ( smoking )<−c ( ” 2 p a r e n t s ” , ” 1 p a r e n t ” , ”0 p a r e n t s ” )
rownames ( smoking )<−c ( ” smokes ” , ” d o e s not smoke ” )
smoking
b a r p l o t ( smoking , l e g e n d=rownames ( smoking ) )

Figura 7: Código en lenguaje R del ejemplo 3 (grafico de barras)

Su grafica de barras se muestra en la Figura 3.1.2, como se puede apreciar esta tabla no es
posible representarse en un gráfico circular

Figura 8: Gráfico de barras de una tabla bidimencional

3.1.3. Histogramas y la función de distribución acumulativa empı́rica

Tomando la edad de los presidentes de los Estados Unidos en el momento de su inauguración


y la creación de su histograma en R se logra de la siguiente manera. En la Figura 3.1.3 se
muestra el codigo en lenguaje R y la Figura 3.1.3 su histograma.

6
# Histogram o f a g e s o f p r e s i d e n t s a t i n a u g u r a t i o n , p . 11
age <− c ( 5 7 , 6 1 , 5 7 , 5 7 , 5 8 , 5 7 , 6 1 , 5 4 , 6 8 , 5 1 , 4 9 , 6 4 , 5 0 , 4 8 , 6 5 , 5 2 , 5 6 , 4 6 ,
54 ,49 ,51 ,47 ,55 ,55 ,54 ,42 ,51 ,56 ,55 ,51 ,54 ,51 ,60 ,61 ,43 ,55 ,
56 ,61 ,52 ,69 ,64 ,46 ,54 ,47 ,70 )
h i s t ( age , b o r d e r = ” d a r k r e d ” ,
main = c ( ”Age o f P r e s i d e n t s a t t h e Time o f I n a u g u r a t i o n ” ) )
# C a l c u l a a y g r a f i c a l a f u n c i o n de f r e c u e n c i a acumulada .
p l o t ( s o r t ( age ) , 1 : l e n g t h ( age ) / l e n g t h ( age ) ,
type = ” s ” , ylim = c ( 0 , 1 . 0 5 ) ,
main = ”Age o f P r e s i d e n t s a t t h e Time o f I n a u g u r a t i o n ” ,
sub = ” E m p i r i c i a l Cumulative D i s t r i b u t i o n Function ” ,
x l a b = ” age ” , y l a b = ” c u m u l a t i v e f r a c t i o n ” ,
c o l = ” darkgreen ” )
grid ()

Figura 9: Código en lenguaje R del ejemplo 4 (histograma)

Figura 10: Histograma (función de frecuencia acumulada)

7
3.1.4. Gráfico de dispersión

femur<−c ( 3 8 , 5 6 , 5 9 , 6 4 , 7 4 )
humerus<−c ( 4 1 , 6 3 , 7 0 , 7 2 , 8 4 )
p l o t ( femur , humerus , main=c ( ” Bone Lengths f o r Archeopteryx ” ) )

Figura 11: Código en lenguaje R del ejemplo 5 (gráfico de dispersión)

Figura 12: Gráfico de dispersión

8
4. Conclusiones

9
5. Referencias
[1]

10

También podría gustarte