Está en la página 1de 10

Tarea 1.

Elaborado por:
Dorys Lenith Viviescas Ortiz

Presentado a:
Josefa Ramoni

Maestría en Biotecnología
Universidad de Santander UDES
Bucaramanga
2018
Solución

1. Datos Vinos.
Para analizar la calidad del vino y los factores que se asocian a ella, se utiliza una muestra
aleatoria de vinos de dos tipos diferentes (Cabernet y Shiraz), a los cuales se les mide no solo
su calidad (Y), sino otros factores, según se muestra en la siguiente lista

Se pide:
1. Describir las características de los vinos, según su tipo. Estime y comente las
estadísticas que considere convenientes. No olvide incluir el coeficiente de variación.

X1 Variable n Media D.E. CV Mín Máx Mediana


0 y 14 15,69 1,92 12,26 12,80 19,20 15,50
0 x2 14 3,83 0,14 3,53 3,47 3,98 3,87
0 x4 14 7,31 2,91 39,77 3,60 12,85 6,10
0 x5 14 4,32 1,86 42,99 2,15 7,70 3,65
0 x6 14 1,89 0,87 45,70 0,75 3,90 1,57
0 x7 14 2,43 1,06 43,72 1,15 3,80 2,20
0 x8 14 0,37 0,06 15,61 0,27 0,49 0,37
0 x9 14 13,36 6,08 45,55 6,00 22,00 11,50
0 x10 14 0,05 0,02 43,72 0,02 0,08 0,04
0 x3 14 88,43 29,12 32,93 61,00 178,00 80,00
1 y 18 15,09 1,65 10,94 11,50 18,50 15,30
1 x2 18 3,81 0,11 2,95 3,60 3,98 3,76
1 x4 18 7,27 1,84 25,35 4,25 10,25 7,65
1 x5 18 4,36 1,16 26,65 2,40 6,10 4,58
1 x6 18 1,68 0,47 28,27 0,95 2,60 1,73
1 x7 18 2,68 0,76 28,16 1,15 3,70 2,80
1 x8 18 0,37 0,09 23,59 0,25 0,63 0,37
1 x9 18 15,22 5,49 36,09 6,00 25,00 16,00
1 x10 18 0,05 0,02 28,16 0,02 0,07 0,06
1 x3 18 100,33 65,16 64,94 10,00 301,00 89,00

En el estudio se utilizó una población total de 32 de los cuales 14 pertenecían al vino


Cabernet y 18 al vino Shiraz, se puede concluir que en promedio el vino que presenta
mejor calidad es el Shiraz, presentan un grado de acidez similar con poca variación.
2. Represente gráficamente el promedio de SO2 según tipo. ¿Qué observa?
X1 Variable Media
0 x3 88,43
1 x3 100,33
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Promedio Versión
SO2 Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
100,93
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
97,65
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Media

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
94,38
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
91,11
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
87,83
Versión Estudiantil Versión Estudiantil Versión Estudiantil
0 Versión1Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
x1 Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

El promedio de SO2 del vino Shiraz es superior al de Caberet esto se debe principalmente a
que se tomaron más muestras de este vino para analizar que del otro.

3. Represente gráficamente la proporción de cada tipo de vino en el estudio.

0 1

4. Utilice un diagrama de caja para representar el comportamiento de la calidad del vino


(Y) según tipo.
20
18
calidad

16
14
12

0 1

5. Elabore un histograma del pH de todos los vinos, sin separarlos por tipo.
4
3
Density

2
1
0

3.5 3.6 3.7 3.8 3.9


ph

6. Estime la matriz de correlaciones entre las diferentes variables de cantidad.

| y x2 x3 x4 x5 x6 x7

-------------+---------------------------------------------------------------

y | 1.0000

x2 | 0.2775 1.0000

x3 | -0.3759 -0.5820 1.0000

x4 | 0.7018 0.2132 -0.3915 1.0000

x5 | 0.7077 0.1521 -0.3709 0.9957 1.0000


x6 | 0.6512 0.2204 -0.3254 0.9454 0.9253 1.0000

x7 | 0.6813 0.0863 -0.3690 0.9367 0.9589 0.7797 1.0000

x8 | -0.1682 0.0955 0.4045 0.0155 0.0031 -0.0429 0.0372

x9 | 0.6170 -0.0489 -0.4960 0.7969 0.8260 0.6905 0.8472

x10 | 0.6813 0.0863 -0.3690 0.9367 0.9589 0.7797 1.0000

| x8 x9 x10

-------------+---------------------------

x8 | 1.0000

x9 | -0.4558 1.0000

x10 | 0.0372 0.8472 1.0000

2. Datos Pesonacer
Para determinar los factores que inciden en el bajo peso al nacer de los niños, se tiene
información acerca de un grupo de recién nacidos y sus madres. Las variables disponibles
son:

Se pide:

1. Construya una tabla de contingencia con las variables LOWW y SMOKE. Comente
los resultados

Smokeno fuma

loww 0 1 Total

-----------+----------------------+----------

0 normal 629 99 728

1 bajo peso 55 15 70

-----------+----------------------+----------
Total 684 114 798

El peso bajo se incrementa en las madres que durante el periodo de gestación fuman, al igual
se puede inferir que la mayoría de la población que se encuentra en el estudio presenta bajo
peso al nacer.
2. Represente gráficamente el peso promedio de los niños, según si la madre fuma o no.
4,000
3,000
mean of peso

2,000
1,000

0 1

3. Describa las características básicas de los niños, según si tienen o no bajo peso al
nacer. Comente.
-> loww = 0

Variable | Obs Mean Std. Dev. Min Max

-------------+---------------------------------------------------------

weeks | 729 39.04527 1.902683 32 45

peso | 730 3431.243 460.1855 2523.15 4791.15

mage | 730 27.01096 6.051665 15 42

-------------------------------------------------------------------------
------------

-> loww = 1 bao peso

Variable | Obs Mean Std. Dev. Min Max

-------------+---------------------------------------------------------

weeks | 70 34.12857 4.975072 22 43


peso | 70 1922.94 619.9718 340.2 2494.8

mage | 70 25.91429 6.623942 16 40

Al nacer pres
4. Utilice un diagrama de caja para representar el comportamiento del peso de los niños,
según si la madre fuma o no.
5,000
4,000
2,000peso3,000
1,000

0 1

1. Elabore un histograma del peso de los niños, sin separarlos en grupos por ningún
criterio.
.001
8.0e-04
6.0e-04
Density
4.0e-04
2.0e-04

0 1000 2000 3000 4000 5000


peso

2. Estime las correlaciones entre las variables cuantitativas


| mage weeks peso

-------------+---------------------------

mage | 1.0000

weeks | 0.0210 1.0000

peso | 0.1691 0.5828 1.0000


5000
4000
3000
peso
2000
1000

20 25 30 35 40 45
weeks

3. Salinidad
Se quiere estudiar la relación entre el pH (pH), la salinidad (Salinidad), el contenido de Zn
(Zinc) y el contenido de K (Potasio) presentes en el suelo con la producción de biomasa de
una Forrajera. Para ello se registraron 45 mediciones de la biomasa (gr) y de dichos valores
característicos del suelo donde crecieron las plantas.
Se pide:
1. Describa las características básicas de la muestra. No olvide calcula el coeficiente de
variación. Comente
stats | biomasa ph salini~d zinc potasio

---------+--------------------------------------------------

cv | .5048059 .2722416 .1228984 .464068 .3731933

max | 2337.33 7.45 38 31.29 1441.67

min | 369.82 3.2 24 .21 350.73

mean | 1082.173 4.608889 30.26667 17.83089 797.3778

sd | 546.2872 1.254731 3.719726 8.274745 297.576


Se observa que en el estudio existen predominan los suelos ácidos, presentan alto
contenido de potasio, y la biomasa forrajera presenta una producción moderada.
2. Utilice diagramas de caja para representar el comportamiento de las variables.

2,500
2,000
1,500
1,000
500
0

biomasa ph
salinidad zinc
potasio

3. Elabore un histograma de la biomasa.


8.0e-04
6.0e-04
Density
4.0e-04
2.0e-04

500 1000 1500 2000 2500


biomasa

4. Calcule la matriz de correlaciones entre las variables. Elabore también diagramas de


dispersión, colocando siempre la variable biomasa en el eje vertical y las restantes en
el horizontal (puede elaborar una matriz de diagramas de dispersión)
| biomasa ph salini~d zinc potasio

-------------+---------------------------------------------

biomasa | 1.0000

ph | 0.9281 1.0000
salinidad | -0.0666 -0.0446 1.0000

zinc | -0.7815 -0.7205 -0.4265 1.0000

potasio | -0.0732 0.0324 -0.0196 0.0788 1.0000

40
8
7

35
6

salinidad
ph

30
4

25
3

500 1000 1500 2000 2500 500 1000 1500 2000 2500
biomasa biomasa
30

1400
1200
20

1000
zinc

potasio

800
10

600
400
0

500 1000 1500 2000 2500 500 1000 1500 2000 2500
biomasa biomasa

También podría gustarte