Está en la página 1de 14

ALEJANDRO MARTINEZ CASTAÑO 1015032

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES


INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

ESTADISTICA DESCRIPTIVA
SECCION B:
En este caso llamaremos al banco de datos del ambiente R “Orange”, se trata de un banco de datos que
básicamente el crecimiento de árboles de naranjas, para los cuales se toman 3 variables:
- Tree: indica el árbol en el cual se realiza la medicion, el orden es de acuerdo al aumento del diámetro.
- Age: la edad en días que tiene cada árbol desde el 31 de diciembre de 1968.
- Circumference: es un vector de circunferencias en milímetros (mm) de los árboles.

 Tree:

Tree indica el árbol en el cual se realiza la medicion, el orden es de acuerdo al aumento del diámetro.
A continuación se muestra su tabla de frecuencias:

Tree ni Ni hi Hi porcentaje
3 7 7 0,2 0,2 20%
1 7 14 0,2 0,4 20%
5 7 21 0,2 0,6 20%
2 7 28 0,2 0,8 20%
4 7 35 0,2 1 20%
35 1 100%

diagrama de barras diagrama circular


7
6

1
5

3
4
absoluta

5
2

4
1
0

2
3 1 5 2 4

Tree
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

 Age:

Age representa la edad en días que tiene cada árbol desde el 31 de diciembre de 1968. A continuación
se muestra la tabla de frecuencias:

Age ni Ni hi Hi porcentaje
118 5 5 0,142857 0,1429 14,28571
484 5 10 0,142857 0,2857 14,28571
664 5 15 0,142857 0,4286 14,28571
1004 5 20 0,142857 0,5714 14,28571
1231 5 25 0,142857 0,7143 14,28571
1372 5 30 0,142857 0,8571 14,28571
1582 5 35 0,142857 1,0000 14,28571
35 1,0000 100%

histograma
boxplot
10

1500
8
6
Frequency

1000
4
2

500
0

0 500 1000 1500

age

Promedio: 922.1
Desviación estándar: 491.8645
Mediana: 1004.0
Coeficiente de variación: 53.3393
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

Cuartiles de distribución:
- límite inferior= 118
-cuartil 1 (Q1)= 484
-cuartil 2 (Q2)= 1004
-cuartil 3 (Q3)= 1372
-límite superior= 1582

 Circumference

Circumference es un vector de circunferencias en milímetros (mm) de los árboles. A continuación la


tabla de frecuencias de los datos:

Circumference ni Ni hi Hi porcentaje
30 3 3 0.08571429 0.08571429 8,57
32 1 4 0.02857143 0.11428571 2,86
33 1 5 0.02857143 0.14285714 2,86
49 1 6 0.02857143 0.17142857 2,86
51 1 7 0.02857143 0.20000000 2,86
58 1 8 0.02857143 0.22857143 2,86
62 1 9 0.02857143 0.25714286 2,86
69 1 10 0.02857143 0.28571429 2,86
75 1 11 0.02857143 0.31428571 2,86
81 1 12 0.02857143 0.34285714 2,86
87 1 13 0.02857143 0.37142857 2,86
108 1 14 0.02857143 0.40000000 2,86
111 1 15 0.02857143 0.42857143 2,86
112 1 16 0.02857143 0.45714286 2,86
115 2 18 0.05714286 0.51428571 5,71
120 1 19 0.02857143 0.54285714 2,86
125 1 20 0.02857143 0.57142857 2,86
139 1 21 0.02857143 0.60000000 2,86
140 1 22 0.02857143 0.62857143 2,86
142 2 24 0.05714286 0.68571429 5,71
145 1 25 0.02857143 0.71428571 2,86
156 1 26 0.02857143 0.74285714 2,86
167 1 27 0.02857143 0.77142857 2,86
172 1 28 0.02857143 0.80000000 2,86
174 1 29 0.02857143 0.82857143 2,86
177 1 30 0.02857143 0.85714286 2,86
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

179 1 31 0.02857143 0.88571429 2,86


203 2 33 0.05714286 0.94285714 5,71
209 1 34 0.02857143 0.97142857 2,86
214 1 35 0.02857143 1 2,86
35 1 100

histograma boxplot
6

200
5
4

150
Frequency

3
2

100
1
0

50

50 100 150 200

circumference

Promedio: 115.8571
Desviación estándar: 57.48818
Mediana: 115
Coeficiente de variación: 49.61988
Cuartiles de distribución:
- límite inferior= 30.0
-cuartil 1 (Q1)= 65.5
-cuartil 2 (Q2)= 115.0
-cuartil 3 (Q3)= 161.5
-límite superior= 214.0
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

- CONCLUSIONES

 Como se puede observar en la variable Tree, los arboles de naranjas están ordenados por su
diámetro, y se tomaron los diámetro de 7 árboles por grupo, es decir hay 5 grupos de diámetro, es
por esto que se deduce que hay 20% de cada grupo de diámetro y la gráfica de una manera tan
simétrica.
 Para la variable de la edad (Age) se tiene una distribución parecida a la de Tree, ya que se tiene
registro de 7 edades distintas, para las cuales se tienen datos de 5 árboles por edad, así que no se
puede concluir que hay más arboles por cierta edad que por otra, como se mencionó
anteriormente por edad hay exactamente 5 árboles.
 Se puede resaltar que los rangos de edad son bastante amplios, es decir, el mínimo es de 118, y el
máximo es de más de 1500 días.
 Para la circunferencia del tronco de estos árboles si se tiene datos un poco más variados, como se
observa en el histograma, la mayoría de troncos tiene una circunferencia de alrededor de 100cm, y
cabe resaltar que los datos van desde 30cm hasta 214cm, un rango bastante amplio.

SECCION C:
Para la mayoría de personas el vino es simplemente el fermento de un destilado que se hace a partir de las
uvas y dependiendo el nivel de alcohol y la manera de fermentación y destilación se derivan muchos tipos de
vino, pero en realidad el vino es mucho más que eso, tiene varias componentes y propiedades tanto químicas
como físicas que las hace diferenciar entre ellos; a continuación se realiza un análisis de dos de esas
propiedades en función de la calidad del mismo, tomando como referencia un banco de datos de muestras de
cientos de vino:

 Calidad :
La calidad del vino depende de muchos factores, en este caso se calificaron de 1 a 10 al menos
1599 vinos y se hizo el análisis correspondiente:

Primero se hace la tabla de frecuencias:

calidad ni Ni hi Hi pc
3 10 10 0.006253909 0.006253909 0,6250
4 53 63 0.033145716 0.039399625 3,3140
5 681 744 0.425891182 0.465290807 42,5890
6 638 1382 0.398999375 0.864290181 39,8990
7 199 1581 0.124452783 0.988742964 12,4480
8 18 1599 0.011257036 1 1,1250
1599 1 100
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

Luego se realizan las respectivas graficas:

Ahora se analizaran 2 de las propiedades que tiene el vino en función de la calidad:

 % alcohol:
Se trata de una medida de concentración porcentual en volumen. A cada unidad de porcentaje
de alcohol en el volumen total le corresponde un grado de graduación alcohólica. Así, se habla
de un vino con una graduación de 13,5° cuando tiene un 13,5% de alcohol, o sea, 135 ml de
etanol por litro.

Primero se realiza la tabla de frecuencias:

intervalos mc ni Ni hi Hi porcentaje
1 8,864 194 194 0.121325829 0.1213258 12,13
2 9,793 648 842 0.405253283 0.5265791 40,53
3 10,721 377 1219 0.235772358 0.7623515 23,58
4 11,650 252 1471 0.157598499 0.9199500 15,76
5 12,579 105 1576 0.065666041 0.9856160 6,57
6 13,507 15 1591 0.009380863 0.9949969 0,94
7 14,436 8 1599 0.005003127 1 0,50
1599 1 100

Promedio: 10.42298
Mediana: 10.2
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

Desviación estándar: 1.065668


Coeficiente de variación: 10.22421

Luego se realizan las respectivas gráficas:

Histograma Alcohol Poligono de Frecuencias Alcohol


600

600
500

500
Frecuencia Acumulada
Frecuencia Absoluta

400

400
300

300
200

200
100

100
0

9 10 11 12 13 14 15 9 10 11 12 13 14 15

% de alcohol % de alcohol
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

 Densidad:

La densidad relativa a 20ºC se obtiene multiplicando la masa volúmica por el factor 1,0018. Se
expresa con cuatro decimales y es adimensional. Los valores habituales de la masa volúmica a
20ºC para cada tipo de muestra son: -Vino blanco seco: 0,9880-0,9930 g/mL. -Vinos tinto seco:
0,9910-0,9950 g/mL.

Primero se realiza la tabla de frecuencias:

intervalos mc ni Ni hi Hi pc
1 0,990751 8 8 0.005003127 0.005003127 0,5003
2 0,992113 27 35 0.016885553 0.021888680 1,6886
3 0,993475 90 125 0.056285178 0.078173859 5,6285
4 0,994837 250 375 0.156347717 0.234521576 15,6348
5 0,996199 487 862 0.304565353 0.539086929 30,4565
6 0,997561 448 1310 0.280175109 0.819262039 28,0175
7 0,998923 185 1495 0.115697311 0.934959350 11,5697
8 1,0003 74 1569 0.046278924 0.981238274 4,6279
9 1,0016 19 1588 0.011882427 0.993120700 1,1882
10 1,0030 11 1599 0.006879300 1 0,6879
1599 1 100

Promedio: 0.9967467
Mediana: 0.99675
Desviación estándar: 0.001887334
Coeficiente de variación: 0.01810743
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

Seguidamente se hacen las gráficas:

- CONCLUSIONES

 Teniendo en cuenta que las calificaciones de calidad se dan de 1 a 10, se puede deducir que son
muy pocas los vinos que tiene una calidad distinta de 5 o 6, estos dos números representan más
del 80% de todos los datos, es decir que el otro 20% aproximado está repartido entre los
valores de calidad de 1, 2, 3, 4, 7, 8, 9,10; por cierto, no hay vinos con una calidad de 1, 2, 9 y
10.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

 El promedio del porcentaje de alcohol en los vinos de esta muestra (y en general) es de 10%,
que representan este banco de datos alrededor del 40% de muestras, que es considerable
teniendo en cuenta que los rangos de estudio van desde 8 a 14% aproximadamente.
 A partir del 10% de alcohol empieza a decaer el número de muestras que contienen más
porcentaje, es decir hay menos con 12% y muchas menos con 14%, las cuales significan tan solo
el 0,5% de la muestra, esto ya que son solo 8 vinos en medio de 1599 muestras.
 Los valores de la densidad del vino son muy parecidos a las del agua, y varían muy poco entre
muestras, tanto asi que las muestras que superan 1g/ml de densidad representan solo el 6% de
todos los vinos, mientras que las que tienen 0,99g/ml aproximadamente son el 95% de los 1599
vinos.

SECCIÓN D:

Los datos a seguir fueron tomados de un hospital con el fin de mejorar algunos servicios y sobre todo conocer
la opinión de los pacientes en relación con algunas variables:

En relación con estos datos, analizar las variables y responder cada una de las siguientes preguntas,
sustentando su respuesta ya sea con una tabla o simplemente con un gráfico:

1. En proporción, se puede decir que los pacientes atendidos son iguales, aunque tiene una leve diferencia
del 2% que se le suma a las pacientes mujeres, es decir que el 48% de los pacientes son hombres.
personas atendidas
h 48%

m 52%

2. El rango de edad más frecuente en el hospital son pacientes entre los 40 y 50 años, seguido por personas
de 30 y 40, una población con edad entre 70 y 80.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

60% 70% 85% 90%


58.40 66.30 75.15 77.10

El punto en el que se tiene el 60% de los datos tomados, después de tener en orden de edad, los pacientes tienen 58,4
años, o menos, así mismo, en el punto en el que ya se tiene un 90% de investigación se dice que la población tiene
alrededor de 77 años.

Así que se puede decir que el 10% de los pacientes son personas de más de 77 años, y que entre 80 y 90 años es donde
menos población hay.

3. Como se muestra en la gráfica la gran mayoría de personas fueron hospitalizadas entre 2 y 10 días; también se
muestra que dentro de toda la muestra no hubo hospitalizados entre 10 y 20 días, y tampoco entre 40 y 70 días.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

4. En el diagrama circular se ve claramente que no es mucha la variación entre los pacientes que requirieron
cirugía y los que no, solo los diferencia un 8%, que están a favor de los que NO les realizaron operación,
con un porcentaje total de 58% y por ende un 42% a los que SI se les hizo.

cirugia

NO 58%

SI 42%

5. Según el flujo de pacientes que se observan en el diagrama de barras, es fácil concluir que la dependencia
donde se necesita mayor número de médicos especialistas es en la número 2, es decir, en traumatología;
sin embargo no es mucha la diferencia de pacientes que entran a la dependencia 1: medicina interna.

ESPECIALIDAD

6. Según las opiniones de los pacientes (diferenciando cada tipo de atención) se obtuvieron los siguientes resultados
basados en los numerales de acuerdo y desacuerdo:
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

1- Totalmente en desacuerdo.
2- En desacuerdo.
3- Ni de acuerdo ni en desacuerdo.
4- De acuerdo.
5- Totalmente de acuerdo.

habitaciones comida

25
20
Frecuencias

Frecuencias

15
5 10

0 5
0

1 2 3 4 5 2 3 4 5

AtencionEnfe InfRecibida
40
25

30
Frecuencias

Frecuencias

20
15

10
5
0

2 3 4 5 1 2 3 4

7. Según los resultados de cada análisis, y principalmente basados en las opiniones de los pacientes que
finalmente son lo primordial dentro del hospital se plantean algunas sugerencias de mejora al hospital:

- Aunque los pacientes no tienen una buena opinión de las habitaciones, ya que hay un gran porcentaje
que se dirige al numeral de desacuerdo, hay una mayoría de opiniones con el totalmente de acuerdo,
así que se debe mejorar la calidad de habitaciones, pero por el momento hay que darle prioridad a
otros aspectos
- Es preocupante con la mayoría de personas están en desacuerdo con la comida del hospital, sin duda
es un aspecto que se debe mejorar inmediatamente, ya aunque no se tenga registro de que alguien
esté en absoluto desacuerdo tampoco son muchas las personas que estén en total acuerdo.
ALEJANDRO MARTINEZ CASTAÑO 1015032
UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES
INGENIERIA FISICA
PROBABLIDAD Y ESTADISTICA
2019-1

- La atención de la enfermería tiene buenos registros y se debe continuar trabajando de la misma


manera, no hay nadie en total desacuerdo, y aunque no hay gran población en total acuerdo, la
mayoría están de acuerdo, así que se debe mejorar solo un poco la atención en esa área.
- Por último la información que se le brinda a los pacientes acerca de su estado es probablemente el
mejor aspecto que tiene el hospital ya que la mayoría de personas están en acuerdo y muy pocas en
desacuerdo o total desacuerdo, se debe seguir con esta metodología de trabajo.