Está en la página 1de 26

Bioestadística

Agronomía
Universidad de Los Lagos

Informe Práctico Nro. 1.


Estadística Descriptiva
Análisis de Variables Cualitativas y Cuantitativas

Docente:
Integrantes:
Fecha de Entrega:
I. INTRODUCCIÓN.

En las últimas décadas, el avance de la tecnología y de los


estudios científicos ha permitido obtener grandes cantidades
de datos. Los diferentes estudios de medicina, de la
agricultura, de la alimentación, etc., arrojan información
muy valiosa para la humanidad, pero bastante difícil de
abarcar en su totalidad. La bioestadística es una disciplina
que ayuda a arrojar luz sobre esa importantísima información,
mediante el empleo de los diferentes métodos de análisis de
la estadística para abordar los objetos de estudio y así
obtener datos importantes para representarlos e
interpretarlos.

Para esto se utiliza la estadística descriptiva que es según


Spiegel, (2009) "un conjunto de técnicas numéricas y gráficas
utilizadas para describir y analizar un grupo de datos dado,
sin extraer conclusiones o inferencias de un grupo mayor o
sobre la población a la que pertenecen". La estadística
descriptiva trata de las técnicas para recolectar, organizar,
presentar y estudiar e interpretar un conjunto de datos
numéricos y a partir de ellos, resumir con uno o dos
elementos de información (medidas descriptivas) que
caracterizan la totalidad de los mismos. El principal
objetivo de este tipo de estadística es facilitar la
descripción y la aplicación de los datos organizándolos en
tablas, en gráficas o en medidas numéricas, que resumen y
presentan la información contenida en ellos (Barón, 2005).

Para aplicar una técnica descriptiva, numérica o gráfica, es


necesario analizar previamente el tipo de variable con la que
se está trabajando, es por esto, que para la elaboración de
la siguiente practica experimental se utiliza un producto
agronómico de alto consumo por parte de la población chilena,
como lo es la papa. A partir de las características más
relevantes del producto, se determinan las variables
cualitativas y cuantitativas para su posterior análisis,
descripción y presentación.
Las variables seleccionadas para el estudio son: peso, forma
y tamaño (calibre) y color, ya que estas aseguran el alto
rendimiento en la producción del tubérculo. Un incremento en
la producción de este producto, se logra con una cantidad
óptima de tubérculos, con un incremento en el tamaño y el
peso del mismo. La forma del tubérculo es relevante en el
momento de ser seleccionada por el consumidor, ya que las
formas alargadas suelen destacar más que las formas ovaladas,
lo que aporta diversidad en el mercado.

El destino de la producción se define en gran medida de las


características que se le exigen a una determinada variedad,
y que debe cumplir para ser aceptada por el consumidor. Las
condiciones del tubérculo semilla están determinadas por el
estado fisiológico de los tubérculos, su tamaño y sus
características físicas. Por lo tanto, para producir con
distintos objetivos de comercialización se necesita conocer
el comportamiento de cada variedad en cuanto al manejo y
almacenaje en el medioambiente y entorno local (Manual del
cultivo de la papa en Chile, 2017).

Para obtener resultados concluyentes, se utilizan dos


variedades de papa, tales como: Rodeo (Roja) y Yagana
(Amarilla).

II. OBJETIVOS.

Los objetivos que se requieren alcanzar con el desarrollo y


aplicación de la práctica experimental, se mencionan a
continuación:

 Relacionar la estadística descriptiva con la


agronomía.
 Identificar variables cualitativas y cuantitativas en
productos de importancia agronómica como la papa.
 Realizar representaciones gráficas de las variables
cualitativas y cuantitativas en estudio.
 Comprender el desarrollo y tratamiento de datos
estadísticos.
 Realizar cálculos estadísticos de tendencia central,
dispersión, forma y posición.

III. MATERIALES Y MÉTODOS.

Los materiales utilizados durante el procedimiento


experimental:
 Papas de dos variedades distintas (Rodeo y Yagana).
 Balanza Digital
 Regla graduada
 Pie de metro o Vernier
 Cuaderno
 Lápiz
 Excel
 Bibliografía

Para llevar a cabo el procedimiento experimental, se aplica


la siguiente metodología: en primer lugar, para cada variedad
de papa utilizada, mediante la observación se toman los datos
cuantitativos necesarios para el desarrollo de la practica
experimental, como sigue:

Figura 1.
Variedad de papas
utilizadas

Figura 2. Variedad Rodeo Figura 3. Variedad Yagana


En segundo lugar, para cada una de las variedad mencionada
mediante el uso de instrumentos de medición previamente
calibrados, como la balanza digital, el pie de metro y la
regla graduada, se obtienen los datos cuantitativos
necesarios para realizar los cálculos estadísticos de la
práctica, como se muestra a continuación:

Figura 4. Instrumentos
Calibrados.

Figura 3. Peso de la papa rodeo utilizando la balanza


analítica.
Figura 4. Calibre de la papa rodeo utilizando el pie de
metro.

Figura 5. Peso de la papa yagana utilizando la balanza


analítica.
Figura 6. Calibre de la papa yagana utilizando el pie de
metro.

Figura 7. Altura de la papa yagana utilizando la regla


graduada.
IV. Resultados

 Para el tratamiento de los datos obtenidos se identifica el


tipo de variable de estudio en los productos agronómicos:

Variables cualitativas: forma y color.


Variables cuantitativas: peso y tamaño (calibre).

 Se establecen categorías de color en los productos


agrícolas como tarjetas de referencia:

Color Forma
Variedad Rodeo Rojo Oval
Variedad Yagana Amarilla Alargada

A partir de los datos cualitativos, se construye una tabla de


frecuencias como sigue:

  X ni Ni hi Hi
Variedad 8 8 0,5714 0,5714
Rojo
Rodeo
Variedad 6 14 0,4286 1,0000
Amarilla
Yagana
  n 14   1  

Las Tablas de frecuencias son herramientas de estadística


donde se colocan los datos en columnas representando los
distintos valores recogidos en la muestra y las frecuencias
en que ocurren. La muestra de cálculo realizada se desglosa a
continuación:

ni (Frecuencia absoluta), es aquella que indica la cantidad de


datos que hay en un intervalo determinado de clases se
utiliza, n1 es el número de variedades en estudio para la
muestra color rojo y n2 es para la muestra de color amarillo.
Por lo tanto n es la cantidad total de datos:

n=n1 +n2=8+6=14
Para determinar Ni (Frecuencia absoluta acumulada),se utiliza
la siguiente expresión:
k

∑ N i=ni +ni +1+ …+nk


i=1

Entonces, para la muestra color rojo:


1

∑ N 1=n1=8
i=1

Para la muestra color amarillo:


2

∑ N 2=n1 +n2=8+6=14
i=1

Para determinar hi (Frecuencia relativa), se utiliza la


siguiente expresión:
n
hi = i
n

De esta manera, para la muestra color rojo:


8
h1 = =0,5714
14

Para la muestra color amarillo:


6
h2 = =0,4286
14

Finalmente, para determinar Hi (Frecuencia relativa


acumulada), se utiliza la siguiente expresión:
k

∑ H i =hi +hi +1+ …+nk


i=1

Entonces, para la muestra color rojo:


1

∑ H 1 =h1=0,4286
i=1

Para la muestra color amarillo:


2

∑ H 2 =h1 +h2=0,4286+0,5714=1
i=1
 Se construye el set de datos para cada variedad con los
datos cuantitativos obtenidos en la metodología experimental:
Peso Calibre Peso Calibre
ntubérculo ntubérculo
(g) (cm) (g) (cm)
Variedad Variedad
1 165,96 8,95 1 126,58 8,35
Rodeo Rodeo
2 135,22 5,65 2 127,18 8,58

3 178,67 9,45 3 126,76 8,45

4 157,91 7,23 4 126,12 7,89

5 153,78 7,01 5 127,54 8,91

6 175,32 9,64 6 128,39 7,95

7 165,7 8,21

8 166,43 7,93

 A partir de los datos cuantitativos se construye una tabla


de frecuencias para cada una de la variedad de papa, de la
siguiente manera:

Tabla de frecuencia para el peso de cada variedad:

Variedad Intervalo en
Rodeo ni Ni hi Hi
gramos

[130-140] 1 1 0,1250 0,1250

[150-160] 2 3 0,2500 0,3750

[160-170] 3 6 0,3750 0,7500

[170-180] 2 8 0,2500 1,0000

n 8   1  

Variedad Intervalo
ni Ni hi Hi
Yagana en gramos
100-110 1 1 0,1667 0,1667
110-120 2 3 0,3333 0,5000
120-130 3 6 0,5000 1,0000
n 6   1  

Tabla de frecuencia para el calibre de cada variedad:

Variedad Intervalo en
ni Ni hi Hi
Rodeo centímetros
5-6 1 1 0,1250 0,1250
6-7 0 1 0,0000 0,1250
7-8 3 4 0,3750 0,5000
8-9 2 6 0,2500 0,7500
9-10 2 8 0,2500 1,0000
n 8   1

Variedad Intervalo en
ni Ni hi Hi
Yagana centímetros
5-6 1 1 0,1667 0,1667
6-7 1 2 0,1667 0,3333
7-8 1 3 0,1667 0,5000
8-9 3 6 0,5000 1,0000
n 6   1

Es importante resaltar que las ecuaciones utilizadas, son


iguales a las usadas para las variables cualitativas.

 Utilizando las tablas de frecuencia obtenidas para los


datos cuantitativos y cualitativos, se obtienen los
siguientes gráficos, con la finalidad de representar el
comportamiento para cada variedad:
Forma y color de los tubérculos

42,86%

57,14%

Rojo-oval

Amarillo-aplanado

Gráfico #1. Datos cualitativos de forma y color

Peso de la variedad Rodeo


3
Frecuencia absolu-

1
ta

0
[130-140] [150-160] [160-170] [170-180]
Peso (g)

Gráfico #2. Datos cuantitativos de peso para la variedad de


papas Rodeo.
Peso de la variedad Yagana
3

Frecuencia ab-
2

soluta
1

0
[100-110] [110-120] [120-130]
Peso (g)

Gráfico #3. Datos cuantitativos de peso para la variedad de


papas Yagana.

Calibre de la variedad Rodeo


3
Frecuencia abso-

1
luta

0
[5-6] [7-8] [8-9] [9-10]

Calibre (cm)

Gráfico #4. Datos cuantitativos de calibre para la variedad


de papas Rodeo.
Calibre de la variedad Yagana
3

Frecuencia abso-
2

1
luta
0
[5-6] [6-7] [7-8] [8-9]
Calibre (cm)

Gráfico #5. Datos cuantitativos de calibre para la variedad


de papas Yagana.

 Para las variables cuantitativos se calcula los


estadísticos de tendencia central:

Las medidas de tendencia central son medidas estadísticas que


pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado
el conjunto de los datos. La muestra de cálculo para las
medidas de tendencia central más utilizadas se desglosa a
continuación:

X i (Media aritmética) es el valor numérico que se obtiene al


dividir la sumatoria de un conjunto de datos cuantitativos,
entre el número total de datos observados (n), mediante la
siguiente ecuación:

k
C i ∙ ni
X i =∑
i=1 n

Sabiendo que Ci es la marca de clase, que viene dada por la


sumatoria del intervalo mayor más el intervalo menor entre
dos (punto medio de la clase), de esta manera, para la
variedad rodeo:

135 ∙ 1+ 155∙ 3+165 ∙2+175 ∙ 2 1280


Xi= = =160
8 8

De igual manera, se estima para la variedad yagana:

105 ∙ 1+ 115∙ 2+125 ∙3 710


Xi= = =118,3
6 6

M e(Mediana) es el valor numérico de posición central que


parte la distribución en dos, es decir, deja la misma
cantidad de valores a un lado que a otro, mediante la
siguiente expresión:

( )
n
−n
2 i−1
M e =Li + ∙ Ai
ni

Para la variedad Rodeo, se obtiene: Li límite inferior del de


la mediana (160), ni frecuencia absoluta del intervalo de la
mediana (2), ni-1, frecuencia absoluta acumulada anterior al
intervalo de la mediana (3), n número total de datos del
ejercicio (8) y A amplitud de los intervalos y en este caso
vale 10. De esta manera:

( )
8
−3
2
M e =160+ ∙ 10=165
2

Por consiguiente, para la variedad yagana se obtiene:

( )
6
−1
2
M e =110+ ∙ 10=1 20
2
Por último, la Mo (Moda) que es el valor dentro del conjunto
de datos que más se repite, el que tiene mayor frecuencia, se
determina mediante la siguiente ecuación:

M o=Li +
( ni−ni−1
)
( ni−n i−1 ) + ( ni−n i+1 )
∙ Ai

Para la variedad Rodeo, se obtiene: Li límite inferior del


intervalo modal (150), ni frecuencia absoluta del intervalo
modal (3), ni-1, frecuencia absoluta acumulada anterior al
intervalo modal (1), ni+1 frecuencia absoluta acumulada
posterior al intervalo modal (2) y A amplitud de los
intervalos y en este caso vale 10. Sustituyendo:

M o=150+
( ( 3−13−1
) + ( 3−2 ) )
∙10=157

De igual manera, se reemplaza para la variedad yagana:

M o=1 2 0+
( ( 3−23−2
) + ( 3−0 ) )
∙ 10=123

Tabla de Media aritmética, Mediana y moda para el peso de


cada variedad:

Variedad Intervalo
Ci ni Ci*ni
Rodeo en gramos
[130-140] 135 1 135
[150-160] 155 3 465
[160-170] 165 2 330
[170-180] 175 2 350
n 8 1280
160
Me 165
Mo 156,7
Variedad Intervalo
Ci ni Ci*ni
Yagana en gramos
[100-110] 105 1 105
[110-120] 115 2 230
[120-130] 125 3 375
n 6 710
118,3
Me 120
Mo 122,5

A partir de los resultados obtenidos para este grupo de


datos, se estima que el peso promedio para la papa roja es
160 g y para la papa amarilla es de 118,3 g. Que el peso
desde los 130g hasta los 165g lo poseen 4 papas rojas y desde
165g hasta 180g, la misma cantidad; que desde los 100g hasta
los 120g lo poseen 3 papas amarillas y desde 120g hasta 130g,
lo poseen otras tres papas de este color. Y por último que el
peso más común para la variedad rodeo es de 156,7 g y para la
variedad yagana es de 122,5g. Obteniendo una representación
cuantitativa de la posición de los datos de una distribución
en el análisis de una variable como es el peso para cada
variedad. De la misma manera, se procede a resolver para el
calibre de ambas variedades, resultando:

Tabla de Media aritmética, Mediana y moda para el calibre de


cada variedad:

Variedad Intervalo en
Ci ni Ci*ni
Rodeo centímetros
[5-6] 5,5 1 6
[7-8] 7,5 3 23
[8-9] 8,5 2 17
[9-10] 9,5 2 19
  n 8 64
8
Me 8,5
Mo 7,7

Variedad Intervalo en
Ci ni Ci*ni
Yagana centímetros

[5-6] 5,5 1 5,5


[6-7] 6,5 1 6,5
[7-8] 7,5 1 7,5
[8-9] 8,5 3 25,5
n 6 45
7,5
Me 7
Mo 8,4

A partir de los resultados obtenidos para este grupo de


datos, se estima que el calibre promedio para la papa roja es
8 cm y para la papa amarilla 8,3 cm. Que desde los 5cm hasta
los 8,5cm poseen 4 papas rojas 8,5 cm de calibre y desde 8,5
cm hasta 10 cm, la misma cantidad; de igual manera, que desde
los 5 cm hasta los 7 cm, 3 papas amarillas poseen este tamaño
y desde 7 cm hasta los 10 cm, lo poseen otras tres papas de
este color. Y por último que el tamaño más común para la
variedad rodeo es 7,7 cm y para la variedad yagana es 8,4cm.

 Para las variables cuantitativos se calcula los


estadísticos de dispersión:

Las medidas de dispersión son medidas estadísticas que


entregan información sobre la variación de la variable; es
decir, pretende resumir en un solo valor la dispersión que
tiene el conjunto de datos. La muestra de cálculo para las
medidas de dispersión más utilizadas se desglosa a
continuación:

S2(Varianza) es una medida de dispersión que representa la


variabilidad de una serie de datos respecto a su media. Y se
determina mediante la siguiente expresión:
2
S=
∑ (Ci− X )2 ∙ ni
n

S(Desviación estándar) de igual manera es una medida de


dispersión que indica si los valores se encuentran más o
menos próximos a las medidas de posición. Y vienen dada por:

S= √ S2

Y por último, Cv (Coeficiente de variación) que es un


indicador que permite establecer comparaciones entre
distintos casos o poblaciones, a partir de la siguiente
ecuación:

S
Cv=
x

Finalmente, sustituyendo se obtienen las siguientes tablas


para los datos cuantitativos y las variables de dispersión
como: Varianza, Desviación estándar y coeficiente de
variación para ambos tipos de papas (rodeo y yagana)

Variedad Intervalo
Ci ni Ci*ni (Ci- x ) (Ci- x )^2 (Ci- x )^2*ni
Rodeo en gramos
[130-140] 135 1 135 -25 625 625
[150-160] 155 3 465 -5 25 75
[160-170] 165 2 330 5 25 50
[170-180] 175 2 350 15 225 450
n 8
Σ(Ci*ni) 1280
Σ((Ci- x )^2*ni) 1200
S^2 150
S 12,25
Cv (%) 7,65
Variedad Intervalo (Ci- x ) (Ci- x ¿2 (Ci- x ¿2*ni
Ci ni Ci*ni
Yagana en gramos
[100-110] 105 1 105 -13 178 178
[110-120] 115 3 345 -45 2025 6075
[120-130] 125 2 250 -35 1225 2450
n 6
Σ(Ci*ni) 700
Σ((Ci- x ¿2*ni) 8703
S^2 1450
S 38,08
Cv (%) 32,18

Intervalo
Variedad en Ci ni Ci*ni (Ci- x ) (Ci- x ¿2 (Ci- x ¿2*ni
Rodeo centímetros

[5-6] 5,5 1 6 -3 6 6
[7-8] 7,5 3 23 -1 0 1
[8-9] 8,5 2 17 1 0 1
[9-10] 9,5 2 19 2 2 5
n 8
Σ(Ci*ni) 64
Σ((Ci- x ¿2*ni) 12
S^2 1,50
S 1,22

Cv (%)  15,31
Intervalo
Variedad
en Ci ni Ci*ni (Ci- x ) (Ci- x ¿2 (Ci- x ¿2*ni
Yagana
centímetros

[5-6] 5,5 1 6 -2 4 4
[6-7] 6,5 1 7 -1 1 1
[7-8] 7,5 1 8 0 0 0
[8-9] 8,5 3 26 1 1 3
n 6
Σ(Ci*ni) 45
Σ((Ci- x ¿2*ni) 8
S^2 1,33
S 1,15
Cv  15,40

Para la variedad de rodeo y el peso la variación de la


población con respecto a la media no es significativa, lo que
indica que existe muy poca dispersión en los datos; también
se comprueba que la población no tiene variabilidad, ya que
el coeficiente de variación es relativamente bajo. En el caso
de la variedad de color amarilla (yagana)y el peso, se
observa que la población es bastante variable con respecto a
la media, por lo tanto, la desviación estándar indica que los
datos se encuentran bastantes dispersos; al analizar el
coeficiente de variación se estima que es bastante alto, por
lo que la población es variable.
En el caso de la variedad el rodeo y el calibre, la variación
de la población con respecto a la media, no es significativa;
la varianza presenta un valor muy bajo lo que indica que los
datos tratados no se encuentran tan dispersos con respecto a
la media. Por otro lado, sé corrobora que la población no
tiene variabilidad, ya que el coeficiente de variación es
relativamente bajo. Por último se observa que para la
variedad yagana y el calibre ocurre lo mismo con respecto a
las variables de dispersión.

 Para las variables cuantitativos se determina el


coeficiente de simetría de Pearson, a partir de la siguiente
ecuación:

x−M o
Ap=
S

Por consiguiente, para la variedad rodeo roja y su relación


con el peso, se obtiene:

( 160−1 56,7 )
Ap= =0,2 722
12,25

Por lo tanto, se deduce que la distribución es asimétrica


positiva y se sesga hacia la izquierda.

Para la variedad rodeo roja y su relación con el calibre, se


obtiene:

( 8−7,7 )
Ap= =0,2722
1,22

De igual manera, la distribución es asimétrica positiva y se


sesga hacia la izquierda.

Finalmente, para la variedad yagana amarilla y su relación


con el peso, se obtiene:
( 118,3−122,5 )
Ap= =−0,1 094
38,08

Se observa, que la distribución es asimétrica negativa y se


sesga hacia la derecha.

De igual manera, para la variedad yagana amarilla y su


relación con el calibre, se obtiene:

( 7,5−8,4 )
Ap= =−0,7 794
1,15

Se estima, que la distribución es asimétrica negativa y se


sesga hacia la derecha.

 Para las variables cuantitativos se crea un gráfico de


cajón con bigotes, como sigue:

Variedad
Rodeo Valores Ancho

Ci (g) Mínimo 135 135


135 q1 150 15
155 q2 160 145
165 q3 168 23
175 Máximo 175 153
Variedad
Valores Ancho
Yagana
Ci (cm) Mínimo 5,5 5,5
5,5 q1 6 1

6,5 q2 7 6

7,5 q3 8 2
8,5 Máximo 8,5 7
V. Conclusión

Tras la recolección y el procesamiento de los datos, se


aprecia que el peso y el calibre de cada una de las
variedades existe uniformidad en los datos recolectados,
generando mayor rendimiento en el procesamiento del producto
y simplificando la elección del producto por parte del
consumidor.

La importancia del estudio estadístico en la agronomía radica


en que esta es una ciencia formal que estudia la recolección,
análisis e interpretación de datos de una muestra
representativa, lo que facilita la toma de decisiones, para
explicar condiciones regulares o irregulares de algún
fenómeno o estudio aplicado, de ocurrencia en forma aleatoria
o condicional.

En este caso, se determina que las dos variedades en estudio


presentan comportamientos similares, son equitativas, tanto
las variables cualitativas como cuantitativas para cada
tubérculo, lo que permite resaltar la importancia del estudio
de las variables estadísticas en la agronomía. Esta
continuidad permite establecer una relación satisfactoria
entre el productor y el consumidor.

Se mantiene presente la idea de que para estudiar fenómenos


agronómicos aleatorios, detectar diferencias entre grupos de
unidades o estudiar relaciones entre variables, es necesario
para medir más de un individuo o caso y que la cantidad de
casos en la muestra depende de varios factores como lo son la
variabilidad de las mediciones, la magnitud de las
diferencias que se estudian y el grado de asociación entre
variables. Cuando la variabilidad de los datos es baja o las
diferencias que se esperan encontrar son grandes o las
relaciones muy obvias, el análisis de pocos casos (bajo
tamaño muestral) podría ser suficiente para logar una buena
conclusión.
VI. Bibliografía

 Barón, J. y Rius, F. (2005). Bioestadística. Ediciones


Paraninfo, S.A; 1er Edición.

 Kramm, M. y Quilamapu, I. (2017). Manual del cultivo de


la papa en Chile. Instituto de Investigaciones
Agropecuarias.

 Murray, S. y Larry, S. (2009). Estadística. McGraw-


Hill/Interamericana Editores, S.A; 4ta Edición.

También podría gustarte