Está en la página 1de 30

CURSO

“Biología Cuantitativa ”
Doctor en Ciencias Biológicas
José Iannacone Oliver
E-mail:joseiannacone@yahoo.es
GENERALIDADES
El manejo de los datos en Biología como ciencia ha dado
pasos agigantados en su desarrollo y una de las
herramientas que utiliza en la etapas de análisis de datos
es la estadística, la cual provee la confirmación o el
rechazo de nuestras hipótesis planteadas en las
investigaciones en el Laboratorio.
Por lo tanto La Estadística es un campo de estudio
relacionado con:
•La recopilación, organización y resumen de los datos.
•La obtención de inferencias acerca de un conjunto de
datos cuando sólo se observa una parte de ellos,
sacando conclusiones.
Existe la tentación de recoger más información de la
necesaria por la posibilidad de que resulte útil en le
presente estudio o en otro futuro, aunque ello puede
suponer importantes desventajas. La recogida de
datos cuesta dinero y , aunque el costo que
representa recoger información extra de un dato,
puede ser relativamente bajo, dicho costo siempre
debe tenerse en cuenta. La desventaja más
importante consiste en que la obtención de
información útil marginal puede desvirtuar el valor
de datos esenciales. Pues si un Investigador, realiza
100 mediciones en un día, será menos cuidadoso
que en el caso de requerir sólo 30.
CONCEPTOS BÁSICOS

Variable: Una característica que toma valores distintos.


Ejemplo: el número placas positivas a Vibrio.
Variable Cualitativa o categórica incluye aquellas
características que no pueden ser medidas en el sentido que
se miden las variables Cuantitativas. Ejm1. Tipos de
parásitos en una muestra de agua residual. Ejm2. Tipos de
metales presentes en una muestra de suelo.

Una Variable Cuantitativa es aquella que puede medirse


en forma habitual, en cantidades numéricas, por lo general
medidas o recuentos. Ejm. Número de hojas en una planta.
Las variables cuantitativas se dividen en:
Variable Aleatoria Discreta Se caracteriza por
saltos o interrupciones en los valores que esta
puede tener. Ejm. Número colonias de Enterococo
fecal en aguas residual.
En cambio la Variable Aleatoria Continua, no
posee los saltos o interrupciones que caracterizan
a una variable aleatoria discreta. Ejm. Diámetro
de la colonia de un hongo patógeno.
Variable interválica: tiene distancias iguales
entre sus valores. Ejm. % Parasitismo.
Las variables Cualitativas se dividen en:
Variable Nominal: consiste en categorías
a las que se asigna un nombre sin que
exista ningún orden implícito entre ellas.
Ejm. Sexo de personas; Tipo de
Enterobacterias, Tipo de metales pesados.
Variable Ordinal: consiste en categorías
ordenadas. Ejm. No. de enteroparásitos en
suelos de parques urbanos
estacionalmente (verano, otoño, invierno,
primavera).
La Población se define como el mayor grupo de
elementos por los cuales se tiene un cierto interés en un
momento dado.
La Muestra es una parte de la población.
DATOS AGRUPADOS PARA DATOS
INTERVÁLICOS:
LA DISTRIBUCION DE FRECUENCIAS
Un conjunto de observaciones puede hacerse más
comprensible y adquirir mayor significado por medio de un
arreglo ordenatorio.
Para agrupar a un conjunto de observaciones, se
selecciona un conjunto de intervalos contiguos que no se
traslapen de modo que cada valor en el conjunto de
observaciones puede colocarse en uno, y solo uno de los
intervalos.
♦ Estos intervalos se conocen en general
como Intervalos de clase. Como
recomendación para el cálculo de los
intervalos de clase, se puede usar la
fórmula de Sturges:
♦ K = 1 + 3,322 (log10n),
♦ donde K representa el número de valores
en el conjunto de datos bajo
consideración.
Otra cuestión que debe decidirse se refiere a la amplitud
de los intervalos de clase los cuales en general deberían
tener la misma amplitud.
Simbólicamente la amplitud del intervalo de clase esta
dada por:
♦ W = R/K
donde R (el recorrido) es la diferencia entre la
observación más pequeña y más grande en el conjunto
de datos.
Sin embargo para todos los casos debe aplicarse el buen
juicio y seleccionar un intervalo de clase y una amplitud
que sea más conveniente.
La Tabla donde se colocan el número de
valores que caen en cada intervalo se conoce
como Distribución de Frecuencias.
Pudiendo determinarse la frecuencia,
Frecuencia acumulada de los valores dentro de
cualquiera de los intervalos de clase.
A veces puede ser útil conocer la proporción de
valores que caen dentro de un determinado
intervalo de clase.
Determinándose la frecuencia relativa y la
relativa acumulada.
Ejercicio No. 1. Número de total de
especies de fitonemátodos contados en
el Laboratorio presentes en 30 muestras
de suelo de una plantación de Cacao
durante de la cosecha en Tingo María
bajo el tratamiento con Gliocladium.
2, 6, 7, 4, 5, 9, 7, 4, 5, 14, 0, 11, 1, 6, 6, 14,
6, 8, 4, 5, 15, 8, 5, 10, 18, 2, 13, 5, 9, 7.
Determinar :
Tabla de Distribución de frecuencias.
Tipo de gráfico a emplear.
Rangos de clase Marcas de clase Frecuencia relativas
0a2 1,5 4
3a5 4,5 8
6a8 7,5 9
9 a 11 10,5 4
12 a 14 13,5 3
15 a 18 16,5 2
Total 30

Tabla.- Distribución de frecuencias de número


de especies de fitonemátodos en muestras de suelo
GRAFICOS DE DATOS
El Histograma o diagrama de barras es la representación
gráfica de una distribución de frecuencias relativas. Los
valores de la variable en consideración constituyen el eje
horizontal, mientras que el eje vertical tiene una escala a la
frecuencia o frecuencia relativa. Se usa generalmente
barras rectangulares.
Para datos nominales mayormente, pero se puede usar
para datos interválicos y ordinales.
El diagrama de puntos (una variante del diagrama de
barras) es particularmente útil, cuando hay un gran
número de categorías. En lugar de colocar una barra se
coloca un punto grueso exactamente en lugar en que
terminaría aquella.
Generalidades
El Polígono de frecuencias es otro tipo de
representación gráfica de una distribución de
frecuencias.
Para trazar un polígono de frecuencias se hace una
marca primero en los punto medios de la parte
superior de cada una de las barras que representan
los intervalos de clase sobre el eje horizontal de la
gráfica.
Uniendo los puntos por líneas rectas se obtiene el
polígono de frecuencias.
Para datos interválicos. Mayormente no se usan
para datos ordinales o nominales.
Generalidades: Histograma
% de muestras con Cobre (Cu2+) sobre los límites permisibles en en
Lago Junín en seis localidades comparativos durante el período
Enero- Diciembre del 2001.

Pari2

Upamayo

Puente
% muestras sobre LMP

Represa

Pari

Ondores

0 5 10 15 20 25
Generalidades: Polígono
de Frecuencias
Frecuencia de fitonemátoso presentes en el suelo del árbol de
Cacao, que quedan durante de la cosecha.

10
N= 30
9 9
K= 5,9
8 8
R= 18 - 0
7 W= 3
6

5 Frecuencia

4 4 4

3 3

2 2

0
0 5 10 15 20
Generalidades: Polígono
de Frecuencias relativas
Frecuencia relativa de fitonemátodos presentes en el árbol de
Cacao, que queda durante de la cosecha.

35

30 30

26.67
25

20 Frecuencia relativa

15
13.33 13.33

10 10

6.67
5

0
0 5 10 15 20
Generalidades: Polígono
de Frecuencias absolutas
Frecuencia absoluta de fitonemátodos presentes en el árbol de
Cacao, que queda durante la cosecha.

120

100 100
93.33

80 80
70 Frecuencia absoluta

60

40 40

20
13.33

0
0 5 10 15 20
Estadística Descriptiva en
Biología Cuantitativa
Medidas de Tendencia Central
♦ Es un tipo de medidas descriptivas en las que se tiene un solo valor que se
considera como típico del conjunto de datos como un todo. Las cuatro
medidas de tendencia central que más se utilizan son:
♦ - la media aritmética,
♦ - la media geométrica,
♦ - la mediana,
♦ - y la moda.
♦ Media Aritmética: es la medida de tendencia central mas conocida. La media
se obtiene sumando todos los valores en una población o muestra y
dividiendo el valor obtenido entre el número de valores que se sumaron.
♦ N

♦ x=u=ΣX/N
• i=1
Generalidades
Medidas de Tendencia Central
♦ - La mediana. Si las observaciones se disponen en orden
creciente o decreciente. La mediana es la observación
central. Si el número de observaciones, n, es impar,
existirá una única mediana: la observación que ocupe la
posición (n+1)/ 2 a partir de cada extremo. Si n es par no
existe en rigor una observación central y, en este caso.
La mediana se define por convención como la media de
las dos observaciones centrales. Suele ser útil para el
trabajo descriptivo y cuando la distribución de los datos
es asimétrica.
♦ - La moda. Es el valor de la variable en la que la curva de
frecuencias alcanza el máximo.
Generalidades
♦ Media Geométrica (MG) puede ser calculada como el antilogarítmo de la
suma promedio de los logarítmos de la media aritmética de los datos. Esto
es apropiado solo cuando todos los datos son valores positivos. La
media Geométrica puede ser calculada también como la raíz a la n del
producto de los n datos.
♦ n __________________ n__
♦ MG= √ (X1 X2X3...Xn ) = √ π xi
♦ π= Producto de los datos.
♦ La Media Geométrica es un parámetro ampliamente usada como un
Indicador de Conteos Bacterianos o de hongos productores de esporas
y se sabe que todos estos datos siguen una distribución log-normal. Si
algunos de los conteos son cero (como regularmente sucede durante los
conteos microbiológico), la estimación de la media geométrica requiere una
manipulación matemática de los datos, como una transformación log
X+1.
Generalidades
♦ Medidas de Dispersión
♦ La dispersión de un conjunto se observaciones se refiere a la variedad que
exhiben los valores de las observaciones.
♦ El recorrido es una forma de medir la variación de un conjunto de valores.
de las observaciones. La Varianza mide el grado de dispersión de un
conjunto de observaciones en torno a su media.
♦ n
♦ S2= Σ (X1 -X)2 / n-1
♦ i=1
♦ S2 = Varianza de la muestra
♦ n-1 = Es una consideración teórica conocida como los grados de libertad.
♦ n n
♦ S2= n Σx2- (Σ
Σxi)2 / n(n-1) n-1 más apropiada.
♦ i =1 i=1
Generalidades
♦ Desviación Estándar es la raíz cuadrada de la
varianza. Es más usada que la varianza, por
encontrarse esta última medida de dispersión en
unidades cuadradas. S = √ S2
♦ El Coeficiente de Variación (C.V.) es una medida
de dispersión que expresa a la desviación
estándar como un porcentaje de la media.
♦ C.V.= S/x . 100
♦ El Coeficiente de Variación es una medida
independiente de la unidad de medición.
Adimensional. Se le llama Desviación estándar
relativo.
Generalidades
♦ Medidas de la media calculadas a partir de datos
agrupados.- Primero es necesario calcular el punto medio
del intervalo o clase. El punto medio de un intervalo se
obtiene calculando la media de los límites superior e inferior
del intervalo. X= Σmifi/ Σfi X= media mi= Punto medio
de la clase mi
♦ fi= Frecuencia de la clase fi
♦ La Varianza y la desviación Estándar: Datos Agrupados
♦ La varianza de una muestra con datos agrupados esta dada
por la expresión:
♦ S2 = nΣ mi2 fi -(Σ mifi)2 / n(n-1)
♦ n = Σfi
♦ La desviación estandar es S = √ S2
TRANSFORMACIÓN DE DATOS
♦ Transformación Logarítmica
♦ En muchas ocasiones para la aplicación de un
análisis de varianza paramétrica u otros procedimientos
estadísticos ciertas transformaciones logarítmicas son
necesarias realizar, tales como:
♦ X = log X ó X = log (X+1)
♦ esta última es preferible cuando algunos de los valores
observados son muy pequeños (particularmente cero), lo
cual es bastante frecuente en conteos microbianos en
análisis de laboratorio. El logaritmo en base 10 es
generalmente utilizados.
♦ También se realiza transformación logarítmica cuando
las varianzas de 2 o más muestras no son estadísticas
iguales.
♦ Si la distribución de X es normal, entonces la distribución
de X se dice que es log normal.
Transformación Raíz Cuadrada
Es un tipo de transformación aplicable en datos
biológicos cuando las muestras son tomadas de
una distribución de Poisson. Esta transformación
es como sigue:
X = √ (X + 0,5)

la cual es preferible a X = √X, especialmente


cuando los datos son muy pequeños o cuando
algunas de las observaciones son cero.
♦ Transformación Arco-Seno
♦ Es un tipo de transformación aplicable a
los porcentajes o proporciones de muestras
tomadas de una distribución binomial. La
cual es dada por la siguiente fórmula:
♦ p = arcoseno √p
♦ p = proporción o porcentaje.
A partir del ejercicio No 1 calcular:
Media aritmética = 7,2
Media geométrica = 8,18
Varianza = 17,89
Desviación estándar = 4,23 (n) /4,31 (n-1)
Coeficiente de variación= 59,86%.
La Estadística
PROMEDIO, descriptiva es clave:
Un solo número
representativo;
DISPERSIÓN,
GRADO DE VARIACIÓN
ALREDEDOR DE LA
MEDIA;

DISTRIBUCIÓN DE
FRECUENCIAS,
GRÁFICAS.
ANEXOS

• Números Aleatorios
• Desviación Media (Pdf)

También podría gustarte