Está en la página 1de 66

FRECUENCIA ABSOLUTA

La frecuencia absoluta es el número de veces que aparece un


determinado valor en un estudio estadístico.
ESTADISTICA DESCRIPTIVA

fi = Frecuencia absoluta

La suma de las frecuencias absolutas es igual al número total de


datos, que se representa por n. (número de valores)

fi+fi+fi+fi = n
UTEQ
FRECUENCIA RELATIVA Y RANGO

La frecuencia relativa es el cociente entre la frecuencia


absoluta de un determinado valor y el número total de datos
ESTADISTICA DESCRIPTIVA

El rango es la diferencia entre el mayor y el menor de los valores


obtenidos de una muestra o población
UTEQ
Gráficos diferenciales para variables numéricas

 Son diferentes en función de que las variables


sean discretas o continuas. Valen con frec.
absolutas o relativas.
ESTADISTICA DESCRIPTIVA

 frec. Absolutas. Representan un valor numérico

 frec. relativas. Representan un valor numérico


expresado en %
UTEQ
Gráficos diferenciales para variables numéricas
419
400 375

◦ Diagramas barras para v. discretas


300

255

Recuento
215

 Se deja un hueco entre barras para 200

indicar los valores que no son posibles


127
ESTADISTICA DESCRIPTIVA

100

54
24 23 17

0 1 2 3 4 5 6 7 Ocho o más

Núme ro de hijos

◦ Histogramas para v. Discretas y


250

continuas 200

Recuento
 El área que hay bajo el histograma entre 150

dos puntos cualesquiera indica la 100

cantidad (porcentaje o frecuencia) de


UTEQ

50

individuos en el intervalo.
20 40 60 80

Edad del e ncue stado


Gráficos diferenciales para variables numéricas

Diagrama de Frecuencias absolutas


Frecuencia

6
ESTADISTICA DESCRIPTIVA

0
59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97
UTEQ

DAP

No olvidar: Colocar las variables en sus respectivos ejes


Gráficos diferenciales para variables numéricas
Histograma de Clases Diamétricas para Plantación Forestal
ESTADISTICA DESCRIPTIVA
UTEQ
Gráficos diferenciales para variables numéricas
Histograma de Clases Diamétricas para Bosque Nativo
ESTADISTICA DESCRIPTIVA
UTEQ
EJEMPLO
Valores de una muestra de 48 días correspondiente al
numero de visitantes dentro de un área protegida
75 82 68 90 62 88 xi fi
88 73 60 93 71 59 59 1
75 87 74 62 95 78 60 2
82 75 94 77 69 74
61 1
62 3
89 61 75 95 60 79
63 1
97 97 78 85 76 65 65 1
73 67 88 78 62 76
ESTADISTICA DESCRIPTIVA

67 1
73 81 72 63 76 75 68 1
69 1
Para determinar la frecuencia Absoluta fi : 71 1
72 1
1.- Se ordenan los datos en forma creciente o ascendente. 73 3
2.- Se determina el número de veces que se repite cada valor. 74 2
75 5
dentro de la muestra. 76 3
77 1
Diagramas barras 78 3
5 79 1
fi 81 1
82 2
4
85 1
87 1
3 88 3
UTEQ

89 1
2
90 1
93 1
94 1
1 95 2
97 2
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98

Producto Silvícola
EJEMPLO
xi xifi fin n fr fr
Rango 59 591 148 81000
48 2.08
60 602 248 48
4.17 4.17
61 611 148 48
2.08 2.08
Es la diferencia entre el mayor y el menor de los
62 623 348 48
6.25 6.25
valores obtenidos en nuestro ejemplo: 63 631 148 48
2.08 2.08
65 651 148 48
2.08 2.08
Rango 97 – 59 = 38 67 671 148 48
2.08 2.08
68 681 148 48
2.08 2.08
ESTADISTICA DESCRIPTIVA

69 691 148 48
2.08 2.08
71 711 148 48
2.08 2.08
Frecuencia relativa 72 721 148 48
2.08 2.08
73 733 348 48
6.25 6.25
74 742 248 48
4.17 4.17
Se encuentra como el cociente entre la frecuencia 75 755 548 48
10.42 10.42
absoluta de un determinado valor y el total de 76 763 348 48
6.25 6.25
observaciones. 77 771 148 48
2.08 2.08
78 783 348 48
6.25 6.25
79 791 148 48
2.08 2.08
Formula de frecuencia Relativa expresada en porcentaje 81 811 148 48
2.08 2.08
82 822 248 48
4.17 4.17
85 851 148 48
2.08 2.08
87 871 148 48
2.08 2.08
88 883 348 48
6.25 6.25
89 891 148 48
2.08 2.08
UTEQ

90 901 148 48
2.08 2.08
93 931 148 48
2.08 2.08
94 941 148 48
2.08 2.08
95 952 248 48
4.17 4.17
97 972 248 48
4.17 4.17
Σ 100.00
Σ 100.00
Al final un método de prueba es la suma de todas las frecuencias relativas cuyo valor
será 100 o su respectiva aproximación.
FRECUENCIAS DE CLASE

Frecuencia de clase

El histograma nos da para cada valor el total de observaciones o su frecuencia la


construcción de este grafico cuando se trabaja con un gran número de datos
resulta muy laborioso es por eso que se recurre a agrupar los datos en clases o
ESTADISTICA DESCRIPTIVA

categorías y determinar el número de valores correspondientes a cada clase, a


esto se le denomina frecuencia de clase.

Intervalo de clase
Al analizar nuestro ejemplo observamos que las 48 frecuencias obtenidas
mediante el ordenamiento anterior son excesivas para visualizar el problema por
ello se agrupan los datos en clases. Cada clase contiene un número fijo de valores
posibles, para nuestro ejemplo vamos a elegir el tamaño de Intervalo de clase 5 y
entonces obtenemos la siguiente agrupación de datos.
UTEQ

Tamaño de Intervalo de clase 5


Número de Intervalos de clase = rango / tamaño de clase
= 38/5 = 7,6 8
Los intervalos de clase son siempre números enteros
MÉTODO GENERAL PARA DISTRIBUCIÓN DE FRECUENCIAS

•Dividir el rango en un número conveniente de intervalo de clase


del mismo tamaño. (5 para nuestro ejemplo). xi fi
59 1
•Determinar el número de observaciones que cae dentro de 60
61
2
1
cada intervalo de clase es decir es decir encontrar la frecuencia 62 3
de clase. 63
65
1
1
ESTADISTICA DESCRIPTIVA

67 1
68 1
frecuencia 69 1
intervalo Frecuencia frecuencia
acumulada 71 1
de clase de clase acumulada 72 1
relativa
73 3
74 2
54-58… 75 5
59-63… 8 8 16,66666667 76 3
77 1
64-68… 3 11 22,91666667 78 3
69-73… 6 17 35,41666667 79 1
74-78… 14 31 64,58333333 81 1
82 2
79-83… 4 35 72,91666667 85 1
84-88… 5 40 83,33333333 87 1
89-93… 3 43 89,58333333 88 3
UTEQ

89 1
94-98… 5 48 100
90 1
99-104 93 1
94 1
95 2
97 2
HISTOGRAMA Y POLIGONO DE FRECUENCIAS DE CLASE
Histograma y polígono de frecuencia
Son dos representaciones graficas de la distribución de frecuencias está formada por lo general por una serie de
rectángulos que tienen sus bases sobre un eje horizontal (eje x) e iguales al ancho de un intervalo de clase su altura
tiene el valor de la frecuencia que le corresponda (HISTOGRAMA)

Polígono de frecuencia
Es un gráfico de líneas trazadas sobre el punto medio de cada clase, se obtiene uniendo los puntos medios de los
extremos superiores de cada rectángulo por lo general se acostumbra a prolongar el polígono hasta los puntos medios
inferiores de las clases inmediatas.
ESTADISTICA DESCRIPTIVA

Histograma

12.5

10.0
Frecuencia

7.5
14

5.0
UTEQ

6
2.5 5 5
4
3 3

Media =76.92
0.0 Desviación típica =10.792
N =48
53.00
55.00
57.00
59.00
61.00
63.00
65.00
67.00
69.00
71.00
73.00
75.00
77.00
79.00
81.00
83.00
85.00
87.00
89.00
91.00
93.00
95.00
97.00
99.00
101.00
103.00
105.00
107.00
Universidad Técnica Estatal de Quevedo

DISEÑOS FACTORIALES

Se llaman Diseños Factoriales a aquellos experimentos en los que se estudia simultáneamente dos o
más factores, y donde los tratamientos se forman por la combinación de los diferentes niveles de
cada uno de los factores.

Los Diseños factoriales en si no constituyen un diseño experimental si no que ellos deben ser
llevados en cualquiera de los diseños tal como D.C.A; D.B.C.A; D.C.L.

Los diseños factoriales se dividen en diseños factoriales simples y diseños factoriales complejos.
Estos pueden ejecutarse en cualquiera de los diseños simples o clásicos hasta ahora desarrollados,
es decir, que se pueden tener diseños factoriales en un diseño completamente al azar, en bloques
completamente al azar y en cuadrado latino. De igual forma se puede hacer en los diseños
factoriales complejos, todo depende de las características del material experimental que se utilice
en el experimento.

Los Diseños factoriales se emplean en todos los campos de la investigación, son muy útiles en
investigaciones exploratorias en las que poco se sabe acerca de muchos factores.

Los diseños factoriales se utilizan para estudiar los efectos en una respuesta o salida de al menos
dos variables o factores cuando éstos cambian de valor simultáneamente.

Si tenemos k factores y se elige variar cada uno a mk niveles, el número de combinaciones


experimentales es de m1· m2 · m3 · … · mk

En función del número de factores que se estudien, los diseños factoriales pueden ser bifactoriales,
trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto de interpretación.

El concepto Factorial.

2 factores a 3 y 5 niveles cada uno

Bioestadística 1
Universidad Técnica Estatal de Quevedo

Arreglo combinatorio

Como se ha mencionado anteriormente, un factor es una clase de tratamiento que genera más
tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro de un factor y
arreglo combinatorio se refiere a la combinación de los niveles de los factores en estudio. Suponga
que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B con cuatro niveles (b1, b2, b3,
b4). En este caso se tiene un experimento bifactorial 3 x 4. El arreglo combinatorio de estos dos
factores sería el que se muestra en el siguiente cuadro.

Cuadro 1. Arreglo combinatorio bifactorial 3 x 4.

FACTOR B
FACTOR A
b1 b2 b3 b4
a1 a1b1 a1b2 a1b3 a1b4
a2 a2b1 a2b2 a2b3 a2b4
a3 a3b1 a3b2 a3b3 a3b4

En el ejemplo de arreglo combinatorio expuesto líneas arriba, se lleva a cabo en un diseño o arreglo
completamente al azar, entonces su modelo aditivo lineal sería el siguiente:

𝑌𝑖𝑗𝑘= μ+𝐴𝑖+𝐵𝑗+ 𝐴∗𝐵 𝑖𝑗+𝐸𝑖𝑗𝑘;

𝑑𝑜𝑛𝑑𝑒:
Yijk = Variable respuesta
μ = Efecto común a todas las observaciones
Ai = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor A
Bj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B
(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor B
Eijk = Error del modelo

En este diseño se prueban hipótesis tanto para el factor A, factor B y para las interacciones, bajo la
misma tipología desarrollada en este documento (hipótesis nula e hipótesis alternativa). En caso de
rechazo de la hipótesis nula, se debe hacer prueba de rangos múltiples según sea el caso.

Un cuadro de organización de información para un diseño bifactorial un arreglo completamente al


azar se muestra a continuación.

Bioestadística 2
Universidad Técnica Estatal de Quevedo

Cuadro 2. Cuadro de organización de información para un diseño bifactorial


3x4 en un arreglo completamente al azar con cuatro repeticiones.

FACTOR REPETICIONES
FACTOR A ∑yij
B 1 2 3 4
b1 a1b11 a1b12 a1b13 a1b14 a1b1
b2 a1b21 a1b22 a1b23 a1b24 a1b2
a1
b3 a1b31 a1b32 a1b33 a1b34 a1b3
b4 a1b41 a1b42 a1b43 a1b44 a1b4
b1 a2b11 a2b12 a2b13 a2b14 a2b1
b2 a2b21 a2b22 a2b23 a2b24 a2b2
a2
b3 a2b31 a2b32 a2b33 a2b34 a2b3
b4 a2b41 a2b42 a2b43 a2b44 a2b4
b1 a3b11 a3b12 a3b13 a3b14 a3b1
b2 a3b21 a3b22 a3b23 a3b24 a3b2
a3
b3 a3b31 a3b32 a3b33 a3b34 a3b3
b4 a3b41 a3b42 a3b43 a3b44 a3b4

De este cuadro se extrae la información de los efectos principales y secundarios (interacciones)

Cuadro 3. Información de los efectos principales y de las interacciones para un


diseño bifactorial 3x4 en un arreglo completamente al azar con
cuatro repeticiones

FACTOR B
FACTOR A ∑yi
b1 b2 b3 b4
a1 a1b1 a1b2 a1b3 a1b4 y1
a2 a2b1 a2b2 a2b3 a2b4 y2
a3 a3b1 a3b2 a3b3 a3b4 y3
∑yj y1 y2 y3 y4

Ejemplo:

Se compara el crecimiento y desarrollo de una especie de gramínea utilizada en fitorremediación


en tres diferentes estratos de suelo Factor A (a1, a2 y a3) de cuatro diferentes tipos de dosis de
fertilizantes elaborados con diferentes combinaciones de (N, P, K, Na y Mg) Factor B (b1, b2, b3
y b4) se realizaron cuatro repeticiones en un arreglo completamente al azar, siendo la variable de
respuesta la cantidad de materia orgánica en estado seco en Kg.

Bioestadística 3
Universidad Técnica Estatal de Quevedo

Cuadro 4. Cuadro de organización de información de la variable de respuesta


para un diseño bifactorial 3x4 en un arreglo completamente al azar
con cuatro repeticiones.

FACTOR REPETICIONES
FACTOR A ∑yij
B 1 2 3 4
b1 18 19 17 20 74
b2 20 24 29 30 103
a1
b3 30 28 29 32 119
b4 31 33 26 28 118
b1 21 18 19 22 80
b2 25 29 32 29 115
a2
b3 27 29 31 35 122
b4 29 26 32 27 114
b1 30 28 24 25 107
b2 31 33 29 34 127
a3
b3 28 25 32 31 116
b4 28 31 34 35 128

Cuadro 5. Información de los efectos principales y de las interacciones para


un diseño bifactorial 3x4 en un arreglo completamente al azar
con cuatro repeticiones

FACTOR B
FACTOR A ∑yi
b1 b2 b3 b4
a1 74 103 119 118 414
a2 80 115 122 114 431
a3 107 127 116 128 478
∑yj 261 345 357 360

Siendo

∑ 𝑖= Sumatoria de Factor A
∑ 𝑗 = Sumatoria de factor B
∑ 𝑖𝑗 = Sumatoria del producto de los factores A y B.

∑ 𝑖= Suma de cada uno de los valores del cuadro Nº 4 (18, 19, 17,…..31, 34, 35)
2 2
∑ 𝑖 = Suma de cada uno de los valores del cuadro Nº 4 elevados al cuadrado (18 , 19 ,
17 ,…..31 , 34 , 35 )
2 2 2 2

(∑ 𝑖) = Suma de ∑ 𝑖 elevado al cuadrado

Con esta información procedemos a calcular los valores para el análisis de varianza

Bioestadística 4
Universidad Técnica Estatal de Quevedo

(∑ ) ( )
𝐶= ∗ ∗
= ∗ ∗
= 36465,19

𝐶 𝑜 𝑙𝑒 = ∑ 𝑖 𝐶 = 37569,00 - 36465,19 = 1103,81

(∑ )
𝐶𝐴 = ∑ 𝐶 = = =

(∑ )
𝐶𝐵 = ∑ ∗
𝐶 = = 37016,25 =

(∑ )
𝐶𝐴𝐵 = ∑ 𝐶 ( 𝐶𝐴 + 𝐴𝐶𝐵) = ( + )

= –( ) =

𝐶𝐸 𝑜 = 𝐶 𝑜 𝑙𝑒 ( 𝐶𝐴 + 𝐶𝐵 + 𝐶𝐴𝐵) = ( + + )=

En función de este diseño el resumen de la varianza queda resumido de la siguiente forma:

FV Gl SC CM Fc Ft
Factor A a-1 𝐶𝐴 CMA=

Factor B b-1 𝐶𝐵 CMB=



A*B (a-1)(b-1) 𝐶𝐴𝐵 CMAB=

Error ab(r-1) 𝐶𝐸 𝑜 CME=

Total abr-1 𝐶 𝑜 𝑙𝑒

Reemplazando:

FV Gl SC CM Fc Ft 95%
Factor A 2 137,37 68,69 8,36* 3.266

Factor B 3 551.06 183,69 22,35* 2,872

A*B 6 119,63 19,94 2,43* 2,370

Error 36 295,75 8,22

Total 47 1103,81

Posterior al análisis de varianza se concluye que al 95% de confiabilidad existe efecto significativo
en la cantidad de materia orgánica en estado seco acumulada en la especie de gramínea entre los
diferentes estratos de suelo y las cuatro combinaciones de nutrientes, además también existen
diferencias significativas en la interacción entre ambos factores.

Bioestadística 5
DISEÑO
COMPLETAMENTE
AL
BIOESTADISTICA

AZAR
(DCA)
UTEQ
IDEAS BÁSICAS DEL DISEÑO EXPERIMENTAL

Antes de llevar a cabo un experimento, se deben contestar


algunas preguntas:

1. Cuántos tratamientos se van a estudiar?

2. Cuántas veces se va a observar cada


tratamiento?
BIOESTADISTICA

3. Cuáles son las unidades experimentales?

4. Cómo aplica el experimentador los tratamientos a


las u.e. disponibles y luego observa las
respuestas?
UTEQ

5. Se puede analizar el diseño resultante y/o se


pueden hacer las comparaciones deseadas?

*u.e. Unidad experimental


IDEAS BÁSICAS DEL DISEÑO EXPERIMENTAL

Considere un experimento que involucra t tratamientos y cada tratamiento


se aplica a r u.e. diferentes.

Un modelo matemático que se puede usar para describir yij , la respuesta


observada de la j-ésima u.e. del i-ésimo tratamiento es:

i = 1, 2, . . . , t (1)
yij = μi + Eij
BIOESTADISTICA

j = 1, 2, . . . , r

Donde

μi = es la media real, pero desconocida, de las respuestas del i-ésimo


tratamiento
UTEQ

Eij = es una variable aleatoria que represental el ruido resultante de


lavariación total y otras posibles fuentes de error aleatorio y no
aleatorio.
IDEAS BÁSICAS DEL DISEÑO EXPERIMENTAL

Para llevar a cabo este experimento, el investigador


debe seleccionar r t u.e. y asignar aleatoriamente cada
tratamiento a r de las u.e.

El uso de la aleatorización es muy importante ya que


BIOESTADISTICA

previene la introducción de sesgos sistemáticos en el


experimento. Si el investigador no usa la
aleatorización, entonces no puede decir si una
diferencia observada se debe a diferencias entre los
tratamientos o se debe al método sistemático usado
UTEQ

para asignar los tratamientos a las u.e.


IDEAS BÁSICAS DEL DISEÑO EXPERIMENTAL

Ya que el objetivo de un experimento es comparar la


respuesta observada en las u.e. de los tratamientos,
entonces, mientras más parecidas sean las u.e. mejores
serán las comparaciones entre los tratamientos.
BIOESTADISTICA
UTEQ
ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

1. Estructura de tratamientos.
Tipos de estructuras de tratamientos

2. Estructura de diseño.
Tipos de estructura de diseño.
BIOESTADISTICA
UTEQ
ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

1. ESTRUCTURA DE TRATAMIENTOS.

Es el conjunto de tratamientos, combinación de los niveles de los


factores bajo estudio, o poblaciones que son seleccionadas por el
investigador para comparar.
BIOESTADISTICA

La estructura de tratamientos puede ser un conjunto de


tratamientos, llamada estructura de tratamientos unifactorial (de
una vía, one-way), o un conjunto de combinaciones de niveles
como un arreglo factorial de 2 factores (vías) o de mayor orden.
UTEQ

El DCA es unifactorial (de una vía, one-way)


ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

2. ESTRUCTURA DE DISEÑO.

Es la forma en que se agrupan las u.e. en conjuntos


homogéneos (bloques).

La estructura de diseño de un experimento involucra el


agrupamiento de las u.e. de tal manera que las condiciones bajo
BIOESTADISTICA

las cuales se observan los tratamientos sean lo más uniformes


posible.

Si todas las u.e. son homogéneas, entonces solo hay un grupo o


bloque de observaciones y las u.e. pueden ser asignadas a los
UTEQ

tratamientos completamente al azar. Esta estructura de diseño se


llama diseño completamente al azar.
ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

Una vez que se seleccionaron las estructura de tratamientos y


de diseño, el diseño experimental se especifica
describiendo exactamente el método de asignación aleatoria
de los tratamientos a la u.e. en la estructura de diseño.
BIOESTADISTICA

La estructura de diseño se selecciona usando toda la


información disponible de las u.e. y se escoge
independientemente de la estructura de tratamientos
UTEQ
ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

TIPOS DE ESTRUCTURA DE DISEÑO.

1. Diseño completamente al azar.

Se supone que todas las u.e. son homogéneas y los


tratamientos se asignan a las u.e. completamente al azar.
BIOESTADISTICA

2. Diseño de bloques al azar (completos).


3. Diseño de cuadro latino.
4. Diseño de bloques incompletos.
5. Combinaciones y generalizaciones.
UTEQ
ESTRUCTURAS DE UN DISEÑO EXPERIMENTAL

TIPOS DE ESTRUCTURAS DE TRATAMIENTOS

1. Estructura de una vía (one way).

Consiste de un conjunto de t tratamientos o poblaciones que


corresponden a los t niveles del factor bajo estudio.
BIOESTADISTICA

2. Estructura de dos vías (two way).


3. Estructura de arreglo factorial.
4. Estructura de arreglo factorial fraccional.
5. Arreglos factoriales con uno o más controles.
UTEQ
UTEQ BIOESTADISTICA
EJEMPLO
EJEMPLO

Son 20 u.e. son Homogéneas? tratamientos se asignan a las u.e.


al azar (son 5 tratamientos)

1 2 3 4 5 1 2 3 4 5
T1 T4 T2 T5 T3
BIOESTADISTICA

6 7 8 9 10 6 7 8 9 10
T2 T2 T1 T5 T4

11 12 13 14 15 11 12 13 14 15
T1 T4 T3 T5 T3

16 17 18 19 20 16 17 18 19 20
T4 T1 T3 T5 T2
UTEQ

Tenemos 5 t con 4 r
EJEMPLO

Procedemos a realizar las evaluaciones de cada u.e. durante el


tiempo de duración del experimento es decir mediremos la variable
de interés o respuesta

Tenemos 5 t con 4 r

1 2 3 4 5
T1 T4 T2 T5 T3
15 14 12 20 17
9
BIOESTADISTICA

6 7 8 10
T5
T2 T2 T1 T4
21
12 13 16 13
11 12 13 14 15
T1 T4 T3 T5 T3
14 12 18 21 17
16 17 18 19 20
T4 T1 T3 T5 T2
12 15 18 20 13
UTEQ

Mapa del experimento

Variable de interés o respuesta: es la variable que se desea estudiar y controlar su


variabilidad.
EJEMPLO Sistematización de la Información
Datos tomados
1 2 3 4 5
T1 T4 T2 T5 T3
15 14 12 20 17
6 7 8 9 10
T2 T2 T1 T5 T4
12 13 16 21 13
11 12 13 14 15
T1 T4 T3 T5 T3
14 12 18 21 17
16 17 18 19 20
T4 T1 T3 T5 T2
BIOESTADISTICA

12 15 18 20 13

Mapa del experimento

Sistematización de la Información
Tratamientos
tratamientos
Repeticiones
T1 T2 T3 T4 T5
UTEQ

I 15 12 17 14 20
II 16 12 18 13 21
III 14 13 17 12 21
IV 15 13 18 12 20
EJEMPLO ANÁLISIS DE LA VARIANZA

tratamientos
T1 T2 T3 T4 T5 Ʃxr
Repeticiones

I 15 12 17 14 20 78
II 16 12 18 13 21 80
III 14 13 17 12 21 77
IV 15 13 18 12 20 78
Ʃxt 60 50 70 51 82
x 15,00 12,50 17,50 12,75 20,50

ΣTi 60 50 70 51 82

(Σti)2
BIOESTADISTICA

3600 2500 4900 2601 6724

n numero de rep. 4 4 4 4 4
N = 20 (Σti)2/n 900,00 625,00 1225,00 650,25 1681,00

Ʃxi = 313 Ʃ(ƩTi)2 = 5081.25


n Suma de los (tratamientos al cuadrado / numero de valores)
Ʃxi2 = 5089
Fc = (Ʃxi)2 = 4898.45
N
SCTotales= Ʃxi2 – (Ʃxi)2 = 5089 – 4898.45 = 190.55
N
UTEQ

SCT= Ʃ(ƩTi)2 – (Ʃxi)2 = 5081.25 - 4898.45 = 182.80


n N

SCE= SCTotales – SCT = 190.55 – 182.80 = 7.75


EJEMPLO Sistematización de la Información

tabla de Anova
Fuente de variación GL SC CM Fc Ft
Tratamiento nt-1 CMT= SCT CMT Valor de la tabla
SCT
n-1 CME F Fisher
Error (N-1) -(nt-1) CME = SCE
SCE
(N-1) -(n-1)
Total N-1 SCTOTALES
BIOESTADISTICA
UTEQ
TABLA F DE FISHER

El valor lo vemos en la tabla


F Fisher al 95% de
Probabilidad.

V1 = 4 Gl tratamientos
V2 = 15 Gl Error
ESTADISTICA
UTEQ
EJEMPLO Sistematización de la Información
BIOESTADISTICA

Como F0,05(4,15) =3,056 y 88,452>3,056 rechazamos la hipótesis nula y


concluimos que los resultados de los tratamientos son diferentes (es decir
existe diferencia significativa en los tratamientos)

El valor observado en la tabla F Fisher

A través del análisis estadístico se ha demostrado que existen diferencias


UTEQ

significativas entre los tratamientos (conclusión)


(falta determinar si existen esas diferencias entre todos los tratamientos o en uno de
ellos con referencia a los demás o de todas las combinaciones posibles)
EJEMPLO Duncan

A través del análisis estadístico se ha demostrado que existen


diferencias significativas entre los tratamientos (conclusión)

Para determinar si existen esas diferencias entre todos los tratamientos


BIOESTADISTICA

o en uno de ellos con referencia a los demás o de todas las


combinaciones posibles usamos las pruebas de comparación de
medias
UTEQ
EJEMPLO Duncan

Método de Duncan

Esta prueba es ampliamente utilizada entre las diversas pruebas de


Rangos Múltiples. Su método es de naturaleza secuencial, lo que quiere
decir, que utiliza un nuevo valor “estudentizado”, para cada una de las
comparaciones de medias adyacentes ordenadas por magnitud en orden
descendente.
BIOESTADISTICA

Esta prueba incluye el cálculo de las diferencias significativas mínima


entre las medias de tratamiento cuando éstas se encuentran dispuestas
en orden de magnitud. La fórmula es la siguiente:
UTEQ
EJEMPLO Duncan

TABLA DE DUNCAN

El valor lo vemos en la tabla


de Duncan al 5% recurrido
significativo

V1 = 5 numero de medias
V2 = 15 Gl Error
BIOESTADISTICA
UTEQ

tratamientos
T1 T2 T3 T4 T5 Ʃxr
Repeticiones
I 15 12 17 14 20 78
II 16 12 18 13 21 80
III 14 13 17 12 21 77
IV 15 13 18 12 20 78
Ʃxt 60 50 70 51 82
x 15,00 12,50 17,50 12,75 20,50
EJEMPLO Duncan

Error Estándar de la media


CME Cuadrado medio del error
sx =
r N° de repeticiones

0.517
BIOESTADISTICA

sx =
4

s x = 0.3595

Rangos mínimos de Duncan (RMD) y rangos mínimos significativos (RMS)


2 3 4 5
UTEQ

RMD 3.014 3.16 3.25 3.312 Copiado de la tabla de Duncan


s x = 0.3595
RMS 1.0835 1.1360 1.1683 1.1907 RMS = Producto de RMD * SX
EJEMPLO Duncan
Contrastación de las diferencias entre medias adyacentes
con los valores críticos de Duncan.
Promedio 20,50 17,50 15,00 12,75 12,50
TRATAMIENTOS T5 T3 T1 T4 T2
20,50 T5 0 3,00 * 5,50 * 7,75 * 8,00 *
17,50 T3 0 2,5 * 4,75 * 5 *
15,00 T1 0 2,25 * 2,50 *
12,75 T4 0 0,25 ns
12,50 T2 0
RMS 1.1907 1.1683 1.1360 1.0835
BIOESTADISTICA

Arreglar los RMS


De mayor a menor también
T5 a a
T3 b b b
T1 b c c c
T4 b c d d d
T2 b c d d d d

Lo anterior se resume en el siguiente rango de mérito:


UTEQ

T5 a
T3 b
T1 c
T4 d
T2 d
Promedios con literales distintas son estadísticamente diferentes según el método de Duncan
EJEMPLO Duncan

Interpretación de la Prueba de Duncan


BIOESTADISTICA

Como se observa en los resultados de la Prueba de Duncan


podemos confirmar que existen diferencias estadísticas entre los
UTEQ

tratamientos en estudios, obteniendo el mayor promedio T5 con


20.50 kg. en tanto que en T4 y T2 (estadísticamente iguales)
obtuvo el menor promedio con 12.75 y 12.50 kg. respectivamente
EJEMPLO II Duncan

TRATAMIENTOS
REPETICIONES 1 2 3 4
I 180 172 163 158
II 173 158 170 146
III 175 167 158 160
IV 182 160 162 171
V 181 175 170 155
X Media 178,20 166,40 164,60 158,00
BIOESTADISTICA

La tabla de Anova
Fuente de variación GL SC CM Fc Ft
Tratamiento 4 2010,64 502,66 11,24 2,866
Error 20 894,4 44,72
Total 24 2905,04
UTEQ
EJEMPLO II Duncan

CONCENTRACION
Duncan
Se muestran las medias para los grupos en los subconjuntos homogéneos.
a Usa el tamaño muestral de la media armónica = 5,000.

Subconjunto para alfa =


.05

TRAT N 2 1
4,00 5 158,0000
BIOESTADISTICA

3,00 5 164,6000
2,00 5 166,4000
1,00 5 178,2000
Sig. ,077 1,000

NO OLVIDAR LA CONCLUSION DEL ANALISIS DE CONPARACIÓN DE MEDIAS


DE DUNCAN
UTEQ
ANÁLISIS DE LA
VARIANZA
ESTADISTICA

(ANOVA)
UTEQ
ANOVA

En múltiples ocasiones el analista o investigador se enfrenta al


problema de determinar si dos o mas grupos son iguales, si dos o
mas cursos de acción arrojan resultados similares o si dos o mas
conjuntos de observaciones son parecidos

Concentración CO Concentración CO Concentración CO


1 Semana 2 Semana 3 Semana
ESTADISTICA

L 20 50 50
M 40 46 46 Los dos grupos son iguales?
M 30 50 50
J 50 51 51
UTEQ

V 45 40 40 Numéricamente
S 40 39 39 Estadísticamente
D 25 41 41
ANOVA

Otros ejemplos:

 En el caso de determinar si dos niveles de renta producen


consumos iguales o diferentes de un determinado producto,

Si las notas de dos grupos en una asignatura son similares,


ESTADISTICA

 Si tres muestras de análisis químico de una sustancia son


iguales

 Si los municipios de cuatro provincias colindantes tienen el


UTEQ

mismo nivel de paro.


ANOVA

Una aproximación simple sería comparar las medias de


estos grupos y ver si las medias aritméticas de la variable
estudiada son parecidas o diferentes.

Estadísticos de posición
ESTADISTICA

Pero tal aproximación no es válida ya que la dispersión de las


observaciones influirá en la posibilidad de comparar los
promedios o medias de cada grupo.
UTEQ

Estadísticos de dispersión
ANOVA

En tales situaciones la estimación del modelo significa la


realización de un análisis de la varianza clásica(ANOVA), de
amplia tradición en los estudios y diseños experimentales.

DISEÑOS EXPERIMENTALES
ESTADISTICA

Plan total para llevar a cabo una Investigación que Indica


UTEQ

paso a paso a través de secuencia de acciones a tomar para


obtener información objetiva, confiable y válida
USO DEL ANOVA

El ANOVA (análisis de la varianza = Analysis of variance) puede


utilizarse para comparar entre sí, las medias de los resultados
derivados por diversos laboratorios, analistas, métodos de análisis,
etc.

Sabemos que el análisis de la varianza (ANOVA) es una potente


herramienta estadística, de gran provecho tanto en la industria,
para el control de procesos, como en el laboratorio de análisis, para
ESTADISTICA

el control de métodos analíticos.

Los ejemplos de uso son múltiples, pudiéndose agrupar, según el


objetivo que persiguen, en dos principalmente:
UTEQ

la comparación de múltiples columnas de datos y

la estimación de los componentes de variación de un proceso.


EJEMPLO ANOVA

Se quiere evaluar la eficacia de distintas dosis de un producto quìmico


contra un hongo, comparándola con la de una sin aplicación. Para ello
se seleccionan al azar 25 muestras y se distribuyen aleatoriamente en
5 grupos.

Al primero de ellos no se le suministra ningún tratamiento,


al segundo con un contenido pobre en Cloro,
al tercero sin cloro y dosis mínima,
al cuarto el fármaco a una dosis determinada y
al quinto el mismo fármaco a otra dosis.
ESTADISTICA

La presencia de hongos por unidad de área obtenida fue

Grupo
1 2 3 4 5
180 172 163 158 147
UTEQ

173 158 170 146 152


175 167 158 160 143
182 160 162 171 155
181 175 170 155 160
EJEMPLO ANOVA

TRATAMIENTOS
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
ESTADISTICA

181 175 170 155 160


UTEQ
FORMULAS

Suma de todos los xi Suma de todos los xi al cuadrado


(suma de todos los datos) (suma de todos los datos al cuadrado)
TRATAMIENTOS
1 2 3 4 5 TRATAMIENTOS AL CUADRADO
180 172 163 158 147 Ʃxi = 4093 1 2 3 4 5
Suma de todos Ʃxi2 = 673011
173 158 170 146 152 32400 29584 26569 24964 21609
Suma de todos
los valores de
175 167 158 160 143 29929 24964 28900 21316 23104 los valores de la
la tabla
182 160 162 171 155 30625 27889 24964 25600 20449 tabla
181 175 170 155 160 33124 25600 26244 29241 24025
ΣTi 891 32761 30625 28900 24025 25600
ΣTi 891,00 832,00 823,00 790,00 757,00

(Σti) 2
793881,00 692224,00 677329,00 624100,00 573049,00
Ʃ(ƩTi)2
n 5 5 5 5 5
n Suma de los (tratamientos al cuadrado / numero de valores)
(Σti) /n
2
158776,20 138444,80 135465,80 124820,00 114609,80

N = 25 Tamaño de la muestra o número de valores


ESTADISTICA

Ʃxi = 4093 suma de todos los valores o datos

Ʃxi2 = 673011 suma de todos los valores al cuadrado o datos al cuadrado

Fc (factor de corrección) = al valor de Ʃxi elevado al cuadrado


Fc = (Ʃxi)2 = 670105,96
/ n (número de valores)
N
SCTotales= Ʃxi2 – (Ʃxi)2 = 673011 - 670105,96 = 2905.04 SCTotales (suma de cuadrados totales) = suma de todos los
N valores al cuadrado – el factor de corrección.
UTEQ

SCT= Ʃ(ƩTi)2 – (Ʃxi)2 = 672116.60 - 670105,96 = 2010.64 SCT (suma de cuadrados tratamientos) = Suma de los (tratamientos
al cuadrado / numero de valores) – el factor de corrección.
n N

SCE= SCTotales – SCT = 2905.04 - 2010.64 = 894.40 SCE (suma de cuadrados del error) = Suma de cuadrados totales –
suma de cuadrados tratamientos.
TABLA DE ANOVA

SCTotales= Ʃxi2 – (Ʃxi)2 = 673011 - 670105,96 = 2905.04


N
SCT= Ʃ(ƩTi)2 – (Ʃxi)2 = 672116.60 - 670105,96 = 2010.64
n N
SCE= SCTotales – SCT = 2905.04 - 2010.64 = 894.40

tabla de Anova
Fuente de variación GL SC CM Fc Ft
ESTADISTICA

Tratamiento CMT= SCT CMT Valor de la


nt-1 SCT
n-1 CME tabla F Fisher
Error CME = SCE
(N-1) -(nt-1)=N-n SCE
(N-1) -(n-1)
Total N-1 SCTOTALES
UTEQ
TABLA DE ANOVA

SCTotales= Ʃ(xi2) – (Ʃxi)2 = 673011 - 670105,96 = 2905.04


N
SCT= Ʃ(ƩTi)2 – (Ʃxi)2 = 672116.60 - 670105,96 = 2010.64
n N
SCE= SCTotales – SCT = 2905.04 - 2010.64 = 894.40

tabla de Anova
Fuente de variación GL SC CM Fc Ft
Tratamiento nt-1 CMT= SCT CMT Valor de la tabla
SCT
n-1 CME F Fisher
Error (N-1) -(nt-1) CME = SCE
ESTADISTICA

SCE
(N-1) -(n-1)
Total N-1 SCTOTALES

La tabla de Anova
UTEQ

Fuente de variación GL SC CM Fc Ft
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04
TABLA F DE FISHER

El valor lo vemos en la tabla


ESTADISTICA

F Fisher al 95% de
Probabilidad.

V1 = 4 Gl tratamientos
V2 = 20 Gl Error
UTEQ
TABLA DE ANOVA

La tabla de Anova
Fuente de variación GL SC CM Fc Ft
Tratamiento 4 2010,64 502,66 11,24 2,866
Error 20 894,4 44,72
Total 24 2905,04

Como F0,05(4,20) =2,866 y 11,24>2,87 rechazamos la hipótesis nula y concluimos


que los resultados de los tratamientos son diferentes (es decir existe diferencia
ESTADISTICA

significativa en los tratamientos)

El valor observado en la tabla F Fisher

A través del análisis estadístico se ha demostrado que existen diferencias


UTEQ

significativas entre los tratamientos (conclusión)


(falta determinar si existen esas diferencias entre todos los tratamientos o en uno de
ellos con referencia a los demás o de todas las combinaciones posibles)
EJERCICIO

TRATAMIENTOS
A B C D
10 9 9 8
8 8 8 10
9 10 6 8
4 9 10 9
7 8 9 8
EJERCICIO

TRATAMIENTOS TRATAMIENTOS AL CUADRADO


1 2 3 4 1 2 3 4

10 9 9 8
8 8 8 10
9 10 6 8
4 9 10 9
7 8 9 8
ΣTi
ESTADISTICA

ΣTi

(Σti)2
UTEQ

(Σti)2/n
EJERCICIO

La tabla de Anova
Fuente de variación GL SC CM Fc Ft
Tratamiento
ESTADISTICA

Error
Total
UTEQ
BANCO DE PREGUNTAS

1. Cuál es la diferencia entre un diagrama de barras y un histograma de


frecuencias
a) El diagrama de barras representa gráficamente a una variable cualitativa mientras
que el histograma únicamente a variables numéricas.
b) El diagrama de barras representa gráficamente a una variable cuantitativa mientras
que el histograma únicamente a variables cualitativas
c) El diagrama de barras representa gráficamente a una variable cualitativa y
cuantitativa mientras que el histograma únicamente a variables numéricas
d) Ninguna de las anteriores.

2. Seleccione los pasos para el estudio estadístico:


a) Plantear la hipótesis sobre una población
b) Deducir las leyes que rigen estos fenómenos qué datos recoger
c) Describir los datos obtenidos
d) Entender mejor el mundo real
e) Cuantificar la confianza en la inferencia

3. Escoja la respuesta correcta: definición de Frecuencia Absoluta:


a) Es el número de veces que se repite un determinado valor en un estudio estadístico
b) Es el cociente entre la frecuencia absoluta de un determinado valor y el número
total de datos
c) Es la diferencia entre el mayor y el menor de los valores obtenidos de una muestra
o población
d) Son diferentes en función de que las variables sean discretas o continuas.

4. Seleccionar la respuesta correcta. En los estudios estadísticos se plantea…..


a) Hipótesis nula de un conjunto interesado
b) Hipótesis sobre una población
c) Hipótesis de una inferencia
d) Hipótesis de una variable
5. Escoger la respuesta correcta:

La __________ es el número de veces que aparece un determinado valor en un estudio


estadístico.

a) Frecuencia Relativa
b) Frecuencia Absoluta
c) Frecuencia de Rango
d) Frecuencia de un polígono

6. Seleccione la respuesta correcta:

La suma de las frecuencias absolutas es igual al número total de datos, representada por:

a) Frecuencias relativas
b) Muestra
c) Muestra o población
d) Rango

7. La definición de Frecuencia Absoluta es:


a) Número de veces que se repite un determinado valor en un estudio estadístico en
porcentaje.
b) Número total de datos que se repiten y se representa por ¨n¨.
c) Número de veces que aparece determinado valor en un estudio estadístico
d) Todas las anteriores

8. Elija la respuesta correcta las variables discretas son aquellas que….


a) Registran valores numéricos enteros.
b) Registran valores numéricos en decimales.
c) Registran valores numéricos decimales y enteros.
d) Ninguno de los anteriores.

9. Las variables cualitativas se clasifican en 2 tipos, seleccione la correcta:


a) Discreta y continua
b) Nominal y Ordinal
c) Nominal y discretas
d) Ordinal y Continuas
10. Los tipos de variables son:
a) Variables cualitativas
b) Variables Semánticas
c) Variables Poblacionales
d) Variables Cuantitativas o numéricas

11. Existen al menos cuatro buena razones para estudiar estadística, que nos
ayudara a: (seleccione el grupo de respuesta correcta)
a) Aprender reglas y pasos puntuales para trabajos estadísticos -Cualificar resultados
estadísticos -Entender el entorno que nos rodea -Conocer ideas estadísticas.
b) Aprender las reglas y métodos para tratar información estadística -Evaluar y
cuantificar la importancia de resultados estadísticos -Conocer los aspectos del
pensamiento estadístico como un componente esencial -Entender mejor el mundo
real de nuestro entorno.
c) Aplicar reglas y métodos para tratar información estadística -Calificar cuán
importante es la estadística -Reconocer aspectos con pensamientos estadísticos -
Disfrutar mejor el mundo que nos rodea.
d) Ninguna de las anteriores

12. Escoja las respuestas correctas: la frecuencia Absoluta….


a) Se ordenan los datos en forma creciente o ascendente.
b) No se determina el número de veces que se repite cada valor.
c) Se determina el número de veces que se repite cada valor, dentro de la muestra.
d) Se ordenan los datos en forma no creciente o descendente.

13. Cuáles son los pasos de convertir un gráfico de barras a un histograma…


a) Doble Crick izquierdo en las barras
b) Se despliega formato de serie de datos
c) En la opción ancho de intervalo se coloca 0%
d) Todas las anteriores son correctas
14. Escriba Verdadero o Falso

El Histograma se utiliza únicamente para variables Discretas.


(FALSO)

15. La definición de estadística Descriptiva es:


a) Comprende aquellos métodos y técnicas usados para hacer generalidades,
predicciones o estimaciones sobre poblaciones a partir de una muestra.
b) Comprende aquellos métodos usados para organizar y describir la información
recabada.
c) Permite inferir los resultados obtenidos en los procesos analíticos.
d) Ninguna de las anteriores.

16. Qué se entiende por variable


a) El valor que tenga asignado. Se representan dentro del eje de abscisas.
b) Una variable es un registro medible de una muestra o población
c) Es el conjunto de valores que puede tomar cierta característica de la población
sobre la que se realiza el estudio estadístico y sobre la que es posible su
medición.
d) Ninguna de las anteriores

17. Seleccione la definición correcta El Polígono de Frecuencia es:


a) Un intervalo de clase de mínimo tamaño obtenida mediante ordenamiento
b) Un serie de rectángulo que representa la distribución de un intervalo de una
frecuencia
c) Un gráfico de líneas trazadas sobre el punto medio de cada clase y se obtiene
uniendo los puntos medios de los extremos superiores del rectángulo.
d) Ninguna de las anteriores

18. Para tabular los resultados de una encuesta realizada, ¿cuáles son las
principales consideraciones antes de procesar los datos...
a) Priorizar las variables que contribuyan a la investigación.
b) Ordenar de manera ascendente o alfabéticamente los resultados.
c) Realizar la interpretación y conclusión de los datos.
d) Verificar y corregir los datos.
19. Seleccione cuál es el primer paso que se debe realizar para hacer una
investigación mediante el método científico:
a) Describir los datos obtenidos.
b) Plantear una hipótesis.
c) Reconocer si la muestra es representativa.
d) Interpretar los datos obtenidos.

20. Escoja la respuesta correcta: De que es Frecuencia Absoluta


a) Es el número de veces que se repite un determinado valor en un estudio
estadístico.
b) Es el cociente entre la frecuencia absoluta de un determinado valor y el número
total de datos.
c) Es la diferencia entre el mayor y el menor de los valores obtenidos de una
muestra o población.
d) Son diferentes en función de que las variables sean discretas o continuas.

21. Seleccione cuáles son las bases de datos según su contenido…


a) Bibliográficas
b) De texto completo
c) Directorios
d) Especializadas
e) Todas las anteriores

22. Seleccione las características principales que debe tener el tamaño de una
muestra
a) Representativa y homogénea
b) Sistematizada y probable
c) No representativa y general
d) Adecuada y que abarque la población total
23. Seleccione la opción correcta: Una base de datos es:
a) Es un conjunto de información que pertenece a un mismo contexto, ordenada de
modo sistemático para su posterior recuperación, análisis y/o transmisión.
b) Es información que pertenece a único contexto y no esta ordenada de modo
sistemático para su posterior recuperación, análisis y/o transmisión.
c) Es un conjunto de información que no pertenece a un mismo contexto, ordenada
de modo sistemático para su posterior recuperación, análisis y/o transmisión.
d) Es información que pertenece a único contexto y no esta ordenada de modo
sistemático para su posterior recuperación, análisis y/o transmisión.

24. Seleccione las respuestas correctas

Para determinar la frecuencia absoluta ¨fi¨

a) Se ordenan los datos en forma creciente o ascendente.


b) Se deja un hueco entre barras para indicar los valores que no son posibles.
c) Se determina el número de veces que se repite cada valor dentro de la muestra.
d) Se encuentra como el cociente entre la frecuencia absoluta de un determinado
valor.

25. Seleccione la fórmula para obtener la frecuencia relativa:


a) fr=(n/fi)*100
b) fr=(fi/n)*100
c) fr=(fi/100)*n
d) fi=(fr/n)*100

También podría gustarte