Está en la página 1de 77

ESTADSTICA

INTRODUCCIN.
La Estadstica es una ciencia de desarrollo reciente y de auge cada vez mayor. Se centra en el
estudio cuantitativo de conjuntos de datos, empleando modelos matemticos basados en la
probabilidad y que permiten adquirir nuevos conocimientos y tomar decisiones. Est
ntimamente ligada con la Investigacin cientfica y es imprescindible para el desarrollo
profesional del Ingeniero en Ciencias Agrarias
Historia de la Estadstica
Se refiere a los orgenes de la Estadstica as como a los impulsos subsiguientes quela hicieron
evolucionar. Los dos factores que se conjugaron para generar la Estadstica actual son la
recoleccin de datos para la elaboracin de censos y los juegos de azar.
La recoleccin de datos para censos es uno de los primeros problemas que ms tarde fijaran
las nociones y los mtodos de la Estadstica. Los primeros censos aparecen en Egipto, donde
tambin se tienen noticias de que conocan y practicaban el juego de dados. Sin embargo es
en Europa donde se encausa la Teora de la Probabilidad hacia lo que es hoy. A lo largo de
toda la Edad Media y hasta principios del siglo XVII, la Estadstica fue puramente descriptiva.
A principios del siglo XVIII, Bernoulli y, sobre todo, Laplace buscaron la aplicacin de los
resultados del clculo de probabilidades a las observaciones, cambiando el mtodo descriptivo
por el mtodo matemtico. As, de la conjuncin de la estadstica descriptiva y del clculo de
probabilidades (que proporcion el aparato matemtico indispensable), surgi la estadstica
matemtica.
Desde 1650 hasta 1933 se desarrolla el Clculo de Probabilidades consiguiendo una
axiomatizacin de la probabilidad, aunque este concepto fundamental en la Estadstica sigue
evolucionando hoy en da. Aparece la inferencia clsica al tratar de aplicar la teora de la
probabilidad y la Estadstica a problemas biolgicos y a la mayor necesidad de organizacin
que lleva consigo la experimentacin en las esferas de la agricultura y de la industria. Fruto de
estas ideas son los trabajos de Fisher, Neyman y Pearson que organizan la teora de la
estimacin y de los contrastes de hiptesis, centrados en las ideas de verosimilitud y
suficiencia. Las bases de la teora del diseo de experimentos se deben a los trabajos de R.A.
Fisher, entre 1919 y 1927.
El estudio de los procesos estocsticos, la teora de la decisin y el anlisis multivariante tienen
sus comienzos en las dcadas del 30 al 50.A partir de los aos 50 se abre una gran diversidad
de campos (control de calidad, anlisis de series temporales en el dominio de la frecuencia,
inferencia no paramtrica, simulacin, etc.) debido, por una parte, a que se dispone de una
herramienta estadstica cientfica suficientemente estructurada y desarrollada, y, por otra a la
ayuda de los primeros ordenadores.

Importancia de la Estadstica.
La Estadstica, en mayor o menor medida, est presente en toda nuestra vida: desde la
decisin de sustentar la tesis profesional, conocer la composicin florstica en una micro

cuenca, pasando por el clculo crecimientos de animales, plantas, venta diario de productos
elaborados, la incorporacin al mercado de nuevos productos de carne, todo ello se realizan
gracias a la ESTADSTICA.
No hay materia donde no se pueda dar una aplicacin de la estadstica. Algunas aplicaciones
son la comparacin de crecimiento de plantas por zonas, la bsqueda de la diferencia de
significados entre la calidad de plantas, la seleccin de animales, la determinacin de
fenmenos de crecimiento, la evolucin de poblaciones en peligro de extincin, la
determinacin de pautas de crecimiento en los rboles, la asignacin de restos fsiles a una
determinada especie, etc.

El Objetivo
El objetivo de la asignatura es formar una base slida de conocimientos de Estadstica
Descriptiva e Inferencial, porque las actividades profesionales en Ciencias Agrarias es recopilar
y analizar datos de campo, laboratorio, invernadero y de investigaciones con la finalidad de
tomar decisiones; adems la asignatura est relacionada con otras del currculo de estudios de
la Facultad, como son: Diseos Experimentales, Control de Calidad y Legislacin Alimentaria,
Dasometra, Inventarios Forestales, Manejo de Bosques Tropicales, Mejoramiento Gentico,
Nutricin Animal, Metodologa de la Investigacin, Control de Plagas Agrcolas, entre otros.
Los conceptos tericos de Estadstica se complementan con los procesos de clculo mecnico
con calculadora cientfica y paquetes especializados o software estadstico como SPSS, SAS,
MINITAB, STATGRAPHICS, que ayudan al estudiante ganar tiempo en el anlisis e
interpretacin de los datos, adems de ofrecer gran diversidad de grficos que
automticamente representan a los datos en figuras.
En las prcticas de anlisis de datos se recomienda el uso de software SPSS en su versin 19
en espaol, el estudiante puede consultar la ayuda o su tutor que ofrece este software.
Ejemplo de problema en Ciencias Forestales
Si una empresa maderera, desea informacin confiable sobre el volumen promedio de rboles
maduros de Cedrela odorata en una zona X del valle de Peren; el empresario buscar datos
de inventarios forestales en las instituciones del sector Agricultura de la Regin Junn, Facultad
de Ciencias Forestales y del Ambiente de la UNCP y otros similares, de existir los datos de
inventario posiblemente no son recientes, o no son de la zona que queremos averiguar. As
surge un problema de informacin. Para tener ms conocimiento a este problema, debemos
preguntarnos:
Para qu quiere conocer el empresario el volumen promedio de los rboles? (objetivo),
Cul es la superficie (rea) total de las plantaciones de Cedrela odorata? (poblacin),
Cmo estimamos el volumen de la madera ? (mtodo), Tenemos los recursos
econmicos disponible para realizar las mediciones correspondientes para determinar
el volumen?. (Logstica). Contamos con instrumentos de medicin? (Herramientas).
Tenemos personal capacitado para tomar las medidas dasonmicas de los rboles y
calcular el volumen? (competencias) etc.

Si la poblacin de rboles es grande, no ser posible realizar las mediciones de volumen de


todos los rboles existentes en el valle de Peren, por el tiempo que demanda el
trabajo y costo de las operaciones. Para superar esta dificultad existen los mtodos y
tcnicas estadsticos que nos ayudarn estimar el volumen promedio de rboles de la
zona X (poblacin) a partir de la muestra.
Finalmente; veremos cmo presentar el informe (tablas, ecuaciones, grficos fotografas). El
informe debe ser claro, preciso y fcil de comprender, porque son informaciones de
referencia para tomar las decisiones sobre el volumen de los rboles.
Si tuviramos otras preguntas como: Cul es la variacin de longitud de la fibra de las
maderas de pino segn las especies?; Cul es el porcentaje de supervivencia de
plantones despus del establecimiento definitivo en una zona determinada como alto
Ipoke? Si en enero de 2008 el volumen de rboles de nogal fue 120 metros cbicos
por hectrea cul, ser el volumen de estos mismos rboles en el ao 2020. Qu
cantidad de carne de res consume los pobladores de Satipo diariamente? Cul es el
rendimiento de una variedad de caf por hectrea en el distrito de Ro Negro a una
altitud entre 800 y 900 msnm?. En todos estos casos, es imprescindible el uso de las
tcnicas estadsticas para estimar los resultados y pronosticar los hechos o fenmenos.
Ejemplo de problema de datos en Agronoma
Es imposible tener datos exactos de produccin de ctricos durante el ao 2013 en el distrito de
Pangoa, las dificultades surgen por las siguientes preguntas: Qu variedad de ctrico?, Cul
es la superficie de produccin?, Qu tcnicas de cultivo?, Hubo manifestacin de
enfermedades? Con qu fertilizantes y en qu dosis se incrementa mejor el producto?
pocas de plantacin?, Cul es la densidad de plantacin?, entre otros.
Es fcil determinar la variedad de caf, pero no es posible informar la superficie exacta de la
plantacin de caf en la provincia de Satipo, no es posible tener datos exactos de produccin
durante el ao 2013, pero se puede estimar con un margen de error a travs de las tcnicas de
Estadstica Inferencial partiendo de la muestra.
Ejemplo de problema de datos en Industrias Alimentarias
Si somos productores de queso y mantequilla debemos conservar estos alimentos mediante
algn mtodo que existe en la actualidad. Si la produccin, es 5000 unidades por da y nos
recomiendan tres mtodos para conservarlos, no sera correcto someter a prueba de
conservacin las 5000 unidades de queso o mantequilla para determinar el efecto del mtodo
de conservar, esto se har mediante las muestras de queso o mantequilla. A travs del anlisis
estadstico de los tres mtodos se determinar el mejor mtodo de conservar estos productos.
Si un empresario est interesado en saber el contenido de azcar de una fruta como la
mandarina, es imposible imaginar la cantidad exacta de este ctrico en una zona, pero con la
ayuda de la estadstica podemos lograr estimar.

Ejemplo de problema de datos en Zootecnia


El xito de una empresa de pollos parrilleros depender de la raza del animal, tipo de
alimentos, mtodo de crianza entre otros, personal capacitado. Si surgen las preguntas: Qu
cantidad de alimento consumir un pollo de raza X desde su exclusin hasta alcanzar un peso
deseable de un kilogramo? Para contestar esta pregunta es necesario conocer el anlisis
cuantitativo y cualitativo de alimentos que consumir el pollo, mtodo de crianza, consumo de
agua por el animal, zona de vida etc. En estos casos las tcnicas estadsticas son necesarias
para estimar los resultados.

DEFINICIN DE LA ESTADSTICA
"La Estadstica actual es el resultado de la unin de dos disciplinas que evolucionaron
independientemente hasta confluir en el siglo XX: la primera es el clculo de probabilidades,
que surge en el siglo XVII como teora matemtica de los juegos de azar; la segunda es la
"Estadstica" (o ciencia del Estado, del latn Status) que estudia la descripcin de datos, y tiene
unas races ms antiguas. La integracin de ambas lneas de pensamiento da lugar a una
ciencia que estudia cmo obtener conclusiones de la investigacin emprica mediante el uso de
modelos matemticos", (Pea, 1987).
Desde el punto de vista de sus aplicaciones algunas definiciones son:
"Es la ciencia cuyo objeto es el tratamiento de la informacin que contienen las series de datos
procedentes de observaciones (demogrficas, econmicas, mdicas, tecnolgicas, etc.), en
que el gran nmero de factores de variacin que intervienen hacen necesarias tales tcnicas
para que a las conclusiones o leyes extradas de los mismos se les pueda asignar una
confianza medible", (Ros, 1972).
"La Estadstica es la tecnologa del mtodo cientfico experimental. La estadstica proporciona
instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre",
(Mood, 1976).
En la misma lnea, en que la estadstica es considerada como un conjunto de tcnicas que nos
permiten manejar la informacin, se encuentra la definicin que da Barnet (1982): "ciencia que
nos indica cmo debe ser utilizada la informacin, en orden a reflejar y dar una gua de accin
en situaciones prcticas que envuelven incertidumbre".
En casi todas las definiciones se recoge el empleo de modelos matemticos para medir la
incertidumbre y poder tomar una decisin.
Sierra (1991), la estadstica es la ciencia formada por un conjunto de teoras y tcnicas
cuantitativas, que tiene por objeto la organizacin, presentacin, descripcin, resumen y
comparacin de conjuntos de datos numricos, obtenidos de poblaciones en su conjunto de
individuos o fenmenos o bien de muestras que representan las poblaciones estudiadas, as
como el estudio de su variacin, propiedades, relaciones, comportamiento probabilstico de
dichos datos y la estimacin, inferencia o generalizacin de los resultados obtenidos de

muestras, respecto a las poblaciones que aqullas representan. La estadstica en la


investigacin cientfica, dada la necesidad de manejar y tratar en ellas grandes cantidades,
progresivamente crecientes, de datos.
Nocedo et al (2001), anotan que la estadstica es la ciencia encargada de suministrar las
diferentes tcnicas y procedimientos que permiten desde organizar la recoleccin de datos
hasta su elaboracin, anlisis e interpretacin. Abarca dos campos fundamentales la
estadstica descriptiva y la estadstica inferencial,
Hopkins y Glass (1997), la estadstica es un lenguaje para comunicar informacin basada en
datos cuantitativos.
Montgomery (1985), define a la estadstica como el arte de tomar decisiones acerca de un
proceso o una poblacin con base en un anlisis de la informacin contenida en una muestra
tomada de la poblacin.
Otra definicin de la estadstica que lo vincula al uso cientfico de principios matemticos, a la
coleccin, al anlisis y a la presentacin de datos numricos. Contribuyen con la investigacin
cientfica diseando pruebas y experimentos; la coleccin, el proceso, y el anlisis de datos; y
la interpretacin de los resultados, aplicando conocimientos matemticos y estadsticos. El
conocimiento estadstico se aplica a la biologa, economa, ingeniera, medicina, salud pblica,
psicologa, comercializacin, educacin y deportes.
Muchas decisiones agrcolas, forestales, pecuarias, econmicas, sociales, polticas y militares
no se pueden tomar objetivamente sin el empleo adecuado de la estadstica.
En Ciencias Agrarias la Estadstica, implica la coleccin, clasificacin, sntesis, organizacin e
interpretacin de datos procedentes o no de los problemas biolgicos, con el fin de probar la
hiptesis, estimar, pronosticar y tomar decisiones sobre alguna o algunas caractersticas de
una poblacin.
En otras palabras la estadstica es el conjunto de procedimientos y tcnicas utilizadas para
recolectar datos sobre los cuales tomar decisiones en una situacin de incertidumbre o frente a
una informacin incompleta. La estadstica concierne la coleccin, presentacin, anlisis y
utilizacin de datos numricos para realizar inferencias (sacar consecuencias) y alcanzar
decisiones ante la incertidumbre que plantea las Ciencias Agrarias y otras ciencias. En el libro
de OSTLE, B. 1979. puede encontrar el siguiente resumen

Coleccin y compendio de datos

Medicin de la variacin de datos

Estimacin de parmetros de poblacin

Ensayo de hiptesis respecto a poblaciones

Diseo de experimentos y de reconocimiento

Estudio de la relacin entre dos o ms variables

Estudio de conglomerados

Control de calidad

Estadstica se clasifica en descriptiva, e inferencial


ESTADSTICA DESCRIPTIVA:
Es la parte de la estadstica que trata solamente de describir y analizar un grupo de datos, sin
sacar conclusiones o inferencias, se denomina tambin estadstica deductiva. En otras
palabras describe analiza y representa un grupo de datos utilizando mtodos numricos y
grficos que resumen y presentan la informacin contenida en ellos.
ESTADSTICA INFERENCIAL:
La estadstica inferencial se denomina tambin estadstica inductiva, es la parte de la
estadstica que trata de las condiciones bajo las cuales son vlidas las conclusiones
(inferencias) obtenidas a partir de anlisis de una muestra representativa de la poblacin.
La Estadstica Inferencial permite formular y probar hiptesis. En otras palabras apoyndose en
el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto mayor de datos (poblacin).
CONCEPTOS BSICOS DE ESTADSTICA
Elementos o individuos: personas u objetos que contienen cierta informacin que se desea
estudiar (Ejemplos: Una planta, un animal, un litro de yogurt)
Poblacin:

Es una coleccin de entidades o elementos, digamos poblacin de rboles,


poblacin de animales tiles al hombre, poblacin hojas de los rboles de
cierta especie forestal, nmero de clulas de un tejido leoso, cien mil litros de
yogurt, estudiantes de la UNCP. En relacin al tamao de la poblacin, sta
puede ser:

Finita, como es el caso del nmero de animales depredares en una


micro cuenca, rboles enfermos en una plantacin.

Infinita, si por ejemplo estudiamos el mecanismo aleatorio que


describe la secuencia de caras y sello obtenida en el lanzamiento
repetido de una moneda

Parmetro:

Funcin definida sobre los valores numricos de caractersticas medibles de


una poblacin. Por ejemplo el promedio ( ), la desviacin estndar ( ), entre
otros de una poblacin determinada.

Muestra:

Es una parte de una poblacin. Ejemplo si la poblacin es un bosque de Pinus


radiata que tiene 10,000 rboles, la muestra puede ser 1 rbol, 16 rboles,
136, 1000 o ms rboles.

Muestra Aleatoria. Es aquella en la que se seleccionan determinada cantidad de individuos


pertenecientes a la poblacin que se desea estudiar, sabiendo que cada uno
de los individuos pertenecientes a la poblacin tiene la misma probabilidad de
ser elegido.

Muestra No Aleatoria. Es aquella en la que el investigador elige deliberadamente los objetos a


ser estudiados, suelos erosionados, rboles enfermos, sitios contaminados
Estadstico:

Funcin definida sobre los valores numricos de una muestra. Por ejemplo la
media aritmtica ( x ) y la desviacin estndar ( s ) del peso seco de una
muestra de maz.

Variable:

Una caracterstica se clasifica como variable si,

tal como se observa, se

encuentra que esta toma diferentes valores en diferentes objetos, lugares,


plantas o cosas. Una caracterstica no es la misma cuando se observa en
diferentes posiciones de la misma. Ejemplo de variables, altura de las plantas,
longitud radicular, nmero de hojas, peso de probetas de madera etc.
Variable cuantitativa: Es aquella que puede medirse en forma usual, se puede medir el
dimetro de rboles, el volumen y densidad de la madera, temperatura,
mortandad precipitacin, longitud de la nervadura de hoja de una especie,
grado de contaminacin, velocidad del viento, acidez o pH del suelo, peso seco
de materia orgnica, longitud de la raz etc.
Variable cualitativa:

Algunas caractersticas de los objetos, plantas, animales y hombre no

pueden ser medidas, muchas de ellas slo se pueden clasificar por ejemplo,
rboles enfermos, vigas torcidas, rboles achaparrados o mal formados,
madera con rajadura, animales peligrosos, personas buenas, terreno inundado
etc.
Variable Aleatoria: Cuando los valores se originan como resultado de factores aleatorios (al
azar),la variable se llama aleatoria. Siempre que se determina, la altura, dimetro, volumen de
los rboles, el resultado frecuentemente se refiere a un valor de la variable respectiva.
Variables aleatorias discretas: Una variable aleatoria discreta se caracteriza por
separaciones <o interrupciones en la escala de valores que puede tomar. Por ejemplo nmero
de plantas, nmero de hojas, nmero de plantas enfermas, nmero de ros contaminados etc.
Variables aleatorias continuas: Una variable aleatoria continua no posee las separaciones o
interrupciones en una escala de valores. Ejemplo longitud de hojas, edad de las plantas, peso
seco de una probeta de madera, dimetro de fruto, contenido de azcar de frutas etc

ESTADSTICA DESCRIPTIVA
En sntesis, la estadstica descriptiva trata de los mtodos que se utilizan para resumir y
organizar los datos. El presente captulo trata: de la toma de datos, Distribucin de frecuencia.
Medidas de tendencia central. Medidas de Dispersin y formas de distribucin de frecuencia, se
inicia con:
TOMA DE DATOS
La toma de datos es la obtencin de un conjunto de los mismos, normalmente se presentar
sin ordenamiento numrico.
ORDENACIN DE DATOS
Significa colocacin de datos numricos tomados, en orden ascendente o descendente. La
diferencia entre el dato mximo y mnimo se llama rango o recorrido.
DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencia es una tabla estadstica que organiza y presenta resumidamente
los datos estadsticos y tiene las siguientes partes: Lmites de clase, marca de clase, frecuencia
absoluta, Frecuencia relativa, Frecuencia acumulada y otras. En esta tabla se sacrifica parte de
la informacin contenida en los datos; en lugar de conocer el valor exacto de cada unidad.
El primer paso en la construccin de una distribucin de frecuencia, es decidir en cuntas
clases o grupos se resumirn los datos. El nmero de clases por usar depende del nmero de
observaciones, o datos, en la prctica se puede usar entre 7 y 13 clases.
Por ejemplo, construir una tabla de frecuencia de una muestra de 120 elementos
correspondiente a las mediciones de altura total de plantones de cedro la India determinada en
la zona de Santa Marta por la empresa TRAVI
Se pide ordenar los datos
Calcular el rango
Calcular nmero de clases
Elaborar la tabla de frecuencia e interpretar los datos resumidos

Tabla 01.

Altura total (cm)de plantones de cedro de la India a 10 meses de germinacin


sin ordenamiento numrico de los elementos.

Estos nmeros pueden representar tambin: peso de animales vivos en kilogramos, altura de
plantas agrcolas en un invernadero (cm), tiempo de proceso de alimentos (horas), tiempo de
germinacin de semillas (das), profundidad de suelo (cm), porcentaje de arena de muestras de
suelo etc.
Tabla 02. Altura total (cm) de plantones de cedro de la India despus de 10 meses de
germinacin con ordenamiento numrico de los elementos.

TABLA DE FRECUENCIA
Para comprender mejor el conjunto de datos, se recomienda resumir estos, en una tabla,
denominada tabla de frecuencia (TF), antes de construir la tabla, los datos deben estar
ordenados en forma ascendente o descendente, luego pasamos a calcular los siguientes

estadsticos.
RANGO(R).

Es igual el dato mximo menos el mnimo


31.8 - 6.20 = 25.6

R =25.6

NMERO DE CLASES ( K )
En el clculo del nmero de clases o grupos en que queremos agrupar los datos, nos orienta, la
frmula de STURGES
K = 1+3.3333 log(n).
Donde n es igual al nmero total de los elementos del conjunto o muestra, en estadstica se
denomina tamao de la muestra, en este caso el tamao de la muestra del ejemplo es igual a
120.
K=1+3.3333 log(120)

K=1+3.33(2.08) =7.93

Redondeando el resultado al nmero ms prximo se tiene K = 8


Intervalo de clase o amplitud del intervalo ( I )

R
K

25.6
3.2
8

Con estos datos se construye la primera columna de la tabla 03 de distribucin de frecuencia,


los datos ordenados en forma ascendente nos facilita el conteo de repeticin de datos.
La primera clase de la columna 01de la tabla 03, resulta de la suma al valor mnimo de los
datos, el intervalo de clase calculado, as se obtiene el valor mximo de la primera clase,
6.2+3.2=9.4
El valor mnimo de la segunda clase ser

9.5

y el valor mximo 9.5+3.2 = 12.7, as

sucesivamente se calculan los valores inferiores y superiores de cada clase, hasta completar
las 8 clases. Ver los resultados en la siguiente tabla de frecuencias.
Tabla 03. Distribucin de frecuencia de alturas totales de cedro de la India
Intervalos
de Clase

Marca de
Clase

Frecuencia
Absoluta

Frecuencia
Relativa

Frecuencia
Relativa %

Frecuencia
acumulada

6.2 - 9.4

7.80

0.0417

4.17

9.5 - 12.7

11.10

0.0667

6.67

13

12.8 - 16.0

14.40

16

0.1333

13.33

29

16.1 - 19.3

17.70

30

0.2500

25.00

59

19.4 22.6

21.00

20

0.1667

16.67

79

22.7 - 25.9

24.30

18

0.1500

15.00

97

26.0 - 29.2

27.60

16

0.1333

13.33

113

29.3 32.5

30.90

0.0583

5.83

120

120

1.0000

100.00

Sumas

10

OBSERVACIONES:

El lmite mayor del primer intervalo se calcul sumando el intervalo de clase 3.2 al dato
mnimo o sea 6.2+3.2=9.4, esto no es una regla, podemos haber iniciado sumando el
intervalo 3.2 por ejemplo a 6.0+3.2 entonces el lmite mayor de la primera clase sera
9.2 y no 9.4.

Podemos establecer los lmites de las clases con 02 decimales, en cualquier caso la
variacin de los resultados en el clculo de las medidas de tendencia central y de
dispersin sern mnimos.

En el anlisis estadstico de datos, los programas (software) de estadstica,


tienen opcin para calculan el valor de los estadgrafos (media, mediana, moda,
varianza, desviacin estndar, error estndar etc.) para datos sin agrupar
cualquiera sea el nmero de datos o el tamao de la muestra.

En el clculo de frecuencia relativa se redondea a 02 decimales, si hubiramos


considerado 04 decimales el resultado de la primera frecuencia relativa es
5/120=0.0417 y no as 0.04.

MARCA DE CLASE, del primer intervalo es igual

MC

6.2 9.4
7.8
2

de igual manera se obtiene la marca de clase de la octava clase

MC

29.3 32.5
30.90
2

FRECUENCIA ABSOLUTA
Es el conjunto de datos que pertenecen a las clases previamente establecidas, para la primera
clase la frecuencia absoluta tiene 05 elementos, porque los siguientes datos 6.2, 7.7, 8.3, 9
y 9.4 del conjunto de datos forman el grupo de la primera clase, las dems frecuencias se
establecen de la misma manera.

11

HISTOGRAMA DE FRECUENCIA

Frecuencia absoluta

40

30

30

20

20
18
16

16

10
8

5
0
7.80

11.10

14.40

17.70

21.00

24.30

27.60

30.90

Marca de clase de la variable altura de cedro

Fig. 1. Histograma de frecuencia de altura total, de cedro de la Indiade 10 meses, observe, la


marca de marca de clase o punto medio de cada clase se muestra en el eje X.
En la figura 01, o histograma de frecuencia absoluta no aparecen los intervalos de
clase, por comodidad a la visin figuran las marcas de cada clase, se sobre entiende
los lmites de cada clase.
Se puede representar de esta otra forma

Fig. 02. En el eje de la abscisa se ha considerado los intervalos de cada clase, se tiene
ocho intervalos. El polgono de frecuencia se logra uniendo con una lnea los puntos
medios del extremo superior de cada clase. En vez de considerar los intervalos se
puede dar nombre a cada intervalo de clase y la figura se simplifica ms como se
demuestra en la siguiente pgina

12

Intervalos de
Clase

Nombre
de clase

Frecuencia
Absoluta

6.2 - 9.4

9.5 - 12.7

12.8 - 16.0

16

16.1 - 19.3

30

19.4 22.6

20

22.7 - 25.9

18

26.0 - 29.2

16

29.3 32.5

Sumas

120

Fig. 03. En el eje de la abscisa se ha considerado el nombre de cada grupo o intervalo


de clase, el primer grupo se denomina A, el segundo B etc.

FRECUENCIA RELATIVA
La frecuencia relativa resulta de dividir la frecuencia absoluta de cada clase por el total de
datos.
La frecuencia relativa de la primera clase de cedro de la India es 5/120 = 0.04 y la frecuencia
de la ltima clase es 7/120=0.06, en el clculo se considera 02 decimales, puede ser ms. La
suma de las frecuencias relativas debe ser igual a la unidad. Para casos prcticos se utiliza la
frecuencia relativa expresada en porcentaje, esto resulta de multiplicar la frecuencia relativa
calculada por 100.

13

30
25

25
20

17
15

15

13

10
5

13

7
4
1

8
6

0
1

Fig. 04. Frecuencia relativa en porcentajes. Las barras de la figura representan las 8
clases consideradas en la tabla de frecuencia del ejemplo, no figuran los decimales de la
frecuencia relativa por redondeo a enteros

INTERPRETACIN DE LA FRECUENCIA RELATIVA


Para interpretar el cuadro de la distribucin de frecuencia se reproduce a continuacin.
Tabla 03. Distribucin de frecuencia de alturas totales de Cedrela odorata
Intervalos de
Clase

Marca de
Clase

Frecuencia
Absoluta

Frecuencia
Relativa

Frecuencia
Relativa %

Frecuencia
acumulada

6.2 - 9.4

7.80

0.0417

4.17

9.5 - 12.7

11.10

0.0667

6.67

13

12.8 - 16.0

14.40

16

0.1333

13.33

29

16.1 - 19.3

17.70

30

0.2500

25.00

59

19.4 22.6

21.00

20

0.1667

16.67

79

22.7 - 25.9

24.30

18

0.1500

15.00

97

26.0 - 29.2

27.60

16

0.1333

13.33

113

29.3 32.5

30.90

0.0583

5.83

120

120

1.0000

100.00

Sumas

La columna ms importante del cuadro de distribucin de frecuencias es la que representa a la


frecuencia relativa de los datos, para interpretar se expresar en porcentajes como se muestra
en la columna 5 de la tabla 03.
En la primera fila de la tabla 03 existe 05 plantas de Cedrela odorata con alturas que varan
entre los lmites 6.2 a9.4 cm. esto muestra la frecuencia absoluta columna 03 de la tabla. La
frecuencia relativa correspondiente expresada en porcentaje, indica que slo 4.17% de los
plantas estn en esta clase y en las condiciones de altura.
Asimismo, la cuarta clase del cuadro indica, que 30 plantas tienen alturas entre 16.1 a19.30
cm. En otras palabras el 25.00% de las plantas tienen alturas que varan entre 16.1 a 19.3
centmetros.
Finalmente slo 5.83% de las plantas tienen alturas comprendidas entre 29.3 a32.5 cm.
Si una empresa solicita plantas de cedro para reforestar una zona, con plantas cuyas alturas
sean iguales o mayores de 20 cm; en estas condiciones dispondramos aproximadamente 50%
deplantas de esta especie con la caracterstica solicitada.
FRECUENCIA ACUMULADA

14

Fig. 05. Muestra la frecuencia acumulada de la sexta columna de la fig. 03

Ejemplo 02: Analizar la distribucin de peso seco de plantas observado en un


invernadero de investigacin. El objetivo es conocer la acumulacin de materia
orgnica en las plantas en un periodo de tiempo
Datos de campo sin ordenar

Los mismos datos pero ordenado

4 3,8 2,7 1,5 2,2 1,5 3,3


0,5
6 2,3 1,5 2,9 3,7 1,2
0,8
2 3,3 1,8 2,6 2,8 1,5
0,9
5 3,8
2 2,5 3,9 2,5
1,1
6
3 1,25 2,5
3 3,5
1 5,2
4 2,9
4 2,75 2,8
1,3 1,5 2,95 1,45
4
1 1,6
1 1,5 4,5 2,7 1,5 1,8 1,5
2 5,2
5 2,9 1,48 1,5 1,45
2,5
5 1,5
3 2,2 2,8 1,7
1,5
2 1,2 3,7 2,3 2,9 1,8
1,4
5 1,15 0,5 2,4 3,8 2,5
2 2,2 1,65
3 2,3 3,95 2,25
1,55 4,7
2 1,35 1,1 3,9 2,49
2,3 3,6 1,6 1,3 3,1
2 2,6
2,5
3 1,6
2
4
2 2,5
1,9 1,65 2,5
2 2,7
2
3
3,5 3,21 2,8 1,9 2,39 3,9 3,5
2,7 2,5
3 2,76 3,8
2 2,5
3,8 2,4
3 2,9 1,6 1,7 2,5

0,5
0,5
0,8
0,9
1
1
1
1,1
1,1
1,15
1,2
1,2
1,25
1,3
1,3
1,35
1,4
1,45
1,45
1,48

1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,5
1,55
1,6
1,6
1,6
1,6
1,65
1,65
1,7
1,7

1,8
1,8
1,8
1,9
1,9
2
2
2
2
2
2
2
2
2
2
2
2
2,2
2,2
2,2

2,25
2,3
2,3
2,3
2,3
2,39
2,4
2,4
2,49
2,5
2,5
2,5
2,5
2,5
2,5
2,5
2,5
2,5
2,5
2,5

2,6
2,6
2,7
2,7
2,7
2,7
2,75
2,76
2,8
2,8
2,8
2,8
2,9
2,9
2,9
2,9
2,9
2,95
3
3

3
3
3
3
3
3
3,1
3,21
3,3
3,3
3,5
3,5
3,5
3,6
3,7
3,7
3,8
3,8
3,8
3,8

3,8
3,9
3,9
3,9
3,95
4
4
4
4
4
4,5
4,7
5
5
5
5
5,2
5,2
6
6

Estos nmeros pueden representar tambin: longitud de las hojas (cm), altura de plantas
agrcolas (cm), pH de una sustancia etc.

15

CONSTRUCCIN DE LA TABLA DE FRECUENCIA


Para interpretar mejor el conjunto de datos procedentes del invernadero, se recomienda
resumir estos, en una tabla, denominada tabla de frecuencia (TF), antes de construir la tabla,
los datos deben estar ordenados en forma ascendente o descendente como en el ejemplo
anterior, luego se calculan los siguientes estadsticos.

RANGO(R).

Es igual el dato mximo menos el mnimo


6.0 0.5 = 5.5

NMERO DE CLASES

R =5.5
(K)

K = 1+3.33 log(n).
Donde n es igual al nmero total de los elementos dela muestra, en estadstica se denomina
tamao de la muestra, en este caso el tamao de la muestra es 140.
K=1+3.33 log10 (140)

K=1+3.33(2.1461) = 8.1466

Redondeando el resultado al nmero ms prximo se tiene K = 8


Intervalo de clase o amplitud del intervalo ( I )

R
K

5.5
0.69
8

La primera clase de la columna titulado intervalos de clase de la tabla, resulta de sumar al valor
mnimo de los datos ms el intervalo de clase.
5.5+ 0.69 =1.19
El valor mnimo de la segunda clase ser 1.20 y el valor mximo 1.20 + 0.69 = 1.89, as
sucesivamente se calculan los valores inferiores y superiores de cada clase, hasta completar
las 8 clases. Ver los resultados en la siguiente tabla de frecuencias.
Tabla 03. Distribucin de frecuencia de alturas totales de cedro de la India
Intervalos de
Clase

Marca de
Clase

Frecuencia
Absoluta

Frecuencia
Relativa

Frecuencia
Relativa %

Frecuencia
acumulada

0.5 - 1.19

0.845

10

0.0714

7.14

10

1.20 - 1.89

1.545

33

0.2357

23.57

43

1.90 - 2.59

2.245

37

0.2643

26.43

80

2.60 - 3.29

2.945

28

0.2000

20.00

108

3.30 3.99

3.645

17

0.1214

12.14

125

4.0 - 4.69

4.345

0.0429

4.290

131

4.70 - 5.39

5.045

0.0500

5.000

138

5.40 - 6.09

5.745

0.0143

1.43

140

140

1.0000

100.00

Sumas

Interpretacin (segn los objetivos)


Si nos interesa conocer el peso seco de plantas que tienen iguales o mayores de 4.0
kilogramos, encontraramos slo 10.72% plantas del conjunto que tiene esa caracterstica que
resulta de la suma de las frecuencias relativas 4.29% + 5.0% + 1.43%

16

MEDIDAS DE TENDENCIA CENTRAL


Media aritmtica para poblacin, cuyo smbolo es ()
Es la medida ms importante de la tendencia central de una distribucin, se obtiene dividiendo
la suma de los valores de la distribucin por el nmero de valores observados. La media tiene
en cuenta el valor de cada observacin en la distribucin de datos. Representa un punto de
equilibrio o centro de gravedad, en el que la suma de distancias a las observaciones por
encima del mismo iguala a la suma de distancias a las observaciones que estn por debajo, lo
que supone que la suma total de las distancias entre el valor medio y cada una de las
observaciones es igual a cero. Sin embargo la media aritmtica tiene la desventaja de resultar
sensiblemente afectada por los valores extremos de la variable que estamos analizando.
Ejemplo 01. Supongamos que una poblacin est constituida solamente por 14 datos, como
longitud de postes de madera en metros 3, 7, 9, 6, 7, 4, 8, 5, 9, 10, 8, 6, 4, 10. Para calcular la
media aritmtica () de la poblacin se utiliza la siguiente frmula.
N

Xi
i 1

El smbolo

sigma, indica sumatoria


N

Xi

El smbolo sumatoria con indicaciones i 1


significa que todos los valores de la
variable Xi se suman desde i =1 hasta i = N, es decir por definicin.

= Media aritmtica o promedio aritmtico de la poblacin.

N = Tamao de la poblacin
Xi = isimo valor de la variable X.
Aplicando la frmula a los datos de la poblacin se tiene
N = 14
Los valores de X1 =3, X2 =7 .... X14 =10

3 7 9 6 7 4 8 5 9 10 8 6 4 10
6.8571
14
m

En realidad una poblacin de postes de madera slo con 14 elementos no viene al caso; se
tom este ejemplo con pocos elementos para demostrar el proceso de clculo visual. En la
prctica no conocemos el tamao verdadero de la poblacin de postes de madera, que bien
pueden ser cientos, miles y quizs millones, esto debemos delimitar segn los objetivos del
estudio, por ejemplo si analizamos una plantacin de pino para postes de tendido elctrico, con
mil rboles por hectrea y la plantacin tiene digamos 50 hectreas, el tamao de la poblacin
(N) ser 50,000 rboles.
Media Aritmtica de la muestra

17

Ya se mencion que en la prctica no se conoce el verdadero valor promedio o media de la


poblacin, esta cantidad se estima mediante las tcnicas estadsticas de muestreo. Por
ejemplo si una empresa quiere saber, cuntos metros cbicos de madera existe en una
plantacin de pino de 1000 hectreas, de una edad 20 aos: Suponemos que en mil hectreas
debe haber al menos un milln de rboles con una distribucin entre plantas de 3 metros.

Para estimar la media de la poblacin se extraer una muestra cuyo tamao (nmero
de elementos que tiene la muestra) est en funcin de la variabilidad de los elementos
y el error que uno comete durante el muestreo.
Ejemplo 02. Hemos considerado una poblacin slo de 14 elementos para demostrar el clculo
de la media de la poblacin; si de estos 14 elementos sacamos al azar una muestra, digamos 6
elementos y calculamos la media aritmtica, este valor es un estimador de la verdadera media
de la poblacin, que en raras ocasiones puede ser igual a la media de la poblacin verdadera.
La frmula para el clculo es la siguiente
n

X
i 1

x = media de la muestra
n = tamao de la muestra
Xi = isimo valor de la variable X.
Obteniendo al azar una muestra de 06 elementos de la poblacin de 14 elementos del ejemplo
01 tenemos 7, 9, 6, 8, 4, 10
Calculando la media aritmticas con la frmula propuesta

7 9 6 8 4 10
7.33
6
metros

Este valor sobre estima a la verdadera media de la poblacin que es 6.8571 metros, en algunos
casos el resultado de la muestra sub estima.
Propiedades de la Media aritmtica
La media aritmtica es un valor representativo debido a que es el centro de gravedad o punto
de equilibrio de un conjunto de observaciones,
Si se sustituye el valor de cada observacin por el valor del promedio no vara la suma de todas
la suma de todas las observaciones.
La suma de las desviaciones de las observaciones con respecto al promedio es igual a cero.
n

X
i 1

X 0

La suma de los cuadrados de las desviaciones de las observaciones con respecto a la media
es menor o igual que la suma de los cuadrados de las desviaciones de las observaciones con
respecto a cualquier otro valor.

18

i 1

i 1

Xi X Xi K

donde

K R

Media Aritmtica para datos agrupados (muestra)

Donde
clase

fX

se refiere a la suma de la frecuencia de cada clase, f veces la marca de

N = Tamao de la muestra.
Ejemplo 03. Calcular la media aritmtica de altura total de Cedrela odorata,
agrupada en 8 clases. Para ello se construye la tabla 03 con datos de la tabla 02
Tabla 03. Distribucin de frecuencia de alturas totales de Cedrela odorata
Intervalos de
Clase

Marca de
Clase (X)

06.2 - 09.4
09.5 - 12.7
12.8 - 16.0
16.1 - 19.3
19.4 - 22.6
22.7 - 25.9
26.0 - 29.2
29.3 - 32.5

Frecuencia
Absoluta (f)

7.80
11.10
14.40
17.70
21.00
24.30
27.60
30.90

Sumas

Xf

5
8
16
30
20
18
16
7

39.0
88.8
230.4
531.0
420.0
437.4
441.6
216.3

120

2404.5

2404.5
20.0375
120

Aplicando la frmula de media aritmtica sin agrupar los datos de Cedrela odorata se tiene:

X
n

26.8 19.1 ...15.9 18.5


20.08
120

Donde

n = 120 que corresponde al tamao de


la muestra.

La mediana (Md)

La mediana de un conjunto finito de valores ordenado es aquel valor que divide al


conjunto en dos partes iguales Si el nmero de valores es impar, la mediana es el valor medio
siempre y cuando todas los valores de la variable sean ordenados en magnitudes de menor a
mayor o viceversa. Cuando el nmero de valores en el conjunto es par, no existe un solo valor
medio, si no que existen dos valores medios. En tal caso la mediana corresponde a la media
aritmtica de los dos valores medios.
Por ejemplo calcular la mediana de los datos: 9, 4, 7, 6, 7, 5, 8,3. Primero se ordena 3, 4, 5, 6,

19

7, 7, 8, 9, luego se calcula como sigue: Md=(6+7)/2= 6.5. Si los datos fueran impares como 7,
11, 12, 12, 15, entonces automticamente la mediana es el tercer dato o sea 12.
La Moda (Md)
La moda de un conjunto de valores es aquel valor que ocurre con mayor frecuencia. Si todos
los valores son distintos no existe moda. Un conjunto de valores puede tener ms de una
moda.
La moda del grupo de valores del ejemplo es 7 porque este nmero se ocurre 02 veces.
La moda se puede utilizar para describir datos cualitativos. Por ejemplo supongamos que un
grupo de plantas enfermas fueron tratados con fungicidas orgnicos y al cabo de 2 meses
observamos plantas levemente enfermas, plantas enfermas y plantas sanas.

Mediana para datos agrupados (Md)

Md = L +

n
-F
2
fm

Frmula
Donde:

L = Lmite inferior de la clase mediana (es decir, la clase que contiene


el elemento medio de la distribucin
n = nmero de observaciones en el conjunto de datos o tamao de la muestra
F = suma de las frecuencias en las clases inferiores a la clase mediana
fm = frecuencia de la clase mediana
c = amplitud del intervalo de clase

120
Md = 19.4 +

- 59

3.2 = 19.56
20

Moda (Mod)
Es el valor que aparece ms frecuentemente en el conjunto de datos. La frmula para datos
agrupados es:

Mod = L +
Donde:

d1
c
d1 + d2
L = lmete inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase anterior

d2 = frecuencia de la clase modal menos la frecuencia de la siguiente


clase
c = amplitud del intervalo
Reemplazando en la frmula de moda se tiene
Mod = 16.1+

30 - 16
3.2 = 17.96
30 - 16 + 30 - 20

20

OTRAS MEDIDAS DE TENDENCIA CENTRAL


La media geomtrica
La media geomtrica para datos no agrupados se calcula con la frmula

G =

X 1. X 2 . X 3. . . . . X n

Cuando se usan logaritmos la frmula es


n

logX

Log G =

i=1

Ejemplo: Sobre la base del cuadro 04 calcule el promedio geomtrico de los datos
Tabla 04. Costos mensuales, en dlares de una distribuidora
MES

COSTO EN DOLARES ( $)

Log X

Enero

20000

4.30103

Febrero

30000

4.47712

Marzo

51000

4.70757

Abril

39000

4.59106

Mayo

31000

4.49136

Junio

22000

4.34242

Total

26.91056

Calculando la media geomtrica para estos datos no agrupados se tiene

Log G =

26,91056
= 4.48509
6

El antilogaritmo de 4.48509 es 30555


En consecuencia el costo promedio estimado es igual a 30555 dlares
Media geomtrica para datos agrupados

Log G =

f.logX
n

21

Ejemplo: Calcular media geomtrica de altura de Cedrela odorata.


Tabla 05.

Generada con los datos de la tabla 02

Intervalos de
Clase

Marca de
Clase (X)

Frecuencia
Absoluta (f)

6.2 - 9.4

7.80

0.8921

4.4605

9.5 - 12.7

11.10

1.0453

8.3626

12.8 - 16.0

14.40

16

1.1584

18.5338

16.1 - 19.3

17.70

30

1.2480

37.4392

19.4 - 22.6

21.00

20

1.3222

26.4444

22.7 - 25.9

24.30

18

1.3856

24.9409

26.0 - 29.2

27.60

16

1.4409

23.0545

29.3 - 32.5

30.90

1.4900

10.4297

Sumas

Logaritmo de
Marca de
clase

120

f (log de X)

153.6656

Utilizando la frmula para calcular la media geomtrica para datos agrupados se tiene:
Log G=153.6656/120 = 1.2805,
El antilogaritmo 19.0786, es la media geomtrica de los datos de altura de Cedrela odorata.
Media armnica
Para datos no agrupados se usa la frmula

H=

n
n

X
i=1

Para datos agrupados se usa la frmula

H=

n
1
f

i=1 Xi
n

Donde n es suma de la frecuencia


Ejemplo para datos sin agrupar. Un una empresa de aserro tiene los gastos anuales por
mano de obra de la siguiente manera
AOS
GASTOS

1995
20

1996
40

1997
60

1998
60

1999
30

en miles de dlares

Calcular el gasto promedio, utilizando la frmula propuesta

H=

5
= 35.294
1
1
1
1
1
+ + + +
20 40 60 60 30

Ejemplo para datos agrupados. Calcular la media armnica para datos de altura de Cedrela
odorata.

22

Tabla 06. Primera, segunda y tercera columna de la tabla 02


Intervalos de
Clase

Marca de
Clase (X)

Frecuencia
Absoluta (f)

6.2 - 9.4

7.80

9.5 - 12.7

11.10

12.8 - 16.0

14.40

16

16.1 - 19.3

17.70

30

19.4 - 22.6

21.00

20

22.7 - 25.9

24.30

18

26.0 - 29.2

27.60

16

29.3 - 32.5

30.90

Sumas

120

Aplicando la frmula para datos agrupados tenemos


H=

120
= 17.99
1
1
1
1

1
1
1
1

5
8
16 14.4 30 17.7 20
21 18

16 27
.6 7 30
.9
7.8 11 .1

24.3

Media cuadrtica: Se utiliza la siguiente frmula

Q=

Ejemplo Hallar la media cuadrtica de los siguientes datos: 2, 8, 7, 9, 7, 11. El resultado con la
frmula propuesta es:

22 82 7 2 92 72 112
Q=
7.83
6

CUARTILES Y PERCENTILES
Para hallar los cuartiles y percentiles se ordenar las n observaciones de menor a mayor, luego

np i

i
determinar el producto
siendo n tamao dela muestra, i el p-simo percentil; i se
refiere a la proporcin de casos que acumula el percentil buscado (por ejemplo el percentil 40

acumula una proporcin de casos de (0.40) y finalmente


CASO 1.

i es el lugar que ocupa el percentil.

np

i no es entero redondelo al entero inmediato posterior


Si el resultado
y determine el valor ordenado correspondiente.

Aplicando el mtodo WAVEREAGE, para hallar el lugar del i-simo percentil, calcular:
El cuartil inferior

QI

El cuartil mediana

de un conjunto de datos ordenados es el 25 percentil

Qm

de un conjunto de datos ordenados es el 50 percentil

23

El cuartil superior

QS

de un conjunto de datos ordenados es el 75 percentil

En el clculo de los cuartiles existen dos casos:


a) cuando el resultado del clculo no es entero y
b) cuando el resultado es entero

Primer caso cuando

npi no es entero

Calcule el cuartil inferior QI, cuartil mediana Qm y el cuartil superior Qs de los datos ordenados
0.02
0.15
0.19
0.47
0.71

0.75
0.82
0.92
0.96
1.16

1.17
1.23
1.38
1.4
1.59

1.61
1.94
2.01
2.16
2.41

2.59
3.07
3.53
3.76
4.75

n 25
p1

1
0.25,
4

Clculo del

p2

QI

2
0.50,
4

p3

3
0.75
4

Cuartil inferior

QI 0.25 ( 25) 6.25


Este resultado 6.25 no es entero, por tanto se redondea al entero posterior o sea a 7
Clculo de

Qm

Cuartil mediana

Q 0.50 ( 25) 12.5


m
Este resultado no es entero, por tanto se redondea al entero posterior o sea a 13, este dato
viene a ser la mediana del conjunto de datos
Clculo de

QS

Cuartil superior

QS 0.75 ( 25) 18.75


Como en los casos anteriores, el resultado no es entero, en consecuencia redondeamos al
entero posterior, o sea a 19
El valor del cuartil inferior

QI

segundo cuartil o mediana

Qm

se encuentra 7 lugar del conjunto ordenado, esto es 0.82, el


se encuentra el 13 lugar siendo 1.38 y finalmente el valor del

cuartil superior S se encuentra en 19 lugar esto es igual a 2.16. En el siguiente conjunto de


datos ordenados se resaltan en negrita estos valores calculados.

Segundo CASO.

np i

i
Si el valor
es entero, digamos k, calcule la media de las
observaciones ordenadas k-sima y (k+1)-sima.

Teniendo los siguientes datos de peso seco de materia orgnica hallar el 25 , 50 y 75


percentil en otras palabras calcule el primero, segundo y tercer cuartiles de 28 datos ya
ordenado

24

28 datos ordenados de peso de materia seca (Kg.)


4
4
4
4
4
4.5
5.9

n 28
pi

p1

6
7
7.5
8
8.5
8.7
8.9

9.5
9.6
9.7
9.9
10
10.1
10.2

10.6
10.8
11
11.5
12
13
15

Tamao de la muestra
isimo percentil

1
0.25,
4

Clculo del

QI

p2

2
0.50,
4

p3

3
0.75
4

p1n QI 0.25(28) 7

Este resultado es entero, aplicando el mtodo WAVEREAGE, tomada de JHONSON (1997) el


valor ubicamos en el lugar 7 de los datos ordenados, esto es 5.9, a este valor sumamos el
siguiente valor de la serie que se encuentra en el octavo lugar, esto es 6, sumando ambos
valores y dividiendo entre 2 se tiene

k esima k7

Finalmente
Clculo de

QI
Qm

K 7 5.9

( k 1) esima k8

luego

k8 6

k7 k8 5.9 6

5.95
2
2
p2 n Qm 0.5 ( 28) 14

Este resultado es entero, por tanto seguimos aplicando el mtodo WAVEREAGE y ubicamos el
valor en el lugar 14, esto es 8.9, a este valor sumamos el siguiente dato del conjunto ordenado
o sea 9.5, sumando ambos valores y dividiendo entre 2 se tiene

K esima 14
Finalmente

Qm

( k 1) esima 15

k14 k15 8.9 9.5

9. 2
2
2

El resultado es la mediana del conjunto de 28 datos ordenados


Clculo de

QS

p3n QS 0.75 ( 28) 21

Como en los casos anteriores, el resultado es entero, el valor ubicamos en el lugar 21, esto es
10.2, a este valor sumamos el siguiente dato del conjunto o sea 10.6, sumando ambos valores
y dividiendo entre 2 se tiene

K esima 21

( k 1) esima 22

25

QS

k21 k22 10.2 10.6

10.4
2
2

Rango Intercuartil (RIQ)

RIQ QS QI
RIQ 10.40 5.95 4.45

El rango Intercuartil es igual a 4.45

DIAGRAMA DE CAJA
Definicin
Es un grfico de resumen basado en la mediana, los cuartiles y valores extremos. El grfico
es una caja, representa la amplitud intercuartil que contiene el 50% de los valores centrales de
un conjunto de datos ordenados. Una lnea que atraviesa la caja indica la situacin de la
mediana. Los "bigotes" son las lneas que se extienden desde la caja hasta los valores ms
altos y ms bajos, excluyendo los valores atpicos.
Los diagramas de caja son especialmente eficaces para la descripcin grfica de
comparaciones entre conjuntos de observaciones. Son fciles de entender y ejercen un
poderoso impacto visual.
Ejemplo. Supongamos que se desea describir el peso seco en kilogramos de 25 plantas
despus de un tratamiento con fertilizantes.
Para contruir el diagrama de caja primero ordene los datos en forma ascendente.
0.02
0.15
0.19
0.47
0.71

0.75
0.82
0.92
0.96
1.16

1.17
1.23
1.38
1.4
1.59

1.61
1.94
2.01
2.16
2.41

2.59
3.07
3.53
3.76
4.75

PASOS PARA CONSTRUIR EL DIAGRAMA DE CAJA


Calcular:
La mediana
La muestra contiene nmero de datos impar, en consecuencia la mediana, llamada
tambin cuartil mediana
igual a 1.38 Kg.

Qm

se localiza en el 13 lugar de datos ordenado, siendo esto

Mtodo Bisagras Tukey


El cuartil inferior

QI

QI p1n 0.25( 25) 6.25

Redondeando al nmero entero siguiente el lugar es 7 a este corresponde el valor de 0.82


Kg.
El cuartil superior

QS

QS p3n 0.75( 25) 18.75

26

Redondeando al entero siguiente es 19, significa que el cuartil superior


19 lugar de datos ordenados siendo su valor 2.16 Kg.
Rango Intercuartil

QS

se encuentra

RIQ

El Rango Intercuartil es la diferencia entre el cuartil superior y cuartil inferior

RIQ Qs QI 2.16 0.82 1.34

Representacin grfica de diagrama de caja


1. Construya una caja rectangular paralela a la ordenada Y con
inferior y superior. Entonces la altura de la caja ser igual a
SPSS se denomina Amplitud Intercuartil)

QI

QS

situados la parte

RIQ . (Rango Intercuartil, en

2. Marcar la mediana o cuartil mediana m (1.38) dentro de la caja con una lnea horizontal
resaltado
3. Establezca dos conjuntos de lmites en la grfica de caja.
Cotas interiores

. Es igual a la distancia de 1.5(

RIQ ) por debajo de QI

y por arriba de

QS

1.34*1.5 2.01 2.16 4.17

Cotas exteriores

. Es igual a la distancia de 3(

RIQ ) por debajo de QI

y por arriba de

QS

1.34*3 4.02 2.16 6.18

4. Las observaciones que caen entre las cotas interiores y exteriores se denominan posibles
valores fuera de intervalo. Marque los posibles valores fuera de intervalo en el diagrama
de caja utilizando asteriscos(*). Las observaciones que caen fuera de las cotas exteriores
se denominan valores fuera de intervalo muy probable. Utilice crculos pequeos ( )
para marcar los valores fuera del intervalo muy probables.
5. A fin de destacar los valores extremos, se aaden bigotes al diagrama de caja. Marque

el valor de la variable dentro de la regin entre I y la cota inferior que est ms cercano
a la cota interior con una aspa (X) y otra aspa (X) al cuadro con una lnea punteada. De
forma similar utilice una X y su bigote para ubicar el valor ms extremo entre

27

QS

y la cota

interior superior.
Si calculamos estos valores de primer, segundo y tercer cuartil con software SPSS el resultado
es:
Variables
dependiente
s
PESO

Percentiles
50

,4
5
0
,3
0
,2
0
,1
0
,0
0
,P
e
s
o
e
c
o
d
e
p
la
n
ts

Mtodos
Promedio
ponderado(definicin 1)
Bisagras de Tukey

PESO

25

75

.7850

1.3800

2.2850

.8200

1.3800

2.1600

El diagrama de caja simplificado por SPSS es como sigue

Esto se interpreta de la siguiente manera:

Dentro de la caja estn 50% de datos observados o recogidos durante la investigacin


La lnea negra horizontal dentro de la caja es la mediana del conjunto de datos. La altura de la
caja es igual al rango intercuartil, en otras palabras es la diferencia entre el cuartil superior e
inferior
El 25% de los datos estn por debajo de la caja y 25% por encima de la caja

28

MEDIDAS DE DISPERSIN
La dispersin se refiere a la variabilidad o amplitud en los datos, las medidas ms utilizadas
son: (1) el rango (2) la varianza y (3) la desviacin estndar.
La varianza de la poblacin ( )
La varianza de poblacin (sigma al cuadrado), para datos no agrupados est dada por la
siguiente frmula:

X X

El mismo resultado se obtiene con la siguiente frmula

N
2

La varianza de la muestra ( s ) se calcula con la frmula

(x - x
=

)2

n-1

La frmula que facilita el clculo manual de la varianza de la muestra es la siguiente

s
2

2
i

n 1

La varianza representa unidades al cuadrado, por lo que no es una medida adecuada de


dispersin, si se pretende expresar este concepto en trminos de las unidades originales. Para
hallar la medida de dispersin en unidades originales, se obtiene la raz cuadrada de la
varianza, el resultado se denomina desviacin estndar.
Desviacin estndar
La desviacin estndar es la medida de dispersin (absoluta) ms utilizada en el anlisis de los
datos. La desviacin estndar de la poblacin se simboliza con la letra griega
desviacin estndar de la muestra con la letra latina s.

y la

Ejemplo Hallar la varianza y desviacin estndar de una muestra con 5 elementos (5, 8, 7, 9,
11) obtenida que corresponden a las alturas (m) de rboles.

5 8 7 9 11
8
5

1.

Primero se halla la media:

2.

Calcular la varianza con la frmula para muestras y datos no agrupados:

s2 =

(5 - 8)2 (8 - 8)2 ( 7 - 8)2 (9 - 8)2 (11 - 8)2


5
5 -1

El resultado est dado en unidades cuadradas, por tanto se debe calcular la raz cuadrada del
resultado
3.

La desviacin estndar, es igual a la raz cuadrada de la varianza

s 2 5 2.2361 metros lineales

29

s
2

Utilizando la frmula

s2

2
i

n 1

se tiene donde

X 40 y X

340

(40) 2
5 5
4

340

Sacando la raz cuadrada a la varianza se tiene 2.2361 metros lineales


Ejemplo calcular la varianza y desviacin estndar para datos agrupados, de la tabla 2.
Tabla 07. Datos para calcular la varianza y desviacin estndar de datos agrupados
Intervalos de
Clase

Marca de
Clase (X)

Frecuencia
Absoluta (f)

6.2 - 9.4
9.5 - 12.7
12.8 - 16.0
16.1 - 19.3
19.4 22.6
22.7 - 25.9
26.0 - 29.2
29.3 32.5

7.80
11.10
14.40
17.70
21.00
24.30
27.60
30.90

5
8
16
30
20
18
16
7

Sumas

X x
-12.24
-8.94
-5.64
-2.34
0.96
4.26
7.56
10.86

120

( X x )2
149.8176
79.9236
31.8096
5.4756
0.9216
18.1476
57.1536
117.9396

f ( X x )2
749.0880
639.3888
508.9536
164.2680
18.4320
326.6568
914.4576
825.5772
4146.8820

Anteriormente se ha calculado que el promedio para estos datos agrupados es igual 20.04 cm,
con este valor se construye la columna 04, generando posteriormente las columnas 5 y 6 de la
tabla 07.
Por ejemplo el valor -12.24 se obtiene restando a la marca de clase 7.8, la media aritmtica
20.04.
Con los datos de la tabla 07 se calcula la varianza para la muestra de datos agrupados

30

s2 =

4146.8220
= 34.85
120 - 1
Centmetros cuadrados

Finalmente se calcula la desviacin estndar de las alturas de Cedrela odorata, simplemente sacando la
raz cuadrada de la varianza

s=

34.85 = 5.90cm

Coeficiente de variacin (CV)


La desviacin estndar es til como medida de variacin en un conjunto de datos. Pero, cuando se
quiere comparar la dispersin de dos conjuntos de datos, la comparacin de las dos desviaciones
estndar puede dar un resultado errado. Esto puede ocurrir si las medidas variables que se comparan
tienen medidas en diferentes unidades. Por ejemplo se quiere conocer si la cantidad de semillas de los
rboles medidos en kilogramos son ms variadas que la altura total de los rboles medido en metros.

CV =

s
X

La frmula del coeficiente de variacin es


Como ejercicio calculamos el coeficiente de variacin para alturas totales de Cedrela odorata de la tabla
02
Ya tenemos los valores de la media aritmtica 20.04cm y la desviacin estndar 5.90 cm

CV =

5.9
= 0.2944
20.04

Esta cantidad siempre se expresa en porcentaje, simplemente multiplicando por 100 el C.V, en nuestro
caso el coeficiente es 29.44%.

31

NOCIONES DE PROBABILIDAD
El concepto de probabilidad tuvo su origen en los juegos de dados, cartas y el tiro de la moneda. Luego
se implement en problemas sociales y econmicos. Las probabilidades son muy tiles para tomar
decisiones de posibles resultados futuros. Para utilizarlas es necesario seguir ciertas reglas generales.
La probabilidad es el estudio de experimentos aleatorios o libres de determinacin. Si una moneda es
lanzada al aire, entonces hay certeza que caer, pero no es cierto afirmar que aparecer cara. Sin
embargo supongamos que repetimos el experimento de lanzar la moneda; sea s el nmero de aciertos,
esto es el nmero de veces que un sello aparece, sea n el nmero de lanzamientos. Se sabe entonces

que empricamente la relacin

s
n frecuencia relativa ( f ) tiende a estabilizarse a la larga, o sea

que se aproxima a un lmite. Esta estabilidad es la base de la teora de la probabilidad.


En teora, el clculo y la distribucin de probabilidades es una rama de las matemticas de mucha
utilidad en la Bioestadstica, tanto en las pruebas de hiptesis para poblaciones con valores de medidas
estadsticas, como en la interpretacin de resultados experimentales.
El concepto de probabilidad se usa en aquellas situaciones en donde se tienen varias alternativas de
la ocurrencia de un suceso o evento (E), todas posibles pero ninguna segura.
La probabilidad (p) de que ocurra un suceso determinado es, definida numricamente, como la relacin
entre el nmero de casos favorables y el nmero de casos posibles, siempre que todos sean igualmente
posibles y mutuamente excluyentes.

Nmero de casos favorables


Nmero de casos posibles

Generalmente se expresa, p, en por ciento.

Nmero de casos favorables


100
Nmero de casos posibles

Antes de iniciar con ejemplos se resume algunos trminos importantes.


Experimento - Proceso que produce algn resultado (al lanzar una moneda result sello)
Experimento aleatorio Experimento que se puede repetir.
Evento o suceso Es el resultado conocido o desconocido de un experimento.
Evento elemental Es un resultado particular el cual no se puede subdividir como por ejemplo
la seleccin de una moneda.
Evento compuesto Hay ms de un resultado. Por ejemplo, que en la seleccin de la moneda se
vea cara o sello.
Espacio muestral Es la coleccin de todos los posibles eventos que pueden surgir de un
experimento. Por ejemplo, el espacio muestral de E es (e1, e2, e3).
Eventos mutuamente excluyentes Son eventos que no pueden ocurrir al mismo tiempo. Si
32

sale 2 en un dado no puede salir 5 en el mismo tiro.


Evento independiente La ocurrencia de un evento no tiene influencia en la ocurrencia de otro
evento. Si sale 2 en un dado no afecta el nmero que salga en el prximo tiro.
Evento dependiente La ocurrencia de un evento influye en la ocurrencia de otro evento. Si un
proyecto se empieza tarde otro proyecto que dependa del mismo requerir tiempo adicional.
Con reemplazo - Que se incluye nuevamente en la muestra o grupo de origen.
Se describen las reglas de probabilidad utilizando ejemplos, ejercicios y enlaces.
Las reglas que se presentan en este mdulo se utilizan para
Facilitar el cmputo de probabilidades asociadas a sucesos y fenmenos que siguen un modelo
probabilstico.
Definir el mximo y mnimo de una probabilidad.
Permitir la sumar, restar, divisin y multiplicacin de la probabilidad de un evento o suceso.
Relacionar la probabilidad de un evento dependiente o independiente.
Obtener la probabilidad condicional de un segundo evento.
REGLAS DE PROBABILIDAD
Las reglas que se presentan es para facilitar el cmputo de probabilidades asociadas a sucesos y
fenmenos que siguen un modelo probabilstico.
Definir el mximo y mnimo de una probabilidad.
Permitir la sumar, restar, divisin y multiplicacin de la probabilidad de un evento o suceso.
Relacionar la probabilidad de un evento dependiente o independiente.
Obtener la probabilidad condicional de un segundo evento.
Regla del rango de la probabilidad 0 < P(E) < 1
Para cualquier evento E, la probabilidad de que ocurra ese evento est entre 0 y 1. Si estamos
seguros de que algo puede ocurrir, podemos asignar al evento la probabilidad de 0.0 1.0

Regla del 1 P(e) = 1


La probabilidad de todos los eventos elementales suma 1
Ejemplo: la probabilidad de que salga cara en una moneda es de 0.50 mas la probabilidad de que
salga sello es de 0.50. El total es 1.
Regla del suceso contrario P() = 1 P(E)
La probabilidad del complemento de un evento E, es 1 menos la probabilidad de ese evento.
Ejemplo: La probabilidad de que salga 2 3 en un dado es 2 de 6, se escribe (2/6). La
probabilidad de que no salga 2 3 ser 1 2/6 = 4/6 = 2/3
Regla de suma para eventos elementales (e)
Si E = (e1, e2, e3) entonces
P(E)=P(e1)+P(e2)+P(e3)
33

La probabilidad de un evento compuesto E es igual a la suma de las probabilidades de los


eventos elementales que lo forman (su espacio muestral).
Regla de suma para eventos mutuamente NO excluyentes
P ( E1 E 2) P ( E1 E 2)
P ( E1 E 2) P ( E1) P ( E 2) P( E1 E 2)

La probabilidad de que ocurran los eventos no excluyentes P(E1 E2) que es lo mismo que
P (E1 E2) es la suma de sus probabilidades individuales P (E1) ms P (E2) menos la
probabilidad conjunta de ambos eventos P (E1 y E2) que tambin se escribe como P (E1 E2).
Regla de suma para eventos mutuamente excluyentes
P(E1 E2) = P(E1) + P(E2)
La probabilidad de que ocurran los eventos mutuamente excluyentes E1 y E2 es la suma de sus
probabilidades individuales P(E1) y P(E2)
Regla de probabilidad condicional para dos eventos dependientes E1 y E2

P(E1 | E2) = P(E1 E2)/P(E2) en donde P(E2) es mayor que cero P(E1|E2) se lee como
probabilidad de E1 dado que ha ocurrido E2. ***No es una divisin de la probabilidad de E1 entre
E2***

La probabilidad de que ocurra el evento E1 dado que ha ocurrido el evento E2, es la probabilidad
conjunta de ambos eventos E1 y E2, dividido por la de E2 donde esta ltima debe ser mayor de
cero.
Regla de probabilidad condicional para dos eventos independientes E1 y E2

P (E1|E2) = P(E1)
La probabilidad de que ocurra el evento E1 dado que ha ocurrido el evento E2, es la probabilidad
de que ocurra el evento E1.
Regla de multiplicacin para dos eventos dependientes E1 y E2
P (E1 y E2) = P(E1E2) = P(E1) P(E2|E1)
Es til cuando necesitamos encontrar la probabilidad conjunta pero no tenemos las frecuencias
relativas. La probabilidad conjunta de dos eventos E1 E2, es el producto de la probabilidad
individual de E1 por la probabilidad condicional de E2 dado que ha ocurrido E1.

34

Cul ser la probabilidad de escoger dos ases corridas (sin reemplazo) de un paquete de 52
cartas?
P(E1) es la probabilidad de escoger el primer as = 4/52
P(E2) es la probabilidad de escoger el segundo as = 3/51
El resultado ser 4/52 * 3/51 = 12/2652 = 0.0045
Regla de multiplicacin para dos eventos independientes E1 y E2
P(E1 E2) = P(E1) P(E2)
La probabilidad conjunta de dos eventos E1 y E2 es el producto de la probabilidad de E1 por la
probabilidad de E2.
Cul ser la probabilidad de escoger dos Ases corridas (con reemplazo) de un paquete de 52
cartas?
P(E1) es la probabilidad de escoger el primer As = 4/52
P(E2) es la probabilidad de escoger el segundo As = 4/52
El resultado sera 4/52 * 4/52 = 16/2704 = 0.006

Reglas de probabilidad Tabla de ejemplo


En la siguiente tabla tenemos un resumen de tres grupos divididos por edades y las veces que
comen fuera de la casa por semana.
EDADES
Veces que salen a comer fuera por semana

E5
Menores de 30

E1

e1

10 o ms veces

200

E2

e4

3 a 9 veces

600

E3

e7

1 a 2 veces

400

E4

e10

Menos de una vez

700

TOTAL

1900

E6
30 a 50

E7
Mayores de 50

TOTAL

e2
100

E3
100

400

E5
900

e6
400

1900

E8
600

E9
500

1500

e11
500

e12
0

1200

2100

1000

5000

35

Probabilidad marginal
EDADES
Veces que salen a comer por semana

E5
Menores de 30

E1

e1

10 o ms veces

200

E2

e4

3 a 9 veces

600

E3

e7

1 a 2 veces

400

E4

e10

Menos de una vez

700

TOTAL

1900

E6
30 a 50

E7
Mayores de 50

TOTAL

e2
100

e3
100

400

e5
900

e6
400

1900

e8
600

e9
500

1500

e11
500

e12
0

1200

2100

1000

5000

E7
Mayores de 50

TOTAL

Probabilidad conjunta
EDADES
Veces que salen a comer fuera por semana

E5
Menores de 30

E1

e1

10 o ms veces

200

E2

e4

3 a 9 veces

600

E3

e7

1 a 2 veces

400

E4

e10

Menos de una vez

700

TOTAL

1900

E6
30 a 50

e2
100

e3
100

400

e5
900

e6
400

1900

e8
600

e9
500

1500

e11
500

e12
0

1200

2100

1000

5000

36

Cmputo de la probabilidad

Los siguientes ejercicios le permitirn relazar los conceptos y reglas estudiadas en este mdulo.
Cada ejercicio incluye la idea de cmo hacer el cmputo.
Para contestarlos utilice la tabla de ejemplo presentada en las lminas anteriores.
1 - Compruebe las reglas 1 y 2 sumando todos los eventos elementales.
La suma de todas las probabilidades conjuntas designada como e, debe ser igual a uno.
2 - Utilice la regla 3 para determinar la probabilidad de que las personas menores de 30 aos
salgan a comer fuera. Sume las probabilidades P(e1) + P(e4) + P(e7) + P(e10). Debe ser igual
P(E5)=0.38.
37

3 - Con la regla del suceso contrario determine la probabilidad de que las personas menores de
30 aos no salgan a comer fuera. Debes restar uno menos la probabilidad del ejercicio anterior.
Esto es 1-P(E5).
4 Utilice la regla 4 para conseguir la probabilidad de personas que coman fuera 3 a 9 veces por
semana o que sean mayores de 50 aos. Haga el siguiente computo: P(E2) + P(E7) P(E2 E7)
En este caso P(E2 E7) es igual a P(e6) que es 0.08.
5 Utilice la regla 5 para conseguir la probabilidad de personas que coman fuera de 1 a 2 veces
o de 3 a 9 veces por semana. El resultado lo obtendr con la suma P(E2) + P(E3).
6 Con la regla 6 determine la probabilidad encontrar personas que coman fuera menos de una
vez dado de que son menores de 30 aos. Esto es P(E4/E5) = P(E4 E5)/P(E5)
7 Con la regla 7 demuestre la probabilidad de encontrar personas menores de 30 dado de que
hay personas mayores de 50. Esto es P(E5/E7) debe ser igual a P(E5).
Ejercicios de redaccin, use la tabla de ejemplo
1 - Mencione cules de los eventos en la tabla son independientes y cules son dependientes.
Mencione si hay eventos mutuamente excluyentes. Explique su razonamiento de acuerdo a las
definiciones presentadas en este mdulo.
2 - D ejemplos de eventos elementales y compuestos.
3 - Escriba sobre cul es el espacio muestral de los eventos E2, E4, E5 y E7.
Ejemplo. La probabilidad de obtener el rey de diamantes al extraer una primera carta de una baraja es
P(KD) = 1/52
Si la primera carta seleccionada fue efectivamente el rey de diamantes y si la primera carta no se vuelve
a colocar en la baraja, la probabilidad de obtener otro rey en la segunda eleccin es dependiente de la
primera eleccin porque ahora quedan solamente 3 reyes y 51 cartas en la baraja. La probabilidad
condicional de escoger otro rey, dado que el rey de diamantes fue ya escogido y no se volvi a colocar
es P(K/KD) = 3/51.
As la probabilidad de escoger el rey de diamantes en la primera seleccin y, sin reemplazo, escoger otro
rey en la segunda es
P(KD y K) = P(KD) . P(K/KD) = 1/52 . 3/51 = 3/2652

DISTRIBUCIONES DE USO COMN


DISTRIBUCIN BINOMIAL O DE BERNOULLI
38

Es un importantsimo teorema de la teora estadstica, porque constituye, en cierta medida, un nexo entre
la vaga definicin de probabilidad y su utilizacin prctica. Su autor JACOBO BERNOULLI, confes, en
su obra publicada en 1713, haber tardado 20 aos en su demostracin.
Esta distribucin est representada por el desarrollo del binomio . Cuando p y q son iguales, la
distribucin es simtrica, como cuando p = 0.5 y q = 0.5. Cuando p > q, la distribucin es asimtrica; sin
embargo, aun en estos casos la distribucin puede llegar a ser simtrica si nes numerosa y con accin
ecolgica intensa, como ocurre un caracteres cuantitativos biolgicos (altura del rbol, volumen de la
troza, longitud de la raz, etc.).
La distribucin Binomial se utiliza cuando se tiene una variacin discreta y el nmero de clases
es bajo. Por ejemplo porcentaje de plantas sanas o enfermas, relacin del sexo, en estos casos se

(p+q) n

puede obtener el desarrollo


.
Cuando p = q y n crece infinitamente, se tiene una curva que recibe el nombre de curva normal de
probabilidades; la cual es semejante a la curva de errores de Gauss.
Ejemplo: calcular la distribucin de obtener 0, 1, 2, 3, 4 y 5 plantas de una poblacin, en el cual 40% son
enfermas 60% sanas: teniendo la siguiente informacin: p = enferma y q = sanas
p = 0.4 q = 0.6;
n=5
Es fcil calcular la distribucin de 0, 1, 2, 3, 4 y 5, utilizando la siguiente frmula:

p(x)=

n!
x n x
p q
x! n-x !

Donde n! (lese n factorial) = n . (n-1) . (n-2) . . 3 . 2 . 1,


y 0!=1
La variable aleatoria X denota el nmero de xitos en n pruebas, X = 0, 1, 2, ... , n.
Por ejemplo: Supongamos una plantacin con 40% de rboles enfermos, de esta plantacin extraemos
05 muestras al azar, nos pide calcular, cul es la probabilidad de que en la muestra obtenida: ninguno de
los rboles sea enfermo; uno sea enfermo, dos sean enfermos, 3 sea enfermos 04 sean enfermos, 05
sean enfermos.
Nota, por definicin q = 1-p
Llamemos p la proporcin de plantas enfermas y q sanas.
Entonces p = 0.4
q = (1 - 0.4) = 0.6.
Si calculamos las probabilidades de que 0, 1, 2, 3, 4 y 5 sean enfermas, los resultados son:

P ( X 0)

5!
(0.4)0 (0.6)5 0.07776
0!(5 0)!

P ( X 1)

5!
(0.4)1(0.6) 4 0.25920
1!(5 1)!

P ( X 2)

5!
(0.4) 2 (0.6)3 0.34560
2!(5 2)!

P ( X 3)

5!
(0.4)3 (0.6)2 0.23040
3!(5 3)!

P ( X 4)

5!
(0.4) 4 (0.6)1 0.07680
4!(5 4)!

P( X 5)

5!
(0.4)5 (0.6) 0 0.01024
5!(5 5)!

39

Preguntas: a) Cul es la probabilidad de que, tres o ms plantas sean enfermas?


Respuesta: sumar las probabilidades de x=3, x=4 y x=5, o sea 0.23040 + 0.076680 + 0.01024 = 0.31744.
b) Cul es la probabilidad de que, dos o menos plantas sean enfermas?
Respuesta: sumar las probabilidades de x=2, x=1 y x=0, o sea 0.34560 + 0.25920 + 0.07776 = 0.6826.

Algunas Propiedades de la Distribucin Binomial


MEDIA

np

VARIANZA

DESVIACIN ESTNDAR

npq
npq

Por tanto para la distribucin anterior

=5(0.4)=2

2 5(0.4)(0.6) 1.2
= 5(0.6)(0.4) 1.095
Supuestos:
1.

Hay slo dos resultados posible para cada ensayo(arbitrariamente llamados xito y

fracaso)
2.

La probabilidad de un xito es la misma para cada ensayo

3.

Hay n ensayos, donde n es una constante y

4.

Los n ensayos son independientes

Ejemplo: suponga que se sabe que el 30% de cierta poblacin plantas es inmune a alguna enfermedad.
Si se escoge una muestra aleatoria de 10 elementos de entre esta poblacin Cul es la
probabilidad de que dicha muestra contenga exactamente 04 plantas inmunes?

P( X 4)

10!
(0.7)6 (0.3) 4 0.2001
4!(10 4)!

Ejemplo. Suponga que se sabe que en cierta poblacin 10% es de


la especie A, si se extrae una muestra aleatoria de 25
elementos de esa poblacin, encuentre de que:
a)

Existen cinco o menos de la especie A

P ( X 5)

25!
(0.1)5 (0.9) 20 0.06459
5!(20)!

P ( X 4)

25!
(0.1) 4 (0.9) 21 0.138415
4!(21)!

40

P ( X 3)

25!
(0.1)3 (0.9)22 0.22649
3!(22)!

P( X 2)

25!
(0.1) 2 (0.9) 23 0.26588
2!(23)!

P ( X 1)

25!
(0.1)1 (0.9) 24 0.19941
1!(24)!

P( X 0)

25!
(0.1) 0 (0.9) 25 0.07179
0!(25)!

Respuesta correcta 0.9666


b)

Existen 06 o ms de la especie A

P ( X 6)

25!
(0.1)6 (0.9)19 0, 023924
6!(19)!

P ( X 7)

25!
(0.1) 7 (0.9)18 0, 007215
7!(18)!

P ( X 8)

25!
(0.1)8 (0.9)17 0, 001804
8!(17)!

P ( X 9)

25!
(0.1)9 (0.9)16 0, 000379
9!(16)!

P( X 10)

Sumando

25!
(0.1)10 (0.9)15 0, 0000467
10!(15)!

los

resultados

de

cada

una

encontradas se tienen aproximadamente

de

las

probabilidades

0.0334, no vale la

pena seguir calculando para 11, 1225 porque el resultado es


aproximadamente cero.
Para encontrar una respuesta ms rpida se utiliza el concepto de
probabilidades complementarias, o sea la probabilidad de que
existan seis o ms de la especie A, es el complemento de la
probabilidad de que existan 05 o menos. Como ya se calcul
para cinco o menos iguala a 0.9666
P( X 6) 1 P( X 5) 1 0.9666 0.0334
c)

Existen

entre

seis

nueve

individuos

de

la

especie

inclusive
La respuesta es la suma de las probabilidades de 6, 7, 8 y 9
individuos igual a 0,0333.
41

d)

Existan dos, tres o cuatro de la especie A

Respuesta es la suma de las probabilidades de 2, 3 4 plantas


0.265888+0.226497+0.138415 = 0.6308

Ejercicio
En cierta comunidad de plantas de una especie maderable 85%
estn

invadidas

por

plantas

trepadoras,

un

forestal

selecciona una muestra aleatoria de 12 plantas para hacer


el tratamiento correspondiente.
a.

Calcular la probabilidad de que en la muestra seleccionada


07 plantas estn invadidas
P ( X 7)

b.

12!
(0.85) 7 (0.3)5 0, 019280
7!(5)!

Se encuentre 5 plantas o menos invadidas

P ( X 5)

12!
(0.85)5 (0.15)7 0, 000600
5!(7)!

P ( X 4)

12!
(0.85) 4 (0.15)8 0, 000066
4!(8)!

P ( X 3)

12!
(0.85)3 (0.15)9 0, 000005
3!(9)!

La

respuesta

es

la

suma

de

las

probabilidades

calculadas

0.00671
c.

Se encuentre ocho o ms plantas invadidas

P ( X 8)

12!
(0.85)8 (0.15) 4 0, 068284
8!(4)!

P ( X 9)

12!
(0.85)9 (0.15)3 0,171976
9!(3)!

P( X 10)

12!
(0.85)10 (0.15) 2 0, 292358
10!(2)!

P ( X 11)

12!
(0.85)11 (0.15)1 0, 301218
11!(1)!

P ( X 12)

12!
(0.85)12 (0.15)0 0,142242
12!(0)!

Sumando los resultados de cada probabilidad se tienen la


42

respuesta correcta que es 0.976078

DISTRIBUCIN DE POISSON
Una forma sencilla de generar el modelo probabilstica que se conoce como distribucin de Poisson es
considerar un nmero muy grande de repeticiones de un experimento Binomial, con probabilidades de
xito muy pequeas. Bajo ciertas condiciones, la distribucin de la variable X, definida como el nmero
de xitos en n repeticiones, se aproxima (cuando n tiende a infinito) a la funcin de probabilidades de
Poisson. Por esta razn se considera a veces al modelo Poisson como una forma lmite de la distribucin
Binomial y se le utiliza para aproximar probabilidades en sta. Aparte de su uso como una aproximacin
a la distribucin Binomial, la distribucin de Poisson sirve como modelo para experimentos donde los
eventos ocurren en intervalos de tiempo y espacio y nos interesa el nmero promedio de ocurrencias en
el intervalo. En este caso se supone que cada repeticin del experimento Binomial que genera el espacio
muestral ocurre en cada punto del intervalo y, por lo tanto, el nmero de repeticiones puede considerarse
infinito. Como ejemplos especficos de fenmenos que pueden representarse por este modelo tenemos:
el nmero de partculas de polvo en cierto volumen de aire, las llamadas en una lnea telefnica por
unidad de tiempo, el nmero de incendios forestales, el nmero de accidentes por mes en una
extracciones forestales, el nmero de insectos por rbol en una plantacin atacada etc.
Los postulados que rigen a un experimento cuyo modelo probabilstico es Poisson se anotan en seguida.
Un modelo probabilstico Poisson tienen las siguientes caractersticas:
5.
El espacio muestral se genera por un nmero muy grande (puede considerarse infinito)
de repeticiones en un experimento cuyo modelo probabilstico es Binomial con probabilidades
muy pequeas de xito. Por esta razn a la distribucin de Poisson se le llama de eventos
raros. Las repeticiones del experimento Binomial se realizan en cada uno de los puntos de un
intervalo de tiempo o espacio.
6.

El nmero de xitos en el intervalo

Ii

es independiente del nmero de xitos en el

I I I

k
intervalo k , donde i
7.
La probabilidad de que se tengan 2, ms xitos en el mismo punto del intervalo es 0.

8.
El nmero promedio de xitos en un intervalo es una constante , (lambda) que no
cambia de intervalo a intervalo.
Para aclarar el significado de estos cuatro postulados presentamos el siguiente ejemplo.
Una variable aleatoria X tiene una distribucin de Poisson si su funcin de probabilidades est dada por:

e x
P( X )
; x 0,1, 2,....
x!
Donde P(X) = Probabilidad de X nmero de apariciones,

nmero promedio de apariciones

Ejemplo:
Un entomlogo examina una planta contando el nmero de huevecillos de un insecto (Helliothissp) por
planta. De estudios anteriores se sabe que bajo las condiciones del experimento el nmero de
huevecillos por planta puede representarse por una distribucin de Poisson con = 0.9. Las

43

probabilidades de que el entomlogo encuentre 0,1,2... huevecillos por planta son:

p( 0)

e 0.9 (0.9)0
0.40657
0!

e0.9 (0.9)1
p ( 1)
0.36591
1!
p(x=2)=

e-0.9 (0.9) 2
0.16466
2!

p(x=3)=

e-0.9 (0.9)3
0.04940
3!

p(x=4)=

e-0.9 (0.9)4
0.01111
4!

p(x=5)=

e-0.9 (0.9)5
0.00200
5!

p(x=6)=

e-0.9 (0.9) 6
0.00030
6!

p(x=7)=

e-0.9 (0.9) 7
0.00004
7!

Se puede verificar que las probabilidades de X=8, X=9 etc. son ceros con una aproximacin de 5
decimales por lo que no vale la pena calcular ms.
Entonces la probabilidad de encontrar 7 o menos huevecillos ser la suma de las probabilidades de 0, 1,
2, 3, 4, 5, 6, y 7= 0.9999
La probabilidad de encontrar 5 ms huevecillos ser la suma de las probabilidades de 5, 6, 7, 8, 9, en
otras palabras sumar las probabilidades 0.00200 + 0.0003 + 0.00004 + = 0.0023.
Cuando utilizar el modelo Poisson
La distribucin de Poisson se utiliza cuando se encuentran los eventos o entidades distribuidas al azar
en espacio y tiempo, y bajo esta suposicin se puede calcular la ocurrencia de eventos o entidades en
alguna unidad de espacio y tiempo.
En un estudio de suicidas encontraron que la distribucin mensual de adolescentes suicidas, sigui una
distribucin de Poisson con parmetros

2.75

Encuentre la probabilidad de que en un mes seleccionado aleatoriamente se uno en el que ocurri el


suicidio de tres adolescentes
Solucin:

P ( X 3)

e2.75 2.753 (0.063928)(20.796875)

0.221584
3!
6
44

Cul es la probabilidad de que en un mes seleccionado aleatoriamente sea uno en el que ocurrirn tres o
cuatro suicidios

e 2.75 2.754
P ( X 3) 0.221584
4!
2.21584 0.152338 0.373922
Puesto que los eventos son mutuamente excluyentes la regla de adicin para encontrar los resultados

Durante el estudio de cierto nmero de organismos acuticos, se tom un gran nmero de muestras de
una laguna, y se cont el nmero de organismos en cada muestra. El nmero promedio de los
organismos encontrados por muestra fue de dos. Suponiendo que el nmero de organismos sigue una
distribucin de Poisson, calcule la probabilidad de que la prxima muestra que se tome tenga un
organismo o menos. P ( X 1| 2) 0.406

P ( X 1)

e 2 21
0.27067
1!

P ( X 1)

e 2 20
0.13533
0!

Respuesta

sumando

ambos

resultados

se

encuentra

que

la

probabilidad buscada es 0.406


Calcule

la

probabilidad

de

que

la

siguiente

muestra

tenga

exactamente tres organismos


P ( X 3 | 2) P ( X 3) P ( 2) 0.857 0.677 0.180

e 2 23
P ( X 3)
0.180447
3!
e 2 22
P ( X 2)
0.216536
2!
e 2 21
P ( X 1)
0.270670
1!

e 2 2 0
P ( X 0)
0.13533
0!

45

DISTRIBUCIN NORMAL
Uno de los ms importantes ejemplos de una distribucin de probabilidad continua es la Distribucin
Normal, algunas veces llamada distribucin de Gauss. La funcin de densidad para la distribucin est
dada por:

f (X )

2
1
e ( x ) / 2
2

(mu) es la media y (sigma) es la desviacin estndar de la poblacin.


La variable aleatoria continua X es aquella que puede tomar un nmero infinito de valores dentro de
cualquier intervalo dado. La probabilidad de que X caiga dentro de algn intervalo est dada por el rea
bajo la distribucin de probabilidad (o funcin de densidad) dentro de ese intervalo. El rea total
(probabilidad) bajo la curva es 1.
ALGUNAS PROPIEDADES DE LA DISTRIBUCIN NORMAL
1.

La distribucin normal es simtrica al rededor de la media , el valor esperado de X,

2.

Debido a la simetra, la media, moda y mediana coinciden

3.

La distancia horizontal entre una lnea vertical erigida sobre eje (X) y el punto de inflexin

de la curva es la desviacin estndar () de la distribucin.


DISTRIBUCIN NORMAL ESTNDAR
Es una distribucin con media de 0 y una desviacin estndar 1.
Expresado de esta manera ( 0

y 1 )

Cualquier distribucin normal de eje X se puede convertir a una distribucin normal estndar
estableciendo que

0 y expresando las desviaciones de en unidades de desviacin estndar

(escala Z). En tales condiciones 68.28% del rea total (probabilidad) bajo la curva normal estndar se
incluye dentro de una desviacin estndar de la media (o sea
99.74% dentro de

1 ), 95.54% dentro de 2 , y

3 .

Para encontrar probabilidades (reas)para la solucin de problemas de distribucin normal,


primero se convierte el valor de X a su correspondiente valor en Z, con la siguiente frmula

Posteriormente se localiza el valor de Z en la tabla estadstica estructurado para Z.


Ejemplo: En un inventario forestal realizado en la comunidad de Cheni, durante enero de 2008, se
encontr los siguientes resultados que figuran en el siguiente cuadro.

46

Resultados de evaluacin de crecimiento del Junglas neotropica observados en el paraje Cheni.


Altura (m)
11.998

Dimetro (cm)
14.78

Volumen (m3)
0.1380

0.105

0.29

0.0104

Mediana

12.216

14,50

0.1074

Moda

10.531

15.00

0.0913

Desviacin estndar

2.299

6.49

0.2270

Varianza de la muestra

5.285

42.21

0.0516

Rango

12.285

90

3.7155

Mnimo

6.096

05

0.0067

Mximo

18.381

95

3.7223

5710.954

7034.50

65.6821

476

476

476

19.16

43.96

164.54

Estadgrafos
Media
Error tpico

Suma total
Tamao de la muestra
C.V.%

Si consideramos la variable dimetro como un indicador para uso de la madera de nogal por la
comunidad, habrn muchas interrogantes. Por ejemplo los rboles con dimetros iguales o menores de
10cm en qu se utilizarn y qu porcentaje de estos rboles podemos encontrar en la plantacin de
Cheni?.
En funcin a su dimetro qu probabilidades de uso tienen los rboles de nogal de la
comunidad de Cheni?
4.
a. rboles con dimetros menores de 10 cm.
En el cuadro 01 la desviacin estndar de los dimetros de nogal en la plantacin de la comunidad de
Cheni es 6.4969cm y una media de 14.7783, en consecuencia, utilizando la distribucin normal estndar

se puede estimar el porcentaje de rboles que existen en la plantacin.

Xi

10 14.78
0.74
6.49

El valor de Zcalculado es - 0.74 este es un valor estandarizado de la variable dimetro, para conocer el
rea correspondiente de Z =-0.74, se busca en la tabla Z de la distribucin normal estandarizada
integrada desde cero a mas infinito, una parte de la tabla Z se encuentra en el en la siguiente pgina.
El valor 0.74 es negativo, no se encuentra en esta tabla, pero considerando la simetra de la curva
normal estndar se toma el valor absoluto, o sea 0.74

47

TABLA 01: REAS BAJO LA CURVA NORMAL TIPIFICADA


Z
0,0
0,1
0,2
0,3
0,4

0
0,0000
0,0398
0,0793
0,1179
0,1554

1
0,0040
0,0438
0,0832
0,1217
0,1591

2
0,0080
0,0478
0,0871
0,1255
0,1628

3
0,0120
0,0517
0,0910
0,1293
0,1664

4
0,0160
0,0557
0,0948
0,1331
0,1700

5
0,0199
0,0596
0,0987
0,1368
0,1736

6
0,0239
0,0636
0,1026
0,1406
0,1772

7
0,0279
0,0675
0,1064
0,1443
0,1808

8
0,0319
0,0714
0,1103
0,1480
0,1844

9
0,0359
0,0753
0,1141
0,1517
0,1879

0,5
0,6
0,7
0,8
0,9

0,1915
0,2257
0,2580
0,2881
0,3159

0,1950
0,2291
0,2611
0,2910
0,3186

0,1985
0,2324
0,2642
0,2939
0,3212

0,2019
0,2357
0,2673
0,2967
0,3238

0,2054
0,2389
0,2704
0,2995
0,3264

0,2088
0,2422
0,2734
0,3023
0,3289

0,2123
0,2454
0,2764
0,3051
0,3315

0,2157
0,2486
0,2794
0,3079
0,3340

0,2190
0,2517
0,2823
0,3106
0,3365

0,2224
0,2549
0,2852
0,3133
0,3389

Nota: En esta tabla no hay valores de negativos de Z. Como la distribucin normal estndar es
simtrica, el rea desde cero hacia mas el infinito es igual al rea desde cero a menos infinito y
su valor para cada uno es a 0.5
La pregunta que anteriormente planteamos es
Tomando el valor absoluto de Z, en la interseccin de fila y columna sombreada de la tabla se encuentra
el valor de Z tabulado igual a 0.2704, pero este valor es al rea que corresponde desde Z igual a cero
hasta Z igual a 0.74. La pregunta es, rboles con dimetros menores de 10cm en todo caso restamos el
rea 0.2704 de 0.5000, en consecuencia el rea buscada es igual 0.5000 0.2704 = 22.96 o 22.96%
b)

rboles con dimetros entre 10cm a 15cm

Con el mismo procedimiento anterior

Z1

10 14.78
0.74
6.49

Z2

15 14.78
0.034
6.49

Z1 = - 0.74

El rea que corresponde a este valor es igual a 0.2704 (lado izquierdo de cero)

Z2 = 0.034

El rea que corresponde a este valor es aproximadamente igual a 0.0120.

En consecuencia las reas que se encuentran en el lado izquierdo y derecho de la media cero es la
suma de ambos valores.
0.2704 + 0.0120 = 0.28.24 en trminos el 28.24% de rboles tienen dimetros entre 10 y 15cm
c)

Z1

rboles con dimetros de 15 20.00cm

15 14.78
0.034
6.49

Z2

20.00 14.78
0.80
6.49

El valor de Z1calculado es 0.034, el rea correspondiente es igual a 0.012


El valor de Z2 calculado es 0.80 y el rea correspondiente es igual 0.2881
Ambas reas se encuentran superpuestas en el lado derecho de la media cero en consecuencia
restando del rea mayor la menor se tiene la respuesta 0.2881 0.012 = 27.61.
En consecuencia 27.62% de rboles de las plantaciones de esta comunidad estara destinado para
puntales para mina y postes cortos para cercos.

48

d)

Z1

rboles con dimetros entre 20cm y 25cm

20.00 14.78
0.80
6.49

Z2

25.00 14.78
1.57
6.49

El valor de Z1 es igual a 0.80 y su rea es igual a 0.2881


El valor de Z2 es igual a 1.57 y su rea correspondiente es igual a 0.4418
Ambas reas se encuentran superpuestas en el lado derecho de la media cero en consecuencia
restando se tiene el resultado
0.4418 0.2881 = 0.1537
En consecuencia solamente 15.36% de rboles de las plantaciones quedara para postes de tendido
elctrico de baja tensin.
e)

rboles con dimetros mayores de 25cm

25.00 14.78
1.57
6.49

El valor de Z calculado es 1.57 el rea correspondiente es igual 0.4418.


La pregunta dice mayores de 25cm conociendo que todo el rea desde la media cero al infinito es igual a
0.5, solamente queda restar el rea de lectura
0.5000 0.4418 = 0.0582
En consecuencia solamente 5.82% de rboles de las plantaciones de esta comunidad sera para
aserro.
Los valores de Z calculado fueron obtenidos en la tabla cuyos valores se leen desde la media igual a
cero de la distribucin normal estndar, para mejor detalle se anexa

49

Distribucin t Student
Esta distribucin fue estudiada por William Gosset en 1908, Ronald Fisher perfeccion en 1924. Es muy
til para el estudio de muestras pequeas es decir cuando n es menor de 60. Cuando la muestra o
poblacin es muy grande de 120 o ms observaciones, la distribucin t es prcticamente normal e igual
a la distribucin Z.
Anloga a la empleada para calcular Z, la frmula para calcular t es:

x
Sx

Como se observa, para calcular t se necesita el parmetro y dos estadsticos,


se necesita un valor de Xi de cualquier observacin y dos parmetros
Error estndar (

Sx

x y S x . Para calcular Z

El valor x se llama error estndar de la media de una muestra de tamao n, tomada al azar de una
poblacin normal; para calcular se utiliza la siguiente frmula

Sx

s2
s

n
n

Donde:
s2 es la varianza de la muestra, n tamao de la muestra.

S
La expresin

2
x

s2

se llama varianza de la media de una muestra de tamao n.

El error estndar (o error tpico) de la media

S 2 x est dado en las mismas unidades que aquellas

usadas para las observaciones. El error tpico de la muestra estima al error tpico de la poblacin

x y

su valor indica la confiabilidad de un estimador de .


Las caractersticas son:
Forma
El problema de investigar, la significacin de la desviacin de la media aritmtica de una muestra con
respecto a la media aritmtica de un universo, dado cuando N es pequea y se conoce nicamente la
varianza de la muestra, fue resuelto por W. Gosset, que escriba con el seudnimo Student. Su mtodo
fue modificado por Ronald. A. Fisher. Cuando el universo de X es normal, ellos demostraron que la
variable
1

( X )( N 1) 2
t
s
tiene una distribucin simtrica de forma de campana, pero no normal con

= 0, su funcin de

densidad de probabilidad es de la forma

50


t
y c 1
n

( n 1)
2

Donde el parmetro n = N-1 es el nmero de grados de libertad, C es una constante que depende de n y
est determinada de tal forma que el rea bajo la curva de densidad es igual a la unidad.
GRADOS DE LIBERTAD.

x o su desviacin de la media del universo x ,


cmo puede variar t en la frmula anterior? . Claramente, la variacin de t para cualquier x , depende
del denominador s, Para una x dada, las N variantes que constituyen la muestra x 1, x2, x3, .xN. Pueden
Dada una muestra de tamao N que determina una

variar libremente y, as, determinar los valores de la desviacin estndar s, sujeta a la restriccin

1
x
N

x
i 1

As, se llega a la conclusin de que la distribucin t tiene N-1 grados de libertad.


Aplicaciones, se utiliza para la prueba de hiptesis sobre las caractersticas de la poblacin.

PRUEBA DE t PARA UNA MUESTRA


El procedimiento Prueba t para una muestra comprueba si la media de una sola variable proveniente de
una poblacin normal difiere de una constante especificada.
Ejemplos. Un investigador desea comprobar si la mortandad de rboles establecido en una campaa de
plantacin difiere de 30%.
La hiptesis planteada es la siguiente

Ho : 30% Ha : 30%
Esta hiptesis generalmente se demuestra con 95% de confianza.
Para comprobar la hiptesis se debe obtener informacin de mortandad de rboles en la zona de
plantacin. Si el resultado de mortandad en porcentaje, obtenido mediante el muestreo al azar en 15
parcelas es la siguiente:

25

36

35

Media = 22.93

18

12

15

14

12

14

18

15

16

33

45

36

Desviacin estndar = 11.022

Los estadgrafos de la muestra necesarios para probar la hiptesis planteada son:


La media = 22.93%, desviacin estndar s = 11.022% y el tamao de la muestra n = 15
La media de la muestra 22.93% se compara con el supuesto 30% mediante la frmula de
t de Student para una muestra.

tc

x
s
n

tc
Reemplazando valores

22.93 30
2.4843
11.022
15

El valor absoluto de t calculado (tc) 2.4843 se debe comprar con el valor de t, tabulado con un nivel de

51

significacin de alfa 0.05, obtenido de la tabla t de Student con (n-1) grados de libertad; en este ejemplo
el valor de t tabulado con 14 grados de libertad es 2.145
Realizando la comparacin se tiene, 2.4843 > 2.145
Cuando t calculada es mayor que t tabulado se rechaza la hiptesis nula planteada y se acepta la
alterna. En consecuencia se rechaza la hiptesis nula planteada. Esto quiere decir que 22.93% de
mortandad es significativamente inferior al supuesto 30%.

PRUEBA DE t PARA DOS MUESTRAS INDEPENDIENTES


PRIMER CASO SUPONIENDO VARIANZAS IGUALES
Es ms comn, surge cuando deseamos comparar las medias de dos poblaciones y hemos tomado
muestras de cada una independientemente. Por ejemplo podramos tener una muestra de un rodal
semillero entre 20 y 30 aos de edad para comparar la cantidad de semillas producida.
El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de casos.
Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma que
cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros
factores.
Ejemplo. Supongamos que se tienen dos poblaciones normales independientes con medias
desconocidas 1 y 2 y varianzas desconocidas pero iguales 21 =22 =2.Se desea probar

Ho : 1 2
Ha : 1 2

Sean

x1 , x 2, S 21 , S 2 2

como S

, las medias muestrales y las varianzas muestrales respectivamente. Puesto que

1
2
tanto
son estimaciones de la varianza comn 2,pueden combinarse para formar un solo
estimador, por ejemplo:
2

s2

(n1 1) s1 (n2 1) s 2
n1 n 2 2

Para demostrar la hiptesis planteada

tc

S
S

x1 x2
x1 x2

Ho : 1 2 , se requiere la frmula de t de Student

x1 x2
S x1 x2

s2 s2

n1 n2
Se denomina error estndar de la diferencia de medias

Ejemplo: Sean dos zonas X1 y X2, donde fue observada la mortandad de plantas de una especie
arbrea como consecuencia del ataque por insectos defoliadores, los datos en % son:

52

No.
Observaciones
1
2
3
4
5
6
7
8
9
10
Totales
Media
Des. Estndar
Varianza

X1

X2

26
26
29
30
14
12
11
9
16
25
198
19.8
8.1350

36
12
15
14
11
11
10
12
14
8
143
14.30
7.9029

66.18

62.46

Primero se debe probar la hiptesis nula Ho : 1 2


Para ello se recurre a la prueba de F, donde Fc (f calculado)
2

Fc

S2
S2

Reemplazando

Fc

66.18
1.06
62.46

El valor de Fc (1.06) se compara con el valor de F tabulado con los grados de libertad (n 1-1) y (n2-1) para
un nivel escogido en este caso con 0.05 (alfa 0.05) que es igual a 3.18, luego
Comparando Fc = 1.06 es menor que 3.18 de F tabulado con ( 0.05) con 9 y 9 18 g.l
Cuando Fces menor que Ft ( F tabulado) se acepta la hiptesis planteada, en consecuencia la varianza
de la muestra X1 es igual estadsticamente a la varianza de la muestra X2.
Calcular la varianza comn (S2)
2

(n 1) s1 (n2 1) s 2
s 1
n1 n 2 2

s2

(10 1) 66.18 (10 1) 62.46


64.32
10 10 2

Calcular el error estndar de la diferencia de medias

x1 x2

6 4 .3 2 6 4 .3 2

3 .5 8 6 6
10
10

Calcular las medias cada grupo

x 1 1 9 .8

x 2 1 4 .3 0

Finalmente calcular, tc

53

tc

x1 x2
S x1 x2

Reemplazando valores

tc

1 9 .8 1 4 . 3 0
1 .5 3 3 5
3 .5 8 6 6

En consecuencia. Cuando el valor absoluto de t c es menor que t alfa tabulado se acepta la hiptesis nula
caso contrario se rechaza, en este caso aceptamos la Ho
Nota el valor de t tabulado, se busca en la tabla t de Student con (n1 + n2) 2 grados de libertad y con
un nivel de significacin escogido, para el nivel de escogido es 0.05.

SEGUNDO CASO SUPONIENDO VARIANZAS DESIGUALES


En algunas situaciones no es razonables suponer que las varianzas desconocidas 21 y 22 son iguales.
Para este caso no existe una estadstica t exacta para probar la Ho: 1 = 2, sin embargo el estadstico

t0

x1 x2
s12 s2 2

n1
n2

Tiene una distribucin que es aproximadamente una distribucin t con grados de libertada dado por la
siguiente ecuacin

S 21 S 22

n2
n1

S 21 S 2 2

n1

n2
n1 1
n2 1

Si, la hiptesis nula Ho: 1 = 2 es verdadera.

Ha : 1 2 se
Por tanto 1 2 , la hiptesis de las ecuaciones: Ho : 1 2
prueban
como suponiendo varianzas iguales, con la excepcin de que ahora se emplea t 0 como estadstico de
prueba, con el reemplazo de (n1 + n2) 2 por v para determinar el nmero de grados de libertad de la
prueba.
2

Ejemplo Comprar los grupos X1 y X2


No. Observaciones
1
2
3
4
5
6
7
8
9
10
11
Media
Desviacin estndar

X1

X2
30
26
29
38
8
12
11
9
36
15
28
22

26
12
15
14
11
11
13
12
14
15
14.30

11.1892

4.3729

54

Varianza
125.2
19.1222
Reemplazando valores en las frmulas anteriores
2 2 1 4 .3 0
2 .1 1
1 2 5 . 2 1 9 .1 2 2 2

11
10

t0

Determinando los grados de libertad


2

125.2 19.1222

11
10

v
2
125.2
19.1222
11
10
11 1
10 1

13

176.7304
13.22 13
129.55 3.6566

10
9

El grado de libertad (v) para estos dos grupos es aproximadamente igual a 13


En la tabla de t de Student con 13 grados de libertad y un nivel de significacin de 0.025 se tiene un
valor de 2.16, comparando valores.

t0 t 0.025
2.11 < 2.16
Cuando el to es menor que t alfa tabulado se acepta la hiptesis nula, en otras palabras el promedio de
X1 es igual al promedio de X2.

MUESTRAS APAREADAS.
Las investigaciones se disean para descubrir y evaluar diferencias entre efectos, ms bien que los
efectos mismos. Por ejemplo la diferencia entre el grado de recuperacin de las plantas despus de
aplicar fungicidas, el crecimiento de una especie despus de la fertilizacin etc. En los experimentos
estos procedimientos se denominan tratamientos. Estudios de este tipo se pueden llevar de dos
maneras.
Muestras apareadas.
En este caso se seleccionan pares de individuos o de cosas similares. Un tratamiento de aplica a un
miembro de cada par el otro tratamiento al segundo miembro. Los miembros de un par pueden ser dos
plantas que poseen capacidades similares, dos variedades de una especie etc.
Con un solo par es imposible decir si la diferencia en comportamiento ha de atribuirse a la diferencia en
el tratamiento, a la variabilidad natural de los individuos, o en parte de ambos. Tiene que haber un
nmero de pares. Los datos que se van a analizar consisten en una muestra de n diferencias en
medidas.
Ejemplos:

a.

Con muestras apareadas.

En un experimento se compararon el crecimiento dos variedades de cedro A y B


plantadas una frente a la otra. Los crecimientos de altura total por unidad
experimental muestra la siguiente tabla.

55

Altura m.
Parcelas

AB

Grupo A

Grupo B

9
17
14
13
15
10
11
13
13
15

8
15
11
11
9
12
11
10
9
14

1
2
3
2
6
-2
0
3
4
1

130
13

110
11

20
2

1
2
3
4
5
6
7
8
9
10
Sumas
Promedios

Es significativa la diferencia de los promedios? O es diferente a cero el promedio de las diferencias?.

H0D 0

H0D 0

Probar la hiptesis con alfa 0.05

to

d
sd
n

s 2d

( d ) 2 / n
n 1

s2d

84
9

20
10 4.8889

d Es igual a la diferencia de promedios o medias (13 11)


s 2d
Varianza de las diferencias = 4.8889

sd

Desviacin estndar de las diferencias

sd s 2 d

4.8889 2.211
2
to
2.86
2.2111
10

H si t t

2.262

H si t t

2.262

0
0
0.025 ,9 gl
0
0
0.025, 9 gl
Rechazar la hiptesis nula
o
Conclusiones. Puesto que t calculado 2.86 > que 2.262 tabulado, se rechazando la hiptesis de
planteada

56

PROCEDIMIENTO DE VERIFICACIN DE HIPOTESIS


1.
2.
3.
4.
5.
6.
7.
8.
9.

Planteamiento de la hiptesis
Seleccin del nivel de significacin
Descripcin de la poblacin que interesa y planteamiento de las suposiciones necesarias
Seleccin del estadstico pertinente
Especificacin del estadstico de prueba y consideracin de su distribucin.
Especificacin de la regin de rechazo y aceptacin
Recoleccin de datos y clculo de los estadsticos necesarios
Decisiones estadsticas
Conclusin

LA DISTRIBUCIN DE JI CUADRADA O CHI CUADRADA


La prueba de Chi-Cuadrado es una prueba no paramtrica que mide la diferencia entre una
distribucin observada y otra distribucin terica (bondad de ajuste), indicando en qu medida las
diferencias existentes entre ambas varan, de haberlas, se deben al azar. Tambin se utiliza para probar
la independencia de dos muestras entre s, mediante la presentacin de los datos en tablas de
contingencia.
Procedimiento:
La Chi Cuadrada se calcula a travs de una tabla de contingencia o tabulacin cruzada, que es una
tabla de dos dimensiones y cada dimensin contiene una variable. A su vez, cada variable se subdivide
en dos o ms categoras.
Los datos obtenidos en los trabajos de experimentos biolgicos son de dos tipos principales. En un tipo
cada individuo se caracteriza por una medida o por alguna forma de especificacin cuantitativa. En otro,
cada individuo se coloca en una clase particular, y los resultados se expresan como frecuencias en las
cuales los individuos se encuentran dentro de cada clase. En un gran nmero de trabajos biolgicos, las
hiptesis que interesa comprobar no estn relacionadas con la caracterizacin cuantitativa de los
individuos o de las muestras, sino con las probabilidades, y por tanto con las frecuencias de los
individuos u observaciones que pertenecen a determinadas clases, previamente especificadas.
Cuando deseamos comprobar la significacin de la desviacin de una proporcin simple entre dos
frecuencias de lo que esperamos segn la hiptesis, podemos utilizar la prueba de t, pero en general
cuando se utiliza ms de dos frecuencias, se emplea el estadstico Chi cuadrado (2), el cual fue ideado
por Karl Pearson.
Pruebas de Concordancia o Bondad del ajuste
El tipo de situacin ms sencillo en el cual utilizamos la prueba de 2 es aquella en que una hiptesis
particular nos conduce a esperar que los individuos u observaciones caigan en una serie de clases con
unas frecuencias determinadas. Cuando se realizan las observaciones, stas nos producen una serie de
frecuencias observadas. El problema radica entonces en comprobar la significacin de una
desviacin dada entre las frecuencias observadas y esperadas (es decir, de determinar la
probabilidad de obtener tal desviacin o una mayor, si la hiptesis es correcta).
La expresin matemtica del estadstico es:

(O E ) 2

E
2

Donde:

Chi cuadrado; O, es la frecuencia observada y E es la frecuencia esperada, el valor obtenido


se busca en la tabla de 2 para (n-1) grados de libertad, donde n igual al nmero de clases de frecuencia
compradas.

57

Ejemplo del uso de 2 cuadrado con solamente de dos frecuencias


Gregorio Mendel cultiv 929 plantas procedentes de la autofecundacin de plantas de guisantes
heterocigticas para el color de la flor; 705 de estas tenan flores coloradas y las 224 restantes tenan
flores blancas. )Son stas proporciones consistentes con la hiptesis de una proporcin 3:1 entre las
plantas coloreadas y de flor blanca?
Cuadro 01. Frecuencias observadas (O) y Esperadas (E) del color de semillas

Clase

Observado

Proporcin

Esperado

Desviacin

Coloreadas

705

696.75

+8.25

Blancas

224

232.25

-8.25

929

00.00

Total
929
Utilizando la frmula de 2 tenemos

Para calcular la frecuencia esperada de cada clase se multiplica la frecuencia total observada por la
proporcin correspondiente y se divide entre la suma total de la proporcin

Esperada coloreadas
Esperada blancas

929(3)
696.75
4

929(1)
232.25
4

El valor de Chi cuadrado se calcula utilizando la frmula anteriormente mencionada con un grado de
libertad

(705 696.75) 2 (224 232.25) 2

0.39
696.75
232.25

Al valor obtenido corresponde a una probabilidad mayor de 0.05 y por tanto se admite que la desviacin
obtenida no es significativa, y que los datos se ajustan aceptablemente a la hiptesis.
Ejemplo 02. En un lanzamiento de una moneda se observaron 115 caras y 85 sellos. Ensayar la
hiptesis de que la moneda est bien hecha con un nivel de significacin de alfa 0.05 y 0.01.
Cuadro 01. Frecuencias observadas (O) y Esperadas (E) del color de semillas

Esperado

Desviacin

Caras

Moneda

Observado
115

Proporcin
1

100

+15

Sellos

85

100

-15

Total

200

200

00.00

Utilizando la frmula de tenemos

Esperada caras

200(1)
100
2

Esperada sellos

200(1)
100
2

El valor de Chi cuadrado se calcula utilizando la frmula anteriormente mencionada

58

(115 100) 2 (85 100) 2


4.50
100
100
2

El nmero de categoras es dos, la primera corresponde a la cara y la segunda al sellos entonces k =2 y


los grados de libertad es K 1 = 1.

El valor crtico de Chi cuadrado 0.95 para un grado de libertad = 3.84, este valor es menor que 4.50 en
consecuencia se rechaza la hiptesis planteada de que la moneda est bien hecha
El valor crtico de Chi cuadrado
hiptesis planteada.

2
0.99
con un grado de libertad es 6.63, en consecuencia se acepta la

BONDAD DE AJUSTE O PRUEBA DE CONCORDANCIA CON MS DE DOS CLASES


Cuando las frecuencias observadas se reparten en ms de dos clases y deseamos comprobar la
concordancia entre estas frecuencias observadas y aquellas predichas por la hiptesis, no podemos
aplicar el estadstico t, y por tanto tenemos que emplear la prueba de Chi cuadrado.
Ejemplo: Gregorio Mendel obtuvo los siguientes resultados a partir de una planta dihbrida (doble
heterocigtico) procedente de un cruzamiento entre dos variedades de guisantes redonda amarilla 315,
redonda /verde 108, rugosa/amarilla 101 y rugosa/verde 32 (total 556). )Son estos resultados
consecuentes con la hiptesis de una segregacin independiente y de dominancia sencilla del amarillo
sobre el verde y el redondo sobre el rugoso?.
Es decir son consistentes con la proporcin 9:3:3:1 ?.
La suma de la proporcin es 9 + 3 + 3 + 1 = 16
Cuadro 02. Frecuencias observadas y esperadas de semillas
Clase de semillas

Observado

Proporcin

Esperado

Desviacin

Redonda/amarilla

315

312.75

+2.25

Redonda/verde

108

104.25

+3.75

Rugosa/amarilla

101

104.25

-3.25

32

34.75

-2.75

556

16

556

0.00

Rugosa/verde
Total

Como en el ejemplo anterior la frecuencia esperada para cada clase, se calcula multiplicando el total
observado por la proporcin y dividiendo el producto por la suma total de la proporcin.

Esperada redonda / amarilla

556 (9)
312.75
16

Calculo de Chi cuadrado

2 .2 5 2
3 .7 5 2 3 .2 5 2 2 .7 5 2
2

0 .4 7
3 1 2 .7 5 1 0 4 .2 5 1 0 4 .2 5
3 4 .7 5
Utilizando la frmula general de Chi cuadrado con tres grados de libertad
A este valor le corresponde una probabilidad mayor que 0.9. Esto significa que esperaramos que se
presenten desviaciones de esta magnitud o de un valor superior, con una frecuencia superior a nueve

59

veces cada 10 repeticiones del experimento.


Es de esperar que esta estrecha concordancia entre los resultados observados y esperados se d, de
cundo en cundo, aunque si estos valores bajos de Chi cuadrado, y por tanto valores que les
corresponde una probabilidad muy elevada, se dan con bastante frecuencia, hay que buscar si ha
producido un determinado sesgo en el registro de los mismos.
En la siguiente tabla de frecuencia observada y esperada de 04 enfermedades poco comunes (A, B, C y
D) de una plantacin, se pregunta, Es significativa la diferencia entre la frecuencia observada y esperada
de las enfermedades?.
Cuadro 03 Frecuencias observadas (O) y esperadas (E) de enfermedades raras, A, B, C y D
Frecuencias

Tipo de enfermedad

Total

Observada

17

Esperada

17

Puesto que las enfermedades C y D, con frecuencia esperada < 5, combinamos estas dos clases, los
resultados se muestra en la tabla siguiente.
Cuadro 04. Frecuencias de tipo de enfermedad
Frecuencias

Tipo de enfermedad

Total

C+D

Observada

17

Esperada

17

(O E ) 2 (3 6) 2 (5 6) 2 (9 5) 2
x

4.87
E
6
6
5
2

Como quiera que el valor de Chi cuadrado excede el valor tabulado de 2 = 4.61 para alfa 0.1 y dos
grados de libertad, rechazamos la hiptesis nula Ho, y aceptamos la hiptesis alterna Ha, que hay
diferencia significativa entre las frecuencias observadas y esperadas de ocurrencia de estas
enfermedades raras en la plantacin.
Ejemplo: En una encuesta de 37 trabajadores entre hombres y mujeres mayores de 60 aos, se
demuestra la hiptesis de que el nmero de trabajadores hombres y mujeres en los grupos de edad de
61 - 70 y 71 aos en adelante en la poblacin es independiente del sexo.

Cuadro 05. Trabajadores hombres y mujeres de ms de 65 aos (frecuencia observada)


Grupo de edad

Hombres

Mujeres

Total

60

61 - 70
71 en adelante

17

26

11

20

17

37

Cuadro 06. Trabajadores hombres y mujeres mayores de 65 aos (frecuencia esperada)


Grupo de edad

Hombres

61 - 70
71 en adelante

Mujeres

Total

14

12

26

11

20

17

37

Las frecuencias esperadas se calculan como sigue.

c r
n

r filas
c columnas
n total observaciones
Resultados esperados para el grupo de edad 61 - 70

(20)(26)
14
37

(17)(26)
12
37

Resultados esperados para grupo de edad 71 en adelante

(20)(11)
6
37

(17)(11)
5
37

Los grados de libertad gl = (r-1)(c-1) = (2-1)(2-1)=1. Ya que gl = 1 <5, se debe hacer una correccin por
continuidad para calcular el valor de Chi cuadrado, con la siguiente frmula

(| O E | 0.5) 2
E

( |17 14 | 0.5) 2 (| 9 12 | 0.5) 2 (| 3 6 | 0.5) 2 (| 8 5 | 0.5) 2

3.25
14
12
6
5

El Chi cuadrado calculado es mayor que el tabulado de 2 con = 0.10 y gl = 1, rechazamos la hiptesis
nula, que hombres y mujeres de ms de 65 aos continan trabajando independientemente de si estn
sobre o bajo los 70 aos de edad

61

PRUEBA DE INDEPENDENCIA (CHI-CUADRADO)


La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relacin entre dos
variables categricas. Es necesario resaltar que esta prueba nos indica si existe o no una relacin entre
las variables, pero no indica el grado o el tipo de relacin; es decir, no indica el porcentaje de influencia
de una variable sobre la otra o la variable que causa la influencia
Cuando se estudian datos de una poblacin que caracterizan a los individuos con respecto a dos
atributos conjuntamente, el clculo de

X 2 permite probar si dichos atributos son independientes entre s,

o si alguno de ellos tiene influencia sobre el otro.


Cada carcter, atributo o factor puede manifestar en dos o ms clases, de manera que los individuos de
una muestra pueden ser clasificados de acuerdo con una de las categoras o clases de cada carcter. Es
decir, si se conoce la frecuencia observada de individuos con el par de caracteres, se puede calcular la
frecuencia terica.
Para lograr lo anterior es necesario generar una tabla de contingencia como la siguiente
Ejemplo; Resultados de una investigacin realizada en una muestra de 300 agricultores residentes en
Selva Central. A cada uno se le pidi que indicara cul de las tres modalidades de fertilizacin preferiran
para sus cultivos.

Nivel educativo
Profesionales
Segunda enseanza
Estudios bsicos
Total

Qumico
5
15
15
35

Mtodos de fertilizacin de suelos


Orgnico
Qumico y
No
Orgnico
Fertilizan
44
23
3
100
30
5
40
10
10
184
63
18

Total
75
150
75
300

Es posible concluir, a partir de estos datos, que en la poblacin muestreada existe una relacin entre
nivel de educacin y tratamientos de de fertilizacin de suelos.
Ho:
Ha:

No existe relacin entre tipo de fertilizacin y el nivel educativo de la muestra.


Hay cierta relacin entre tipo de fertilizacin y el nivel educativo de la muestra.

La frecuencia esperada se halla de la siguiente manera:

F11

35 x 75
184 x75
63 x75
18 x75
8,8 F12
46 F13
15,8 F14
4,5
300
300
300
300

F21

35 x150
184 x150
63x150
18 x150
17,5 F22
92 F23
31,5 F24
9
300
300
300
300

F31

35 x75
184 x75
63x75
18 x75
8,8 F32
46 F33
15,8 F34
4,5
300
300
300
300

62

Tabla de contingencia Nivel educativo por Tipo de fertilizacin

Estadsticos
Nivel
educativo
Profesionales
Segunda
enseanza

Observado
Esperado
Observado
Esperado

Estudios
bsicos

Observado
Esperado

TOTAL

Observado
Esperado

Luego hallamos el

2
c

5 8,8

8,8

Qumico
5
8,8
15

Tipo de fertilizacin
Qumico
Orgnic
y
No
o
Orgnico fertilizan
44
23
3
46,0
15,8
4,5
100
30
5

Total

75
75,0
150

17,5

92,0

31,5

9,0

150,0

15

40

10

10

75

8,8

46,0

15,8

4,5

75,0

35
35,0

184
184

63
63

18
18

300
300

2 cuadrado calculado:

44 46

46

10 15,8
...
15,8

10 4,5

4,5

22,502

Hallamos los grados de libertad: (r-1)(c-1) = (3-1)(4-1) = 6, en tabla es:12.592


Conclusin:
Como el,

2
c2 22,502 tab
(6 gl ;0.05) 12,592

aceptamos la hiptesis alterna que

menciona que existen diferencias entre la frecuencia observado y la frecuencia esperado es decir, hay
una relacin entre modalidad de fertilizacin de suelos y el nivel educativo de las 300 personas
encuestadas.
PRUEBA DE HOMOGENEIDAD DE VARIANZA
En ocasiones los totales de columnas de hileras y columnas pueden estar bajo el control del investigador
, es decir se puede especificar que las muestras independientes sean extradas de varias poblaciones.
En este caso se dice que el conjunto de totales marginales es fijo, mientras que el otro conjunto que
corresponde al criterio de clasificacin aplicado a las muestras es aleatorio. Esto conduce a la prueba
una prueba de homogeneidad de Chi cuadrada.

63

TABLA 01. REAS BAJO LA CURVA NORMAL TIPIFICADA


Z
0,0
0,1
0,2
0,3
0,4

0
0,0000
0,0398
0,0793
0,1179
0,1554

1
0,0040
0,0438
0,0832
0,1217
0,1591

2
0,0080
0,0478
0,0871
0,1255
0,1628

3
0,0120
0,0517
0,0910
0,1293
0,1664

4
0,0160
0,0557
0,0948
0,1331
0,1700

5
0,0199
0,0596
0,0987
0,1368
0,1736

6
0,0239
0,0636
0,1026
0,1406
0,1772

7
0,0279
0,0675
0,1064
0,1443
0,1808

8
0,0319
0,0714
0,1103
0,1480
0,1844

9
0,0359
0,0753
0,1141
0,1517
0,1879

0,5
0,6
0,7
0,8
0,9

0,1915
0,2257
0,2580
0,2881
0,3159

0,1950
0,2291
0,2611
0,2910
0,3186

0,1985
0,2324
0,2642
0,2939
0,3212

0,2019
0,2357
0,2673
0,2967
0,3238

0,2054
0,2389
0,2704
0,2995
0,3264

0,2088
0,2422
0,2734
0,3023
0,3289

0,2123
0,2454
0,2764
0,3051
0,3315

0,2157
0,2486
0,2794
0,3079
0,3340

0,2190
0,2517
0,2823
0,3106
0,3365

0,2224
0,2549
0,2852
0,3133
0,3389

1,0
1,1
1,2
1,3
1,4

0,3413
0,3643
0,3849
0,4032
0,4192

0,3438
0,3665
0,3869
0,4049
0,4207

0,3461
0,3686
0,3888
0,4066
0,4222

0,3485
0,3708
0,3907
0,4082
0,4236

0,3508
0,3729
0,3925
0,4099
0,4251

0,3531
0,3749
0,3944
0,4115
0,4265

0,3554
0,3770
0,3962
0,4131
0,4279

0,3577
0,3790
0,3980
0,4147
0,4292

0,3599
0,3810
0,3997
0,4162
0,4306

0,3621
0,3830
0,4015
0,4177
0,4319

1,5
1,6
1,7
1,8
1,9

0,4332
0,4452
0,4554
0,4641
0,4713

0,4345
0,4463
0,4564
0,4649
0,4719

0,4357
0,4474
0,4573
0,4656
0,4726

0,4370
0,4484
0,4582
0,4664
0,4732

0,4382
0,4495
0,4591
0,4671
0,4738

0,4394
0,4505
0,4599
0,4678
0,4744

0,4406
0,4515
0,4608
0,4686
0,4750

0,4418
0,4525
0,4616
0,4693
0,4756

0,4429
0,4535
0,4625
0,4699
0,4761

0,4441
0,4545
0,4633
0,4706
0,4767

2,0
2,1
2,2
2,3
2,4

0,4773
0,4821
0,4861
0,4893
0,4918

0,4778
0,4826
0,4864
0,4896
0,4920

0,4783
0,4830
0,4868
0,4898
0,4922

0,4788
0,4834
0,4871
0,4901
0,4925

0,4793
0,4838
0,4875
0,4904
0,4927

0,4798
0,4842
0,4878
0,4906
0,4929

0,4803
0,4846
0,4881
0,4909
0,4931

0,4808
0,4850
0,4884
0,4911
0,4932

0,4812
0,4854
0,4887
0,4913
0,4934

0,4817
0,4857
0,4890
0,4916
0,4936

2,5
2,6
2,7
2,8
2,9

0,4938
0,4953
0,4965
0,4974
0,4981

0,4940
0,4955
0,4966
0,4975
0,4982

0,4941
0,4956
0,4967
0,4976
0,4983

0,4943
0,4957
0,4968
0,4977
0,4983

0,4945
0,4959
0,4969
0,4977
0,4984

0,4946
0,4960
0,4970
0,4978
0,4984

0,4948
0,4961
0,4971
0,4979
0,4985

0,4949
0,4962
0,4972
0,4979
0,4985

0,4951
0,4963
0,4973
0,4980
0,4986

0,4952
0,4964
0,4974
0,4981
0,4986

3,0
3,1
3,2
3,3
3,4

0,4987
0,4990
0,4993
0,4995
0,4997

0,4987
0,4991
0,4993
0,4995
0,4997

0,4987
0,4991
0,4994
0,4996
0,4997

0,4988
0,4991
0,4994
0,4996
0,4997

0,4988
0,4992
0,4994
0,4996
0,4997

0,4989
0,4992
0,4994
0,4996
0,4997

0,4989
0,4992
0,4994
0,4996
0,4997

0,4989
0,4992
0,4995
0,4996
0,4997

0,4990
0,4993
0,4995
0,4996
0,4997

0,4990
0,4993
0,4995
0,4997
0,4998

0,4998
0,4998
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,4999
0,5000

0,4998
0,4999
0,4999
0,5000
0,5000

3,5
0,4998
3,6
0,4998
3,7
0,4999
3,8
0,4999
3,9
0,5000
edro Arizapana

Percentiles de la distribucin t de Student


g.l.

0,995

0,99

0,975

0,95

0,9

0,8

64

1 63,6567 31,8205 12,7062


2 9,9248 6,9646 4,3027
3 5,8409 4,5407 3,1824
4 4,6041 3,7469 2,7764
5 4,0321 3,3649 2,5706
6 3,7074 3,1427 2,4469
7 3,4995 2,9980 2,3646
8 3,3554 2,8965 2,3060
9 3,2498 2,8214 2,2622
10 3,1693 2,7638 2,2281
11 3,1058 2,7181 2,2010
12 3,0545 2,6810 2,1788
13 3,0123 2,6503 2,1604
14 2,9768 2,6245 2,1448
15 2,9467 2,6025 2,1314
16 2,9208 2,5835
2,1199
17 2,8982 2,5669 2,1098
18 2,8784 2,5524 2,1009
19 2,8609 2,5395 2,0930
20 2,8453 2,5280 2,0860
21 2,8314 2,5176 2,0796
22 2,8188 2,5083 2,0739
23 2,8073 2,4999 2,0687
24 2,7969 2,4922 2,0639
25 2,7874 2,4851 2,0595
26 2,7787 2,4786 2,0555
27 2,7707 2,4727 2,0518
28 2,7633 2,4671 2,0484
29 2,7564 2,4620 2,0452
30 2,7500 2,4573 2,0423
31 2,7440 2,4528 2,0395
32 2,7385 2,4487 2,0369
33 2,7333 2,4448 2,0345
34 2,7284
2,4411 2,0322
35 2,7238 2,4377 2,0301
36 2,7195 2,4345 2,0281
37 2,7154 2,4314 2,0262
38
2,7116 2,4286 2,0244
39 2,7079 2,4258 2,0227
40 2,7045 2,4233
2,0211
41 2,7012 2,4208 2,0195
42 2,6981 2,4185 2,0181
43 2,6951 2,4163 2,0167
44 2,6923 2,4141 2,0154
45 2,6896 2,4121 2,0141
46 2,6870 2,4102 2,0129
47 2,6846 2,4083
2,0117
48 2,6822 2,4066 2,0106
49 2,6800 2,4049 2,0096
50 2,6778 2,4033 2,0086
60 2,6603 2,3901 2,0003
70 2,6479 2,3808 1,9944
80 2,6387 2,3739 1,9901
90 2,6316 2,3685 1,9867
120 2,6174 2,3578 1,9799

6,3138
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7531
1,7459
1,7396
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,7056
1,7033
1,7011
1,6991
1,6973
1,6955
1,6939
1,6924
1,6909
1,6896
1,6883
1,6871
1,6860
1,6849
1,6839
1,6829
1,6820
1,6811
1,6802
1,6794
1,6787
1,6779
1,6772
1,6766
1,6759
1,6706
1,6669
1,6641
1,6620
1,6577

3,0777
1,8856
1,6377
1,5332
1,4759
1,4398
1,4149
1,3968
1,3830
1,3722
1,3634
1,3562
1,3502
1,3450
1,3406
1,3368
1,3334
1,3304
1,3277
1,3253
1,3232
1,3212
1,3195
1,3178
1,3163
1,3150
1,3137
1,3125
1,3114
1,3104
1,3095
1,3086
1,3077
1,3070
1,3062
1,3055
1,3049
1,3042
1,3036
1,3031
1,3025
1,3020
1,3016
1,3011
1,3006
1,3002
1,2998
1,2994
1,2991
1,2987
1,2958
1,2938
1,2922
1,2910
1,2886

1,3764
1,0607
0,9785
0,9410
0,9195
0,9057
0,8960
0,8889
0,8834
0,8791
0,8755
0,8726
0,8702
0,8681
0,8662
0,8647
0,8633
0,8620
0,8610
0,8600
0,8591
0,8583
0,8575
0,8569
0,8562
0,8557
0,8551
0,8546
0,8542
0,8538
0,8534
0,8530
0,8526
0,8523
0,8520
0,8517
0,8514
0,8512
0,8509
0,8507
0,8505
0,8503
0,8501
0,8499
0,8497
0,8495
0,8493
0,8492
0,8490
0,8489
0,8477
0,8468
0,8461
0,8456
0,8446

TABLA DE CHI CUADRADO


g.l.
1
2

0,990
0,000
0,020

Valores crticos de la distribucin de Chi cuadrada


0,975
0,950
0,900
0,100
0,050
0,025
0,001
0,004
0,016
2,706
3,841
5,024
0,051
0,103
0,211
4,605
5,991
7,378

0,010
6,635
9,210

65

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
60
70
80
90
120

0,115
0,297
0,554
0,872
1,239
1,646
2,088
2,558
3,053
3,571
4,107
4,660
5,229
5,812
6,408
7,015
7,633
8,260
8,897
9,542
10,196
10,856
11,524
12,198
12,879
13,565
14,256
14,953
15,655
16,362
17,074
17,789
18,509
19,233
19,960
20,691
21,426
22,164
22,906
23,650
24,398
25,148
25,901
26,657
27,416
28,177
28,941
29,707
37,485
45,442
53,540
61,754
86,923

0,216
0,484
0,831
1,237
1,690
2,180
2,700
3,247
3,816
4,404
5,009
5,629
6,262
6,908
7,564
8,231
8,907
9,591
10,283
10,982
11,689
12,401
13,120
13,844
14,573
15,308
16,047
16,791
17,539
18,291
19,047
19,806
20,569
21,336
22,106
22,878
23,654
24,433
25,215
25,999
26,785
27,575
28,366
29,160
29,956
30,755
31,555
32,357
40,482
48,758
57,153
65,647
91,573

0,352
0,711
1,145
1,635
2,167
2,733
3,325
3,940
4,575
5,226
5,892
6,571
7,261
7,962
8,672
9,390
10,117
10,851
11,591
12,338
13,091
13,848
14,611
15,379
16,151
16,928
17,708
18,493
19,281
20,072
20,867
21,664
22,465
23,269
24,075
24,884
25,695
26,509
27,326
28,144
28,965
29,787
30,612
31,439
32,268
33,098
33,930
34,764
43,188
51,739
60,391
69,126
95,705

0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599
21,434
22,271
23,110
23,952
24,797
25,643
26,492
27,343
28,196
29,051
29,907
30,765
31,625
32,487
33,350
34,215
35,081
35,949
36,818
37,689
46,459
55,329
64,278
73,291
100,624

6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
41,422
42,585
43,745
44,903
46,059
47,212
48,363
49,513
50,660
51,805
52,949
54,090
55,230
56,369
57,505
58,641
59,774
60,907
62,038
63,167
74,397
85,527
96,578
107,565
140,233

7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
44,985
46,194
47,400
48,602
49,802
50,998
52,192
53,384
54,572
55,758
56,942
58,124
59,304
60,481
61,656
62,830
64,001
65,171
66,339
67,505
79,082
90,531
101,879
113,145
146,567

9,348
11,143
12,833
14,449
16,013
17,535
19,023
20,483
21,920
23,337
24,736
26,119
27,488
28,845
30,191
31,526
32,852
34,170
35,479
36,781
38,076
39,364
40,646
41,923
43,195
44,461
45,722
46,979
48,232
49,480
50,725
51,966
53,203
54,437
55,668
56,896
58,120
59,342
60,561
61,777
62,990
64,201
65,410
66,617
67,821
69,023
70,222
71,420
83,298
95,023
106,629
118,136
152,211

11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
52,191
53,486
54,776
56,061
57,342
58,619
59,893
61,162
62,428
63,691
64,950
66,206
67,459
68,710
69,957
71,201
72,443
73,683
74,919
76,154
88,379
100,425
112,329
124,116
158,950

66

TABLA DE VALORES PARA LA DISTRIBUCIN DE F.


gl.
*
1

2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
30
60
120

161,45
4052,1
8
18,51
98,50
10,13
34,12
7,71
21,20
6,61
16,26
5,99
13,75
5,59
12,25
5,32
11,26
5,12
10,56
4,96
10,04
4,84
9,65
4,75
9,33
4,67
9,07
4,60
8,86
4,54
8,68
4,35
8,10
4,17
7,56
4,00
7,08
3,92
6,85

199,50
4999,5
0
19,00
99,00
9,55
30,82
6,94
18,00
5,79
13,27
5,14
10,92
4,74
9,55
4,46
8,65
4,26
8,02
4,10
7,56
3,98
7,21
3,89
6,93
3,81
6,70
3,74
6,51
3,68
6,36
3,49
5,85
3,32
5,39
3,15
4,98
3,07
4,79

215,71
5403,3
5
19,16
99,17
9,28
29,46
6,59
16,69
5,41
12,06
4,76
9,78
4,35
8,45
4,07
7,59
3,86
6,99
3,71
6,55
3,59
6,22
3,49
5,95
3,41
5,74
3,34
5,56
3,29
5,42
3,10
4,94
2,92
4,51
2,76
4,13
2,68
3,95

224,58
5624,5
8
19,25
99,25
9,12
28,71
6,39
15,98
5,19
11,39
4,53
9,15
4,12
7,85
3,84
7,01
3,63
6,42
3,48
5,99
3,36
5,67
3,26
5,41
3,18
5,21
3,11
5,04
3,06
4,89
2,87
4,43
2,69
4,02
2,53
3,65
2,45
3,48

230,16
5763,6
5
19,30
99,30
9,01
28,24
6,26
15,52
5,05
10,97
4,39
8,75
3,97
7,46
3,69
6,63
3,48
6,06
3,33
5,64
3,20
5,32
3,11
5,06
3,03
4,86
2,96
4,69
2,90
4,56
2,71
4,10
2,53
3,70
2,37
3,34
2,29
3,17

233,99
5858,9
9
19,33
99,33
8,94
27,91
6,16
15,21
4,95
10,67
4,28
8,47
3,87
7,19
3,58
6,37
3,37
5,80
3,22
5,39
3,09
5,07
3,00
4,82
2,92
4,62
2,85
4,46
2,79
4,32
2,60
3,87
2,42
3,47
2,25
3,12
2,18
2,96

Grados de libertad del numerador (g.l)


7
8
9
10
11
12
236,77
5928,3
6
19,35
99,36
8,89
27,67
6,09
14,98
4,88
10,46
4,21
8,26
3,79
6,99
3,50
6,18
3,29
5,61
3,14
5,20
3,01
4,89
2,91
4,64
2,83
4,44
2,76
4,28
2,71
4,14
2,51
3,70
2,33
3,30
2,17
2,95
2,09
2,79

238,88
5981,0
7
19,37
99,37
8,85
27,49
6,04
14,80
4,82
10,29
4,15
8,10
3,73
6,84
3,44
6,03
3,23
5,47
3,07
5,06
2,95
4,74
2,85
4,50
2,77
4,30
2,70
4,14
2,64
4,00
2,45
3,56
2,27
3,17
2,10
2,82
2,02
2,66

240,54
6022,4
7
19,38
99,39
8,81
27,35
6,00
14,66
4,77
10,16
4,10
7,98
3,68
6,72
3,39
5,91
3,18
5,35
3,02
4,94
2,90
4,63
2,80
4,39
2,71
4,19
2,65
4,03
2,59
3,89
2,39
3,46
2,21
3,07
2,04
2,72
1,96
2,56

241,88
6055,8
5
19,40
99,40
8,79
27,23
5,96
14,55
4,74
10,05
4,06
7,87
3,64
6,62
3,35
5,81
3,14
5,26
2,98
4,85
2,85
4,54
2,75
4,30
2,67
4,10
2,60
3,94
2,54
3,80
2,35
3,37
2,16
2,98
1,99
2,63
1,91
2,47

ANLISIS DE VARIANZA CON IGUAL NMERO DE OBSERVACIONES

242,98
6083,3
2
19,40
99,41
8,76
27,13
5,94
14,45
4,70
9,96
4,03
7,79
3,60
6,54
3,31
5,73
3,10
5,18
2,94
4,77
2,82
4,46
2,72
4,22
2,63
4,02
2,57
3,86
2,51
3,73
2,31
3,29
2,13
2,91
1,95
2,56
1,87
2,40

243,91
6106,3
2
19,41
99,42
8,74
27,05
5,91
14,37
4,68
9,89
4,00
7,72
3,57
6,47
3,28
5,67
3,07
5,11
2,91
4,71
2,79
4,40
2,69
4,16
2,60
3,96
2,53
3,80
2,48
3,67
2,28
3,23
2,09
2,84
1,92
2,50
1,83
2,34

13

14

15

20

244,69
6125,8
6
19,42
99,42
8,73
26,98
5,89
14,31
4,66
9,82
3,98
7,66
3,55
6,41
3,26
5,61
3,05
5,05
2,89
4,65
2,76
4,34
2,66
4,10
2,58
3,91
2,51
3,75
2,45
3,61
2,25
3,18
2,06
2,79
1,89
2,44
1,80
2,28

245,36
6142,6
7
19,42
99,43
8,71
26,92
5,87
14,25
4,64
9,77
3,96
7,60
3,53
6,36
3,24
5,56
3,03
5,01
2,86
4,60
2,74
4,29
2,64
4,05
2,55
3,86
2,48
3,70
2,42
3,56
2,22
3,13
2,04
2,74
1,86
2,39
1,78
2,23

245,95
6157,2
8
19,43
99,43
8,70
26,87
5,86
14,20
4,62
9,72
3,94
7,56
3,51
6,31
3,22
5,52
3,01
4,96
2,85
4,56
2,72
4,25
2,62
4,01
2,53
3,82
2,46
3,66
2,40
3,52
2,20
3,09
2,01
2,70
1,84
2,35
1,75
2,19

248,01
6208,7
3
19,45
99,45
8,66
26,69
5,80
14,02
4,56
9,55
3,87
7,40
3,44
6,16
3,15
5,36
2,94
4,81
2,77
4,41
2,65
4,10
2,54
3,86
2,46
3,66
2,39
3,51
2,33
3,37
2,12
2,94
1,93
2,55
1,75
2,20
1,66
2,03

25

120

249,26 253,25
6239,8
3 6339,39
19,46
19,49
99,46
99,49
8,63
8,55
26,58
26,22
5,77
5,66
13,91
13,56
4,52
4,40
9,45
9,11
3,83
3,70
7,30
6,97
3,40
3,27
6,06
5,74
3,11
2,97
5,26
4,95
2,89
2,75
4,71
4,40
2,73
2,58
4,31
4,00
2,60
2,45
4,01
3,69
2,50
2,34
3,76
3,45
2,41
2,25
3,57
3,25
2,34
2,18
3,41
3,09
2,28
2,11
3,28
2,96
2,07
1,90
2,84
2,52
1,88
1,68
2,45
2,11
1,69
1,47
2,10
1,73
1,60
1,35
1,93
1,53

Observaciones

GRUPOS
A

29

53

36

II

32

55

42

III

36

60

29

IV

27

49

31

38

50

21

TOTAL

162

267

159

MEDIA

32.4

53.4

31.8

Los resultados del experimento no son iguales, existe variacin dentro de los tratamientos y variacin entre los tratamientos, en consecuencia se debe
realizar el anlisis de varianza para conocer si esta variacin es significativa estadsticamente.
El mtodo de anlisis de varianza se debe a Ronald Fisher.
CUADRO DE ANLISIS DE VARIANZA DE GRUPOS CON IGUAL NMERO DE OBSERVACIONES POR GRUPOS
Fuentes de

Grados de

Suma de

Cuadrado

Variacin

libertad (g.l)

cuadrados (S.C)

Medio (C.M)

Tratamiento

t1

S.C.Trat

C.M.Trat

error

t(r-1)

S.c. Error

C.M.Error =s2

Total

rt1

S.C. Tot

(grupo)

t = nmero de tratamientos
r = nmero de repeticiones
PROCEDIMIENTO DE CLCULO

F, calculado
C.M.Trat/s2

F 0.05

Factor de correccin (FC)

FC
FC

2 9

i j

r t

3 2 . . . . . . 3 1 2 1
15

2 3 0 4 9 .6 0

Suma Cuadrado Tratamientos (S.C.Trat)

X
S .C.Trat.

2
j.

FC
r
1622 267 2 1592
S .C.Trat.
23049.60 1513.2
5
3

Suma Cuadrado Total (S.C.Tot )

S :C .T ot

S .C .T o t (2 9
4

2
i j

3 2 2 . . . . . . . 3 1 2 2 1 2 ) F C 1 9 2 2 .4 0

FC

Suma Cuadrado Error (S.C. Error)


Suma Cuadrado Total Suma Cuadrado Tratamiento
1922.4 - 1513.2 = 409.2

Cuadrado Medio Tratamientos (C.M.Trat)

C . M .T rat
6

S . C . T r a t 1 5 1 3 .2 0

7 5 6 .6 0
g .l T rat
2

Cuadrado Medio Error (C.M.Error)

C . M . E rro r
7

S .C . E rro r
4 0 9 .2 0

3 4 .1 0
g .l E rro r
12

F, calculado, se lee como F calculado. Se refiere a la distribucin de probabilidad de F

Fc

C . M .T ra t
7 5 6 .6 0

2 2 .1 8 8
C . M . E rro r
3 4 .1 0

Una vez calculado las sumas de cuadrados y los cuadrados medios, los valores de cada uno de ellos trasladamos a la siguiente tabla de anlisis de
varianza
TABLA DE ANLISIS DE VARIANZA (ANVA)
Fuentes de

Suma de

Grados de

Cuadrado

Variacin

Cuadrados

libertad

Medio

Tratamiento

1513.20

756.00

409.2

12

34.10

F, calculado
22.188

F 0.05
3.89

(grupo)
error

Total
1922.40
14
El valor de F 0.05 se busca en la tabla de distribucin de probabilidades de F con el nivel de significacin escogido y los grados de libertad del tratamiento y
grados de libertad del Error, (2, 12) siendo este valor 3.89
Finalmente se interpreta
Fc, 22.188 es mayor que tabulado F 0.05 (3.89), en consecuencia se dice que existe diferencia estadstica significativa entre los promedios de los
tratamientos
Esto nos conduce rechazar la hiptesis planteada y se aceptar la hiptesis alterna, en otras palabras los promedios de los tratamientos no son iguales como
se ha supuesto al inicio del experimento.
La prueba de F significativa indica que la variabilidad entre los tratamientos no se debe al azar, sino a un efecto distinto de dichos tratamientos, lo cual es
equivalente a indicar que las diferencias son significativas entre las medias de las poblaciones, estimadas por las medias de las muestras; sin embargo, la
prueba de F no indica cules medias son iguales o cules son diferentes.
Con los datos del cuadro de anlisis de varianza se hacen las pruebas de significacin de las diferencias, para ello existen varios mtodos o pruebas como
son: Tukey, Duncan, Comparaciones Ortogonales Dunnet, Diferencia Mnima Significativa (DMS) etc. El paquete estadstico SPSS ofrece 18 modelos de

pruebas de comparacin de promedios.


PRUEBA DE COMPARACIN DE TUKEY
El procedimiento consiste en calcular un valor terico comn o diferencia mnima significativa mediante la siguiente frmula:

W q (t , g.l.e) S x
q = Nivel de significacin de la tabla Tukey, en Ciencias Agrarias se considera 0.05 o 0.01
t = nmero de tratamientos
r = nmero de repeticiones
g.l.e = grados de libertad del error

= error estndar de la media

Para el ejemplo la prueba de Tukey es como sigue

0.05
t=3

Sx

r=4

g.l.e = 12

C.M .Error
34.10

2.92
r
4

El valor q se encuentra en la tabla de tukey, se busca con el nmero de tratamientos a = t y los grados de libertad del error experimental (g.l.e) en este caso
12y para alfa 0.05

W q 0.05(3,12) S x 3.77(2.92) 11.0084

W 11
Para realizar las comparaciones mltiples, primero se ordenan las medias de los tratamientos en forma ascendente o descendente
C

31.8

32.4

53.4

Luego, las medias se comparan por diferencia, empezando del lado derecho como sigue:
La primera comparacin es entre las medias de los tratamientos B y A
53.4 32.4 = 21
21supera al valor de W = 11 por tanto se dice que existe diferencia significativa entre estos tratamientos A y B.
La segunda comparacin es entre las medias o promedios de los tratamiento B y C siendo el resultado 53.4 31.8 = 21.6 la interpretacin es similar a la
primera comparacin.
La tercera comparacin es entre los tratamientos A y C, 32.4 31.8 = 0.6 este valor no supera al valor de W = 11, entonces se dice que la diferencia de
medias de tratamientos no son significativos. Estos valores no significativos iguales se pueden unir con una barra
C

31.8

32.4

53.4

3.2

ANLISIS DE VARIANZA CON DIFERENTE NMERO DE REPETICIONES POR GRUPO

En los experimentos a veces se presentan casos en los que dos o ms muestras o tratamientos tienen diferente nmero de repeticiones. La metodologa de
anlisis con diferente nmero de repeticiones es la misma que para el ANVA en diseo con igual nmero de repeticiones, con ligeras modificaciones en las
frmulas.
Ejemplo: Si en el experimento de secado de las probetas de madera de 04 especies se hubiera perdido datos como muestra el siguiente cuadro 3
Cuadro 04. Peso seco de probetas de o4 especies maderables
Repeticin (n)
1
2
3
4
5
6
7
8
9
10
11

40
36
38
37
29
37
36
35
31
26
30

18
15
18
19
16
20
27
19

29
25
27
24
27
33
28
24
25
20
21

23
30
28
28
24
34
20
18
24
28
22

12
28
21
Total
403
152
283
300
Media
33.58
19
25.73
25
El nmero de repeticiones para los tratamientos: A = 12, B = 8, C = 11 D = 12
Para utilizar las frmulas de ANVA del ejemplo anterior se da valores a:
n1= 12
n2 = 8
n 3= 11
n4 = 12
Cuadro 05.
Anlisis de varianza tendr la siguiente estructura.
F de V

S.C

g.l

C. M

Tratamientos

t-1

Error

n 1 t 1

Total

ni 1

Hallar el Factor de Correccin (F.C)

F .C

( X i ) 2

F .C

(40 36 ....22 21) 2 1295044

30117.3023
12 8 11 12
43

Suma Cuadrado Total (S.C.T)

S .C.T X i 2 FC

S : C : T (402 362.....22 2 212 ) 30117.3023 1776.698


S .C.T 31894.00 30117.3023 1776.698
Suma Cuadrado Tratamientos

Fc

S .C.Tr

ti.2
FC
ni

4032 1522 2832 3002

30117.3023 1085.599
8
11
12
12

S .C.Tr

S .C.Tr 31202.9015 30117.3023 1085.599


Suma Cuadrado Error(S.C.E) Por diferencia

S .C.E 1776.698 1085.599 691.098


Cuadrado Medio Tratamientos (C.M.Tr)

C.M .Tr

S .C.Tr
g.l de t

C.M .Tr

1085.599
361.866
3

Cuadrado Medio Error (C:M:E)

C.M .E.

S .C.Error
g.l Error

C.M .E

691.098
17.72
39

F calculado

Fc

361.866
20.42
17.72

Cuadro 06. Anlisis de varianza de peso seco (g) de probetas de 4 especies maderables
Fuentes de

Suma de

Grados de

Cuadrado

variacin

Cuadrados

Libertad

Medio

F. C

F 0.05

Tratamientos

1292.167

361.866

Error

773.833

39

17.72

Total

2066.000

42

20.42

2.76 *

NOTA: Se rechaza la hiptesis planteada de que las medias de peso seco de las probetas son iguales
COMPARACIN MLTIPLE DE TUKEY
Como en el ejemplo anterior

W q (t g.l )

C.M .E 1 1

2 n1 n2

q0.05(4, 40) 3.79


NOTA:
En la tabla Tukey no existe el valor para 39 grados de libertad, pero se puede optar por el valor ms prximo en este caso el nmero ms prximo es 40,
Ordenando los promedios de los tratamientos
Tratamientos

Promedios

19

25

25.73

33.58

Primera comparacin

A C 33.58 25.73 7.85


W 3.79

17.72 1 1
4.71

2 12 11

7.85 > 4.71 *

(Existe diferencia significativa) se pone un asterisco

Segunda comparacin

C D 25.73 25 0.73

W 3.79

17.72 1 1
5.85

2 11 12

0.73 < 5.85 NS. (No hay diferencia significativa) se designa como NS
Tercera comparacin

D B 25 19 6

W 3.79

17.72 1 1
5.15

2 12 8

6 5.15 en consecuencia existe diferencia significativa


Una de las formas de representar los tratamientos no significativos es uniendo con una lnea horizontal los promedios de tratamientos no significativos como
sigue:

Tratamientos

Promedios

19

25
25.73
________________

A
33.58

El software SPSS presenta la prueba de comparacin de Tukey como sigue.


HSD de Tukey
Tratamiento
B
D
C
A

N
8
12
11
12

Subconjunto para alfa = .05


1
2
3
19,0000
25,0000
25,7273
33,5833

Se muestran las medias para los grupos en los subconjuntos homogneos. a) Usa el tamao muestral de la media armnica = 10,455: b) Los tamaos de
los grupos no son iguales. Se utilizar la media armnica de los tamaos de los grupos. Los niveles de error de tipo I no estn garantizados.

INTERPRETACIN
El tratamiento A es significativamente mayor que los tratamientos B, D, A. No existe diferencia significativa entre los tratamientos C y D. Finalmente el
tratamiento B es significativamente menor que los otros tratamientos. Esta afirmacin es con 95% de seguridad y 5% de estar equivocado.

También podría gustarte