Está en la página 1de 5

La estadstica en el trabajo

633

La estadstica en el trabajo
"Aun si usted no es un

Por favor, describa su ocupacin.

hbil operador de

Trabajo para Published Image donde utilizo la estadstica para generar los grficos y datos que utilizamos en nuestras
publicaciones financieras; utilizo muchos
estadsticos y sus aplicaciones. Escribimos notas informativas para bancos y
sociedades de inversin.

nmeros, el conocimiento
[estadstico] es til en
cualquier situacin que
requiera prediccin,
toma de decisiones
o evaluacin".

Qu conceptos de estadstica
utiliza usted?
La desviacin estndar para medir el riesgo, la regresin para medir la relacin de
la inversin con su punto de referencia,
y la correlacin para determinar el movimiento de una inversin en relacin con
otras inversiones.

Cmo utiliza la estadstica


en el trabajo?

Nabil Lebbos
Ilustrador grfico, Published
Image
Como analista para Published
Image de Standard & Poor, los
estudios de Nabil en rendimiento
de inversiones se publican en
peridicos que son ledos
por ms de un milln de
inversionistas.

Comienzo con un conjunto dado de datos


en bruto. Por lo regular, se trata de rendimientos mensuales, diarios o anuales de
las inversiones. Luego uso Excel para graficar los datos y as puedo obtener una imagen de lo que estoy examinando. A partir
de esto, procedo a realizar un anlisis. Algunas veces los resultados no respaldan un
aspecto que el artculo adjunto quiere fortalecer. En situaciones como sta, analizo
otras posibilidades.
Por favor, describa un ejemplo especfico que ilustre cmo el uso de la
estadstica tuvo xito en mejorar un
producto o servicio.
Uno de nuestros clientes quera sealar
que aunque su sociedad de inversin no
superaba a las otras, tena xito en evitar

consistentemente rendimientos negativos


grandes. Ejecut algunas pruebas de sesgo y riesgo, las cuales mostraron que, de
hecho, los rendimientos de la inversin
estaban sesgados positivamente. Creamos histogramas comparando este fondo
de inversin con un promedio de todos
los fondos de inversin, lo cual aclar la
cuestin.
En trminos de estadstica, que le
recomendara a quienes buscan un
empleo?
La estadstica es una herramienta lgica
que, cuando se utiliza con fines informativos, puede convencer a uno mismo y a
su audiencia con mucha ms eficacia
que las palabras de aquello que se intenta comunicar. Aun si usted no es un
hbil operador de nmeros, el conocimiento [estadstico] es til en cualquier
situacin que requiera prediccin, toma
de decisiones o evaluacin.
Cree que las personas que solicitan
un empleo reciben una evaluacin
ms favorable si estudiaron algo de
estadstica?
S.
Cuando estudiaba en la universidad,
esperaba utilizar la estadstica en
el trabajo?
No. Estudi la carrera de arquitectura y un posgrado en negocios.

Anlisis de varianza

12
12-1 Panorama general
12-2 ANOVA de un factor
12-3 ANOVA de dos factores

PROBLEMA DEL CAPTULO

Tratamientos diferentes afectan


los pesos de lamos?
El conjunto de datos 7 del apndice B incluye los pesos

extremo cuando se compara con los otros pesos de los

(en kilogramos) de lamos que recibieron distintos tra-

rboles fertilizados. Con la presencia de un solo valor

tamientos en terrenos diferentes. Slo consideraremos


los pesos del ao 1 en el terreno 1, el cual tiene un suelo

extremo, procederemos bajo el supuesto de que las


muestras provienen de poblaciones con distribuciones

frtil y hmedo, y se localiza cerca de un arroyo. Los


pesos que consideraremos se resumen en la tabla 12-1.
Con la intencin de explorar los datos para investi-

aproximadamente normales. Podramos realizar anlisis

gar el centro, la variacin, la distribucin, los valores

(Vase el ejercicio 5 en la seccin 12-2).

extremos y los patrones de cambio a travs del tiempo


(CVDVT), comenzamos calculando los estadsticos
muestrales que aparecen en la parte inferior de la tabla
12-1. Al examinar las medias muestrales, vemos que

Parece que las diferencias entre las medias muestrales indican que las muestras provienen de poblaciones con medias diferentes, pero en vez de considerar

adicionales posteriormente para determinar si el peso


de 1.34 kg tiene un fuerte efecto en los resultados.

parecen variar mucho, desde 0.164 kg hasta 1.334 kg.


Adems, las desviaciones estndar de las muestras varan

nicamente las medias muestrales, tambin debemos


considerar las cantidades de variacin, los tamaos
muestrales y la naturaleza de la distribucin de las me-

considerablemente, desde 0.126 kg hasta 0.859 kg. Es


difcil analizar las distribuciones porque cada muestra
consiste nicamente en 5 valores, pero las grficas
cuantilares normales sugieren que tres de las muestras
provienen de poblaciones con distribuciones aproxi-

dias muestrales. Una forma de tomar en cuenta todos


estos factores importantes consiste en realizar una prueba
formal de hiptesis que los incluya de manera automtica. En el presente captulo se estudiar una prueba de

madamente normales. Sin embargo, el anlisis de los

este tipo, y la usaremos para determinar si existe evidencia suficiente para concluir que las medias no son

pesos de los lamos que recibieron tratamiento con

iguales. Entonces sabremos si los distintos tratamientos

fertilizantes sugiere que el peso de 1.34 kg es un valor

tienen algn efecto.

Tabla 12 - 1

Pesos (en kg) de lamos


Tratamiento

Ninguno

0.15

0.02

0.16

0.37

0.22

5

0.184

0.127

Fertilizante

1.34

0.14

0.02

0.08

0.08

5

0.332

0.565

Riego

0.23

0.04

0.34

0.16

0.05

5

0.164

0.126

Fertilizante y riego
2.03
0.27
0.92
1.07
2.38
5
1.334
0.859

636

Captulo 12

Anlisis de varianza

12-1 Panorama general


En la seccin 12-2 explicamos un mtodo importante para probar la igualdad de
tres o ms medias poblacionales. En la seccin 9-3 estudiamos procedimientos para
probar la hiptesis de que dos medias poblacionales son iguales, pero los mtodos de
esa seccin no pueden aplicarse cuando se incluyen tres o ms medias. En vez
de referirnos al objetivo principal de probar medias iguales, el trmino anlisis de
varianza se refiere al mtodo que empleamos, el cual est basado en un anlisis
de varianzas muestrales.
Definicin
El anlisis de varianza (ANOVA) es un mtodo de prueba de igualdad de tres
o ms medias poblacionales, por medio del anlisis de las varianzas muestrales.
Por qu no probar sencillamente dos muestras al mismo tiempo? Por qu
necesitamos un nuevo procedimiento, cuando podemos probar la igualdad de dos
medias utilizando los mtodos presentados en el captulo 9? Por ejemplo, si deseamos utilizar los datos muestrales de la tabla 12-1 para probar la aseveracin de que
las tres poblaciones tienen la misma media, por qu no simplemente tomamos dos
a la vez y probamos H0: ja i = itt,, luego H0: ,u., = p.3, y as sucesivamente? Para los
datos de la tabla 12-1, el mtodo de probar la igualdad de dos medias a la vez requiere de seis pruebas diferentes de hiptesis, de manera que el grado de confianza
podra ser tan bajo como 0.956 (o 0.735). En general, conforme incrementamos el
nmero de pruebas de significancia individuales, aumentamos el riesgo de obtener
una diferencia nicamente por el azar (en vez de una diferencia real en las medias).
El riesgo de un error tipo I (encontrar una diferencia en uno de los pares cuando en
realidad no existe tal diferencia) es demasiado alto. El mtodo del anlisis de varianza nos ayuda a evitar este problema en particular (rechazar una hiptesis nula verdadera) utilizando una prueba de igualdad de varias medias.

Distribucin F
Los mtodos del ANOVA de este captulo requieren de la distribucin F que se
present por primera vez en la seccin 9-5, en la cual sealamos que la distribucin F tiene las siguientes propiedades importantes (vase la figura 12-1):
La distribucin F no es simtrica; est sesgada hacia la derecha.
Los valores de F pueden ser O o positivos, pero no pueden ser negativos.
3. Existe una distribucin F diferente para cada par de grados de libertad para el
numerador y el denominador.
Los valores crticos de F se localizan en la tabla A-5.
El anlisis de varianza (ANOVA) est basado en una comparacin de dos estimados diferentes de la varianza comn de las distintas poblaciones. Estos estimados (la varianza entre muestras y la varianza dentro de las muestras) se describirn
en la seccin 12-2. El trmino un factor se utiliza porque los datos muestrales estn
separados en grupos segn una caracterstica o factor. En la seccin 12-3 estudiaremos el anlisis de varianza de dos factores, el cual nos permite comparar poblaciones
separadas en categoras por medio de dos caractersticas (o factores). Por ejemplo,
podramos separar la estatura de las personas utilizando los siguientes dos factores:
1. gnero (hombre o mujer) y 2. mano dominante derecha o izquierda.

12-2

ANOVA de un factor

No simtrica
(sesgado hacia la derecha)

637

Figura 12-1
Distribucin F
Existe una distribucin F distinta
para cada par de grados de libertad diferente para el numerador
y el denominador.

1.0

nicamente valores
no negativos

Estrategia de estudio sugerida: Puesto que los procedimientos empleados


en este captulo requieren de clculos complicados, enfatizaremos el uso y la interpretacin de programas de cmputo, tales como STATDISK, Minitab y Excel, o
de una calculadora TI-83/84 Plus. Sugerimos que inicie la seccin 12-2 enfocndose en el siguiente concepto clave: estamos utilizando un procedimiento para
probar la aseveracin de que tres o ms medias son iguales. A pesar de que los
detalles de los clculos son complicados, nuestro procedimiento ser fcil debido
a que est basado en un valor P. Si el valor P es pequeo, como 0.05 o menor, se
rechaza la igualdad de las medias. De otra manera no se rechaza la igualdad de las
medias. Despus de comprender este procedimiento bsico y sencillo, proceda a
la comprensin de los fundamentos subyacentes.

12-2 ANOVA de un factor


Concepto clave En esta seccin se presenta el mtodo del anlisis de varianza
de un factor, que se utiliza para probar las hiptesis de que tres o ms medias poblacionales son iguales, como en H 0 : // I
1-1,3. Como los clculos son muy
complicados, recomendamos interpretar los resultados obtenidos por medio de un
programa de cmputo o de una calculadora TI-83/84 Plus. Sugerimos la siguiente
estrategia de estudio:
Comprenda que un valor P pequeo (como 0.05 o menos) conduce al rechazo
de la hiptesis nula de igualdad de medias. Con un valor P grande (como uno
mayor que 0.05), no rechace la hiptesis nula de igualdad de medias.
Trate de comprender el fundamento subyacente al estudiar los ejemplos de esta seccin.
3. Familiarcese con la naturaleza de los valores de la SC (suma de cuadrados) y de
los CM (cuadrados medios), as como con el papel que desempean en la
determinacin del estadstico de prueba F, pero utilice programas estadsticos de
cmputo o una calculadora para obtener esos valores.
El mtodo que empleamos se denomina anlisis de varianza de un factor (o
anlisis de varianza de una entrada) porque empleamos una sola propiedad o caracterstica para categorizar las poblaciones. En ocasiones a esta caracterstica se le
llama tratamiento ()j'actor.