Exactitud Inexactitud
Precisión
Imprecisió
n
Incertidumbre y Variabilidad
Cuando buscamos encontrar múltiples fuentes para nuestras
necesidades de datos, nos toparemos inevitablemente con situaciones
en donde los datos no ajustan al grado que esperaríamos. Esto nos
llevará a situaciones en donde tendremos que considerar
incertidumbre y variabilidad en nuestros datos. Mientras que la
manera en que trabajamos y modelamos la incertidumbre y los datos
variables es similar, primero definimos cada condición por separado.
Estas definiciones simples serán usadas aquí, dando mayores detalles
en capítulos posteriores según se necesite. La variabilidad existe
debido a la heterogeneidad o diversidad de un sistema. Puede ser, por
ejemplo, que la energía usada para manufacturar un artículo difiera
según el turno matutino o vespertino en una fábrica. La incertidumbre
existe porque no podemos medir precisamente un valor o porque nos
falta la información completa, o porque somos ignorantes de alguna
condición. Es posible que si hiciéramos investigación adicional o
mejoráramos nuestros métodos de medición, pudiéramos reducir la
incertidumbre, redundando en un mejor valor o resultado. Por otro
lado, la variabilidad no es fácilmente reductible –se puede deber
totalmente a factores naturales u a otros fuera de nuestro control
13 Capítulo 2Capítulo 2:
Rangos
Si Ud. puede encontrar múltiples fuentes primarias, es típicamente
más útil representar completamente toda la información que Ud.
tenga, en vez de simplemente escoger un sólo punto representativo.
Si Ud. usa un sólo valor, Ud. está haciendo una declaración consciente
de que un valor particular es el más correcto y que los otros son
irrelevantes. En realidad, Ud. puede tener más de un valor
potencialmente correcto o útil, por ejemplo, basado en que Ud.
encontró múltiples y creíbles fuentes primarias. Al usar rangos, Ud.
puede representar múltiples datos puntuales, o un pequeño conjunto o
subconjunto de datos. Mientras que los datos puntuales individuales
son representados por un solo número (por ejemplo, 5), un rango se
crea encapsulando sus múltiples datos puntuales, y puede ser
representado con paréntesis, tal como (0,5) o (0-5). Un rango
representado de esta forma podría significar “un número entre 0 y 5”.
Los valores usados como los límites de un rango pueden crearse con
varios métodos. Los valores mínimo y máximo de un conjunto de datos
son parámetros que se usan frecuentemente. En un dominio de
tecnología energética, Ud. podría querer representar un rango de
valores de eficiencia de una tecnología para generar electricidad, tal
como (30%, 50%).
Por último, los rangos pueden usarse para representar los mejores o
peores escenarios de caso. Los valores límite escogidos para los
rangos establecidos son escogidos subjetivamente aunque quizás
tomando como referencia otros límites de rangos derivados de
algunos otros métodos conocidos. Por ejemplo, Ud. podría decidir que
un “mejor valor de caso” para la eficiencia sea 100% y un “peor valor
de caso” sea 0% (a pesar de no ser potencialmente realista). Los
límites de los mejores y peores casos son típicamente más útiles
cuando se modelan parámetros económicos, por ejemplo, representar
el salario más alto que Ud. podría necesitar para pagar un trabajador
o la tasa más baja de interés que se podría conseguir en un préstamo
bancario. Los mejores y peores casos, por su propia naturaleza, son
improbables. No es muy probable que todos sus peores parámetros
ocurrirán, así como e improbable que todos los mejores parámetros
ocurran tampoco. O sea que Ud. podría considerar los rangos
mejores-peores como un tipo de análisis de límites.
Ejemplo 2-1:
Pero ¿que pasaría si todo lo demás falla y Ud. no puede encontrar una
fuente primaria o una unidad necesaria de conversión? ¿Que pasaría
si no podemos encontrar un método apropiado de cálculo? Se debe
encontrar un método alternativo que nos ayude a encontrar una
respuesta cuantitativa, preservando el método científico, con
flexibilidad suficiente para usarse sin todos los datos o ecuaciones
necesarios. Esta alternativa podría requerir el hacer una encuesta de
expertos o de no-expertos, o de suponer la respuesta. Es esta idea de
27 Capítulo 2Capítulo 2:
Pregunta: A partir de que el total de millas manejadas por todos los vehículos en los
EE.UU. es de cerca de 3 billones de millas por año ¿Cuántos galones de petróleo se usan por día
en los EE.UU. para el transporte?
conoce, o el intentar con métodos con los que Ud. ya tenga buena
experiencia. Ahora que hemos revisado los bloques de construcción, el
Ejemplo 2-2 nos muestra cómo aplicarlos para crear una estimación
simple.
Pensemos más sobre las razones por las que nos desviamos en un factor de dos. Primero,
intentamos una estimación en un párrafo con dos suposiciones. La parte de vehículos de
pasajeros en el total de millas manejadas no es el 100%, y los camiones pesados representan el
10% de las millas recorridas y cerca de un cuarto del combustible consumido (porque sus
consumos de combustible son aproximadamente de 5 mpg y no de 20). Considerando estas
desviaciones, nuestra estimación original, aunque simplista, resultó útil.
Fuentes: US DOE, EIA, Annual Petroleum and Other Liquids Consumption Data
http://www.eia.gov/dnav/pet/pet_cons_psup_dc_nus_mbbl_a.htm
36 Capítulo 2Capítulo 2:
las respuestas reales. Puede ser que Ud. no esté haciendo buenas
suposiciones, o puede que Ud. esté sistemáticamente proponiendo
valores muy altos o muy bajos. No es difícil capacitarse después de
haber tratado de estimar 5-10 valores diferentes por Ud. mismo. Al
hacerlo, trate de aplicar todos los métodos de bloques de construcción
propuestos por Mosteller.
"La propuesta de la EPA presenta un rango para la concentración permisible de ozono al nivel
de terreno, el principal ingrediente en el smog, desde 60 partes por millardo hasta 70 partes
por millardo. Esto es equivalente a 60 a 70 pelotas de tenis en una alberca de tamaño
Olímpico llena de un millardo de pelotas de tenis."
Respuesta: Suponga que la nota falla en su prueba de olfato porque Ud. se da cuenta que un
millardo de pelotas de tenis es un número muy grande de pelotas para esta alberca. Una
estimación rápida aproximada sugiere que el tamaño aproximado de una alberca Olímpica es
de 50m x 25m * 2m = 2500 metros cúbicos. Similarmente, suponga que una pelota de tenis
ocupa un cubo de diámetro de 2.5 pulgadas (70 mm o 0.07m), lo que implica un volumen de
0.00034 m3. Esta alberca contiene sólo cerca de 7 millones de pelotas de tenis, casi tres órdenes
de magnitud menos que el millardo sugerido en el extracto. Por supuesto que podríamos
refinar aún más nuestras suposiciones como el de que la alberca pudiera estar uniformemente
más profunda, o el que la pelota de tenis ocupara completamente su cubo (para considerar que
las pelotas de tenis adyacentes pudieran llenar algunos de los huecos de las pelotas
amontonadas) pero ninguna suposición podría explicar la diferencia en los varios órdenes de
magnitud.
Ud. no puede poner un millardo de pelotas de golf en una alberca Olímpica, así que el punto de
referencia sugerido para la audiencia lega es erróneo. Se trata probablemente de una referencia
informal de la Página de Hechos de la EPA en el artículo noticioso (por ejemplo, "60-70 pelotas
en una alberca llena de pelotas").