Está en la página 1de 3

Una de las definiciones de diccionario de la palabra ciencia se da como verdad

determinada por observación, experimento e inducción. Hoy en día, la sociedad está


gastando una gran cantidad de tiempo, dinero y dinero en la búsqueda de la ciencia.
Esta búsqueda es a menudo frustrante porque, como sabe cualquier científico, los
procesos de observación, experimentación e inducción no siempre dejan al
descubierto la verdad. Un experimento con un conjunto de observaciones puede
llevar a dos científicos a dos conclusiones diferentes. Por ejemplo, un científico
coloca una rata en un corral con dos puertas, ambas cerradas. Una puerta está
pintada de rojo y la otra azul. La rata se somete a 20 minutos de música del tipo
popular entre los adolescentes de hoy. Después de esta experiencia, ambas puertas
se abren y la rata se queda sin la pluma. El científico observa qué puerta de color
eligió la rata. Este experimento se repite 10 veces, cada vez usando una rata
diferente. Al final del experimento compuesto, el experimento observa que las ratas
eligieron la puerta roja 7 de cada 10 veces y concluye la verdad ya que el tratamiento
usado hace que las ratas prefieran la puerta roja a la puerta azul. Sin embargo, un
colega escucha esta conclusión y prueba en broma al científico: "SI arrojé una
moneda 10 veces obteniendo 7 cabezas y, antes de cada una de ellas, silbé el
garabato del tanque, ¿concluirían que mi susurro hizo que la moneda prefiriera la
cabeza?". La analogía entre una rata que elige una de las dos puertas y una moneda
que aterriza en uno de sus dos lados, el científico se da cuenta del error y decide
que el resultado del experimento podría haber sido el resultado de la casualidad.
Más tarde, el científico realiza un segundo experimento. Él inyecta una cierta droga
en el torrente sanguíneo de cada una de 10 ratas. Cinco minutos después, examina
a las ratas y descubre que 7 están muertas, y las otras 3 son aparentemente sanas.
Sin embargo, dado que solo 7 están muertos, recuerda el experimento anterior
permite que tal resultado pueda haber ocurrido por casualidad y, por lo tanto, no hay
pruebas de que las inyecciones de drogas sean peligrosas. Su colega interrumpe
de nuevo diciendo: "con tu primer experimento, cada rata tenía una probabilidad de
50-50 de elegir la puerta roja, sin la música, y por lo tanto podemos comparar ese
experimento con tirar una moneda. En este experimento, las posibilidades de que
una rata muera en cinco minutos son bastante escasas, si el medicamento no tiene
efecto. Dado que su experimento dio como resultado 7 de estos eventos raros de
solo 10 posibilidades, parece seguro concluir que las inyecciones de drogas
causaron las muertes. Y así va la investigación. Pronto se vuelve evidente para la
mayoría de los científicos que la forma ideal de expresar los resultados de
experimentos, como el anterior, es poder decir algo como "sin el tratamiento que
administré, los resultados experimentales tan extremos como los que obtuve
ocurrirían solo 3 veces en 1000. Por lo tanto, llegué a la conclusión de que el
tratamiento tiene un efecto definitivo ". En este sentido, todos los científicos que leen
este experimento saben cuánta subjetividad u opinión entraron en la conclusión
establecida.
El propósito de este campo de la ciencia, conocido como estadística, es
proporcionar los medios para medir la cantidad de subjetividad que entra en la
conspiración científica y separar así la ciencia de la opinión. Esto se logra al
establecer un "modelo" teórico para el experimento, como el modelo de "lanzar una
moneda" que se creó para el primer experimento discutido. Se aplican leyes de
probabilidad a este modelo para determinar cuáles son las posibilidades de que
existan varios posibles resultados del experimento bajo la suposición de que todas
las posibilidades, y no las inyecciones de música o drogas, determinan el resultado
del experimento. Entonces el experimentador tiene una base objetiva para decidir
si los resultados fueron el resultado de los tratamientos aplicados o si los mismos
resultados pudieron haber ocurrido fácilmente por casualidad sin tratamiento.
Aunque a veces es difícil describir un modelo teórico apropiado para el
experimento, la dificultad real a menudo viene después de que se ha definido el
modelo, en la forma de encontrar las probabilidades asociadas con el modelo. Se
han inventado muchos modelos razonables para los que no se han encontrado
soluciones de probabilidad alguna vez. Por lo tanto, los estadísticos a menudo han
cambiado ligeramente el modelo para poder resolver las probabilidades deseadas
con la esperanza de que el cambio en el modelo sea lo suficientemente leve para
que el modelo cambiado sea todavía bastante realista. Luego pudieron obtener
soluciones exactas para estos "problemas aproximados".
Este conjunto de estadísticas a veces se denomina "estadísticas paramétricas" e
incorpora pruebas tan conocidas como la "prueba t", la "prueba f" y otras. A fines de
la década de 1930, un enfoque diferente del problema de las probabilidades de
encontrar comenzó a cobrar impulso. Este enfoque implicaba hacer pocos cambios,
si es que había alguno, en el modelo y usar métodos simples y poco sofisticados
para encontrar las probabilidades deseadas, o al menos una buena aproximación a
esas probabilidades. Por lo tanto, se encontraron soluciones aproximadas a
problemas exactos, en oposición a la solución exacta para aproximar los problemas
proporcionados por estadísticos paramétricos. Este nuevo paquete de
procedimiento estadístico se conoció como "estadísticas no paramétricas". Los
métodos no paramétricos se han convertido en herramientas esenciales en el taller
del científico aplicado que necesita hacer análisis estadísticos. Cuando el precio por
tomar una decisión incorrecta es alto, los científicos aplicados son muy conscientes
de que los métodos estadísticos que están utilizando no se basan en suposiciones
que parecen ser inválidas o que son imposibles de verificar. Además de la ventaja
de utilizar un modelo más simple, los métodos estadísticos no paramétricos a
menudo implican menos trabajo computacional y, por lo tanto, a veces son más
fáciles y rápidos de aplicar que otros métodos estadísticos. Una tercera ventaja de
los métodos no paramétricos puede desarrollarse rigurosamente, sin usar otras
matemáticas más allá del álgebra de la escuela secundaria. Un científico que
entiende la teoría detrás de los métodos estadísticos es menos apto para usar ese
método en una situación en la que dicho uso sería incorrecto y puede desarrollar
mejor sus propios métodos estadísticos si el modelo es uno que aún no ha sido
considerado por estadísticos. Las partes de estadísticas no paramétricas que
requieren el uso de matemáticas más avanzadas se presentarán sin derivarlas, pero
siempre que sea conveniente, se hará referencia a una fuente donde se pueda
encontrar la prueba. La cuarta razón, y la más importante, para preferir los métodos
no paramétricos es que a menudo son más poderosos que los métodos
paramétricos si las suposiciones detrás del modelo paramétrico no son ciertas. El
poder es la probabilidad de que el experimentador pueda demostrar lo que intenta
probar en el experimento. Los métodos de análisis no paramétricos a menudo hacen
un uso más eficiente de los datos que los métodos paramétricos, cuando los
métodos paramétricos se aplican de manera inapropiada.
Esto nos lleva al tema de por qué este libro no contiene ninguna de las muchas
pruebas no paramétricas basadas en ejecuciones. Una carrera es una secuencia
de observaciones similares. Por ejemplo, un período de ejecución consiste en
mediciones consecutivas del DHIA donde el DJIA de cada día es más alto que el
día anterior. Del mismo modo, se puede definir un agotamiento. El número total de
ejecuciones cuenta los dos tipos de ejecuciones y se puede utilizar como una
medida de independencia de las mediciones de un día para otro.
Las pruebas de ejecución pueden usarse para probar la independencia de las
observaciones, para probar si dos muestras provienen de la misma población
(ordenando las dos muestras de menor a mayor y contando las series de
observaciones de la misma muestra) y en otras situaciones. Las pruebas basadas
en el número de ejecuciones son fáciles de realizar (generalmente es fácil contar el
número de ejecuciones) y la distribución de probabilidad del número de ejecuciones
a menudo se conoce exactamente. Sin embargo, la prueba de carrera tiene muy
poca potencia y puede ser reemplazada en todos los casos por otra prueba no
paramétrica con mucha mayor potencia.
Por lo tanto, las pruebas basadas en el número de ejecuciones no son prácticas, y
por esa razón no se incluyen en este libro.
Esta formulación de estadística paramétrica versus estadística no paramétrica es
simplemente un intento de dar una idea aproximada sobre el tema de este libro. Una
distinción más precisa entre las dos ramas de las estadísticas se dará en el Capítulo
2, donde la filosofía de la experimentación científica se analiza con mayor detalle.
Para presentar ejemplos e ilustraciones en el capítulo 2, se necesita un
conocimiento preliminar de algunos aspectos elementales de la probabilidad. Esta
es la preocupación del capítulo 1