Está en la página 1de 5

6.

PROBABILIDAD Y ESTADÍSTICA
6.1. Incertidumbre y probabilidad
 Ciencia e incertidumbre
La evidencia empírica disponible es en muchos casos parcial, incompleta o limitada, y no elimina completamente
la incertidumbre sobre el fenómeno investigado. En estos casos la evidencia podrá ser compatible con varias
hipótesis alternativas: no habrá una única hipótesis acorde con la evidencia disponible. Ejemplo:
– Imaginemos que la única evidencia disponible sobre un crimen es que el asesino es un hombre. Esta evidencia
permitirá descartar los sospechosos que son mujeres, pero no será suficiente para determinar quién es el
asesino entre los sospechosos hombres. Hasta que aparezca nueva evidencia, seguirá existiendo incertidumbre
acerca de quién es el culpable.
¿Qué tipo de resultados científicos pueden alcanzarse en situaciones de incertidumbre en las que la evidencia es
incompleta? Debido a que la investigación científica con frecuencia se desarrolla en condiciones de incertidumbre
(evidencia limitada), no siempre será posible ofrecer respuestas concluyentes y firmes, o tesis de aplicación
universal que describan completamente y con exactitud el fenómeno estudiado. Tan solo se podrán dar respuestas
parciales, tentativas, imprecisas o probabilísticas, que reflejen la incertidumbre de los investigadores. No obstante,
existen métodos para controlar, acotar y delimitar de manera rigurosa la incertidumbre de los resultados científicos.
 Probabilidad e incertidumbre
La incertidumbre acerca de un evento puede representarse en términos de probabilidad (que indica el grado de
confianza acerca de si dicho evento tendrá lugar). El grado de probabilidad asignado a un evento suele expresarse
en una escala de 0 a 1 (0 = mínimo grado de confianza, seguridad de que el evento no ocurrirá; 1 = máxima
confianza, seguridad de que el evento sí ocurrirá; 0.5 = grado medio de confianza, igualmente probable que el evento
suceda como que no suceda). También puede expresarse como un porcentaje (0 – 50 – 100%). Ejemplo:
– La probabilidad de ganar la lotería (comprando un único boleto) es cercana a 0 (0%), mientras que la
probabilidad de perder es cercana a 1 (100%).
Existen técnicas matemáticas para operar de manera precisa y rigurosa con asignaciones de probabilidad (Teoría de
la probabilidad).
 Ciencia probabilística
Los resultados científicos se presentan frecuentemente de manera probabilística. En muchas ocasiones, la
evidencia disponible no justifica aceptar de manera concluyente una hipótesis (porque hay hipótesis alternativas
compatibles con la evidencia), sino solo asignarle un cierto grado de probabilidad. La probabilidad asignada a una
hipótesis, o a una predicción científica, refleja el grado de apoyo que la evidencia disponible ofrece a tal hipótesis o
predicción. Ejemplo:
– Si estamos en una región lluviosa, observamos nubes densas y estamos en una época del año en que las lluvias
son frecuentes, la evidencia disponible justifica asignar un alto grado de probabilidad a la posibilidad de que
llueva en las próximas horas (aunque no podamos descartar completamente la posibilidad de que no llueva).
La necesidad de acudir a teorías científicas de naturaleza probabilística se dará independientemente de si el mundo
está gobernado por leyes deterministas o si la realidad es azarosa e indeterminista: nos veremos obligados a apelar a
probabilidades en aquellas investigaciones científicas que se realicen en condiciones de incertidumbre y con
evidencia incompleta o limitada. Los pronósticos y predicciones realizadas por la ciencia son en muchos casos
probabilísticos: no se asegura que cierto evento vaya a suceder, sino que se asignan probabilidades. Ejemplo: los
pronósticos meteorológicos.
 Aplicaciones prácticas de la probabilidad
Aunque una predicción probabilística no elimine completamente la incertidumbre, puede proporcionar una guía
útil para la toma de decisiones (en política, economía, medicina, ingeniería…). Ejemplos:
– Saber cómo de probable es que llueva nos ayudará a decidir si llevar un paraguas.
– Disponer de información fiable sobre el riesgo de que un volcán entre en erupción (es decir, la probabilidad de
que se produzca una erupción) permitirá tomar medidas adecuadas para proteger a las poblaciones cercanas.
– Si se sabe que una dieta alta en sal aumenta la probabilidad de desarrollar hipertensión, se puede reducir el
riesgo de tener hipertensión disminuyendo la cantidad de sal consumida.
 Márgenes de error
Entre las fuentes de incertidumbre en los resultados científicos, se encuentran los posibles errores e imprecisiones
en las observaciones, medidas y métodos de investigación empleados. Ejemplo: los instrumentos de medida tienen
una precisión limitada. Si utilizamos un reloj con minutero pero sin segundero no podremos determinar la hora con
precisión de segundos o décimas de segundo.
Al presentar resultados científicos es fundamental señalar claramente cómo de imprecisos son tales resultados.
Existen distintas formas de reflejar la imprecisión de un resultado científico: una opción estándar es especificando
márgenes de error (por ejemplo, mediante barras de error). Los márgenes de error de una medida o predicción de
cierta variable indican el intervalo de valores dentro de los cuáles se estima que se encontrará dicha variable.
Ejemplos:
– Un cinemómetro (medidor de velocidad) que mide la velocidad de un automóvil como 100 ± 5 km/h.
– Una predicción según la cual el incremento de la temperatura global en los próximos 100 años estará entre
1.8°C y 4°C.
6.2. Evidencia estadística
 Estadística
Estadística: Análisis y procesamiento de conjuntos de datos.
La evidencia científica suele presentarse de forma estadística, como grandes colecciones de datos acerca de un
objeto de estudio (por ejemplo, un conjunto de resultados experimentales obtenidos en una investigación). Para poder
extraer conclusiones relevantes a partir de un conjunto de datos empíricos, es necesario recurrir a métodos de
análisis estadístico. Ejemplos:
– Un experimento de física subatómica en el CERN puede involucrar miles de observaciones, generando gran
cantidad de datos que deben ser procesados estadísticamente.
– Los estudios epidemiológicos estándar tienen muestras de cientos de individuos.
– Big data/data mining (grandes conjuntos de datos analizados estadísticamente con ayuda de ordenadores).
Estadística descriptiva: Se busca describir las propiedades de un conjunto de datos. Ejemplo:
– A partir de datos sobre la altura de cada estudiante en una clase, se calcula la frecuencia de cada medida, la
altura media de la clase, la altura mediana o la dispersión de las alturas de los estudiantes.
Estadística inferencial: Tomando como evidencia datos sobre parte de una población o una serie de casos
(muestra), se realizan inferencias (inductivas) acerca de las propiedades de la población en su conjunto, o acerca
de propiedades generales del tipo de fenómeno ejemplificado por los casos (es decir, inferencias cuyas conclusiones
sean aplicables más allá de los casos sobre los que se tiene datos). Ejemplo: se realiza una encuesta sobre intención
de voto entre parte de la población de un país para realizar estimaciones acerca del resultado de unas elecciones.
 Inferencias estadísticas
Los métodos inferenciales estadísticos parten de datos acerca de una serie de casos o individuos (Muestra
estadística = conjunto de casos/individuos sobre los que se tiene datos) y tienen como objetivo extraer conclusiones
aplicables de manera general al tipo de fenómeno o la población estudiada. Lo que suelen buscarse son tendencias,
patrones y correlaciones entre variables de interés, y que sean aplicables de manera general, más allá de los casos
dentro de la muestra. Ejemplo: un cierto estudio epidemiológico puede tener como objetivo investigar si existe una
correlación entre una dieta alta en sal y el desarrollo de hipertensión.
La evidencia estadística recopilada en una investigación científica (a partir de los datos empíricos disponibles) no
siempre permite extraer conclusiones absolutas o correlaciones perfectas, sino que servirá de base para inferir
conclusiones de naturaleza probabilística: patrones, tendencias y correlaciones probabilísticas, más o menos
marcadas. Ejemplo: aunque no toda persona con una dieta alta en sal acabe siendo hipertensa, la evidencia estadística
disponible permite concluir que es más probable desarrollar hipertensión si se sigue una dieta alta en sal.
 ¿Qué es una correlación estadística?
Correlación estadística: relación o dependencia entre los valores de las dos variables del análisis estadístico de un
conjunto de datos (por ejemplo, el aumento o disminución de una variable cuando aumenta o disminuye la otra
variable). Ejemplos:
– El peso y la altura de una persona están estadísticamente correlacionados: las personas altas tienden a ser más
pesadas que las bajas.
– La altura de los padres está estadísticamente correlacionada con la altura de sus hijos: los hijos de padres altos
tienden a ser más altos que los hijos de padres bajos.
Es útil conocer la existencia de correlaciones entre variables porque permite predecir el valor de una variable
sabiendo el valor de la otra (por ejemplo, si sabemos que unos padres son muy altos, podremos predecir que sus hijos
probablemente también serán altos).
Un resultado extraído a partir de un conjunto de datos (e.g. una correlación) se dice que es estadísticamente
significativo si es suficientemente improbable que dicho resultado sea debido al azar (e.g. una correlación fruto de
una coincidencia casual en los casos observados). Cuanto mayor es la muestra (más representativa), menos
probabilidad de que se den correlaciones debidas a coincidencias azarosas y mayor probabilidad de obtener
resultados estadísticamente significativos. Ejemplo:
– Si se observan solo las últimas 4 jugadas de una ruleta (no defectuosa), no es demasiado improbable que, por
azar, todos los ganadores sean pares (≈6%). No obstante, la conclusión de que en esa ruleta los números
ganadores son en general pares no representará adecuadamente el funcionamiento normal de la ruleta. Con una
muestra más amplia, es casi imposible que todos los números ganadores observados sean pares: si se observan
muchas jugadas, lo normal es que haya un número similar de ganadores pares e impares (si la ruleta es
imparcial y no tiene grandes defectos).
 Sesgos estadísticos
Al analizar estadísticamente un conjunto de datos, es importante asegurarse de que las conclusiones extraídas (e.g.
que existe cierta correlación entre dos variables) reflejan correlaciones y tendencias realmente presentes en el objeto
de estudio, y no se deben más bien a distorsiones generadas por deficiencias en los métodos de análisis empleados o
en la recolección de datos (sesgos estadísticos). Por ejemplo, si la muestra de datos usada como evidencia no es
representativa (muestra sesgada) de la población/fenómeno que se quiere estudiar, se está dando un sesgo de
selección, que puede introducir aparentes correlaciones que no se dan realmente. Ejemplos:
– Si estamos estudiando una población de individuos de un país, la muestra de individuos para hacer nuestro
análisis estadístico ha de ser representativa de dicha población (no puede incluir solo un género, o solo
personas de una franja de edad).
– Si queremos estudiar las preferencias de voto de distintas zonas de España, pero tomamos como muestra solo
personas mayores de 60 años, obtendremos resultados sesgados y distorsionados, pues los votantes jóvenes no
votan exactamente igual que los votantes mayores de 60 años.
Existen técnicas para minimizar la presencia de sesgos, por ejemplo, escoger la muestra de manera aleatoria entre
toda la población (para así evitar que la muestra se concentre en un sector particular de la población), o utilizar
muestras amplias.
 Correlaciones y causas
¡Correlación ≠ Causación! La existencia de correlaciones estadísticas entre dos variables (X e Y) no siempre
implica que haya una relación causa-efecto entre ambas; es decir, no implica que los cambios en (X) sean la causa de
los cambios en (Y). Para analizar si hay relaciones causales entre dos variables (X) e (Y), habrá que examinar cómo se
correlacionan, controlando la posible influencia de otras variables (Z). Para ello se puede averiguar (mediante un
experimento controlado) si la correlación entre X/Y persiste cuando (Z) se mantiene constante. Ejemplo:
– La correlación estadística entre vivir en barrios caros (X) y poseer más de un coche (Y) no nos permite inferir
(de forma directa) que (X) sea la causa de (Y). Por ejemplo, puede que la causa inicial que explique ambas
variables sea tener un determinado nivel de renta (Z) (en este caso, elevado). Así, (Z) sería la causa tanto de
(X) como de (Y).
– Si quisiéramos comprobar si el nivel de renta (Z) no afecta a la correlación entre X/Y, habrá que analizar si
sigue existiendo dicha correlación cuando fijamos/controlamos un nivel de renta determinado. Es decir,
podemos mantener (Z) constante (por ejemplo, nivel de renta alto) y variar la (X): tomar diferentes muestras de
personas con alto poder adquisitivo y que vivan (indistintamente) en barrios caros, medios y baratos. Si del
estudio se deriva que esta población tiene más de un coche (Y), independientemente de su lugar de residencia,
podremos inferir que la verdadera causa de (Y) no es la variable (X) sino (Z).
6.3. Aproximaciones en ciencia
 Incertidumbre, precisión, exactitud
Una evidencia disponible incompleta genera incertidumbre e imprecisión, pues, ante las preguntas planteadas en la
investigación, solo puede dar respuestas parciales y provisionales, dejando opciones abiertas. Ejemplo: ¿A qué hora
llegará el tren? Entre las 2 y las 3.
Las aproximaciones son respuestas incorrectas e inexactas a una pregunta, pero suficientemente cercanas a la
respuesta correcta. Ejemplos:
– ‘¿A qué hora llega el tren?’ ‘Aproximadamente a las 2.30h’ [La hora exacta de llegada son las 2.29h]
– 3,1416 es una aproximación del número π.
 Aproximaciones en ciencia
El uso de aproximaciones en ciencia es ubicuo, y son frecuentes en la mayoría de disciplinas científicas. Se utilizan:
– Cuando no se puede dar una respuesta correcta a una pregunta de investigación, por ser la evidencia
disponible limitada.
– Cuando se puede dar una respuesta correcta, pero, o bien es demasiado trabajosa de obtener, o bien resulta
difícil de utilizar en cálculos y en predicciones.
 Aproximaciones y la aspiración a la verdad
Las aproximaciones son, estrictamente, falsas. Ejemplo: si el tren llega a las 2:29h, la predicción por aproximación
“llega a las 2:30h” es estrictamente falsa, pues queda falsada al comprobar (evidencia) que el tren llega a las 2:29h.
Y sin embargo, la ciencia aspira a la verdad: ¿Es compatible el uso de aproximaciones con la aspiración de la
ciencia a la verdad? Si sabemos que una respuesta/hipótesis/predicción queda falsada por la evidencia, ¿no
deberíamos descartarla, aplicando el método científico falsacionista?
 ¿Son las aproximaciones aceptables en ciencia?
El uso de aproximaciones en ciencia es legítimo, siempre que aceptemos que no son respuestas exactas. Una
aproximación será aceptable si es suficientemente cercana a la respuesta correcta, según los intereses de los
investigadores: que pueda usarse de manera exitosa para entender y manipular el fenómeno estudiado, y más en
concreto, en la medida que lleve a aplicaciones prácticas exitosas. En muchas aplicaciones prácticas, la diferencia
entre una buena aproximación y una respuesta exacta no será relevante o apreciable.
 Un caso: la física newtoniana como una aproximación
La física gravitacional newtoniana se considera una teoría incorrecta e inexacta, refutada por la evidencia y sustituida
por la teoría relativista (Einstein).
No obstante, para muchas aplicaciones prácticas cotidianas, la física newtoniana sigue siendo una aproximación
suficientemente buena a la verdad porque explica y predice, con bastante exactitud, el comportamiento de sistemas
con interacciones gravitacionales débiles y velocidades mucho menores que la de la luz. En estos sistemas (las
condiciones típicas en la Tierra) los resultados obtenidos usando la física newtoniana no divergen apreciablemente de
los resultados correctos relativistas (e.g. podemos construir un puente fiable usando la física newtoniana). En
cambio, para estudiar fenómenos astronómicos (“bujeros” negros) o para diseñar sistemas GPS fiables, hay que
recurrir a la física relativista (la aproximación newtoniana es demasiado inexacta para este tipo de aplicaciones).
 Simplificaciones e idealizaciones de un sistema
Una forma típica de obtener aproximaciones es simplificar el problema investigado, introduciendo una idealización:
en vez de estudiar el sistema real, estudiamos un sistema simplificado/idealizado en el que se ha eliminado parte de
la complejidad. Los resultados así obtenidos describirán los hechos, solo de manera aproximada. Si es una buena
aproximación, los resultados obtenidos seguirán teniendo aplicaciones útiles. Las idealizaciones y simplificaciones
son ubicuas en ciencia. Ejemplo: al estudiar el movimiento de un cuerpo unido a un muelle con frecuencia se
introduce un sistema idealizado, ignorando el rozamiento del aire y despreciando la masa del muelle.
 Simplificación de cálculos
En muchos casos, los problemas matemáticos que hay que resolver para obtener resultados/predicciones exactas a
partir de una teoría o hipótesis son demasiado complicados. Para poder trabajar de manera operativa con una
teoría/hipótesis es frecuente la simplificación de los cálculos implicados en la manipulación de dicha teoría/hipótesis,
obteniendo por tanto resultados aproximados. Ejemplos:
– En lugar de enfrentarnos a una ecuación complicada podemos resolver una ecuación más sencilla
suficientemente parecida a la original.
– Métodos computacionales. El uso de ordenadores (mediante métodos de aproximación y simplificación ya
estudiados) permite obtener soluciones aproximadas a problemas matemáticos complejos.
 Un caso: simplificando la ecuación del péndulo
La ecuación de movimiento de un péndulo simple es:

(g es la aceleración de la gravedad, l la longitud del péndulo y θ el ángulo que el péndulo se separa de la vertical).
Pero para valores pequeños de θ (pequeñas oscilaciones del péndulo) sinθ≈θ, y podemos simplificar la ecuación a:

Esta ecuación (que describe el movimiento armónico de un muelle simple idealizado) es más fácil de resolver.
 La simplificación y los resultados
Para que una aproximación sea aceptable, las simplificaciones realizadas no deben afectar significativamente a los
resultados obtenidos (los factores ignorados al idealizar han de tener una influencia suficientemente pequeña en el
comportamiento del sistema).
En sistemas complejos no siempre es fácil anticipar en qué casos una simplificación (ignorar los efectos de cierta
variable) tendrá consecuencias relevantes. Ejemplo: las ciencias sociales estudian sistemas particularmente
complejos (sociedades humanas) cuyo comportamiento depende de la interacción de numerosas variables. Con
frecuencia es difícil determinar cuáles de estas variables tienen una influencia significativa en el comportamiento del
sistema.
 Simplificaciones en ciencias sociales
En economía es habitual idealizar a los individuos como agentes racionales ideales (e.g. perfectamente coherentes,
lógicamente omniscientes, satisfacen de manera óptima sus preferencias) y a los mercados como si se diera
competencia perfecta (e.g. información completa y simétrica; sin barreras de entrada; número elevado de
compradores y vendedores). Pero estos mercados idealizados solo representan de manera aproximada los mercados
reales. Así, las conclusiones obtenidas sobre estas situaciones idealizadas podrán tener aplicaciones útiles para el
estudio de mercados reales, pero, en muchos casos, podrán llevan a una representación distorsionada del mercado
real que se quiere estudiar.
 Conclusiones. El modelo científico
En ciencia no siempre es posible (o no resulta práctico) trabajar con resultados exactos, que den una respuesta
completa y correcta a nuestras preguntas de investigación. En estos casos es habitual recurrir a aproximaciones, que
implican representaciones idealizadas y simplificadas (modelos científicos) del fenómeno estudiado.

También podría gustarte