Está en la página 1de 51

ESTADÍSTICA BÁSICA

PARA ESTUDIANTES DE CIENCIAS

Javier Gorgas Garcı́a


Nicolás Cardiel López
Jaime Zamorano Calvo

Departamento de Astrofı́sica y Ciencias de la Atmósfera


Facultad de Ciencias Fı́sicas
Universidad Complutense de Madrid
Capı́tulo 1

Introducción
“La Ciencia es más una forma de pensar que una rama del conocimiento.”

Carl Sagan (1934-1996)

1.1. La Estadı́stica como ciencia

La Estadı́stica es la ciencia que se encarga de recoger, organizar e interpretar los datos. Es la ciencia de los
datos. En la vida diaria somos bombardeados continuamente por datos estadı́sticos: encuestas electorales,
economı́a, deportes, datos meteorológicos, calidad de los productos, audiencias de TV. Necesitamos una
formación básica en Estadı́stica para evaluar toda esta información. Pero la utilidad de la Estadı́stica va
mucho más allá de estos ejemplos.
La Estadı́stica es fundamental para muchas ramas de la ciencia desde la medicina a la economı́a. Pero
sobre todo, y en lo que a nosotros importa, es esencial para interpretar los datos que se obtienen de la
investigación cientı́fica. Es necesario leer e interpretar datos, producirlos, extraer conclusiones, en resumen
saber el significado de los datos. Es por lo tanto una herramienta de trabajo profesional.
Se recomienda leer la Introducción de Estadı́stica: modelos y métodos de Daniel Peña, para conocer el
desarrollo histórico de la Estadı́stica. La Estadı́stica (del latı́n, Status o ciencia del estado) se ocupaba sobre
todo de la descripción de los datos fundamentalmente sociológicos: datos demográficos y económicos ( censos
de población, producciones agrı́colas, riquezas, etc.), principalmente por razones fiscales. En el siglo XVII
el cálculo de probabilidades se consolida como disciplina independiente aplicándose sobre todo a los juegos
de azar. Posteriormente (s. XVIII) su uso se extiende a problemas fı́sicos (principalmente de Astronomı́a)
y actuariales (seguros marı́timos). Posteriormente se hace imprescindible en la investigación cientı́fica y es
ésta la que la hace avanzar. Finalmente, en el siglo XIX, nace la Estadı́stica como ciencia que une ambas
disciplinas.
El objetivo fundamental de la estadı́stica es obtener conclusiones de la investigación empı́rica usando
modelos matemáticos. A partir de los datos reales se construye un modelo que se confronta con estos datos
por medio de la Estadı́stica. Esta proporciona los métodos de evaluación de las discrepancias entre ambos.
Por eso es necesaria para toda ciencia que requiere análisis de datos y diseño de experimentos.

3
4 Introducción

1.2. Para qué sirve la Estadı́stica

Ya hemos visto que la Estadı́stica se encuentra ligada a nuestras actividades cotidianas. Sirve tanto para
pronosticar el resultado de unas elecciones, como para determinar el número de ballenas que viven en nuestros
océanos, para descubrir leyes fundamentales de la Fı́sica o para estudiar cómo ganar a la ruleta.
La Estadı́stica resuelve multitud de problemas que se plantean en ciencia:

Análisis de muestras. Se elige una muestra de una población para hacer inferencias respecto a esa
población a partir de lo observado en la muestra (sondeos de opinión, control de calidad, etc).

Descripción de datos. Procedimientos para resumir la información contenida en un conjunto (amplio)


de datos.

Contraste de hipótesis. Metodologı́a estadı́stica para diseñar experimentos que garanticen que las con-
clusiones que se extraigan sean válidas. Sirve para comparar las predicciones resultantes de las hipótesis
con los datos observados (medicina eficaz, diferencias entre poblaciones, etc).

Medición de relaciones entre variables estadı́sticas (contenido de gas hidrógeno neutro en galaxias y la
tasa de formación de estrellas, etc)

Predicción. Prever la evolución de una variable estudiando su historia y/o relación con otras variables.

1.3. El método cientı́fico

Citando a Martin Gardner: “La ciencia es una búsqueda de conocimientos fidedignos acerca del mundo:
cómo se estructura y cómo funciona el universo (incluyendo los seres vivos)”. La informacion que maneja la
ciencia es amplia, al ser amplio su ámbito. Pero se suele reunir en tres apartados: los hechos, las leyes y las
teorı́as. No es una partición estanca, aunque podemos entender aquı́ nos referimos con algún ejemplo. Los
hechos se refiere a casos especı́ficos y/o únicos. Por ejemplo la Tierra tiene una luna (satélite natural).
La primera ley de Kepler (ya que estamos con planetas) es un buen ejemplo de ley: los planetas describen
orbitas elı́pticas en torno al Sol, que ocupa uno de los focos de la elipse. Como se ve, frente al hecho, concreto
y único, la ley se refiere a muchos casos, como lo son los planetas que orbitan en torno al Sol. La generalización
de la ley de Kepler permite aplicarla a cualquier par de cuerpos ligados por la gravedad.
Una teorı́a es una abstracción, con entidades inobservables, que explica hechos y leyes. Por ejemplo la
teorı́a newtoniana de la gravitación. En ella se habla de fuerzas (o de campos gravitatorios) que no son entes
observables, pero esta teorı́a explica hechos y leyes.
Sucede que el conocimiento cientı́fico no es completamente seguro en ninguna de las precedentes cate-
gorı́as. Podrı́a existir otra luna en torno a la Tierra. O, como sabemos, la teorı́a newtoniana de la gravitación
no es completa, porque no da cuenta de algunos fenómenos. De ahı́ vino su evolución a nuevas teorı́as de la
gravitación. No hay ası́ un conocimiento completamente seguro: los enunciados absolutamente ciertos sólo
existen en el ámbito de las matemáticas o la lógica. Pero la ciencia usa una correspondencia con estas dos
disciplinas. La matemática y la lógica aplicadas a las ciencias facilitan poder establecer hechos, leyes y teorı́as
con coherencia interna y con un alto grado de certeza. Y la Estadı́stica proporciona una herramienta para
poder evaluar esta certeza, o proporcionar pautas para realizar inferencias a partir de lo que se conoce.

Estadı́stica Básica para Estudiantes de Ciencias Febrero 2009


1.4 El proceso experimental 5

Lo que distingue a una teorı́a cientı́fica es que ésta, a diferencia de la que no lo es, puede ser refutada:
puede existir un conjunto de circunstancias que si son observadas demuestran que la teorı́a está equivocada.
A continuación se ofrece una visión simplificada del método cientı́fico.
Hacemos observaciones en la naturaleza y a través de un proceso creativo generamos una hipótesis de cómo
funciona cierto aspecto de la naturaleza (modelos). Basándonos en esa hipótesis diseñamos un experimento
que consiste en que un conjunto de observaciones deben tener lugar, bajo ciertas condiciones, si la hipótesis
es cierta. En el caso de que estas observaciones no ocurran nos enfrentamos a varias posibilidades: nuestras
hipótesis necesitan ser revisadas, el experimento se llevó a cabo de forma incorrecta, o nos hemos equivocado
en el análisis de los resultados del experimento.

Hace algunos cientos de años se estableció un método para encontrar respuestas a los interrogantes que nos planteamos al
contemplar la naturaleza. Este método, conocido como método cientı́fico, se basa en tres pilares fundamentales: observación,
razonamiento y experimentación.
El método cientı́fico no es una simple receta, sino que es un proceso exigente que requiere, entre otros ingredientes, juicio crı́tico.
De forma resumida, el método cientı́fico incorpora las siguientes facetas:

Observación: aplicación atenta de los sentidos a un objeto o a un fenómeno, para estudiarlos tal como se presentan en realidad.

Descripción: las mediciones deben ser fiables, es decir, deben poder repetirse. Las observaciones únicas e irrepetibles no
permiten predecir futuros resultados. En este sentido la Cosmologı́a se enfrenta, a priori, a un grave problema. El
Universo es único y no podemos volver a repetirlo modificando las condiciones iniciales.

Predicción: las predicciones de cualquier fenómeno deben ser válidas tanto para observaciones pasadas, como presentes y
futuras.

Control: capacidad de modificar las condiciones del experimento para estudiar el impacto de los diferentes parámetros parti-
cipantes. Esto se opone a la aceptación pasiva de datos, que puede conducir a un importante sesgo (bias) empı́rico.

Falsabilidad o eliminación de alternativas plausibles: Este es un proceso gradual que requiere la repetición de los experimentos
(preferiblemente por investigadores independientes, quienes deben ser capaces de replicar los resultados iniciales con la
intención de corroborarlos). Todas las hipótesis y teorı́as deben estar sujetas a la posibilidad de ser refutadas. En este
sentido, a medida que un área de conocimiento crece y las hipótesis o teorı́as sobre la que se sustenta van realizando
predicciones comprobables, aumenta la confianza en dichas hipótesis o teorı́as (uno de los defensores fundamentales del
criterio de falsabilidad es Karl Popper (1902–1994); ver, por ejemplo, La lógica de la investigación cientı́fica en Popper
1935).

Explicación causal: los siguientes requisitos son normalmente exigibles para admitir una explicación como cientı́fica:

Identificación de las causas.

Las causas identificadas deben correlacionarse con los observables.

Las causas deben preceder temporalmente a los efectos medidos.

1.4. El proceso experimental

La experimentación está lejos de estar carente de dificultades. Algunas técnicas experimentales exigen
un aprendizaje largo y, en muchas ocasiones, el volumen de datos a manejar puede ser tan grande que sea
necesario un trabajo de análisis intenso. La paciencia y la perseverancia son grandes aliadas en este sentido.
Las razones para realizar un experimento son diversas y de alcance muy variable. Preguntas tı́picas son,
por ejemplo: ¿Cómo de aplicable es una teorı́a particular? ¿Es posible mejorar una técnica de medida? ¿A
qué temperatura debe fundir una nueva aleación? ¿Qué ocurre con las propiedades magnéticas de un material
al someterlo a temperaturas de trabajo muy bajas? ¿Se ven alteradas las propiedades de un semiconductor
debido al bombardeo por radiación nuclear?
De una forma esquemática, el proceso experimental suele desarrollarse siguiendo el siguiente esquema:

1. Definir la pregunta o problema a resolver. Cuanto más claro y definido sea el objetivo del experimento,
mucho más fácil será realizar su planificación y ejecución.

Estadı́stica Básica para Estudiantes de Ciencias Febrero 2009


6 Introducción

2. Obtener información y recursos. Una vez definido el objetivo del experimento, es necesario elaborar un
plan de trabajo para poder alcanzarlo. Hay que identificar qué equipos son necesarios, qué cantidades
hay que medir, y de qué manera se va a realizar el experimento.

3. Formular hipótesis, acerca de los resultados de nuestro experimento. Hacerlo antes de su ejecución evita
el sesgo personal de identificar los resultados que ya se conocen como objetivos iniciales (no debemos
engañarnos a nosotros mismos).

4. Realizar el experimento y obtener las medidas. Esta tarea se subdivide en varios pasos:

Preparación: el equipo debe ser puesto a punto para su utilización. Si el experimento requiere
la utilización de aparatos con los que no estamos familiarizados, es necesario leer atentamente
los manuales de utilización, e incluso consultar a experimentadores con experiencia previa en
su manejo. Todo ello evita perder tiempo y cometer errores de bulto, a la vez que preserva la
integridad del equipo (¡y la nuestra!).

Experimentación preliminar: suele ser muy aconsejable realizar una pequeña experimentación de
prueba antes de iniciar la toma definitiva de medidas. Esto facilita el uso correcto del equipo
instrumental, permitiendo identificar los aspectos más difı́ciles o en los que resulta más fácil
cometer errores.

Toma de datos: el trabajo cuidadoso y detallado son fundamentales en todo proceso experimental.
Ejecutar dicha labor siguiendo un plan de trabajo bien definido resulta básico. No hay nada más
frustrante que descubir, tras largas horas de medidas, que hemos olvidado anotar algún parámetro
esencial o sus unidades. En este sentido resulta imprescindible tener presentes varias cuestiones

• ¿Cuáles son las unidades asociadas a cada medida?


• ¿Cuál es la incertidumbre asociada?
• ¿Qué variabilidad presentan las medidas?
• ¿Cómo puedo tener una idea del orden de magnitud de una medida antes de realizarla y saber
ası́ que los resultados que se van obteniendo son razonables?
• ¿Qué información debe ser incluida en la tabla de datos?

Comprobación de la repitibilidad: siempre que sea posible, todo experimento deberı́a repetirse va-
rias veces para comprobar que los resultados obtenidos son repetibles y representativos. Y aunque,
obviamente, la repetición de un experimento no proporciona exactamente los mismos números,
discrepancias muy grandes deben alertarnos acerca de la existencia de efectos sistemáticos que
pueden estar distorsionando el experimento.

5. Analizar los datos: una vez obtenidas las medidas es necesario su tratamiento estadı́stico para poder
obtener magnitudes (e incertidumbres asociadas) representativas del objeto de nuestro estudio.

6. Interpretar los datos y extraer conclusiones que sirvan como punto de partida para nuevas hipótesis. El
éxito de esta interpretación dependerá, básicamente, de la calidad de las medidas y de su análisis. Las
herramientas estadı́sticas que se describen en este libro nos permitirán tomar decisiones
de manera objetiva.

7. Publicar los resultados. Los resultados de cualquier proceso experimental deben ser comunicados de
manera clara y concisa. Esto incluye desde un sencillo informe de laboratorio, como el que se exigirá en
los diversos laboratorios en los que se trabajará durante la licenciatura de Fı́sicas, hasta la publicación
de un artı́culo cientı́fico en una revista reconocida.

Estadı́stica Básica para Estudiantes de Ciencias Febrero 2009


1.5 Bibliografı́a complementaria 7

No es extraño que, aunque la pregunta inicial a responder haya sido establecida de una forma clara, tras
el desarrollo del experimento y el análisis de los resultados, se descubran fenómenos no previstos que obliguen
a modificar y repetir el proceso descrito. De hecho, si el resultado de un experimento fuera completamente
predecible, tendrı́a poco sentido llevarlo a cabo. Por ello, de forma práctica el esquema anterior se ejecuta
siguiendo un proceso iterativo entre los puntos 3 y 6. Una vez obtenido un conocimiento significativo, éste ha
de ser explicado en una publicación, permitiendo a nuevos investigadores corroborar o refutar las conclusiones.

1.5. Bibliografı́a complementaria

La consulta de libros es necesaria para conocer diferentes enfoques y, desde luego, se hace imprescindible
para ampliar la colección de ejemplos y ejercicios, ya que la Estadı́stica es una disciplina eminentemente
práctica. A continuación se enumeran algunos de los textos en castellano más frecuentes en las bibliotecas
de las Facultades de Ciencias, con una pequeña descripción en relación a los contenidos cubiertos por este
libro:

Curso y ejercicios de estadı́stica, Quesada, Isidoro & Lopez, Alhambra 1988.


Cubre casi todos los temas. Buen formalismo matemático. Amplia colección de problemas.

Probabilidad y Estadı́stica, Walpole & Myers, McGraw-Hill 1992.


Muy bien explicado. Con multitud de ejemplos. Es más amplio. De carácter práctico. Válido para todos
los temas excepto el primero.

Probabilidad y Estadı́stica, Spiegel, McGraw-Hill 1991.


Con muchos problemas. La teorı́a se encuentra muy resumida. Vale para todos los temas excepto el
primero. Este tema se desarrola en otro libro de Spiegel: Estadı́stica (Teorı́a y Problemas).

Métodos Estadı́sticos, Viedma, Ediciones del Castillo 1990.


Muy sencillo. Cubre todos los temas, aunque algunos no de forma completa.

Estadı́stica Básica para Estudiantes de Ciencias Febrero 2009


Capı́tulo 2

Fundamentos de Estadı́stica
Descriptiva

“Se cometen muchos menos errores usando datos inadecuados que


cuando no se utilizan datos.”

Charles Babbage (1792-1871)

La aplicación del tratamiento estadı́stico tiene dos fases fundamentales:

1. Organización y análisis inicial de los datos recogidos.

2. Extracción de conclusiones válidas y toma de decisiones razonables a partir de ellos.

Los objetivos de la Estadı́stica Descriptiva son los que se abordan en la primera de estas fases. Es decir, su
misión es ordenar, describir y sintetizar la información recogida. En este proceso será necesario establecer
medidas cuantitativas que reduzcan a un número manejable de parámetros el conjunto (en general grande)
de datos obtenidos.
La realización de gráficas (visualización de los datos en diagramas) también forma parte de la Estadı́stica
Descriptiva dado que proporciona una manera visual directa de organizar la información.
La finalidad de la Estadı́stica Descriptiva no es, entonces, extraer conclusiones generales sobre el fenómeno
que ha producido los datos bajo estudio, sino solamente su descripción (de ahı́ el nombre).

2.1. Variables estadı́sticas

El concepto de variable estadı́stica es, sin duda, uno de los más importantes en Estadı́stica. Pero antes
de abordar su definición, es necesario introducir anteriormente diversos conceptos básicos.

2.1.1. Población y muestra


Se denomina población al conjunto completo de elementos, con alguna caracterı́stica común, que es el
objeto de nuestro estudio. Esta definición incluye, por ejemplo, a todos los sucesos en que podrı́a concretarse
un fenómeno o experimento cualesquiera. Una población puede ser finita o infinita.

11
12 Fundamentos de Estadı́stica Descriptiva

Ejemplo I–1 Los habitantes de un paı́s, los planetas del Sistema Solar, las estrellas en la Vı́a Láctea, son elementos de
una población finita. Sin embargo, el número de posibles medidas que se puedan hacer de la velocidad de
la luz, o de tiradas de un dado, forman poblaciones infinitas.

Cuando, aunque la población sea finita, su número de elementos es elevado, es necesario trabajar con solo
una parte de dicha población. A un subconjunto de elementos de la población se le conoce como muestra.
Ejemplo I–2 Si se quiere estudiar las propiedades de las estrellas en nuestra Galaxia, no tendremos la oportunidad
de observarlas todas; tendremos que conformarnos con una muestra representativa. Obviamente, elegir
de forma representativa los elementos de una muestra es algo muy importante. De hecho existe un grave
problema, conocido como efecto de selección, que puede condicionar el resultado de un estudio si uno no
realiza una selección correcta de los elementos que forman parte de una muestra.

Al número de elementos de la muestra se le llama tamaño de la muestra. Es fácil adelantar que para
que los resultados de nuestro estudio estadı́stico sean fiables es necesario que la muestra tenga un tamaño
mı́nimo. El caso particular de una muestra que incluye a todos los elementos de la población es conocido
como censo.

2.1.2. Caracteres cuantitativos o cualitativos


El objeto de nuestra medida pueden ser caracteres de tipos muy diversos. De ahı́ que normalmente se
clasifiquen en:

caracteres cuantitativos: aquellos que toman valores numéricos. Por ejemplo la altura o la velocidad
de un móvil.

caracteres cualitativos: también llamados atributos, son aquellos que no podemos representar numéri-
camente y describen cualidades. Por ejemplo, un color o el estado civil.

Aunque existen algunas diferencias, el tratamiento para ambos casos es similar, pudiéndose asignar, en
muchas ocasiones, valores numéricos a los diferentes caracteres cualitativos.

2.1.3. Variable estadı́stica


Se entiende por variable estadı́stica al sı́mbolo que representa al dato o carácter objeto de nuestro
estudio de los elementos de la muestra y que puede tomar un conjunto de valores. En el caso de que estemos
tratando con caracteres cuantitativos, la variables estadı́sticas pueden clasificarse en: discretas, cuando
solo pueden tomar una cantidad (finita o infinita) numerable de valores, y continuas, cuando pueden tomar
teóricamente infinitos valores entre dos valores dados. Es la diferencia básica que existe entre contar y medir.
Ejemplo I–3 El número de electrones de un átomo es una variable discreta. La velocidad o la altura de un móvil son
variables continuas.
Por otra parte, las variables se pueden asimismo clasificar en unidimensionales, cuando solo se mida
un carácter o dato de los elementos de la muestra, o bidimensionales, tridimensionales, y en general
n–dimensionales, cuando se estudien simultáneamente varios caracteres de cada elemento.
Ejemplo I–4 La temperatura o la presión atmosférica (por separado), son variables monodimensionales. La temperatura
y la presión atmosférica (estudiadas conjuntamente), o la longitud y el peso de una barra conductora, son
ejemplos de variables bidimensionales. La velocidad, carga eléctrica y masa de un ión es tridimensional.

Estadı́stica Básica para Estudiantes de Ciencias Febrero 2009