Está en la página 1de 15

Tratamiento estadístico

de datos experimentales
2
F1008
Terminología
La frecuencia absoluta de un dato es la cantidad de veces que se repite ese
dato en el listado.
La frecuencia relativa es el número de veces que aparece un dato entre el
número total de datos.
Las medidas de tendencia central (moda, media, mediana) es un número
ubicado hacia el centro de la distribución de valores de las mediciones.
Moda

• La moda es el dato más repetido del listado de datos, es decir, el dato con la
frecuencia absoluta más alta.
• Si hay dos modas, es decir, dos datos con la misma frecuencia absoluta,
entonces se dice que es una distribución bimodal.
• Si hay más de dos modas, entonces será una distribución multimodal.
• Si todos los datos tienen la misma frecuencia, entonces no hay moda.
Mediana

• Es el valor de la variable (dato) que deja debajo de sí la mitad de los datos,


una vez que éstos están ordenados de menor a mayor.
• En el caso de un número impar de datos, es el dato con la misma cantidad
de datos arriba y debajo de ese valor.
• En el caso de un número par de datos, la convención es tomar el promedio
de los dos datos centrales del listado.
#Alumno Calificación

Ejemplo 1
2
9
8
3 8
4 7
La tabla de la derecha muestra las calificaciones de los 5 5
estudiantes de un grupo. Encuentre 6 10
7 8
a) La moda 8 9
9 6
b) La mediana 10 10
11 7
c) La media
12 9
13 9
14 6
15 9
16 8
17 10
18 7
19 8
20 9
Histogramas y distribuciones

Como se ha visto, en muchos


experimentos se requiere la realización
de numerosas medidas. Una forma de
mostrar éstos datos es a través de
histogramas.
Pasos para hacer un histograma
1. En el sistema coordenado se colocan los valores de las mediciones en las abscisas y las frecuencias
(cantidad de veces que se repite un dato) relativas en las ordenadas.
2. Se divide el conjunto de mediciones en una colección de intervalos de tal manera que cada medición
esté en un intervalo. Cada intervalo se llama intervalo de clase o clase.
3. Para seleccionar los intervalos de clase se realiza lo siguiente:
a. Se calcula la cantidad y se redondea el número entero superior. Este será el número de intervalos de
clase.
b. Se encuentre el rango R (diferencia entre el valor máximo y mínimo de los datos).
c. Se divide R entre el número de intervalos para calcular el ancho de cada intervalo.
4. En caso de que un dato caiga en el límite de un algún intervalo, utilizaremos la convención de
intervalos cerrados a izquierda y abiertos a derecha.
5. Se construye una tabla que muestre para cada
intervalo el número de valores que cae en ese
intervalo (frecuencia absoluta), y la frecuencia
relativa será .
6. Se construye un gráfico asignando a cada
intervalo un rectángulo cuya altura es la
frecuencia relativa.
Histograma de frecuencia y frecuencia relativa:
Ejemplo
Se han realizado una serie de mediciones de la resistencia a la tensión del
acero laminado. Utilice el listado de datos para:
a) Encuentre la mediana y la moda de los datos.
b) Genere una tabla de frecuencias de los datos.
c) Haga un histograma de frecuencias absolutas y uno de frecuencias
relativas.
d) Calcule la media, la varianza, la desviación estándar y el error estándar de
la media para los datos.
Actividad
Experimento medición indirecta de la aceleración de la gravedad
Generalizando algunos conceptos
Como se vio anteriormente, al graficar un
histograma de frecuencias para un
determinado número de mediciones se
puede apreciar la variación de las
mediciones alrededor de la media.
Si se incremente el número de datos
medidos se puede incrementar también el
número de intervalos de clase.
Entre más datos tengamos más suave será el
polígono de frecuencias para la distribución.
En el límite cuando el número de datos se va a
infinito terminaríamos con la curva mostrada. Para
muchas mediciones los errores aleatorios generan
una distribución “normal” en la mediciones, es
decir, una curva en forma de campana como en la
figura de la derecha.

Como se mencionó en la clase anterior, el


histograma de frecuencias relativas indica el
porcentaje de datos que caen en cada intervalo de
clase y en ese sentido nos indica la probabilidad de
que una medición caiga en ese intervalo.
Dicho lo anterior, el área bajo la curva de la distribución de frecuencias relativas indica la
probabilidad de que un dato caiga en esa región.
El total del área bajo la curva de distribución es igual a 1.
También, como ya hemos definido, la desviación estándar para esos datos indica qué tan dispersos
están los datos alrededor de la media.
Si calculamos el área bajo la curva de distribución (que es igual a la
probabilidad de que un dato caiga en esa región) a una distancia igual a a
ambos lados de la media, obtenemos 0.6826, es decir, hay un 68.26% de
probabilidad de que un dato caiga en esa región de la distribución.

También podría gustarte