Está en la página 1de 15

28/09/2020

APLICACIÓN DE LA
ESTADÍSTICA DESCRIPTIVA A
LA METROLOGÍA (I).

Estadística Descriptiva (Revisión)


Estadística Descriptiva, temas:
•Tipos de datos, presentación de los datos: tablas, gráficos.
•Síntesis de los datos: medidas de posición y de dispersión.

Concepto de variable aleatoria:


• Típica observación experimental, resultado de un
experimento. Características que pueden tomar valores
distintos de una unidad a otra.
•Toda función que toma distintos valores numéricos,
dependiente de los resultados de un fenómeno aleatorio,
con distintas probabilidades.

1
28/09/2020

Un ejemplo:

Contenido de Biotina en harina de trigo (en mg/kg):


Posibles casos a medir:
• Determinaciones repetitivas de una misma muestra.

•Determinación en dos muestras de lotes distintos.

•Determinación en la misma muestra en dos momentos


diferentes.

Variaciones de los valores medidos:


 Instrumento
 Analista
 Muestra
 Ruido

Tipos de variables:

CUANTITATIVAS:
•Continuas: cualquier valor dentro de un intervalo
•Discretas: cantidades que se pueden contar.

CATEGÓRICAS:
•Ordinales: grados (severo, moderado, leve )
•Nominales: no ordenados (sexo, colores, grupo
sanguíneo)

El tipo de variable determina el método de medida y el


test estadístico a utilizar.

2
28/09/2020

Concepto de Población:

Conjunto de elementos acotados en el tiempo y en un


espacio determinado, con alguna característica común
medible.

•Incluye todo el conjunto de unidades muestrales.

•Puede ser: Finita (n unidades) o Infinita

¿Qué es un Parámetro?

Propiedad o característica de interés. No varía!!!.

Por ejemplo:μ= media poblacional !No se puede


medir!

3
28/09/2020

Concepto de muestra:

Parte de la población bajo estudio.

Tamaño muestral = n

Estadístico muestral : característica que se mide.

Ejemplo: <x> = media muestral o promedio.

Presentación de los datos

Tablas De distribución de Frecuencias:

Ejemplo: Distribución del grupo sanguíneo en 500 alumnos


varones de una Universidad.

Solamente existen 4 grupos sanguíneos, es decir que la


distribución estará dentro de cuatro clases definidas
separadas (discretas, no continuas):
Grupo Frecuencia Frecuencia Porcentaje
sanguíneo Absoluta (FA) Relativa (FR) (%)
A 150 0.30 30
B 75 0.15 15
AB 25 0.05 5
O 250 0.50 50
Total 500 1.00 100

4
28/09/2020

60

Frecuencia (%)
50
50

40

30
30

20
15
10
5
0
A B AB O

Clases

Pero si tengo un conjunto de datos no definidos


¿cómo trabajo el histograma?
Ejemplo: Datos sobre la cantidad exacta de azúcar contenido
en paquetes de 250 gramos. (120 unidades muestreadas y
medidas).

5
28/09/2020

Paso 1: Preparación de los datos


Los datos deben ser objetivos, exactos, completos y
representativos.

Paso 2: Determinar los valores extremos de los datos y


el recorrido
Identificar en la tabla de datos originales el valor máximo, el
valor mínimo y el recorrido (R = Vmax - Vmin).
Recorrido total = máximo – mínimo = 258 g = 15 g.

Paso 3: Definir las "clases" que contendrá el Histograma


Clases: Son los intervalos en que se divide la característica
sobre la que se han tomado los datos. El número de clases es
igual al de barras del histograma.

Numero recomendado de clases en un histograma:

6
28/09/2020

En el ejemplo de los paquetes de azúcar hay 120 datos, necesitamos


entonces aproximadamente 8 clases para el histograma.

Amplitud aproximada de cada clase 15 g / 8 =1.875 g.

Amplitud elegida como conveniente en este caso: 2 g.

Paso 4: Construir las clases anotando los límites de cada una de ellas.

Los límites de la primera clase incluirán el valor mínimo de los datos.

Para evitar que algunos datos coincidan con los límites de los intervalos,
definir éstos de forma que tengan una cifra más detrás de la coma.

Si, por ejemplo, los datos tienen dos cifras detrás de la coma (3,55; 3,83;
3,64; 3,73; 3,78, etc), se definirán las clases hasta la tercera cifra detrás de la
coma (3,545-3,555; 3,555-3,565, etc).

Si se obtiene una clase más o menos respecto del número recomendado,


debido al redondeo posteriormente efectuado, no existe deterioro ni en la
sencillez ni en la información.

Como el valor menor en nuestros datos es 243 g.,


empezaremos el primer intervalo en 242.5 g y construiremos
ocho clases con 2 g de amplitud:

Paso 5: Calcular la frecuencia de clase


Determinar el número de datos que están incluidos en cada
una de las clases (frecuencia de clase). Se puede hacer
manual o con Excel o con la técnica de los palitos.

7
28/09/2020

Técnica de los palitos:

Paso 6 y 7: Rotular los ejes y dibujar el histograma

El eje vertical representa las frecuencias, por tanto en él se rotularán


números naturales, dependiendo su valor y escala del número de
datos que se han tomado.

El eje horizontal representa la magnitud de la característica medida por


los datos. Este eje se divide en tantos segmentos iguales como clases
se hayan definido.

Rotular los límites de los intervalos de clase.

Rotular el eje con la característica representada y las unidades de


medida
Empleadas y dibujar las barras verticales correspondientes a cada
clase.

Se puede realizar con Excel con gráficas del barra.

8
28/09/2020

Paso 8: Rotular el Gráfico

Cuando proceda, poner el título, las condiciones en que se han


recogido los datos, los límites de tolerancia nominales, etc.
Estas notas ayudan a los demás a interpretar el gráfico y sirven de
recordatorio de la fuente de los datos.
Frecuencia (absoluta)

Contenido de azúcar

INTERPRETACIÓN DEL HISTOGRAMA

Uno de los propósitos del análisis o interpretación de un Histograma es


identificar y clasificar la pauta de variación del conjunto de datos
estudiado (valor medio, recorrido, forma) y elaborar una explicación
admisible y relevante para dicha pauta, que relacione la variación con
el proceso o fenómeno en estudio.

El resultado de este análisis es una teoría sobre el funcionamiento


del proceso (de medición) o sobre la causa del problema que se está
investigando.

Por ser una teoría es necesario confirmarla o rechazarla, recogiendo


otros datos que nos den información más específica sobre dicha teoría.

9
28/09/2020

Forma típicas de variación:


a. Distribución en forma de campana
Forma simétrica con un pico en la mitad del recorrido de los datos.

Es la distribución natural, habitual para, los datos de gran cantidad de


procesos. Por esta circunstancia se llama Distribución Normal.

La desviación respecto a esta forma puede indicar la existencia de


problemas o influencias externas al proceso.

La forma de campana no asegura, por sí misma y sin analizar su valor


medio y el recorrido de los datos, que el proceso funcione de forma
satisfactoria.

Distribución
en campana

b. Distribución con doble campana o con doble pico


Un marcado valle en el centro de la distribución con picos a ambos
lados.
Esta forma, generalmente, es la combinación de dos
distribuciones y sugiere la presencia de dos procesos distintos.
Deberán ensayarse varios esquemas de estratificación para
identificar y separar los distintos procesos.

Distribución con
doble campana

10
28/09/2020

c. Distribución plana
Una gran parte plana, sin ningún pico y con dos ligeras colas a los lados.
Esta forma puede ser el resultado de varias distribuciones en campana con
sus centros distribuidos uniformemente a lo largo del recorrido de los
datos.

Se deberán identificar los diferentes procesos que intervienen dentro del


proceso básico. (Cada uno mide a su manera por ejemplo).

Distribución plana

d. Distribución en peine
Valores altos y bajos se alternan de forma regular. Esta pauta de variación
es típica de errores de medición, errores en la forma de agrupar los datos
para la construcción del Histograma o sesgos sistemáticos de redondeo.
En este caso se debe revisar inicialmente los procesos de recogida de
datos y construcción del Histograma.

Distribución en peine

11
28/09/2020

e. Distribución con un pico aislado


Como en el caso de la distribución de dos picos, esta forma sugiere
existencia de dos procesos distintos.
El proceso con el pico pequeño será una anormalidad o deficiencia que
sucede a menudo o regularmente.
Estos picos unidos a distribuciones sesgadas o truncadas indican
falta de eficacia en la eliminación de elementos defectuosos.

Distribución con pico aislado


en el extremo

f. Distribución con un pico en el extremo


Un pico situado en un extremo de una distribución regular.
Esta forma se presenta cuando la cola de una distribución regular se ha
cortado y acumulado en una sola categoría en el extremo del recorrido de
los datos. Suele indicar un registro poco cuidadoso o sesgado de los
datos.

Distribución con pico en extremo

12
28/09/2020

g. Distribución sesgada o truncada


Su forma es asimétrica, con un pico descentrado dentro del recorrido de
los datos, las colas descienden: bruscamente en un lado y suavemente
en el otro.
Esta distribución es típica de procesos con límites prácticos a un lado del
valor nominal o a datos parciales de un proceso (distribuciones con
parte de los datos suprimidos).

Distribución sesgada Distribución truncada

Principales Medidas de Posición en un


gráfico

a. Moda: Valor más frecuente. Puede haber más de una. Tiene


sentido definirla cuando hay muchos datos y están agrupados
en intervalos de clase.

b. Mediana: Deja tantas observaciones por encima como por


debajo de ella. Puede o no pertenecer a la muestra. Es el
valor central (cuando hay cantidad impar de datos) o el
promedio de los dos valores centrales (cuando hay cantidad
impar de datos).

c. Media: (Promedio): Promedio de los valores


¿Cómo se calcula cuando se tienen datos discretos en una
tabla de frecuencias?

Por medio de una media o promedio ponderado:

13
28/09/2020

¿Qué significa la media ponderada o promedio ponderado?


Se le da peso diferente a los distintos valores:

<x> = [f1.x1 +f2.x2 +..........+ fn.xn ]/ (f1+f2 +............+ fn)

El peso en ese caso es la frecuencia (f).

Variaciones del Histograma:

A veces es más útil representar las frecuencias


acumuladas. Estos gráficos pueden ser de dos tipos:
donde en el eje de las ordenadas se acumulan las
frecuencias relativos o porcentuales (FRA), o en los
cuales se acumulan las frecuencias absolutas (FAA).

Ejemplo:

Gráficos Resultantes de la Distribución de la Masa


Corporal (MC es el valor de la mitad de la clase) en
kg, de una muestra de 500 alumnos varones de una
Universidad:

14
28/09/2020

Ejercicio: La siguiente tabla muestra las frecuencias de niveles de


colesterol en sangre de una población de 1067 pacientes:

Estime: la moda, el valor aproximado de la mediana, la media


ponderada.
¿Qué porcentaje de individuos tiene valores superiores a 275 mg/dL?
Construir los gráficos de FA vs MC y FRA vs MC en Excel.

15

También podría gustarte