Está en la página 1de 60

CMI

CMIP-
– Centro
Centro de
de Metrologia
Metrologia ee Instrumentação
Inovação em Processos

Estadística Fundamental
Aplicada a los Análisis en
Laboratorios

Ing. MSc. Daniel Hamburg Piekar


Colombia, 7 Noviembre a 7 de Diciembre de 2011

© COPYRIGHT 2011 - Fundação CERTI 1


Estadística Fundamental

Objetivos Incerteza de Medição

Título do Slide
• Permitir el entendimiento de los conceptos fundamentales de
estadística, con la intención de sustentar el aprendizado de los
conceptos básicos de metrología y control de calidad.
• Crear las bases para el desenvolvimento de cálculos de
incertidumbre de medición y construcción de gráficos de control.

Contenidos
1. Estadística descriptiva
2. Probabilidad y distribuciones de probabilidad
3. Ajuste de curvas
4. Control estadístico de proceso
5. Análisis estadístico con Microsoft EXCEL

© COPYRIGHT 2011 - Fundação CERTI 2


Estadística Fundamental

1. Estadística descriptiva

• 1.1. Tratamiento de datos


• 1.2. Representación gráfica
• 1.3. Descriptores de posición y dispersión
• 1.4. Aplicaciones prácticas y ejercicio

© COPYRIGHT 2011 - Fundação CERTI 3


Estadística Fundamental

... Datos ... Datos ... Datos ... Datos ...

12,456 11,487 12,568 14,562 11,653 10,985


10,312 15,205 13,658 13,365 13,654 15,023
14,707 14,312 12,568 13,587 13,285 14,852
13,212 13,569 11,598 14,201 12,652 13,552
12,445 13,987 14,265 15,625 13,458 11,526
13,652 12,564 13,985 13,358 12,248 12,856
11,458 13,354 11,987 12,298 11,582 13,254
14,201 12,785 15,104 13,658 12,585 14,582
13,215 11,296 14,625 13,585 13,542 15,284
12,455 12,865 13,671 11,208 11,542 12,523
13,212 14,520 13,205 13,985 12,587 13,254

© COPYRIGHT 2011 - Fundação CERTI 4


Estadística Fundamental

Tipos de datos

Variables: •Obtenidas por medición de la característica de


calidad bajo estudio;
•La proximidad de dos valores sucesivos está
limitada sólo por la resolución del instrumento de
medición utilizado (idealmente son variables
continuas);
•Presentan alto contenido de información;
•La evaluación de conformidad con datos tipo
variables requiere comparar los valores obtenidos
con los límites de especificación.

Ejemplos:
masa, longitud, temperatura, fuerza, tensión,
corriente, volumen, caudal ...

© COPYRIGHT 2011 - Fundação CERTI 5


Estadística Fundamental

Atributos: •Describen el estado de características de calidad no


mensurables o de las cuales sólo importa el
cumplimiento o no de la especificación;
•Un atributo sólo puede presentar dos estados: bueno
o malo, conforme o no-conforme, está o no está,
aceptable o no-aceptable ...
•Una variable puede dar origen a un atributo una vez
que el dato ha sido comparado con la especificación
correspondiente;
•En control de calidad los atributos se procesan por
conteo, dando origen a variables discretas
(particularmente aquellas que sólo presentan valores
enteros);

Ejemplos de atributos puros:


Presencia de golpes en fruta, burbujas en un parabrisas
de auto, defectos en un recubrimiento cerámico ...

© COPYRIGHT 2011 - Fundação CERTI 6


Estadística Fundamental

Muestra y Población

Población o
Universo

Muestra

© COPYRIGHT 2011 - Fundação CERTI 7


Estadística Fundamental

Población (Universo): Muestra: Subconjunto de objetos


Colección bien definida de pertenecientes a la población bajo
objetos que se pretende estudio, seleccionados en forma
estudiar. predefinida.

Ejemplos: Ejemplos:
• Todos los cerámicos de un • Conjunto de baldosas cerámicas
cierto tipo producidos durante extraídas del proceso en grupos
un periodo definido; de 3 unidades cada 8h de
producción;
• El film de polietileno producido
en el mes de Marzo por una • Conjunto de los trozos de film de
determinada empresa o línea polietileno de 4 cm2 obtenidos
de producción; cada 4 h de producción en Marzo;
• El volumen total de petróleo • Muestras de petróleo 1 dm3
producido en un cierto obtenidas en cada pozo del
yacimiento; yacimiento una vez por semana;

© COPYRIGHT 2011 - Fundação CERTI 8


Estadística Fundamental

La ESTADISTICA es la ciencia que permite, a partir del


estudio de una o más muestras, conocer las propiedades
correspondientes de la población.
Todo valor calculado en base a la muestra se denomina
estadístico. Un estadístico siempre difiere en una magnitud
no conocida de su homólogo a nivel población, llamado
parámetro. Esta diferencia se denomina error de muestreo.
El valor máximo del error de muestreo puede estimarse con
ayuda de la estadística, siempre que la muestra obtenida sea
aleatoria.

Una muestra es aleatoria cuando, dado el valor de la propiedad


de interés en una o más unidades extraídas, no pueda predecirse
el valor de la propiedad en la próxima unidad a extraer.

© COPYRIGHT 2011 - Fundação CERTI 9


Estadística Fundamental

Recolección de datos:
Debe tener un propósito bien definido. Ejemplos:
• Inspección de la calidad, orientada a definir acciones sobre el producto
(inspección 100%, aceptación por muestreo, muestreo on-line);
• Inspección de la calidad, orientada a definir acciones sobre el proceso
(CEP);
• Recolección de datos para gestión preventiva de la calidad;
• Análisis de no-conformidades (causa-efecto) ...

Plan de (re)acción o de
contingencia
Son 5W1Hs!
Plan de muestreo What? Qué?
Who? Quién?
Where? Dónde?
When? Cuándo?
Why? Por qué?
How? Cómo?

© COPYRIGHT 2011 - Fundação CERTI 10


Estadística Fundamental

Hojas de verificación para la distribución del proceso:


•Se utilizan principalmente cuando se dispone de datos tipo variable;
•Permiten tener una primera idea sobre la dispersión y valor de concentración
del proceso.

Marcas
Desvío Frec
5 10 15 20
-9
LIE -8
-7
Ejemplo
-6
-5 1
-4 2
-3 4
-2 6
-1 9
83 0 11
1 8
2 7
3 3
4 2
5 Una cruz por cada 1
6 1
7
evento
LSE 8
9
Total 55

© COPYRIGHT 2011 - Fundação CERTI 11


Estadística Fundamental

Gráfico de puntos o “dotplot”


• La herramienta gráfica más sencilla para estudiar la distribución de los
datos: información sobre la localización de los datos, su dispersión,
valores extremos, etc.;
• Util cuando el conjunto de datos es razonablemente pequeño o
presenta pocos valores diferentes;
• Cada observación es representada con un punto encima del valor
correspondiente en una escala horizontal. Cuando un valor ocurre más
de una vez, se repite el punto, apilándolo en dirección vertical.
N º de
o c u r r e n c ia s

16
14
12
10
8
6
4
2

329,5
329,6
329,7
329,8
329,9
330,0
330,1
330,2
330,3
330,4
330,5
330,6
330,7
330,8

© COPYRIGHT 2011 - Fundação CERTI 12


Estadística Fundamental

Ejemplo:

Gráfico de puntos de las temperaturas medidas en los O´rings del


motor cohete del transbordador espacial, presuntos causantes de la
tragedia del Challenger en 1986 (resultados de ensayos posteriores, 36
determinaciones)
84 70 73 53 75
49 69 70 67 76
61 80 57 75 58
Temperaturas en ºC 40 58 63 61 31
83 68 70 70
67 60 78 81
45 67 52 76
66 72 67 79

Temperatura
30 40 50 60 70 80

© COPYRIGHT 2011 - Fundação CERTI 13


Estadística Fundamental

Histograma
• Permite visualizar la forma de la distribución de una variable a partir de
los valores obtenidos en una muestra de tamaño adecuado (generalmente,
no menor de 50 unidades);
• Se lo dibuja en forma distinta, según la variable bajo análisis sea discreta
o continua;
• Para datos de una variable discreta se lo suele denominar diagrama de
bastones o de barras;
• Para datos de variable continua, se lo conoce directamente con el nombre
de histograma;
• En todos los casos, un histograma se se obtiene graficando las frecuencias
absolutas o las frecuencias relativas:

 Frecuencia absoluta es el número de veces que ocurre un evento


determinado.
 Frecuencia relativa es el cociente entre la frecuencia absoluta y el
tamaño de la muestra (número de eventos posibles).

© COPYRIGHT 2011 - Fundação CERTI 14


Estadística Fundamental

Construcción de histograma
(variables continuas ):
Etapa 1:
Luego de recolectados los datos, identifique el valor máximo y el valor mínimo
obtenidos en la muestra. Calcule a continuación la diferencia entre ellos, denominada
amplitud o rango:

Rango = Valor máximo - Valor mínimo


Etapa 2:
Determine el intervalo de clase, de forma tal de obtener entre 5 y 20 clases de
igual ancho cuya suma sea ligeramente mayor a la amplitud de los datos calculada en
el punto anterior. Como ayuda, puede usarse la regla:

Número de clases = número de datos


Etapa 3:
Determine los límites de cada clase, de forma tal que el menor valor quede
incluido en la primera clase y el mayor valor en la última clase. Por regla general, los
limites de clase deben estar definidos con un decimal más que los datos (para evitar
que algunos datos caigan en los límites de clase, generando ambigüedades en la
clasificación).

© COPYRIGHT 2011 - Fundação CERTI 15


Estadística Fundamental

Etapa 4:
Clasifique los datos por comparación con los límites de clase obtenidos
en el punto anterior y calcule las frecuencias absolutas y relativas.
Construya la tabla de frecuencias.

Intervalo de valores Frecuencia absoluta Frecuencia relativa


de la variable

Contar las ocurrencias en el Dividir la frecuencia absoluta


intervalo. por el tamaño de la muestra

Etapa 5:
Dibuje el histograma de la misma forma que se hace para variables
discretas, pero trace los rectángulos de forma que se toquen entre sí.

© COPYRIGHT 2011 - Fundação CERTI 16


Estadística Fundamental

Ejemplo:
Resultados de 90 mediciones de pH en una solución:
7,510; 7,517; 7,522; 7,522; 7,510; 7,511; 7,519; 7,532; 7,543
7,525; 7,527; 7,536; 7,506; 7,541; 7,512; 7,515; 7,521; 7,536
7,529; 7,524; 7,529; 7,523; 7,523; 7,523; 7,519; 7,528; 7,543
7,538; 7,518; 7,534; 7,520; 7,514; 7,512; 7,534; 7,526; 7,530
7,532; 7,526; 7,523; 7,520; 7,535; 7,523; 7,526; 7,525; 7,532
7,522; 7,502; 7,530; 7,522; 7,514; 7,533; 7,510; 7,542; 7,524
7,530; 7,521; 7,522; 7,535; 7,540; 7,528; 7,525; 7,515; 7,520
7,519; 7,526; 7,527; 7,522; 7,542; 7,540; 7,528; 7,531; 7,545
7,524; 7,522; 7,520; 7,519; 7,519; 7,529; 7,522; 7,513; 7,518
7,527; 7,511; 7,519; 7,531; 7,527; 7,529; 7,528; 7,519; 7,521
Etapa 1
Valor máximo en la muestra= 7,545
Valor mínimo en la muestra= 7,502
Rango= 7,545-7,502=0,043
Etapa 2
número de clases = 90 = 9 . 48 ≅ 9 clases
rango 0 ,043
intervalo de clase = = ≅ 0 ,005
9 9

© COPYRIGHT 2011 - Fundação CERTI 17


Estadística Fundamental

Etapa 3
Límites de clase:
7 ,5005; 7,5055; 7,5105; 7,5155; 7,5205;
7,5255; 7,5305; 7,5355; 7,5405; 7,5455

Etapa 4
Tabla de frecuencias absolutas y relativas

Clase Intervalo Frecuencia Frecuencia


Nº de clase absoluta relativa

1 7,5005 - 7,5055 1 0,0111


2 7,5055 - 7,5105 4 0,0444
3 7,5105 - 7,5155 9 0,1000
4 7,5155 - 7,5205 14 0,1555
5 7,5205 - 7,5255 22 (Moda) 0,2444
6 7,5255 - 7,5305 19 0,2111
7 7,5305 - 7,5355 10 0,1111
8 7,5355 - 7,5405 5 0,0555
9 7,5405 - 7,5455 6 0,0666

© COPYRIGHT 2011 - Fundação CERTI 18


Estadística Fundamental

Etapa 5

Frecuencia Frecuencia
22 absoluta relativa 0,25
20
18 0,20
16
14 0,15
12
10
8 0,10
6
4 0,05
2
0 0
1 2 3 4 5 6 7 8 9

clases
Observación:
Para que el histograma cumpla adecuadamente el objetivo de poner en
evidencia la distribución de los datos, debe tener una adecuada relación de
aspecto. Se recomienda que la altura del rectángulo más alto sea de 0.5 a 2.0
veces la distancia entre los valores máximo y mínimo en el eje horizontal.

© COPYRIGHT 2011 - Fundação CERTI 19


Estadística Fundamental

Histogramas

simple acumulado

Frecuencia da clase (%)


Frecuencia acumulada (%)

Intervalo de clase

Punto medio de la clase

© COPYRIGHT 2011 - Fundação CERTI 20


Estadística Fundamental

Diagrama de Pareto
• La mayoría de las pérdidas de calidad se deben a algunos pocos tipos de
defecto, que pueden ser atribuidos a una pequeña cantidad de causas: se
los denomina los “pocos importantes” o “pocos vitales”.
• Fenómenos generalmente son influenciados por pocas causas dominantes
y muchas causas secundarias.

Influência
Causas
A B C D E F Outras

© COPYRIGHT 2011 - Fundação CERTI 21


Estadística Fundamental

Cómo construir un diagrama de Pareto:


Etapa 1: Definir el problema y el método de análisis
• Decidir qué problemas deben investigarse (Ej: unidades no-
conformes, pérdidas en valores monetarios, accidentes, etc.);
• Decidir cuáles datos serán necesarios y cómo clasificarlos (Ej:
por tipo de no-conformidad, ubicación, proceso, máquina,
operador, método, otros);
• Determinar el método de recolección de datos y el período
durante el cual se extiende la recolección.

Ejemplo:
Se desea identificar los pocos defectos vitales en elementos de
polipropileno inyectado. Se producen habitualmente los siguientes tipos
de defectos: fisuras, rayas, manchas, deformaciones, rayas profundas,
porosidad y otros. Se planifica analizar visualmente 1000 piezas
producidas en forma consecutiva.

© COPYRIGHT 2011 - Fundação CERTI 22


Estadística Fundamental

Etapa 2: Crear una hoja de registro de datos


La hoja de registro de datos puede crearse para el caso
específico o puede usarse el modelo de hoja de verificación
para no-conformidades / atributos múltiples (página RD-20)

Etapa 3: Obtener y registrar los datos


Completar la hoja de registro (hoja de verificación) creada en
la etapa 2 y calcular los totales por tipo de defecto y el gran
total.
N o - c o n f o r m id a d F r e c u e n c ia S u b -to ta l

F is u r a //// //// 1 0
R a ya //// //// //// ... //// // 4 2
M a n ch a //// / 6
D e f o r m a c ió n //// //// //// ... //// //// 1 0 4
R a y a p ro fu n d a //// 4
P o r o s id a d //// //// //// //// 2 0
O tro s //// //// //// 1 4

T o ta l 2 0 0

© COPYRIGHT 2011 - Fundação CERTI 23


Estadística Fundamental

Etapa 4: Calcular totales acumulados y porcentajes


Calcular totales acumulados y porcentajes, registrándolos en una tabla
de la siguiente forma:
• Ordene los tipos de defecto en orden decreciente de cantidad
(segunda columna);
• El item “otros” debe quedar siempre último, independientemente
de la cantidad asociada;
• Calcule la cantidad acumulada y los porcentajes que constan en las
dos últimas columnas de la tabla abajo.
No-conformidad Cantidad Total acumulado Porcentaje del total Porcentaje acumulado
defectos (%) (%)
Deformación 104 104 52 52
Raya 42 146 21 73
Porosidad 20 166 10 83
Fisura 10 176 5 88
Mancha 6 182 3 91
Raya profunda 4 186 2 93
Otros 14 200 7 100
Total 200 - 100 -

© COPYRIGHT 2011 - Fundação CERTI 24


Estadística Fundamental

Etapa 5: Construir el diagrama de Pareto

Diagrama de barras Curva acumulada

200 100
180 90
160 80
140 70
120 60
100 50
80 40
Porcentaje acumulada

60 30

Cantidad de defectuosos
40 20
20 10
0 0

Raya
Otros

Fisura
Mancha

Porosidad

Deformación
Raya profunda

© COPYRIGHT 2011 - Fundação CERTI 25


Estadística Fundamental

Descriptores cuantitativos

• Media de la muestra: 1 n x1 + x2 + x3 + .....+ xn


x = ∑ xi =
n i =1 n
• Mediana
– valor “del medio” de la distribución.
– Si x1, x2, x3, ..., xn son ordenados de forma creciente, entonces
la mediana corresponde al valor de la observação: 2
3
n +1
si n es impar 3
2 4
n n+2 5
media entre y si n es par
2 2 5
7
© COPYRIGHT 2011 - Fundação CERTI 26
Estadística Fundamental

Medidas numéricas de posición:


• Puede obtenerse una idea cualitativa de cuál es la posición del conjunto
de datos a partir del análisis del histograma o diagrama de barras.
• Las denominadas medidas de posición son la media, la mediana y los
cuartiles y percentiles. Estas medidas proveen una estimación
cuantitativa, más precisa y práctica para la toma de decisiones.
• La media y la mediana son conocidas también como medidas de tendencia
central, ya que indican sobre qué valor se concentran los datos.

Mínimo
Máximo Media
Cuartiles Mediana
Percentiles

Medidas de Medidas de tendencia


posición central

© COPYRIGHT 2011 - Fundação CERTI 27


Estadística Fundamental

Mínimo
Es el menor valor encontrado en la muestra
muestral min (x 1 , x 2 , ... x n )

min( x j ) ∀ j = 1 ... n

Máximo
Es el mayor valor encontrado en la muestra
muestral m ax (x 1 , x 2 , ... x n )

m ax ( x j ) ∀ j = 1 ... n

Media Es el promedio (media aritmética) de las n


muestral observaciones
X 1 + X 2 + ... + X n
x =
n
n
1
x = ⋅ ∑ x j
n j =1 sumatoria

• Es recomendable expresar la media con un decimal más que los datos;


• El valor de la media es fuertemente influenciado por la presencia de
“outliers”.

© COPYRIGHT 2011 - Fundação CERTI 28


Estadística Fundamental

Mediana La mediana divide la muestra en dos partes iguales. Es el


muestral valor central del conjunto de datos una vez ordenado en
forma creciente o decreciente.

Determinación de la mediana:

1) Ordenar el conjunto de datos de menor a mayor (o de mayor a menor);


2) Si el tamaño de la muestra (número de datos) es impar el valor de la
mediana corresponde al valor del elemento central del conjunto
ordenado:
⎛n + 1⎞
x~ = valor elemento ⎜ ⎟
⎝ 2 ⎠

3) Si el tamaño de la muestra es par, el valor de la mediana se obtiene


promediando los valores de los dos elementos centrales del conjunto
ordenado:
1 ⎡ ⎛n ⎞ ⎛n ⎞⎤
x~ = ⋅ ⎢ valor elemento ⎜ ⎟ + valor elemento ⎜ + 1 ⎟ ⎥
2 ⎣ ⎝2⎠ ⎝2 ⎠⎦

Nota: La mediana resiste el efecto de “outliers” mejor que la media.

© COPYRIGHT 2011 - Fundação CERTI 29


Estadística Fundamental

Ejemplo: Obtener media y mediana de los datos de pH utilizados en el


ejemplo de construcción de histograma.

1 n
Media: x = ⋅
∑x
n j =1 j
1
x = ⋅ (7,510 + 7,517 + ... + 7,521)
90
x = 7,5247

Mediana: A partir del conjunto de datos ordenado de menor a mayor


se calcula la mediana usando la fórmula para tamaño de
muestra par (n=90)
1 ⎡ ⎛n ⎞ ⎛n ⎞⎤
x~ = ⋅ ⎢valor elemento ⎜ ⎟ + valor elemento ⎜ + 1⎟⎥
2 ⎣ ⎝2⎠ ⎝2 ⎠ ⎦
1
x~ = ⋅ [valor elemento (45) + valor elemento (46)]
2
1
x~ = ⋅ [7,524 + 7,524]
2
~
x = 7,524

© COPYRIGHT 2011 - Fundação CERTI 30


Estadística Fundamental

Medidas numéricas de dispersión o variabilidad:


• Puede obtenerse una idea preliminar de la variabilidad de una
característica de calidad en una muestra a partir del análisis de un
diagrama de puntos o de un histograma.
• Las denominadas medidas numéricas de dispersión o variabilidad,
típicamente la amplitud o rango, el desvío estándar y el rango
intercuartílico, proveen una estimación cuantitativa, más precisa y
práctica para la toma de decisión.

Rango o amplitud de la Es la diferencia entre el valor máximo y el


muestra valor mínimo de las n observaciones

R = max (x j ) − min (x j ) ∀ j = 1 ...n

• El rango es la medida de dispersión de los datos más simple de calcular;


• Su principal problema es que sólo depende de los valores extremos,
despreciando la influencia de los restantes (n-2) valores;
• El rango es poco confiable en presencia de “outliers”.

© COPYRIGHT 2011 - Fundação CERTI 31


Estadística Fundamental

Desvío estándar Es una medida de dispersión o variabilidad que


de la muestra depende de la suma de las diferencias cuadradas
de los valores de la muestra respecto de la media
muestral.

x j − x = −1,.15
x k − x = 2.,85
xi = 6 x k = 10

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

x = 7.,15

© COPYRIGHT 2011 - Fundação CERTI 32


Estadística Fundamental

La expresión de cálculo del desvío estándar muestral es:

n 2
1 Suma de las
s = ⋅ ∑ x − x ( )
n − 1 j =1 j diferencias
cuadradas

La necesidad de trabajar con diferencias cuadradas proviene del hecho que


la suma de diferencias es igual a cero debido a la definición de la media
muestral:
n n
1
x = ⋅ ∑ xj ⇒ ∑ (x j − x )= 0
n j
=1 j=1

Por la misma razón se usa (n-1) en lugar de n como divisor al calcular el


desvío estándar. En términos generales, una vez que se conocen (n-1)
diferencias, el valor de la diferencia restante estará predeterminado.
Entonces, n diferencias proporcionan información redundante sobre la
variabilidad.

© COPYRIGHT 2011 - Fundação CERTI 33


Estadística Fundamental

Varianza de la La varianza es el desvío estándar elevado al


muestra: cuadrado.

n 2
2 1
s = ⋅ ∑ (x j − x )
n − 1 j =1

• La varianza está relacionada con la variabilidad de la muestra por ser


el cuadrado del desvío estándar;
• En rigor, no es una medida de la dispersión pues no está expresada en
la unidad en que se miden los datos (Ejemplo, datos en m, varianza de
los datos en m2).

Observación a medidas de dispersión:

Si bien el desvío estándar es una medida más representativa de


la variabilidad en la muestra, es considerablemente más difícil
de calcular que el rango.

© COPYRIGHT 2011 - Fundação CERTI 34


Estadística Fundamental

Ejemplo:

Obtener el rango, el desvío estándar y la varianza de los datos de


pH utilizados en el ejemplo de construcción de histograma
Rango:
R = max (x j ) − min (x j ) = 7,545 - 7,502 = 0,043

Desvío estándar:

n
1
s = ⋅ xj −x( )2
n −1 ∑j =1

1
s = ⋅ ⎡ x1 − x
( )2 + ... + (x 90 −x
⎢⎣
90 − 1
)2 ⎤⎥⎦
1
s = ⋅ (7 ,510 − 7 ,5247
[ )2 + ... + (7 ,521 − 7 ,5247 )2 ]
89
s = 0 ,00 89

© COPYRIGHT 2011 - Fundação CERTI 35


Estadística Fundamental

Varianza:
s 2 = 0 ,0089 2 = 0 ,00008

Marcando la media y el desvío estándar sobre el histograma construido


con los datos:
s s
x = 7 , 5247
Frecuencia Frecuencia
absoluta relativa
22 0,25
20
18 0,20
16
14 0,15
12
10
8 0,10
6
4 0,05
2
0 7,5155 0
7,5205
7,5255
7,5305
7,5355
7,5405

7,5105

7,5005
7,5055
7,5455

© COPYRIGHT 2011 - Fundação CERTI 36


Estadística Fundamental

Ejercicio 1: Estadística
Descriptiva

© COPYRIGHT 2011 - Fundação CERTI 37


Estadística Fundamental

2. Probabilidad y
distribuciones de probabilidad
• 2.1. Conceptos básicos
• 2.2. Función de distribución
• 2.3. Tipos de distribución de probabilidad
• 2.4. Distribución normal y análisis de normalidad
• 2.5. Población y muestra
• 2.6. Teorema del límite central
• 2.7. Correlación
• 2.8. Conceptos generales sobre Z-score, error normalizado y
ANOVA.

© COPYRIGHT 2011 - Fundação CERTI 38


Estadística Fundamental

Espacio muestral

• Conjunto de todos los valores posibles de un experimento


(todos los valores que la muestra puede asumir)
– ejemplos:
{ a, e, i, o, u }

– puede ser finito o infinito


– puede ser discreto o continuo

© COPYRIGHT 2011 - Fundação CERTI 39


Estadística Fundamental

Probabilidad

• Concepto clásico:
– “Si existen “n” posibilidades con las mismas chances de
ocurrir, de las cuales “s” son clasificadas como favorables
(o éxito), entonces la probabilidad de éxito es dada como
s/n”
– Ejemplo: la probabilidad de obtener un número par al jugarse
um dado honesto:

Espacio muestral: {1, 2, 3, 4, 5, 6} n=6

Eventos favorables: {2, 4, 6} s=3

Probabilidad = s/n = 3/6 = 0,5 = 50%


© COPYRIGHT 2011 - Fundação CERTI 40
Estadística Fundamental

Variables aleatorias
• Son funciones definidas sobre los elementos de un espacio
muestral.
– ej: suma de dos dados, cotación del Dólar, precipitación diaria de
lluvia en una ciudad, límite de resistencia de una pieza, etc.
• Pueden ser
– discretas
– continuas
• Convención:
– variables aleatorias: X, Y, ... (letras mayúsculas)
– valores posibles de las variables aleatorias: x, y, ... (minúsculas)

© COPYRIGHT 2011 - Fundação CERTI 41


Estadística Fundamental

Variables aleatorias discretas


• La función que atribuye probabilidad a cada valor
posible de una variable aleatoria discreta es
denominada distribución de probabilidad.
f(x) = P(X = x)
• ejemplo:
– dado honesto: f(x) = 1/6, para x=1, 2, 3, 4, 5 ou 6
– ¿cómo seria f(x) para la suma de dos dados?
• Propiedades:
f ( x) ≥ 0 ∑ f ( x) = 1
todosX

© COPYRIGHT 2011 - Fundação CERTI 42


Estadística Fundamental

Función de distribución (acumulada)


• La función de distribución acumulada de una variable aleatoria X
asocia a cada valor posible de X la probabilidad de ese valor ser
menor o igual a x. Se denota F(x) = P(X ≤ x)
• ejemplo:

f(x) F(x)
0,50 1,00

0,25 0,50
x x
1 2 3 4 5 1 2 3 4 5
© COPYRIGHT 2011 - Fundação CERTI 43
Estadística Fundamental

Media y varianza de uma distribución


calculada a partir de su distribución de
probabilidad
• Media (o valor esperado)

μ= ∑ x. f ( x) = E( x)
todosx

• Varianza
2 2
σ = ∑(x − μ) . f (x)
todosx

© COPYRIGHT 2011 - Fundação CERTI 44


Estadística Fundamental

Variables aleatorias continuas


– Asumen valores reales
f(x)
f(x) = función densidad
de probabilidad
x
P( X = x) = 0
a b

b
P(a ≤ X ≤ b) = ∫ f ( x) dx
a

© COPYRIGHT 2011 - Fundação CERTI 45


Estadística Fundamental

Variables aleatorias continuas


– Propiedades:
f(x)

f ( x) ≥ 0, ∀x

∞ x
∫ f (x)dx =1 a b
−∞

P(a ≤ X ≤ b) = P(a < X ≤ b) = P(a ≤ X < b) = P(a < X < b)

© COPYRIGHT 2011 - Fundação CERTI 46


Estadística Fundamental

Función probabilidad acumulada


– La función probabilidad acumulada de una variable aleatoria X
asocia a cada valor posible de X la probabilidad de ese valor ser
menor o igual a x. Se denota F(x)
f(x)
x
F ( x) = P( X ≤ x) = ∫ f (α )dα
−∞
x
d F ( x) a b
= f ( x)
dx F(x)
1,00

F(b)

F(a) x
P(a ≤ X ≤ b) = F (b) − F (a) a b

© COPYRIGHT 2011 - Fundação CERTI 47


Estadística Fundamental

Media y varianza de una VA continua

• Media (o valor esperado)



μ = ∫ x f ( x)dx = E( x)
−∞

• Varianza
∞ ∞
σ 2 = ∫ ( x − μ)2 f ( x) dx = ∫ x2 f ( x) dx − μ 2
−∞ −∞

© COPYRIGHT 2011 - Fundação CERTI 48


Estadística Fundamental

Distribución de probabilidad uniforme o


rectangular

probabilidad
1.2

0.8

1/6 0.6

Probabilidade (1/6) 0.4

0.2

0
1 2 3 4 5 6 0 1 2 3 4 5 6 7
Valores
Lanzamiento de un dado

© COPYRIGHT 2011 - Fundação CERTI 49


Estadística Fundamental

Distribución de probabilidad triangular

probabilidad (1/36)

2 3 4 5 6 7 8 9 10 11 12
Suma de dos dados

© COPYRIGHT 2011 - Fundação CERTI 50


Estadística Fundamental

Lanzamiento de un dado

1.2

0.8

0.6

0.4

Probabilidade (1/6)
0.2

0
0 1 2 3 4 5 6 7
Valores

© COPYRIGHT 2011 - Fundação CERTI 51


Estadística Fundamental

Media de dos dados

P rob a b ilid ade (1/36)


1

0
0 1 2 3 4 5 6 7
M édi a d e 2 d ado s

© COPYRIGHT 2011 - Fundação CERTI 52


Estadística Fundamental

Media de tres dados

30

25

20

15

10

P r o bab ilid ade (1/2 16)


0
0 1 2 3 4 5 6 7
M édi a d e 3 d ado s

© COPYRIGHT 2011 - Fundação CERTI 53


Estadística Fundamental

Media de cuatro dados

16 0
14 0
12 0
10 0

80
60
40

P ro bab ilid a d e (1 /12 96)


20
0
0 1 2 3 4 5 6 7
M édi a d e 4 d ado s

© COPYRIGHT 2011 - Fundação CERTI 54


Estadística Fundamental

Media de seis dados

500 0
450 0
400 0
350 0
300 0
250 0
200 0
150 0
100 0

P ro ba bili dad e ( 1/ 466 56)


50 0
0
0 1 2 3 4 5 6 7
M édi a d e 6 d ado s

© COPYRIGHT 2011 - Fundação CERTI 55


Estadística Fundamental

Média de ocho dados

160000
140000
120000
100000
80000
60000
40000
20000

Probabilidade (1/1679616)
0
0 1 2 3 4 5 6 7
Média de 8 dados

© COPYRIGHT 2011 - Fundação CERTI 56


Estadística Fundamental

Curva normal

puntos de inflexión
σ = desvio estándar

μ = media

asíntota σ σ asíntota
μ
© COPYRIGHT 2011 - Fundação CERTI 57
Estadística Fundamental

Distribución normal (o gaussiana)

• Observada en el siglo XVIII: “curva normal de errores”


−( x − μ ) 2
1 2σ 2
f ( x) = e − ∞ < x < +∞
2π σ
f(x) Punto de
inflexión

μ-σ μ μ+σ

© COPYRIGHT 2011 - Fundação CERTI 58


Estadística Fundamental

Distribución normal (o gaussiana)


Función probabilidad acumulada:
x −(α −μ )2
1 2σ 2
F ( x) = ∫e dα
2π σ −∞

No pude ser integrada de forma explícita.


Es calculada numericamente y tabulada.
Problema:
para cada valor de μ y σ seria necesario una tabla
diferente!
Solución:  distribución normal estándar

© COPYRIGHT 2011 - Fundação CERTI 59


Estadística Fundamental

variable distribución μ=3


f(x)
σ=2

X
0 3
f(y) μ=0
σ=2
Y = X −3
0 3

f(z) μ=0
σ=1
X −3
Z=
2
0 3
© COPYRIGHT 2011 - Fundação CERTI 60

También podría gustarte