Está en la página 1de 73

MAESTRAENINGENIERAVIAL MAESTRA EN INGENIERA VIAL

ESTADSTICA APLICADA
Ing. Paul Idrobo Dvalos, Mba
ESTADSTICADESCRIPTIVA ESTADSTICA DESCRIPTIVA
CONCEPTOSGENERALES CONCEPTOS GENERALES
Tendencia central.- La tendencia central se refiere
al punto medio de una distribucin. Las medidas de
tendencia central se conocen tambin como medidas tendencia central se conocen tambin como medidas
de posicin.
Dispersin.- La dispersin se refiere a la extensin p p
de los datos en una distribucin, es decir, el grado en
que las observaciones se distribuyen.
Variable Es algo que va cambiando en el Variable.- Es algo que va cambiando en el
transcurso de un problema.
y = a + bx variable (x) , constante (a) y ( ) , ( )
MEDIDASESTADSTICAS MEDIDAS ESTADSTICAS
MEDIDAS DE TENDECIA CENTRAL
media aritmtica (x), el valor medio.
mediana el valor central mediana, el valor central.
moda, el valor ms frecuente.
MEDIDAS DE DISPERSIN
l d d ( ) Rango, amplitud o recorrido (R)
Desviacin estndar ( poblacional; S muestral).
Varianza ( , S)
Desviacin media (DM).
Coeficiente de Variacin (C. V.)
MEDIAARITMTICA MEDIA ARITMTICA
La media aritmtica de n valores, es igual a la suma de todos
ellos dividida entre n. Tenemos:
d b d d l
n
X
X

=
Si se cuenta con una distribucin de datos entonces se aplica
la frmula:
n
X f
X


=
MODA MODA
Es aquel valor de mayor frecuencia, la moda puede ser
no nica e inclusive no existir.
MEDIANA MEDIANA
Es una medida comn de tendencia central. Es el valor medio en
un conjunto de valores ordenados, es el punto abajo y arriba del
cual cae un nmero igual de observaciones. Nos indica donde
est la mitad est la mitad.
Datos no agrupados:
Si N I h t i t l l t i Si N es Impar, hay un trmino central, el trmino que
ser el valor de la mediana.
Si N es Par, hay dos trminos centrales, la mediana
ser la media de esos dos valores ser la media de esos dos valores.
MEDIANA MEDIANA
Datos agrupados:
MEDIDASDE POSICIN MEDIDAS DE POSICIN
0% 50% 100%
MEDIANA
0% 25% 50% 75% 100%
CUARTILES
0% 20% 40% 60% 80% 100%
QUINTILES
DECILES
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
PERCENTILES
0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% 90% 95% 100%
RANGO RANGO
Es la diferencia entre el dato mayor y el dato menor.
R= X mx. X mn.
DESVIACINMEDIA DESVIACIN MEDIA
Se conoce tambin como promedio de desviacin. Para una serie
de N valores se puede calcular a travs de la siguiente expresin:
x x
DM


=
N
DM=
VARIANZA
El depsito de una medida de variabilidad es cuantificar el grado de variacin entre el
conjunto de valores de una distribucin. La varianza de la variacin se define como la
suma de las desviaciones al cuadrado dividido entre el nmero total de
observaciones. Es el cuadrado de la desviacin estndar.
Datos no agrupados Datos agrupados
( ) x x
2

( ) x x F
2

Poblacin
( )
N
x x
2


=
( )
N
x x F
2


=
M t
( ) x x
2


=
2
S
( ) x x F
2


=
2
S
Muestra
1 - n
S
1 - n
S
DESVIACINESTNDAR DESVIACIN ESTNDAR
La desviacin estndar o desviacin tipo se define como la raz cuadrada de los
cuadrados de las desviaciones de los valores de la variable respecto a su media cuadrados de las desviaciones de los valores de la variable respecto a su media.
Datos no agrupados Datos agrupados
( ) F
2

Poblacin ( )
N
x x
2


=
( )
N
x x F
2


=
Muestra
N
( ) x x
2


= S
( ) x x F
2


= S
Muestra
1 - n

= S
1 - n

= S
COEFICIENTE DE VARIACIN COEFICIENTE DE VARIACIN
Es la relacin que existe entre la desviacin estndar y
la media aritmtica, expresada en trminos de
porcentaje y se expresa: porcentaje y se expresa:
S
100
X
S
CV =
X
COEFICIENTE DE ASIMETRA COEFICIENTE DE ASIMETRA
El concepto de asimetra se refiere a si la curva que
forman los valores de la serie presenta la misma
forma a izquierda y derecha de un valor central forma a izquierda y derecha de un valor central
(media aritmtica).
Para medir el nivel de asimetra se utiliza el
Coeficiente de Asimetra de Fisher, cuya frmula
es:
COEFICIENTE DE ASIMETRA COEFICIENTE DE ASIMETRA
g1 = 0
Distribucin Simtrica: Cuando la mediana, la moda y
la media aritmtica coinciden
Di t ib i A i t i P iti C d l
g1 > 0
Distribucin Asimtrica Positiva: Cuando las
frecuencias descienden ms lentamente por la derecha
de la media que por la izquierda.
i ib i i i i C d l
g1 < 0
Distribucin Asimtrica Negativa: Cuando las
frecuencias descienden ms lentamente por la izquierda
de la media que por la derecha.
CURTOSIS CURTOSIS
El Coeficiente de Curtosis analiza el grado de
concentracin que presentan los valores alrededor de
la zona central de la distribucin la zona central de la distribucin.
Para medir la curtosis se utiliza la siguiente frmula:
CURTOSIS CURTOSIS
g2 = 0
Distribucin mesocrtica: Presenta un grado de concentracin
medio alrededor de los valores centrales de la variable (el mismo que
presenta una distribucin normal).
g2 > 0
Distribucin leptocrtica: Presenta un elevado grado de
concentracin alrededor de los valores centrales de la variable.
g2 < 0
Distribucin platicrtica: Presenta un reducido grado de
concentracin alrededor de los valores centrales de la variable
g
concentracin alrededor de los valores centrales de la variable.
DISTRIBUCIONES DISTRIBUCIONES
TIPOSDE DISTRIBUCIONES TIPOS DE DISTRIBUCIONES
VARIABLES DISTRIBUCIN VARIABLES DISTRIBUCIN
Binomial o Bernoulli
Discretas
(conteos)
Poisson
Hipergeomtrica Hipergeomtrica
Normal, z o Gauss
(30 o ms elementos)
Continuas
(mediciones)
(30 o ms elementos)
Student o t
(menos de 30 elementos) (menos de 30 elementos)
DISTRIBUCINBINOMIAL DISTRIBUCIN BINOMIAL
Se tiene una distribucin binomial cuando un experimento
aleatorio tiene las siguientes caractersticas:
En cada prueba del experimento slo son posibles dos En cada prueba del experimento slo son posibles dos
resultados: xito o fracaso.
El resultado obtenido en cada prueba es independiente de los
resultados obtenidos anteriormente. resultados obtenidos anteriormente.
La probabilidad de que el suceso ocurra es constante, la
representamos por p, y no vara de una prueba a otra. La
probabilidad de que el proceso no ocurra es 1- p y la probabilidad de que el proceso no ocurra es 1 p y la
representamos por q.
El experimento consta de un nmero n de pruebas.
FUNCIONDE PROBABILIDADDE LA FUNCION DE PROBABILIDAD DE LA
DISTRIBUCIN BINOMIAL
r n r
q p
n
P

=
!
q p
r n r
P

=
)! ( !
Donde:
p = probabilidad de tener xito
q = probabilidad de tener fracaso (1 - p)
r = nmero de xitos deseados (r < n) r nmero de xitos deseados (r n)
n = nmero de intentos hechos
DISTRIBUCINDE POISSON DISTRIBUCIN DE POISSON
Expresa la probabilidad de un nmero de eventos
ocurriendo en un tiempo fijo si estos eventos ocurren
con una tasa media conocida y son independientes con una tasa media conocida, y son independientes
del tiempo desde el ltimo evento.
FUNCINDE PROBABILIDAD DE LA FUNCIN DE PROBABILIDAD DE LA
DISTRIBUCIN DE POISSON
) (
e
x P
x

=
!
) (
x
= el nmero medio de presentaciones por un intervalo de tiempo
e = base logartmica natural = 2.718281 g
x = nmero de presentaciones
DISTRIBUCINHIPERGEOMTRICA DISTRIBUCIN HI PERGEOMTRI CA
Los experimentos que tienen este tipo de distribucin tienen
las siguientes caractersticas:
Al realizar un experimento con este tipo de distribucin, se
esperan dos tipos de resultados.
Las probabilidades asociadas a cada uno de los resultados
no son constantes.
Cada ensayo o repeticin del experimento no es Cada ensayo o repeticin del experimento no es
independiente de los dems.
El nmero de repeticiones del experimento (n) es
constante constante.
FUNCINDE PROBABILIDADDE LA FUNCIN DE PROBABILIDAD DE LA
DI STRI BUCI N HI PERGEOMTRI CA
x N
r n
x
r
C C
r x P
) (
) (
) (

=
N
n
C
r x P ) , ( =
N = nmero de elementos de la poblacin
n = nmero de elementos de la muestra
x = nmero de xitos en la poblacin
r = nmero de xitos en la muestra
DISTRIBUCINNORMAL DISTRIBUCIN NORMAL
2
2
2
1
) (
z
e z f

=
2
CARACTERSTICASDE LA CARACTERSTICAS DE LA
DISTRIBUCIN NORMAL
La curva tiene un solo pico, por tanto es unimodal (una
sola moda), tiene la forma de una campana. sola moda), tiene la forma de una campana.
La media de una poblacin distribuida normalmente cae
en el centro de la curva.
P i t i l di l d t bi l Por ser simtrica la mediana y la moda tambin cae en el
centro de la curva, es decir que la media, la mediana y la
moda tienen el mismo valor.
Los dos extremos de la distribucin normal se extiende
indefinidamente y nunca tocan el eje horizontal.
NORMALIZACIN NORMALIZACIN
El valor normalizado z representa la cantidad de
desviaciones estndar que el valor de la variable x se
l j d l di El i d i di i l l j i t aleja de la media. El signo de z indica si el alejamiento
se produce a la derecha (+) o a la izquierda (-) de la
media.
x x

x x
z

=
CASOSFRECUENTES CASOS FRECUENTES
CASOSFRECUENTES CASOS FRECUENTES
CASOSFRECUENTES CASOS FRECUENTES
NIVEL DE CONFIANZA NIVEL DE CONFIANZA
CARACTERSTICASDE LA CARACTERSTICAS DE LA
DISTRIBUCIN DE STUDENT
Se utiliza para cuando existen menos de 30
elementos.
E i t di t ib i i l d d d Existe una distribucin para nivel de grados de
libertad.
El nivel de significancia es complementario al de El nivel de significancia es complementario al de
confianza.
Se puede tener un anlisis considerando una o dos
l l di ib i colas en la distribucin.
CARACTERSITCASDE LA CARACTERSITCAS DE LA
DISTRIBUCIN T
Al igual que la distribucin Z, es una distribucin continua
La distribucin t tiene una media de cero, es simtrica respecto de la media y
se extiende de - a + .
L i d t > 2 C d l d d lib t d ( )

La varianza de t es para > 2. Cuando los grados de libertad (v) son


suficientemente grandes la varianza de la distribucin t tiende a 1.
Tiene forma acampanada y simtrica.
No hay una distribucin t, sino una "familia" de distribuciones t. todas con la
2
y ,
misma media cero, pero con su respectiva desviacin estndar diferente de
acuerdo con el tamao de la muestra n.
La distribucin t es ms ancha y ms plana en el centro que la distribucin
normal estndar como resultado de ello se tiene una mayor variabilidad en las normal estndar como resultado de ello se tiene una mayor variabilidad en las
medias de muestra calculadas a partir de muestras ms pequeas. Sin
embargo, a medida que aumenta el tamao de la muestra, la distribucin t se
aproxima a la distribucin normal estndar.
DISTRIBUCINDE STUDENT (T) DISTRIBUCIN DE STUDENT (T)
: Nivel de significancia (una cola)
Grados de libertad: nmero de datos nmero de variables
MUESTREO MUESTREO
TAMAODE UNAMUESTRA TAMAO DE UNA MUESTRA
POBLACI ONES I NFI NI TAS POBLACI ONES FI NI TAS FORMULAS
( )
2 2
2
2 2
1) (N e
N z
n
+
=
2
z
n

=
DESVIACIN
ESTNDAR
CONOCIDA
( )
2 2
z 1) (N e x +
e x

CONOCIDA
1) (N
pqN z
n
2 2
2
+
=
PROPORCIONES
2
z
pq n

=
pq z 1) (N e
2 2
+
e
pq

TAMAODE UNAMUESTRA TAMAO DE UNA MUESTRA


En donde:
z nmero de desviaciones estndar alrededor de la z = nmero de desviaciones estndar alrededor de la
media para determinar el intervalo de confianza
= desviacin estndar
e = error de estimacin
p = proporcin de la muestra a favor
i d l q = proporcin de la muestra en contra
MTODOSDE MUESTREO MTODOS DE MUESTREO
Probabilsticos:
Aleatorio simple
Sistemtico
Estratificado
Po Conglome ados Por Conglomerados
No probabilsticos:
Accidental Accidental
Por cuotas
Intencionado
NMEROSALEATORIOS NMEROS ALEATORIOS
Son nmeros que deben de cumplir los requisitos de
espacio equiprobable, es decir, que todo elemento
tenga la misma probabilidad de ser elegido y que la tenga la misma probabilidad de ser elegido y que la
eleccin de uno no dependa de la eleccin del otro.
Tienen las siguientes caractersticas:
Uniformemente distribuidos.
E d i i d di Estadsticamente independientes.
Su media debe ser estadsticamente igual a 1/2.
Su varianza debe ser estadsticamente igual a 1/12 Su varianza debe ser estadsticamente igual a 1/12.
DIAGRAMASDE CONTROL DIAGRAMAS DE CONTROL
TIPOSDE DIAGRAMAS TIPOS DE DIAGRAMAS
Control de variables (continuas)
Diagrama de medias
Diagrama de amplitudes
Cont ol de at ib tos (disc etas) Control de atributos (discretas)
Diagrama p
Diagrama c Diagrama c
DIAGRAMADE MEDIAS(1)
= X
DIAGRAMA DE MEDIAS (1)

n
x
x

=
n

=
x
n n
x
z + = x superior control de Lmite
i f i l d i
x
z = x inferior control de Lmite
Donde: Donde:
media de las medias de la muestra
d l di d l
= X
Z = nmero de las medias de la muestra
error estndar; desviacin estndar de las medias de la muestra.
=
X

DIAGRAMADE MEDIAS(2) DIAGRAMA DE MEDIAS (2)

R
n
R

=
R
n
R A superior control de Lmite + = x R A superior control de Lmite
2
+ = x
R A x inferior control de Lmite
2
=
di d di F t A
medio Rango : R
medias de diagrama para Factor : A
2
DIAGRAMADE AMPLITUDES DIAGRAMA DE AMPLITUDES
R D inferior control de Lmite
3
=
R D superior control de Lmite
4
=
amplitudes de diagrama para Factores : D y D
medio Rango : R
4 3
a p tudes de d ag a a pa a acto es y
4 3
DIAGRAMAP DIAGRAMA P
d f t id d


m n
s defectuosa unidades
p
_

=

n
p


=
_ _
p 1 p

n
p
z + =
_
p superior control de Lmite
p
p p
p
z =
_
p inferior control de Lmite
En donde: En donde:
media de la fraccin defectuosa en la muestra
desviacin estndar de la distribucin de las muestras
= p
=
p

p
n = tamao de la muestra
m = nmero de muestras
DIAGRAMAC DIAGRAMA C
d
s encontrado defectos de nmero
c

=
muestras de nmero
c z c superior control de Lmite + =
c z c inferior control de Lmite =
INTERPRETACIN INTERPRETACIN
Fuera de los lmites de control
INTERPRETACIN INTERPRETACIN
Racha: cuando los puntos ocurren continuamente en un lado
de la lnea central Se considera anormal: de la lnea central. Se considera anormal:
Una longitud de 7 puntos.
Al menos 10 de 11 puntos consecutivos ocurren en un
i l d d l l t l mismo lado de la lnea central.
Al menos 12 de 14 puntos consecutivos ocurren en un
mismo lado de la lnea central.
Al menos 16 de 20 puntos consecutivos ocurren en un
mismo lado de la lnea central.
INTERPRETACIN INTERPRETACIN
Tendencia: cuando los puntos forman una curva
ti d t d d t continua ascendente o descendente.
INTERPRETACIN INTERPRETACIN
Acercamiento a los lmites de control: Teniendo
t l t l l it 3 en cuenta los puntos que se acercan a los lmites 3
sigma, si 2 de 3 puntos ocurren por fuera de las
lneas de 2 sigma, el caso es anormal. g ,
INTERPRETACIN INTERPRETACIN
Acercamiento a la lnea central: cuando la
d l t t d t d l l d mayora de los puntos estn dentro de las lneas de
1.5 sigma, esto se debe a una forma inapropiada de
hacer los subgrupos. g p
INTERPRETACIN INTERPRETACIN
Periodicidad: es anormal que la curva muestre
tid t t d i d t repetidamente una tendencia ascendente y
descendente para casi el mismo intervalo.
CAPACIDADDE PROCESOS CAPACIDAD DE PROCESOS
CAPACIDADDE PROCESO CAPACIDAD DE PROCESO
Si el proceso est en control estadstico, solo se
presenta la variacin natural. No obstante, es posible
que el proceso no pueda satisfacer an las que el proceso no pueda satisfacer an las
especificaciones objetivo.
La capacidad de proceso, en un proceso que est en
control estadstico, equivale al rango de variacin
aleatoria por ejemplo seis variaciones estndar del aleatoria, por ejemplo, seis variaciones estndar del
valor promedio.
NDICE DE CAPACIDAD NDICE DE CAPACIDAD
En donde:
C
p
, C
pk
= ndice de capacidad
LST = lmite superior de tolerancia
LIT = lmite inferior de tolerancia LIT = lmite inferior de tolerancia

x
= error estndar
= media del proceso
Si C
p
o C
pk
1 el proceso es capaz
Si C C <1 l Si C
p
o C
pk
<1 el proceso no es capaz
CORRELACIN
ENTRE VARIABLES
CHI CUADRADO CHI CUADRADO
( ) E O
2
( )

=
E
E - O
X
2
X
2
Coeficiente chi cuadrado
O Frecuencia observada
E F i d E Frecuencia esperada
COEFICIENTESDE CORRELACIN COEFICIENTES DE CORRELACIN
Primera
Variable
Segunda Variable
Dicotmica Ordinal Intervalo
Dicotmica
Coeficiente Phi
Correlacin biserial
por rangos
Correlacin punto
biserial
Correlacin por
Ordinal
Correlacin biserial
por rangos
Correlacin por
rangos de
Spearman
Correlacin por
rangos de
Spearman
Intervalo
Correlacin punto
biserial
Correlacin por
rangos de
Spearman
Correlacin de
Pearson
INTESIDADDE LACORRELACIN INTESIDAD DE LA CORRELACIN
VALOR SIGNIFICADO
1 00 P f l i di 1.00 Perfecta correlacin directa
0.80 0.99 Correlacin directa muy fuerte
0.60 0.79 Fuerte correlacin directa 0 60 0 9 ue te co e ac d ecta
0.40 0.59 Moderada correlacin directa
0.20 0.39 Dbil correlacin directa

-0.19 0.19
Probablemente no hay correlacin, salvo que el
nmero de casos sea elevado
-0.20 -0.39 Dbil correlacin inversa
-0.40 -0.59 Moderada correlacin inversa
-0.60 -0.79 Fuerte correlacin inversa
0 80 0 99 Co elacin in e sa m f e te -0.80 -0.99 Correlacin inversa muy fuerte
-1.00 Perfecta correlacin inversa
COEFICIENTE PHI COEFICIENTE PHI
a b a+b=y
d a - c b
=
a b a+b=y
c d c+d=z
z y x w
a+c=w b+d=x
CORRELACINPUNTOBISERIAL CORRELACIN PUNTO BISERIAL
) (
1) - N(N
n n

) x x (
B A B A

=
pb
r
X
A
Promedio del grupo A en la variable intervalar
X
B
Promedio del grupo B en la variable intervalar
Desviacin estndar de los puntajes en la variable intervalar
n
A
Nmero de casos en el grupo A
n
B
Nmero de casos en el grupo B
N Nmero total de casos (n
A
+n
B
)
CORRELACINBISERIAL POR CORRELACIN BISERIAL POR
RANGOS
) R R (
n
2
0 1
=
br
r
n
n Nmero total de casos ordenados por rangos
R
1
Rango medio de aquellos incluidos en la categora 1

R
1
en la medida dicotmica
R
0
Rango medio de aquellos incluidos en la categora 0
en la medida dicotmica
CORRELACINPOR RANGOSDE CORRELACIN POR RANGOS DE
SPEARMAN
d 6
2

) 1 n(n
d 6
1
2

=

s
r
d
La diferencia entro los rangos obtenidos en la variable X y
la variable Y
d
2
La suma de todas las desviaciones previamente elevadas
al cuadrado
n Nmero de casos
CORRELACINDE PEARSON CORRELACIN DE PEARSON
( ) [ ] ( ) [ ]

=
2
2
2
2
y x - xy N
r
( ) [ ] ( ) [ ]

2
2
2
2
y y N x x N
N Nmero de parejas de datos
Y Datos de la variable dependiente Y Datos de la variable dependiente
X Datos de la variable independiente
REGRESIONES REGRESIONES
REGRESIONES REGRESIONES
Se define a la regresin como una relacin funcional
entre dos o ms variables correlacionadas y se usa para
pronosticar una variable con base en la otra pronosticar una variable con base en la otra.
Existen varios tipos de regresiones, siendo la ms Existen varios tipos de regresiones, siendo la ms
comn la regresin lineal en donde la relacin entre las
variables forma una lnea recta.
REGRESINLINEAL REGRESIN LINEAL
Bx A y + =

n
x B - y
A

=
( )

=
2
2
x x n
y x - xy n
B
n
( )

x x n
TIPOSDE REGRESIONES TIPOS DE REGRESIONES
TIPO FORMA VARIABLES
Lineal y = A + Bx x y
Logartmica y= A + B ln x ln x y
Exponencial y = A e
Bx
x ln y
De Potencia y = Ax
B
ln x ln y
TIPOSDE REGRESIONES TIPOS DE REGRESIONES
LI NEAL LOGARI TMI CA
300
400
500
600
15
20
25
30
0
100
200
1 11 21 31 41 51 61 71 81 91 101
0
5
10
1 11 21 31 41 51 61 71 81 91 101
6E+86
7E+86
8E+86
EXPONENCI AL
10000
12000
DE POTENCIA
0
1E+86
2E+86
3E+86
4E+86
5E+86
6E+86
0
2000
4000
6000
8000
1 11 21 31 41 51 61 71 81 91 101 1 11 21 31 41 51 61 71 81 91 101
ERROR TPICO ERROR TPICO
Es la medida de dispersin alrededor de la recta o plano de
regresin, segn sea el caso.
Su frmula es:
( )

Y Y ( )
1

=

m n
Y Y
S
xy
En donde:
: Valores estimados a partir de la regresin Y

: Valores estimados a partir de la regresin


n: nmero de datos
m: nmero de variables independientes
REGRESINMLTIPLE REGRESIN MLTI PLE
Este tipo se presenta cuando dos o ms variables
independientes influyen sobre una variable
dependiente dependiente.
La forma general de una regresin mltiple es: La forma general de una regresin mltiple es:
n n
x b x b x b a y + + + + = ...
2 2 1 1 n n
y
2 2 1 1

También podría gustarte