Está en la página 1de 16

Estadı́stica y Probabilidades

Definición de Estadı́stica

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Las medidas de posición sono conocidas en general


cuantiles y se pueden clasificar en grupos: Cuartiles,
Deciles, Percentiles.
Cuartiles: son los tres valores de la variable de una
distribución que la dividen en cuatro partes iguales,
es decir, al 25 %, 50 % y 75 %. Se representan por
Q1: Cuartil1; Q2:Cuartil2:mediana; Q3:Cuartil3

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Los Deciles: Corresponden a los 9 valores que divi-


den a estos en 10 partes iguales es decir, al 10 %,
al 20 %... y al 90 %. Los Deciles se designan por
D1 , D2 , ..., D9
Los Percentiles: Son los noventa y nueve valores
de la variable de una distribución que la dividen en
cien partes iguales es decir, al 1 %, al 2 %... y al
99 % de los datos. Los percentiles se designan por
P1 , P2 , ...P99

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de Posición

Q1 = P25 ; D3 = P30
D7 = P70 ; Q2 = P50 = M e

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Diagrama de cajas

El diagrama de caja y bigotes (boxplot) es una re-


presentación gráfica de un conjunto de datos que fa-
cilita la percepción visual de la posición, extensión y
del grado y la dirección del sesgo. También permi-
te identificar los datos atı́picos. Es especialmente útil
cuando se desean comparar dos o más conjuntos de
datos.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Diagrama de cajas

Atı́pico → b
Máx(x)|x ≤ Ls

Ls = Q3 + RIC · 1,5

Q3 (75 %)
6
Mediana RIC = Q3 − Q1
(50 % de datos)
Q1 (25 %) ?
Li = Q1 − RIC · 1,5
Mı́n(x)|x ≥ Li

RIC: Rango Intercuartil

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Son números que miden el grado de separación de


los datos con respecto a un valor central, que ge-
neralmente es la media aritmética que generalmente
permiten verificar si determinadas medidas son sigi-
nificativas o no. Entre los principales tenemos Rango,
Varianza, Desviación Estándar y Coeficiente de Va-
riación.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Rango: La diferencia entre el mayor y menor valor del


conjunto de datos. Su valor no puede ser negativo, la
desventaja es que no describe la variabilidad
La varianza y la desviación estándar: Son me-
didas de dispersión muy importantes, la desviación
estándar indica como están dispersos los datos res-
pecto de su media aritmética, el cual también es la
raı́z cuadrada positiva de la varianza.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Medidas de dispersión

Hay dos tipos de varianza:


Varianza poblacional que se representa (σ 2 )
Varianza muestral se representa (S 2 )
En ambos casos el valor de la varianza no sera la
misma para un mismo conjunto de datos, ademas la
raı́z cuadrada de cada una de ellas se llama desviación
estándar poblacional y muestral respectivamente.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Ejemplo

Edades
23 26
24 25
19 33
25 26
24 25
27 20
25 26
32 20
24 29 La mayor parte de los datos está a una distancia
19 30 igual a dos desviaciones estandar respecto a la
media.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Propiedad de Chebyshev

Para un conjunto de datos no importando cual sea


la forma de la distribución la proporción de ellos que
cae en el intervalo:
[µ − 2σ; µ + 2σ]
hay por lo menos el 75 % de los datos.
[µ − 3σ; µ + 3σ]
hay por lo menos el 89 % de los datos.

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Coeficiente de Variación

Es una medida de dispersión relativa, que se define


como la desviación estándar dividido por la media
aritmética.
desviacion
CV = · 100 %
|x|
Buena dispersión si es menor a 10 %
Normal dispersión de 10 % a menos de 25 %
Regular dispersión de 25 % a menos de 50 %
Mala dispersión de 50 % a mas

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Asimetrı́a

Si sk =0 la distribución es simétrica
Si sk es positivo la distribución es sesgada a la dere-
cha
Si sk es negativo la distribución es sesgada a la iz-
quierda

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Curtosis

Esta medida determina el grado de concentración que


presentan los valores en la región central de la distri-
bución. El exceso de curtosis puede alcanzar valores
de -2 a infinito positivo.
Si K=0 la distribución es mesocurtica
Si K es positivo la distribución es leptocurtica
Si K es negativo la distribución es platicurtica

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
curtosis

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel
Ejemplo

Edades
23 26
24 25
19 33
25 26
24 25
27 20
25 26
32 20 La distribución es: .........................
24 29 .....................................................
19 30 .....................................................

Universidad Antonio Ruiz de Montoya M.Sc. Ing. López Esquivel Miguel Ángel

También podría gustarte