Está en la página 1de 47

Estadística I

Capítulo 3

Medidas Numéricas Descriptivas

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc. Chap 3-1


Definiciones
n  Tendencia central, es la medida que describe
cómo todos los valores de los datos se agrupan
en torno a un valor central.

n  Variación, es la cantidad de disgregación o


dispersión de los valores con respecto a un
valor central.

n  Forma, es el patrón de distribución de los


valores desde el menor hasta el mayor.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-2
Medidas de Tendencia Central: La
Media

n  La media aritmética (por lo general llamada la


media) es la medida más común de la
tendencia central.
Media de la muestra
El i-ésimo valor de X
n

!X i
X1 + X 2 + ! + Xn
X= i=1
=
n n
Tamaño de Valores
la muestra observados
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-3
Medidas de Tendencia Central: La
Media
n  La medida mas común de tendencia central.
n  Media = suma de los valores dividida entre el número
de valores.
n  Se ve afectada por los valores extremos. (Valores
atípicos).

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Media = 3 Media = 4
1 + 2 + 3 + 4 + 5 15 1 + 2 + 3 + 4 + 10 20
= =3 = =4
5 5 5 5

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-4


Medidas de Tendencia Central: La
Mediana

n  La mediana es el valor medio de un conjunto de


datos ordenado de menor a mayor. (50%
mayores, 50% menores)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mediana = 3 Mediana = 3

n  No se ve afectada por los valores extremos.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-5


Medidas de Tendencia Central:
Localizando la Mediana

n  La localización de la mediana cuando los valores están en orden


numérico de menor a mayor:

n +1
Posición Mediana = posición en los datos ordenados
2
n  Si el número de datos es impar, la mediana es el valor de en
medio.
n  Si el número es par, la mediana es el promedio de los valores
centrales.

n +1
Notar que no es el valor de la mediana, solo es la posición
2
de la mediana en el conjunto de datos ordenados.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-6


Medidas de Tendencia Central: La
Moda

n  Es el valor más frecuente


n  No es afectada por valores extremos
n  Es utilizada para datos numéricos y categóricos
n  Puede no existir la moda
n  Pueden existir varias modas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

No hay Moda
Moda = 9
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-7
Medidas de Tendencia Central:
Ejemplo

Precios de Casas: §  Media: ($3,000,000/5)


$2,000,000 = $600,000
$500,000
$300,000
§  Mediana: valor medio de los datos
$100,000 ordenados
$100,000 = $300,000
Suma $3,000,000 §  Moda: valor mas frecuente
= $100,000

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-8


Medidas de Tendencia Central:
Qué medida escoger?

§  La media es generalmente usada, a menos que


valores extremos (atípicos) existan.
§  La mediana es a menudo usada, ya que no se ve
afectada por los valores extremos.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-9


Cuartiles
n  Los cuartiles dividen los datos ordenados en 4
segmentos con igual número de valores por
segmento.
25% 25% 25% 25%

Q1 Q2 Q3

n  El primer cuartil, Q1, es el valor para el cual el 25% de los


datos son menores y 75% son mayores.
n  Q2 es el mismo que la mediana (50% de los datos son
menores y 50% son mayores)
n  Solamente 25% de los datos son mayores que el tercer
cuartil Q3

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-10


Localizando Cuartiles

Posición del 1er Cuartil: Q1 = (n+1)/4

Posición del 2do Cuartil: Q2 = (n+1)/2

Posición del 3er Cuartil: Q3 = 3(n+1)/4

donde n es el número de datos observados

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-11


Reglas para Calcular Cuartiles

n  Si el resultado es un número entero, entonces el


cuartil es igual al valor clasificado.

n  Si el resultado es una fracción de mitad (2.5, 4.5, 7.5


etc.), entonces el cuartil es igual al promedio de los
valores clasificados correspondientes..

n  Si el resultado no es un número entero ni una


fracción de mitad, se redondea al entero más
cercano y se selecciona ese valor clasificado.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-12


Localizando Cuartiles
Datos de la muestra ordenados: 11 12 13 16 16 17 18 21 22

(n = 9)
Q1 está en posición (9+1)/4 = 2.5 de los datos
ordenados, por lo tanto usar el valor medio entre el
segundo y el tercer dato:
Q1 = 12.5

Q1 y Q3 no son medidas de localización central


Q2 = mediana, es la medida de tendencia central
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-13
Calculando Cuartiles
Datos ordenados: 11 12 13 16 16 17 18 21 22

(n = 9)
Q1 está en la (9+1)/4 = 2.5 posición,
por lo que Q1 = (12+13)/2 = 12.5

Q2 está en la (9+1)/2 = 5ta posición,


por lo que Q2 = mediana = 16

Q3 está en la 3(9+1)/4 = 7.5 posición,


por lo que Q3 = (18+21)/2 = 19.5
Q1 y Q3 no son medidas de localización central
Q2 = mediana, es la medida de tendencia central
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-14
Medidas de Variación
Variación

Rango Varianza Desviación Coeficiente


Estándar de Variación

n  Las medidas de variación


dan información sobre la
dispersión o variabilidad
de los datos.

Mismo centro,
diferente variación
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-15
Medidas de Variación: El
Rango

§  El rango es la medida numérica descriptiva más sencilla de la


variación en un conjunto de datos.
§  El rango es igual al valor mayor menos el valor menor.

Rango = Xmayor – Xmenor

Ejemplo:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Rango = 13 - 1 = 12

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-16


Porqué el Rango no es confiable?

§  Ignora la manera en que los datos están distribuidos.

7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5

§  Es sensible a valores atípicos.


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Rango = 5 - 1 = 4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-17


Medidas de Variación: La
Varianza
n  Es el promedio aproximado de las desviaciones
al cuadrado de los datos con respecto a la
media.
n
2
n  Varianza muestral:
2
! (X " X)i
S = i=1
n -1
X = media
n = tamaño de la muestra
Xi = i-ésimo valor de la variable X
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-18
Medidas de Variación: La
desviación Estándar

n  Es la medida de variación mas utilizada.


n  Muestra la variación respecto a la media.
n  Es la raíz cuadrada de la varianza.
n  Tiene las mismas unidades de los datos.
Desviación Estándar n
2
de la muestra:
! (X " X)
i
S= i=1
n -1

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-19


Medidas de Variación: La
Desviación Estándar

Pasos para calcular la desviación estándar:

1. Calcule la diferencia entre cada valor y la media.


2. Eleve al cuadrado cada diferencia.
3. Sume todas las diferencias al cuadrado.
4. Divida esta suma por (n-1) para obtener la varianza
de la muestra.
5. Obtenga la raíz cuadrada de la varianza para
obtener la desviación estándar.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-20


Cálculo de la Desviación Estándar

Datos (Xi) : 10 12 14 15 17 18 18 24

n=8 Media = X = 16

(10 ! X)2 + (12 ! X)2 + (14 ! X)2 +!+ (24 ! X)2


S=
n !1

(10 !16)2 + (12 !16)2 + (14 !16)2 +!+ (24 !16)2


=
8 !1

130
Una medida de la
= = 4.3095 dispersión promedio
7
respecto a la media.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-21
Comparando Desviaciones
Estándar

Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 3.338

Datos B Media = 15.5


11 12 13 14 15 16 17 18 19 20 S = 0.926
21

Datos C Media = 15.5


S = 4.570
11 12 13 14 15 16 17 18 19 20 21

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-22


Comparando Desviaciones
Estándar

Menor desviación estándar

Mayor desviación estándar

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-23


Medidas de Variación:
Resumen de Características
§  Entre mas dispersos están los datos, mayor será el
rango, la varianza y la desviación estándar.

§  Entre mas concentrados están los datos, menor será


el rango, la varianza y la desviación estándar.

§  Si los valores son todos iguales (no hay variación),


todas estas medidas serían cero..

§  Ninguna de estas medidas es negativa.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-24


Medidas de Variación: El
Coeficiente de Variación
n  Mide la variación relativa.
n  Siempre se expresa como porcentaje (%)
n  Muestra la variación respecto a la media.
n  Puede ser usado para mostrar la variabilidad de
dos o mas conjuntos de datos de diferentes
unidades.

'S$
CV = %% "" ! 100%
&X#
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-25
Comparando Coeficientes de
Variación
n  Inventario A:
n  Precio promedio en el último año = $50

n  Desviación estándar = $5

'S$ $5
CVA = %% "" ! 100% = ! 100% = 10%
&X# $50 Ambos
inventarios
n  Inventario B: tienen la misma
n  Precio promedio en el último año = $100 desv. estándar,
pero el
n  Desviación estándar = $5 inventario B es
menos variable
'S$ $5 respecto a su
CVB = % " ! 100% =
% " ! 100% = 5% precio.
&X# $100
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-26
Localizando Valores Atípicos:
Puntuaciones Z
§  Para determinar la puntuación Z de un dato, restar la
media y dividir entre la desviación estándar.

§  La puntuación Z es el número de desviaciones


estándar a las que se encuentra un valor de la media.

§  Un dato se considera un valor atípico si su


puntuación Z es menor que -3.0 o mayor que +3.0.

§  Entre mas grande es el valor absoluto de la


puntuación Z, mas lejos está el dato de la media.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-27


Localizando Valores Atípicos:
Puntuaciones Z

X!X
Z=
S

X representa el dato
X es la media de la muestra
S es la desviación estándar de la muestra

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-28


Localizando Valores Atípicos:
Puntuaciones Z

§  Suponga que la media de los resultados de un


examen de matemáticas del SAT es 490, con una
desviación estándar de 100.
§  Determine la puntuación Z para un resultado de 620.
X ! X 620 ! 490 130
Z= = = = 1.3
S 100 100

Un resultado de 620 está 1.3 desviaciones estándar por


encima de la media y no se consideraría un valor
atípico.
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-29
Forma de una Distribución

n  Describe como los datos están distribuidos.


n  Medidas de la forma
n  Simétrica o Asimétrica (con sesgo)

Sesgo Izquierdo Simétrica Sesgo Derecho


Media < Mediana Media = Mediana Media > Mediana

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-30


Medidas Numéricas Descriptivas de
para Población: La Media (µ)
n  La media poblacional es la suma de los valores
en la población divididos por el tamaño de la
población, N.
N

!X
i=1
i
X1 + X 2 + ! + XN
µ= =
N N
Donde: µ = media poblacional
N = tamaño de la población
Xi = i-ésimo valor de la variable X
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-31
Medidas Numéricas Descriptivas
para una Población: La Varianza σ2

n  Promedio de las desviaciones estándar al


cuadrado de los valores respecto a la media.
N

n  Varianza Poblacional: "(X ! µ ) i


2

2 i=1
! =
N

Donde µ = media poblacional


N = tamaño de la población
Xi = i-ésimo valor de la variable X
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-32
Medidas Numéricas Descriptivas para una
Población: La Desviación Estándar σ

n  Es la medida de variación mas utilizada.


n  Muestra la variación respecto a la media.
n  Es la raíz cuadrada de la varianza poblacional.
n  Tiene las mismas unidades que los datos.
Desviación Estándar Poblacional:
N

"(X ! µ )
i
2

i=1
!=
N

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-33


Estadísticos de la muestra vs.
Parámetros de la Población

Medida Parámetro Estadístico


Poblacional Muestral
Media
µ X
Varianza
!2 S2
Desviación
! S
Estándar

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-34


La Regla Empírica

n  La regla empírica aproxima la variación de los


datos con una distribucion en forma de campana.
n  Aproximadamente el 68% de los valores se
encuentran a una distancia de ±1 desviación
estándar de la media.

68%

ì
µ ±1!
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-35
La Regla Empírica
n  Aproximadamente el 95% de los valores se encuentran
a una distancia de ±2 desviaciones estándar de la
media.
n  Aproximadamente el 99.7% se encuentran a una
distancia de ±3 desviaciones estándar de la media.

95% 99.7%

µ ± 2! µ ± 3!
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-36
Usando la Regla Empírica
§  Suponga que la distribución de los resultados de
Matemáticas de un examen SAT tiene forma de
campana con una media de 500 y una desviación
estándar de 90. Por lo que,
§  68% de los resultados están entre 410 y 590 (500 ± 90).

§  95% de los resultados están entre 320 y 680 (500 ± 180).

§  99.7% de los resultados están entre 230 y 770 (500 ± 270).

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-37


Regla de Chebyshev

n  Independientemente de como estén


distribuidos los datos, por lo menos (1 - 1/k2) x
100% de los valores caerán dentro de k
desviaciones estándar de la media (para k > 1)
n  Ejemplos:
Por lo menos Dentro de

(1 - 1/22) x 100% = 75% …........ k=2 (µ ± 2σ)


(1 - 1/32) x 100% = 89% ………. k=3 (µ ± 3σ)

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-38


Calculando Medidas Numéricas Descriptivas
de una Distribución de Frecuencia

n  Algunas veces solo contamos con una


distribución de frecuencias y no con el conjunto
de datos.

n  En este caso se pueden calcular valores


aproximados de la media y la desviación
estándar.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-39


Aproximando la Media a partir de
una Distribución de Frecuencias
n  Utilice el punto medio de un intervalo de clase para
aproximar los valores en esa clase.

!m f
j=1
j j

X=
n
Donde n = número de valores o tamaño de la muestra
c = número de clases en la distribución de frecuencia
mj = punto medio de la clase j
fj = número de datos en la clase j

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-40


Aproximando la Desviación Estándar a
partir de una Distribución de Frecuencias

n  Asuma que todos los valores dentro del intervalo de clase
están localizados en el punto medio de la clase.

c
2
(m
! j " X ) fj
j=1
S=
n -1
Donde n = número de valores o tamaño de la muestra
c = número de clases en la distribución de frecuencia
mj = punto medio de la clase j
fj = número de datos en la clase j

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-41


La Covarianza

n  La covarianza mide la fortaleza de la relación lineal


entre dos variables numéricas (X y Y).
n  La covarianza muestral:
n

" ( X ! X)( Y ! Y )
i i
cov ( X , Y ) = i=1
n !1
n  Sólo mide la fuerza de la relación.
n  No mide ningún efecto causal.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-42


Interpretando la Covarianza

n  Covarianza entre 2 variables:


cov(X,Y) > 0 X y Y tienden a cambiar en la misma dirección.
cov(X,Y) < 0 X y Y tienden a cambiar en dirección opuesta.

cov(X,Y) = 0 X y Y son independientes.

n  La covarianza tiene un defecto importante. Como la


covarianza puede tener cualquier valor, es imposible
determinar la fortaleza relativa de la relación. Para ello, es
necesario calcular el coeficiente de correlación.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-43


Coeficiente de Correlación
n  El coeficiente de correlación mide la fortaleza
relativa de una relación lineal entre dos
variables numéricas.
n  Coeficiente de Correlación de la muestra:
cov (X , Y)
r=
SX SY

wheren n n
" (X ! X)(Y ! Y)
i i " (X ! X)
i
2
" (Y ! Y )
i
2

cov (X , Y) = i=1
SX = i=1
SY = i=1
n !1 n !1 n !1

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-44


Características del Coeficiente de
Correlación
n  El coeficiente de correlación poblacional: ρ
n  El coeficiente de correlación muestral: r
n  Tanto ρ como r tienen las siguientes características:
n  Carecen de unidades
n  Oscilan entre –1 y 1
n  Mas cercano a –1, mas fuerte la relación lineal negativa
n  Mas cercano a 1, mas fuerte la relación lineal positiva
n  Mas cercano a 0, mas débil la relación lineal

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-45


Diagramas de Dispersión con Varios
Coeficientes de Correlación
Y Y

X X
r = -1 r = -.6
Y
Y Y

X X X
r = +1 r = +.3 r=0
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-46
Consideraciones Éticas

Las medidas numéricas descriptivas:

n  Deben documentar ambos resultados buenos y


malos.
n  Deben ser presentados de una manera justa,
objetiva y neutral.
n  No deben usar resúmenes inapropiados que
distorsionen los hechos.

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 3-47

También podría gustarte