Está en la página 1de 36

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIERÍA AMBIENTAL Y


DE RECURSOS NATURALES

ESTADÍSTICA DESCRIPTIVA

COEFICIENTES DE VARIABILIDAD
COEFIENTE DE SIMETRIA Y ASIMETRIA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
¿Qué es variabilidad?
Algunas personas asocian variabilidad con rango mientras que otras asocian
variabilidad con cómo difieren los valores de la media. Hay muchas medidas
de variabilidad, y la desviación estándar es la más usada. Pero recuerden que
una distribución con la menor desviación estándar no es necesariamente la
distribución que es menos variable con respecto a otras definiciones de
variabilidad.
Resumen: Cuando queremos describir una variable usamos alguna medida de posición
central y una medida de dispersión. El par de medidas más comúnmente usado es la
media aritmética y la desviación estándar. Pero vimos que cuando la distribución de las
observaciones es sesgada, la media no es una buena medida de posición central y
preferimos la mediana. La mediana en general va acompañada del rango como medida de
dispersión. Pero cuando observamos valores extraños (extremos) el rango se ve muy
afectado, por lo que preferimos usar el rango entre cuartiles.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
¿Qué son los outliers?

Valores extremos o anómalos (outliers): son observaciones que se alejan


del conjunto der datos.
• Una regla para determinar si un dato es outliers es:
• Si un dato es < Q1 – 1.5(Q3-Q1)
• Si un dato es > Q3 + 1.5(Q3-Q1)
• Los valores extremos por lo general son atribuibles a una de las
siguientes causas:
• La observación se registra incorrectamente.
• La observación proviene de una población distinta.
• La observación es correcta pero representa un suceso poco común
(fortuito)
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Ejemplo
Analizar si los siguientes datos poseen valores outliers. Se trata de las
edades de un grupo de pacientes de un médico:
45 41 51 46 47 42 43 50 39 32 41 44 47 49 45 42 41 40 45 37
• Primero ordenamos la muestra:
32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51
• Calcular los cuartiles: Q1=P25=41, Q2=P50=43.5 y Q3=P75=46.5
• Rango entre cuartiles: Q3-Q1=46.5-41=5.5
• límite inferior: 41-1.5x5.5= 32.75
• Límite superior: 46.5+1.5x5.5= 54.75
• Por lo tanto queda una observación fuera del límite inferior: 32
(la décima observación de la base de datos original).
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Boxplot
El diagrama de cajas de construye de la
siguiente forma:
• Dibujar la caja que empieza en el primer
cuartil y termina en el tercer cuartil.
• Dibujar la mediana con una línea dentro
de la caja.
• Por último, se extienden las líneas
(bigotes) saliendo de la caja hasta el
mínimo y el máximo (salvo en la presencia
de outliers).
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Boxplot
En la presencia de outliers, los
bigotes se extienden hasta el valor
observado anterior al valor
extremo. La distancia entre la
mediana y los cuartiles es
aproximadamente la misma, lo que
nos hace pensar que la distribución
de los datos es más o menos
simétrica.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Estadísticos de Forma

¿Qué nos dice la forma de la distribución


de la variable salario actual que se
muestra en el siguiente histograma?
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Asimetría
La simetría de una distribución de frecuencias hace referencia al grado en
que valores de la variable, equidistantes a un valor que se considere centro
de la distribución, poseen frecuencias similares.
• Es un concepto más intuitivo a nivel visual, especialmente, si se observa
una representación gráfica (diagrama de barras, histograma…) de la
distribución de frecuencias. Ésta será simétrica si la mitad izquierda de la
distribución es la imagen especular de la mitad derecha.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Asimetría
Media y mediana coinciden en las distribuciones simétricas. Si sólo hay una
moda (distribución unimodal), el valor de ésta también será igual a las dos
anteriores.
• En distribuciones unimodales, el nivel de simetría se suele describir de
acuerdo a tres grandes categorías: distribuciones simétricas, distribuciones
asimétricas positivas (o sesgada a la derecha) y distribuciones asimétricas
negativas (o sesgada a la izquierda). Tomando como eje de referencia a la
moda, estas categorías de asimetría vienen definidas por el diferente grado
de dispersión de los datos a ambos lados (colas) de ese eje virtual. La cola más
dispersa en el lado de los valores altos de la variable caracteriza a la asimetría
positiva; si en el lado de los más bajos, a la asimetría negativa; y si la
dispersión es igual o muy similar a ambos lados, a una distribución de
frecuencias simétrica.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Asimetría
En caso de asimetría, los valores de la media, mediana y moda difieren.
En concreto si la asimetría es positiva: media>mediana>moda. Si la
asimetría es negativa: media<mediana<moda.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
Curtosis
Distribución platicúrtica. (apuntamiento negativo): indica que en sus colas
hay más casos acumulados que en las colas de una distribución normal.
• Distribución leptocúrtica (apuntamiento positivo): justo lo contrario.
• Distribución mesocúrtica (apuntamiento normal): como en la distribución
normal.
• Coeficiente de apuntamiento de Fisher para variables cuantitativas: se
basa en las desviaciones de los valores observados respecto a la media.
n

 ( x − x)
i
4

K= i =1
4
−3
nS
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
n
Curtosis 4
 ( y − y) n
i j
Y para el caso de datos tabulados: K= i =1
4
−3
nS
Interpretación: el valor de este coeficiente para la distribución normal será
igual a 0, o sea que cualquier distribución para la que se obtenga un valor de
K igual o próximo a 0 significará que su nivel de apuntamiento es como el de
la distribución normal (mesocúrtica). Valores mayores que 0, expresan que
la distribución es leptocúrtica, mientras que si son menores que 0 ponen de
manifiesto que la distribución es platicúrtica. No está limitado a un rango de
valores.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
El Coeficiente de Variación
Es otra medida de variabilidad que tiene la ventaja de ser sin unidades.
Para una muestra de datos con media M(Y) y desviación estándar s, se define
el coeficiente de variación como
S
CV =
Y
Si cambiamos la escala de medir en la variable, el coeficiente de variación
no cambia. No obstante, si la media es igual a cero, el coeficiente de
variación no existe.
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
EJEMPLO: como parte de un
estudio de medición de FM MODERNA FM PANAMERICANA
Tiempo de escucha
audiencia radial, se llevó a cabo Tiempo de escucha (minutos) Hogares (nº) (minutos)
Hogares (nº)

Li Ls nj Li Ls nj
una encuesta a 150 hogares de 0 15 14 0 15 3
15 30 45
la ciudad para medir el tiempo 15
30
30
45
18
20 30 45 25
45 60 20
de escucha de dos radios locales, 45
60
60
75
25
45
60 75 18
75 90 18
entre la 16 y las 19 horas. los 75
90
90
105
18
7
90 105 14
105 120 7
resultados de esta observación 105 120 3 TOTAL 150
TOTAL 150
se presentan en la tablas
adjuntas:
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
FM MODERNA FM PANAMERICANA
Tiempo de escucha Marca de Hogares Tiempo de Marca de Hogares
(minutos) clase (nº) escucha (minutos) clase (nº)
Li Ls Yj nj Yj*nj Nj (Yj-Media)^2*nj Li Ls Yj nj Yj*nj Nj (Yj-Media)^2*nj
0 15 7,5 14 105 14 30401,84 0 15 7,5 3 22,5 3 6075
15 30 22,5 18 405 32 17974,08 15 30 22,5 45 1012,5 48 40500
30 45 37,5 20 750 52 5511,2 30 45 37,5 25 937,5 73 5625
45 60 52,5 25 1312,5 77 64 45 60 52,5 20 1050 93 0
60 75 67,5 45 3037,5 122 8080,2 60 75 67,5 18 1215 111 4050
75 90 82,5 18 1485 140 14518,08 75 90 82,5 18 1485 129 16200
90 105 97,5 7 682,5 147 13184,92 90 105 97,5 14 1365 143 28350
105 120 112,5 3 337,5 150 10231,68 105 120 112,5 7 787,5 150 25200
TOTAL 150 8115 99966 TOTAL 150 7875 126000
Medida FM moderna FM Panamericana
Media 54,10 52,50
Mediana 58,80 46,50
Moda 66,38 25,16
Q1 34,58 26,50
Q3 71,83 76,25
Y − MO
S^2 670,91 845,64 CAP = MUESTRAL
S 25,90 29,08 S
Q1 + Q3 − 2Q2
CAP= -0,474 0,940 CAB =
CAB= -0,300 0,196 Q3 − Q1
COEFICIENTES DE CORRELACIÓN
Este ejemplo muestra cómo obtener los coeficientes de correlación y
los estadísticos del procedimiento Correlaciones bivariadas.
✓ En el cuadro de diálogo Correlaciones bivariadas, seleccionar las
variables tiempemp (meses desde el contrato), salini (salario inicial)
y salario (salario actual) y trasladarlas a la lista Variables.
✓ Marcar las opciones Pearson, Tau-b de Kendall y Spearman del
recuadro Coeficientes de correlación.
✓ Pulsar el botón Opciones... para acceder al cuadro de diálogo
Correlaciones bivariadas: Opciones y, en el recuadro Estadísticos,
marcar las opciones Medias y desviaciones típicas y Productos
cruzados y covarianzas.
 XY − X Y
COV ( X , Y ) =
 XY
− XY r=
COV ( X , Y )
= n
n S X * SY S X * SY
COEFICIENTES DE CORRELACIÓN LINEAL DE PEARSON
Total Media Var Ds C_V
xi 1 3 5 5 6 7 7 8 9 10 0,431
yi 2 4 3 5 7 6 7 7 8 10 0,388
ni 3 4 3 4 4 3 4 2 1 2 30
xi*ni 3 12 15 20 24 21 28 16 9 20 168 5,6
yi*ni 6 16 9 20 28 18 28 14 8 20 167 5,567
xiyini 6 48 45 100 168 126 196 112 72 200 1073
xi^2*ni 3 36 75 100 144 147 196 128 81 200 1110 5,83 2,42
yi^2*ni 12 64 27 100 196 108 196 98 64 200 1065 4,67 2,16

 ( x − x) n 2

(  x n − nx ))
i i
1 2
Sx = i =1
= 2

n −1 n −1
i i
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
INTRODUCCIÓN A LA TEORÍA DE PROBABILIDAD
En la vida cotidiana aparecen muchas situaciones en las que los resultados observados son
diferentes aunque las condiciones iniciales en las que se produce la experiencia sean las
mismas. Por ejemplo, al lanzar una moneda unas veces resultará cara y otras sello.

Estos fenómenos, denominados aleatorios, se ven afectados por la incertidumbre.


En el lenguaje habitual, frases como "probablemente...", "es poco probable que...", "hay
muchas posibilidades de que..." hacen referencia a esta incertidumbre.

La teoría de la probabilidad pretende ser una herramienta para modelizar y tratar con
situaciones de este tipo. Por otra parte, cuando aplicamos las técnicas estadísticas a la
recogida, análisis e interpretación de los datos, la teoría de la probabilidad proporciona una
base para evaluar la fiabilidad de las conclusiones alcanzadas y las inferencias realizadas. El
objetivo del Cálculo de Probabilidades es el estudio de métodos de análisis del
comportamiento de fenómenos aleatorios.
INTRODUCCIÓN A LA TEORÍA DE PROBABILIDAD
La teoría de la probabilidad pretende ser una herramienta para modelizar y tratar con
situaciones de este tipo. Por otra parte, cuando aplicamos las técnicas estadísticas a la
recogida, análisis e interpretación de los datos, la teoría de la probabilidad proporciona una
base para evaluar la fiabilidad de las conclusiones alcanzadas y las inferencias realizadas.
El objetivo del Cálculo de
Probabilidades es el estudio de
métodos de análisis del
comportamiento de fenómenos
aleatorios. Aunque desde sus orígenes
siempre han estado ligadas, es cierto
que existe un cierto paralelismo entre
la estadística descriptiva y el cálculo de
probabilidades, como se puede
apreciar en la siguiente tabla:
Conceptos básicos
Con ellos vamos a dar una serie de conceptos para poder desarrollar este tema y los
sucesivos.

Fenómeno determinístico.- Cuando al repetirlo bajo idénticas condiciones iniciales se


obtienen siempre los mismos resultados. o Fenómeno aleatorio.- Cuando al repetirlo bajo
idénticas condiciones iniciales no se obtienen siempre los mismos resultados. Ejemplo:
cuando lanzamos una moneda al aire observando la sucesión de caras y cruces que
presentan.
Experimento aleatorio.- Operación que repetimos bajo idénticas condiciones iniciales y no
se obtienen siempre los mismos resultados. Ejemplo: lanzamiento de un dado observando la
sucesión de números que se presentan {1, 2, 3, 4, 5,6}.
Suceso elemental. Cada uno de los resultados posibles del experimento aleatorio; luego un
suceso elemental consta de un solo elemento del espacio muestral (E). En el ejemplo del
dado: {1}.
Conceptos básicos
Espacio muestral.- Conjunto de todos los sucesos elementales del
experimento aleatorio y lo designaremos como (E). Ejemplo del
dado: {1,2,3,4,5,6}
Suceso.- Conjunto formado por uno o más sucesos elementales,
es decir, un subconjunto de resultados elementales del
experimento aleatorio. Ejemplo del dado: nos interesa saber si el
resultado a sido un número impar A={1, 3,5}.
Suceso seguro.- Coincide con el suceso elemental, ya que al
realizar el experimento aleatorio se obtendrá con seguridad uno
de los posibles resultados o sucesos elementales, y por tanto
ocurrirá (E).
Dos sucesos se dice que son iguales, cuando todo suceso
elemental de uno está en el otro, y viceversa.
Suceso imposible.- Es el que no tiene ningún elemento del
espacio muestral (E), y por tanto no ocurrirá nunca, y se
representa como ∅. Ejemplo: En el lanzamiento del dado no
puede darse el 7.
INTRODUCCIÓN A LA TEORÍA DE PROBABILIDAD
Suceso complementario a un suceso A: Es el suceso
que se verifica si, como resultado del experimento
aleatorio, no se verifica A. Se acostumbra a denotar con
el símbolo Ā.
Sucesos incompatibles: Los sucesos A y B son
incompatibles o mutuamente excluyentes si no pueden
ocurrir simultáneamente. A = {a, b}, B = {d, e}

Si tenemos dos sucesos cualesquiera A, B: A está contenido en B, entonces B no está


contenido en A, A ⊂ B ⇒ B ⊄ A o Si tenemos dos sucesos cualesquiera A, B: donde A está
contenido en B y B está contenido en A, entonces A = B. A, B / A ⊂ B ⇒ B ⊂ A ⇒ A = B
OPERACIONES CON SUCESOS
Al ser los sucesos aleatorios nada más que subconjuntos de un conjunto E (espacio
muestral), podemos aplicarles las conocidas operaciones con conjuntos, como son la unión,
intersección y diferencia:
Suceso contenido en otro.- Un suceso A se dice que está
contenido o inducido en otro B si siempre que se verifica A
se verifica B. Se representa A⊂Bº

Ejemplo: Considerando el experimento aleatorio del lanzamiento de un dado, si


designamos por: A= que aparezca el 2 ó el 4 = { 4,2 }
B= que aparezca un número par: { 6,4,2 }
El suceso A  B, pues los resultados o sucesos elementales 2 y 4 de A, pertenecen a B.
Diremos también que A implica a B y lo denotaremos A⇒B
OPERACIONES CON SUCESOS
Igualdad de sucesos.- Dados dos sucesos A y B, diremos que
son iguales, si siempre que ocurre el suceso A también ocurre A  B
 A= B
el suceso B, y siempre que ocurre el suceso B ocurre el suceso B  A
A, y lo indicaremos por A = B. Es decir, si se verifica:

Ejemplo: Sean los sucesos:


A = obtener un número par al lanzar un dado = { 6,4,2 }
B = obtener un múltiplo de 2 = {2, 4, 6} Aquí se verifica que:
A⊂ B pues siempre que ocurre A ocurre B
B⊂ A pues siempre que ocurre B ocurre A. Entonces A = B.
OPERACIONES CON SUCESOS
Diferencia de sucesos.- Dados dos sucesos aleatorios A, B ∈ E, se llama suceso diferencia de
A y B y se representa mediante A/B, o bien, A-B al suceso aleatorio formado por todos los
sucesos elementales que pertenecen a A, pero no a B.

Unión de sucesos.- Dados dos sucesos A y B se llama unión de A y B, y


se representa por A∪B, al suceso que se realiza cuando se realiza
alguno de ellos, A o B, es decir, a todos los elementos que están en A ó
están en B.
Ejemplo: Sean los sucesos:
A = obtener el lanzamiento de un dado un número impar = { 5,3,1 }
B = obtener un número mayor que 4 = { 6,5 }
El suceso unión será:
A∪ B = {5, 3, 1} ∪ { 6,5 } = {1, 3, 5, 6}
Intersección de sucesos.- Dados dos sucesos A y B, se llama suceso intersección de A y B, y se
representa por A ∩ B, al suceso que se realiza si y sólo si se realizan simultáneamente A y B.
OPERACIONES CON SUCESOS
Ejemplo: Utilizando el ejemplo de la unión, la intersección viene
dada por:

Sucesos Incompatibles.- Dos sucesos A y B cuya intersección es el


suceso imposible se llaman sucesos incompatibles. Obsérvese
que un suceso y su contrario son siempre incompatibles.

Sucesos Incompatibles.- Dos sucesos A y B cuya intersección es el


suceso imposible se llaman sucesos incompatibles. Obsérvese que A B = 
un suceso y su contrario son siempre incompatibles.

Sucesos Complementarios.- Dado un suceso A, se llama suceso


contrario o complementario de A, y se representa por Ā, al suceso
que se realiza cuando no se realiza A y recíprocamente.
OPERACIONES CON SUCESOS

E =  = 1, 2,3, 4,5, 6 


A = 1, 2   A ' = 3, 4,5, 6 
B = 2, 4, 6   B ' = 1, 3,5 
C = 3, 5,   C ' = 1, 2, 4, 6 
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA
COEFICIENTES DE SIMETRIA Y ASIMETRÍA

También podría gustarte