Está en la página 1de 13

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE FILOSOFÍA
PEDAGOGIA DE LAS CIENCIAS EXPERIMENTALES-
INFORMÁTICA

Estadística Descriptiva e
Inferencial
TERCER SEMESTRE CII-2019

PARALELO: PEI-S-CO-3-A-1

DOCENTE:
Msc. Jonathan Samaniego

Integrantes:
Barre Olmedo Yamileth Rosa
Guerrero Martinez Anggi Aracelly
Vizueta Macias Joseph Joel
Zamora Franco Rodrigo Xavier

Guayaquil, Ecuador
ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

Medidas de Posición no Centrales


CUANTILES
El término cuantil fue usado por primera vez por Kendall en 1940.
Las medidas de posición no central (o medidas de tendencia no central) permiten conocer
Puntos característicos de una serie de valores, que no necesariamente tienen que ser
Centrales. La intención de estas medidas es dividir el conjunto de observaciones en grupos con
el mismo número de valores.
se destaca 3 tipos de fractiles que son los más utilizados y se detallan en el siguiente gráfico:

 Cuartiles
Conociendo que los cuartiles son aquellos que parten o dividen la distribución en cuartas
partes de manera equitativa, estos se pueden hallar en datos sin agrupar a partir de la
mediana (Me).
Número impar de datos
2, 5, 3, 6, 7, 4, 9

Número par de datos


2, 5, 3, 4, 6, 7, 1, 9

 Cálculo de los cuartiles para datos agrupados

Para poder calcularlos se ejecuta el siguiente proceso:


 Ordenamos los datos de mayor a menor
 Aplicamos la fórmula para buscar la posición la cual es:

Donde k es el número de cuartil y la variable n es el número de datos.


Nos dará como resultado la posición la cual la buscaremos en la frecuencia absoluta
acumulada, donde pueden suceder dos opciones que se encuentre el valor de la posición en la
frecuencia absoluta acumulada o que este, no se encuentre en la misma.

Entonces decimos que ese cuartil (Qk) es igual al límite superior del intervalo determinado por
la posición (10-25) en este ejemplo el límite inferior (Li) es 10 y el límite superior (Ls) entonces
sería 25 entonces determinado este ejemplo se resuelve que Qk=Ls

Aplicado a un ejemplo

Edad Frecuencia Frecuencia


absoluta absoluta
acumulada
30-35 3 3

35-40 7 10

40-45 12 22

45-50 23 45

50-55 14 59

55-60 1 60
Donde:
Li es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fai es la frecuencia acumulada anterior a la clase mediana.
f es la frecuencia absoluta
i es la amplitud de la clase.

 Encontrar el cuartil 3 (Q3)


k=3

=4 5

Q3 = Ls
Q3 = 50

 Deciles
Son medidas de posición que dividen en diez partes iguales a un conjunto de datos ordenados
de menor a mayor, que en términos de porcentajes cada uno corresponde a un 10%.
Pero para poder obtener su valor el proceso se repite con una pequeña variación en la fórmula
que determina la posición la cual es:

Donde si queremos encontrar realizamos el mismo proceso realizado anteriormente donde k


es el número de decil y n el número de datos, aplicaremos un ejemplo con los datos dados
previamente, para así poder detallar el proceso de manera más efectiva.

Encontrar el decil 2 (D2)

= 12

Aquí encontramos otro caso que es cuando k no se encuentra en la frecuencia absoluta


acumulada, pero determinamos que k=12 se encuentra entre 10 y 22 por lo cual aplicaremos la
otra fórmula para determinar los estadígrafos de posición la cual es:

Dk= Li+A

Donde Fi-1 es el número anterior a el determinado en la posición que en este caso es 12, eso
quiere decir que en este ejercicio Fi-1=10

Así mismo determinamos que Fi es el numero posterior a el resultante de posición, el cual


estaría simbolizado en este caso por Fi=22

Para determinar el límite inferior (Li) se debe tener en cuenta a Fi, ya que al no estar
concretamente k en la tabla como frecuencia absoluta acumulada, entonces el Li de 22 es 40.
Finalmente determinamos la amplitud para poder reemplazar y resolver la cual se obtiene con
la resta de el límite superior(Ls) y el límite inferior(Li).

A=Ls-Li
A=40-45

Edad Frecuencia Frecuencia


absoluta absoluta
acumulada
30-35 3 3

35-40 7 10

40-45 12 22

45-50 23 45

50-55 14 59

55-60 1 60

Es así que la fórmula con datos ya reemplazados quedaría de la siguiente manera

Entonces por medio de esta fórmula para cuando no se encuentre el valor de la posición en la
frecuencia absoluta acumulada y queda como resultante que:
D2=40,83 es decir que el decil número 2 es 40,83

 Percentiles
En estadística, un percentil es una medida de posición no central, al igual que los cuartiles o los
deciles. El concepto de percentil es igual pero referido a porcentajes. Si un valor tiene un
percentil 55 (P55), el 55% de los demás datos tendrán un valor igual o más pequeño.

Al igual que en los anteriores procesos lo unico que varía es que al ser centésimas la fórmula
de posición cambiara su denominador a 100
Edad Frecuencia Frecuencia
absoluta absoluta
acumulada
30-35 3 3

35-40 7 10

40-45 12 22

45-50 23 45

50-55 14 59

55-60 1 60

Determinar el percentil 55 (P55)

Al observar que el valor de la posición del percentil no se encuentra en la frecuencia absoluta


acumulada, aplicamos nuevamente la fórmula general de los estadígrafos de posición.

Pk= Li+A

Es así que por medio de la fórmula general de estadígrafos de posición se determina que
P55=47,39

Obtener ya sea cuartil, decil o percentil no es de mucha complejidad, ya que es por medio de
las fórmulas y procesos matemáticos simples que se puede obtener, teniendo en cuenta que el
fin de los estadígrafos de posición es, ubicar datos particulares dentro de ciertas divisiones de
una distribución de datos.
GENERALIZACION DE LAS FÓRMULAS

 Datos agrupados puntualmente

 Datos agrupados por intervalo.

Coeficiente de correlación de Pearson


El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima
de intervalo), es un índice que mide el grado de covariación entre distintas variables
relacionadas linealmente. Adviértase que decimos "variables relacionadas linealmente".

Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal, en
cuyo caso no proceder a aplicarse la correlación de Pearson. Por ejemplo, la relación entre la
ansiedad y el rendimiento tiene forma de U invertida; igualmente, si relacionamos población y
tiempo la relación será de forma exponencial.

En estos casos (y en otros muchos) no es conveniente utilizar la correlación de Pearson.


Insistimos en este punto, que parece olvidarse con cierta frecuencia.
Este coeficiente mide el grado de asociación lineal entre dos variables es decir la fuerza y el
sentido de la relación lineal, el cual está representado por r y se obtiene con la siguiente
fórmula:

Donde Sxy es la varianza de X y Y y respectivamente Sx es la desviación estandar de X y Sy es la


desviación estándar de Y.

INTERPRETACIÓN DEL COEFICIENTE DE CORRELACIÓN DE KARL PEARSON


El coeficiente de correlación de Pearson tiene el objetivo de indicar cuán asociadas se
encuentran dos variables entre sí por lo que:

 CORRELACIÓN MENOR A CERO: Si la correlación es menor a cero, significa que es


negativa, es decir, que las variables se relacionan inversamente.
Cuando el valor de alguna variable es alto, el valor de la otra variable es bajo. Mientras más
próximo se encuentre a -1, más clara será la covariación extrema. Si el coeficiente es igual a -1,
nos referimos a una correlación negativa perfecta
Cuando este coeficiente tome el valor de -1 diremos que hay una asociación lineal perfecta
negativa,

 CORRELACIÓN IGUAL A CERO: Cuando la correlación es igual a cero significa que no es


posible determinar algún sentido de covariación. Sin embargo, no significa que no
exista una relación no lineal entre las variables.
Cuando esta tome el valor de 0 diremos que no hay asociacioón linea entre ambas variables y
finalmente ,

 CORRELACIÓN MAYOR A CERO: Si la correlación es igual a +1 significa que es positiva


perfecta. En este caso significa que la correlación es positiva, es decir, que las variables
se correlacionan directamente.
Cuando el valor de una variable es alto, el valor de la otra también lo es, sucede lo mismo
cuando son bajos. Si es cercano a +1, el coeficiente será la covariación.
Si el valor es como resultante 1 determinaremos que existe una asociación lineal perfecta
positiva.

En resumen si el valor está más distante de 0 se dice que la relación es fuerte, por lo contrario
entre más cercana este de 0 se determinará como una relación nula.

El sentido de relación es determinado por el signo, es decir que si el valor de la correlación es


positivo (+) como consecuencia se determina que si la variable X aumenta la variable Y lo hará
de igual manera. Cuando el valor es negativo (-) esto determina que si la variable X aumenta la
variable Y disminuirá.
De manera gráfica esto se observara de la siguiente manera:

Fuente: http://www.sachile.cl/upfiles/revistas/54e63a1a778ff_15_correlacion-2-2014_edit.pdf

Es decir que lo primero que debemos obtener es la varianza y la desviación estándar de ambas
variables.
 Ejemplo:
Teniendo estas dos variables
X 18 17 15 16 14 12 9 15 16 14 16 18 Sx=180

Y 13 15 14 13 9 10 8 13 12 13 10 8 Sy=138

Se calcula la media aritmética:

X Y X=x-X Y=y-Y X2 xy Y2
18 13 3 1.5 9 4.5 2.25
17 15 2 3.5 4 7 12.25
15 14 0 2.5 0 0 6.25
16 13 1 1.5 1 1.5 2.25
14 9 -1 -2.5 1 2.5 6.25
12 10 -3 -1.5 9 4.5 2.25
9 8 -6 -3.5 36 21 12.25
15 13 0 1-5 0 0 2.25
16 12 1 0.5 1 0.5 0.25
14 13 -1 1.5 1 -1.5 2.25
16 10 1 -1.5 1 -1.5 2.25
18 8 3 -3.5 9 -10.5 12.25
180 138 72 28 63
Aplicamos la fórmula:

Entonces determinamos que existe una correlación moderada.


La cual determina la fuerza de relación por las siguiente tabla:
CONCEPTO DE ASIMETRÍA ESTADÍSTICA
• La simetría de una distribución de frecuencias hace referencia al grado en que valores de la
variable, equidistantes a un valor que se considere centro de la distribución, poseen
frecuencias similares.

• Es un concepto más intuitivo a nivel visual, especialmente, si se observa una representación


gráfica (diagrama de barras, histograma…) de la distribución de frecuencias. Ésta será simétrica
si la mitad izquierda de la distribución es la imagen especular de la mitad derecha.

•Media y mediana coinciden en las distribuciones simétricas. Si sólo hay una moda
(distribución unimodal), el valor de ésta también será igual a las dos anteriores.

• En distribuciones unimodales, el nivel de simetría se suele describir de acuerdo a tres


grandes categorías: distribuciones simétricas, distribuciones asimétricas positivas (o sesgada a
la derecha) y distribuciones asimétricas negativas (o sesgada a la izquierda). Tomando como
eje de referencia a la moda, estas categorías de asimetría vienen definidas por el diferente
grado de dispersión de los datos a ambos lados (colas) de ese eje virtual. La cola más dispersa
en el lado de los valores altos de la variable caracteriza a la asimetría positiva; si en el lado
de los más bajos, a la asimetría negativa; y si la dispersión es igual o muy similar a ambos
lados, a una distribución de frecuencias simétrica.

• En caso de asimetría, los valores de la media, mediana y moda difieren. En concreto si la


asimetría es positiva: media>mediana>moda.
Si la asimetría es negativa: media<mediana<moda.
ASIMETRÍA ÍNDICES ESTADÍSTICOS
A continuación se presentan diferentes índices estadísticos que permiten cuantificar el nivel de
asimetría de una variable.
Destacar antes que para variables nominales no tiene sentido el plantear este tipo de índices,
dado que no existe un orden intrínseco a los valores de la variable.

 Índice de asimetría para variables ordinales:


Se basa en las distancias entre los cuartiles a fin de establecer un resumen de la asimetría de la
distribución.

Nota: oscila entre -1 y 1 lo cual facilita la comprensión.

 Índice de asimetría para variables cuantitativas:


Primer coeficiente de Pearson: se basa en la relación existente entre la media y la moda en
distribuciones unimodales asimétricas.

 Interpretación del coeficiente de Pearson:


los valores menores que 0 indican asimetría negativa; los mayores, asimetría positiva y cuando
sea cero, o muy próximo a cero, simétrica.
No está limitado a un rango de valores.

 Coeficiente de asimetría de Fisher:


se basa en las desviaciones de los valores observados respecto a la media. La interpretación de
los resultados proporcionados por este coeficiente es igual a la del primer coeficiente de
Pearson.

Y para el caso de datos tabulados:


REFERENCIAS

BENALCÁZAR, Marco, (2002), Unidades para Producir Medios Instruccionales en Educación,


SUÁREZ, Mario Ed. Graficolor, Ibarra, Ecuador.

DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial Megabyte, Lima,
Perú.

GOVINDEN, Lincoyán, (1985), Introducción a la Estadística, Ed. McGraw Hill. Interamericana


Editores. S.A., Bogotá, Colombia.

JOHNSON, Robert, (2003), Estadística Elemental, Ed. Math Learning, Ed. Tercera, México DF.

KUBY, Patricia.

KAZMIER, J. Leonard, (1990). Estadística Aplicada a la Administración y la Economía, Ed.


McGrawHill, Ed. Segunda, Bogotá, Colombia.

LIND, Marchal, (2005), Estadística Aplicada a los Negocios y a la Economía, Ed. McGraw- Hill,

Valencia, J. A. A., & Araújo, J. J. O. (2008). Fundamentos de inferencia estadística. Pontificia


Universidad Javeriana.

Dagnino, J. (2014). Coeficiente de correlacion lineal de pearson. Chil Anest, 43, 150-153.

http://www.mat.uda.cl/hsalinas/cursos/2011/2do/clase2.pdf

También podría gustarte