Está en la página 1de 5

Paula Alejandra Vargas Ramírez

Belky Janeth González Rodríguez

TALLER 1
1.
MEDIDAS DE TENDENCIA CENTRAL
La mayor parte de las serie de datos muestran una clara tendencia a agruparse alrededor de un
cierto punto central. Así pues, dada cualquier serie de datos particular, por lo general es posible
seleccionar algún valor o promedio típico para describir toda la serie de datos. Este valor
descriptivo típico es una medición de tendencia central o de ubicación.
Cinco tipos de promedios a menudo usados como mediciones de tendencia central. Estos son
la media aritmética, la mediana, la moda, el rango medio el eje medio.

La media aritmética: La media aritmética es el promedio o medición de tendencia central de uso


más común. Calcula sumando todas las observaciones de una serie de datos y luego dividiendo el
total entre el número de elementos involucrados.

La mediana: La mediana es el valor medio de una secuencia ordenada de datos. Si no hay


empates, la mitad de las observaciones serán menores y la otra mitad serán mayores. La mediana
no se ve afectada por ninguna observación extrema de una serie de datos. Por tanto, siempre que
esté presente una observación extrema es apropiada usar la mediana en vez de la media para
describir una serie de datos
Para calcular la mediana de una serie de datos recolectados en su forma sin procesar, primero
debemos poner los datos en una clasificación ordenada. Después usamos la formula de punto de
posicionamiento:

La moda: La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la moda no
se ve afectada por la ocurrencia de los valores extremos. 

El rango medio: El rango medio es el promedio de las observaciones menores y mayores de una
serie de datos.
El rango medio a menudo es usado como una medición de resumen tanto por analistas financieros
como por reporteros meteorológicos, puesto que puede proporcionar una medición adecuada,
rápida y simple para caracterizar toda una serie de datos, como por ejemplo toda una serie de
lecturas registradas de temperatura por horas durante todo un día.

El eje medio: Como última medida de tendencia central, mencionamos al eje medio, que es el
promedio del primer y tercer cuartiles de una serie de datos. Es decir:
Eje medio: (Q1 + Q2) / 2

Siendo Q1 y Q2, el primer y segundo cuartil. En conclusión, podemos decir que es una medición
de resumen usada para zanjar problemas potenciales introducidos por los valores extremos de los
datos.

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad de
los datos, es decir, si la distribución de los datos es más o menos homogénea y por tanto nos dan
una medida sobre la representatividad de los parámetros de centralización (moda, mediana o
media)

Como en los parámetros de centralización y de posición existen varios para medir la dispersión.
Los principales son:

RANGO O RECORRIDO: Es la diferencia entre el mayor valor de los datos y el menor.

Re = Max {xi} - Min {xi}

La principal ventaja del rango es su fácil cálculo aunque su valor es poco significativo, ya que
sólo tiene en cuenta los dos valores extremos.

RANGO O RECORRIDO INTERCUATÍLICO: Es la diferencia entre el tercer cuartil y el


primero, el rango donde se encuentra el 50% central de los datos.

RI = Q3 - Q1

En ocasiones también se suele usar como valor la mitad del rango intercuartílico, hablando en
esta caso de recorrido semi-intercuartil.

Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la media no es
posible o ésta no es significativa (ver medidas de centralización)
Las siguientes medidas que vamos a analizar se basan en medir la diferencia de los datos con la
media.

DESVIACIÓN MEDIA: La desviación media es la media de la distancia de los valores de los


datos (en valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias
positivas, lo que daría como resultado que la desviación media sea cero para cualquier
distribución de datos.
VARIANZA: Como hemos referido antes para evitar que se anulen diferencias positivas y
negativas, en a la desviación media se toma valor absoluto. Dado que la función valor absoluto
no tiene unas buenas propiedades matemáticas (por ejemplo, no es derivable) otra manera de
transformar los valores negativos en positivos es elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los datos a
la media.

Para el cálculo se suele aplicar la expresión:

DESVIACIÓN TÍPICA: Definimos la desviación típica como la raíz cuadrada de la varianza.

o, usando la otra expresión:

El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de dispersión esté
expresada en la misma unidad que la variable.

COEFICIENTE DE VARIACIÓN (DE PEARSON): Dado que la desviación típica es una


medida que está expresada en las mismas unidades que la variable, si queremos comparar
dispersiones a escalas distintas necesitamos un parámetro adimensional. En estas situaciones
usaremos el coeficiente de variación que se expresa tanto de forma decimal como en tanto por
ciento, y nos expresaría la desviación típica como porcentaje con respecto a la media.
MEDIDAS DE POSICIÓN
Las medidas de posición relativa se llaman en general cuantiles y se pueden clasificar en tres
grandes grupos: Cuartiles, quintiles, deciles, percentiles.
 
Las medidas de posición como los cuartiles, quintiles, deciles y percentiles dividen a una
distribución ordenada en partes iguales. Para calcular las medidas de posición es necesario que
los datos estén ordenados de menor a mayor.
 
a - Los Cuartiles (Qn):  son los tres valores de la variable de una distribución que la dividen en
cuatro partes iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro
Cuartiles, se utiliza la fórmula:
 
 Qk = k (n/4)

El primer cuartil (Q1) es el valor de la variable que supera a lo más el 25 % de los datos y es


superado por a lo más el 75 % de ellos en la distribución ordenada de menor a mayor.
 
El segundo cuartil (Q2) es un valor que supera a lo más el 50 % de los datos y es superado por a
lo más el 50 % de ellos, es decir, Q2 coincide con la mediana.
 
El tercer cuartil (Q3) es un valor que supera a lo más al 75 % de los datos y es superado por a lo
más el 25 % de ellos.

b - Los Deciles: Corresponden a los 9 valores que dividen a estos en 10 partes iguales, es decir,


al 10%, al 20%... y al 90%. Los Deciles se designan por D1, D2, D9
 
c-  Los percentiles (Pn): son los noventa y nueve valores de la variable de una distribución que
la dividen en cien partes iguales, es decir, al 1%, al 2%... y al 99% de los datos. Los percentiles se
designan por P1, P2, P99
 
 El percentil p (Pp) es un valor de la variable tal que el p% de la muestra está por debajo y el
(100p) % está sobre.
 
2.
Sexo Edad Semestre

Compañero 1 Mujer 18 4

Compañero 2 Hombre 21 4

Compañero 3 Mujer 21 7

Compañero 4 Hombre 29 1

Compañero 5 Hombre 18 4

Compañero 6 Hombre 24 6

Compañero 7 Mujer 19 3

Compañero 8 Mujer 21 7

Compañero 9 Mujer 17 1

Compañero 10 Hombre 20 3

También podría gustarte