Está en la página 1de 17

U1NIVERSIDAD NACIONAL EXPERIMENTAL

DE LOS LLANOS OCCIDENTALES


“EZEQUIEL ZAMORA”

ESTADISTICA DESCRIPTIVA UNIVARIADA

Autor: Luis Oliveros


C.I: 25798686
Sub-proyecto: Estadística
Sección: Autoestudio

Barinas, Junio 2021


INTRODUCCION

El objetivo de esta investigación, es identificar aspectos


relacionados estadística descriptiva univariada, para ello, se analiza la
publicación de artículos y otros trabajos de investigación relacionados con
este tema.

En este se exponen conceptos básicos de: medidas de tendencia


central, medidas de posición, medidas de dispersión dando a conocer
ejemplo reales de la vida cotidiana.
Mediadas de tendencia central:

Moda: es el valor de una serie de datos que aparece con más


frecuencia. Se obtiene fácilmente de una clasificación ordenada. A
diferencia de la media aritmética, la moda no se ve afectada por la
ocurrencia de los valores extremos. 

Ejemplo: Los valores siguientes son las calificaciones de un


alumno durante todo el año

7;  8;  9;  7;  9;  8;  8;  8;  7;  8


Podemos afirmar entonces que el modo es igual a 8, dado que es el valor
que aparece con más frecuencia.

Media: es el promedio o medición de tendencia central de uso más


común. Se calcula sumando todas las observaciones de una serie de
datos y luego dividiendo el total entre el número de elementos
involucrados.

Ejemplo para cálculo de la media:

Las edades de 8 niños que van a una fiesta son: 2, 2, 3, 5, 7, 7, 9,


10. Hallar la edad media:

X= 2+2+3+5+7+7+9+10 = 45/8 = 5,625

8
Mediana: es el valor medio de una secuencia ordenada de datos.
Si no hay empates, la mitad de las observaciones serán menores y la otra
mitad serán mayores. La mediana no se ve afectada por ninguna
observación extrema de una serie de datos. Por tanto, siempre que esté
presente una observación extrema es apropiado usar la mediana en vez
de la media para describir una serie de datos.

Para calcular la mediana de una serie de datos recolectados en su


forma sin procesar, primero debemos poner los datos en una clasificación
ordenada. Después usamos la fórmula de punto de posicionamiento:

N+1/2

Para encontrar el lugar de la clasificación ordenada que


corresponde al valor de la mediana, se sigue una de las dos reglas:

1. Si el tamaño de la muestra es un número impar, la mediana se


representa mediante el valor numérico correspondiente al punto de
posicionamiento, la observación ordenada es (n+1)/2.
2. Si el tamaño de la muestra es un número par entonces el punto de
posicionamiento cae entre las dos observaciones medias de la
clasificación ordenada. La mediana es el promedio de los valores
numéricos correspondientes a estas dos observaciones medias.

Ejemplo de cálculo de mediana:

Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.


Solución:
Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.

Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.


El valor de la mediana es: Me = 7.

¿Y si la cantidad de datos es un número par?

En ese caso, la mediana es la media entre los dos valores centrales.

Medidas de posición:

Los cuartíles: son los tres valores que dividen al conjunto de


datos ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo


cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual
o por debajo del cual queda un cuarto (25%) de todos los valores de la
sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de los datos.

Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando


contamos un número grande de datos y tenemos en cuenta que en estos
casos generalmente los datos son resumidos en una tabla de frecuencia.
La fórmula para el cálculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:

k= 1,2,3

Donde:

Lk = Límite real inferior de la clase del cuartil k

n = Número de datos


Fk = Frecuencia acumulada de la clase que antecede a la clase del
cuartil k.

fk = Frecuencia de la clase del cuartil k

c = Longitud del intervalo de la clase del cuartil k

Si se desea calcular cada cuartil individualmente, mediante otra fórmula


se tiene lo siguiente:

 El primer cuartil Q1, es el menor valor que es mayor que una cuarta
parte de los datos; es decir, aquel valor de la variable que supera 25%
de las observaciones y es superado por el 75% de las observaciones.

Fórmula de Q1, para series de Datos agrupados:

Q1= Li + (kn/4 – Fi -1) Ic


fi

Donde:

Li = limite inferior de la clase que lo contiene

n= número total de valores involucrados

fi = la frecuencia de la clase que contiene la medida solicitada.

Fi-1 = frecuencia acumulada anterior a la que contiene la medida


solicitada.

 El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2


= Md), es el menor valor que es mayor que la mitad de los datos, es
decir el 50% de las observaciones son mayores que la mediana y el
50% son menores.

Fórmula de Q2, para series de Datos agrupados:


Q2= Li + P-fa-1 * Ic P= 2n/4

Fi

Donde:

Li= limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida

fi = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida


solicitada.

Ic = intervalo de clase

 El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas
partes de los datos, es decir aquel valor de la variable que supera al
75% y es superado por el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

Q1= Li + P – fa-1 * Ic P 3n/4

fi

Donde:

Li= limite inferior de la clase que lo contiene

P = valor que representa la posición de la medida

fi = la frecuencia de la clase que contiene la medida solicitada.

Fa-1 = frecuencia acumulada anterior a la que contiene la medida


solicitada.

Ic = intervalo de clase.


Otra manera de verlo es partir de que todas las medidas no son
sino casos particulares del percentil, ya que el primer cuartil es el 25%
percentil y el tercer cuartil 75% percentil.

Para Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:

- El primer cuartil:

Cuando n es par:

1* n/4

Cuando n es impar:

1(n+1)

 Para el tercer cuartil

Cuando n es par:

3*n
4

Cuando n es impar:

3 (n+1)

4
Ejemplos: 
a) Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7.
¿Cuál es el valor del tercer cuartil?
 
1° ordenamos los datos de menor a mayor:
 
2;  3;  5;  6;  7;  9;  10;  11;  13
 
n= 9

Los deciles son ciertos números que dividen la sucesión de datos


ordenados en diez partes porcentualmente iguales. Son los nueve valores
que dividen al conjunto de datos ordenados en diez partes iguales, son
también un caso particular de los percentiles. Los deciles se denotan D1,
D2,..., D9, que se leen primer decil, segundo decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar
el aprovechamiento académico.

Datos Agrupados

Para datos agrupados los deciles se calculan mediante la fórmula.

Fórmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:

Cuando n es par:

Cuando n es impar:

EJEMPLOS:

1. La  tabla  muestra  el peso (en Kg)  de los  estudiantes  de la I.E. "J. M.
ARGUEDAS",  Calcula e interpreta los cuatro primeros Deciles:
Solución:
Completamos la tabla hallando F:

Encontramos las clase Decil y seleccionamos el intervalo del cual


tomaremos los datos.

Decil 1:
Respuesta: El 10% de los estudiantes tiene 58,16 Kg de peso o menos.

Decil 2:

Respuesta: El 20% de los estudiantes tiene 65 Kg de peso o menos.

Decil 3:

Respuesta: El 30% de los estudiantes tiene 570,94 Kg de peso o menos.

Decil 4:

Respuesta: El 40% de los estudiantes tiene 75 Kg de peso o menos.

PERCENTILES: Los también llamados centiles, son los 99 valores de la


variable que dividen en 100 la distribución de frecuencias. Representado
por Pk , es un valor de la variable de interés que deja por debajo de sí un
porcentaje k de sujetos, donde k = 1,2....99

El cálculo de los percentiles se realiza utilizando una extensión del


método expuesto para la mediana. La diferencia está en que para la
mediana se trata de localizar la posición de n/2; mientras los percentiles
se hace en base al número n×k/100. Este número es igual a n/2 cundo
calculamos el percentil 50, entonces si k = 50; n×50/100 = n/2.

Al igual que con la mediana, cuando en la distribución de frecuencias los


datos no están en intervalos, se aplica I = 1.

Sin embargo lo que queremos calcular es qué percentil ocupa un valor X


debemos de despejar k i para Xi.

A veces el resultado puede darnos un valor con decimales; en este


caso, tomamos la cantidad entera más próxima.

Fórmula

EJEMPLOS:

1. La tabla muestra el consumo semanal de fruta  de los pacientes de un


hospital, Calcula e interpreta el Percentil 60 y 90.
Solución:
Completamos la tabla hallando F:

Encontramos las Clase Percentil y seleccionamos el intervalo del cual


tomaremos los datos.

Percentil 60:

Respuesta: Semanalmente el 60% de los pacientes consume como


máximo 3.5 Kg de fruta y el 40% restante consume más de 3,5 Kg de
fruta.

Percentil 90:
Respuesta: Semanalmente el 90% de los pacientes consume como
máximo 5,8 Kg de fruta y el 10% restante consume más de 5,8 Kg de
fruta. 

Medidas de dispersión:

Valores máximo y mínimo:


Los valores máximo y mínimo de un conjunto de datos se obtienen con
las funciones max y min. La función max o min nos devuelve dos datos, el
valor máximo xmax y el índice nmax del elemento del vector que guarda
el máximo. Vemos que el quinto elemento del vector x guarda el máximo
valor 1.0.

Rango o amplitud: Indica la dispersión entre los valores extremos de


una variable. se calcula como la diferencia entre el mayor y el menor valor
de la variable. Se denota como R.

Para datos ordenados se calcula como:

R = x(n) - x(1)

Donde: x(n): Es el mayor valor de la variable. x (n): Es el menor valor de la


variable.

Varianza: Es otro parámetro utilizado para medir la dispersión de


los valores Rango intercuartilico de una variable respecto a la media.
Corresponde a la media aritmética de los cuadrados de las desviaciones
respecto a la media. Su expresión matemática es:
donde Xi es el dato i-ésimo y   es la media de los N datos.
desviación típica: La desviación estándar o desviación típica es una
medida que ofrece información sobre la dispersión media de una variable.
La desviación estándar es siempre mayor o igual que cero.

Ejemplo:

Cálculo de la desviación típica:

Edad xi ni
   

20-29 25 14 -18,875 356,2656 4987,71875

30-39 35 17 -8,875 78,7656 1339,01563

40-49 45 22 1,125 1,2656 27,84375

50-59 55 18 11,125 123,7656 2227,78125

60-69 65 9 21,125 446,2656 4016,39063

Total   80     12598,75

Sx =

La desviación típica es de 12,5 años

Coeficiente de variación
El coeficiente de variación se denomina por las siglas CV, se
expresa en un porcentaje, pues se trata de un coeficiente, y se calcula de
la siguiente manera:

CV = desviación estándar / media aritmética x 100

Este coeficiente es utilizado para comparar conjuntos de datos de


poblaciones distintas, teniéndose en cuenta el valor de la media
aritmética, lo que nos permite eliminar las eventuales distorsiones de las
medias de dos o más poblaciones.

Pongamos un ejemplo para entender mejor esta fórmula:

Supongamos que tenemos una población de perros con un peso


medio de 1.000 kilos y una desviación típica de 150 kilos. Por otro lado,
tenemos una población de ratas con un peso medio de 25 kilos y una
desviación típica de 10 gramos. Ahora hemos de comparar la dispersión
de ambas poblaciones utilizando la desviación típica de ambas. Vamos a
ello:
Perros à 150/1.000 = 0,15
Ratas à 10/40 = 0,25

Ahora estos datos hemos de multiplicarlos por 100 para obtener el


coeficiente de variación:

Perros à 0,15 x 100 = 15%


Ratas à 0,25 x 100 = 25%

Así, en la población de perros el coeficiente de variación es de un


15%, mientras que en la población de ratas el coeficiente de variación es
de un 25%. De acuerdo con estos datos, la población con mayor
dispersión es la de ratas, la que tenía una menor desviación típica y la
que, a priori, podría parecer que tendría un coeficiente de variación menor
que el de la población de perros.

También podría gustarte