Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADISTICA
DESCRIPTIVA. PROF. FRANCISCO HERRERA: INFORME DE INVESTIGACION DE
TERCERA UNIDAD: Medidas estadísticas descriptivas
Medidas de Centralización: Que sirven para determinar los valores centrales o medios de la
distribución
Medidas de Dispersión: Nos van a dar una idea sobre la representatividad de las medidas
centrales, a mayor dispersión menor representatividad.
Medidas de Localización: Útiles para encontrar determinados valores importantes, para una
"clasificación" de los elementos de la muestra o población.
Medidas de la Simetría: Sirven para ver si la distribución tiene el mismo comportamiento por
encima y por debajo de los valores centrales.
Según la aleatoriedad
Variables: Son los conceptos u objetos que se busca entender o analizar. Sobre todo con
respecto a su relación con otras variables. Así por ejemplo, una variable puede ser el salario de
los trabajadores y lo que queremos analizar son sus principales determinantes (por ejemplo: años
de estudio, educación de los padres, lugar de nacimientos, etc.).
Restricciones: Son determinados límites que nos indican que los resultados del análisis son
razonables. Así por ejemplo, si una de las variables es el número de hijos de una familia, una
restricción natural es que este valor no puede ser negativo.
Relaciones entre las variables: El modelo establece una determinada relación entre las
variables apoyándose en teorías económicas, físicas, químicas, etc.
Representaciones simplificadas: Una de las características esenciales de un modelo
matemáticos es la representación de las relaciones entre las variables estudiadas a través de
elementos de las matemáticas tales como: funciones, ecuaciones, fórmulas, etc.
Fuente bibliográfica
https://www3.gobiernodecanarias.org/medusa/ecoblog/agilarm/files/2014/10/UNIDAD-
3.pdf
https://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt15.html
https://economipedia.com/definiciones/modelo-matematico.html
Ejemplo:
Supongamos que la altura de 15 personas que se presentan a las oposiciones del cuerpo de
policía nacional son las siguientes:
1,82, 1,97, 1,86, 2,01, 2,05, 1,75, 1,84, 1,78, 1,91, 2,03, 1,81, 1,75, 1,77, 1,95, 1,73.
Para elaborar la tabla de frecuencias, los valores se ordenan de menor a mayor, pero en este caso
dado que la variable es continua y podría tomar cualquier valor de un espacio continuo
infinitesimal, hay que agrupar las variables por intervalos.
N = 15
fi = Frecuencia absoluta (número de veces que se repite el suceso en este caso, las alturas que se
encuentran dentro de un determinado intervalo).
hi = Frecuencia relativa
XI FI HI
total 15 100%
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Esto va en
forma de una columna cuando encontremos dos modas, es decir, dos datos que tengan la
misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que
encontramos tres modas. En el caso de la distribución uniforme discreta, cuando todos los
datos tienen una misma frecuencia, se puede definir las modas como indicadas, pero estos
valores no tienen utilidad.
https://economipedia.com/definiciones/frecuencia-relativa.html#:~:text=La%20frecuencia
%20relativa%20es%20una,poblaci%C3%B3n%2Fmuestra%20(N).
https://enciclopediaeconomica.com/frecuencia-relativa/#:~:text=La%20frecuencia
%20relativa%20es%20un,un%20conjunto%20total%20de%20valores.
https://www.uaeh.edu.mx/division_academica/educacion-media/repositorio/2010/6-
semestre/estadistica/moda-para-datos-agrupados-y-desagrupados.pdf
https://es.wikipedia.org/wiki/Moda_(estad%C3%ADstica)
La mediana es un estadístico de posición central que parte la distribución en dos, es decir, deja
la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a menor, o al
contrario de menor a mayor. Esto es, que tengan un orden.
Ejemplo:
En primer lugar los ordenamos de menor a mayor con lo que tendríamos lo siguiente:
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la misma cantidad
de valores tanto a un lado como a otro. ¿Cuántas observaciones tenemos? 9 observaciones.
Calculamos la posición con la fórmula de la mediana correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la observación
cuya posición es la quinta.
Por lo tanto la mediana de esta sería de datos sería el número 10, ya que está en la posición
quinta. Además, podemos comprobar cómo tanto a la izquierda del 5 hay 4 valores (2, 4, 6 y 8) y
a la derecha del 10 hay otros 4 valores (12, 14, 16 y 18).
Q1 = primer cuartil es el percentil 25 (P25). El 25 % de los datos son menores o iguales a Q1.
Q3 = tercer cuartil es el percentil 75 (P75). El 75 % de los datos son menores o iguales a Q3.
Ejemplo:
Sea un conjunto de la edad de los veinte integrantes (N=20) de un club. Supongamos que el
conjunto está ordenado:
Un quintil es la quinta parte de una población estadística, representa el 20% del número total de
individuos de una población determinada. Es un término muy utilizado en economía para
distribuir a la población.
Ejemplos de Quintiles
1. Quintil 1 (Q1): valor que es superior al del 20% de las muestras más bajas.
2. Quintil 2 (Q2): valor que es superior al del 40% de las muestras más bajas.
3. Quintil 3 (Q3): valor que es superior al del 60% de las muestras más bajas.
4. Quintil 4 (Q4): valor que es superior al del 80% de las muestras más bajas
El Decil (Dn) es una medida estadística que se utiliza para indicar el valor por debajo del cual se
encuentra un determinado porcentaje de observaciones.
Cada decil representa un 10% hasta llegar a 100% siendo 100% el total de las muestras
analizadas:
Decil 1 (D1): valor que es superior al del 10% de las muestras más bajas
Decil 2 (D2): valor que es superior al del 20% de las muestras más bajas
Decil 3 (D3): valor que es superior al del 30% de las muestras más bajas
Existen varios métodos para el cálculo de deciles. Veamos uno de los más sencillos (válido para
datos no agrupados):
1. Agrupamos las muestras de menor a mayor valor
2. Calculamos la posición que ocupa el percentil buscado aplicando la siguiente fórmula:
x = (N · i) / 10
Para calcular los percentiles, primero hay que ordenar los datos de forma ascendente.
Una vez ordenados, se resta 0.5 a la posición que ocupa el dato del que queremos calcular el
percentil. Después dividimos entre el número total de datos y multiplicamos por 100.
Siendo P el percentil, Xn la posición del valor en la secuencia de datos y N el número total de
datos.
En primer lugar, es similar a otras medidas de posición no central. Por tanto, nos informa sobre
la posición de un dato respecto a otros.
Por otro lado, en muchas situaciones aporta información más detallada que otros. Por ejemplo,
algunos índices de impacto de revistas científicas utilizan este en lugar del cuartil.
Además, es de mucha utilidad para agrupar una gran cantidad de datos. Cuando trabajamos con
muchos casos, los otros cuantiles pueden arrojar grupos demasiado numerosos y difíciles de
interpretar.
Sin embargo, tiene un inconveniente relacionado con lo anterior. No es útil para muestras con
pocos casos, ya que los grupos serían demasiado pequeños. Por eso, en estas circunstancias se
recomiendan otros como el cuartil o el decil.
Fuente bibliográfica
https://economipedia.com/definiciones/mediana.html
http://www.economia.unam.mx/profesor/barajas/estadis/parte2.pdf
https://www.universoformulas.com/estadistica/descriptiva/cuartiles/
https://www.edufinet.com/consultas-edufiemp/que-es-un-quintil#:~:text=Un%20quintil
%20es%20la%20quinta,para%20distribuir%20a%20la%20poblaci%C3%B3n.
https://www.matematicas10.net/2017/02/ejemplos-de-quintiles.html
https://www.matematicas10.net/2017/02/ejemplos-de-deciles.html
https://curiosoando.com/que-son-los-percentiles
4. Medidas de representación (media aritmética, media geométrica y media armónica).
Definición, características: tipos y propiedades, modelo matemático y partes, ejemplo.
Fuente bibliográfica.
Fuente bibliográfica
Fuente bibliográfica
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del
conjunto y la media, dividido entre la desviación típica elevado también a la cuarta potencia. Sea
el conjunto X=(x1, x2,…, xN), entonces el coeficiente de curtosis será:
Fuentes bibliográficas:
https://wikioes.icu/wiki/Standard_score
https://www.dicenlen.eu/es/diccionario/entradas/puntuacion-estandar#:~:text=Las
%20puntuaciones%20est%C3%A1ndar%20m%C3%A1s%20utilizadas,nombre
%20de%20puntuaci%C3%B3n%20est%C3%A1ndar%20normalizada.
Fuentes bibliográficas:
https://es.wikipedia.org/wiki/Coeficiente_de_Gini
https://www.elblogsalmon.com/conceptos-de-economia/que-es-el-coeficiente-de-gini
9. Medidas de asociación (coeficiente chi cuadrado, coeficiente de contingencia).
Definición, características: tipos y propiedades, modelo matemático y partes,
ejemplo. Fuente bibliográfica.
Es un número que mide el grado de asociación o dependencia de las clasificaciones en
una tabla de contingencia (h x k). Se obtiene mediante la siguiente fórmula:
Cuanto más se acerque la Chi-Cuadrado a cero menos asociación hay (más
independencia) entre los atributos. Cuanto más se acerque la Chi-Cuadrado a su cota
superior más asociación hay (menos independencia) entre los atributos. Cuando la Chi-
Cuadrado es igual a cero no hay asociación entre los atributos. Es decir, los atributos son
independientes.
Características: El estadístico chi-cuadrado tomará un valor igual a 0 si existe
concordancia perfecta entre las frecuencias observadas y las esperadas; por contra, el
estadístico tomará un valor grande si existe una gran discrepancia entre estas frecuencias,
y consecuentemente se deberá rechazar la hipótesis nula.
Modelo matemático:
Ejemplo:
Fuentes bibliográficas:
https://es.wikipedia.org/wiki/Alfa_de_Cronbach
https://asesoriatesis1960.blogspot.com/2014/07/coeficiente-alfa-de-cronbach.html