Estadística Descriptiva

0
INDICE ____________
1.1 CONCEPTOS BÁSICOS DE ESTADÍSTICA: DEFINICIÓN, TEORÍA DE

DESICIÓN, POBLACIÓN, MUESTRA ALEATORIA,PARÁMETROS
ALEATORIOS ......................................................................................................... 2
1.2 DESCRIPCIÓN DE DATOS: DATOS AGRUPADOS Y NO AGRUPADOS, FRECUENCIA DE
CLASE, FRECUENCIA RELATIVA, PUNTO MEDIO, LÍMITES ................................................. 6
1.3 MEDIDAS DE TENDENCIA CENTRAL: MEDIA ARITMÉTICA, GEOMÉTRICA Y PONDERADA,
MEDIANA, MODA, MEDIDAS DE DISPERCIÓN, VARIANZA, DESVIACIÓN ESTÁNDAR,
DESVIACIÓN MEDIA, DESVIACIÓN MEDIANA, RANGO ....................................................... 9
1.4 PARÁMETROS PARA DATOS AGRUPADOS .............................................. 14
1.5 DISTRIBUCIÓN DE FRECUENCIAS: ............................................................. 15
1.6 TÉCNICAS DE AGRUPACIÓN DE DATOS ................................................... 17
1.7 TÉCNICAS DE MUESTREO ........................................................................... 22
1.8 HISTOGRAMAS.............................................................................................. 23
BIBLIOGRAFÍAS: ................................................................................................. 25
1
1.1 Conceptos básicos de estadística
Estadística:
La estadística es una rama de las matemáticas que te permite recopilar, organizar

y analizar datos según la necesidad que tengas, por ejemplo: obtener un resultado,
comparar información, tomar mejores decisiones, entre muchas cosas más.
Se puede decir que es la Ciencia de los Datos y que su principal objetivo es mejorar
:la comprensión de los hechos a partir de la información disponible.
Tipos de estadística:
Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e

inferencial.
 Estadística descriptiva: Se refiere a los métodos de recolección,

organización, resumen y presentación de un conjunto de datos. Se trata
principalmente de describir las características fundamentales de los datos y
para ellos se suelen utilizar indicadores, gráficos y tablas.
 Estadística inferencial: Se trata de un paso más allá de la mera descripción.
Se refiere a los métodos utilizados para poder hacer predicciones,
generalizaciones y obtener conclusiones a partir de los datos analizados
teniendo en cuenta el grado de incertidumbre existente.
o Estadística paramétrica: Se caracteriza porque asume que los datos
tienen una determinada distribución o se especifican determinados
parámetros que deberían cumplirse.
o Estadística no paramétrica: En ella no es posible asumir ningún tipo
de distribución subyacente en los datos ni tampoco un parámetro
específico. Un ejemplo de este tipo de análisis es la prueba binomial.
Teoría de decisión:
La teoría de decisiones consiste en tomar una decisión de un conjunto de posibles

acciones. Se debe tener en cuenta que existe incertidumbre al escoger que vamos
2
a hacer, debido a que el resultado se ve afectado por factores externos que no están
en nuestro control.
Cabe resaltar que todas las decisiones están sujetas a la generación de un

resultado.
La teoría de decisiones proporciona una manera útil de clasificar modelos para la

toma de decisiones, esta se clasifica en cuatro categorías
ELEMENTOS DE UN PROBLEMA DE DECISIÓN en ambiente de incertidumbre:
Un problema de decisión se define por la cuarteta (D, E, C, ≤), donde:
3
 D: Espacio de opciones. Es el conjunto de posibles alternativas, debe de
construirse de manera que sea exhaustivo (que agote todas las posibilidades
que en principio parezcan razonables) y excluyente (que la elección de uno
de los elementos de D excluya la elección de cualquier otro).
D = {d1,d2,...,dk}.
 E: Espacio de eventos inciertos. Contiene los eventos inciertos relevantes al

problema de decisión.
Ei = {Ei1,Ei2,...,Eimi}., i=1,2,…,k.
 C: Espacio de consecuencias. Es el conjunto de consecuencias posibles y

describe las consecuencias de elegir una decisión.
C = {c1,c2,...,ck}.
 ≤: Relación de preferencia entre las distintas opciones. Se define de manera

que d1≤d2 si d2 es preferido sobre d1.
Población:
En estadística, el término “población” se refiere al conjunto de elementos que se

quiere investigar, estos elementos pueden ser objetos, acontecimientos, situaciones
o grupo de personas.
Tipos de población:
 Población estadística finita: Es aquella en la que el número de valores que

la componen tiene un fin. Por ejemplo, la población estadística que nos indica
la cantidad de árboles de una ciudad es finita. Es cierto que puede variar con
el tiempo, pero en un instante determinado es finita, tiene fin.
 Población estadística infinita: Se trata de aquella población que no tiene

fin. Por ejemplo, el número de planetas que existen en el universo. Aunque
puede que sea finito, el número es tan grande y desconocido que
estadísticamente se asume como infinito.
4
Muestra:
Un subconjunto cualquiera de la población. Para que la muestra nos sirva para

extraer conclusiones sobre la población deber ser representativa, lo que se
consigue seleccionando sus elementos al azar, lo que da lugar a una muestra
aleatoria.
Muestra aleatoria:
Es aquel procedimiento de selección de la muestra en el que todos y cada uno de

los elementos de la población tiene una cierta probabilidad de resultar elegidos.
Estos son los tipos de muestra aleatoria:
 Muestra aleatoria simple: Todos los componentes de la población tienen

exactamente las mismas posibilidades de formar parte de la muestra y son
elegidos al azar, mediante sorteos o funciones RND informáticas.
 Muestra aleatoria estratificado: Este método se utiliza si interesa conocer
datos concretos según esas diferentes características en la población.
 Muestra aleatoria de conglomerados: También se escogerán las muestras
aleatoriamente entre cada grupo ya formado.
 Muestra aleatoria sistemática: Es escoge un primer individuo al azar. A
partir de él, se aplica el intervalo y se escogen los individuos o casos,
previamente numerados, que resulten de la aplicación de ese intervalo. Aquí
ya no todos pueden ser escogidos porque los que están en medio del
intervalo no pueden serlo.
Parámetro aleatorio:
Se llama variable aleatoria aquella que toma diversos valores o conjuntos de valores
con distintas probabilidades. Existen 2 características importantes de una variable
aleatoria, sus valores y las probabilidades asociadas a esos valores.
Una tabla, gráfico o expresión matemática que dé las probabilidades con que una
variable aleatoria toma diferente valores, se llama distribución de la variable
aleatoria.
5
1.2 Descripción de datos
Datos agrupados y no agrupados:
Los datos agrupados son datos que se han agrupado en categorías. Se

pueden utilizar histogramas y tablas de frecuencia para mostrar este tipo de
datos:
Histograma de frecuencia relativa que muestra las ventas de

libros de un día determinado, ordenados por precio.
Una tabla de frecuencia que muestra datos agrupados por

altura.
Datos agrupados frente a datos no agrupados:
Los datos no agrupados son los datos que recopila por primera vez de un
experimento o estudio. Los datos son sin procesar, es decir, no están
ordenados en categorías, clasificados o agrupados de otra manera. Un
conjunto desagrupado de datos es básicamente una lista de números.
Cálculo de la media muestral para datos agrupados:
Cuando tiene una tabla de frecuencia u otro grupo de datos, el conjunto

original de datos se pierde y se reemplaza con estadísticas para el grupo. No
puede encontrar la media muestral exacta (ya que no tiene los datos
6
originales), pero puede encontrar una estimación. La fórmula para estimar la
media muestral para datos que han sido agrupados es:
 x̄ es la media muestral,
 x es el punto medio de la clase (o categoría),
 f es la frecuencia de clase.
Datos no agrupados:
En estadística, los datos no agrupados son aquellos datos que no se

agrupan, sino que se estudian por separado. Es decir, cuando los datos no
están agrupados se analiza cada valor del conjunto de datos individualmente.
De manera que en los datos no agrupados no se forman intervalos, a

diferencia de los datos agrupados.
Una vez se ha construido la tabla de frecuencias, cuando los datos no están

agrupados es habitual calcular varias medidas estadísticas.
En concreto, se suelen determinar las medidas de tendencia central, las

medidas de dispersión y las medidas de posición, ya que permiten resumir
una muestra de datos y, además, compararla con otros conjuntos de datos.
Frecuencia de clase:
Punto que divide a la clase en dos partes iguales. Es el promedio entre los límites
superior e inferior de la clase. Intervalo de clase: para una distribución de
7
frecuencias que tiene clases del mismo tamaño, el intervalo de clase se obtiene
restando el límite inferior de una clase del límite inferior de la siguiente.
Frecuencia relativa:
Es la relación o cociente entre la frecuencia absoluta y el número total de

observaciones. Es la proporción entre la frecuencia de un intervalo y el número total
de datos.
Punto medio:
Punto medio es el punto que divide a un segmento en dos partes iguales. El punto
medio de un segmento, es único y equidista de los extremos del segmento.
Cumpliendo esta última condición, pertenece a la mediatriz del segmento. La
fórmula para determinar el punto medio de un segmento en el plano, con
coordenadas: (x1,y1) y (x2,y2) es: [(x1 + x2) / 2] + [(y1 + y2) / 2]
8
Limites:
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
1.3 Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que informan sobre
el centro de la distribución de la muestra o población estadística.
Las medidas de tendencia central, como es obvio, persiguen una serie de objetivos
que justifican su existencia.
En primer lugar, las medidas de tendencia central sirven para conocer en qué lugar
se ubica el elemento promedio, o típico del grupo. Imaginemos que queremos saber
qué grupo de música es el favorito de la clase. Para ello, podemos utilizar la moda.
9
Media aritmética:
La media aritmética es un tipo de media que otorga la misma ponderación a todos
los valores.
Existen muchos tipos de media y la más conocida es la media aritmética. Sin
embargo, la idea general se mantiene en todos los tipos de media: queremos saber
un valor promedio. Al ser una medida de tendencia central, lo que busca es
aportarnos información sobre el centro.
La media aritmética es lo que se conoce como media al uso. Sumamos todos los
valores y lo dividimos entre la cantidad de observaciones.
 Símbolo de la media aritmética:
El símbolo de la media aritmética es una X con una barra encima. Por lo que
quedaría así ↓
Símbolo de la media aritmética → x̄
 Fórmula de la media aritmética
Media geométrica:
La media geométrica es un tipo de media que se calcula como la raíz del producto
de un conjunto de números estrictamente positivos
La media geométrica se calcula como un producto conjunto. Es decir, que todos los
valores se multiplican entre sí. De modo que si uno de ellos fuera cero, el producto
total sería cero. Por ello, debemos siempre tener en cuenta que a la hora de calcular
la media geométrica necesitamos números que sean únicamente positivos.
Uno de sus principales usos es para calcular medias sobre porcentajes, pues su
cálculo ofrece unos resultados más adaptados a la realidad.
 Fórmula de la media geométrica
10
Media ponderada:
La media ponderada es un tipo de media que otorga diferentes pesos a los distintos
valores sobre los que se calcula.
Se diferencia de la media aritmética en que no le da la misma importancia a todos
los valores. De hecho, como veremos más tarde, en realidad la media aritmética es
una media ponderada en la que todos los valores son igual de importantes.
 Fórmula de la media ponderada
Mediana:
La mediana es un estadístico de posición central que parte la distribución en dos,
es decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a
menor, o al contrario de menor a mayor.
La mediana, junto con la media y la varianza es un estadístico muy ilustrativo de
una distribución. Al contrario que la media que puede estar desplazada hacia un
lado o a otro, según la distribución, la mediana siempre se sitúa en el centro de esta.
 Fórmula de la mediana
La fórmula no nos dará el valor de la mediana, lo que nos dará es la posición en la
que está dentro del conjunto de datos. Debemos tener en cuenta, en este sentido,
si el número total de datos u observaciones que tenemos (n) es par o impar. De tal
forma que la fórmula de la mediana es:
Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las observaciones
Cuando el número de observaciones es impar:

Mediana = (n+1) / 2 → Valor de la observación
11
Moda:
La moda estadística de un conjunto de datos, se define como el número que está
representado más veces dentro de esos datos, es decir, aquel número que presenta
una mayor frecuencia absoluta dentro de la muestra.
¿Cómo se calcula la moda?
La moda puede ser calculada tanto para variables cuantitativas como para variables
cualitativas.
Medidas de dispersión:
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de
arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de
una variable.
las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es
conocer de manera resumida una característica de la variable estudiada. En este
sentido, deben acompañar a las medidas de tendencia central.
Varianza:
La varianza es una medida de dispersión que representa la variabilidad de una serie
de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones.
También se puede calcular como la desviación típica al cuadrado. Dicho sea de
paso, entendemos como residuo a la diferencia entre el valor de una variable en un
momento y el valor medio de toda la variable.
 Fórmula
Desviación estándar o típica:

La desviación estándar o desviación típica es una medida que ofrece información
sobre la dispersión media de una variable. La desviación estándar es siempre mayor
o igual que cero.
Para entender este concepto necesitamos analizar 2 conceptos fundamentales.
12
Esperanza matemática, valor esperado o media: Es la media de nuestra serie de
datos.
Desviación: La desviación es la separación que existe entre un valor cualquiera de
la serie y la media.
Ahora, entendiendo estos dos conceptos la desviación típica se calculará de forma
similar a la media. Pero tomando como valores las desviaciones.
 Fórmulas para calcular la desviación típica
Desviación media:
La dispersión estadística es el grado en que una distribución de datos se aleja, o se
acerca, en valor absoluto a la media aritmética, como estadístico de posición central.
Por tanto, las medidas de dispersión van a acompañar siempre a esa media o
promedio.
De esta forma, estarían informando de la variabilidad o dispersión de los datos en
relación a ella. A mayores valores, como veremos a continuación, mayor dispersión
estadística.
https://economipedia.com/definiciones/dispersion-estadistica.html
Desviación mediana:
la desviación absoluta mediana (DMA) es una medida robusta de la variabilidad de
una muestra univariada de datos cuantitativos. También puede referirse al
parámetro poblacional que estima la MAD calculada a partir de una muestra.
Para un conjunto de datos univariados X 1, X 2,..., X n, la MAD se define como la
mediana de las desviaciones absolutas de la mediana de los datos
https://academia-lab.com/enciclopedia/desviacion-mediana-absoluta/
Rango:
El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:
13
R = Máxx – Mínx
1.4 Parámetros para datos agrupados

Media aritmética para datos agrupados:
Si se tiene una cantidad considerable de datos, se recomienda que la variableen
estudio se clasifique en un cuadro de distribución de frecuencias. Laexpresión
matemática para el cálculo de la media aritmética es:
f k = frecuencias de cada clase o intervalo; en donde k= 1,2,3,…,n clase o

intervalo.
x k = marcas de clase de cada intervalo, en donde k= 1,2,3,…,n marca de clase
de cada intervalo
Cálculo de la mediana para datos agrupados en intervalos de clase.
En ocasiones para realizar el análisis estadístico, es necesario que el conjunto de
datos esté agrupado en una tabla de distribución de frecuencias. El procedimiento
de cálculo se debe realizar mediante una interpolación, que se lleva a cabo de la
manera siguiente:
1. El intervalo de clase que contiene a la mediana se ubica mediante el cálculo del
cociente del número de datos en la tabla (n) entre dos n/2.
2. Se procede a encontrar el valor de las variables siguientes:
 Lin= límite inferior del intervalo de clase que contiene la mediana.
 n= número total de datos en la tabla de frecuencias.
 Fac=frecuencia acumulada hasta el intervalo de clase que antecede al que
contiene la mediana.
 f i= frecuencia absoluta del intervalo de clase que contiene la mediana.
 ti= tamaño del intervalo de la clase que contiene la mediana.
 La mediana se calcula mediante la relación de interpolación siguiente
14
1.5 Distribución de Frecuencias:
Definición de distribución de frecuencias La distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias Frecuencia absoluta: La frecuencia absoluta o simplemente

frecuencia es el número de veces que aparece un determinado valor en un estudio
estadístico. Se representa por 𝑓𝑖 , aunque otros autores la representan como 𝑛𝑖 . La
suma de las frecuencias absolutas es igual al número total de datos, que se
representa con la letra 𝑁. Para indicar resumidamente estas sumas se utiliza la letra
griega 𝛴 (sigma mayúscula) que se lee suma o sumatoria.
Frecuencia acumulada:
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los

valores inferiores o iguales al valor considerado. Se representa por 𝑓𝑎𝑖.
15
Frecuencia relativa:
La frecuencia relativa (𝑓𝑟𝑖) es el cociente entre la frecuencia absoluta de un

determinado valor y el número total de datos.
𝑓𝑟𝑖 = 𝑓𝑖 /𝑁
La frecuencia relativa es un número comprendido entre 0 y 1.
La suma de las frecuencias relativas es igual a 1.
Frecuencia relativa acumulada:
La frecuencia relativa acumulada (frai) es la suma de las frecuencias relativas de

todos los valores inferiores o iguales al valor considerado. También se pueden
calcular como el cociente entre la frecuencia acumulada de un determinado valor y
el número total de datos.
16
Frecuencia porcentual:
La frecuencia porcentual (fpi) es el porcentaje de la frecuencia absoluta respecto al

total de datos. Y se calcula multiplicando a frecuencia relativa por 100. Se expresar
en tanto por ciento.
𝑓𝑝𝑖 = 𝑓𝑟𝑖 × 100
1.6 Técnicas de agrupación de datos

Es aquella distribución en la distribución tabular de los datos estadísticos se
encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los
datos originales de varios valores adyacentes del conjunto se combinan para formar
un intervalo de clases.
Límites de clase:
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
17
Rango de la clase:
Es la diferencia entre el límite superior y el límite inferior y a esto se le conoce como

Rango de datos.
Fronteras de clase:
Son los puntos medios entre límites de clases adyacentes. Los límites de una clase
estarán siempre contenidos entre las fronteras de la misma clase y tendrán mayor
aproximación que los datos, y por lo tanto también que los límites.
Marca de clase:
La marca de clase es el punto medio de cada intervalo, marca de clase es usada

para el cálculo de ciertos parámetros, como la media aritmética o la desviación
estándar.
Entonces, la marca de clase es el punto medio de cualquier intervalo. Este valor

también es muy útil para encontrar la varianza de un conjunto de datos ya
agrupados en clases, lo que a su vez permite comprender a qué distancia del
centro se encuentran esos datos determinados.
18
Intervalo de clase:
Los intervalos de clase se emplean si las variables toman un número grande de

valores o la variable es continua.
 Intervalo abierto
Un intervalo abierto es aquel que no incluye los extremos entre los cuales está
comprendido, pero sí todos los valores ubicados entre estos. Se representa
mediante una expresión del tipo a < x < b ó (a;b).
Por ejemplo, si tenemos el intervalo abierto (1;5), tendremos el conjunto de
números mayores a 1 y menores que 5. Sin incluir el 1 y el 5.
 Intervalo cerrado
Un intervalo cerrado es aquel que incluye los extremos del intervalo y todos los
valores comprendidos entre estos. Se representa con una expresión del tipo a ≤ x
≤ b ó [a;b].
Intervalo semiabierto
Un intervalo semiabierto es aquel que incluye tan solo uno de los extremos de los
valores que están entre ellos, de modo que el otro extremo queda excluido.
Pueden estar incluidos o excluidos tanto el extremo derecho como el izquierdo.
Se representa con una expresión del tipo a ≤ x < b ó a < x ≤ b, lo que

sería [a;b) ó (a;b].
Por ejemplo, si tenemos el intervalo semiabierto [1;5), tendremos un conjunto de
números mayores o iguales a 1 y menores a 5. Incluyendo el 1 pero no el 5.
19
Diagrama de tallos y hojas:
Un diagrama donde cada valor de datos dividido en una hoja y un tallo.
En un diagrama de tallo y hoja cada dato está separado por la hoja, que es su último
dígito, y el tallo, que son las cifras restantes. De modo que en un diagrama de tallo
y hoja se pone cada hoja en la línea de su tallo correspondiente.
Para hacer un diagrama de tallo y hoja se deben seguir los siguientes

pasos:
 Ordenar los datos de menor a mayor.

 Si es necesario, redondear los números hasta que tengan el número de
cifras deseadas.
 Decidir en qué cifra se hará el corte entre el tallo y la hoja, es decir,
determinar cuántas cifras serán las hojas. Normalmente, se hace que la
hoja sea solamente el último dígito de cada dato.
20
 Representar cada dato en el diagrama de tallo y hoja. Los tallos se colocan
en la columna de la izquierda en orden ascendente, mientras que las hojas
se ponen en la columna de la derecha a la altura de su tallo
correspondiente y también en orden ascendente.
Diagrama de Pareto:
Es una gráfica para organizar datos de forma que estos queden en orden
descendente, de izquierda a derecha y separados por barras.
El diagrama de Pareto sirve para analizar un problema y determinar sus principales

causas. De hecho, el diagrama de Pareto es la base del principio de Pareto, más
abajo veremos en qué consiste esta regla estadística.
El diagrama de Pareto también se conoce como curva cerrada o distribución A-

B-C y fue inventado por el economista italiano Vilfredo Pareto.
Los pasos para hacer un diagrama de Pareto son:
 Recolectar los datos estadísticos del problema a analizar.

 Ordenar los valores según su frecuencia absoluta de manera descendente,
es decir, de mayor frecuencia absoluta a menor.
 Calcular el porcentaje de cada categoría. Para ello simplemente se debe
dividir la frecuencia absoluta de la categoría entre el número total de datos y
luego multiplicar por 100.
21
 Determinar el porcentaje acumulado, que es equivalente a la suma del
porcentaje de la categoría más todos los porcentajes anteriores.
 Representar en una gráfica las frecuencias absolutas mediante barras y los
porcentajes acumulados mediante un polígono de frecuencias.
1.7 Técnicas de Muestreo
El muestreo es una técnica de selección de miembros individuales o de un
subconjunto de la población para hacer inferencias estadísticas a partir de ellos y
estimar las características de toda la población.
También es un método conveniente en cuanto al tiempo y eficaz en función de los
costos y, por lo tanto, constituye la base de cualquier diseño de investigación. Las
técnicas de muestreo pueden utilizarse en un programa informático de encuestas
de investigación para una derivación óptima.
Por ejemplo, si un fabricante de medicamentos desea investigar los efectos
secundarios adversos de un medicamento en la población del país, es casi
imposible llevar a cabo un estudio de investigación en el que participen todos. Para
ello, el investigador elige tener una muestra de personas de cada grupo demográfico
para luego investigar, dándole una retroalimentación indicativa sobre el
comportamiento del medicamento.
Métodos de muestreo:
Existen dos métodos de muestreo: El muestreo probabilístico y el no
probabilístico:
 Muestreo probabilístico: El muestreo probabilístico es una técnica de
muestreo en la que un investigador establece una selección de unos pocos
criterios y elige al azar a los miembros de una población. Todos los miembros
tienen la misma oportunidad de formar parte de la muestra con este
parámetro de selección.
 Muestreo no probabilístico: En el muestreo no probabilístico, el
investigador elige al azar a los miembros de la investigación. Este método de
muestreo no es un proceso de selección fijo o predefinido. Esto dificulta que
todos los elementos de una población tengan las mismas posibilidades de
ser incluidos en una muestra.
22
1.8 Histogramas
En estadística, un histograma es una representación gráfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a
la frecuencia de los valores representados. Sirven para obtener una "primera vista"
general, o panorama, de la distribución de la población, o de la muestra, respecto a
una característica, cuantitativa y continua (como la longitud o el peso). De esta
manera ofrece una visión de grupo permitiendo observar una preferencia, o
tendencia, por parte de la muestra o población por ubicarse hacia una determinada
región de valores dentro del espectro de valores posibles (sean infinitos o no) que
pueda adquirir la característica. Así pues, podemos evidenciar comportamientos,
observar el grado de homogeneidad, acuerdo o concisión entre los valores de todas
las partes que componen la población o la muestra, o, en contraposición, poder
observar el grado de variabilidad, y por ende, la dispersión de todos los valores que
toman las partes, también es posible no evidenciar ninguna tendencia y obtener que
cada miembro de la población toma por su lado y adquiere un valor de la
característica aleatoriamente sin mostrar ninguna preferencia o tendencia.
En el eje vertical se representan las frecuencias, es decir, la cantidad de población

o la muestra, según sea el caso, que se ubica en un determinado valor o subrango
de valores de la característica que toma la característica de interés. Evidentemente,
cuando este espectro de valores es infinito o muy grande, se reduce a solo una
parte que muestre la tendencia o comportamiento de la población. En otras
ocasiones, este espectro es extendido para mostrar el alejamiento o ubicación de la
población o la muestra analizada respecto de un valor de interés.
23
Se utilizan para relacionar variables cuantitativas continuas. Para variables
cuantitativas discretas las barras se dibujan separadas y el gráfico se llama
diagrama de frecuencias, porque la variable representada en el eje horizontal ya no
representa un espectro continuo de valores, sino valores cuantitativos específicos,
igual que ocurre en un diagrama de barras, usado para representar una
característica cualitativa o categórica. Su utilidad se hace más evidente cuando se
cuenta con un gran número de datos cuantitativos y que se han agrupado en
intervalos de clase. Ejemplos de su uso es la representación de edades o estaturas
de una población. Por comodidad, sus valores se agrupan en clases, es decir, en
intervalos continuos. En los casos en los que los datos son cualitativos (no
numéricos), como cierto grado de acuerdo o nivel de estudios, es preferible
un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas
que en ciencias naturales y exactas. Y permite la comparación de los resultados de
un proceso.
24
BIBLIOGRAFÍAS:
GCF. (2022, 29 marzo). Estadística básica: ¿Qué es la estadística?

GCFGlobal.org. Recuperado 21 de febrero de 2023, de
https://edu.gcfglobal.org/es/estadistica-basica/que-es-la-estadistica/1/
Roldán, P. N. (2022, 24 noviembre). Estadística. Economipedia.

https://economipedia.com/definiciones/estadistica.html
Canizales, D. C. (2015). Teoría de decisiones. SlidePlayer. Recuperado 21 de

febrero de 2023, de https://slideplayer.es/slide/1092170/
Instituto Nacional de Estadística. (2019, 22 noviembre). Qué es población. ine.gob.

Recuperado 21 de febrero de 2023, de https://www.ine.gob.cl/ine-
ciudadano/definiciones-estadisticas/poblacion/que-es-poblacion
López, J. F. (2022, 24 noviembre). Población estadística. Economipedia.

https://economipedia.com/definiciones/poblacion-estadistica.html
Software DELSOL. (2019, 12 agosto). â– · Tipos de muestreo.

https://www.sdelsol.com/blog/tendencias/tipos-de-muestreo/
Ramón, I. J. M. (2023, 21 febrero). 3.1 Conceptos básicos de estadística:

Definición, Teoría de decisión, Población, Muestra aleatoria, Parámetros
aleatorios. https://probabilidadyestadisticaitsav.blogspot.com/2012/06/31-
conceptos-basicos-de-estadistica.html
ITCM & ITCM. (2010, 15 abril). 1.7. técnicas de agrupación. slideshare.

https://es.slideshare.net/neneantrox/17-tcnicas-de-agrupacin
Datos no agrupados (estadística) (probabilidadyestadistica.net)

Agresti A. (1990) Análisis de datos categóricos. John Wiley and Sons, Nueva
York.
Klein, G. (2013). La caricatura Introducción a la estadística. Colina y Wamg.
Datos agrupados / Datos no agrupados: definición, ejemplos en 2023 →
STATOLOGOS®
25
Unidad III.pdf (itpn.mx)
Licenciado en Matemáticas. Universidad de los Andes.
Última edición el 20 de mayo de 2021.
Marca de clase: concepto, para qué sirve, cómo se saca, ejemplos (lifeder.com)
Editorial Grudemi (2019). Intervalos. Recuperado de Enciclopedia Económica
(https://enciclopediaeconomica.com/intervalos/). Última actualización: marzo 2021.
Editorial Grudemi (2019). Intervalos. Recuperado de Enciclopedia Económica
(https://enciclopediaeconomica.com/intervalos/). Última actualización: marzo 2021.
http://probabilidadyestadisticaitsav.blogspot.com/2012/06/33-medidas-de-
tendencia-central-media.html
https://cursos.clavijero.edu.mx/cursos/029_rm/modulo4/contenidos/tema4.2.html
https://www.cecytcampeche.edu.mx/BibliotecaVirtual/6toSemestre/06_BAS_Prob_
y_Estadistica_2do_parcial.pdf
https://sites.google.com/site/probyestacecytechig/parcial-i/conceptos-
generales/distribucion-de-frecuencias
https://es.scribd.com/document/389804758/3-5-Parametros-Para-Datos-
Agrupados-Alumnos
https://economipedia.com/definiciones/media-aritmetica.html
Fórmula de la media geométrica
https://economipedia.com/definiciones/media-geometrica.html
https://economipedia.com/definiciones/media-ponderada.html
https://economipedia.com/definiciones/mediana.html
https://estadisticamente.com/moda-estadistica/
https://economipedia.com/definiciones/medidas-de-dispersion.html
https://economipedia.com/definiciones/varianza.html
https://economipedia.com/definiciones/desviacion-tipica.html
26

Estadística Descriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística Descriptiva

Cargado por

Copyright:

Formatos disponibles

0

1.1 CONCEPTOS BÁSICOS DE ESTADÍSTICA: DEFINICIÓN, TEORÍA DE

1.2 DESCRIPCIÓN DE DATOS: DATOS AGRUPADOS Y NO AGRUPADOS, FRECUENCIA DE

CLASE, FRECUENCIA RELATIVA, PUNTO MEDIO, LÍMITES ................................................. 6

1.3 MEDIDAS DE TENDENCIA CENTRAL: MEDIA ARITMÉTICA, GEOMÉTRICA Y PONDERADA,

MEDIANA, MODA, MEDIDAS DE DISPERCIÓN, VARIANZA, DESVIACIÓN ESTÁNDAR,

DESVIACIÓN MEDIA, DESVIACIÓN MEDIANA, RANGO ....................................................... 9

1.4 PARÁMETROS PARA DATOS AGRUPADOS .............................................. 14

1.5 DISTRIBUCIÓN DE FRECUENCIAS: ............................................................. 15

1.6 TÉCNICAS DE AGRUPACIÓN DE DATOS ................................................... 17

1.7 TÉCNICAS DE MUESTREO ........................................................................... 22

La estadística es una rama de las matemáticas que te permite recopilar, organizar

Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e

 Estadística descriptiva: Se refiere a los métodos de recolección,

La teoría de decisiones consiste en tomar una decisión de un conjunto de posibles

Cabe resaltar que todas las decisiones están sujetas a la generación de un

La teoría de decisiones proporciona una manera útil de clasificar modelos para la

ELEMENTOS DE UN PROBLEMA DE DECISIÓN en ambiente de incertidumbre:

Un problema de decisión se define por la cuarteta (D, E, C, ≤), donde:

 E: Espacio de eventos inciertos. Contiene los eventos inciertos relevantes al

 C: Espacio de consecuencias. Es el conjunto de consecuencias posibles y

 ≤: Relación de preferencia entre las distintas opciones. Se define de manera

En estadística, el término “población” se refiere al conjunto de elementos que se

 Población estadística finita: Es aquella en la que el número de valores que

 Población estadística infinita: Se trata de aquella población que no tiene

Un subconjunto cualquiera de la población. Para que la muestra nos sirva para

Es aquel procedimiento de selección de la muestra en el que todos y cada uno de

Estos son los tipos de muestra aleatoria:

 Muestra aleatoria simple: Todos los componentes de la población tienen

Datos agrupados y no agrupados:

Los datos agrupados son datos que se han agrupado en categorías. Se

Histograma de frecuencia relativa que muestra las ventas de

Una tabla de frecuencia que muestra datos agrupados por

Datos agrupados frente a datos no agrupados:

Cálculo de la media muestral para datos agrupados:

Cuando tiene una tabla de frecuencia u otro grupo de datos, el conjunto

En estadística, los datos no agrupados son aquellos datos que no se

De manera que en los datos no agrupados no se forman intervalos, a

Una vez se ha construido la tabla de frecuencias, cuando los datos no están

En concreto, se suelen determinar las medidas de tendencia central, las

Es la relación o cociente entre la frecuencia absoluta y el número total de

1.3 Medidas de tendencia central

Cuando el número de observaciones es impar:

Desviación estándar o típica:

1.4 Parámetros para datos agrupados

f k = frecuencias de cada clase o intervalo; en donde k= 1,2,3,…,n clase o

Tipos de frecuencias Frecuencia absoluta: La frecuencia absoluta o simplemente

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los

La frecuencia relativa (𝑓𝑟𝑖) es el cociente entre la frecuencia absoluta de un

La frecuencia relativa es un número comprendido entre 0 y 1.

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada:

La frecuencia relativa acumulada (frai) es la suma de las frecuencias relativas de

La frecuencia porcentual (fpi) es el porcentaje de la frecuencia absoluta respecto al

𝑓𝑝𝑖 = 𝑓𝑟𝑖 × 100

1.6 Técnicas de agrupación de datos

Es la diferencia entre el límite superior y el límite inferior y a esto se le conoce como

La marca de clase es el punto medio de cada intervalo, marca de clase es usada

Entonces, la marca de clase es el punto medio de cualquier intervalo. Este valor

Los intervalos de clase se emplean si las variables toman un número grande de

Se representa con una expresión del tipo a ≤ x < b ó a < x ≤ b, lo que

Un diagrama donde cada valor de datos dividido en una hoja y un tallo.

Para hacer un diagrama de tallo y hoja se deben seguir los siguientes