Está en la página 1de 8

UNIDAD 1.

ESTADÍSTICA DESCRIPTIVA

CONCEPTOS BÁSICOS

 ESTADÍSTICA
Es el estudio científico que consiste en la obtención o recopilación, organización, representación y
análisis de observaciones, con el fin de describir el conjunto de datos obtenidos, así como inferir
generalizaciones acerca de las características de todas las observaciones a partir de una parte de estas;
para tomar las decisiones más acertadas en el campo de su aplicación.

 CLASIFICACIÓN DE LA ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA Es el estudio que incluye la obtención, organización, presentación y


descripción de información numérica.
ESTADÍSTICA INFERENCIAL Es una técnica mediante la cual se obtienen generalizaciones o se
toman decisiones en base a una información parcial o completa
obtenida mediante técnicas descriptivas.

 ETAPAS DE UN ESTUDIO ESTADÍSTICO


i. Recolección de datos.
ii. Organización, presentación: tabulación y graficación de datos.
iii. Descripción de características de estudio (cálculo de medidas de posición central, de posición, de
dispersión, de forma).
iv. Análisis formal de las características.

 POBLACIÓN
Conjunto de elementos a los que se les estudia una o unas características. Llamada también población
de estudio.

 INDIVIDUO
Cada uno de los elementos que compone la población.

 MUESTRA
Subconjunto representativo de la población.

 VARIABLE
Característica propia del individuo objeto de estudio.

 TIPOS DE VARIABLES

CUALITATIVA O CATEGÓRICA NOMINAL: Agrupa los elementos en categorías sin tener un orden.
Las características no son
cuantificables, define una
ORDINAL: Agrupa los elementos en categorías que siguen un orden.
cualidad o un atributo.
CUANTITATIVA O NUMÉRICA DISCRETA: Las características son numéricas numerables. Se asocia al
Las características son conjunto de los números naturales. Surge como resultado del conteo.
cuantificables o numéricas. Adoptan solamente valores enteros a lo largo de un intervalo.
CONTÍNUA: Las características son numéricas no numerables. Se asocia al
conjunto de los números reales. Surge del hecho de medir y puede tomar
todos los valores de un intervalo. Adopta un valor en cualquier punto
(entero o fraccionario) a lo largo de un intervalo
Ing. Nindirí Armenta
ESCALAS DE MEDICIÓN

 Escala nominal

Los datos son etiquetas o categorías que se usan para definir un atributo de un elemento. Los datos nominales
pueden ser numéricos o no numéricos. No presenta un orden o dimensión particular, son observaciones que
pueden clasificarse o contarse. En esta escala cada persona u objeto debe pertenecer a una y solamente una
de las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo; es decir, tiene que contener
a todos los casos posibles. Ejemplos: el género de una persona es un dato nominal no numérico, el número de
la camiseta en un equipo de fútbol es un dato nominal numérico, el número de DNI.

 Escala ordinal

Los datos pueden usarse para jerarquizar u ordenar las observaciones. Los datos ordinales pueden ser
numéricos o no numéricos. Ejemplos: las medidas: pequeño, mediano y grande son datos ordinales no
numéricos, preferencia a productos de consumo, la edad de una persona en años es un dato ordinal numérico.

 Escala de intervalo

Se expresa a través de una unidad de medición y los datos son numéricos. El cero es arbitrario (la variable
puede tomar ese valor y tiene un significado), no denota ausencia de la característica. Puede tomar valores
negativos. Permite hacer comparaciones por medio de diferencias o de sumas, pero no admite comparaciones
por medio de multiplicaciones, divisiones o porcentajes pues carecen de sentido. Ejemplos: la medición de la
temperatura, el coeficiente intelectual, ubicación en una vía respecto de un punto de referencia (Kilómetro
13 Ruta 20), el sobrepeso respecto de un patrón de comparación, el nivel de aceite en el motor de un
automóvil medido con una vara graduada.

 Escala de razón

Se expresa mediante cociente entre dos medidas y los datos son numéricos. El cero es absoluto (representa
ausencia de la característica o atributo), por ello los múltiplos de los valores de la escala serán significativos.
Ejemplos: el nivel de votos en una elección, número de goles marcados, la distancia, la altura, el peso y el
tiempo.

REPRESENTACIONES GRÁFICAS

Para una Variable

 Diagrama de sectores o de pastel

El área de cada sector es proporcional a su frecuencia


absoluta o relativa.

Los ángulos de los sectores circulares se obtienen así:


360 ∙ 𝑓𝑎 𝑖
∡=
𝑛

Ing. Nindirí Armenta


 Diagrama de barras

Eje horizontal: variable (cualitativa, discreta)

Eje vertical: frecuencia absoluta o frecuencia


relativa

 Diagrama de bastones

 Diagrama de escalones

Eje horizontal: variable cuantitativa discreta

Eje vertical: frecuencia absoluta acumulada o frecuencia


relativa acumulada

 Histograma de frecuencias

Eje horizontal: variable cuantitativa


continua (o intervalo)

Eje vertical: frecuencia absoluta o


frecuencia relativa

Ing. Nindirí Armenta


 Polígono de frecuencias

 Ojiva de frecuencias

Ing. Nindirí Armenta


ORGANIZACIÓN DE LOS DATOS

Los datos se pueden distribuir de 3 maneras:

1. Series simples
2. Tablas de distribución de frecuencias
(para análisis de datos cuantitativos)
a. Por lista
b. Por intervalos
3. Tablas de contingencia o de doble entrada (generalmente para análisis de datos cualitativos)

TABLA ESTADÍSTICA DE FRECUENCIAS

Instrumento estadístico que permite organizar los datos en distintos tipos de frecuencias, entre las cuales se
tiene:

 Frecuencia absoluta (𝒇𝒂 𝒊 ):


Representa el número de veces que se repite cada uno de los valores de la variable. La suma de todas
las frecuencias absolutas representa el tamaño de la muestra (n).
∑ 𝑓𝑎 𝑖 = 𝑛
 Frecuencia absoluta acumulada (𝐹𝑎 𝑖 ):
Representa el número de veces que se repite cada modalidad o cualquiera de los valores de la variable
o de las modalidades iguales e inferiores.
𝐹𝑎 𝑖 = 𝑓𝑎 𝑖−1 + 𝑓𝑎 𝑖 ; 𝐹𝑎 𝑛 = 𝑛

 Frecuencia absoluta desacumulada (𝐹𝑎 𝑖 ↓):


Representa el número de veces que se repite cada modalidad o cualquiera de los valores de la variable
o de las modalidades superiores.
𝐹𝑎 𝑖 ↓= 𝑛 − 𝑓𝑎 𝑖 ; 𝐹𝑎 𝑛 = 𝑓𝑎 𝑛

 Frecuencia relativa (𝒇𝒓 𝒊 ):


Representa la proporción para cada uno de los valores de la variable. Es el cociente entre la frecuencia
absoluta de cada variable y el número total de observaciones.
𝑓𝑎
𝑓𝑟 𝑖 = 𝑖
𝑛

 Frecuencia relativa acumulada (𝐹𝑟 𝑖 ):


Representa la proporción para cada uno de los valores de la variable o de las modalidades iguales e
inferiores.
𝐹𝑟 𝑖 = 𝑓𝑟 𝑖−1 + 𝑓𝑟 𝑖 ; 𝐹𝑟 𝑛 ≅ 1

 Frecuencia relativa desacumulada (𝐹𝑟 𝑖 ↓):


Representa la proporción para cada uno de los valores de la variable o de las modalidades iguales e
superiores.
𝐹𝑟 𝑖 ↓= 𝑛 − 𝑓𝑟 𝑖 ; 𝐹𝑟 𝑛 = 𝑓𝑟 𝑛

Ing. Nindirí Armenta


RESUMEN DE FÓRMULAS

DISTRIBUCIÓN DE SERIE SIMPLE (n<15)


MEDIDAS DE POSICIÓN CENTRAL O DE TENDENCIA CENTRAL
ESTADÍSTICO PARÁMETRO
MEDIA ∑ 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 ∑ 𝑥𝑖 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
ARITMÉTICA 𝑥̅ = = 𝜇= =
𝑛 𝑛 𝑁 𝑁
𝑛+1
 Sí n es impar, hacemos 𝑘 = , entonces la 𝑀𝑒 = 𝑋𝑘
2
MEDIANA 𝑛 𝑋𝑘 + 𝑋𝑘+1
 Sí n es par: hacemos 𝑘 = 2 , entonces la 𝑀𝑒 = 2

𝑀𝑜 = 𝑋𝑖 𝑐𝑜𝑛 𝑚𝑎𝑦𝑜𝑟 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝑓𝑎𝑖 )


MODA
Puede haber más de un valor para la moda
MEDIDAS DE DISPERSIÓN, CONCENTRACIÓN O VARIABILIDAD
RANGO 𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
∑(𝑥𝑖 − 𝑥̅ )2
2
𝑆 = ∑(𝑥𝑖 − 𝜇)2
𝑛−1 𝜎2 =
VARIANZA (𝑥1 − 𝑥̅ )2 + (𝑥2 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 𝑁
= (𝑥1 − 𝜇)2 + (𝑥2 − 𝜇)2 + ⋯ + (𝑥𝑛 − 𝜇)2
𝑛−1 =
Sí n≥30, se usa “n” y no “n-1” en el denominador. 𝑁

DESVIACIÓN 𝑆 = √𝑆 2 𝜎 = √𝜎 2
COEFICIENTE DE 𝜎
𝑆
VARIACIÓN O DE 𝐶𝑉 = ( · 100) % 𝐶𝑉 = ( · 100) %
VARIABILIDAD 𝑥̅ 𝜇
MEDIDAS DE POSICIÓN
𝑘(𝑛+1)
 Cuartil (Qk) → posición cuartil: 𝑖 = ; 𝑘 = 1, 2, 3
4
𝑘(𝑛+1)
 Decil (Dk) → posición decil: 𝑖 = ; 𝑘 = 1, 2, … , 9
10
𝑘(𝑛+1)
 Percentil (Pk) → posición percentil: 𝑖 = ; 𝑘 = 1, 2, … , 99
CUANTILES 100

𝐶𝑈𝐴𝑁𝑇𝐼𝐿: 𝐶𝑘 = 𝑋𝑖𝑒 + 𝑖𝑑. (𝑋𝑖𝑒+1 − 𝑋𝑖𝑒 )

𝑖𝑒 … 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 , 𝑖𝑑 … 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛

Ing. Nindirí Armenta


DISTRIBUCIÓN DE FRECUENCIA POR LISTA
MEDIDAS DE POSICIÓN CENTRAL O DE TENDENCIA CENTRAL
ESTADÍSTICO PARÁMETRO
∑ 𝑋𝑖 . 𝑓𝑎𝑖 ∑ 𝑋𝑖 . 𝑓𝑎𝑖
MEDIA ARITMÉTICA 𝑥̅ = 𝜇=
𝑛 𝑁
𝑛
𝐶𝑎𝑙𝑐𝑢𝑙𝑎𝑟
2
Luego, en la tabla de frecuencias,
MEDIANA 𝑛
1. Buscar en la columna de frecuencia absoluta acumulada (Fa), el valor 2

2. Leer en la misma fila el valor Xi → 𝑀𝑒


𝑀𝑜 = 𝑋𝑖 𝑐𝑜𝑛 𝑚𝑎𝑦𝑜𝑟 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝑓𝑎𝑖 )
MODA
Puede haber más de un valor para la moda
MEDIDAS DE DISPERSIÓN, CONCENTRACIÓN O VARIABILIDAD
RANGO 𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

∑(𝑥𝑖 − 𝑥̅ )2 . 𝑓𝑎𝑖 ∑(𝑥𝑖 − 𝜇)2 . 𝑓𝑎𝑖


VARIANZA 𝑆2 = 𝜎2 =
𝑛−1 𝑁

DESVIACIÓN 𝑆 = √𝑆 2 𝜎 = √𝜎 2
COEFICIENTE DE 𝜎
𝑆
VARIACIÓN O DE 𝐶𝑉 = 100% 𝐶𝑉 = 100%
𝑥̅ 𝜇
VARIABILIDAD
MEDIDAS DE POSICIÓN
𝑘.𝑛
 Cuartil (Qk) → posición cuartil: 𝑖 = ; 𝑘 = 1, 2, 3
4
𝑘.𝑛
 Decil (Dk) → posición decil: 𝑖 = ; 𝑘 = 1, 2, … , 9
10
𝑘.𝑛
 Percentil (Pk) → posición percentil: 𝑖 = 100 ; 𝑘 = 1, 2, … , 99

CUANTILES
En la tabla de frecuencias,
1. Buscar en la columna de frecuencia absoluta acumulada (Fa), el valor
de posición del cuantil.
2. Leer en la misma fila el valor de Xi → 𝐶𝑢𝑎𝑛𝑡𝑖𝑙

Ing. Nindirí Armenta


DISTRIBUCIÓN DE DATOS AGRUPADOS EN INTERVALOS DE CLASE
MEDIDAS DE POSICIÓN CENTRAL O DE TENDENCIA CENTRAL
ESTADÍSTICO PARÁMETRO
∑ 𝑀𝑖 . 𝑓𝑎𝑖 ∑ 𝑀𝑖 . 𝑓𝑎𝑖
MEDIA ARITMÉTICA 𝑥̅ = 𝜇=
𝑛 𝑁
𝑛
− 𝐹𝑎𝑖−1
MEDIANA 𝑀𝑒 = 𝐿𝑖 + 2 𝑤
𝑓𝑎𝑖

𝑓𝑎𝑖 − 𝑓𝑎𝑖−1
MODA 𝑀𝑜 = 𝐿𝑖 + 𝑤
(𝑓𝑎𝑖 − 𝑓𝑎𝑖−1 ) + (𝑓𝑎𝑖 − 𝑓𝑎𝑖+1 )

MEDIDAS DE DISPERSIÓN, CONCENTRACIÓN O VARIABILIDAD


RANGO 𝑅 = 𝐿𝑠−ú𝑙𝑡𝑖𝑚𝑎 𝑐𝑙𝑎𝑠𝑒 − 𝐿𝑖−𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑐𝑙𝑎𝑠𝑒 ó 𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛

∑(𝑀𝑖 − 𝑥̅ )2 . 𝑓𝑎𝑖 ∑(𝑀𝑖 − 𝜇)2 . 𝑓𝑎𝑖


VARIANZA 𝑆2 = 𝜎2 =
𝑛−1 𝑁

DESVIACIÓN 𝑆 = √𝑆 2 𝜎 = √𝜎 2
COEFICIENTE DE 𝜎
𝑆
VARIACIÓN O DE 𝐶𝑉 = 100% 𝐶𝑉 = 100%
𝑥̅ 𝜇
VARIABILIDAD
MEDIDAS DE POSICIÓN
 Cuartil (Qk):
𝑘. 𝑛
− 𝐹𝑎𝑖−1
𝑄𝑘 = 𝐿𝑖 + 4 𝑤 ; 𝑘 = 1, 2, 3
𝑓𝑎𝑖
 Decil (Dk):
𝑘. 𝑛
CUANTILES − 𝐹𝑎𝑖−1
𝐷𝑘 = 𝐿𝑖 + 10 𝑤 ; 𝑘 = 1, 2, … , 9
𝑓𝑎𝑖
 Percentil (Pk):
𝑘. 𝑛
− 𝐹𝑎𝑖−1
𝑃𝑘 = 𝐿𝑖 + 100 𝑤 ; 𝑘 = 1, 2, … , 99
𝑓𝑎𝑖

Ing. Nindirí Armenta