Documentos de Académico
Documentos de Profesional
Documentos de Cultura
µ = Media Cualitativas:
aritmética de
una población Nominal: Se agrupan por clases o categorías
mutuamente excluyentes, pero tales no tienen
un orden dentro de estas; Ejemplo: Género,
religión, partido político, etc.
Cuantitativas:
Intervalo: Datos agrupados en categorías con un
Variables: pueden tomar diferentes valores orden específico y este implica un intervalo
específico, que lo diferencia en las distintas
Cuantitativa: Los resultados posibles de esta
categorías, el 0 es un valor mas y no implica
variable son valores numéricos. Miden cantidad.
ausencia de la característica. Ejemplo: T°, hora
Se dividen en dos categorías: Continuas y
del día en un reloj de 12 h, etc.
Discretas.
Razón: Datos agrupados en categorías con un
➔ Continuas: Pueden tomar infinitos valores
orden específico en donde las diferencias entre
numéricos (dentro de los reales); Ejemplo:
las categorías son iguales para todas las
Peso, edad, longitud, etc.
categorías y el 0 implica ausencia de la
➔ Discretas: Pueden tomar solo valores característica. Ejemplo: Peso, edad, estatura, etc.
enteros; Ejemplo: N° de hijos, ramos
aprobados en segundo año, etc. Clase 2:
Marca de Clase:
(𝐿𝑖𝑚𝑖𝑡𝑒𝑠𝑢𝑝 + 𝐿𝑖𝑚𝑖𝑡𝑒𝑖𝑛𝑓 )
𝑦𝑖 =
2
5) Colocar los valores hallados en las columnas de la tabla de
frecuencias.
Columnas agrupadas
𝑵° 15
Representan la información de tablas de doble
%= 𝒙 𝟏𝟎𝟎 Ej: 32 = 0.469 𝑥 100 = 46,9% entrada; pueden ser dobles, triples o múltiples.
𝑻𝒐𝒕𝒂𝒍
Cada columna
Gráficos
expresará las
La representación gráfica de la información categorías o criterios
contenida en una tabla estadística es una de clasificación de las
manera de obtener una información visual clara variables que se representan (cualitativas o
que facilite su rápida comprensión. cuantitativas discretas).
Sirven para efectuar comparaciones entre Polígono de frecuencias
grupos de datos.
El Polígono de frecuencia es aquel que se forma
Columnas apiladas a partir de la unión de
los distintos puntos
En el eje de las X se ubica una de las variables a
medios de las cimas
clasificar, en el eje de las Y se representa toda la
(puntos de mayor
clasificación de la otra
altura) de las columnas
variable.
que configuran lo que es un histograma de
Una sola barra
frecuencia.
contrasta y relaciona
el mismo Ojiva
comportamiento
respecto a otra variable. Es el polígono de frecuencia acumulado, es
Variables cualitativas o cuantitativas discretas. decir, que en ella se permite ver cuántas
observaciones se
Gráfico de Líneas encuentran por
encima o debajo de
Permiten representar las fluctuaciones de una
ciertos valores, en
variable en el tiempo.
lugar de solo exhibir
Sirven para mostrar
los números asignados a cada intervalo.
la tendencia de una
o más series de Diagrama de dispersión
datos.
Se utilizan para Este tipo de gráfico muestra la relación entre
variables cualitativas o cuantitativas. dos variables
numéricas,
Histograma usando puntos.
Cada punto
Es un gráfico para la distribución de una variable
representa la
cuantitativa continua que representa
intersección
frecuencias
entre los valores de ambas variables. Este
mediante áreas.
conjunto de puntos se denomina “nube de
El histograma se
puntos”.
construye
colocando en el eje
de abscisas los intervalos de clase y levantando
sobre ellos rectángulos con área proporcional a
la frecuencia.
Diagrama de caja (box plot ) extremos. Cada conjunto de datos solo posee
una media.
Los diagramas de caja
En datos agrupados:
(de caja y bigotes) son
gráficos que muestra la ➔ Para variable discreta
distribución de una 𝚺 𝒙𝒊 ∗ 𝒇𝒊
̅=
𝑴(𝒙) = 𝒙
variable usando 𝒏
cuartiles. ➔ Para variable continua
Permite además 𝚺 𝒚𝒊 ∗ 𝒇𝒊
̅=
𝑴(𝒙) = 𝒙
identificar datos atípicos 𝒏
𝒚𝒊 : 𝑴𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆
de su distribución.
Propiedades:
Pictogramas
La media aritmética de una variable más
Los pictogramas son gráficos de aspecto (menos) una constante es igual a la media de la
atractivo que emplean una secuencia de dibujos variable más (menos) la constante. → M (y ± k)
(esquemáticos, artísticos o = M(y) ± k
humorísticos) para
La media aritmética de una variable multiplicada
representar frecuencias y
por una constante es igual a la constante que
son útiles para difusión
multiplica a la media de la variable. → M (y * k)
masiva por ser muy
= k * M(y)
comprensibles y transmiten de forma sencilla la
información contenida en una muestra. La suma de las desviaciones ponderadas de los
valores de la variable respecto de la media
Clase 3 aritmética es cero.
Medidas de tendencia central → ∑(𝑦𝑖 − 𝑦̅) ∗ 𝑓𝑖 = 0
La media aritmética de una constante es igual a
Son medidas estadísticas que informan sobre la
la constante.
tendencia central de los datos de una
→ M(k) = k
distribución.
La tendencia central se refiere al punto medio Media Ponderada
de una distribución 𝒙𝟏 ∗ 𝒑𝟏 + 𝒙𝟐 ∗ 𝒑𝟐 +… + 𝒙𝒏 ∗ 𝒑𝒏
̅̅̅
𝒙𝒑
Media aritmética 𝒑𝟏 + 𝒑𝟐 +… + 𝒑𝒏
Cada factor pi es el peso o ponderación del dato xi
Valor que se obtiene en la división de la Ej:
sumatoria de los datos por el numero total de
datos. Solo es aplicable 𝚺 𝒙𝒊
en datos cuantitativos. 𝑴(𝒙) = 𝒙 ̅=
𝒏
Es sensible a valores
Mediana: 𝑳𝒊𝒎𝒊𝒏𝒇 = límite inferior del intervalo de clase de
la mediana
La mediana es un valor que solo mide la 𝑭𝒂𝒄𝒎−𝟏 = frecuencia acumulada del intervalo
observación central del conjunto. Es el elemento anterior al intervalo de clase de la mediana
que está más al centro del conjunto de números. 𝒇𝒂𝒃𝒔 = frecuencia absoluta del intervalo de
La mitad de los elementos están por arriba de clase de la mediana
este punto y la otra mitad está por debajo. 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗 = amplitud del intervalo de clase de
la mediana
Datos no agrupados
Moda
Se deben ordenar los datos de menor a mayor y
revisar el dato justo del medio. Es el valor que mas se repite en el conjunto de
→ Si n es impar, la mediana es el dato del medio datos. Tiene mayor frecuencia absoluta. Pueden
exacto. existir distribuciones con mas de una moda. Al
→ Si n es par, se promedian los dos datos del igual que la mediana, se puede utilizar como una
centro, el resultado es la mediana. posición central para datos cualitativos como
cuantitativos.
Para datos agrupados (Variable discreta)
→Cálculo de la moda de datos no agrupados
➔ Se calculan las Frecuencias absolutas
acumuladas (Fi), se calcula n/2, la Será el valor que más se repite
mediana es el dato que contiene al
→Cálculo de la moda de datos agrupados
resultado de n/2 (lo excede).
➔ Si la mitad del número de datos (n/2) 𝒅𝒇𝒊−(𝒇𝒊−𝟏)
𝑴𝒐 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓. ∗
𝒅𝒇𝒊−(𝒇𝒊−𝟏) +𝒅𝒇𝒊−(𝒇𝒊+𝟏)
coincide con la Fi de un valor, la mediana
es la semisuma de ese valor y el siguiente. (Fórmula simplificada)
Ej: Si n/2 = K y en Fi, se encuentra K
𝑳𝒊𝒎𝒊𝒏𝒇 (Lk-1)= límite inferior del intervalo de
exacto, el xi de ese dato se promedia con
clase de la mediana
el siguiente. El resultado es la mediana.
𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓 (wk) = amplitud del intervalo de clase
Para datos agrupados (Variable continua) de la mediana
𝒅𝒇𝒊−(𝒇𝒊−𝟏) (𝒅𝟏 ) = frecuencia de la clase modal
➔ Se calculan las Frecuencias absolutas menos la frecuencia de la clase que se
acumuladas (Fi), se calcula n/2, la encuentra inmediatamente menor que ella
mediana es el dato que contiene al 𝒅𝒇𝒊−(𝒇𝒊+𝟏) (𝒅𝟐 ) = frecuencia de la clase modal
resultado de n/2 (lo excede). menos la frecuencia de la clase inmediatamente
Tener en la tabla los intervalos, marca de clase, mayor que ella
el total de datos, frecuencia absoluta y
frecuencia absoluta acumulada
𝒏
− 𝑭𝒂𝒄𝒎−𝟏
𝑴𝒆 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗. ∗ 𝟐
𝒇𝒂𝒃𝒔
Ej: aritmética y siempre quedará expresada en las
unidades de los datos originales
∑|𝑥𝑖 − 𝑥̅ | ∗ 𝑓𝑖 | | = valor absoluto,
𝐷𝑀 = siempre es positivo
𝑛
Lo lejos que está el valor de la media, un valor 0 es que coincide con la media, un
valor elevado con respecto a las demás desviaciones indica que está alejado de
los demás datos
Varianza
Clase 4 (a)
Medidas de dispersión:
𝟒 ∗ (𝟖+𝟏)
➔ Valor de este es como máximo 25% → 𝟒
= 𝟐, 𝟐𝟓 → 4–3=1 → 0,25*1=0,25 → 3+0,25=3,25
Variable Homogénea
➔ Valor superior a 25% → Heterogéneo Datos agrupados (variable discreta)
𝑠𝑥
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = [ ] ∗ 100
𝑦̅
Clase 4 (b)
Medidas de posición
☺
𝟑
unico que varía entre C, Q y P, es el
Cuartil 2: 𝑗 𝑗 𝑗
𝑗 2
∗ 𝑛 = ∗ 10 = 5 → 𝑪𝟐 = 𝟏𝟎, 𝟓 + 𝟐 ∗
𝟓−𝟑 denominador → ; ;
4 4 𝟑
= 𝟏𝟐, 𝟓 𝒏𝒈/𝒎𝒍 4 5 100
Cuartil 3: Clase 4 (c)
𝑗 3 𝟕, 𝟓 − 𝟔
∗ 𝑛 = ∗ 10 = 7,5 → 𝑪𝟑 = 𝟏𝟐, 𝟓 + 𝟐 ∗ = 𝟏𝟒 𝒏𝒈/𝒎𝒍
4 4
Medidas de forma
𝟑
Quintiles
Permiten conocer la forma de la curva que
Dividen los datos en cinco partes iguales de 20% representa los datos de la muestra, se clasifica
y se denota como 𝑄1 , 𝑄2 , 𝑄3 𝑦 𝑄4 en Asimetría o Curtosis, compara el gráfico
(barras o histograma) con la distribución normal
20% 20% 20% 20% 20%
20% 40% 60% 80%
Simetría Curtosis
Cuando los datos se distribuyen con igual Determina grado de concentración de los
frecuencia y alejamiento sobre o debajo de la valores alrededor de la zona central de la
media aritmética distribución de frecuencias. Que tan achatada o
apuntada está la curva respecto a la distribución
Si la distribución de frecuencias es unimodal,
normal
entonces Mediana = Moda = Media
→Leptocúrtica (curtosis > 0) → Los datos están
Asimetría
muy concentrados hacia la media
Si la curva que forman los valores presenta la →Platicúrtica (curtosis < 0) → Los datos están
misma forma a izquierda y derecha de la media muy dispersos
aritmética
→Mesocúrtica (curtosis = 0) → Comportamiento
normal