Está en la página 1de 11

Bioestadística

2. Formulación de una hipótesis: es una


explicación posible de la situación problema
o una respuesta posible a la pregunta
planteada
Clase 1:
3. Deducción de las consecuencias verificables
de hipótesis: deducción de forma lógica las
Estadística: se entiende como la ciencia de la consecuencias particulares
4. Verificación de hipótesis: se puede hacer por
recolección y análisis de datos con apoyo
demostraciones teóricas basadas en el
matemático y a través d estudios investigativos
estado actual del conocimiento
científicamente diseñados y realizados con el
5. Interpretación de resultados: se acepta o se
objetivo de la toma de decisiones respecto a un
rechaza la hipótesis, de ser rechazada se
problema.
debe cambiar
Muchas veces se mal ocupa para fundamentar
alguna decisión. Método estadístico: Conjunto de procedimientos
Bioestadística: Rama de la estadística aplicada a aplicados en secuencia lógica a la obtención y
análisis de datos influidos por múltiples factores.
las ciencias biológicas, permite comprender y
describir la variabilidad que se produce entre Ramas de la estadística
individuos, y la relación entre las características
de los individuos. estadística descriptiva: Describe un conjunto de
datos recopilados en una muestra
Estadística y Método científico
estadística inferencial: Utiliza información
• “En relación con el método científico permite
llevar a la práctica las etapas de verificación de la obtenida del estudio de una muestra para hacer
hipótesis y de interpretación de los resultados. inferencias sobre la población.
• El diseño experimental, el muestreo y el análisis Población: totalidad de personas, animales u
e interpretación de los resultados de
objetos que comparten una característica o
investigaciones empíricas que forman parte del
variable bajo estudio
conjunto de la metodología estadística tienen su
fundamento en la teoría de probabilidades. Muestra: subconjunto de la población, tiene las
• Tiene aplicación en todas las áreas en que se mismas características de la población en la
trabaja con variables afectadas por múltiples misma proporción
factores: medicina, biología, agronomía,
Parámetro: Medida que se obtiene por medio del
economía, demografía, etc.” (Taucher E.1997)
estudio de una población.
Pasos:
Estadígrafo: Medida que se obtiene por medio
1. Enunciado del problema: Define con del estudio de una muestra.
precisión el problema a investigar para un
marco de referencia para los siguientes pasos
Escalas:

µ = Media Cualitativas:
aritmética de
una población Nominal: Se agrupan por clases o categorías
mutuamente excluyentes, pero tales no tienen
un orden dentro de estas; Ejemplo: Género,
religión, partido político, etc.

𝐱̅ = Media Ordinal: Se agrupan en categorías con un orden


aritmética de
específico; Ejemplo: Clase social, grado de
una muestra
agresividad (mucha, poca, ninguna), etc.

Cuantitativas:
Intervalo: Datos agrupados en categorías con un
Variables: pueden tomar diferentes valores orden específico y este implica un intervalo
específico, que lo diferencia en las distintas
Cuantitativa: Los resultados posibles de esta
categorías, el 0 es un valor mas y no implica
variable son valores numéricos. Miden cantidad.
ausencia de la característica. Ejemplo: T°, hora
Se dividen en dos categorías: Continuas y
del día en un reloj de 12 h, etc.
Discretas.
Razón: Datos agrupados en categorías con un
➔ Continuas: Pueden tomar infinitos valores
orden específico en donde las diferencias entre
numéricos (dentro de los reales); Ejemplo:
las categorías son iguales para todas las
Peso, edad, longitud, etc.
categorías y el 0 implica ausencia de la
➔ Discretas: Pueden tomar solo valores característica. Ejemplo: Peso, edad, estatura, etc.
enteros; Ejemplo: N° de hijos, ramos
aprobados en segundo año, etc. Clase 2:

Cualitativa: Los resultados posibles de esta Tablas de Presentación de datos


variable no son valores numéricos. Miden Esquema con filas y columnas donde se ubican los nombres
cualidades. Se dividen en dos categorías: de la o las variables y la frecuencia o número de casos.
Ordinales y Nominales.
1. Distribución de frecuencia: Son aquellas en las
➔ Ordinales: Variables que llevan un orden; que se tabula una sola variable
Ejemplo: Meses del año, días de la 2. Bivariados o de Asociación o de Doble
semana, escala de apreciación, etc. entrada: Son aquellas en las que se tabulan
➔ Nominales: Variables que no siguen un dos variables que han sido categorizadas
bajo algún criterio establecido por el
orden; Ejemplo: sexo, religión, sistema de
investigador, también reciben el nombre de
salud, etc.
tabla de doble entrada o tabla de Una Tabla de distribución de frecuencias con
contingencia. intervalos es una tabla de resumen en la que los
datos están organizados en clases o grupos
Tablas de Distribución de Frecuencias
numéricamente ordenados.
Es una ordenación en forma de tabla, de los Usamos las tablas de frecuencias con intervalos
datos estadísticos, asignando a cada dato su cuando la variable toma un gran número de
frecuencia correspondiente valores o es una variable continua. Para ello, se
agrupan los diferentes valores en intervalos de
Para construir una tabla de distribución de igual amplitud, a los cuáles llamamos clases.
frecuencias es necesario considerar la
clasificación de la variable, de acuerdo a sus y’i -1 – y’i yi fi hi Fi Hi
[ y’0 – y’1 [ y1 f1 h1 F1 H1
categorías, valores o intervalos, para luego
[ y’1 – y’2 [ y2 f2 h2 F2 H2
resumir los datos a partir de frecuencias de
… … … … … …
ocurrencia o intervalo.
[ y’k-1– y’k ] yk fk hf Fk Hk
Variable Discreta: ➔ [𝑦′𝑖−1 – 𝑦′𝑖 [: Intervalo de clase
➔ 𝑦′𝑖−1 : Límite inferior del intervalo
xi Fi hi Fi Hi
➔ 𝑦′𝑖 : Límite superior del intervalo
x1 f1 ℎ1 = 𝑓1 /𝑛 𝐹1 = 𝑓1 𝐻1 = ℎ1
x2 f2 ℎ2 = 𝑓2 /𝑛 𝐹1 = 𝑓1 + 𝑓2 𝐻1 = ℎ1 + ℎ2 ➔ 𝑦𝑖 : Marca de clase
… … … … … ➔ 𝑓𝑖 : Frecuencia absoluta
𝛴𝑓𝑖 = 𝑛 𝛴ℎ𝑖 = 1 ➔ ℎ𝑖 : Frecuencia relativa
➔ 𝒙𝒊 : 𝑉𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 ➔ 𝐹𝑖 : Frecuencia absoluta acumulada
𝑑𝑒 𝑚𝑒𝑛𝑜𝑟 𝑎 𝑚𝑎𝑦𝑜𝑟 ➔ 𝐻𝑖 : Frecuencia relativa acumulada
➔ 𝒇𝒊 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎: Número de veces que
aparece un determinado valor en un estudio Pasos para elaborar una tabla de frecuencias con
estadístico
intervalos
➔ 𝒉𝒊 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎: Es el cociente entre la
frecuencia absoluta de un determinado valor y el 1) Hallar el rango (𝑳𝒊𝒎𝒊𝒕𝒆𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓 − 𝑳𝒊𝒎𝒊𝒕𝒆𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓 )
número total de datos. (hi = fi /n). La suma de todos los
datos siempre debe dar 1. Para interpretar se expresa en (R): R = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
porcentaje
2) Hallar el número de intervalos (k).
(hi x 100 = %)
Si n ≤ 30 entonces
➔ 𝑯𝒊 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎: Es la suma
acumulada de los distintos valores de la frecuencia relativa. 𝒌 = √𝒏
El último dato es igual a 1. Para interpretar se expresa en
Si n > 30 entonces
porcentaje (Hi x 100 = %)
➔ 𝑭𝒊 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎: Es la suma 𝒌 = 𝟏 + 𝟑, 𝟑𝟐𝟐 𝒍𝒐𝒈 (𝒏) (fórmula de Sturges).
acumulada de los distintos valores de la frecuencia absoluta.
De no ser exacto el resultado, siempre se debe aproximar al
El último dato es igual al tamaño de la muestra.
entero superior cuando el primer decimal es mayor o igual a
➔ 𝒏: Es el número total de datos, la suma de las
5.
frecuencias absolutas.
3) Determinar la amplitud de clase (A).
Tabla de distribución de frecuencias con 𝑹𝒂𝒏𝒈𝒐 𝑹
A = 𝑵° 𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔= 𝒌
intervalos
4) Hallar el límite inferior y superior de cada clase [𝑦′𝑖−1 – 𝑦′𝑖 [
así como las marcas de clase (yi ) para cada intervalo.
[𝒚′𝒊−𝟏 : 𝑳𝒊𝒎𝒊𝒕𝒆 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓 𝒚′𝒊 : 𝑳𝒊𝒎𝒊𝒕𝒆 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓[

Corchete Cerrado: Incluye valor Corchete Abierto: No incluye valor

Marca de Clase:
(𝐿𝑖𝑚𝑖𝑡𝑒𝑠𝑢𝑝 + 𝐿𝑖𝑚𝑖𝑡𝑒𝑖𝑛𝑓 )
𝑦𝑖 =
2
5) Colocar los valores hallados en las columnas de la tabla de
frecuencias.

Tabla de Frecuencia Bivariada Graficas de sectores (Circulares, Torta)


Son aquellas en las que se tabulan dos variables Gráficas que se utilizan para resumir datos de
que han sido categorizadas bajo algún criterio atributo (variable cualitativa).
establecido por el investigador. También reciben Muestran la cantidad de datos
el nombre de tabla de doble entrada o tabla de que pertenecen a cada
contingencia. categoría como una parte
proporcional de un círculo.

Columnas y Barras simples


Se utiliza para presentar la
distribución de una tabla de
Cálculo de porcentajes en una Tabla Bivariada: frecuencia (frecuencias
absolutas o relativas) de
variables cualitativas o
variables cuantitativas
discretas

Columnas agrupadas

𝑵° 15
Representan la información de tablas de doble
%= 𝒙 𝟏𝟎𝟎 Ej: 32 = 0.469 𝑥 100 = 46,9% entrada; pueden ser dobles, triples o múltiples.
𝑻𝒐𝒕𝒂𝒍
Cada columna
Gráficos
expresará las
La representación gráfica de la información categorías o criterios
contenida en una tabla estadística es una de clasificación de las
manera de obtener una información visual clara variables que se representan (cualitativas o
que facilite su rápida comprensión. cuantitativas discretas).
Sirven para efectuar comparaciones entre Polígono de frecuencias
grupos de datos.
El Polígono de frecuencia es aquel que se forma
Columnas apiladas a partir de la unión de
los distintos puntos
En el eje de las X se ubica una de las variables a
medios de las cimas
clasificar, en el eje de las Y se representa toda la
(puntos de mayor
clasificación de la otra
altura) de las columnas
variable.
que configuran lo que es un histograma de
Una sola barra
frecuencia.
contrasta y relaciona
el mismo Ojiva
comportamiento
respecto a otra variable. Es el polígono de frecuencia acumulado, es
Variables cualitativas o cuantitativas discretas. decir, que en ella se permite ver cuántas
observaciones se
Gráfico de Líneas encuentran por
encima o debajo de
Permiten representar las fluctuaciones de una
ciertos valores, en
variable en el tiempo.
lugar de solo exhibir
Sirven para mostrar
los números asignados a cada intervalo.
la tendencia de una
o más series de Diagrama de dispersión
datos.
Se utilizan para Este tipo de gráfico muestra la relación entre
variables cualitativas o cuantitativas. dos variables
numéricas,
Histograma usando puntos.
Cada punto
Es un gráfico para la distribución de una variable
representa la
cuantitativa continua que representa
intersección
frecuencias
entre los valores de ambas variables. Este
mediante áreas.
conjunto de puntos se denomina “nube de
El histograma se
puntos”.
construye
colocando en el eje
de abscisas los intervalos de clase y levantando
sobre ellos rectángulos con área proporcional a
la frecuencia.
Diagrama de caja (box plot ) extremos. Cada conjunto de datos solo posee
una media.
Los diagramas de caja
En datos agrupados:
(de caja y bigotes) son
gráficos que muestra la ➔ Para variable discreta
distribución de una 𝚺 𝒙𝒊 ∗ 𝒇𝒊
̅=
𝑴(𝒙) = 𝒙
variable usando 𝒏
cuartiles. ➔ Para variable continua
Permite además 𝚺 𝒚𝒊 ∗ 𝒇𝒊
̅=
𝑴(𝒙) = 𝒙
identificar datos atípicos 𝒏
𝒚𝒊 : 𝑴𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆
de su distribución.
Propiedades:
Pictogramas
La media aritmética de una variable más
Los pictogramas son gráficos de aspecto (menos) una constante es igual a la media de la
atractivo que emplean una secuencia de dibujos variable más (menos) la constante. → M (y ± k)
(esquemáticos, artísticos o = M(y) ± k
humorísticos) para
La media aritmética de una variable multiplicada
representar frecuencias y
por una constante es igual a la constante que
son útiles para difusión
multiplica a la media de la variable. → M (y * k)
masiva por ser muy
= k * M(y)
comprensibles y transmiten de forma sencilla la
información contenida en una muestra. La suma de las desviaciones ponderadas de los
valores de la variable respecto de la media
Clase 3 aritmética es cero.
Medidas de tendencia central → ∑(𝑦𝑖 − 𝑦̅) ∗ 𝑓𝑖 = 0
La media aritmética de una constante es igual a
Son medidas estadísticas que informan sobre la
la constante.
tendencia central de los datos de una
→ M(k) = k
distribución.
La tendencia central se refiere al punto medio Media Ponderada
de una distribución 𝒙𝟏 ∗ 𝒑𝟏 + 𝒙𝟐 ∗ 𝒑𝟐 +… + 𝒙𝒏 ∗ 𝒑𝒏
̅̅̅
𝒙𝒑
Media aritmética 𝒑𝟏 + 𝒑𝟐 +… + 𝒑𝒏
Cada factor pi es el peso o ponderación del dato xi
Valor que se obtiene en la división de la Ej:
sumatoria de los datos por el numero total de
datos. Solo es aplicable 𝚺 𝒙𝒊
en datos cuantitativos. 𝑴(𝒙) = 𝒙 ̅=
𝒏
Es sensible a valores
Mediana: 𝑳𝒊𝒎𝒊𝒏𝒇 = límite inferior del intervalo de clase de
la mediana
La mediana es un valor que solo mide la 𝑭𝒂𝒄𝒎−𝟏 = frecuencia acumulada del intervalo
observación central del conjunto. Es el elemento anterior al intervalo de clase de la mediana
que está más al centro del conjunto de números. 𝒇𝒂𝒃𝒔 = frecuencia absoluta del intervalo de
La mitad de los elementos están por arriba de clase de la mediana
este punto y la otra mitad está por debajo. 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗 = amplitud del intervalo de clase de
la mediana
Datos no agrupados
Moda
Se deben ordenar los datos de menor a mayor y
revisar el dato justo del medio. Es el valor que mas se repite en el conjunto de
→ Si n es impar, la mediana es el dato del medio datos. Tiene mayor frecuencia absoluta. Pueden
exacto. existir distribuciones con mas de una moda. Al
→ Si n es par, se promedian los dos datos del igual que la mediana, se puede utilizar como una
centro, el resultado es la mediana. posición central para datos cualitativos como
cuantitativos.
Para datos agrupados (Variable discreta)
→Cálculo de la moda de datos no agrupados
➔ Se calculan las Frecuencias absolutas
acumuladas (Fi), se calcula n/2, la Será el valor que más se repite
mediana es el dato que contiene al
→Cálculo de la moda de datos agrupados
resultado de n/2 (lo excede).
➔ Si la mitad del número de datos (n/2) 𝒅𝒇𝒊−(𝒇𝒊−𝟏)
𝑴𝒐 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓. ∗
𝒅𝒇𝒊−(𝒇𝒊−𝟏) +𝒅𝒇𝒊−(𝒇𝒊+𝟏)
coincide con la Fi de un valor, la mediana
es la semisuma de ese valor y el siguiente. (Fórmula simplificada)
Ej: Si n/2 = K y en Fi, se encuentra K
𝑳𝒊𝒎𝒊𝒏𝒇 (Lk-1)= límite inferior del intervalo de
exacto, el xi de ese dato se promedia con
clase de la mediana
el siguiente. El resultado es la mediana.
𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓 (wk) = amplitud del intervalo de clase
Para datos agrupados (Variable continua) de la mediana
𝒅𝒇𝒊−(𝒇𝒊−𝟏) (𝒅𝟏 ) = frecuencia de la clase modal
➔ Se calculan las Frecuencias absolutas menos la frecuencia de la clase que se
acumuladas (Fi), se calcula n/2, la encuentra inmediatamente menor que ella
mediana es el dato que contiene al 𝒅𝒇𝒊−(𝒇𝒊+𝟏) (𝒅𝟐 ) = frecuencia de la clase modal
resultado de n/2 (lo excede). menos la frecuencia de la clase inmediatamente
Tener en la tabla los intervalos, marca de clase, mayor que ella
el total de datos, frecuencia absoluta y
frecuencia absoluta acumulada
𝒏
− 𝑭𝒂𝒄𝒎−𝟏
𝑴𝒆 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗. ∗ 𝟐
𝒇𝒂𝒃𝒔
Ej: aritmética y siempre quedará expresada en las
unidades de los datos originales
∑|𝑥𝑖 − 𝑥̅ | ∗ 𝑓𝑖 | | = valor absoluto,
𝐷𝑀 = siempre es positivo
𝑛
Lo lejos que está el valor de la media, un valor 0 es que coincide con la media, un
valor elevado con respecto a las demás desviaciones indica que está alejado de
los demás datos

Varianza
Clase 4 (a)

Medidas de dispersión:

La dispersión es la variación en un conjunto de


datos que proporciona información adicional y
permite juzgar la confiabilidad de la medida de
tendencia central, las medidas de dispersión
muestran la variabilidad de las distribuciones de
datos, números que indican que tan alejadas
están las puntuaciones de las variables y señalan
que tan homogéneos están los datos. Corresponde a la suma del cuadrado de la
• Menor dispersión = más homogéneo diferencia entre cada dato y la media, dividida
• Mayor dispersión = menos homogéneo en el número de observaciones, mientras mayor
• Menor dispersión = menos heterogéneo sea, mayor dispersión de las observaciones, se
• Mayor dispersión = más heterogéneo expresa en la misma unidad que la variable
(PERO SIEMPRE ELEVADA AL CUADRADO)
Rango intercuartílico Ej: (𝑘𝑚)2 , (𝑚𝑡)2 , 𝑒𝑡𝑐
Diferencia entre el Q3 y Q1 e indican los Recordar: 𝑦𝑖 = Es el punto medio del
intervalos de valores que abarcan el 50% del intervalo o la semisuma de los
total de datos y los que están al centro. También límites del intervalo. (no es el
se puede decir P75 – P25, y se sigue midiendo el promedio)
50% central de las observaciones.
Propiedades de la varianza
Desviación media
1. La varianza de una constante es igual a 0.
Conjunto de datos, sirve para calcular cuánto en V(k) = 0
promedio se desvían los datos de la media 2. La varianza es no negativa mayor o igual a cero.
V(x) ≥ 0
3. La varianza de una variable más o menos una calculo de variables cualitativas ordinales y
constante es igual a la varianza de la variable (no se cuantitativas discretas y continuas, se expresan
altera al sumarle o restarle una constante).
en las unidades de los datos estudiados.
V(x ± k) = V(x)
4. La varianza del producto de una variable por una
Cuartiles
constante es igual al cuadrado de la constante
multiplicado por la varianza de la variable.
Dividen los datos en cuatro partes iguales de
V (x*k) = k² * V(x)
25% y se denota como 𝐶1 , 𝐶2 𝑦 𝐶3
Desviación típica o estándar
25% 25% 25% 25%
Mide dispersión de los datos con respecto al 25% 50% 75%

promedio, corresponde a la raíz cuadrada de la Con datos sin agrupar


varianza y se expresa en las mismas unidades de
los datos utilizados (NO SE ELEVA AL Deben estar ordenados de menor a mayor, se
CUADRADO COMO LA VARIANZA). localiza la posicion del cuartil con la formula:
𝑗 ∗ (𝑛 + 1)
𝐶𝑗 =
4
➔ Valor entero → corresponde a esa posición
del cuartil
➔ Valor decimal → se realiza la resta de los
Coeficiente de variación valores enteros entre los que está el cuartil (el
Mide grado de dispersión relativa entre dos o entero menor y el entero mayor). El resultado
más distribuciones y para comparar la variación se multiplica por el decimal que resultó de Cj ,
de dos series de datos en diferentes unidades, luego al resultado se le suma el entero menor.
no depende de las unidades, se expresa en %. Ej:1 3  4 4 5 5 5 6
Tendrá menor dispersión aquella observación 𝑗∗(𝑛+1)
𝐶𝑗 = (Guía por los colores)
que tenga menor coeficiente. 4

𝟒 ∗ (𝟖+𝟏)
➔ Valor de este es como máximo 25% → 𝟒
= 𝟐, 𝟐𝟓 → 4–3=1 → 0,25*1=0,25 → 3+0,25=3,25

Variable Homogénea
➔ Valor superior a 25% → Heterogéneo Datos agrupados (variable discreta)
𝑠𝑥
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = [ ] ∗ 100
𝑦̅

Clase 4 (b)

Medidas de posición

Permiten ubicar la posición que ocupa un valor


dentro de un conjunto de datos, sirve para el
j = corresponde al número de cuartil que se 𝒋
∗ 𝒏 − 𝑭𝒂𝒄𝒎−𝟏
busca 𝑪𝒋 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗. ∗ 𝟓
n = corresponde al número total de la muestra 𝒇𝒂𝒃𝒔
Fi > = Frecuencia acumulada mayor (que 𝑳𝒊𝒎𝒊𝒏𝒇 = límite inferior del intervalo
contiene al número) 𝑭𝒂𝒄𝒎−𝟏 = frecuencia acumulada del intervalo
Datos agrupados (variable continua) anterior al intervalo que contiene al cuartil
𝒇𝒂𝒃𝒔 = frecuencia absoluta del intervalo que
𝒋 contiene al cuartil
∗ 𝒏 − 𝑭𝒂𝒄𝒎−𝟏
𝑪𝒋 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗. ∗ 𝟒 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗 = amplitud del intervalo
𝒇𝒂𝒃𝒔
𝑳𝒊𝒎𝒊𝒏𝒇 = límite inferior del intervalo
Percentiles
𝑭𝒂𝒄𝒎−𝟏 = frecuencia acumulada del intervalo 1% 1% 1% … … … … … 1% 1%
anterior al intervalo que contiene al cuartil
0% 50% 100%
𝒇𝒂𝒃𝒔 = frecuencia absoluta del intervalo que
contiene al cuartil 𝒋
∗ 𝒏 − 𝑭𝒂𝒄𝒎−𝟏
𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗 = amplitud del intervalo 𝑪𝒋 = 𝑳𝒊𝒎𝒊𝒏𝒇 + 𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗. ∗ 𝟏𝟎𝟎
𝒇𝒂𝒃𝒔
Ej:
𝑳𝒊𝒎𝒊𝒏𝒇 = límite inferior del intervalo
𝑭𝒂𝒄𝒎−𝟏 = frecuencia acumulada del intervalo
anterior al intervalo que contiene al cuartil
𝒇𝒂𝒃𝒔 = frecuencia absoluta del intervalo que
contiene al cuartil
𝑨𝒎𝒑𝒊𝒏𝒕𝒆𝒓𝒗 = amplitud del intervalo
Cuartil 1:
𝑗 1 𝟐, 𝟓 − 𝟎 Recordar: La fórmula es la misma para todos, lo
∗ 𝑛 = ∗ 10 = 2,5 → 𝑪𝟏 = 𝟖, 𝟓 + 𝟐 ∗ = 𝟏𝟎, 𝟐 𝒏𝒈/𝒎𝒍
4 4


𝟑
unico que varía entre C, Q y P, es el
Cuartil 2: 𝑗 𝑗 𝑗
𝑗 2
∗ 𝑛 = ∗ 10 = 5 → 𝑪𝟐 = 𝟏𝟎, 𝟓 + 𝟐 ∗
𝟓−𝟑 denominador → ; ;
4 4 𝟑
= 𝟏𝟐, 𝟓 𝒏𝒈/𝒎𝒍 4 5 100
Cuartil 3: Clase 4 (c)
𝑗 3 𝟕, 𝟓 − 𝟔
∗ 𝑛 = ∗ 10 = 7,5 → 𝑪𝟑 = 𝟏𝟐, 𝟓 + 𝟐 ∗ = 𝟏𝟒 𝒏𝒈/𝒎𝒍
4 4
Medidas de forma
𝟑

Quintiles
Permiten conocer la forma de la curva que
Dividen los datos en cinco partes iguales de 20% representa los datos de la muestra, se clasifica
y se denota como 𝑄1 , 𝑄2 , 𝑄3 𝑦 𝑄4 en Asimetría o Curtosis, compara el gráfico
(barras o histograma) con la distribución normal
20% 20% 20% 20% 20%
20% 40% 60% 80%
Simetría Curtosis

Cuando los datos se distribuyen con igual Determina grado de concentración de los
frecuencia y alejamiento sobre o debajo de la valores alrededor de la zona central de la
media aritmética distribución de frecuencias. Que tan achatada o
apuntada está la curva respecto a la distribución
Si la distribución de frecuencias es unimodal,
normal
entonces Mediana = Moda = Media
→Leptocúrtica (curtosis > 0) → Los datos están
Asimetría
muy concentrados hacia la media
Si la curva que forman los valores presenta la →Platicúrtica (curtosis < 0) → Los datos están
misma forma a izquierda y derecha de la media muy dispersos
aritmética
→Mesocúrtica (curtosis = 0) → Comportamiento
normal

Coeficiente de curtosis de Fisher

Se basa en las desviaciones de los valores con


respecto a la media
𝛴𝑛𝑖=1 (𝑥𝑖 − 𝑥̅ )4
• Si la asimetría es negativa: media < mediana < moda. Datos no agrupados → 𝑔2 = −3
→ A la izquierda 𝑛 ∗ 𝑆4
4
• Si la asimetría es positiva: media > mediana > moda. 𝛴𝑛𝑖=1 (𝑥𝑖 − 𝑥̅ ) ∗ 𝑓𝑖
Datos agrupados → 𝑔2 = −3
→ A la derecha
𝑛 ∗ 𝑆4
Índice de simetría de Pearson 𝑨𝒔 <0 asimetría negativa
→Leptocúrtica (𝑔2 > 0) → Los datos están muy
𝑨𝒔 >0 asimetría positiva concentrados hacia la media (muy apuntada)
𝑋̅ − 𝑀𝑜 3(𝑋̅ − 𝑀𝑒)
𝐴𝑠 = ; 𝐴𝑠 = 𝑨𝒔 =0 simetría
𝑆𝑥 𝑆𝑥 →Platicúrtica (𝑔2 < 0) → Muy poca
Para variables cuantitativas, relaciona la concentración en la media (muy achatada)
media y la moda o la media y la mediana
→Mesocúrtica (𝑔2 = 0) → Distribución normal
Coeficiente de asimetría de Fisher 𝒈𝟏 <0 asimetría negativa
Índice que se basa en desviaciones 𝒈𝟏 >0 asimetría positiva
de los valores respecto a la media. 𝒈𝟏 =0 simetría

Datos no agrupados Datos agrupados


𝑛 𝑛
𝛴𝑖=1 (𝑥𝑖 − 𝑥̅ )3 𝛴𝑖=1 (𝑥𝑖 − 𝑥̅ )3 ∗ 𝑓𝑖
𝑔1 = ; 𝑔1 =
𝑛 ∗ 𝑆3 𝑛 ∗ 𝑆3

También podría gustarte