Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Definir el Recolectar
Diseñar Inferir Concluir
Problema y Analizar
1. Centro: Valor promedio o representativo que indica la localización de la mitad del conjunto
de los datos.
2. Variación: Medida de la cantidad en que los valores de los datos varían entre sí.
4. Valores atípicos: Valores muestrales que están muy alejados de la vasta mayoría de los
demás valores de la muestra.
• Tubularmente
• Gráficamente
17
18
19
Una distribución de frecuencias (o tabla de frecuencias) indica cómo un
conjunto de datos se divide en varias categorías (o clases) al listar todas las
categorías junto con el número de valores de los datos que hay en cada una.
15 – 17 9
1. Es posible resumir conjuntos grandes
17 – 19 3
de datos;
19 – 21 3
2. Se logra cierta comprensión sobre la 21 - 23 1
naturaleza de los datos; y
3. Comience por elegir un número para el límite inferior de la primera clase. Elija el valor del dato más bajo
o un valor conveniente que sea un poco más pequeño.
4. Usando el límite inferior de la primera clase y la anchura de clase, proceda a listar los demás límites
inferiores de clase. (Sume la anchura de clase al límite inferior de la primera clase para obtener el
segundo límite inferior de clase).
5. Anote los límites inferiores de clase en una columna vertical y luego proceda a anotar los límites
superiores de clase.
6. Tome el valor de cada dato y ponga una marca en la clase adecuada. Agregue las marcas para obtener la
frecuencia total de cada clase.
Pulso de mujeres
76 72 88 60 72 68 80 64 68 68
80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76
72 72 88 80 60 72 88 88 124 64
frecuencia de clase
frecuencia relativa =
suma de todas las frecuencias
frecuencia de clase
frecuencia porcentual = X 100%
suma de todas las frecuencias
Distribución de Frecuencias Relativas
En una distribución de frecuencia relativa, la frecuencia de una clase se sustituye con una
frecuencia relativa (una proporción) o una frecuencia porcentual (un porcentaje).
frecuencia de clase
frecuencia relativa =
suma de todas las frecuencias
frecuencia de clase
frecuencia porcentual = X 100%
suma de todas las frecuencias
70-80 14 60-70 12
80-90 11 70-80 26
90-100 1 80-90 37
100-110 1 90-100 38
110-120 0 100-110 39
120-130 1 110-120 39
Total 40 120-130 40
Distribución de Frecuencias
• Al inicio las frecuencias son bajas, después se incrementan hasta un punto máximo y
luego disminuyen.
Escolaridad Porcentaje de
fumadores
0 – 12 (sin certificado) 26%
Con certificado de secundaria 43%
Graduado de preparatoria 25%
Algunos semestres en la universidad 23%
Título universitario de 2 años 21%
Título universitario de 4 años 12%
Título de posgrado 7%
123.8 123.9 123.9 123.3 123.4 123.3 123.3 123.6 123.5 123.5
123.5 123.7 123.6 123.7 123.9 124.0 124.2 123.9 123.8 123.8
124.0 123.9 123.6 123.5 123.4 123.4 123.4 123.4 123.3 123.3
123.5 123.6 123.8 123.9 123.9 123.8 123.9 123.7 123.8 123.8
• Tubularmente
• Gráficamente
Datos Agrupados
Datos NO Agrupados
Histograma
Es una gráfica con barras de la misma anchura, dibujadas una junta a la otra
(sin espacios entre sí).
La escala horizontal representa clases de valores de datos cuantitativos, en
tanto que la escala vertical representa frecuencias.
Las alturas de las barras corresponden a los valores de frecuencia.
Un histograma es, básicamente, la versión gráfica de una distribución de
frecuencias.
Polígono de frecuencias
pulso
45
40
35
30
25
20
15
10
0
70 80 90 100 110 120 130
pulso
Gráfica de puntos
El valor posicional más grande de todos los datos son las decenas.
Estos dígitos serán nuestros tallos.
Los escribimos de mayor a menor o de menor a mayor (de ambas formas funciona).
Ahora colocamos los demás dígitos de cada dato en la columna "Hojas." Por ejemplo, para trazar el
valor 84, colocamos el 4 a la derecha del número 8. Allí también colocaremos todos los dígitos
faltantes de los que obtuvieron una puntuación en los ochenta (si obtuviste 87, el 7 irá al lado del
4, si obtuviste 89, el 9 irá al lado del 7, y así sucesivamente).
Ahora arreglamos los números para que cada fila quede en orden numérico (de menor a mayor).
El diagrama de tallo y hoja es una forma conveniente de ver los datos en bruto. Usando este diagrama podemos ver que
la mayoría de los estudiantes obtuvieron entre 70 y 80 puntos, y solo un estudiante sacó menos de 65.
Gráfico de barras
También conocida como la regla del 80/20, afirma que alrededor del 80%
de los efectos generados por cualquier gran sistema viene provocado por
un 20% de las variables de ese sistema.
Ejercicio en clase:
Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos
ordenados según su magnitud y tienen como objetivo resumir los datos en un valor típico o
representativo
Ventajas Limitaciones
Es la medida estadística más Esta afectada por todos los
comúnmente empleada. valores que asume la variable
Es fácil de calcular y entender Si la distribución presenta valores
extremos bajos o altos, se
recomienda usar otra medida de
tendencia central
Sólo tiene sentido en variables POBLACION MUESTRA
cuantitativas
x
Media o Promedio
X X Valores de una
variable
N n Número de datos
f f frecuencia
Media o Promedio
Un conjunto de datos no agrupados se convierten en un
conjunto de datos agrupados cuando éstos son organizados en
una distribución de frecuencias de clase.
Datos Agrupados
i fi 1 X1 f1 (X1)(f1)
= i =1
m 2 X2 f2 (X2)(f2)
i =1
fi 3 X3 f3 (X3)(f3)
4 X4 f4 (X4)(f4)
. . . .
. . . .
. . . .
Muestra
. . . .
. . . .
m Xm fm (Xm)(fm)
Mediana
• Como medida descriptiva no se ve afectada tanto como la media aritmética por la presencia de valores extremos.
• Es de cálculo rápido y de fácil interpretación.
• Se puede hallar en variables cualitativas y cuantitativas.
• Requiere ordenamiento de datos
• En general la mediana es menos estable que la media de una muestra a otra, por lo tanto no es tan útil en la
estadística inferencial.
Mediana Para calcular la mediana, primero se ordenan los valores (se
acomodan en orden)
y luego se sigue uno de los siguientes dos procedimientos:
1. Si el número de valores es impar, la mediana es el número que se
Datos No Agrupados localiza exactamente a la mitad de la lista.
2. Si el número de valores es par, la mediana se obtiene calculando la
𝑥N+1
media de los dos números que están a la mitad.
𝑀𝑒 = Si N es impar
2
Población
𝑥𝑁 +𝑥𝑁
+1
2 2 Población Muestra Representa…
𝑀𝑒 = Si N es par
2
𝑀𝑒 𝑀𝑒 Mediana
X X Valores de una variable
𝑋𝑛+1
𝑀e = Si n es impar N n Número de datos /
2
Muestra
ubicación
f f frecuencia
𝑥𝑛 +𝑥𝑛
+1
2 2
𝑀𝑒 = Si n es par
2
Mediana ( n + 1) / 2 − f acumuladaanterior
Me = LRI + cr
fme
Datos Agrupados
Población
Muestra
Moda
Cuando algo está de moda significa que mucha gente lo sigue o utiliza. Se define la moda como el valor
de la variable estadística que tiene la frecuencia absoluta más alta. Si existen varios valores con esta
característica, entonces se dice que la distribución tiene varias modas (distribución plurimodal).
•Es el único parámetro que tiene sentido también para caracteres cualitativos.
•No es tan sensible como la media aritmética a valores extremos.
La mitad del rango es la medida de tendencia central que constituye el valor que está a
la mitad, entre la puntuación más alta y la más baja, en el conjunto original de datos.
Se calcula sumando el valor máximo con el valor mínimo y luego dividiendo la suma
entre 2, de acuerdo con la siguiente fórmula:
mitad del rango = valor máximo + valor mínimo
2
La mitad del rango se emplea pocas veces. Puesto que utiliza sólo los valores máximo
y mínimo, es demasiado sensible a esos extremos. Sin embargo, la mitad del rango
posee tres características valiosas:
1. es fácil de calcular;
2. ayuda a reforzar la importante idea de que hay varias maneras de definir el
centro de un conjunto de datos;
3. En ocasiones se le utiliza incorrectamente en vez de la mediana, de manera que
la confusión se reduce si se define claramente tanto la mitad del rango como la
mediana.
Media ponderada
Se hace la suma de los productos de las notas por el peso de cada nota y se divide por
la suma de los pesos.
Sesgo
Los datos sesgados a la izquierda (lo que también se conoce como sesgo
negativo) poseen una cola izquierda más larga, y la media y la mediana se
encuentran a la izquierda de la moda.
Los datos sesgados a la derecha (lo que también se denomina sesgo positivo)
poseen una cola derecha más larga, y la media y la mediana se encuentran a
la derecha de la moda.
Fenotipos de guisantes. Se realizó un experimento para determinar si una
deficiencia de dióxido de carbono en la tierra afecta los fenotipos de los
guisantes (chícharos).
2111111412212332313131322
En una industria dos operarios en siete días de trabajo, son capaces de
producir, por día, y en forma individual la siguiente cantidad de árboles
para fresa de 250 mm de longitud por 300 mm de diámetro.
En una industria dos operarios en siete días de trabajo, son capaces de
producir, por día, y en forma individual la siguiente cantidad de árboles
para fresa de 250 mm de longitud por 300 mm de diámetro.
Caso Práctico – Datos Agrupados
Edades
x f
13 3
14 14
15 23
16 10
17 5
18 4
19 1
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
13 3 39 X=
14 14 196 n
15 23 345
16 10 160
17 5 85
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
916
13 3 39 X= = = 15.26 años
14 14 196 n 60
15 23 345
16 10 160
17 5 85
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
916
13 3 39 X= = = 15.26 años
14 14 196 n 60
15 23 345
16 10 160 𝑛 60
Par = = = 30
17 5 85 2
2
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30
17 5 55 85 2
2
18 4 59 72
19 1 60 19
60 916
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30 Me = 15 años
17 5 55 85 2
2
18 4 59 72
19 1 60 19
60 916
Caso Práctico – Datos Agrupados
Edades
x f F x.f 𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30 Me = 15 años
17 5 55 85 2
2
18 4 59 72
19 1 60 19
Mo = 15 años
60 916
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 4
15 – 17 9
17 – 19 3
19 – 21 3
21 - 23 1
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 56
15 – 17 16 9 144
17 – 19 18 3 54
19 – 21 20 3 60
21 - 23 22 1 22
20 336
Media
𝑥 .𝑓
X=
n
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 56
15 – 17 16 9 144
17 – 19 18 3 54
19 – 21 20 3 60
21 - 23 22 1 22
20 336
Media
𝑥 .𝑓 336
X= 16,8 años
n
20
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años
Edades Xi fi F xifi 𝑛+1
Impar =
13 - 15 14 4 4 56 2
15 – 17 16 9 13 144
17 – 19 18 3 16 54 𝑛
Par =
19 – 21 20 3 19 60 2
21 - 23 22 1 20 22
20 336
Mediana
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años
1. Identificar la ubicación
Edades Xi fi F xifi 𝑛+1
Impar =
13 - 15 14 4 4 56 2
15 – 17 16 9 13 144
17 – 19 18 3 16 54 𝑛
Par =
19 – 21 20 3 19 60 2
21 - 23 22 1 20 22
20 336 20
= 10
2
Mediana
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años
Edades Xi fi F xifi
13 - 15 14 4 4 56 𝑛+1
Impar =
15 – 17 16 9 13 144 2
17 – 19 18 3 16 54
19 – 21 20 3 19 60
𝑛
21 - 23 22 1 20 22 Par =
2
20 336
20
2 = 10
Mediana
20
− 4
2
15 + .2
9
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi
13 - 15 14 4 4 56 𝑛+1
Impar =
15 – 17 16 9 13 144 2
17 – 19 18 3 16 54
19 – 21 20 3 19 60
𝑛
21 - 23 22 1 20 22 Par =
2
20 336
20
2 = 10
Mediana
20
− 4
2
15 + .2 15 + 1.33 16.33 años
9
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi 1. Identificar la fi mayor
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336
Moda
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi 1. Identificar la fi mayor
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336
Moda
9−4
15 + .2
(9-4) + (9-3)
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336
Moda
9−4
15 + .2 15 + 0.90 15.90 años
(9-4) + (9-3)
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336