Está en la página 1de 86

Recolectar y Analizar

Profesora Sharon González


Pasos para realizar un análisis estadístico

Definir el Recolectar
Diseñar Inferir Concluir
Problema y Analizar

1. Ejecutar el plan de recolección de


datos.

2. Análisis de la Información muestral, es


decir, cuál método estadístico es
apropiado para extraer la información
de datos.
Características de los Datos

1. Centro: Valor promedio o representativo que indica la localización de la mitad del conjunto
de los datos.

2. Variación: Medida de la cantidad en que los valores de los datos varían entre sí.

3. Distribución: La naturaleza o forma de la distribución de los datos sobre el rango de valores


(como en forma de campana, distribución uniforme o sesgada).

4. Valores atípicos: Valores muestrales que están muy alejados de la vasta mayoría de los
demás valores de la muestra.

5. Tiempo: Características cambiantes de los datos a través del tiempo


Los datos obtenidos se les puede representar Recolectar
de diferentes formas: y Analizar

• Tubularmente
• Gráficamente

Datos NO Agrupados Datos Agrupados

Edad Edad Frecuencia Edades Frecuencia


13 13 3
13 - 15 4
13 14 14
15 – 17 9
13 15 23
14 16 10 17 – 19 3
14 17 5
19 – 21 3
15 18 4
16 19 1 21 - 23 1

17
18
19
Una distribución de frecuencias (o tabla de frecuencias) indica cómo un
conjunto de datos se divide en varias categorías (o clases) al listar todas las
categorías junto con el número de valores de los datos que hay en cada una.

Las distribuciones de frecuencias se Edades Frecuencia

construyen por las siguientes razones: 13 - 15 4

15 – 17 9
1. Es posible resumir conjuntos grandes
17 – 19 3
de datos;
19 – 21 3
2. Se logra cierta comprensión sobre la 21 - 23 1
naturaleza de los datos; y

3. Se tiene una base para construir


gráficas (como los histograma).
Una distribuciónDefiniciones
de frecuencias (o tabla de frecuencias) indica cómo un conjunto de datos se divide en varias
categorías (o clases) al listar todas las categorías junto con el número de valores de los datos que hay en cada una.

• Los límites inferiores de clase son las cifras más pequeñas


que pueden pertenecer a las diferentes clases. (Los límites
inferiores de clase de la tabla son 60, 70, 80, 90,100, 110 y
120).
• Los límites superiores de clase son las cifras más grandes
que pueden pertenecer a las diferentes clases. (Los límites Pulso Frecuencia
superiores de clase de la tabla son 69, 79, 89, 99, 109, 119, 60-70 12
129). 70-80 14
• Las marcas de clase son los puntos medios de las clases. Las 80-90 11
marcas de clase se calculan sumando el límite inferior de
90-100 1
clase con el límite superior de clase, y dividiendo el
resultado entre 2. 100-110 1

• La anchura de clase es la diferencia entre dos límites 110-120 0


inferiores de clase consecutivos o dos fronteras inferiores de 120-130 1
clase consecutivas en una distribución de frecuencias. (La
anchura de clase de los datos de la tabla es 10).
Procedimiento para construir una distribución de frecuencias

Los pasos para su elaboración manual son los siguientes:


1. Determine el número de clases que desea, el cual debe estar entre 5 y 20.
2. Calcule la anchura de clase.

Anchura de clase = (valor más alto) - (valor más bajo)


número de clases

3. Comience por elegir un número para el límite inferior de la primera clase. Elija el valor del dato más bajo
o un valor conveniente que sea un poco más pequeño.
4. Usando el límite inferior de la primera clase y la anchura de clase, proceda a listar los demás límites
inferiores de clase. (Sume la anchura de clase al límite inferior de la primera clase para obtener el
segundo límite inferior de clase).
5. Anote los límites inferiores de clase en una columna vertical y luego proceda a anotar los límites
superiores de clase.
6. Tome el valor de cada dato y ponga una marca en la clase adecuada. Agregue las marcas para obtener la
frecuencia total de cada clase.
Pulso de mujeres
76 72 88 60 72 68 80 64 68 68
80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76
72 72 88 80 60 72 88 88 124 64

1. Seleccione la cantidad de clases con la


que trabajará. Trabajaremos con 7 clases.
2. Calcule la anchura de clase.
124−60
Anchura de clase = = 9.14
7
redondeamos a 10
Pulso de mujeres
76 72 88 60 72 68 80 64 68 68
80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76
72 72 88 80 60 72 88 88 124 64

1. Seleccione la cantidad de clases con la


que trabajará. Trabajaremos con 7 clases.
2. Calcule la anchura de clase. Pulso Frecuencia
124−60 60
Anchura de clase = = 9.14
7 70
redondeamos a 10
80
90
3. Primer límite inferior de clase = 60.
100
4. Sume la anchura de clase (10) para
110
obtener los siguientes limites inferiores.
120
Pulso de mujeres
76 72 88 60 72 68 80 64 68 68
80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76
72 72 88 80 60 72 88 88 124 64

1. Seleccione la cantidad de clases con la


que trabajará. Trabajaremos con 7 clases.
2. Calcule la anchura de clase. Pulso Frecuencia
124−60 60-70
Anchura de clase = = 9.14
7 70-80
redondeamos a 10
80-90
90-100
3. Primer límite inferior de clase = 60.
100-110
4. Sume la anchura de clase (10) para
110-120
obtener los siguientes limites inferiores.
120-130
5. Identifique los límites superiores.
Pulso de mujeres
76 72 88 60 72 68 80 64 68 68
80 76 68 72 96 72 68 72 64 80
64 80 76 76 76 80 104 88 60 76
72 72 88 80 60 72 88 88 124 64

1. Seleccione la cantidad de clases con la


que trabajará. Trabajaremos con 7 clases.
2. Calcule la anchura de clase. Pulso Frecuencia
124−60 60-70 12
Anchura de clase = = 9.14
7 70-80 14
redondeamos a 10
80-90 11
90-100 1
3. Primer límite inferior de clase = 60.
100-110 1
4. Sume la anchura de clase (10) para
110-120 0
obtener los siguientes limites inferiores.
120-130 1
5. Identifique los límites superiores.
6. Obtenga la frecuencia por clase.
Distribución de Frecuencias Relativas
En una distribución de frecuencia relativa, la frecuencia de una clase se sustituye con una
frecuencia relativa (una proporción) o una frecuencia porcentual (un porcentaje).

frecuencia de clase
frecuencia relativa =
suma de todas las frecuencias

frecuencia de clase
frecuencia porcentual = X 100%
suma de todas las frecuencias
Distribución de Frecuencias Relativas
En una distribución de frecuencia relativa, la frecuencia de una clase se sustituye con una
frecuencia relativa (una proporción) o una frecuencia porcentual (un porcentaje).

frecuencia de clase
frecuencia relativa =
suma de todas las frecuencias

frecuencia de clase
frecuencia porcentual = X 100%
suma de todas las frecuencias

Pulso Frecuencia Pulso Frecuencia Pulso Frecuencia


60-70 12 Relativa Relativa %

70-80 14 60-70 0.30 60-70 30%

80-90 11 70-80 0.35 70-80 35%

90-100 1 80-90 0.275 80-90 27.5%

100-110 1 90-100 0.025 90-100 2.5%

110-120 0 100-110 0.025 100-110 2.5%

120-130 1 110-120 0 110-120 0

Total 40 120-130 0.025 120-130 2.5%


Distribución de Frecuencias Acumuladas
La frecuencia acumulada de una clase es la sima de as frecuencias para esa clase y
todas las clases anteriores.

Pulso Frecuencia Pulso Frecuencia


60-70 12 acumulada

70-80 14 60-70 12

80-90 11 70-80 26

90-100 1 80-90 37

100-110 1 90-100 38

110-120 0 100-110 39

120-130 1 110-120 39

Total 40 120-130 40
Distribución de Frecuencias

La distribución de frecuencias es una de las primeras herramientas que utilizamos para


analizar datos, y por lo regular revela alguna de sus características importantes.

Utilizamos la distribución de frecuencias para determinar si los datos tienen una


distribución aproximadamente normal.

Las distribuciones aproximadamente normales se caracterizan por tener una distribución


de frecuencias con los siguientes atributos:

• Al inicio las frecuencias son bajas, después se incrementan hasta un punto máximo y
luego disminuyen.

• La distribución es aproximadamente simétrica, y las frecuencias tienden a distribuiré


de amera uniforme a ambos lados de la frecuencia máxima, como si se tratara de una
imagen observada en un espejo.
Ejemplo:

Puntuaciones del CI Frecuencia Distribución normal:


50 – 70 24 Al inicio las frecuencias son bajas
70 – 90 228
90 – 110 490 Aumentan hasta un punto máximo
110 – 130 232
130 – 150 26 Disminuyen nuevamente

Esta tabla presenta datos con una distribución normal.


Ejemplo: Monedas de un centavo elegidas al azar

Pesos en gramos Frecuencia


2.40 – 2.49 18
2.50 – 2.59 19
2.60 – 2.69 0
2.70 – 2.79 0
2.80 – 2.89 0
2.90 – 2.99 2
3.00 – 3.09 25
3.10 – 3.19 8
Ejemplo: Monedas de un centavo elegidas al azar

Pesos en gramos Frecuencia


2.40 – 2.49 18
2.50 – 2.59 19
2.60 – 2.69 0
2.70 – 2.79 0
2.80 – 2.89 0
2.90 – 2.99 2
3.00 – 3.09 25
3.10 – 3.19 8

En una investigación posterior se descubrió que las monedas de un


centavo acuñadas antes de 1983 tenían un 97% de cobre y un 3% de zinc,
mientras que las acuñadas después de 1983 tienen 3% de cobre y un 97%
de zinc.
¿Sería posible identificar la lista original de los pesos individuales a
partir de la siguiente tabla?
Ejemplo: Escolaridad y tabaquismo

Escolaridad Porcentaje de
fumadores
0 – 12 (sin certificado) 26%
Con certificado de secundaria 43%
Graduado de preparatoria 25%
Algunos semestres en la universidad 23%
Título universitario de 2 años 21%
Título universitario de 4 años 12%
Título de posgrado 7%

¿Es una distribución de frecuencias porcentual?


1. Identifique la anchura de clase y las marcas de clase para las siguientes
distribución de frecuencias.

Alquitrán (mg) en Frecuencia Alquitrán (mg) en Frecuencia


cigarrillos sin filtro cigarrillos con filtro
10 – 13 1 2–5 2
14 – 17 0 6–9 2
18 – 21 15 10 – 13 6
22 – 25 7 14 – 17 15
26 – 29 2

2. Construya la distribución de frecuencias acumuladas.

3. Construya la distribución de frecuencias relativas y porcentuales.


Mediciones de voltaje realizadas en una casa por 40 días. Las mediciones
corresponden a la electricidad que se suministra directamente a la casa, aun
generador independiente Generac y a un dispositivo de alimentación eléctrica
ininterrumpida conectado al suministro de la electricidad de la casa.

123.8 123.9 123.9 123.3 123.4 123.3 123.3 123.6 123.5 123.5

123.5 123.7 123.6 123.7 123.9 124.0 124.2 123.9 123.8 123.8

124.0 123.9 123.6 123.5 123.4 123.4 123.4 123.4 123.3 123.3

123.5 123.6 123.8 123.9 123.9 123.8 123.9 123.7 123.8 123.8

Construya una distribución de frecuencia con 5 clases.


Recolectar
Los datos obtenidos se les puede representar de diferentes formas: y Analizar

• Tubularmente
• Gráficamente

Datos Agrupados
Datos NO Agrupados
Histograma

Es una gráfica con barras de la misma anchura, dibujadas una junta a la otra
(sin espacios entre sí).
La escala horizontal representa clases de valores de datos cuantitativos, en
tanto que la escala vertical representa frecuencias.
Las alturas de las barras corresponden a los valores de frecuencia.
Un histograma es, básicamente, la versión gráfica de una distribución de
frecuencias.
Polígono de frecuencias

Es un gráfico que se construye sobre el histograma.


De acuerdo al tipo de distribución de frecuencia, éstos
pueden denominarse:
. Polígonos de frecuencia absoluta
. Polígonos de frecuencia relativa
. Polígonos de frecuencia porcentual

Para construir el polígono de frecuencia se toma la marca de clase que


coincide con el punto medio de cada rectángulo de un histograma.
Polígono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una tabla de


datos agrupados se obtiene el histograma de frecuencias
acumuladas o su correspondiente polígono.
Ojiva
Una ojiva es una gráfica estadística que representa frecuencias
acumuladas, y sirve para determinar el número de valores que se ubican
por debajo de algún valor específico.

pulso
45

40

35

30

25

20

15

10

0
70 80 90 100 110 120 130
pulso
Gráfica de puntos

Es aquella donde se marca cada valor de un dato como un punto a lo


largo de una escala de valores. Los puntos que representan valores
iguales se apilan.
Gráfico de tallo y hojas

Representa datos cuantitativos separando cada valor en dos


partes:
• El tallo (el dígito ubicado en el extremo izquierdo)
• La hoja (el dígito del extremo derecho)
Ejemplo. Estas son las notas del último examen: 90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72

El valor posicional más grande de todos los datos son las decenas.
Estos dígitos serán nuestros tallos.
Los escribimos de mayor a menor o de menor a mayor (de ambas formas funciona).

Ahora colocamos los demás dígitos de cada dato en la columna "Hojas." Por ejemplo, para trazar el
valor 84, colocamos el 4 a la derecha del número 8. Allí también colocaremos todos los dígitos
faltantes de los que obtuvieron una puntuación en los ochenta (si obtuviste 87, el 7 irá al lado del
4, si obtuviste 89, el 9 irá al lado del 7, y así sucesivamente).

Ahora arreglamos los números para que cada fila quede en orden numérico (de menor a mayor).

El diagrama de tallo y hoja es una forma conveniente de ver los datos en bruto. Usando este diagrama podemos ver que
la mayoría de los estudiantes obtuvieron entre 70 y 80 puntos, y solo un estudiante sacó menos de 65.
Gráfico de barras

Utiliza barras del mismo ancho para mostrar las frecuencias de


categorías de datos cualitativos.

El eje vertical representa frecuencias o frecuencias relativas


El eje horizontal identifica las diferentes categorías de los datos
cualitativos

Las barras pueden separarse entre sí por pequeños espacios o no


separarse.
Gráfica de barras múltiples

Contiene dos o más conjuntos de barras, y se utiliza para


comparar dos o más conjunto de datos.
Gráfica de Pareto

Es una gráfica de barras para datos cualitativos, donde las barras


se acomodan en orden descendente de acuerdo con las
frecuencias.
• Las escalas verticales de las gráficas de Pareto representan
tanto frecuencias como frecuencias relativas.
• La escala horizontal identifica las diferentes categorías de datos
cualitativos.
• La altura de las barras disminuye de izquierda a derecha.
Principio de Pareto

También conocida como la regla del 80/20, afirma que alrededor del 80%
de los efectos generados por cualquier gran sistema viene provocado por
un 20% de las variables de ese sistema.
Ejercicio en clase:

1. Organizarse en grupos de 5 a 6 personas.


2. Planear la recolección de los datos: estatura de los estudiantes del
salón.
3. Construya una distribución de frecuencias de todos los
estudiantes.
4. Construya una distribución de frecuencias relativa porcentual.
5. Estratifique los datos en hombres y mujeres y construya una
distribución de frecuencias.
Diagramas de dispersión

Un diagrama de dispersión es una gráfica de datos apareados (x, y),


con un eje x horizontal y un eje y vertical. Los datos se aparean de tal
forma que cada valor de un conjunto de datos corresponde a un valor
de un segundo conjunto de datos.
Para elaborar manualmente un diagrama de dispersión, construya un
eje horizontal para los valores de la primera variable, construya un eje
vertical para los valores de la segunda variable y después grafique los
puntos. El patrón de los puntos graficados suele ser útil para
determinar si existe alguna relación entre las dos variables.
Este es el diagrama de dispersión que expresa la cantidad de dinero que se ganó Mateo
cada semana trabajando en la tienda de su padre.
Las semanas están diagramadas en el eje x, y la cantidad de dinero que se ganó en esa
semana en el eje y. En general, la variable independiente (la variable que no está
influenciada por nada) está en el eje x y la variable dependiente (la que es modificada
por la variable independiente) está en el eje y.
En este diagrama podemos ver que en la semana 2 Mateo se ganó alrededor de $125, y
en la semana 18 estuvo cerca de los $165. Pero más importante aún es la tendencia. Por
ejemplo, con estos datos podemos ver que Mateo gana cada vez más según pasan las
semanas. Quizá su padre le da más horas a la semana o más responsabilidades.
Gráficas de series de tiempo

Una gráfica de series de tiempo incluye datos de series de tiempo, los


cuales se reúnen en diferentes momentos
En una industria automotriz es necesario realizar un estudio debido a un partida
defectuosa de discos de embrague. Para ello se ha recopilado la siguiente
información referente a la duración en horas de 50 de ellos.
Se realizaron dos experimentos referente al peso, en Kg,
aplicado sobre una cierta cantidad de tableros.
Una gráfica no es, en sí misma, un resultado final; es una herramienta para describir,
explorar y comparar datos, que consideramos como sigue:

• Descripción de datos: En un histograma, por ejemplo, se toman en cuenta el centro,


la variación, la distribución y los valores extremos.

• Exploración de datos: Buscamos características de la gráfica que revelen rasgos


interesantes y/o útiles del conjunto de datos.

• Comparación de datos: Construya gráficas similares que faciliten la comparación de


conjuntos de datos. Por ejemplo, si usted grafica un polígono de frecuencias con los
pesos de hombres y otro polígono de frecuencias con pesos de mujeres, sobre el
mismo conjunto de ejes, el polígono de los hombres debería aparecer a la derecha
del polígono de mujeres, lo cual indica que los hombres tienen pesos mayores.
¿Qué son las Medidas de Tendencia Central?

Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos
ordenados según su magnitud y tienen como objetivo resumir los datos en un valor típico o
representativo

Media Aritmética Mediana Moda


Media o Promedio

Es la suma de todos los valores dividida entre la cantidad de valores

Ventajas Limitaciones
Es la medida estadística más Esta afectada por todos los
comúnmente empleada. valores que asume la variable
Es fácil de calcular y entender Si la distribución presenta valores
extremos bajos o altos, se
recomienda usar otra medida de
tendencia central
Sólo tiene sentido en variables POBLACION MUESTRA
cuantitativas

 x
Media o Promedio

Datos no agrupados es el conjunto de observaciones que se


presentan en su forma original tal y como fueron recolectados,
para obtener información directamente de ellos.
Datos No Agrupados
Población

Población Muestra Representa…


µ 𝑥ҧ media o promedio
𝛴1 𝛴1 Sumatoria
Muestra

X X Valores de una
variable
N n Número de datos
f f frecuencia
Media o Promedio
Un conjunto de datos no agrupados se convierten en un
conjunto de datos agrupados cuando éstos son organizados en
una distribución de frecuencias de clase.
Datos Agrupados

m CLASES MC (Xi) fi (Xi)(fi)


X
Población

i fi 1 X1 f1 (X1)(f1)
= i =1
m 2 X2 f2 (X2)(f2)
i =1
fi 3 X3 f3 (X3)(f3)
4 X4 f4 (X4)(f4)
. . . .
. . . .
. . . .
Muestra

. . . .
. . . .
m Xm fm (Xm)(fm)
Mediana

Es el valor que divide a un conjunto de datos en dos partes iguales

• Como medida descriptiva no se ve afectada tanto como la media aritmética por la presencia de valores extremos.
• Es de cálculo rápido y de fácil interpretación.
• Se puede hallar en variables cualitativas y cuantitativas.
• Requiere ordenamiento de datos
• En general la mediana es menos estable que la media de una muestra a otra, por lo tanto no es tan útil en la
estadística inferencial.
Mediana Para calcular la mediana, primero se ordenan los valores (se
acomodan en orden)
y luego se sigue uno de los siguientes dos procedimientos:
1. Si el número de valores es impar, la mediana es el número que se
Datos No Agrupados localiza exactamente a la mitad de la lista.
2. Si el número de valores es par, la mediana se obtiene calculando la
𝑥N+1
media de los dos números que están a la mitad.
𝑀𝑒 = Si N es impar
2
Población

𝑥𝑁 +𝑥𝑁
+1
2 2 Población Muestra Representa…
𝑀𝑒 = Si N es par
2
𝑀𝑒 𝑀𝑒 Mediana
X X Valores de una variable
𝑋𝑛+1
𝑀e = Si n es impar N n Número de datos /
2
Muestra

ubicación
f f frecuencia
𝑥𝑛 +𝑥𝑛
+1
2 2
𝑀𝑒 = Si n es par
2
Mediana  ( n + 1) / 2 − f acumuladaanterior 
Me = LRI +    cr
 fme 
Datos Agrupados
Población
Muestra
Moda
Cuando algo está de moda significa que mucha gente lo sigue o utiliza. Se define la moda como el valor
de la variable estadística que tiene la frecuencia absoluta más alta. Si existen varios valores con esta
característica, entonces se dice que la distribución tiene varias modas (distribución plurimodal).

•Es el único parámetro que tiene sentido también para caracteres cualitativos.
•No es tan sensible como la media aritmética a valores extremos.
La mitad del rango es la medida de tendencia central que constituye el valor que está a
la mitad, entre la puntuación más alta y la más baja, en el conjunto original de datos.
Se calcula sumando el valor máximo con el valor mínimo y luego dividiendo la suma
entre 2, de acuerdo con la siguiente fórmula:
mitad del rango = valor máximo + valor mínimo
2

La mitad del rango se emplea pocas veces. Puesto que utiliza sólo los valores máximo
y mínimo, es demasiado sensible a esos extremos. Sin embargo, la mitad del rango
posee tres características valiosas:
1. es fácil de calcular;
2. ayuda a reforzar la importante idea de que hay varias maneras de definir el
centro de un conjunto de datos;
3. En ocasiones se le utiliza incorrectamente en vez de la mediana, de manera que
la confusión se reduce si se define claramente tanto la mitad del rango como la
mediana.
Media ponderada

En algunos casos, los valores varían de acuerdo con su grado de


importancia, por lo que podemos ponderarlos y calcular la media
ponderada de los valores x, una media que se obtiene asignando distintos
pesos (w) a los valores.
Media ponderada
La nota final de una asignatura es una media ponderada de las notas que han obtenido
los alumnos en los cuatro elementos evaluables que determina el profesor. El
responsable de la asignatura otorga un peso de 3 al examen inicial, de 1 al trabajo
entregable, 2 al trabajo final y 4 al examen final. Las notas de un alumno han sido las
siguientes:

Se hace la suma de los productos de las notas por el peso de cada nota y se divide por
la suma de los pesos.
Sesgo

Una distribución de datos está sesgada si no es simétrica y se extiende más


hacia un lado que hacia el otro. (Una distribución de datos es simétrica si la
mitad izquierda de su histograma es aproximadamente una imagen en espejo
de su mitad derecha).

Los datos sesgados a la izquierda (lo que también se conoce como sesgo
negativo) poseen una cola izquierda más larga, y la media y la mediana se
encuentran a la izquierda de la moda.

Los datos sesgados a la derecha (lo que también se denomina sesgo positivo)
poseen una cola derecha más larga, y la media y la mediana se encuentran a
la derecha de la moda.
Fenotipos de guisantes. Se realizó un experimento para determinar si una
deficiencia de dióxido de carbono en la tierra afecta los fenotipos de los
guisantes (chícharos).

A continuación se indican los códigos de los fenotipos:

1 = amarillo claro, 2 = verde claro, 3 = amarillo rugoso y 4 verde rugoso.

¿Se pueden obtener medidas de tendencia central para estos valores?


¿Los resultados tienen algún sentido?

2111111412212332313131322
En una industria dos operarios en siete días de trabajo, son capaces de
producir, por día, y en forma individual la siguiente cantidad de árboles
para fresa de 250 mm de longitud por 300 mm de diámetro.
En una industria dos operarios en siete días de trabajo, son capaces de
producir, por día, y en forma individual la siguiente cantidad de árboles
para fresa de 250 mm de longitud por 300 mm de diámetro.
Caso Práctico – Datos Agrupados
Edades

x f
13 3
14 14
15 23
16 10
17 5
18 4
19 1
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
13 3 39 X=
14 14 196 n
15 23 345
16 10 160
17 5 85
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
916
13 3 39 X= = = 15.26 años
14 14 196 n 60
15 23 345
16 10 160
17 5 85
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
916
13 3 39 X= = = 15.26 años
14 14 196 n 60
15 23 345
16 10 160 𝑛 60
Par = = = 30
17 5 85 2
2
18 4 72
19 1 19
60 916
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30
17 5 55 85 2
2
18 4 59 72
19 1 60 19
60 916
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30 Me = 15 años
17 5 55 85 2
2
18 4 59 72
19 1 60 19
60 916
Caso Práctico – Datos Agrupados
Edades

x f F x.f ෍𝑥 .𝑓
916
13 3 3 39 X= = = 15.26 años
14 14 17 196 n 60
15 23 40 345
16 10 50 160 𝑛 60
Par = = = 30 Me = 15 años
17 5 55 85 2
2
18 4 59 72
19 1 60 19
Mo = 15 años
60 916
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 4
15 – 17 9
17 – 19 3
19 – 21 3
21 - 23 1
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 56
15 – 17 16 9 144
17 – 19 18 3 54
19 – 21 20 3 60
21 - 23 22 1 22
20 336

Media

෍𝑥 .𝑓
X=
n
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 56
15 – 17 16 9 144
17 – 19 18 3 54
19 – 21 20 3 60
21 - 23 22 1 22
20 336

Media

෍𝑥 .𝑓 336
X= 16,8 años
n
20
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años
Edades Xi fi F xifi 𝑛+1
Impar =
13 - 15 14 4 4 56 2
15 – 17 16 9 13 144
17 – 19 18 3 16 54 𝑛
Par =
19 – 21 20 3 19 60 2
21 - 23 22 1 20 22
20 336

Mediana
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años
1. Identificar la ubicación
Edades Xi fi F xifi 𝑛+1
Impar =
13 - 15 14 4 4 56 2
15 – 17 16 9 13 144
17 – 19 18 3 16 54 𝑛
Par =
19 – 21 20 3 19 60 2
21 - 23 22 1 20 22
20 336 20
= 10
2

Mediana
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años
Edades Xi fi F xifi
13 - 15 14 4 4 56 𝑛+1
Impar =
15 – 17 16 9 13 144 2
17 – 19 18 3 16 54
19 – 21 20 3 19 60
𝑛
21 - 23 22 1 20 22 Par =
2
20 336

20
2 = 10
Mediana
20
− 4
2
15 + .2
9
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi
13 - 15 14 4 4 56 𝑛+1
Impar =
15 – 17 16 9 13 144 2
17 – 19 18 3 16 54
19 – 21 20 3 19 60
𝑛
21 - 23 22 1 20 22 Par =
2
20 336

20
2 = 10
Mediana
20
− 4
2
15 + .2 15 + 1.33 16.33 años
9
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi 1. Identificar la fi mayor
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336

Moda
Caso Práctico – Datos Agrupados en Intervalos
Edades X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi 1. Identificar la fi mayor
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336

Moda

9−4
15 + .2
(9-4) + (9-3)
Caso Práctico – Datos Agrupados en Intervalos
Edades
X = 16,8 años Me= 16.33 años
Edades Xi fi F xifi
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336

Moda

9−4
15 + .2 15 + 0.90 15.90 años
(9-4) + (9-3)
Caso Práctico – Datos Agrupados en Intervalos
Edades
Edades Xi fi F xifi
13 - 15 14 4 4 56
15 – 17 16 9 13 144
17 – 19 18 3 16 54
19 – 21 20 3 19 60
21 - 23 22 1 20 22
20 336

X = 16,8 años Me= 16.33 años Mo = 15.90 años


¿Cuál medida de tendencia central se debe utilizar?

• La media aritmética debe utilizarse cuando el conjunto de datos es homogéneo.


• En una distribución simétrica las tres medidas coinciden, por lo cual se puede utilizar cualquiera.
• Cuando los datos no son homogéneos se debe utilizar la mediana, ya que esta no es sensible a
los valores extremos, y además no se ve altamente influida por la frecuencia de aparición de un
solo valor.
• Cuando la población está sesgada ya sea positiva o negativamente la mediana resulta ser la
mejor medida de posición.
• La moda se utiliza más que todo para datos categóricos.

También podría gustarte