Está en la página 1de 8

Colegio de Educación Básica y Media Técnica

Nuestra Señora de Nazareth


GUÍA GRADO SÉPTIMO

Tema: Estadística
Subtemas: Conceptos estadísticos
Caracterización de variables cuantitativas.
Tablas de distribución de frecuencias.
Medidas de tendencia central.
Caracterización de datos no agrupados.
Estadística
La estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta información con el
objetivo de propiciar la toma de decisiones asertivamente y con fundamentos teóricos, basadas en
desarrollos matemáticos.

Conceptos estadísticos

Población: es el conjunto de elementos que tiene una característica común. El tamaño de la población es
el número de individuos, se simboliza con N.

Observación o individuo: elemento que pertenece al conjunto población objeto de estudio, dotado de
ciertas características que lo definen como miembro del conjunto.

Muestra: subconjunto seleccionado aleatoriamente de la población, que se emplea para analizar el


comportamiento de la misma, el tamaño se simboliza con n.

Variable estadística: define una característica particular de la población, que se observa en cada
individuo, asumiendo diferentes valoraciones que pueden ser medidas u observadas.

Variables estadísticas

Cualitativas: define cualidades en una poblacion, pueden ser:


Nominales: son variables que toman valores no numéricos, que no pueden ser ordenados de una manera
lógica. Ej:la nacionalidad de una persona, el genero,

Ordinales: son vriables que toman valores no numéricos, que pueden ser ordenados siguiendo un patrón de
o una manera lógica. Ej: nivel de pobreza, grados universitarios.

Cuantitativas: define cantidades de una poblacion, pueden ser:


Discretas: son variables que toman valores numéricos enteros no negativos y numerables. Ej: la edad de
una persona

Continuas: son variables que toman valores numéricos fijos en un intervalo deterninado. Ej: la estatura.

Caracterización de variables cualitativas


En este coso se analizan estas variables de forma separada, pero si se busca una relación se hace de la
siguiente manera.
Tablas de contingencia: son tablas de doble entrada, donde las filas y las columnas de la tabla asumen
valores categóricos de variables cualitativas que se relacionan entre sí.

Ejemplo: en este caso el estudio es de unos estudiantes que van a ingresar a la universidad a las carreras
profesionales (matemáticas (M), física (F), biología (B) y química (Q)) y el género. Primero se tiene que
ordenar en tablas de frecuencias.

Carrera profesional Género


M F B Q M 45
19 21 55 13 F 63

Los datos los tenemos que integrar en una sola tabla, denominada tabla de contingencia.

Carrera profesional
Género M F B Q Total
Masculino 9 12 20 4 45
Femenino 10 9 35 9 63
Total 19 21 55 13 108

En este caso como ya está integrada la información en una sola tabla podemos hacer una interpretación
más concreta, ejemplo:

✓ La carrera que más prefieren las mujeres es biología con un total de 35 aspirantes.
✓ En matemáticas la cantidad de aspirantes la cantidad de mujeres y de hombres es casi la misma.
✓ La carrera de química es la que menos prefieren los hombres,
únicamente 4 aspirantes.
Recuerda
✓ El porcentaje de hombres que se presentaron a la carrera de Para obtener los porcentajes de cada
biología es de: categoría se utiliza la siguiente formula:
20
x= × 100% = 44,44% por lo tanto, el 44,44% de los 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑎
45 𝑥= 𝑥100%
hombres ingresan a estudiar biología. 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒

Caracterización de variables cuantitativas


Este tipo de datos como son números lo primero que se hace es organizarlos, en una tabla de distribución
de frecuencias, en donde se resumen todos los valores de los individuos.

Tablas de distribución de frecuencias


Una tabla de distribución de frecuencias es un arreglo de filas y columnas en el cual se registra, de
manera ordenada y clasificada, la información de una base de datos.

Elementos:

➢ Intervalos de clase: se ubican en la primera columna de la tabla. Es un conjunto que contiene todos los
números entre dos números dados. Se pueden representar así.
Intervalo [a , b] contiene todos los números desde a hasta b.
Intervalo [a , b) contiene todos los números mayores o iguales a a y menores que b (b no está incluido
en el intervalo)
➢ Rango: es la diferencia entre el mayor y el menor valor de una lista de datos.
➢ Frecuencia absoluta del intervalo ( 𝒇𝒊): número de individuos o de datos que están clasificados en
cada intervalo.
➢ Frecuencia absoluta acumulada (𝑭𝒊):se suman las frecuencias absolutas.
➢ Frecuencia relativa (𝒇𝒓): se divide la frecuencia absoluta 𝑓𝑖 y el total n de datos de la muestra.
➢ Frecuencia relativa acumulada (𝑭𝒓): se suman las frecuencias relativas.
➢ Marca de clase (𝑴𝒊): punto medio de cada intervalo, se considera el dato más representativo de cada
intervalo.

Ejemplo: Construye una tabla de distribución de frecuencias

En un estudio realizado a un grupo de 30 estudiantes de un colegio, se les preguntó sobre los minutos que
les tomó resolver un problema. Con los siguientes datos.

30 20 14 5 10 12 16 6 3 2 8 8 8 5 10
38 35 28 25 5 7 14 25 23 4 32 5 9 12 14
Paso 1: se calcula el número de intervalos, con la formula # 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = √𝑛

En este caso n es 30 son los estudiantes, y como la raíz cuadrada de 30 no es exacta se toma el valor
exacto.

# 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = √30 ≈ 5 por lo tanto, se escriben 5 intervalos.

Paso 2: se ordenan los datos de mayor a menor, y se calcula el rango, donde se toma el dato mayor y se le
resta el menor.

Rango = valor mayor - valor menor


Rango = 38 – 2 = 36

Paso 3: se halla la longitud de los intervalos, como son 5 intervalos, se divide el rango entre los intervalos
36 ÷ 5 = 7,2 ≈ 8 como el valor no es exacto, se aproxima al siguiente exacto. Por lo tanto, la longitud es
de 8.

Paso 4: Entonces como el valor más pequeño es 2 se le suma 8 y queda 10. Por lo tanto, el primer intervalo
va de 2 a 10 sin incluir el 10, el segundo intervalo va de 10 hasta 18 sin incluir 18 y se van agregando 8
para los otros intervalos.

Paso 5: se calcula el valor de 𝑓𝑟, 𝐹𝑖, 𝐹𝑟, 𝑀𝑖 y el porcentaje de cada intervalo y se ubican en la tabla.
Primer intervalo= [2 , 10)
2+10 12
Marca de la clase, 𝑀𝑖 = 2
= 2
=6
Frecuencia absoluta, 𝑓𝑖 = 13 ya que hay 13 estudiantes que se tomaron tiempos de 2mn a 10mn.
13
Frecuencia relativa, 𝑓𝑟 = 30 = 0,43
Porcentaje, 𝑓𝑟𝑥100% = 43%

Y se repite el proceso para los otros datos.


Tiempo 𝑴𝒊 𝒇𝒊 𝑭𝒊 𝒇𝒓 𝑭𝒓 %
(min)
[2,10) 6 13 13 0,43 0,43 43%
[10,18) 14 8 21 0,27 0,7 27%
[18,26) 22 4 25 0,13 0,83 13%
[26,34) 30 3 28 0,1 0,93 10%
[34,42) 38 2 30 0,07 1 7%
segundo intervalo= [10 , 18)
10+18 28
Marca de la clase, 𝑀𝑖 = 2
= 2
= 14
Frecuencia absoluta, 𝑓𝑖 = 8 ya que hay 8 estudiantes que se tomaron tiempos de 10mn a 18mn.
8
Frecuencia relativa, 𝑓𝑟 = 30 = 0,27
Porcentaje, 𝑓𝑟𝑥100% = 27%
tercer intervalo= [18 , 26)
18+26 44
Marca de la clase, 𝑀𝑖 = 2
= 2
= 22
Frecuencia absoluta, 𝑓𝑖 = 4 ya que hay 4 estudiantes que se tomaron tiempos de 18mn a 26mn.
4
Frecuencia relativa, 𝑓𝑟 = 30 = 0,13
Porcentaje, 𝑓𝑟𝑥100% = 13%
Cuarto intervalo= [26 , 34)
26+34 60
Marca de la clase, 𝑀𝑖 = 2
= 2
= 30
Frecuencia absoluta, 𝑓𝑖 = 3 ya que hay 3 estudiantes que se tomaron tiempos de 26mn a 34mn.
3
Frecuencia relativa, 𝑓𝑟 = 30 = 0,1
Porcentaje, 𝑓𝑟𝑥100% = 10%
Quinto intervalo= [34 , 42)
34+42 76
Marca de la clase, 𝑀𝑖 = = = 38
2 2
Frecuencia absoluta, 𝑓𝑖 = 2 ya que hay 2 estudiantes que se tomaron tiempos de 34mn a 42mn.
2
Frecuencia relativa, 𝑓𝑟 = 30 = 0,07
Porcentaje, 𝑓𝑟𝑥100% = 7%

Los datos de 𝑴𝒊 siempre tiene que ser un dato que este dentro den intervalo en el que está. La 𝒇𝒊 es
mirar el intervalo y contar cuantos datos estan en este.

La 𝑭𝒊 es sumar los datos, donde en el primer intervalo es el mismo, el siguiente es sumarlo con el anterior
y así sucesivamente, en el ejemplo el primer dato es 13 y queda igual, en el segundo se suma 8 con el
anterior que es 13 y da 21, en el tercero se suma el 4 con la suma que se llevaba que era 21 y da 25, en el
cuarto es 3 y se suma con el 25 que se llevaba y da 28 y el ultimo es sumar el 2 con el que se llevaba y da
30, siempre el ultimo tiene que dar el total de los datos que en este caso es 30.

La 𝒇𝒓 es tomar 𝒇𝒊 y dividir en 30 que son los datos. La 𝐹𝑟 es sumar los datos de las frecuencias relativas
como se suman los datos de las frecuencias absolutas y al final tiene que dar 1 o un decimal muy cercano.
Y por último el porcentaje es multiplicar la frecuencia relativa por 100.

Medidas de tendencia central


Este proceso se hace para encontrar el valor o los valores que muestran lo característico de la muestra o
de la población. Estos son la media aritmética o promedio, la mediana y la moda.

Media aritmética: es el valor que representa el punto de equilibrio de los datos de la muestra o de
la población. Este valor se halla sumando todos los datos y se dividen entre el número de datos.

𝒙𝟏 +𝒙𝟐 +𝒙𝟑 +⋯+𝒙𝒏


(𝒙
̅) =
𝒏
Cuando son datos no agrupados se multiplica 𝑴𝒊 por 𝒇𝒊 y se suma ese dato con los de los otros intervalos

𝑴𝟏 𝒇 𝟏 + 𝑴𝟐 𝒇 𝟐 + 𝑴𝟑 𝒇 𝟑 + ⋯ + 𝑴𝒏 𝒇 𝒏
(𝒙
̅) =
𝒏
Ejemplo:

a) ¿Cuál es la estatura promedio de un grupo de 44 bailarinas de ballet, si su estatura promedio en


centímetros se registró en la siguiente tabla?
Estatura(cm) 𝑴𝒊 𝒇𝒊 𝑭𝒊 𝒇𝒊 ∙ 𝑴𝒊
[150-154) 152 3 3 456
[154-158) 156 7 10 1.092
[158-162) 160 11 21 1.760
[162-166) 164 14 35 2.296
[166-170) 168 9 44 1.512
total 44 7.116
Como en la última columna ya está la suma de todos los datos solo falta dividir en el número de
datos que en este caso es 44.
𝟕.𝟏𝟏𝟔
̅=
𝒙 = 𝟏𝟔𝟏, 𝟕𝟐 este dato se puede aproximar a 162
𝟒𝟒
Por lo tanto, la estatura promedio de las bailarinas es 162 cm aproximadamente.
b) El número de goles anotados en la temperatura por los jugadores de un equipo de fútbol son los
siguientes: 1,5,9,6,7,5,4,8,2,5,4. En promedio, ¿Cuántos goles a marcado cada jugador?
𝟏+𝟓+𝟗+𝟔+𝟕+𝟓+𝟒+𝟖+𝟐+𝟓+𝟒
̅=
𝒙
𝟏𝟏
𝟓𝟔
̅=
𝒙 = 𝟓, 𝟎𝟗 ≈ 𝟓 Importante: los números decimales se aproximan
𝟏𝟏 de la siguiente manera:
Por tanto, el promedio de goles de los jugadores es Si el primer número decimal es 5 o mayor que 5 se
de 5. aproxima el siguiente número, eje: 3,5 ≈ 4 ; 2,8 ≈ 3
Si el primer número decimal es menor que 5 se le
quita la parte decimal, ej.: 4,3 ≈ 4 ; 6,1 ≈ 6

Mediana (Me): es el valor que determina el punto central de la distribución de los datos. La mediana
es el punto que divide en dos partes iguales de 50% los datos de los individuos.

✓ Los datos deben estar organizados en forma ascendente, de menor a mayor.


✓ Si la cantidad de datos es par se toman los dos datos del centro y se halla el promedio, si es impar se
toma el dato central.
a) En el ejemplo anterior la mediana se calcula teniendo en cuenta la frecuencia acumulada 𝑭𝒊,
44 ÷ 2 = 22 se dividen los datos que son 44 en 2 para mirar donde está el dato de la mitad, como
el dato 22 esta en el cuarto intervalo la mediana está en el intervalo [162-166).
b) En el segundo ejemplo como los datos no están agrupados se ordenan ascendentemente y como
son 11 datos el dato de la mitad es el dato 6.
1,2,4,4,5,5,5,6,7,8,9 se ordenan y en este caso la mediana es 5, por lo tanto, el 50% de los
jugadores meten 5 goles.

Moda (Mo): es el valor que más veces se repite en la distribución de datos observados.

a) En el primer ejemplo como se muestra en la tabla las frecuencias absolutas 𝑓𝑖 donde hay más
datos es en el cuarto intervalo donde hay 14 datos, por lo tanto, la moda está en el intervalo [162-
166).
b) En el otro ejemplo como el número 5 es el que más se repite el 5 es la moda.
Caracterización de datos no agrupados
Si se caracteriza la variable, se pretende entregar la información de tal manera que los datos se reúnan
teniendo en cuenta comportamientos similares.

Una de las maneras de caracterizar los datos es mediante el diagrama de tallo y hojas, en este diagrama
se clasifican los datos la expresión decimal, es decir, las unidades, decenas, centenas, etc.

Las hojas siempre corresponden a la cifra de las unidades del número y el tallo a la cifra de las decenas si
el número es de 2 cifras, olas cifras de las decenas y las centenas si el dato es de tres cifras.

Ejemplo: el profesor de sociales está haciendo un estudio sobre el tiempo que sus estudiantes dedican a
hacer investigación previa sobre los temas que van a trabajar en el bimestre. Para ello, seleccionó 10
estudiantes de cada uno de los cuatro cursos de bachillerato en los cuales da la clase y les preguntó por
el tiempo en minutos que emplean en dicha acción. Los resultados fueron los siguientes:

Tiempos en minutos

25 35 21 12 15 5 35 45 40 30 20 34 27 19 25 15 17 40 62 15

34 60 35 25 35 50 20 34 35 25 19 55 10 14 47 40 25 38 36 34

Organizar los datos en un diagrama de tallo y hojas y escribir algunas conclusiones.

En este caso la variable es cuantitativa; se organizan los datos y como solo tienen unidades y decenas las
hojas son las unidades y las decenas son el tallo. Para los datos de unidades es posible tomar la decena
como el valor 0. Por ejemplo, para los datos 25, 21, 20, 27, el tallo seria 2 y las hojas 5, 1, 0 y 7, si el
número esta más de una vez se escriben todas.

Tallo 2 5 1 0 7 hojas

La idea del diagrama es organizar la información, escribiendo en el tallo y las hojas. Siguiendo los
siguientes pasos.
Primero, se dibuja el diagrama y se escriben inicialmente todos los tallos; en este caso los tallos son 0, 1,
2, 3, 4, 5, y 6.

Luego, se ubican las unidades de cada dato (hojas) teniendo en cuenta las decenas (tallo), así:

Diagrama de tallo y hojas de los tiempos de investigación en ciencias sociales

0 5

1 0 2 4 5 5 5 7 9 9

2 0 0 1 5 5 5 5 5 7

3 0 4 4 4 4 5 5 5 5 5 8

4 0 0 0 5 7

5 0 5

6 0 2

En el diagrama se poede ver que:

• 1 persona emplea 5 minutos en la investigación.


• 9 personas emplean entre 10 y 19 minutos en la investigación.
• 9 personas emplean entre 20 y 29 minutos en la investigación.
• 12 personas emplean entre 30 y 39 minutos en la investigación.
• 5 personas emplean entre 40 y 49 minutos en la investigación.
• 2 personas emplean entre 50 y 59 minutos en la investigación.
• 2 personas emplean entre 60 y 69 minutos en la investigación.

El diagrama sirve para organizar la información y hacer una mejor interpretación de lo que uno crea
relevante, en este caso:

❖ La mayor cantidad de estudiantes emplean entre 30 y 39 minutos preparando la investigación de la


clase.
❖ Solo una persona gasta 5 minutos en la investigación.
❖ 30 de los 40 estudiantes preparan la investigación de la clase entre 10 y 30 minutos.
❖ 4 estudiantes preparan la investigación en tiempos que van desde 50 hasta 62 minutos.
Actividad

1. María ha registrado la medición en centímetros de un grupo de 30 escarabajos para un


proyecto de biología. Para presentar el informe de las mediciones desea construir una
tabla de distribución de frecuencias. Los valores son los siguientes:
5,6 5,7 5,8 5,8 5,8 7,5 7,5 7,7 7,7 7,9
6,1 6,3 6,3 6,5 6,5 8,1 8,1 8,3 8,5 8,6
6,9 6,9 7 7 7,2 9,2 9,2 9,3 9,3 9,3

2. Un grupo de estudiantes quiere inquiere ingresar al equipo de voleibol de la institución. El


proceso de admisión tiene en cuenta las habilidades para el deporte y la estatura (cm) de
los aspirantes. Las mediciones son las siguientes:
156 159 163 168 169
170 175 175 180 181
185 185 186 186 189
191 191 191 192 192
193 194 194 195 195
Calcular las medidas de tendencia central de los datos anteriores; media, mediana y moda.
3. En una empresa de confecciones se contabiliza la producción de unidades de camisetas
deportivas que arma en un día cada una de las operarias. A continuación, se registran los
datos del mes de noviembre:
34 25 34 29 30 29 39 49 57 65
67 73 57 48 60 45 68 46 41 40
46 55 29 20 63 55 49 40 37 47
a. Elabora un diagrama de tallo y hojas con la información.
b. Escribe 4 conclusiones con la información del diagrama.
4. Realizar una encuesta a 10 personas y preguntarle el tipo de música favorita y teniendo en
cuenta el género, hacer una tabla de caracterización de variables cualitativas, como la del
ejemplo.

Tomado de: los caminos del saber 7. SANTILLANA

También podría gustarte