Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema: Estadística
Subtemas: Conceptos estadísticos
Caracterización de variables cuantitativas.
Tablas de distribución de frecuencias.
Medidas de tendencia central.
Caracterización de datos no agrupados.
Estadística
La estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta información con el
objetivo de propiciar la toma de decisiones asertivamente y con fundamentos teóricos, basadas en
desarrollos matemáticos.
Conceptos estadísticos
Población: es el conjunto de elementos que tiene una característica común. El tamaño de la población es
el número de individuos, se simboliza con N.
Observación o individuo: elemento que pertenece al conjunto población objeto de estudio, dotado de
ciertas características que lo definen como miembro del conjunto.
Variable estadística: define una característica particular de la población, que se observa en cada
individuo, asumiendo diferentes valoraciones que pueden ser medidas u observadas.
Variables estadísticas
Ordinales: son vriables que toman valores no numéricos, que pueden ser ordenados siguiendo un patrón de
o una manera lógica. Ej: nivel de pobreza, grados universitarios.
Continuas: son variables que toman valores numéricos fijos en un intervalo deterninado. Ej: la estatura.
Ejemplo: en este caso el estudio es de unos estudiantes que van a ingresar a la universidad a las carreras
profesionales (matemáticas (M), física (F), biología (B) y química (Q)) y el género. Primero se tiene que
ordenar en tablas de frecuencias.
Los datos los tenemos que integrar en una sola tabla, denominada tabla de contingencia.
Carrera profesional
Género M F B Q Total
Masculino 9 12 20 4 45
Femenino 10 9 35 9 63
Total 19 21 55 13 108
En este caso como ya está integrada la información en una sola tabla podemos hacer una interpretación
más concreta, ejemplo:
✓ La carrera que más prefieren las mujeres es biología con un total de 35 aspirantes.
✓ En matemáticas la cantidad de aspirantes la cantidad de mujeres y de hombres es casi la misma.
✓ La carrera de química es la que menos prefieren los hombres,
únicamente 4 aspirantes.
Recuerda
✓ El porcentaje de hombres que se presentaron a la carrera de Para obtener los porcentajes de cada
biología es de: categoría se utiliza la siguiente formula:
20
x= × 100% = 44,44% por lo tanto, el 44,44% de los 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑎
45 𝑥= 𝑥100%
hombres ingresan a estudiar biología. 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒
Elementos:
➢ Intervalos de clase: se ubican en la primera columna de la tabla. Es un conjunto que contiene todos los
números entre dos números dados. Se pueden representar así.
Intervalo [a , b] contiene todos los números desde a hasta b.
Intervalo [a , b) contiene todos los números mayores o iguales a a y menores que b (b no está incluido
en el intervalo)
➢ Rango: es la diferencia entre el mayor y el menor valor de una lista de datos.
➢ Frecuencia absoluta del intervalo ( 𝒇𝒊): número de individuos o de datos que están clasificados en
cada intervalo.
➢ Frecuencia absoluta acumulada (𝑭𝒊):se suman las frecuencias absolutas.
➢ Frecuencia relativa (𝒇𝒓): se divide la frecuencia absoluta 𝑓𝑖 y el total n de datos de la muestra.
➢ Frecuencia relativa acumulada (𝑭𝒓): se suman las frecuencias relativas.
➢ Marca de clase (𝑴𝒊): punto medio de cada intervalo, se considera el dato más representativo de cada
intervalo.
En un estudio realizado a un grupo de 30 estudiantes de un colegio, se les preguntó sobre los minutos que
les tomó resolver un problema. Con los siguientes datos.
30 20 14 5 10 12 16 6 3 2 8 8 8 5 10
38 35 28 25 5 7 14 25 23 4 32 5 9 12 14
Paso 1: se calcula el número de intervalos, con la formula # 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = √𝑛
En este caso n es 30 son los estudiantes, y como la raíz cuadrada de 30 no es exacta se toma el valor
exacto.
Paso 2: se ordenan los datos de mayor a menor, y se calcula el rango, donde se toma el dato mayor y se le
resta el menor.
Paso 3: se halla la longitud de los intervalos, como son 5 intervalos, se divide el rango entre los intervalos
36 ÷ 5 = 7,2 ≈ 8 como el valor no es exacto, se aproxima al siguiente exacto. Por lo tanto, la longitud es
de 8.
Paso 4: Entonces como el valor más pequeño es 2 se le suma 8 y queda 10. Por lo tanto, el primer intervalo
va de 2 a 10 sin incluir el 10, el segundo intervalo va de 10 hasta 18 sin incluir 18 y se van agregando 8
para los otros intervalos.
Paso 5: se calcula el valor de 𝑓𝑟, 𝐹𝑖, 𝐹𝑟, 𝑀𝑖 y el porcentaje de cada intervalo y se ubican en la tabla.
Primer intervalo= [2 , 10)
2+10 12
Marca de la clase, 𝑀𝑖 = 2
= 2
=6
Frecuencia absoluta, 𝑓𝑖 = 13 ya que hay 13 estudiantes que se tomaron tiempos de 2mn a 10mn.
13
Frecuencia relativa, 𝑓𝑟 = 30 = 0,43
Porcentaje, 𝑓𝑟𝑥100% = 43%
Los datos de 𝑴𝒊 siempre tiene que ser un dato que este dentro den intervalo en el que está. La 𝒇𝒊 es
mirar el intervalo y contar cuantos datos estan en este.
La 𝑭𝒊 es sumar los datos, donde en el primer intervalo es el mismo, el siguiente es sumarlo con el anterior
y así sucesivamente, en el ejemplo el primer dato es 13 y queda igual, en el segundo se suma 8 con el
anterior que es 13 y da 21, en el tercero se suma el 4 con la suma que se llevaba que era 21 y da 25, en el
cuarto es 3 y se suma con el 25 que se llevaba y da 28 y el ultimo es sumar el 2 con el que se llevaba y da
30, siempre el ultimo tiene que dar el total de los datos que en este caso es 30.
La 𝒇𝒓 es tomar 𝒇𝒊 y dividir en 30 que son los datos. La 𝐹𝑟 es sumar los datos de las frecuencias relativas
como se suman los datos de las frecuencias absolutas y al final tiene que dar 1 o un decimal muy cercano.
Y por último el porcentaje es multiplicar la frecuencia relativa por 100.
Media aritmética: es el valor que representa el punto de equilibrio de los datos de la muestra o de
la población. Este valor se halla sumando todos los datos y se dividen entre el número de datos.
𝑴𝟏 𝒇 𝟏 + 𝑴𝟐 𝒇 𝟐 + 𝑴𝟑 𝒇 𝟑 + ⋯ + 𝑴𝒏 𝒇 𝒏
(𝒙
̅) =
𝒏
Ejemplo:
Mediana (Me): es el valor que determina el punto central de la distribución de los datos. La mediana
es el punto que divide en dos partes iguales de 50% los datos de los individuos.
Moda (Mo): es el valor que más veces se repite en la distribución de datos observados.
a) En el primer ejemplo como se muestra en la tabla las frecuencias absolutas 𝑓𝑖 donde hay más
datos es en el cuarto intervalo donde hay 14 datos, por lo tanto, la moda está en el intervalo [162-
166).
b) En el otro ejemplo como el número 5 es el que más se repite el 5 es la moda.
Caracterización de datos no agrupados
Si se caracteriza la variable, se pretende entregar la información de tal manera que los datos se reúnan
teniendo en cuenta comportamientos similares.
Una de las maneras de caracterizar los datos es mediante el diagrama de tallo y hojas, en este diagrama
se clasifican los datos la expresión decimal, es decir, las unidades, decenas, centenas, etc.
Las hojas siempre corresponden a la cifra de las unidades del número y el tallo a la cifra de las decenas si
el número es de 2 cifras, olas cifras de las decenas y las centenas si el dato es de tres cifras.
Ejemplo: el profesor de sociales está haciendo un estudio sobre el tiempo que sus estudiantes dedican a
hacer investigación previa sobre los temas que van a trabajar en el bimestre. Para ello, seleccionó 10
estudiantes de cada uno de los cuatro cursos de bachillerato en los cuales da la clase y les preguntó por
el tiempo en minutos que emplean en dicha acción. Los resultados fueron los siguientes:
Tiempos en minutos
25 35 21 12 15 5 35 45 40 30 20 34 27 19 25 15 17 40 62 15
34 60 35 25 35 50 20 34 35 25 19 55 10 14 47 40 25 38 36 34
En este caso la variable es cuantitativa; se organizan los datos y como solo tienen unidades y decenas las
hojas son las unidades y las decenas son el tallo. Para los datos de unidades es posible tomar la decena
como el valor 0. Por ejemplo, para los datos 25, 21, 20, 27, el tallo seria 2 y las hojas 5, 1, 0 y 7, si el
número esta más de una vez se escriben todas.
Tallo 2 5 1 0 7 hojas
La idea del diagrama es organizar la información, escribiendo en el tallo y las hojas. Siguiendo los
siguientes pasos.
Primero, se dibuja el diagrama y se escriben inicialmente todos los tallos; en este caso los tallos son 0, 1,
2, 3, 4, 5, y 6.
Luego, se ubican las unidades de cada dato (hojas) teniendo en cuenta las decenas (tallo), así:
0 5
1 0 2 4 5 5 5 7 9 9
2 0 0 1 5 5 5 5 5 7
3 0 4 4 4 4 5 5 5 5 5 8
4 0 0 0 5 7
5 0 5
6 0 2
El diagrama sirve para organizar la información y hacer una mejor interpretación de lo que uno crea
relevante, en este caso: