Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Montería - Córdoba
2022
INTRODUCCIÓN
La estadística ha cobrado gran
importancia en el análisis de los datos,
no sólo en los asuntos del Estado (de ahí
su nombre), sino también en las facetas
del comportamiento humano,
expandiendo su aplicación en las
diferentes ciencias y disciplinas tales
como la administración, economía,
comunicación, agricultura, medicina,
física, ciencias políticas, psicología,
sociología, ingeniería, entre otras.
DEFINICIÓN DE ESTADISTICA
Es la ciencia de recolectar, describir e interpretar datos. Su objetivo es
recopilar información de orden cualitativa o cuantitativa, perteneciente
a individuos, grupos, hechos o fenómenos, y deducir a partir del
análisis de los datos respuestas a interrogantes o proyecciones futuras.
TIPOS DE ESTADISTICA
• DESCRIPTIVA: La estadística descriptiva nos enseña como recolectar, agrupar y
presentar datos de una forma tal que los describa fácil y rápidamente.
• INFERENCIAL: Se deriva de la muestra, de mediciones u observaciones que se
han hecho a una parte representativa de la población, por lo cual busca
establecer generalidades para la población a partir de los datos obtenidos.
UNIDAD DE ANALISIS DE INVESTIGACIÓN
La unidad de análisis o de investigación es el elemento al cual se investiga. Éste puede ser
un objeto, una persona, un grupo de individuos o un acontecimiento.
La unidad debe ser coherente con el tipo de investigación que se está realizando y se debe
tener en cuenta que las características que posea el elemento no sean ambiguas, sean
entendibles y que permitan mediciones y comparaciones (Ruíz Muñoz, 2005).
𝐿𝑖 = 45 𝑚𝑖𝑛 𝐿𝑖
𝐿𝑠 = 75 𝑚𝑖𝑛
𝑹 = 𝟕𝟓 − 𝟒𝟓 = 𝟑𝑶 𝒎𝒊𝒏
CLASE 2: TABULACION DE DATOS
NUMERO DE INTERVALOS O CLASE: El número de intervalos (m) se define de forma convencional,
procurando mantenerse entre 5 y 20 intervalos o clases. Sin embargo, para evitar caer en los extremos, es
posible obtener una aproximación usando la fórmula propuesta por Sturges (Martínez, 2007), la cual es: :
m= 𝟏 + 𝟑, 𝟑 ∗ 𝒍𝒐𝒈 𝒏
Donde n es el número total de datos. En caso de que se analice la totalidad de elementos de la población,
ésta se representa por N.
Para el ejemplo de la tabla 4, el número de intervalos es:
𝑚 = 1 + 3.3 𝑥 𝑙𝑜𝑔 50
𝑚 = 1 + 3.3 𝑥 1,6989
𝑚 = 1 + 5,60637
𝑚 = 6,60637
NOTA IMPORTANTE: En este caso es posible construir 6 o 7 intervalos, pero éste debe ser definido en el
paso siguiente, al calcular la amplitud del intervalo.
CLASE 2: TABULACION DE DATOS
Amplitud del intervalo de clase: La amplitud de los intervalos (C) no es necesaria que sea igual para
todos; sin embargo, con el objeto de simplificar y volverlo más funcional, es conveniente que todos los
intervalos tengan igual amplitud. Para el cálculo de la amplitud del intervalo se toma el cociente entre la
amplitud del rango (AR) y el número de intervalos (m) que se considere más adecuado, teniendo en
cuenta que este resultado (C) debe ser una cantidad exacta.
𝑨𝑹
𝑪 =
𝒎
Siguiendo el ejemplo presentado en la tabla 4, la amplitud del intervalo sería:
• Si m = 6, la amplitud del intervalo es C = 30/6, C = 5,0 minutos
• Si m = 7, la amplitud del intervalo es C = 30/7, C = 4.285714286... Minutos
En este caso se recomienda usar 6 intervalos (m = 6), con una amplitud de 5 minutos (C = 5).
NOTA IMPORTANTE: Si la amplitud del intervalo (C) no es exacta con ninguno de los dos valores arrojados
por la fórmula de Sturges, el número de intervalos se puede incrementar hasta hacer la división exacta.
CLASE 2: TABULACION DE DATOS
LIMITE DE LOS INTERVALOS: Al construir los intervalos, cada uno de ellos está determinado por dos extremos: límite
inferior (𝑙𝑖 ) y límite superior (𝑙𝑠 ).
Para el primer intervalo, el límite inferior es igual al límite inferior del rango Li y el límite superior de este intervalo se
conforma sumando la amplitud (C) al límite inferior.
El segundo intervalo parte del límite superior del primer intervalo y se le suma la amplitud para obtener el límite
superior.
Este proceso se repite para el total de intervalos en los cuales se agrupó el conjunto de datos. Los intervalos para el
ejemplo de la tabla 4 serían (ver tabla 5):
CLASE 2: TABULACION DE DATOS
Luego de construir los intervalos, se procede al conteo o frecuencia de la información,
ubicando cada dato en el intervalo al cual corresponde, como se muestra en la tabla 6.
CLASE 2: TABULACION DE DATOS
Marca de clase:Conocida también como punto medio, es el valor representativo
para cada intervalo. Se representa por 𝑥𝑖 y se calcula promediando el límite inferior
𝐿𝑖 y superior 𝐿𝑠 en cada intervalo. La fórmula para el cálculo es:
𝑳𝒔 + 𝑳𝒊
𝒙𝒊 =
𝟐
Es importante resaltar que la
marca de clase al pasar de un
intervalo a otro, aumenta la
misma cantidad del intervalo C.
CLASE NUMERO 3:
DISTRIBUCIÓN DE FRECUENCIAS
La distribución de frecuencias o tabla de frecuencias es una ordenación
en forma de tabla de los datos estadísticos, asignando a cada dato su
frecuencia correspondiente.
TIPOS DE FRECUENCIA
• Absoluta: Es el número de veces que aparece un determinado valor en
un estudio estadístico. Se representa por 𝒏𝒊.
• Relativa: Es el cociente entre la frecuencia absoluta de un determinado
valor y el número total de datos. Se puede expresar en tantos por
ciento y se representa por la expresión:
𝒏𝒊
𝒇𝒊 = ∗ 𝟏𝟎𝟎 ………………………………………… 𝟏
𝒏
CLASE NUMERO 3:
FRECUENCIA ACOMULADA: Es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado. Se representa
mediante la expresión:
𝑁𝑖 = σ 𝑛𝑖 ………………………………………… 𝟐
27 1 1 1 2,857142857
∗ 100=2,857142857
35
28 3 4 3 11,42857143
∗ 100 =8,571428571
35
29 5 9 5 25,71428572
∗ 100 =14,28571429
35
30 8 17 8 48,57142858
∗ 100 =22,85714286
35
31 8 25 8 71,42857144
∗ 100 =22,85714286
35
32 2 27 2 77,14285715
∗ 100 =5,714285714
35
33 4 31 4 88,57142858
35
∗ 100 =11,42857143
34 4 35 4 100
∗ 100 = 11,42857143
35
35 100
DISTRIBUCION DE FRECUENCIA POR INTERVALOS
EJEMPLO
A 40 estudiantes se les pidió que estimen el número de horas que
habrían dedicado a estudiar la semana pasada (tanto en clase como
fuera de ella), obteniéndose los siguientes resultados:
36 30 47 60 32 35 40 50 54 35 45 52 48 58 60 38 32 35 56 48 30 55 49
39 58 50 65 35 56 47 37 56 58 50 47 58 55 39 58 45
Realizar las tablas de frecuencias
PASOS A SEGUIR
1. Calculamos el rango (R).
2. Se calcula el numero de intervalos (I).
3. Se calcula la amplitud de clase.
4. Marca de clase.
5. Frecuencia Absoluta.
6. Frecuencia acumulada.
7. Frecuencia relativa absoluta.
8. Frecuencia relativa acumulada.
EJERCITACIÓN EN CLASE
Por ejemplo, en la tabla 4 se presenta el tiempo en minutos requerido por un grupo
de personas para realizar una actividad.
Para cerrar el polígono, se debe ampliar la marca de clase en los extremos manteniendo la misma
amplitud y ubicando la frecuencia con el valor de cero.
OJIVAS O POLÍGONOS DE FRECUENCIAS ACUMULADAS
Si al diagrama de barras horizontal se invierten los ejes (ver Gráfica 7), se obtiene el diagrama
vertical (ver Gráfica 8). En cualquiera de los dos diagramas se pueden representar las frecuencias
absolutas o relativas; la elección queda a discreción de quien este elaborando la gráfica.
DIAGRAMAS CIRCULAR
Se divide un círculo en tantas porciones como clases existan, de modo
que a cada clase le corresponde un arco de círculo proporcional a su
frecuencia absoluta o relativa. El arco de cada porción se calcula
usando la siguiente regla de tres.
DIAGRAMAS CIRCULAR
DATOS
𝐿𝑖 = 55
𝑛𝑖 = 12
𝑛𝑖−1 = 9
𝑛𝑖+1 = 11
𝐴 = 𝐿𝑠 − 𝐿𝑖 =60-
55=5
Es decir, el tiempo que la mayoría de personas
invierten para realizar la actividad es 58,75
minutos.
CONCLUSIONES GENERALES
• LA MEDIA: Nos indica el promedio de los datos; es decir, nos informa el
valor que obtendría cada uno de los individuos si se distribuyeran los
valores en partes iguales.
• LA MODA: La Moda nos indica el valor que más se repite dentro de los
datos o la que tiene mayor frecuencia.
MEDIDAS DE POSICIÓN
• Son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribución en partes, de tal manera que cada una de ellas
contiene el mismo número de frecuencias Los tipos más importantes
de cuantiles son:
• Los cuartiles: que dividen a la distribución en cuatro partes
• Los deciles: que dividen a la distribución en diez partes
• Los percentiles: que dividen a la distribución en cien partes
MEDIDAS DE POSICIÓN
CUARTILES
Son valores que dividen a la población en cuatro partes de igual
longitud, se denotan por 𝑄𝑘 y se calculan de la siguiente manera:
𝑄𝑘 = 𝑋 𝑘𝑛 1
4 +2
• Primer Cuartil: 𝑄1 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 0,25 𝑄0,25
• Segundo Cuartil: 𝑄2 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 0,50 𝑄0,50
• Tercer Cuartil: 𝑄3 𝐶𝑢𝑎𝑛𝑡𝑖𝑙 0,75 𝑄0,75
MEDIDAS DE POSICIÓN
DECILES
Son valores que dividen a la población en diez partes de igual longitud, se
denotan por 𝑄𝑘 y se calculan de la siguiente manera:
𝑄𝑘 = 𝑋 𝑘𝑛 1
10 +2
• Primer decil: 𝐷1 𝐷𝑒𝑐𝑖𝑙 0, 10 𝑄0,10
• Segundo decil : 𝐷2 𝐷𝑒𝑐𝑖𝑙 0,20 𝑄0,20
.
.
.
• Noveno decil : 𝐷3 𝐷𝑒𝑐𝑖𝑙 0,90 𝑄0,90
MEDIDAS DE POSICIÓN
PERCENTIL
Son valores que dividen a la población en cien partes de igual longitud,
se denotan por 𝑃𝑘 y se calculan de la siguiente manera:
𝑃𝑘 = 𝑋 𝑘𝑛 1
100+2
• Primer Percentil: 𝑃1 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 0,25 𝑄0,01
• Segundo Percentil : 𝑃2 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 0,50 𝑄0,02
• Tercer Percentil : 𝑃3 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 0,75 𝑄0,03
CONCLUSIONES GENERALES
Cuartil: Nos indica por debajo de que valor se
encuentra el 25 % de los datos.
Décil: Nos indica por debajo de que valor se encuentra
el 10 % de los datos.
Percentiles nos indica por debajo de que valor se
encuentra el 1 % de los datos.