Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería de Telecomunicaciones
Este trabajo esta basado en una muestra realizada en 115 municipios sobre sus indicadores
energia electrica, y cantidad de servicios publicos disponibles, haciendo uso de las medidas
univariantes, para hallar la media, la moda, la mediana, el rango, la varianza, la desviación, etc,
con el fin de identificar las condiciones de desarrollo territorial social y humano de las
Los seres humanos en cualquier clase de actividad a que se dediquen a diario, experimentan
sencaciones que de una u otra forma ponderan y le dan significado a sus experiencias, lo cual ha
Es por esto, que es importante hacer uso de la estadistica no solo para medir y contar
experiencias, sino tambien para conocer el desarrollo de un territorio donde existen niveles de
pobreza. Es por esto que los resultados de esta investigación son de suma importancia para que
permitan tomar decisiones que conlleven a mejorar el desarrollo de un territorio asi como
Definir claramente los conceptos de media, moda, mediana, rango, varianza, desviación,
datos.
Es decir, si los valores de la distribución se encuentran próximos entre sí, presentaran poca
dispersión o variabilidad, si por el contrario están alejados entre sí presentaran mucha dispersión.
Se pueden calcular diversas medidas de dispersión, las más habituales son el rango, la varianza,
y la desviación típica; estas son medidas de dispersión absoluta. No obstante, si lo que se quiere
que presenta mayor o menor dispersión, debe obtenerse una medida llamada Coeficiente de
Variación de Pearson.
RANGO: El rango de una distribución es la diferencia entre el valor máximo y el valor mínimo,
es decir, ℜ=X max −X min. La principal desventaja de esta medida es que solo cuenta dos valores
de la variable.
media aritmética de los cuadrados de las diferencias de los valores de la variable a la media
aritmética; Con la varianza se pretende medir la dispersión que presentan los valores de la
variable respecto a su media. Cuanto mayor sea la dispersión, cuanto mayor sea la varianza,
Una expresión para calcular la varianza muy utilizada por cuanto simplifica la operatoria es:
N
S¿ 2 x= ∗S2 x
N−1
cuadrado.
Por otra parte, la fórmula para calcular la desviación típica es elevando al cuadrado las
desviaciones, dividir entre el número total de observaciones y por ultimo sacar la raíz cuadrada
σ=
√ ∑ ( X i− X )2
I
N
Alternativamente existiría otra forma de calcularla, seria haciendo un promedio de la suma de los
∑ |X i− X|
i
σ=
N
Sin embargo, esta fórmula no es una alternativa de la desviación típica pues arroja diferentes
En definitiva, la varianza no es más que la desviación típica al cuadrado. O lo que viene a ser lo
forma:
Desviación típica = σ
Varianza = σ 2
Desviación Típica = √ ARIANZA
∑ X i ni
X́ = i=1
N
Cuanto más próximo a cero se encuentre el coeficiente de variación menor será la dispersión y
El coeficiente de variación es una medida de dispersión relativa. Por esta razón, se utiliza para
comparar la dispersión entre dos o más distribuciones, independientemente del valor de sus
central:
Tabla de frecuencias
cantidad
de FRECUEN
FRECUEN
servicios FRECUEN CIA
CIA
públicos CIA ACUMULA
RELATIVA
disponib DA
les
0 4 4 3,48%
1 11 15 9,57%
2 30 45 26,09%
3 26 71 22,61%
4 14 85 12,17%
5 19 104 16,52%
6 5 109 4,35%
7 6 115 5,22%
TOTAL 115 100,00%
Media: La media de una lista de n números (x1, x2, x3, …. Xn) es:
n
x 1+ x 2+ x 3+… . xn 1
x= = ∑ Xi
n n i=1
0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4,
4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7.
Suma = 372
(De los 115 municipios encuestados, la población cuenta con un promedio de tres (3) servicios
Mediana: La mediana de una lista de n números (x1, x2, x3, …. Xn) acomodados en orden
(El 58% de los encuestados cuenta con acceso a al menos tres (3) servicios públicos en su
comunidad.)
Moda: La moda de una lista de n números (x1, x2, x3, …. Xn) es el número que aparece con
Por lo tanto, según la tabla, el número que aparece con mayor frecuencia es el 2 (30).
(De los 115 municipios encuestados la tendencia es tener al menos dos (2) servicios publicos.)
b. Calcular:
1∗116
Cuartil 1 = =29 Posición
4
Q1 = (2)
2∗116
Cuartil 2 = =58 Posición
4
Q2 = (3)
3∗116
Cuartil 3 = =87 Posición
4
Q3 = (5)
Deciles 5 y 7
5∗116
Decil 5 = =58 Posición
10
D5 = (3)
7∗116
Decil 7 = =81 Posición
10
D7 = (4)
Percentiles 25 y 50
25∗116
Percentil 25 = =29 Posición
100
P25 = (2)
50∗116
Percentil 50 = =58 Posición
100
P50 = (3)
Rango: Es un valor numérico que indica la diferencia entre el valor máximo y el valor
R=MAXx−MINx
Donde:
R = Rango
x = Variable
Varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media de una
∑ ( Xi− X )2
i=1
=σ 2
n
267
σ 2=
115
σ =2.32
σ=
√ ∑ (xi−x)2 fi
i−1
N
σ =1.523
una muestra con respecto a su media. Este concepto de coeficiente de variación implica la
variación que pueden presentar unos datos. Esto se conoce como la variabilidad que una
Sx
CV = ∗100
X
Por lo tanto:
1.523
CV = ∗100
3.23
CV =47.058
disponibles, se encontró una relación existente entre los datos arrojados por la media y la
varianza, ya que es cercana a 3, mientras que la desviación típica es cercana a 2, por lo que se
puede deducir que la población en general solo puede acceder a 2 o 3 servicios públicos.
120
Variable Cuantitativa Continua
100
80
60
40
20
0
3.2 9.5 15.9 22.2 28.5 34.8 41.1 47.5
Media: Se calcula sumando todos los productos de marca clase con la frecuencia absoluta
x=4,63
Mediana: Es el valor que ocupa el lugar central de todos los datos cuando estos están ordenados
de menor a mayor. La mediana se representa por Me y solo se puede hallar para variables
cuantitativas.
suma de las frecuencias absolutas. Es decir, tenemos que buscar el intervalo en el que se
n
−Fi−1
2
Me=Li + ∗ti
fi
Para el caso de la base de datos, no hallamos la Mediana porque no tenemos el dato del 50%
siguiente formula:
fi−fi−1
Mo=Li+ ∗ti
( fi−fi−1 )+ ( fi−fi+1 )
Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
Para el caso de la base de datos, no hallamos la moda puesto que no podemos obtener la
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales, hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda
un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el
cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos, su fórmula es:
n
K ( )−Fk
4
Qk=Lk ∗c
fk
k: 1, 2, 3.
Para calcular el primer cuartil buscamos el intervalo donde se encuentra el primer cuartil,
1∗115
=28,75
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 28,75. Para
operación.
Para calcular el segundo cuartil buscamos el intervalo donde se encuentra el segundo cuartil,
2∗115
=57,5
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 57,5. Para el
caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la operación.
Para calcular el tercer cuartil buscamos el intervalo donde se encuentra el tercer cuartil,
3∗115
=86,25
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 86,25. Para
operación.
No obstante, la fórmula para hallar cada uno de los cuartiles cuando se encuentra el intervalo en
k∗N
−Fi−1
4
Qk=Li+ ∗ai
fi
Donde k = 1,2,3.
Decil 5: Los deciles son los nueve valores que dividen una serie de datos ordenados en diez
partes iguales.
Los deciles dan los valores correspondientes al 10%, 20%, 30%, 40%.........90% de los datos.
Para calcular el quinto decil buscamos el intervalo donde se encuentra el quinto decil,
5+115
=57,5
10
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 57,5. Para el
caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la operación.
Percentil 50: Son los 99 valores que dividen una serie de datos ordenados en cien partes iguales.
Los percentiles dan los valores correspondientes al 1%, 2%, 3%, 4%, ……..99%.
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 57,5. Para el
caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la operación.
Sin embargo, podemos deducir que el percentil 50, coincide con la media, y con el decil 5 dentro
Tipo de Asimetría: Es una medida de forma de una distribución que permite identificar y
describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con la que se
distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se
dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la
media aritmética es menor que la mediana y este valor de la mediana a su vez es menor que la
de los datos a ambos lados de la media aritmética. También se dice que una distribución es
simétrica cuando su media aritmética, su mediana y su moda son iguales, en símbolos xMd=Mo.
está en la parte derecha de la media aritmética. También se dice que una distribución es simétrica
a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la
Medidas de Asimetría:
3 ( x−Me )
As=
s
Donde:
X= Media Aritmética
Me: Mediana
Nota:
Q 1+Q 3−2Q 2
As=
Q 3−Q 1
Donde:
Q1: Cuartil uno; Q2: Cuartil dos = Mediana; Q3: Cuartil tres.
Nota:
Medida de Fisher:
As=
∑ f ( Xi− x ) ∧3
n σ3
As=
∑ f (xm−x)3
nσ 3
Donde:
n: Numero de datos.
X: Media Aritmética.
f: Frecuencia Absoluta.
σ³: Cubo de la desviación estándar poblacional.
Nota:
Si As < 0? Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicara que la distribución sea asimétrica negativa.
Si As > 0? Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicara que la distribución sea asimétrica positiva.
Tipos de Curtosis:
Medida de Fisher:
α=
∑ ( Xi−x)4
nσ 4
α=
∑ f ( xm−x )4
nσ 4
Donde:
n: Numero de datos.
x: Media Aritmética.
f: Frecuencia Absoluta.
Nota:
Q3−Q1
Desviacion Cuartilica 2 Q3−Q 1
k= = =
Amplitud Cuartilica P 90−P10 2( P 90−P10)
Nota:
Para muestra:
As=
∑ f ( Xi− x ) ∧3 fi
n s3
muestra menos 1:
6787−115( 4,629)2
S2 =
114
S2=37,91
S= √ 37,91
S=6,15
−10315,48
As= 3
115 ( 6,15 )
As=−0,385
Para población:
As=
∑ f ( Xi−μ ) ∧ 3 fi
n σ3
6787
σ 2= −( 4.629¿¿ 2)=37,58¿
115
σ 2 √ 37,58
σ =6.13
Entonces para hallar la asimetría de Fisher para la población:
−10315,48
As=
115 ( 6,13 )3
As=−0,389
Así las cosas, podemos evidenciar que la asimetría tanto para población como para muestra es
interpretar los resultados y asociarlos con la problemática: “¿En qué condiciones de desarrollo
territorial, social y humano se encuentran las comunidades con mayor pobreza extrema en
Colombia?”
energía eléctrica, podemos deducir que se encontró una relación existente entre los datos
arrojados por la media y la varianza, ya que es cercana a 3, mientras que la desviación típica es
cercana a 2, por lo que se puede deducir que la población en general puede acceder a 2 o 3
población.
Medidas de Dispersión
Rango: Es un valor numérico que indica la diferencia entre el valor máximo y el valor mínimo
R=MAXx−MINx
R=50,62−0,04=50,58
Varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media de una
∑ ( Xi− X )2
i=1
=σ 2
n
σ=
√ ∑ (xi−x)2 fi
i−1
N
√ 37,95
S=6,16
Coeficiente de Variación: Es una representación de cómo es la desviación típica que posee una
muestra con respecto a su media. Este concepto de coeficiente de variación implica la variación
que pueden presentar unos datos. Esto se conoce como la variabilidad que una variable puede
Sx
CV = ∗100
X
Por lo tanto:
6,16
CV = ∗100
4,63
CV =133,04
Conclusiones
Los conceptos y datos antes mencionados fueron trabajados de manera que haga más fácil su
comprensión y análisis, para tratar de entender y poder tomar decisiones respecto a los niveles de
pobreza existentes en el territorio Colombiano respecto a los servicios públicos a los cuales
26 -42
https://economipedia.com/definiciones/desviacion-tipica.html
https://economipedia.com/definiciones/desviacion-tipica.html
https://www.portaleducativo.net/octavo-basico/792/Media-moda-y-mediana-para-datos-
agrupados
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/cuartiles.ht
ml
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/deciles.htm
https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/percentiles.
html
https://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-
forma-asimetria-curtosis.shtml