Estadistica Descriptiva - Analisis de Informacion

Unidad 2 Paso 3 Analisis de la Información
Universidad Nacional Abierta y a Distancia UNAD
Escuela de Ciencias Basicas Tecnologia e Ingeniería ECBTI
Ingeniería de Telecomunicaciones
Curso: Estadistica Descriptiva 204040_43
Bogotá 31 de Octubre de 2019

Introducción
Este trabajo esta basado en una muestra realizada en 115 municipios sobre sus indicadores
económicos, en el cual se realizo el analisis a la variable % de ocupantes en viviendas sin
energia electrica, y cantidad de servicios publicos disponibles, haciendo uso de las medidas
univariantes, para hallar la media, la moda, la mediana, el rango, la varianza, la desviación, etc,
con el fin de identificar las condiciones de desarrollo territorial social y humano de las
comunidades con mayor indice de pobreza en Colombia.

Justificación
Los seres humanos en cualquier clase de actividad a que se dediquen a diario, experimentan
sencaciones que de una u otra forma ponderan y le dan significado a sus experiencias, lo cual ha
llevado al hombre a cuantificar, medir, cualificar todos estos acontecimientos.
Es por esto, que es importante hacer uso de la estadistica no solo para medir y contar
experiencias, sino tambien para conocer el desarrollo de un territorio donde existen niveles de
pobreza. Es por esto que los resultados de esta investigación son de suma importancia para que
permitan tomar decisiones que conlleven a mejorar el desarrollo de un territorio asi como
disminuir los niveles de pobreza.

Objetivos
 Definir claramente los conceptos de media, moda, mediana, rango, varianza, desviación,
en resumen, todo aquello que implique medidas univariantes, ya sean de tendencia
central, posición o dispersión.
 Diferenciar cada uno de los conceptos antes mencionados.
 Interpretar los resultados de cada una de las variables estudiadas.
 Interpretar datos en tablas de frecuencia.
 Aplicar adecuadamente las medidas de tendencia central.

Actividad 1. Mapa Mental.
MEDIDAS ESTADISTICAS UNIVARIANTES
Medidas de Dispersión: Hace referencia a la distancia de separación en que se encuentran los
datos.
Es decir, si los valores de la distribución se encuentran próximos entre sí, presentaran poca
dispersión o variabilidad, si por el contrario están alejados entre sí presentaran mucha dispersión.
Se pueden calcular diversas medidas de dispersión, las más habituales son el rango, la varianza,
y la desviación típica; estas son medidas de dispersión absoluta. No obstante, si lo que se quiere
es compara varias distribuciones de frecuencias en términos de variabilidad para saber cuál es la
que presenta mayor o menor dispersión, debe obtenerse una medida llamada Coeficiente de
Variación de Pearson.
RANGO: El rango de una distribución es la diferencia entre el valor máximo y el valor mínimo,
es decir, ℜ=X max −X min. La principal desventaja de esta medida es que solo cuenta dos valores
de la variable.
VARIANZA Y DESVIACION TIPICA: La varianza se denota por S2 x se define como la
media aritmética de los cuadrados de las diferencias de los valores de la variable a la media
aritmética; Con la varianza se pretende medir la dispersión que presentan los valores de la
variable respecto a su media. Cuanto mayor sea la dispersión, cuanto mayor sea la varianza,
menos representativa será la media.
Una expresión para calcular la varianza muy utilizada por cuanto simplifica la operatoria es:
N
S¿ 2 x= ∗S2 x
N−1
La varianza nunca puede ser negativa ¿ y se encuentra expresada en unidades de medida al
cuadrado.
Por otra parte, la fórmula para calcular la desviación típica es elevando al cuadrado las
desviaciones, dividir entre el número total de observaciones y por ultimo sacar la raíz cuadrada
para deshacer el elevado al cuadrado.
σ=
√ ∑ ( X i− X )2
I
N
Alternativamente existiría otra forma de calcularla, seria haciendo un promedio de la suma de los
valores absolutos de las desviaciones así:
∑ |X i− X|
i
σ=
N
Sin embargo, esta fórmula no es una alternativa de la desviación típica pues arroja diferentes
resultados. En realidad, la formula anterior es la desviación respecto de la media.
En definitiva, la varianza no es más que la desviación típica al cuadrado. O lo que viene a ser lo
mismo, la desviación típica es la raíz cuadrada de la varianza y se relacionan de la siguiente
forma:
Desviación típica = σ
Varianza = σ 2
Desviación Típica = √ ARIANZA
COEFICIENTE DE VARIACION DE PEARSON: Es el cociente entre la desviación típica y
la media aritmética de la variable estadística X, suele representarse por g 0( X).
∑ X i ni
X́ = i=1
N
Cuanto más próximo a cero se encuentre el coeficiente de variación menor será la dispersión y
mejor la representatividad de la media aritmética.
El coeficiente de variación es una medida de dispersión relativa. Por esta razón, se utiliza para
comparar la dispersión entre dos o más distribuciones, independientemente del valor de sus
medias y de la unidad de medida de las variables.

Actividad 2. Laboratorio Medidas Univariantes
Medidas Univariantes de Tendencia Central.
a. Para la variable elegida, se deberán calcular las medidas univariantes de tendencia
central:
Cantidad de Servicios públicos disponibles.
Tabla de frecuencias
cantidad
de FRECUEN
FRECUEN
servicios FRECUEN CIA
CIA
públicos CIA ACUMULA
RELATIVA
disponib DA
les
0 4 4 3,48%
1 11 15 9,57%
2 30 45 26,09%
3 26 71 22,61%
4 14 85 12,17%
5 19 104 16,52%
6 5 109 4,35%
7 6 115 5,22%
TOTAL 115 100,00%
Media: La media de una lista de n números (x1, x2, x3, …. Xn) es:
n
x 1+ x 2+ x 3+… . xn 1
x= = ∑ Xi
n n i=1
0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4,
4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7.
Suma = 372
Media = 372/115 = 3.23
(De los 115 municipios encuestados, la población cuenta con un promedio de tres (3) servicios
públicos disponibles para sus domicilios.)
Mediana: La mediana de una lista de n números (x1, x2, x3, …. Xn) acomodados en orden
(ascendente o descendente) es:
- El número de la mitad, si n es par, y
- La media de los números de la mitad, si n es impar.
(N+1)/2 = 115+1 = 116/2 = 58
Por lo tanto, la mediana es 3 al ordenar la tabla en orden ascendente.
(El 58% de los encuestados cuenta con acceso a al menos tres (3) servicios públicos en su
comunidad.)
Moda: La moda de una lista de n números (x1, x2, x3, …. Xn) es el número que aparece con
mayor frecuencia en la lista.
Por lo tanto, según la tabla, el número que aparece con mayor frecuencia es el 2 (30).
(De los 115 municipios encuestados la tendencia es tener al menos dos (2) servicios publicos.)
b. Calcular:
Todos los cuartiles.
1∗116
Cuartil 1 = =29 Posición
4
Q1 = (2)
2∗116
4
Q2 = (3)
3∗116
4
Q3 = (5)
Deciles 5 y 7
5∗116
Decil 5 = =58 Posición
10
D5 = (3)
7∗116
Decil 7 = =81 Posición
10
D7 = (4)
Percentiles 25 y 50
25∗116
Percentil 25 = =29 Posición
100
P25 = (2)
50∗116
Percentil 50 = =58 Posición
100
P50 = (3)
Medidas univariantes de dispersión:
a. Para la variable elegida, se deberán calcular las medidas univariantes de dispersión:
Rango: Es un valor numérico que indica la diferencia entre el valor máximo y el valor
mínimo de una población o muestra estadística.
La fórmula para hallar el rango es la siguiente:
R=MAXx−MINx
Donde:
R = Rango
MAX = Valor máximo de la muestra o población.
MIN = Valor mínimo de la muestra o población.
x = Variable
Para la variable elegida Cantidad de Servicios públicos disponibles.

Rango 7 6
Máximo 7 7
Mínimo 0 1
Varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística, y se representa por σ 2 y su fórmula es:
∑ ( Xi− X )2
i=1
=σ 2
n
(1−3)2 +(2−3)2+(3−3)2 +(4−3)2+(5−3)2+(6−3)2 +(7−3)2

σ 2=
115
44+30+ 0+14+38+ 45+96

σ 2=
115
267
σ 2=
115
σ =2.32
Desviación típica: Es la raíz cuadrada de la varianza, es decir, la raíz cuadrada de la media de
los cuadrados de las puntuaciones de desviación, se representa σ , la fórmula es:
( x 1−x )2 f 1+ ( x 2−x )2 f 2+ ( xn−x )2 f 1n

σ=
√ N
σ=
√ ∑ (xi−x)2 fi
i−1
N
Por lo tanto, al sacar raíz cuadrada del resultado de la varianza, tendríamos:

σ =√ 2.32
σ =1.523
Coeficiente de variación: Es una representación de cómo es la desviación típica que posee
una muestra con respecto a su media. Este concepto de coeficiente de variación implica la
variación que pueden presentar unos datos. Esto se conoce como la variabilidad que una
variable puede llegar a presentar. Su fórmula es:
Sx
CV = ∗100
X
Sx hace referencia a la desviación típica.
X Hace referencia a la media aritmética.
Por lo tanto:
1.523
CV = ∗100
3.23
CV =47.058
b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio
Al realizar la verificación de los resultados respecto a la cantidad de servicios públicos
disponibles, se encontró una relación existente entre los datos arrojados por la media y la
varianza, ya que es cercana a 3, mientras que la desviación típica es cercana a 2, por lo que se
puede deducir que la población en general solo puede acceder a 2 o 3 servicios públicos.
Actividad 3. Variable Cuantitativa continua
Tabla de Frecuencia de Datos Agrupada. (Histograma de Frecuencias y Polígono de Frecuencias)
Numero Limite Limite Marca de Frecuenci Frecuenci

de a Absoluta
Inferio Superio a
Intervalo Clase Acumulad
r r Absoluta
s a
1 0,04 6,36 3,2 106 106
2 6,36 12,69 9,5 3 109
3 12,69 19,01 15,9 2 111
4 19,01 25,33 22,2 2 113
5 25,33 31,66 28,5 0 113
6 31,66 37,98 34,8 0 113
7 37,98 44,3 41,1 1 114
8 44,3 50,6 47,5 1 115
TOTAL 115
120
Variable Cuantitativa Continua
100
80
60
40
20
0
3.2 9.5 15.9 22.2 28.5 34.8 41.1 47.5
Medidas de Tendencia Central
Media: Se calcula sumando todos los productos de marca clase con la frecuencia absoluta
respectiva y su resultado dividirlo por el número de datos:

Suma(marca clase∗Frecuencia Absoluta)
Total de Datos n
3,2∗106+ 9,5∗3+ 15,9∗2+22,2∗2+ 41,1∗1+ 47,5∗1

x=
115
x=4,63
Mediana: Es el valor que ocupa el lugar central de todos los datos cuando estos están ordenados
de menor a mayor. La mediana se representa por Me y solo se puede hallar para variables
cuantitativas.
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la
suma de las frecuencias absolutas. Es decir, tenemos que buscar el intervalo en el que se
encuentre N/2 y luego calculamos la siguiente formula:
n
−Fi−1
2
Me=Li + ∗ti
fi
Li-1: Es el límite inferior de la clase donde se encuentra la mediana
N/2: Es la semisuma de las frecuencias absolutas.
Fi-1: Es la frecuencia acumulada anterior a la clase media.
fi: Es la frecuencia absoluta del intervalo mediano.
ti: Es la amplitud de intervalos.
Para el caso de la base de datos, no hallamos la Mediana porque no tenemos el dato del 50%
dentro de la frecuencia absoluta.

Moda: Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con
datos agrupados, hablaremos de intervalo modal y se representa por Mo y se calcula con la
siguiente formula:
fi−fi−1
Mo=Li+ ∗ti
( fi−fi−1 )+ ( fi−fi+1 )
Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
fi: Frecuencia absoluta del intervalo modal.
fi-1: Frecuencia absoluta del intervalo anterior al modal.
fi+1: Frecuencia absoluta del intervalo posterior al modal.
ti: Amplitud de los intervalos.
Para el caso de la base de datos, no hallamos la moda puesto que no podemos obtener la
frecuencia pre modal absoluta del intervalo 1.
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales, hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda
un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el
cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos, su fórmula es:
n
K ( )−Fk
4
Qk=Lk ∗c
fk
k: 1, 2, 3.
Lk: Limite real inferior de la clase de cuartil k.

n: Numero de datos.
Fk: Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk: Frecuencia de la clase de cuartil k.
c: Longitud del intervalo de la clase de cuartil k.
Para calcular el primer cuartil buscamos el intervalo donde se encuentra el primer cuartil,
multiplicando 1 por N (115) y dividiendo por 4.
1∗115
=28,75
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 28,75. Para
el caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la
operación.
Para calcular el segundo cuartil buscamos el intervalo donde se encuentra el segundo cuartil,
2∗115
=57,5
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 57,5. Para el
caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la operación.
Para calcular el tercer cuartil buscamos el intervalo donde se encuentra el tercer cuartil,
3∗115
=86,25
4
Buscamos en la columna de frecuencias acumuladas (Fi) el intervalo que contiene a 86,25. Para
el caso de la base de datos no tenemos el intervalo que contenga el valor obtenido en la
operación.
No obstante, la fórmula para hallar cada uno de los cuartiles cuando se encuentra el intervalo en
la frecuencia acumulada es:
k∗N
−Fi−1
4
Qk=Li+ ∗ai
fi
Donde k = 1,2,3.
Decil 5: Los deciles son los nueve valores que dividen una serie de datos ordenados en diez
partes iguales.
Los deciles dan los valores correspondientes al 10%, 20%, 30%, 40%.........90% de los datos.
Para calcular el quinto decil buscamos el intervalo donde se encuentra el quinto decil,
5+115
=57,5
10
Percentil 50: Son los 99 valores que dividen una serie de datos ordenados en cien partes iguales.
Los percentiles dan los valores correspondientes al 1%, 2%, 3%, 4%, ……..99%.
Para calcular el percentil 50 buscamos el intervalo donde se encuentra el percentil 50,

50∗115
=57,5
100
Sin embargo, podemos deducir que el percentil 50, coincide con la media, y con el decil 5 dentro
de las medidas de una base de datos.
Tipo de Asimetría: Es una medida de forma de una distribución que permite identificar y
describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con la que se
hallen dentro de la distribución; Permite identificar las características de la distribución de datos
sin necesidad de generar el grafico.
Asimetría Negativa o a la izquierda:
Se da cuando en una distribución la minoría de datos está en la parte izquierda de la media. La
distribución de los datos tiene a la izquierda una cola más larga que a la derecha. También se
dice que una distribución es simétrica a la izquierda o tiene sesgo negativo cuando el valor de la
media aritmética es menor que la mediana y este valor de la mediana a su vez es menor que la
moda, en símbolos x<Me<Mo.
Simétrica: Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad
de los datos a ambos lados de la media aritmética. También se dice que una distribución es
simétrica cuando su media aritmética, su mediana y su moda son iguales, en símbolos xMd=Mo.
Asimetría Positiva o a la Derecha: Se da cuando en una distribución la minoría de los datos
está en la parte derecha de la media aritmética. También se dice que una distribución es simétrica
a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la
mediana y a su vez mayor que la moda, en símbolos x>Me>Mo.
Medidas de Asimetría:
Coeficiente de Karl Pearson:
3 ( x−Me )
As=
s
Donde:
X= Media Aritmética
Me: Mediana
s: Desviación Típica Estándar
Nota:
El coeficiente de Pearson varía entre -3 y 3
Si As < 0? La distribución será asimétrica negativa.
Si As = 0? La distribución será simétrica.
Si As > 0? La distribución será asimétrica positiva.
Medida de Yule Bowley o Medida Cuartilica:
Q 1+Q 3−2Q 2
As=
Q 3−Q 1
Donde:
Q1: Cuartil uno; Q2: Cuartil dos = Mediana; Q3: Cuartil tres.
Nota:
La medida de Bowley varía entre -1 y 1.
Si As < 0? La distribución será asimétrica negativa.
Si As > 0? La distribución será asimétrica positiva.
Medida de Fisher:
Para datos agrupados en tablas de frecuencia se emplea la siguiente formula:
As=
∑ f ( Xi− x ) ∧3
n σ3
Para datos agrupados en intervalos se emplea la siguiente formula:
As=
∑ f (xm−x)3
nσ 3
Donde:
Xi: Cada uno de los valores.
n: Numero de datos.
X: Media Aritmética.
f: Frecuencia Absoluta.
σ³: Cubo de la desviación estándar poblacional.
xm: Marca de Clase.
Nota:
Si As < 0? Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicara que la distribución sea asimétrica negativa.
Si As > 0? Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicara que la distribución sea asimétrica positiva.
Curtosis o Apuntamiento: Mide el grado de agudeza o achatamiento de una distribución con
relación a la distribución normal, es decir, mide cuan puntiaguda es una distribución.
Tipos de Curtosis:
Leptocurtica: Existe una gran concentración.
Mesocurtica: Existe una concentración normal.
Platicurtica: Existe una baja concentración.

Medidas de Curtosis:
Medida de Fisher:
Para datos agrupados en tablas de frecuencia se emplea la siguiente formula:
α=
∑ ( Xi−x)4
nσ 4
Para datos agrupados en intervalos se emplea la siguiente formula:
α=
∑ f ( xm−x )4
nσ 4
Donde:
Xi: Cada uno de los valores.
n: Numero de datos.
x: Media Aritmética.
σ4: Cuádruplo de la desviación estándar poblacional.
f: Frecuencia Absoluta.
xm: Marca de Clase.
Nota:
Si a < 3? La distribución es Platicútica.
Si a = 3? La distribución es normal o Mesocurtica.

Si a > 3? La distribución Leptocurtica.
Medida basada en Cuartiles y Percentiles:
Q3−Q1
Desviacion Cuartilica 2 Q3−Q 1
k= = =
Amplitud Cuartilica P 90−P10 2( P 90−P10)
K: (Letra Kappa) Coeficiente percentil de Curtosis.
Nota:
Si k < 0,263? La distribución es Platicurtica.
Si k = 0,263? La distribución es normal o Mesocurtica.
Si k > 0,263? La distribución es Leptocurtica.
Esta medida no es muy utilizada.
Para determinar el índice de asimetría de Fisher y Pearson realizamos lo siguiente:
Para muestra:
As=
∑ f ( Xi− x ) ∧3 fi
n s3
Primero debemos hallar el promedio muestral y la desviación estándar muestral:
Varianza muestral: Es el resultado de multiplicar la marca de clase al cuadrado por la frecuencia
absoluta menos el tamaño de la muestra por el promedio al cuadrado sobre el tamaño de la
muestra menos 1:
6787−115( 4,629)2
S2 =
114
S2=37,91
Desviación estándar muestral: Es la raíz cuadrada de la varianza muestral.
S= √ 37,91
S=6,15
Entonces hallando la asimetría: Entre paréntesis al cubo, a la marca de clase le restamos el
promedio y lo multiplicamos por la frecuencia, al final generamos la sumatoria de estos
resultados y ya tenemos todo lo necesario para hallar la asimetría de Fisher.
−10315,48
As= 3
115 ( 6,15 )
As=−0,385
Para población:
As=
∑ f ( Xi−μ ) ∧ 3 fi
n σ3
Primero debemos hallar el promedio poblacional y la desviación estándar poblacional:
Varianza poblacional: Resulta de hallar la sumatoria de la marca de clase al cuadrado por la
frecuencia absoluta menos el promedio al cuadrado: Según la tabla tenemos
6787
σ 2= −( 4.629¿¿ 2)=37,58¿
115
Desviación estándar poblacional: Es la raíz cuadrada de la varianza poblacional.
σ 2 √ 37,58
σ =6.13
Entonces para hallar la asimetría de Fisher para la población:
−10315,48
As=
115 ( 6,13 )3
As=−0,389
Así las cosas, podemos evidenciar que la asimetría tanto para población como para muestra es
menor a cero <0.
interpretar los resultados y asociarlos con la problemática: “¿En qué condiciones de desarrollo
territorial, social y humano se encuentran las comunidades con mayor pobreza extrema en
Colombia?”
Al realizar la verificación de los resultados respecto al porcentaje de ocupantes en viviendas sin
energía eléctrica, podemos deducir que se encontró una relación existente entre los datos
arrojados por la media y la varianza, ya que es cercana a 3, mientras que la desviación típica es
cercana a 2, por lo que se puede deducir que la población en general puede acceder a 2 o 3
servicios públicos, lo que es muy preocupante, pues no permite el desarrollo óptimo de la
población.
Medidas de Dispersión
Rango: Es un valor numérico que indica la diferencia entre el valor máximo y el valor mínimo
de una población o muestra estadística.
La fórmula para hallar el rango es la siguiente:
R=MAXx−MINx
R=50,62−0,04=50,58
Varianza: Es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística, y se representa por σ 2 y su fórmula es:
∑ ( Xi− X )2
i=1
=σ 2
n
106(3,2−4,63)2+3 (9,5−4,63)2+ 2(15,9−4,63)2 +2(22,2−4,63)2+ 0(28,5−4,63)2

114
0 ( 34,8−4,63 )2+1 ( 41,1−4,63 )2 +1 ( 47,5−4,63 )2

=37,95
114
Desviación Típica: Es la raíz cuadrada de la varianza, es decir, la raíz cuadrada de la media
de los cuadrados de las puntuaciones de desviación, se representa σ , la fórmula es:
( x 1−x )2 f 1+ ( x 2−x )2 f 2+ ( xn−x )2 f 1n

σ=
√ N
σ=
√ ∑ (xi−x)2 fi
i−1
N
Por lo tanto, al sacar raíz cuadrada del resultado de la varianza, tendríamos:
√ 37,95
S=6,16
Coeficiente de Variación: Es una representación de cómo es la desviación típica que posee una
muestra con respecto a su media. Este concepto de coeficiente de variación implica la variación
que pueden presentar unos datos. Esto se conoce como la variabilidad que una variable puede
llegar a presentar. Su fórmula es:
Sx
CV = ∗100
X
Sx hace referencia a la desviación típica.
X Hace referencia a la media aritmética.
Por lo tanto:
6,16
CV = ∗100
4,63
CV =133,04
Conclusiones
Los conceptos y datos antes mencionados fueron trabajados de manera que haga más fácil su
comprensión y análisis, para tratar de entender y poder tomar decisiones respecto a los niveles de
pobreza existentes en el territorio Colombiano respecto a los servicios públicos a los cuales
pueden acceder los habitantes de 115 municipios.
Hicimos uso de variables cualitativas y cuantitativas para comparar el comportamiento de la
población en referencia al acceso a servicios públicos en sus territorios.

Referencias
 García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. Página
26 -42
 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical
Descriptive. Cengage Learning Paraninfo, S.A. Paginas 41-50
 https://economipedia.com/definiciones/desviacion-tipica.html
 https://economipedia.com/definiciones/desviacion-tipica.html
 https://www.portaleducativo.net/octavo-basico/792/Media-moda-y-mediana-para-datos-
agrupados
 https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/cuartiles.ht
ml
 https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/deciles.htm
 https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/percentiles.
html
 https://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-
forma-asimetria-curtosis.shtml

Estadistica Descriptiva - Analisis de Informacion

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica Descriptiva - Analisis de Informacion

Cargado por

Copyright:

Formatos disponibles

Unidad 2 Paso 3 Analisis de la Información

Universidad Nacional Abierta y a Distancia UNAD

Escuela de Ciencias Basicas Tecnologia e Ingeniería ECBTI

Curso: Estadistica Descriptiva 204040_43

Bogotá 31 de Octubre de 2019

económicos, en el cual se realizo el analisis a la variable % de ocupantes en viviendas sin

comunidades con mayor indice de pobreza en Colombia.

llevado al hombre a cuantificar, medir, cualificar todos estos acontecimientos.

disminuir los niveles de pobreza.

en resumen, todo aquello que implique medidas univariantes, ya sean de tendencia

central, posición o dispersión.

 Diferenciar cada uno de los conceptos antes mencionados.

 Interpretar los resultados de cada una de las variables estudiadas.

 Interpretar datos en tablas de frecuencia.

 Aplicar adecuadamente las medidas de tendencia central.

MEDIDAS ESTADISTICAS UNIVARIANTES

Medidas de Dispersión: Hace referencia a la distancia de separación en que se encuentran los

es compara varias distribuciones de frecuencias en términos de variabilidad para saber cuál es la

VARIANZA Y DESVIACION TIPICA: La varianza se denota por S2 x se define como la

menos representativa será la media.

La varianza nunca puede ser negativa ¿ y se encuentra expresada en unidades de medida al

para deshacer el elevado al cuadrado.

valores absolutos de las desviaciones así:

resultados. En realidad, la formula anterior es la desviación respecto de la media.

mismo, la desviación típica es la raíz cuadrada de la varianza y se relacionan de la siguiente

COEFICIENTE DE VARIACION DE PEARSON: Es el cociente entre la desviación típica y

la media aritmética de la variable estadística X, suele representarse por g 0( X).

mejor la representatividad de la media aritmética.

medias y de la unidad de medida de las variables.

Medidas Univariantes de Tendencia Central.

a. Para la variable elegida, se deberán calcular las medidas univariantes de tendencia

Cantidad de Servicios públicos disponibles.

Media = 372/115 = 3.23

públicos disponibles para sus domicilios.)

(ascendente o descendente) es:

- El número de la mitad, si n es par, y

- La media de los números de la mitad, si n es impar.

(N+1)/2 = 115+1 = 116/2 = 58

Por lo tanto, la mediana es 3 al ordenar la tabla en orden ascendente.

mayor frecuencia en la lista.

Todos los cuartiles.

Medidas univariantes de dispersión:

a. Para la variable elegida, se deberán calcular las medidas univariantes de dispersión:

mínimo de una población o muestra estadística.

La fórmula para hallar el rango es la siguiente:

MAX = Valor máximo de la muestra o población.

MIN = Valor mínimo de la muestra o población.

Para la variable elegida Cantidad de Servicios públicos disponibles.

distribución estadística, y se representa por σ 2 y su fórmula es:

(1−3)2 +(2−3)2+(3−3)2 +(4−3)2+(5−3)2+(6−3)2 +(7−3)2

44+30+ 0+14+38+ 45+96

Desviación típica: Es la raíz cuadrada de la varianza, es decir, la raíz cuadrada de la media de

los cuadrados de las puntuaciones de desviación, se representa σ , la fórmula es:

( x 1−x )2 f 1+ ( x 2−x )2 f 2+ ( xn−x )2 f 1n

Por lo tanto, al sacar raíz cuadrada del resultado de la varianza, tendríamos:

Coeficiente de variación: Es una representación de cómo es la desviación típica que posee

variable puede llegar a presentar. Su fórmula es:

Sx hace referencia a la desviación típica.

X Hace referencia a la media aritmética.

b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio

Al realizar la verificación de los resultados respecto a la cantidad de servicios públicos

Actividad 3. Variable Cuantitativa continua

Tabla de Frecuencia de Datos Agrupada. (Histograma de Frecuencias y Polígono de Frecuencias)

Numero Limite Limite Marca de Frecuenci Frecuenci