Está en la página 1de 40

Introducción a la Estadística III

Contenidos:

• Organización de la información en Estadística.

• Tablas de frecuencia
• Gráficos (Tipos, construcción e interpretación)
• Medidas de tendencia central
¿Como se organiza la información estadística?

Numérica Gráfica

Arreglos Frecuencias Gráficos

Frecuencia Absoluta (fi)

Frecuencia Relativa (ni)

Frecuencia Acumulada (Fi)

Frecuencia Relativa
Acumulada (Ni)
Interpretación de tablas de frecuencia

Frecuencia absoluta

• Corresponde a la cantidad de veces que se repite un dato. Denotamos este valor


por fi.

• La suma de las frecuencias absolutas es igual al número total de datos, que se


representa por N.

Por ejemplo:
Si hacemos una encuesta a 20 personas para saber cuál es su color favorito obtenemos
lo siguiente:
La Frecuencia Absoluta Acumulada

• Se obtiene sumando sucesivamente las frecuencias absolutas.


Denotamos este valor por Fi.
Frecuencia Relativa

• Es la probabilidad de obtener cierto dato.


• Se obtiene calculando la razón entre la frecuencia absoluta de un dato con el
total. Se puede expresar como fracción, decimal o porcentaje. Denotamos este
valor por ni o hi
Frecuencia Relativa Acumulada

• La frecuencia relativa acumulada es el cociente entre la frecuencia


acumulada de un determinado valor y el número total de datos. Se
puede expresar en tantos por ciento. Denotamos este valor por Hi

Se calcula:
Fi /N
Gráficos

• Llamado también "diagrama" es una representación visual de datos


estadísticos por medio de puntos, números, símbolos, colores, líneas, barras,
polígonos o figuras asociadas a escalas de medición, que permite una fácil
comprensión de la información en su conjunto.
Composición

Un gráfico estadístico está compuesto por tres partes o elementos:

1.- Título: Este debe responder a las preguntas ¿qué?, ¿cómo?, ¿cuándo?
Y ¿dónde?
• ¿Qué? Lo que se está representando en gráfico.

• ¿Cómo? En que unidades están expresados los datos.

• ¿Cuándo? La fecha a la que corresponde la información

• ¿Dónde? Lugar geográfico que abarca.


• Cuerpo del gráfico: Es el esqueleto o gráfico en sí. Está compuesto por un
conjunto de puntos, líneas, barras, polígonos o figuras utilizados en la
representación de los datos estadísticos. Ejemplo:

• Es la línea recta segmentada que representa la escala de medición a la que


corresponden los datos estadísticos del gráfico. Si se visualizan los rótulos de
datos, es optativo mostrar u ocultar el eje de valores. Ejemplo:
• La fuente: De dónde se obtuvieron los datos o informaciones.
Tipos de gráficos

Gráficos de barras

• Está formado por una serie de rectángulos en el cual el ancho de la base es


arbitrario, pero la altura es proporcional al valor de la variable que se quiere
representar. Se utiliza para comparar las frecuencias o los valores de las
distintas categorías o grupos.
Fuente: Informe de Desarrollo Humano, Chile, 2015.
Gráficos de líneas

• Un gráfico de líneas es una herramienta eficaz para la visualización de


tendencias en los datos a lo largo del tiempo y por lo tanto el tipo de
gráfico más adecuado para series temporales.

Fuente: Informe de Desarrollo Humano, Chile, 2015.


Fuente: Informe de Desarrollo Humano, Chile, 2015.
Gráfico circular

• Se utiliza cuando nos interesa resaltar la proporción (porcentaje) en


que aparece una característica o atributo respecto al total. Para
construir el diagrama circular partimos del hecho de que un círculo
encierra un total de 360 grados, luego repartimos los 360° en distintos
sectores circulares de acuerdo con cada porcentaje.
Diagrama de dispersión

Un gráfico de dispersión se utiliza para mostrar la relación entre dos


variables. Es la manera más exacta de mostrar correlaciones, como se
ilustra en el siguiente ejemplo. Sin embargo, algunos analistas
prefieren utilizar los gráficos de barras, pues los diagramas de
dispersión puede ser difíciles de interpretar.
Medidas de Tendencia Central

• Las medidas de Tendencia Central son empleadas para resumir a los


conjuntos de datos que serán sometidos a un estudio estadístico.

• Las medidas de tendencia central son medidas estadísticas que pretenden


resumir en un solo valor a un conjunto de valores. Representan un centro
en torno al cual se encuentra ubicado el conjunto de los datos.

• Se les llama medidas de tendencia central porque generalmente la


acumulación más alta de datos se encuentra en los valores intermedios.

• Estas medidas son utilizadas con gran frecuencias como medidas


descriptivas de poblaciones o muestras.
• Medidas de Posición: son aquellos valores numéricos que nos permiten
o bien dar alguna medida de tendencia central, dividiendo el recorrido
de la variable en dos, o bien fragmentar la cantidad de datos en partes
iguales. Las más usuales son la media, la mediana, la moda, los
cuartiles, quintiles, deciles y percentiles.

• Medidas de Dispersión: se llaman medidas de dispersión aquellas que


permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los datos
en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el desvío
estándar y la varianza.
Medidas de Posición

• Medidas de tendencia central


Media, Mediana y Moda

• Medidas no centrales
Cuantiles: Cuartiles, deciles, percentiles
Las más empleadas

1. Moda: Es el valor con una mayor frecuencia en una distribución


de datos.

2. Mediana: Representa el valor de la variable que deja por debajo


de sí a la mitad de los datos en un conjunto ordenados de menor a
mayor.

3. Media: Promedio o valor obtenido por la suma de todos los datos


(valores) dividida entre el número de sumandos.
Media Aritmética (X) de una variable aleatoria (o Promedio)

Es la suma de todos sus posibles valores dividida por el n° total de datos (n)

(Ejemplo: TALLA)
Datos:
184.2 191.8 188.0 196.2 178.4
184.2 195.4 189.2 186.0 194.3
190.5 190.5 198.1 188.0 184.2
176.5 184.2 193.5 195.6 186.3

_
X
184 .2  191 .8  188 .0  ...  193 .5  195 .6  186 .3  188 .75  188 .8
20
31
Mediana(Med) de una variable aleatoria

Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 %


de las observaciones.

Primero !!!!! Ordenamos los valores de menor a mayor

Si n es el número de observaciones:

a) n impar: mediana es el único valor central

b) n par: mediana es el promedio de los dos valores centrales

32
Si la variable es la talla

33
(Ejemplo: TALLA)

Datos ordenados:

50 * 20 20
50% de 20    10 datos
100 2

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0,
189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

10 datos

n= 20 par Mediana 188.0  189.2


• Promedio de 2 valores Med   188.6
centrales 2
• Dejan aproximadamente
50% de los datos bajo y
sobre sí (aprox. 10 datos)
34
(Ejemplo: PESO)

Datos ordenados:

50 * 21 21
50% de 21    10.5  10 datos
100 2

39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69,
70, 70, 71,72

n= 21 impar Med=58
Mediana
• valor central único
• Deja aproximadamente 50%
de los datos bajo y sobre sí 35
(aprox. 10 datos)
Sea X una variable discreta con los siguientes valores:

X: 2, 5, 7, 12

Media= (2+5+7+12)/4=6.5 Mediana= (5+7)/2= 6

Si cambiamos la última observación por otra


extrañamente grande

X: 2, 5, 7, 125

Media= (2+5+7+125)/4=34.75 Mediana= (5+7)/2= 6

Conclusión:
La Media es afectada por valores extremos, no así,
la Mediana 36
Ejercicio
Cuál de los dos valores es más adecuado para la distribución de los
datos, la Media o la Mediana???

Límite f c F
real Media  X  32.75
0-10 60 5 60
Mediana  15
10-20 80 15 140

20-30 30 25 170

30-100 20 65 190

100-500 10 300 200

200
37
La medida de tendencia central más adecuada para describir estos
38
3.- Moda de una variable aleatoria

Es aquel valor de la variable con mayor frecuencia


absoluta.

• Puede no ser única

39
(Ejemplo: TALLA)

Como conocemos cada uno de los datos, podemos ver el que


más se repite:

Moda= 184.2

40

También podría gustarte