Está en la página 1de 65

Universidad de concepción

Tipos de variables
Representación tabular de variables
Medidas de resumen

Estadı́stica Aplicada 523215


Analisis exploratorio de datos

Francisco Muñoz Gutierrez

1
Departamento de Estadı́stica
Universidad de Concepción

March 15, 2016

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

La estadı́stica es una ciencia que nos facilita numerosas


herramientas para abordar de manera óptima todas las etapas
necesarias, hasta una interpretación final buena de los datos,
que a su vez guardan relación con el interes de nuestro estudio.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

La estadı́stica es una ciencia que nos facilita numerosas


herramientas para abordar de manera óptima todas las etapas
necesarias, hasta una interpretación final buena de los datos,
que a su vez guardan relación con el interes de nuestro estudio.
Las etapas a considerar se basan basicamente en reunir,
resumir y clasificar los datos para luego ser analizados e
interpretados.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

La estadı́stica es una ciencia que nos facilita numerosas


herramientas para abordar de manera óptima todas las etapas
necesarias, hasta una interpretación final buena de los datos,
que a su vez guardan relación con el interes de nuestro estudio.
Las etapas a considerar se basan basicamente en reunir,
resumir y clasificar los datos para luego ser analizados e
interpretados.
En resumen es:
Obtenemos datos, Analizamos los datos y finalmente
presentamos conclusión referente a la información de
interés.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

La estadı́stica es una ciencia que nos facilita numerosas


herramientas para abordar de manera óptima todas las etapas
necesarias, hasta una interpretación final buena de los datos,
que a su vez guardan relación con el interes de nuestro estudio.
Las etapas a considerar se basan basicamente en reunir,
resumir y clasificar los datos para luego ser analizados e
interpretados.
En resumen es:
Obtenemos datos, Analizamos los datos y finalmente
presentamos conclusión referente a la información de
interés.

Cuando ya hemos observados los valores de la variable en los


objetos...¿cómo podemos resumir la información que tenemos?.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción
Población
Conjunto de todos los individuos u objetos que tienen al menos una
caracteristica en común.(Ej: Peso de los niños en Chile).

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción
Población
Conjunto de todos los individuos u objetos que tienen al menos una
caracteristica en común.(Ej: Peso de los niños en Chile).

Parámetro
Medida resumen que describe alguna caracterı́stica del total de la
población.(Ej: Media, Varianza, Mediana, etc).

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción
Población
Conjunto de todos los individuos u objetos que tienen al menos una
caracteristica en común.(Ej: Peso de los niños en Chile).

Parámetro
Medida resumen que describe alguna caracterı́stica del total de la
población.(Ej: Media, Varianza, Mediana, etc).

Muestra
Subconjunto de la población y es obtenida por medio de un muestreo.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción
Población
Conjunto de todos los individuos u objetos que tienen al menos una
caracteristica en común.(Ej: Peso de los niños en Chile).

Parámetro
Medida resumen que describe alguna caracterı́stica del total de la
población.(Ej: Media, Varianza, Mediana, etc).

Muestra
Subconjunto de la población y es obtenida por medio de un muestreo.

Estadı́stico o Estadigrafo
Una medida que describe alguna caracterı́stica de la muestra.(Ej:
Estatura media da la muestra).
Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215
Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción
Población
Conjunto de todos los individuos u objetos que tienen al menos una
caracteristica en común.(Ej: Peso de los niños en Chile).

Parámetro
Medida resumen que describe alguna caracterı́stica del total de la
población.(Ej: Media, Varianza, Mediana, etc).

Muestra
Subconjunto de la población y es obtenida por medio de un muestreo.

Estadı́stico o Estadigrafo
Una medida que describe alguna caracterı́stica de la muestra.(Ej:
Estatura media da la muestra).
Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215
Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

Se cuenta con información de algunas variables medidas a


computadores fabricados por la compañı́a Dell.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

Las variables medidas son:


1 Notebook: código del notebook seleccionado
2 Paı́s: paı́s de origen de la compra
3 Demora: demora en la entrega del producto(consulta a los
compradores)
4 Tiempo Repara: cantidad de meses en que se realizó la primera
reparación al computador.
5 Cant. Acc.: cantidad de accesorios que se agregaron a la compra
del notebook.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Estadistica Descriptiva
Representación tabular de variables
Medidas de resumen

Introducción

No podemos presentar los datos tal cual...de alguna manera


debemos resumirlos tanto numéricamente como gráficamente.
Veremos los tipos de variables que existen y cómo podemos
resumir la información que obtengamos de cada una.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Clasificación de las variables

Las variables aleatorias pueden ser clasificadas en dos grandes


grupos:
1 Variables Cualitativas
2 Variables Cuantitativas

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Clasificación de las variables


Variables Cualitativas

Las variables cualitativas a su vez pueden ser clasificadas en


dos sub-grupos:
1 Variables Cualitativas nominales
2 Variables Cualitativas ordinales

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Clasificación de las variables


Variables Cuantitativas

Las variables cuantitativas a su vez pueden ser clasificadas en


dos sub-grupos:
1 Variables Cuantitativas discretas
2 Variables Cuantitativas continuas

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Clasificación de las variables

A modo de resumen, las variables se clasifican de la siguiente


manera:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Representación tabular de variables

Suponga que se cuenta con n observaciones de la variable


aleatoria X . Llamaremos a n el tamaño de la muestra.
La representación tabular o bien tabla de frecuencias de
variables no es mas que un resumen en forma de tabla de la
información de los datos obtenidos.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Representación tabular de variables

Suponga que se cuenta con n observaciones de la variable


aleatoria X . Llamaremos a n el tamaño de la muestra.
La representación tabular o bien tabla de frecuencias de
variables no es mas que un resumen en forma de tabla de la
información de los datos obtenidos.
Dependiendo del tipo de variable: cualitativa o cuantitativa, la
tabla de frecuencias es diferente.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables nominales y ordinales

La tabla de frecuencia para este tipo de variables muestra los


niveles o categorı́as de las variable nominal u ordinal, seguido
de la frecuencia absoluta de cada categorı́a.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables nominales y ordinales

La tabla de frecuencia para este tipo de variables muestra los


niveles o categorı́as de las variable nominal u ordinal, seguido
de la frecuencia absoluta de cada categorı́a.
La frecuencia absoluta de cada categorı́a corresponde a cuántos
individuos u objetos se encuentran en cada categorı́a de la
variable.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables nominales y ordinales


Ejemplo

Realicemos la tabla de frecuencias para las variables nominales


y ordinales que encontramos en la base de datos de los
computadores fabricados por la empresa Dell.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables discretas

Dado que las variables cuantitativas representan una cantidad


numérica, la tabla de frecuencia es diferente de las variables
cualitativas.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables discretas

Dado que las variables cuantitativas representan una cantidad


numérica, la tabla de frecuencia es diferente de las variables
cualitativas.
En el caso de variables cuantitativas discretas, la tabla se
contruye considerando todos los valores de la variable posibles y
sus frecuencias absolutas:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables discretas

Dado que las variables cuantitativas representan una cantidad


numérica, la tabla de frecuencia es diferente de las variables
cualitativas.
En el caso de variables cuantitativas discretas, la tabla se
contruye considerando todos los valores de la variable posibles y
sus frecuencias absolutas:
Cosntruyamos la tabla de frecuencias para las variables
discretas encontradas en la base de datos de los computadores
Dell.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

En el caso de variables cuantitativas continuas, dado que hay


muchos varoles posibles para la variable, agruparemos valores
en intervalos de que llamaremos intervalos de clase.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

En el caso de variables cuantitativas continuas, dado que hay


muchos varoles posibles para la variable, agruparemos valores
en intervalos de que llamaremos intervalos de clase.
La construcción de los intervalos de clase serán de la siguiente
manera:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

Utilizaremos los siguientes valores:


1 Xmin : valor mı́nimo de las observaciones
2 Xmax : valor máximo de las observaciones
3 Rango: Xmax − Xmin
4 k : cantidad de intervalos a realizar
5 a: amplitud de cada intervalo

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

Para determinar cuántas clases queremos construir, el valor k ,


se recomiendan los siguientes valores:
1 Regla
√ de Sturges: 1 + 3.22log(n), cuando n es grande.
2 n, cuando n es pequeño.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

Para determinar cuántas clases queremos construir, el valor k ,


se recomiendan los siguientes valores:
1 Regla
√ de Sturges: 1 + 3.22log(n), cuando n es grande.
2 n, cuando n es pequeño.
Sin embargo, el valor de k se establece según el criterio de
quien realiza el análisis, variando entre 5 a 20 intervalos.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

La amplitud de cada intervalo puede ser diferente. Nosotros


trabajaremos con intervalos de la misma amplitud.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

La amplitud de cada intervalo puede ser diferente. Nosotros


trabajaremos con intervalos de la misma amplitud.
El valor de la amplitud, constante a, será calculado como:

Rango Xmax − Xmin


a= =
k k

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

La construcción de los intervalos de clase debe ser tal que el


primer intervalo de clase contiene al menor valor observado y el
último intervalo debe contener al mayor valor de las
observaciones.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

La construcción de los intervalos de clase debe ser tal que el


primer intervalo de clase contiene al menor valor observado y el
último intervalo debe contener al mayor valor de las
observaciones.
Para ello, construimos los intervalos de la siguiente manera...

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

Luego de construir los intervalos de clase, debemos determinar


la frecuencia absoluta de cada clase, lo cual denotaremos por
ni .

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables cuantitativas
Variables continuas

Luego de construir los intervalos de clase, debemos determinar


la frecuencia absoluta de cada clase, lo cual denotaremos por
ni .
Los valores ni i = 1, . . . , k los obtendremos contando cuántos
datos pertenecen a cada uno de los intervalos de clase.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables continuas
Ejemplo

Construyamos la tabla de frecuencia para las variables


continuas de la base de datos de los computadores fabricados
por la empresa Dell.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables continuas
Ejemplo

Construyamos la tabla de frecuencia para las variables


continuas de la base de datos de los computadores fabricados
por la empresa Dell.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables continuas

En el caso de datos agrupados, definimos los siguientes valores:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Variables continuas

En el caso de datos agrupados, definimos los siguientes valores:

1 xi : marca de clase del intervalo i, i = 1, . . . , k .


2 hi : frecuencia relativa porcentual del intervalo i, i = 1, . . . , k.
3 Ni : frecuencia absoluta acumulada del intervalo i, i = 1, . . . , k.
4 Hi : frecuencia relativa porcentual acumulada del intervalo i,
i = 1, . . . , k .

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Representación gráfica de variables

Dependiendo de la clasificación de la variable con la que


estemos trabajando, gráficamente podemos representarlas de
diferentes maneras:
1 Variables Cualitativas: gráfico de torta(pie), gráfico de barras
2 Variables Cuantitativas: histograma, polı́gono de frecuencias, ojiva,
gráfico de tallo y hojas, boxplot.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Representación gráfica de variables


Variables Cualitativas

Podemos realizar dos gráficos en el caso de variables


cualitativas:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Variables Cualitativas
Tipos de variables
Variables Cuantitativas
Representación tabular de variables
Representación gráfica de variables
Medidas de resumen

Representación gráfica de variables


Variables Cuantitativas

Podemos realizar varios gráficos en el caso de variables


cuantitativas:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Estadı́sticos de resumen

La tabla de frecuencia anterior y los gráficos asociados a cada


una de ellas nos permiten resumir la información presente en la
muestra.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Estadı́sticos de resumen

La tabla de frecuencia anterior y los gráficos asociados a cada


una de ellas nos permiten resumir la información presente en la
muestra.
Sin embargo, en el caso de variables cuantitativas serı́a útil
también resumir la información de la muestra con pocos
números, más allá de las frecuencias absolutas.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Estadı́sticos de resumen

La tabla de frecuencia anterior y los gráficos asociados a cada


una de ellas nos permiten resumir la información presente en la
muestra.
Sin embargo, en el caso de variables cuantitativas serı́a útil
también resumir la información de la muestra con pocos
números, más allá de las frecuencias absolutas.
Esos valores que nos permite resumir numéricamente la
información de la muestra los llamaremos estadı́sticos: una
función de la muestra.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central

Las medidas de tendencia central:


1 Promedio
2 Mediana
3 Moda

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Promedio

El promedio de una muestra lo obtenemos como:


( Pn
1
nP i=1 Xi Datos no agrupados
X̄ = 1 k
n j=1 nj xj Datos agrupados

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

La mediana de un conjunto de observaciones se calcula de


manera diferente si las observaciones se encuentran agrupadas
o no:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

La mediana de un conjunto de observaciones se calcula de


manera diferente si las observaciones se encuentran agrupadas
o no:
En el caso que las observaciones NO estén agrupadas, primero
debemos ordenarlas: x(1) , x(2) , . . . , x(n)

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

La mediana de un conjunto de observaciones se calcula de


manera diferente si las observaciones se encuentran agrupadas
o no:
En el caso que las observaciones NO estén agrupadas, primero
debemos ordenarlas: x(1) , x(2) , . . . , x(n)
La mediana se obtiene como

x( n+1 ) n impar
Me = 2 
x(n/2) + x(n/2+1) /2 n par

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

En el caso de que los datos estén agrupados en una tabla de


frecuencias, la mediana la calculamos de la siguiente manera:

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

En el caso de que los datos estén agrupados en una tabla de


frecuencias, la mediana la calculamos de la siguiente manera:
n
2 − Ni−1
Me = Linf ,i + ai
ni
donde:
Linf ,i : lı́mite inferior del intervalo mediano.
Ni−1 : frecuencia acumulada del intervalo anterior al mediano.
ni : frecuencia absoluta del intervalo mediano.
ai : amplitud del intervalo mediano.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

¿Porqué está de moda el uso de smartphones?

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

¿Porqué está de moda el uso de smartphones? Desde hace un


tiempo mucha gente comenzó a usar smartphone. Hoy la
mayorı́a de la gente usa smartphones.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

¿Porqué está de moda el uso de smartphones? Desde hace un


tiempo mucha gente comenzó a usar smartphone. Hoy la
mayorı́a de la gente usa smartphones.
Este mismo concepto lo usamos en estadı́stica: la moda de un
conjunto de datos es el valor que más se repite.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de tendencia central


Mediana

¿Porqué está de moda el uso de smartphones? Desde hace un


tiempo mucha gente comenzó a usar smartphone. Hoy la
mayorı́a de la gente usa smartphones.
Este mismo concepto lo usamos en estadı́stica: la moda de un
conjunto de datos es el valor que más se repite.
En el caso de datos agrupados, corresponde a la marca de clase
del intervalo con mayor frecuencia absoluta.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de dispersión

Las medidas de dispersión:


1 Rango
2 Varianza
3 Desviación estándar
4 Coeficiente de variación

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de Dispersión
Varianza

La varianza de una muestra, denotada por s2 , se obtiene de la


siguiente manera:
( Pn
1 2
2 n−1P i=1 (xi − x̄) Datos no agrupados
s = 1 k 2
n−1 j=1 nj (xj − x̄) Datos agrupados

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de Dispersión
Desviación estándar

La desviación estándar de una muestra se denota por s y se


obtiene como la raı́z cuadrada de la varianza s2 :


s = s2

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de Dispersión
Coeficiente de variación

Tanto el rango como la desviación estándar están definidas en la


unidad de medida en que se mide la variable.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de Dispersión
Coeficiente de variación

Tanto el rango como la desviación estándar están definidas en la


unidad de medida en que se mide la variable.
En el Coeficiente de variación es una medida de dispersión
que es adimensional pues está definido por:
s
CV = 100%

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Medidas de Dispersión
Coeficiente de variación

Tanto el rango como la desviación estándar están definidas en la


unidad de medida en que se mide la variable.
En el Coeficiente de variación es una medida de dispersión
que es adimensional pues está definido por:
s
CV = 100%

Dado que es adimensional, permite comparar la dispersión de


dos conjuntos de datos que no tengan la misma unidad de
medida.
obs; Esta misma base de datos la trabajaremos en laboratorio.

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215


Universidad de concepción
Tipos de variables
Representación tabular de variables
Medidas de resumen

Gracias por su atención

Francisco Muñoz Gutierrez Estadı́stica Aplicada 523215

También podría gustarte