Está en la página 1de 28

Investigación

de Mercados

Estadística descriptiva
• Áreas de la estadística:
I. Diseño: Planeamiento y desarrollo de
Análisis de datos investigaciones.
Definición
de estadística II. Descripción: Resumen y exploración de
datos.

III. Inferencia: Hacer predicciones o


generalizaciones acerca de
características de una población en base a
la información de una muestra de la
población.

2
• Escalas o etapas
Ordinales*
Tipos de datos Existe un orden
Ej. Medallas de una prueba deportiva:
oro, plata, bronce.
natural entre las
categorías
Severidad de la patología: Ausente /
leve / moderado / severo.

• Colores
Cualitativas Nominales* • Lugares
 Cualidades , No existe orden
• Profesiones

 categorías o obvio entre las • Estado civil: soltero, casado,


atributos categorías separado, divorciado y viudo.
 • Peso


Variables 
 Discretas
Cuantitativas Toma valores
aislados, es decir
• Número de hijos
 no admite valores


Páginas de un libro
Peso
 Aquellas medibles intermedios.
numéricamente

Continuas
Puede tomar • Peso
valores • Talla
comprendidos • Tiempo
entre dos
números.

* Para más de dos categorías. Cuando se trata de sólo dos categorías hablamos de dicotómicos. Ej. Hombre-mujer
 Medidas de centralización: Indican valores con
respecto a lo que los datos parecen agruparse
 MEDIA, MEDIANA Y MODA
Análisis de datos,
Estadística descriptiva:
 Medidas de dispersión: Indican la mayor o menor
Descripción concentración de los datos con respecto a las
numérica y medidas de centralización.
 RANGO, VARIANZA, DESVIACIÓN ESTANDAR
gráficos
 Medidas de posición: Dividen un conjunto
ordenado de datos en grupos con la misma
cantidad de individuos.
 CUANTILES (PERCENTILES, CUARTILES, DECILES….)

 Gráficos
Análisis de datos, • Valor Medio es simplemente el promedio
Estadística descriptiva: de los números.
Medidas de • La mediana es la observación equidistante de
centralización: los extremos.
• La moda es el valor que se observa con más
MEDIA frecuencia, el más repetido
Análisis de datos, Estadística descriptiva:
Medidas de dispersion: RANGO

• Recorrido o rango: es la
diferencia entre los
valores máximo y
mínimo de la variable.
• En el ejemplo 3, 3, 4, 7,
9, 11, 12, el rango es 12-
3 = 9.

• En principio, la varianza es una


medida de variabilidad que da
cuenta del grado de
homogeneidad de un grupo de
observaciones.
Análisis de datos, Estadística descriptiva:
Medidas de dispersion: VARIANZA
• Denominemos estas variables evaluadas
o cuantificadas “X”, asignándole valores
según un sistema específico de
asignaciones.
• En la gráfica anterior el grupo de
personas se conformaría con
asignaciones diferentes de “X”, lo cual
podríamos representar de la siguiente
manera:

 El conjunto de medidas podrían


ser resumidas mediante promedios
o medidas de tendencia central.
 En este caso utilizamos la media
aritmética.
 Ese valor está representado por un
valor central y un “caso modelo”
que representaría las
características promedio del grupo
Análisis de datos, Estadística descriptiva:
Medidas de dispersion: VARIANZA
• Una vez calculada la medida promedio resulta fácil
notar que existe una diferencia (distancia) entre
las medidas individuales y el promedio.

• Cuanto mayor dispersión se observe (distancia


respecto a la media) menos homogéneas son las
observaciones.

• La dispersión puede cuantificarse calculando la


diferencia entre las medidas individuales y el
promedio.
Análisis de datos, Estadística descriptiva:
Medidas de dispersion: S y DE

Elevar cada diferencia al


cuadrado hace que todos los
números sean positivos (para
evitar que los números
negativos reduzcan la
varianza)

Y también hacen que las


diferencias grandes se
destaquen. Por ejemplo
1002=10,000 es mucho más
grande que 502=2,500.

Pero elevarlas al cuadrado


hace que la respuesta sea muy
grande, así que lo deshacemos
(con la raíz cuadrada) y así la
desviación estándar es mucho
más útil.
Análisis de datos, Estadística descriptiva:
Medidas de dispersion: S y DE

Raíz cuadrada de la
varianza= Desviación
estándar

Desviación estándar
= 3.66

La desviación estándar
es un índice numérico
de la dispersión de un
conjunto de datos (o
población).

Mientras mayor es la
desviación estándar,
mayor es la dispersión
de la población.
Análisis de datos, Estadística descriptiva:
Medidas de posición: CUANTILES

• Los cuantiles suelen usarse por grupos, los cuales dividen la


distribución en partes iguales, interpretadas estas como intervalos
que comprenden la misma proporción de valores los mas usados
son:
• Los cuartiles: Estos dividen a la distribución en cuatro partes

• Los deciles: Este divide la distribución en diez partes.

• Los percentiles: Dividen la distribución en cien partes .


Análisis de datos, Estadística descriptiva:
Medidas de posición: EJ. CUARTILES

• ORDENAR LOS DATOS: Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

• CALCULO DE CUARTILES
• Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución.
• Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el
siguiente:
• Q1=(24 + 25) / 2 = 24,5
Análisis de datos, Estadística descriptiva:
Medidas de posición: EJ. CUARTILES

• ORDENAR LOS DATOS: Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

• CALCULO DE CUARTILES
• Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados.
• Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:
• me= Q2 = (33 + 34)/ 2 =33,5
Análisis de datos, Estadística descriptiva:
Medidas de posición: EJ. CUARTILES
• ORDENAR LOS DATOS: Para calcular los parámetros estadístico, lo primero es ordenar la distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

• CALCULO DE CUARTILES
• Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En
nuestro caso, como 3N / 4 = 15, resulta
• Q2=(39 + 39) / 2 = 39
Análisis de datos, Estadística descriptiva:
Medidas de posición: EJ. CUARTILES

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Análisis de datos
Estadística
descriptiva:
Gráficos Tabla de frecuencias
Diagrama de sectores circulares
Cualitativa
Diagrama de Barras

Tipo de Variable
Histograma
Polígono de Frecuencias
Cuantitativa Diagrama de Dispersión
Gráfico de caja o Box plot
• Se utiliza para variables cuantitativas continuas.

• En el eje x se muestran los datos de la variable, que por


ser continuos requieren ser agrupados previamente en
intervalos, y en el eje y se representa la frecuencia con la
que aparece cada dato.

• Da una idea muy aproximada de la forma de la


Análisis de datos, distribución que sigue la variable
Estadística
descriptiva:
Histograma
• Utiliza la misma escala que el histograma, y se
construye uniendo los puntos medios de la zona más
alta de los rectángulos .

• También aquí lo más importante es el área existente


debajo del polígono, que es igual al área del histograma
Análisis de datos, correspondiente.
Estadística descriptiva:
Polígono de • En el polígono de frecuencias acumuladas, la línea
frecuencia representa la frecuencia de cada intervalo sumada a la
de los intervalos anteriores
• Una distribución de frecuencia acumulativa nos permite
ver cuantas observaciones se hallan por arriba o por
Análisis de datos, debajo de ciertos valores, en lugar de limitarnos a anotar
Estadística descriptiva: los números de elementos dentro de los intervalos
Ojiva
estadística
• Es un gráfico donde se muestran dos variables cuantitativas,
una en el eje x y otro en el y, mostrando los valores mediante
puntos o símbolos.

• Un diagrama de dispersión puede sugerir varios tipos de


correlaciones, estas pueden ser positiva (aumento), negativa
Análisis de datos,
Estadística descriptiva:
(descenso), o nula (las variables no están correlacionadas). 
Nube de • Uno de los aspectos más poderosos de un gráfico de
puntos dispersión, sin embargo, es su capacidad para mostrar las
relaciones no lineales entre las variables. 
• Un Diagrama de caja es un gráfico, basado en cuartiles,
mediante el cual se visualiza un conjunto de datos. Está
compuesto por un rectángulo, la "caja", y dos brazos, los
"bigotes".
Análisis de datos,
Estadística descriptiva:
Gráfico de caja INTERPRETACIÓN (EJEMPLO)
• La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir
(Box plot) que las edades comprendidas entre el 25% y el 50% de la población está más
dispersa que entre el 50% y el 75%.

• El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por


ello el 25% de los más jóvenes están más concentrados que el 25% de los
mayores.
Análisis de datos
Estadística descriptiva: Gráficos

Tabla de frecuencias
Cualitativa Diagrama de sectores circulares
Diagrama de Barras

Tipo de Variable
Histograma
Polígono de Frecuencias
Cuantitativa Diagrama de Dispersión
Gráfico de caja o Box plot
Análisis de datos
Estadística descriptiva:
Tabla de frecuencias
• El modo más simple de presentar datos categóricos (cualitativos) es por medio de una tabla de
frecuencias. Esta tabla indica el número de unidades de análisis que caen en cada una de las clases
de la variable cualitativa.
El diagrama de barras (o gráfico de barras) es
un gráfico que se utiliza para representar datos
de variables cualitativas o discretas. Está
Análisis de datos formado porbarras rectangulares cuya altura es
Estadística proporcional a la frecuencia de cada uno de los
descriptiva: valores de la variable..
Diagrama de
barras simples
• Un Diagrama de Barras Compuestas se utiliza para
presentar la información contenida en una tabla de doble
entrada; es decir, se utiliza para representar la información
obtenida a partir de la medición de dos variables.

Análisis de datos, Gráfico 6. Clasificación de un grupo de habitantes de la


Estadística descriptiva: ciudad de Mérida según el género y su evaluación sobre la
Diagrama de calidad de la tv venezolana. Venezuela, Agosto, 2004.
Fuente: Instituto Nacional de Estadística.
barras compuestas
140
120
100
80
Masculino
60
Femenino
40
20
0
Mala Regular Buena Excelente

Evaluación
• Es otro método empleado con frecuencia para datos
cualitativos, en el que un círculo representa el total, y
un segmento o porción del pastel es la proporción o
porcentaje de cada categoría de la variable.

Análisis de datos, Estadística • Es el gráfico adecuado para variables con categorías


descriptiva: mutuamente excluyentes (no se puede estar soltero y
Diagrama de casado a la vez).
sectores circulares
• La información que brindan los dos tipos de
gráficos es equivalente, sin embargo, el
gráfico de barras resulta más natural para
comparar las distribuciones de dos grupos,
Análisis de datos, Estadística debido a que nuestro ojo percibe mejor
descriptiva:
diferencias en longitudes que en ángulos.
¿Cuál preferir: gráfico
de barras o de tortas?
• Por otra parte, en el gráfico de barras todas
las barras comienzan al mismo nivel, lo que
facilita la comparación.
Próxima clase
Correlación y análisis de regresoión

También podría gustarte