Está en la página 1de 14

4.

Describir los datos


Presentación y análisis de datos
Diagrama de puntos: Resume la distribución de una variable apilando
puntos en una recta numérica que muestra los valores de la variable. Un
gráfico de puntos muestra todos los valores.
Ejemplo: Número de empleados en cada una de las 142 tiendas de Home Depot en la región sureste de Estados
Unidos
los puntitos son las tiendas 84–>2 tiendas
Gráficas de tallo y hojas: Técnica estadística para presentar un conjunto de
datos. Cada valor numérico se divide en dos partes. El dígito principal se
convierte en el tallo y los dígitos secundarios en las hojas. El tallo se localiza a lo
largo del eje vertical y los valores de las hojas se apilan unos contra otros a lo
largo del eje horizontal.
Ejemplo: Número de espacios publicitarios que compraron los miembros de la Greater Buffalo Automobile Dealers Association

¿Cuál es el número menor de espacios publicitarios comprados? ¿El número máximo de espacios comprados?
no siempre los intervalos van a tener la misma distancia.

OTRAS MEDIDAS DE POSICIÓN


25% • Cuartiles: Valores de un conjunto de datos ordenados (del mínimo al
4
máximo) que dividen los datos en cuatro intervalos. datos/grupos
menor- mayor
• El rango intercuartil es la diferencia entre el tercer cuartil y el primer cuartil
10

10% • Deciles: Valores de un conjunto de datos ordenados (del mínimo al datos/grupos


menor- mayor
máximo) que dividen los datos en 10 partes iguales.
100% • Percentiles: Valores de un conjunto de datos ordenados (del mínimo al
máximo) que dividen los datos en 100 intervalos. 100
datos/grupos
𝑋(1) ,𝑋(2) ,𝑋(3) ...𝑋(𝑛): Ordenar las estadísticas, menor- mayor

𝑋(1) = valor mínimo, 𝑋(𝑛) = valor máximo


Ubicación de un percentil P/4
P/10
𝐿𝑝 = 𝑝 (𝑛 + 1) P/100

donde 0 < p < 1 1 <— 100%

Excel Functions:
Percentil.exc(data, percentile) or Percentile.exc(data, percentile)
Cuartil.exc(data, quartile) or Quartile.exc(data, quartile)
donde 0 < percentil < 1 y quartile = {1, 2, 3}

𝐿𝑝 =𝑛𝑝+(1−𝑝)
Excel Functions:
Percentil.inc(data, percentile) or Percentile.inc(data, percentile)
Percentil(data, percentile) or Percentile(data, percentile)
Cuartil.inc(data, quartile) or Quartile.inc(data, quartile)
Cuartil(data, quartile) or Quartile(data, quartile)
donde 0 < percentile < 1 y quartile = {1, 2, 3}

Si Lp no es entero
Diagrama de caja: Es una representación gráfica que muestra la forma
general de la distribución de una variable. Se basa en cinco estadísticos
descriptivos: el máximo y el mínimo, el primer y el tercer cuartil y la
mediana. 50%
75%
25%
Tiempo de entrega de la pizza
Un dato atípico: Es un punto de datos que está inusualmente alejado
de los demás. Una regla aceptada es clasificar una observación como
atípica si está 1,5 veces el rango intercuartil por encima del tercer
cuartil o por debajo del primer cuartil.

LD > 𝑄3 + 1,5(Q3-Q1)
LI < 𝑄1 - 1,5(Q3-Q1)
SESGO
Formas de las distribuciones: Simétrica, Positivamente sesgada,
Negativamente sesgada y Bimodal.
COEFICIENTE DE SIMETRÍA

Coeficiente de sesgo de Pearson

Coeficiente de sesgo calculado con Software Coeficiente

Excel Function: coeficiente.asimetria(data), skew(data)


Diagrama de dispersión: Técnica gráfica utilizada para mostrar la
relación entre dos variables medidas con escalas de intervalo o de
razón.
Coeficiente de correlación de Pearson (r o R): Mide la fuerza de la
relación lineal entre dos variables. -1 < r < 1.
Función de Excel:
coef.de.correl(variable1, variable2), correl(variable1, variable2)
TABLA DE CONTINGENCIA
Tabla de contingencia: Es una tabla utilizada para clasificar las
observaciones de la muestra según dos características
identificables.
Ejemplo: 50 alumnos en una clase:

Marketing Finanzas

Hombre 10 20

Mujer 5 15

También podría gustarte