Está en la página 1de 31

Estadística

Conceptos básicos - Manejo inicial de datos

ESPOL 2020- TÉRMINO I JOFFRE SÁNCHEZ CERÓN


CONCEPTOS BÁSICOS
Datos
Cantidad n de mediciones no procesadas, cuantitativas o cualitativas.

Información
Conjunto de datos procesados que nos permiten tomar decisiones
racionales.

“La respuesta a la pregunta planteada”


Goldratt
CONCEPTOS BÁSICOS

Población objetivo (N)


Conjunto bien definido de elementos que son objeto de medición

Unidades de investigación
Elementos de la Población Objetivo a los que se les efectúa las
medidas bajo análisis.

Muestra
Subconjunto de n unidades de investigación tomadas de la población
objetivo. n < N

Observación
Cada uno de los valores incluidos en la Muestra.
CONCEPTOS BÁSICOS
Parámetros

Población
Parámetro
Es una cantidad numérica calculada a partir de los
elementos de una población.

Estimador o estadístico: Muestra


Es una cantidad numérica calculada a partir de
S
los elementos de una muestra.

Estimadores
CONCEPTOS BÁSICOS

Caracterización de una muestra

Conjunto 𝑿𝟏 , 𝑿𝟐 , … 𝑿𝒏

Vectorial 𝑿𝑻 = 𝑿𝟏 𝑿𝟐 … 𝑿𝒏

Matricial

Variables
𝑿𝟏𝟏 𝑿𝟏𝟐 ⋯ 𝑿𝟏𝒌
Unidades de Investigación ⋮ ⋱ ⋮
𝑿𝒏𝟏 𝑿𝒏𝟐 ⋯ 𝑿𝒏𝒌
CONCEPTOS BÁSICOS - VARIABLES

Unidad de investigación
- Mediciones (Variables)
- Cuantitativas
- Discretas
- Continuas
- Cualitativas
- Nominales
- Ordinales
CONCEPTOS BÁSICOS - VARIABLES

Variables Cuantitativas
Contienen valores numéricos

Discretas
Si toman valores puntuales. Ej. Número de hijos, número de veces
que falla el suministro de energía por mes.

Continuas
Si entre dos valores, son posibles infinitos valores intermedios. Ej.
Tiempo que tarda el dar mantenimiento a una máquina, Edad.
CONCEPTOS BÁSICOS - VARIABLES

Variables Cualitativas
Si sus resultados (modalidades) no se pueden asociar naturalmente a un
número.

Nominales
Si sus valores no se pueden ordenar. Ej. Género, Grupo Sanguíneo,
Religión, Nacionalidad.

Ordinales
Si sus valores se pueden ordenar. Ej. Mejoría a un tratamiento, Grado
de satisfacción.
CONCEPTOS BÁSICOS – ESTADÍSTICOS

Estadísticos de Orden

Ordenar la muestra 𝑿 𝒊

𝑿 𝟏 = 𝒎í𝒏 𝑿𝟏 , 𝑿𝟐 , … 𝑿𝒏

𝑿 𝒏 = 𝒎á𝒙 𝑿𝟏 , 𝑿𝟐 , … 𝑿𝒏
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Media Aritmética - Promedio
Suma de los valores de todos los datos dividido entre la cantidad de
datos 𝒏
𝑿 𝒊
𝒙=
𝒏
𝒊
Mediana
Valor para el cual el 50% de los datos son menores o iguales al mismo;
valor ubicado en el punto medio una vez que se han ordenado los datos.
(Cuartil 2)
Mín Máx
𝒙
Moda
Elemento observado que más se repite
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Medidas de dispersión
Varianza Muestral
Medida de dispersión de una variable X con respecto a su media aritmética
𝒏
𝒙𝒊 − 𝒙 𝟐
𝒔𝟐 =
𝒏−𝟏
𝒊=𝟏

Desviación estándar
𝒏
𝒙𝒊 − 𝒙 𝟐
𝒔=
𝒏−𝟏
𝒊=𝟏

Rango Muestral
Diferencia entre el máximo valor y el mínimo valor de la muestra
𝑹 = 𝑿(𝒏) − 𝑿(𝟏)
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Regla Empírica

68%
95%
99.7%
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Cuantiles - Cuartiles
Primer Cuartil Q1
Valor de X tal que no más del 25% de los datos son menores al mismo

Segundo Cuartil Q2- Mediana


Valor de X tal que no más del 50% de los datos son menores al mismo

Tercer Cuartil Q3
Valor de X tal que no más del 75% de los datos son menores al mismo
Rango Intercuartil RI
Diferencia entre el tercer cuartil y el primero

Valores Aberrantes
Valores ubicados 1.5RI del Q1 y del Q3
Diagrama de Cajas Múltiple
Calificaciones sobre 50 puntos otros
Median; Box: 25%-75%; Whisker: Non-Outlier Range
60 Note que los paralelos de
metodología tradicional
50 (12 -14), tienen las
medianas más bajas (24
– 27) respectivamente y
40
la distancia entre los
cuartiles 1 y 3 (caja) es
30 amplia; ocurre todo lo
contrario en los cursos
con nueva metodología
20
(11-13), es decir
medianas similares (34-
10 35) y caja más estrecha.

0
Median
25%-75%
-10 Non-Outlier Range
P11 OTROS P13 OTROS Outliers
P12 OTROS P14 OTROS Extremes
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Medidas Bi-variadas
Coeficiente de Variación
Si se tiene dos variables dentro del mismo conjunto de individuos pero con
diferente escala de medida usamos para comparar su dispersión relativa
𝒔
𝑽=
𝒙

Covarianza
Medida del grado de variación conjunta de dos variables aleatorias
𝒏
𝟏
𝑺𝒙𝒚 = (𝒙𝒊 − 𝒙)(𝒚𝒊 − 𝒚)
𝒏−𝟏
𝒊=𝟏
CONCEPTOS BÁSICOS – ESTADÍSTICOS
Medidas Bi-variadas
Coeficiente de Correlación Lineal
Medida de la “fuerza” de la relación lineal entre 2 variables

𝑺𝒙𝒚
𝒓= ; −𝟏 < 𝒓 < 𝟏
𝑺𝒙 𝑺𝒚
CONCEPTOS BÁSICOS – ESTADÍSTICOS
KURTOSIS SESGO

>3

<3

=3
ESTADÍSTICA – MANEJO INICIAL DE DATOS

¿Qué contiene la muestra?

¿Qué debo hacer para obtener información?


ESTADÍSTICA – MANEJO INICIAL DE DATOS

1. Ordenar los datos

2.Tabular los datos ordenados

3. Graficar los datos ordenados

4. Calcular a partir de la muestra medidas de


interés para la toma de decisiones.
ESTADÍSTICA – MANEJO INICIAL DE DATOS
Tabulando Datos

Clase Marca de clase

Frecuencia Frecuencia Absoluta


Absoluta Acumulada

Frecuencia Frecuencia Relativa


Relativa Acumulada
ESTADÍSTICA – MANEJO INICIAL DE DATOS
Tabulando Datos
Marca de Frecuencia Frecuencia Frecuencia Frecuencia relativa
Ordinal Clase
clase (mi) Absoluta (fi) Acumulada relativa acumulada

1 [a1,a2) (a1+a2)/2 f1 F1=f1 f1/n F1/n


2 [a2,a3) (a2+a3)/2 f2 F2=f1+f2 f2/n F2/n
3 [a3,a4) (a3+a4)/2 f3 F3=f1+f2+f3 f3/n F3/n

K [ak,ak+1) (ak+ak+1)/2 fk Fk=n fk/n Fk/n=1

Cantidad de clases recomendadas (k) 6 - 10


Ancho de clase = Rango/ k
ESTADÍSTICA – MANEJO INICIAL DE DATOS

Calculando estadísticos de datos agrupados

𝒌 𝒎𝒊
𝒇𝒊 𝒎𝒊
Media 𝒙=
𝒏
𝒊

𝒌
𝟐
𝒇𝒊 𝒎𝒊 − 𝒙
Varianza 𝒔𝟐 =
𝒏−𝟏
𝒊=𝟏
ESTADÍSTICA – MANEJO INICIAL DE DATOS

Calculando estadísticos de datos agrupados


Mediana Moda

𝒏 𝒇𝒊 − 𝒇𝒊−𝟏
− 𝑭𝒊−𝟏 𝑴𝒐 = 𝑳𝒊 + ∗ 𝒂𝒊
𝟐 𝒇𝒊 − 𝒇𝒊−𝟏 + (𝒇𝒊 − 𝒇𝒊+𝟏 )
𝑿 = 𝑳𝒊 + ∗ 𝒂𝒊
𝒇𝒊

Li: Límite inferior del intervalo que contiene a la mediana Li: Límite inferior del intervalo que contiene a la moda
n: Cantidad de datos fi: Frecuencia absoluta del intervalo modal
Fi-1: Frecuencia acumulada del intervalo anterior ai: ancho del intervalo
fi: Frecuencia absoluta del intervalo mediano
ai: ancho del intervalo
ESTADÍSTICA – MANEJO INICIAL DE DATOS
GRÁFICOS - HISTOGRAMA
El histograma en un gráfico bidimensional en cuyo eje de las X se encuentran las clases y en el
eje Y las frecuencias relativas o absolutas.
ESTADÍSTICA – MANEJO INICIAL DE DATOS
GRÁFICOS – POLÍGONO DE FRECUENCIAS
El Polígono es un gráfico bidimensional en cuyo eje X se encuentran las marcas de clase y
en el eje Y las frecuencias relativas o absolutas.

33
ESTADÍSTICA – MANEJO INICIAL DE DATOS
GRÁFICOS – OJIVAS
Es un gráfico que presenta en el eje horizontal las marcas de clase de la característica
cuantitativa que se está investigando y en el eje vertical la frecuencia relativa acumulada .
ESTADÍSTICA – MANEJO INICIAL DE DATOS
OTROS GRÁFICOS – DISPERSIÓN
Se realiza para visualizar la relación entre dos variables, dependiendo de la forma que toma
la “nube” de datos.
ESTADÍSTICA – MANEJO INICIAL DE DATOS
OTROS GRÁFICOS – SERIES TEMPORALES
ESTADÍSTICA – MANEJO INICIAL DE DATOS
OTROS GRÁFICOS – BARRAS

El gráfico de barras contiene en el eje


de las X las categorías de la variable y
en el eje Y las frecuencias absolutas.
ESTADÍSTICA – MANEJO INICIAL DE DATOS
OTROS GRÁFICOS – PASTEL

Gráfico circular cuya área se divide en


sectores que representan los resultados
porcentuales para una variable que
generalmente puede ser cualitativa.
ESTADÍSTICA – MANEJO INICIAL DE DATOS
OTROS GRÁFICOS

También podría gustarte