Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Básicos y
Estadística Descriptiva
Tema 1. Introducción
Concepto de Estadística
Sus fines son describir al conjunto
de datos obtenidos y tomar
decisiones o realizar
generalizaciones acerca de las
características de todas las
Tema 1. Introducción
observaciones bajo consideración.
Áreas que conforman a la Estadística
Tema 1. Introducción
permitan estudiar los aspectos más
importantes de los datos.
DESCRIBIR
Áreas que conforman a la Estadística
Tema 1. Introducción
información parcial obtenida
mediante técnicas descriptivas.
INFERIR
Áreas de Aplicación de la Estadística
El uso de la Estadística es muy amplio.
Resulta difícil nombrar un área en la cual no
se emplee.
Los métodos estadísticos han encontrado
aplicación en:
Gobierno
Negocios
Tema 1. Introducción
Ciencias Sociales
Ingeniería
Ciencias Física y Naturales
Control de Calidad
Procesos de Manufactura
Muchos otros campos de la actividad intelectual.
Áreas de Aplicación de la Estadística
Tema 1. Introducción
Conceptos de Población y Muestra
Población: es la colección de todas
las posibles mediciones u
observaciones que pueden hacerse
de una variable bajo estudio.
Tema 1. Introducción
Conceptos de Población y Muestra
Se clasifica en dos categorías:
Finita: es aquella que incluye una
cantidad limitada contable de
observaciones, individuos o medidas.
Siempre que sea posible alcanzar
(contar) el número total de todas las
Tema 1. Introducción
posibles mediciones, se considera como
finita la población.
Conceptos de Población y Muestra
Infinita: es aquella que incluye un gran
conjunto de observaciones o
mediciones que no pueden alcanzarse
por conteo. Al menos, hipotéticamente,
no existe límite en cuanto al número de
observaciones que el experimento
Tema 1. Introducción
puede generar.
Conceptos de Población y Muestra
Muestra:
es un conjunto de mediciones u
observaciones tomadas a partir de una
población.
es un subconjunto de la población.
Tema 1. Introducción
Conceptos de Población y Muestra
Muestra aleatoria: se considera
aleatoria siempre y cuando cada
observación, medición o individuo
de la población tenga la misma
probabilidad de ser seleccionado.
Tema 1. Introducción
Tipos de datos y escalas de medida
Variables:
son las características o lo que se
estudia de cada individuo de la
muestra. Ej: sexo, edad, peso,
estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos,
presión, grosor, diámetro, ...
Tema 1. Introducción
Datos:
son los valores que toma la variable en
cada caso.
Tipos de datos
Cualitativos: son datos que solo toman
valores asociados a las cualidades o
atributos, clasificándolos en una de varias
categorías, es decir, no son valores
numéricos. Ej:
Sexo: f/m.
Tema 1. Introducción
Hábito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrón, …
Religión: católica, evangélica, …
Estado civil: soltero, casado, divorciado,…
Tipos de datos
Cuantitativos: provienen de variables que
pueden medirse, cuantificarse o
expresarse numéricamente. Ejemplos:
Peso
Edad
Estatura
Tema 1. Introducción
Presión
Humedad
Intensidad de un sismo
Cantidad de hermanos
TEMA 2. ESTADÍSTICA DESCRIPTIVA
Organización de los datos
La Distribución de Frecuencias:
Se recomienda su uso cuando se tienen
grandes cantidades de datos (n).
A continuación se presentan
las calificaciones de 60
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Histograma
Representación gráfica de los datos
Barras
Barras
Representación gráfica de los datos
Curvas
Representación gráfica de los datos
Sectores, torta o circular
x i
m f i i
X i 1
n
Donde: mi: punto medio de la clase i
fi: frecuencia absoluta de la clase i
k: cantidad de clases
Mediana
Es el valor que ocupa la posición
central de un conjunto de
observaciones, una vez que han
Percentiles
Cuartiles
Q1 Q2 Q3
Cuartiles
39 29 43 52 39
44 40 31 44 35
Cuartil 1
29
n 1
31 Q1 VP( )
33 35 4
29
n 1
31 Q1 VP ( )
35 4
29
31 n 1
Q1 VP ( )
35
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
2-2008
51
Percentiles
1% 1% 1% 1% 1% 1% 1%
2-2008
52
Medidas de dispersión, variación o
variabilidad.
Rango.
Varianza.
Desviación Típica.
Coeficiente de variación.
Medidas de dispersión: Rango
Rango (amplitud o recorrido):
Está determinado por los dos
valores extremos de los datos
agrupados: n
n
i
x 2
2
s
2 i 1
x
n
Medidas de dispersión: Varianza
n
k
i fi
m 2
x
2
s2 i 1
n
Medidas de dispersión: Desviación
Típica
s
CV 100%
x
Medidas de Forma: Asimetría
Permiten estudiar la forma de la
curva, dependiendo de cómo se
agrupan los datos.
k = número de aciertos.
n = número de experimentos.
p = probabilidad de éxito, como por
ejemplo, que salga "cara" al lanzar la
moneda.
1-p = “q”
Ejemplo 1
¿Probabilidad de obtener 6 caras al lanzar una
moneda 10 veces?
El número de aciertos k es 6. Esto es x=6
El número de experimentos n son 10
La probabilidad de éxito p = 0.50
P (k = 6) = 0.205
Es decir, que la probabilidad de obtener 6 caras al
lanzar 10 veces una moneda es de 20.5% .
Distribución hipergeométrica
En estadística la Distribución hipergeométrica es
una distribución de probabilidad discreta
con tres parámetros discretos N, d y n cuya
función de probabilidad es:
Aquí, se refiere al coeficiente binomial, o
al número de combinaciones posibles al
seleccionar b elementos de un total a.
C 4 * 3 C1* 2 C 0
p( x 4 , y 1; n 5 ) 20
25 C 5
( 4845 )( 3 )( 1 ) 14535
0.27357
53130 53130
REGRESION LINEAL SIMPLE
Una de las aplicaciones mas
importantes de la estadística implica
la estimación del valor medio de una
variable de respuesta y o la
predicción de algún valor futuro de y
con base el conocimiento de un
conjunto de variables
independientes relacionadas, x1,
x2, . . . xk.
Los modelos que se emplean para
relacionar una variable dependiente y
con las variables independientes x1,
x2, . . . xk se denominan modelos de
regresión o modelos estadísticos
lineales porque expresan el valor medio
de y para valores dados de x1, x2, . . .
xk como una función lineal de un
conjunto de parámetros desconocidos.
Los conceptos de análisis de
regresión se presentan empleando
un modelo de regresión muy
sencillo, uno que relaciona y con
una sola variable x. Aprenderemos
a ajustar este modelo a un
conjunto de datos mediante el
método de los mínimos cuadrados
Un tipo de modelo probabilístico, el
modelo de regresión lineal simple,
supone que el valor medio de y
para un valor dado de x se grafica
como una línea recta y que los
puntos se desvían de esta línea de
medias en una cantidad aleatoria
(positiva o negativa) igual a
Modelo de regresión lineal simple
(probabilístico)
Si queremos ajustar un
modelo de regresión lineal
simple a un conjunto de datos,
debemos encontrar
estimadores para los
parámetros desconocidos, 0 y
1.
Ejercicio:
Con esta información encontrar la
ecuación de la línea recta E(y)=?
Embarque 1 2 3 4 5 6 7 8 9 10
Distancia
825 215 1070550 480 920 1350 325 670 1215
(km) x
Tiempo
3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0
(dias) y
X Y XY X2 Y2
1 825 3.5 2287.5 680625 12.25
2 215 1.0 215.0 46225 1.00
3 1070 4.0 4280.0 1144900 16.00
4 550 2.0 1100.0 302500 4.00
5 480 1.0 480.0 230400 1.00
6 920 3.0 2760.0 846400 9.00
7 1350 4.5 6075.0 1822500 20.25
8 325 1.5 487.5 105625 2.25
9 670 3.0 2010.0 448900 9.00
10 1215 5.0 6075.0 1476225 25.00
7620 28.5 26370 7104300 99.75
ˆ1
SS xy
XY n x y 26370 10(762)(2.85)
X n x 7104300 10(762)
2 2
SS xx 2 ˆ1
SS xy
SS xx
XY n x y 26370 10 (762 )(2.85)
X nx
2 2
7104300 10( 762 )
2
ˆ1 0.0036
ˆ0 y ˆ1 x
2.85
ˆ
ˆ
0.0036( 762) 0.11
yˆ 0 1 x 0.11 0.0036 x