Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Formulario de EstadIstica BACH
Formulario de EstadIstica BACH
FORMULARIO DE ESTADSTICA
Conceptos bsicos
Poblacin: conjunto de todos los elementos objeto de nuestro estudio
Muestra: subconjunto, extrado de la poblacin,(mediante tcnicas de muestreo) cuyo estudio sirve
para inferir caractersticas de toda la poblacin
Individuo: cada uno de los elementos que forman la poblacin o la muestra
Variable estadstica: caracterstica objeto de estudio
- Discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar
- Continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores
Notaciones y frecuencias:
Variables discretas
X : x1 ,..., xk con frecuencias f1 ,..., fk
fi = nmero de veces que aparece el dato xi frecuencia absoluta de xi
N = nmero total de datos
Fi = f j frecuencia absoluta acumulada de xi
j i
fi
frecuencia relativa de xi
N
H i = h j frecuencia relativa acumulada de xi
hi =
j i
Variables continuas
X : I1,..., I k (intervalos)
xi = punto medio del intervalo I i marca de clase de I i
Tablas de frecuencias:
xi
Grficos estadsticos
Diagrama de barras o columnas
Cipri
fi
Fi
hi
Hi
Diagrama de sectores
Departamento de Matemticas
Histogramas
Polgonos de frecuencias
Diagrama de dispersin
x j -1 + x j
n
< Fj Me =
2
2
Fj -1 <
n
< Fj Me = x j
2
Datos agrupados:
Fj =
n
Me = x j
2
n
- Fj -1
n
2
Fj -1 < < Fj Me = x j -1 +
(x j - x j -1 )
fj
2
Formulario de Estadstica
Moda:
Valor ms frecuente de la variable.
Interpretacin: anlisis de los datos
Supongamos que estamos estudiando el nmero de vuelos semanales que realizan 10
pilotos. Los datos obtenidos son los siguientes:
N de vuelos
0
1
2
3
Frecuencia absoluta
2
4
3
1
La media es 1,3, y nos indica, que por trmino medio, el nmero de vuelos es de 1,3, es
decir, que por trmino medio estos pilotos vuelan entre 1 y 2 veces por semana.
La moda es 1, lo que nos indica que lo ms frecuente es que vuelen 2 veces por
semana.
Y por ltimo, la mediana es 1, lo que nos dice que hay tantos pilotos que vuelan 1 o
ms veces, como pilotos que lo hacen 1 vez o menos.
Datos agrupados:
Fj -1 =
xj 1 + xj
r
n < Fj pr / k = k
2
Fj =
Fj -1 <
r
n < Fj pr / k = x j
k
r
n - Fj -1
r
Fj -1 < n < Fj pr / k = x j -1 + k
( x j - x j -1 )
k
fj
r
n pr / k = x j
k
Departamento de Matemticas
Medidas de dispersin:
Varianza:
f (x
=
i
-x
) s = f x
2
2
i i
- x2
Desviacin tpica:
s =+ s2
[5,10 )
[10,15 )
[15, 20 )
[20,25 )
[25, 30 ]
xi
2,5
7,5
12,5
17,5
fi
3
10
25
38
22,5
16
27,5
Total
100
En este caso el rango es 30, y por tanto, no nos proporciona ninguna informacin.
La varianza es s 2 = 33, 79 y la desviacin tpica es s = 5,81, que son relativamente
grandes, lo que nos dice que los datos presentan una agrupacin relativamente pequea
respecto de la media.
Coeficiente de variacin: (Se utiliza para comparar distribuciones)
s
CV =
x
Si CVX < CVY entonces la distribucin de X es ms homognea que la de Y
Si CV = 0 s = 0 x tiene mxima representatividad
Si x < s x no tiene representatividad alguna
Interpretacin: anlisis de los datos
Vamos a comparar las siguientes distribuciones de datos:
7
3
2
8
0
3
2
5
6
2
2
4
6
3
1
4
9
5
4
5
5
8
4
0
6
1
1
7
9
4
8
0
1
2
3
6
2
3
5
5
1
4
0
7
2
5
1
5
4
3
Formulario de Estadstica
Rectas de regresin:
Determina la estructura de dependencia (en nuestro caso una recta) que mejor expresa el tipo de
relacin entre las variables.
s ( X ,Y )
1) de Y / X : y - y = 2 ( x - x )
s X
s ( X ,Y )
2) de X / Y : x - x = 2 ( y - y )
s Y
ndices de correlacin:
Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables estadsticas
distintas, con el fin de ver si existe alguna relacin entre ellas, es decir, si los cambios en una de
ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables estn
correlacionadas o bien que hay correlacin entre ellas.
1) Razn de correlacin: r =
2
s (2X ,Y )
s 2X s Y2
s (X ,Y )
s X sY
Cipri
Departamento de Matemticas
Solucin:
Disponemos los clculos de la siguiente forma:
(Accidentes) Vehculos
xi
yi
15
5
18
7
10
2
8
1
20
9
24
71
x
x=
N
2
y
24
=
= 4,8 ;
5
y
=
2
i
-y =
y
y=
xi2
25
49
4
1
81
160
yi2
225
324
100
64
400
1113
71
=
= 14,2 ;
5
1113
- 14, 2 2 = 20, 96 ; s xy =
5
y-y=
s xy
s x2
x
=
x y
i i
2
x
xiyi
75
126
20
8
180
409
2
i
-x =
- x.y =
s xy
s x s y
160
- 4,8 2 = 8, 96
5
409
- 4, 8.14, 2 =13,64
5
13, 64
= 0, 996
8, 96. 20,96
(x - x)
13,64
( x - 4,8) ; y - 14,2 = 1,53( x - 4,8)
8,96
Para x = 6, y - 14,2 = 1,53(6 - 4,8) , es decir, y = 16,04. Podemos suponer que ayer
circulaban 16 vehculos por la autopista a ms de 120 kms/h.
c) La prediccin hecha es buena ya que el coeficiente de correlacin est muy prximo a 1.
y - 14, 2 =
Formulario de Estadstica