Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Internacional
Bienvenido (a):
Trminos iniciales.
Medidas de tendencia central y dispersin
con datos no agrupados.
Medidas de tendencia central y dispersin
con datos agrupados.
Probabilidad.
Distribucin normal.
Regresin lineal.
Trminos iniciales
En este Material de formacin, se introducirn
conceptos bsicos de la estadstica que permitirn
analizar los datos recolectados hasta ahora.
Ejemplos:
Observaciones:
1. Las herramientas anteriores son denominadas
medidas de tendencia central debido a que buscan
donde se concentran los datos.
2. Como la mediana seala el centro de la distribucin y la
media su promedio, es interesante notar que:
Frecuencia Frecuencia
Datos
Absoluta (fi) Relativa(hi)
Brasil 14 28%
Vietnam 10 20%
Colombia 12 24%
Indonesia 11 22%
Per 3 6%
50 100%
Grficos tabla de frecuencias
La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia absoluta de
cada dato.
Histograma de frecuencias sobre la
procedencia del caf de Alemania
16
14
12
10
8
6
4
2
0
Brasil Vietnam Colombia Indonesia Per
Vietnam
Colombi 20%
a
24%
18 21 18 22 15
21 19 24 18 30
15 18 20 19 21
24 20 21 20 22
19 15 18 21 24
19 30 21 20 19
22 21 15 20 18
18 22 24 19 24
19 24 19 18 20
20 19 19 20 21
Lo primero que se debe hacer, es realizar un listado
ordenado de los datos sin repeticiones.
15 18 19 20 21 22 24 30
Frecuencia Frecuencia
Frecuencia Frecuencia Absoluta Relativa
Datos(xi)
Absoluta (fi) Relativa(hi) Acumulada Acumulada
(Fi) (Hi)
15 4 8% 4 8%
18 8 16% 12 24%
19 10 20% 22 44%
20 8 16% 30 60%
21 8 16% 38 76%
22 4 8% 42 84%
24 6 12% 48 96%
30 2 4% 50 100%
50 100%
Grficos tabla de frecuencias
La primera grfica que se puede deducir, se llama
histograma de frecuencias en la que en el eje x, se
colocan los datos y en el eje y, la frecuencia
absoluta de cada dato.
Histograma de frecuencias sobre la
edad inicial para el consumo de caf
12
10
8
6
4
2
0
15 18 19 20 21 22 24 30
Nota: en cualquiera de los paquetes bsicos de
office, se puede encontrar en insertar -grfico -
columna.
Otro grfico til es el diagrama circular en el cual se
grafica la frecuencia relativa, este coloca en proporcin
los ngulos del crculo con los pesos porcentuales de los
datos. La frmula para esto es multiplicar la frecuencia
relativa por 360.
30 15
24 4% 8%
12%
18
16%
22
8%
21
16% 19
20%
20
16%
Frecuenci Frecuenci
Frecuenci Frecuenci Marca de
a Absoluta a Relativa
Intervalos a Absoluta a Relativa clase
Acumulad Acumulad
(fi) (hi) (yi)
a (Fi) a (Hi)
0-1 3 6% 3 6% 0.5
1.01 - 2 8 16% 11 22% 1.5
2.01 - 3 18 36% 29 58% 2.5
3.01 - 4 13 26% 42 84% 3.5
4.01 - 5 8 16% 50 100% 4.5
50 100%
15
10
0
0-1 1.01 - 2 2.01 - 3 3.01 - 4 4.01 - 5
Nota: en cualquiera de los paquetes bsicos de
office, se puede encontrar en insertar -grfico -
columna.
Otro grfico til es el diagrama circular en el cual se
grafica la frecuencia relativa, este se coloca en
proporcin los ngulo del crculo con los pesos
porcentuales de los datos. La frmula para esto es
multiplicar la frecuencia relativa por 360.
0-1
4.01 - 5 6%
16% 1.01 - 2
16%
3.01 - 4
26%
2.01 - 3
36%
Media:
Recordar que es la suma de todos los datos dividido por
n.
Para calcular la suma de todos los datos en la tabla, se
debe naturalmente sumar las multiplicaciones de cada
dato por su frecuencia.
Como en la tabla de frecuencias de la variable continua,
no existen los datos de manera individual sino intervalos.
Se toma un representante de cada uno, el cual se
estableci en la marca de clase.
Se interpreta que en promedio los alemanes
consumen 2.8 kg de caf al ao.
Moda:
La moda es el dato que ms se repite, debido a que
para su clculo, se observa el intervalo con mayor
frecuencia y se toma el representante llamado marca
de clase.
En el ejemplo la mayor frecuencia, est en el tercer
intervalo [2.01 - 3] y su marca de clase es 2.5, por lo
cual:
Medidas de dispersin
Desviacin estndar:
Recordar que esta medida representa la dispersin de
los datos con respecto a la media.
La frmula para calcularla es idntica a la de los datos
no agrupados, recordar:
Respuesta pregunta 1:
Si llamamos R al evento que una empresa responda una
encuesta va e-mail, entonces:
Comprobar que:
Regla de la probabilidad conjunta
Se utiliza cuando se quiere que ocurran dos eventos a la
vez.
Cuando los eventos estn relacionados y se conoce la
probabilidad condicional, la frmula est dada por: