Documentos de Académico
Documentos de Profesional
Documentos de Cultura
..
..
..
..
ertyuiopasdfghjklzxcvbnmqwert
.
yuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklz
xcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwer
tyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopa
sdfghjklzxcvbnmqwertyuiopasdf
ghjklzxcvbnmqwertyuiopasdfghj
klzxcvbnmqwertyuiopasdfghjklz
xcvbnmrtyuiopasdfghjklzxcvbnm
qwertyuiopasdfghjklzxcvbnmqw
ertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyui
APUNTES
PROBABILIDAD Y ESTADSTICA
ESIME ZACANTENCO
..
..
..
..
.
BIENVENIDA
..
..
..
..
.
Introduccin
Todas las disciplinas del saber humano que sistematizan su actuar est
influenciado por el azar, siendo como lo es la vida misma azarosa el
estudio y comprensin del pensamiento probabilstico es fundamental
para poder predecir con mayor certeza las consecuencias de los
diferentes actuares en la vida.
En este sentido desde que el humano encontr que en los juegos de azar
exista una relacin de los casos favorables entre los casos posibles, se
dio a la tarea de construir toda una teora que le permitiera predecir.
A partir de este momento el desarrollo de las teoras probabilsticas y de
las tcnicas estadsticas para asirse del comportamiento de las variables
empez a contar con mltiples tablas de frecuencia y con ello comprendi
la importancia de la informacin que arrojaba la media y la desviacin
estndar y la varianza.
As crece y se desarrollan las distribuciones probabilsticas ya sean de
variables aleatoria discretas y las variables aleatorias continuas.
Surgen entonces con fuerza acadmica
importante los estudios
empricos que dan origen a los muestreos paramtricos y no
paramtricos.
Ya partir de ellos, una vez que se comprendi la esencia misma de la
empria surgen La distribucin de probabilidad binomial, Poisson,
normal, exponencial y toda una constelacin con que podemos analizar
todos los comportamientos azarosos de la vida en todas sus
manifestaciones.
He aqu , un material que conjuga la teora con la practica esperando que
con ella se podr comprender mejor lo que es y para que sirve la
Estadstica y la probabilidad.
..
..
..
..
.
Objetivo general
El alumno resolver problemas terico prcticos que involucren
fenmenos probabilsticos.
Objetivos particulares
..
..
..
.. DESCRIPTIVA Y MUESTREO
ESTADSTICA
.
ndice
1.1.-
1. 2.-
11
11
11
11
11
11
11
12
12
14
1. 4.-
9
10
10
Tabla de Frecuencia
1.2.1 Definicin de tabla de frecuencia
1. 2.2 Frecuencias Acumuladas
1. 2.3 Frecuencias Relativas
1.2.4 .Escala ordinal
1. 2.5.- Escala nominal
1.2.5 Determinacin del tamao de la muestra
1.2.6.- Determinacin del nmero de intervalos
1.2.7.- Definicin de lmite superior e inferior
1.2.8.- Ejemplos
1. 2.9 Ejercicios
1. 3.-
7
7
7
7
8
8
8
9
9
15
16
16
17
17
19
19
19
19
20
21
21
..
..
..
.. 1.4.8.- Cuartiles
. 1. 4.9 .- Porcentiles
1. 4.10.- Varianza
1.4.11.- Desviacin estndar
1.4.12.- Coeficiente de variacin
1.4.13.- Clculo de datos agrupados
2.-
21
21
21
22
22
22
Probabilidad clsica
2.1.. Teora de conjuntos
2.1.1.- Un poco de historia
2.1.2.- Nociones de conjuntos
2.1.3.- Igualdad de conjuntos
2.1.4.- Unin
2.1.5.- Interseccin
2.1.6.- Complemento
2.1.7.- Diferencia
2.1.8.- Conjunto vaco
2.1.9.- Conjunto universal
2.1.10- Ejemplos
2.1.11.- Producto cartesiano
2.1.12.- Conjunto potencia
2.1.13.- Ejemplos
2.1.14.- Simbologa
24
24
25
25
26
26
27
27
28
28
29
30
30
33
..
..
..
..
.
Introduccin
Esta Modulo I est diseado para que el alumno comprenda los fundamentos y
aplicaciones de la Estadstica descriptiva. Se abordarn los temas en dos
vertientes; la primera a partir de los fundamentos tericos y aplicaciones y la
segunda mediante un Muestreo por encuestas.
Al tomar una cantidad de elementos de una poblacin para poder contar con
criterios de decisin, estamos tomando una muestra de ella.
Del tamao de la poblacin (N) se pueden extraer varias muestras. Un cierto
estadstico puede ser calculado para cada una de las muestras posibles
extradas de la poblacin. Una distribucin del estadstico obtenida de esta
manera es llamada la distribucin del estadstico.
En estadstica un muestreo es la tcnica para la seleccin de una muestra a
partir de una poblacin.
a).- Terminologa para el muestreo
Los trminos usados en inferencia estadstica son:
Estadstico: medida usada para describir alguna caracterstica de una muestra
(media aritmtica, mediana. desviacin estndar)
Parmetro: representacin del estadstico.
b).- Los smbolos usados para representar los estadsticos y los parmetros;
Medida
Smbolo para el
estadstico
Media
Desviacin estndar
Nmero de
..
..
..
..
.
elementos
Proporcin
Al elegir una muestra buscamos encontrar sus propiedades las que al ser
extrapolables a la poblacin nos permitan obtener resultados similares a los
que se obtendran de realizase un estudio de toda la poblacin.
En el muestreo el tamao de la muestra es ms pequeo que el tamao de la
poblacin por lo que se puede extraer dos o ms muestras de sta.. Al
conjunto de muestras que se pueden obtener de la poblacin se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de
extraccin, sigue la llamada distribucin muestral
c).- Error Estndar: La desviacin estndar de una distribucin, en el
muestreo de un estadstico, es el error estndar del estadstico.
De esta forma, la desviacin estndar de las medias de todas la muestras
posibles del mismo tamao, extradas de una poblacin, es llamada el error
estndar de la media.
d).- Error muestral o error de muestreo: La diferencia entre el resultado
obtenido de una muestra y el resultado que deberamos de obtener de la
poblacin se llama el error muestral o error de muestreo. Un error de muestreo
ocurre cuando no se lleva a cabo la encuesta completa de la poblacin, sino
que se toma una muestra de ella para estimar sus caractersticas.
El error muestral es medido por el error estadstico, en trminos de
probabilidad, bajo la curva normal. El resultado de la media indica la precisin
de la estimacin de la poblacin basada en el estudio de la muestra. Mientras
ms pequeo sea el error muestral, mayor es la precisin de la estimacin.
e).- Mtodos de seleccin de muestras.
Una muestra debe ser representativa si va a ser usada para estimar las
caractersticas de la poblacin. Los mtodos para seleccionar una muestra
representativa son numerosos, dependiendo del tiempo, dinero y habilidad
disponibles para tomar una muestra y la naturaleza de los elementos
individuales de la poblacin.
..
..
..
.
Mtodos de.. muestreo clasificados
tomadas de una poblacin.
..
..
..
.
tamao de ..la muestra. El nmero de elementos en la poblacin es, primero,
dividido por el nmero deseado en la muestra. El cociente indicar si cada
dcimo, cada onceavo, o cada centsimo elemento en la poblacin va a ser
seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemtica puede dar la misma precisin de estimacin acerca de la
poblacin, que una muestra aleatoria simple cuando los elementos en la
poblacin estn ordenados al azar.
C. Muestreo Estratificado. Para obtener una muestra aleatoria estratificada,
primero se divide la poblacin en grupos, llamados estratos, que son ms
homogneos que la poblacin como un todo. Los elementos de la muestra son
entonces seleccionados al azar o por un mtodo sistemtico de cada estrato.
Las estimaciones de la poblacin, basadas en la muestra estratificada,
usualmente tienen mayor precisin (o menor error muestral) que si la poblacin
entera muestreada mediante muestreo aleatorio simple. El nmero de
elementos seleccionado de cada estrato puede ser proporcional o no
proporcional al tamao del estrato en relacin con la poblacin.
D. Muestreo de conglomerados. Para obtener una muestra de
conglomerados, primero dividir la poblacin en grupos que son convenientes
para el muestreo. En seguida, seleccionar una porcin de los grupos al azar o
por un mtodo sistemtico. Finalmente, tomar todos los elementos o parte de
ellos al azar o por un mtodo sistemtico de los grupos seleccionados para
obtener una muestra. Bajo este mtodo, aunque no todos los grupos son
muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por
lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisin de las estimaciones acerca de la poblacin)
que una muestra aleatoria simple del mismo tamao. Los elementos
individuales dentro de cada "conglomerado" tienden usualmente a ser iguales.
10
..
..
..
..
.
11
..
..
..
.. el nmero de intervalos de clase disminuye,
A medida que
.
la informacin es
menos precisa pero su tratamiento analtico es mayor. El nmero de intervalos
se sugiere que sea entre 5 y 15 dependiendo de las necesidades de
investigador.
1.2.7- Definicin Lmite superior e inferior: son los existentes en un intervalo de
clase
< lmite inferior, lmite superior >.
1.2.8.- Ejemplos
Para elaborar este tipo de tabla se van sumando las frecuencias de cada una
de los intervalos de clase. Su utilidad consiste en que podemos conocer el
comportamiento del proceso estadstico de los intervalos de clase con respecto
a la primera variable..
En los intervalos de clase, por ejemplo < 13 a 15 > Edad en que entr a
trabajar el 13 representa el lmite inferior y el 15 el lmite superior.
En este cuadro el investigador organiz su informacin en 7 intervalos de clase
sacrificando precisin en la informacin pero gan claridad analtica en ella.
Cuadro 1
Edad a que entr a Trabajar el
trabajador
Edad
Frecuencia
9 12
72
13 - 15
153
16 17
190
18 20
313
21 25
45
26 en adelante
9
No contest
30
Total
812
Al analizar los datos vemos que estn agrupados por intervalos de clase
ordinal, de conformidad con la necesidad que el investigador tiene de conocer
parmetros que le permitan inferir acerca del trabajo infantil < 9 a 12 >, de la
pubertad (13 a 15 ), de la adolescencia (18 a 20 ) y la juventud <21 a 25 >
teniendo un intervalo mixto <26 en adelante> y uno nominal <no contest>.
Tabla de frecuencia acumulada
12
..
..
..
.. una tabla de frecuencia acumulada del cuadro 1 se van
Para elaborar
.
sumando las frecuencias de cada uno de los intervalos. Ah la utilidad para el
investigador consiste en que puede conocer en cada uno de los intervalos el
comportamiento total. Detecta en particular que 225 trabajadores se iniciaron
en el trabajo asalariado entre los 9 y 15 aos de edad.
Cuadro 2
Edad de inicio laboral del asalariado
Clase
9 12
9 - 15
9 17
9 20
9 25
9 26 en adelante
No contest
Total
Frecuencia Acumulada
72
225
415
728
773
782
782
13
..
..
..
..
.
1.2.9.- Ejercicios
1.- Qu utilidad tendra utilizar la frecuencia acumulada en los cuadros 4,5 y 6
2.- Qu utilidad tendra utilizar la frecuencia relativa en los cuadros 4,5,y 6 ?.
3.- Qu ventajas tiene el utilizar frecuencias de amplitud total en los cuadros
4,5 y 6 ?
4.- Tiene sentido la frecuencia de amplitud total en los cuadros 4,5 y 6?
Cuadro
4
Tamao de la muestra 812
Edad
Edad
Frecuencia
0 17
12
18 20
60
21 25
143
26 30
171
31 - 35
148
36 40
137
41 45
61
46 - 50
52
51 - 55
21
55 o ms
5
No contest
2
Total
812
Cuadro 5
Tamao de la Muestra 812
Sexo
Frecuencia
Masculino
712
Femenino
67
No Contest
33
Total
812
14
..
..
..
..
.
Cuadro 6
Tamao de la Muestra 812
Estado Civil
Frecuencia
Soltero
206
Casado
544
Viudo
13
Divorciado
15
Unin Libre
28
No Contest
6
Total
812
15
..
..
..
..
.
16
..
..
..
.. de
1.3.4.- Grfica
.
conos
17
..
..
..
.. 7
Cuadro
.
Salario Semanal
Clase
Frecuencia
Hasta $ 125
31
$126 $ 250
194
$251 $ 375
224
$376 $500
123
$510 ms
240
No contest
0
Total
812
Nota
La presentacin de los intervalos de clase en el salario semanal esta dada en
combinacin ordinal y nominal < hasta 125 >, < 501 ms >.
En el polgono de frecuencia podemos deducir que la mayor concentracin de
los trabajadores se localiza en los niveles salariales de 4 salarios mnimos
ms.
Adems de peso de los trabajadores que perciben hasta un salarios mnimo
prcticamente inexistente.
Cuadro 8
Antigedad
Aos
Frecuencia
0 1
143
2 5
290
6 10
183
11 15
86
16 20
56
21 25
35
26 29
12
300 ms
7
Total
812
18
..
..
..
.. de tendencia central
1.4.- Medidas
.
Las medidas de ubicacin proporcionan informacin sobre el lugar hacia donde
existe la tendencia central dentro de un grupo de nmeros. Las medidas de
ubicacin presentadas en esta unidad para datos no agrupados son la media,
la mediana, y la moda.
1.4.1.- Media: La media aritmtica, promedio o media, es calculada sumando
todos los nmeros de un conjunto de nmeros (xi) y despus dividindolos por
el nmero de observaciones (n) del conjunto.
= xi /n
La media es sensible a los valores extremos; es decir, los datos
extremadamente grandes o pequeos pueden causar que la media se ubique
ms cerca de uno de los datos extremos.
1.4.2.- Media Ponderada: en algunos casos, los datos de una muestra o
poblacin son ponderados de acuerdo a su importancia.
1.4.3.- Mediana: La mediana es el valor medio de una grupo ordenado de
observaciones. Si existe un nmero par de observaciones correspondientes al
grupo puede haber dos medianas
La mediana es normalmente utilizada para resumir los resultados de una
distribucin. Si la distribucin es sesgada , la mediana es un buen indicador de
medida para saber donde los datos observados se encuentran concentrados.
Generalmente, la mediana proporciona una mejor medida que la media cuando
las observaciones son extremadamente grandes o pequeas
La media tiene dos ventajas sobre la mediana. Es ms estable, y uno puede
calcular la media de dos o ms muestras.
1.4.4- Moda: La moda es el valor ms frecuente en un sistema de
observaciones.
Los datos pueden tener dos modas. En este caso, decimos que los datos son
bimodales, y los grupos de observaciones con ms de dos modos estn
referidos como multimodales.
Observe que la moda no es una medida til de ubicacin, porque puede haber
ms de una moda o quizs ninguna.
19
..
..
..
..
.
1.4.5.- Caractersticas de la Moda, Mediana y Media
Moda
Mediana
Media
Es el valor mas
frecuente en la
distribucin.
Es el valor de mayor
concentracin de la
muestra
Su valor es
establecido por la
frecuencia
predominante, no por
los valores en la
distribucin.
El valor de la media es
fijado por su posicin
en la seleccin, y no
refleja valores
individuales.
La suma de las
desviaciones en cualquier
lado de la media son
iguales.
Este es el valor ms
comn.
La distancia agregada
entre la mediana y
cualquier otro punto de Esta refleja la magnitud
la muestra es menor
de cada valor.
que en cualquier otro
punto.
Una distribucin
Cada seleccin tiene
puede tener ms de 2
solo una mediana.
modas.
No puede ser
manipulada
algebraicamente.
No puede ser
manipulada
algebraicamente.
Es inestable, puede
Es estable , al agrupar
ser influenciada en el
los datos no se afecta
proceso de
su apreciacin.
agrupacin.
Es estable en cuanto a al
procedimiento para
agrupar ya que ste no
afecta la apreciacin.
20
..
..
..
.. Geomtrica: La media geomtrica (G) de n valores no
1.4.6.- La Media
.
negativos es la ensima raz del producto de los n valores.
Si algunos valores son muy grandes en magnitud y otros muy pequeos, la
media geomtrica proporciona una mejor representacin de los datos que un
simple promedio.
1.4.7.-Histogramas: Analizando la Homogeneidad de la Poblacin
Un histograma es una representacin grfica de una estimacin para la
densidad (para variables aleatorias continuas) o la funcin de probabilidad total
(para variables aleatorias discretas) de la poblacin.
Las caractersticas geomtricas del histograma nos permiten descubrir
informacin til sobre los datos, por ejemplo:
1. La localizacin del centro de los datos.
2. El grado de dispersin.
3. La seccin a la cual se sesga, es decir, cuando no cae
simtricamente en ambos lados del pico.
4. El grado de agudeza del pico. Cmo se levanta y baja la
pendiente.
Las medidas de variacin ms comunes son: varianza, desviacin estndar,
y el coeficiente de variacin.
1.4.8.- Cuartiles: Cuando requerimos sean divididos en cuartos, Q1... Q4,
conocidos como cuartiles. El primer cuartl (Q1) es el valor donde estn 25% de
los valores mas pequeos y en el otro 75% los ms grandes. El segundo cuartl
(Q2) es el valor donde estn 50% de los valores mas pequeos y en el otro
50% los ms grandes. En el tercer cuartl (Q3) es el valor donde estn 75% de
los valores mas pequeos y en el otro 25% los ms grandes.
1.4.9.- Porcentajes: Los porcentajes tienen la ventaja que pueden ser
subdivididos en 100 porciones. Los porcentajes y los cuartiles son ms
convenientes de leer cuando son tomados de una funcin de distribucin
acumulativa.
1.4.10.- Varianza: Es una importante medida de variabilidad.
La varianza es el promedio de las desviaciones estndar elevadas al
cuadrado de cada una de las observaciones con respecto a la media.
21
..
..
..
..
.
Desviacin Estndar:
Ambas, la varianza y la desviacin estndar proporcionan la misma
informacin; una siempre puede ser obtenida de la otra .
La desviacin estndar es la raz cuadrada de la varianza, esta siempre es
expresada en las mismas unidades que el conjunto de datos:
CV =100 |S/ | %
El CV es independiente de las unidades de medida. En la estimacin de un
parmetro, cuando su CV es menos del 10%, la estimacin se asume
aceptable. En el caso contrario, digamos, 1/CV se llama el Cociente de seal
de ruido.
El coeficiente de variacin se utiliza para representar la relacin de la
desviacin estndar hacia la media,.
22
..
..
..
..
.
23