Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADSTICA GENERAL
CONTENIDO PROGRAMTICO
ASIGNATURA: ESTADSTICA GENERAL (URBE)
UNIDAD I
NDICE
1.- INTRODUCCIN A LA ESTADSTICA
2.- DEFINICIONES DE TRMINOS BSICOS
1. Estadstica
2. Estadstica Descriptiva e Inductiva
3. Poblacin
4. Unidad Estadstica
5. Poblacin estadstica
6. Datos Estadsticos
7. Parmetros
8. Muestra aleatoria
9. Estadstico o estadgrafo
10. Variables estadsticas
10.1 Variable cuantitativa
10.2 Variable cualitativa
10.3 Variable contina
10.4 Variable discreta o discontinua
11. Relacin de la estadstica con otras ciencias de la investigacin
3.- DISTRIBUCIN DE FRECUENCIA
3.1. Definicin
3.2. Elementos de una tabla de distribucin de frecuencia
3.2.1. Intervalo de Clase
3.2.2. Frontera de clase
3.2.3. Punto Medio de Clase
3.2.4. Frecuencia Absoluta
3.2.5. Frecuencia Absoluta Acumulada
3.2.6. Frecuencia Relativa
3.2.7. Frecuencia Relativa Acumulada
Binomial
Normal
t - Student
8. REGLA DE BAYES
UNIDAD III
9. TEORA DEL MUESTREO
1.
2.
3.
4.
5.
Tipos de muestreo
Teorema del lmite central
Distribucin muestral para la media
Distribucin muestral para la proporcin
Estimacin de intervalo para la media
que se requiera recolectar datos, organizarlos y analizarlos para tomar decisiones a corto,
mediano o largo plazo.
En el presente texto se estudian; en la unidad 1 lo referente a la definicin y clasificacin
de la Estadstica, conceptos de muestra y poblacin, se analizan las medidas de
centralizacin y variabilidad para datos agrupados y no agrupados, se manejan
definiciones de frecuencia absoluta y relativa, se realiza la tabla de distribucin de
frecuencia con sus respectivos histogramas, diagramas circulares, polgonos, ojivas, etc.
En la Unidad 2 se estudia la teora axiomtica de probabilidades, reglas de adicin, de
multiplicacin, probabilidad condicional, probabilidad total regla de Bayes para los
diferentes tipos de eventos. En la unidad 3 se enfoca el estudio en variables aleatorias
discretas y continuas, sus funciones de distribucin de probabilidades, para variables
discretas se establecen tres leyes a saber: La ley binomial, la hipergeomtrica y la de
poisson y para variables aleatorias continuas la ley de distribucin normal
Al final del curso el estudiante estar en capacidad de aplicar todos estos conceptos
estadsticos a la solucin de problemas de su rea profesional.
En el campo de la educacin, la estadstica desempea un papel de importancia. Un
educador tal vez quiera saber si hay una relacin significativa entre las puntuaciones de
un test de aptitud acadmica y las calificaciones promedios de un grupo de estudiantes.
En biologa y agronoma las tcnicas estadsticas se han empleado desde hace mucho
tiempo, en particular para estudiar los efectos de los tipos de semillas de los insecticidas y
de los fertilizantes en las cosechas. La medicina reconoce los efectos secundarios o la
eficacia de medicamentos para el control de la propagacin de enfermedades con base
en las tcnicas estadstica.
La estadstica ha encontrado tambin una aplicacin creciente en la fsica y en la qumica,
ciencias en la que se ha utilizado para contrastar hipotesis con base en los datos
experimentales.
El desarrollo del campo de la computacin ha contribuido a la expansin de las
aplicaciones de las tcnicas en nuevos y ms complejos problemas
3.- DISTRIBUCIN DE FRECUENCIA
1. Definicin: Una distribucin de frecuencia es una tabla en la cual se agrupan los
valores posibles para una variable y se registra el nmero de valores observados que
corresponde a cada clase.
Los datos organizados en la distribucin de frecuencia se denominan datos
agrupados. Para los no agrupados se enumeran todos los valores observados de la
variable aleatoria.
OBSERVACIN
1: Cuando los elementos que conforman la poblacin son muy grandes, se le resta uno
(1) al elemento ms pequeo de toda la tabla para construir el Intervalo de Clase y luego
se le suma la amplitud del intervalo de clases(C) a este se le suma 1 y se coloca en el
lmite inferior y as sucesivamente.
4.- REPRESENTACIN GRAFICA DE UNA DISTRIBUCIN DE FRECUENCIAS
4.1. Histograma de Frecuencia: Un histograma o histograma de frecuencia es un
diagrama de frecuencia univariante en la cual se levanta, en segmentos del eje horizontal,
rectngulos que tienen:
a) Sus bases sobre un eje horizontal con centro en las marcas de clases y longitud igual a
la amplitud de la clase.
b) rea proporcionales a sus frecuencias de clase
La frontera de clase(FC) se colocan usualmente a lo largo del eje horizontal del diagrama,
mientras que el nmero de observaciones se enumera a lo largo de eje vertical(f)
4.2. Polgono de Frecuencia: Es un diagrama que muestra la forma de una distribucin de
frecuencia; las frecuencias son medidas en ordenadas y los valores de la variante en la
abscisas, de tal modo que una vez dibujada la frecuencias correspondiente a cada valor
de la variante se une el extremo superior de cada una de las ordenadas.
La marca de clase o el punto medio de cada clase(PMC) se identifica a lo largo de todo el
eje horizontal y el nmero de observaciones se enumera a lo largo del eje vertical.(f).
NOTA: Al primer elemento del PMC se le resta el AIC y al ltimo elemento del PMC se le
suma el AIC, esto con el fn de que el polgono se inicie en el origen y termine en el
origen.
4.3. Ojiva: La ojiva, o polgono de frecuencia acumulada, es un grfico de lneas
quebradas como el polgono de frecuencias, pero aqu termina la semejanza entre los
dos.
La frontera superior de clase(FC) se coloca a lo largo del eje horizontal, mientras que la
frecuencia Absoluta acumulada(F) se enumera a lo largo del eje vertical.
4.4. Diagrama circular: Es un mtodo de representacin diagramtica en el que los
componentes de un nico total pueden ser mostrados como sectores de un crculo. Los
ngulos de los sectores son proporcionales a los componentes del total. Puede obtenerse
una ayuda visual con colores o sombrendolos. Tambin es conocido como grfico
circular.
4.5. Pictograma: Es un mtodo de representacin visual de magnitudes estadsticas por
medio de dibujos o pinturas de la materia sujeta a discusin. El mtodo es restringido a la
presentacin de relaciones simples.
Es un medio de presentacin grfica que usan frecuentemente los economistas, pero que
tambin tiene cierta importancia en otros campos de aplicacin. Una presentacin
pictogrfica compara magnitudes comparando objetos que tienen relacin con la materia
tratada. Por ejemplo, una unidad pictrica para representar el nmero de estudiantes de
una unidad educativa podra ser fotos de varios estudiantes en un aula de clases, para
representar tasas de natalidad, podra ser un beb.
65
63
65
63
69
67
53
58
60
61
64
65
64
72
68
66
55
57
60
62
64
65
64
71
68
66
56
59
61
62
63
65
63
70
67
66
57
59
61
62
64
64
63
69
67
66
58
60
61
62
Se pide:
a) Construya la tabla de distribucin de frecuencia
b) Haga las representaciones grficas
a) Histograma de frecuencia
b) Polgono de frecuencia
c) Ojiva
d) Diagrama circular
e) Pictograma
c) Cuntas personas pesan entre 60 y 63 kg?
d) Cuntas personas pesan entre 76 y 79 kg?
e) Cul es el mayor porcentaje en peso kg?
f) Cul es el porcentaje de las personas que pesan entre 68 y 71 kg?
SOLUCIN
Amplitud del Intervalo de Clases = AIC
AIC= VMayor Vmenor
NDC
NDC = 6,61 = 7
AIC= Vmayor Vmenor
NDC
AIC= 72 53
= 2,71 = 3
7
AIC= 3
a) Construya la tabla de distribucin de frecuencia
NDC
1
2
3
4
5
6
7
Punto
Frecuenci
Frecuenci
Frecuenci
Intervalo
Frontera
Medio
de Clase
de Clase
de
Absoluta(f
Abs.Acum.
Relativa
51,5
55,5
59,5
63,5
67,5
71,5
75,5
Clase
53,5
57,5
61,5
65,5
69,5
73,5
77,5
)
2
7
16
18
6
1
0
(F)
2
9
25
43
49
50
50
(Fri)
0.040
0,140
0,320
0,360
0,120
0,020
0,000
52
56
60
64
68
72
76
55
59
63
67
71
75
79
55,5
59,5
63,5
67,5
71,5
75,5
79,5
Frecuencia
Relativa
Acum.(Fra)
0,040
0,180
0,500
0,860
0,980
1,000
1,000
TOTAL 50
5
14
19
11
10
6
15
7
24
13
7
13
29
11
9
Se pide:
a) Construya la tabla de distribucin de frecuencia
b) Haga las representaciones grficas
a) Histograma de frecuencia
b) Polgono de frecuencia
c) Ojiva
d) Diagrama circular
e) Pictograma
c) Donde se aprecia una mejor efectividad para el procesamiento de las ordenes de
pedido?
d) Cuntos embarques se llevaron a cabo en un intervalo desde 15 hasta 32?
12
20
17
14
6
8
25
21
6
5
40
28
7
8
5
6
30
6
9
6
Se pide:
a) Construya la tabla de distribucin de frecuencia
b) Haga las representaciones grficas
a) Histograma de frecuencia
b) Polgono de frecuencia
8
26
8
11
8
10
30
14
13
7
30
4
7
15
12
c) Ojiva
d) Diagrama circular
e) Pictograma
c) Cuntos pacientes tienen edades comprendidas entre 10 y 30 aos?
d) Cuntos pacientes tienen edades menores a 17 aos?
e)Cul es el mayor de los porcentajes?
X = xi
n
= xi
N
VARIANZA POBLACIONAL
2 = (XI - )2
N
6.2. DESVIACIN ESTNDAR: Esta es una medida importante de variabilidad y se
representa como la raz cuadrada de la varianza muestral y sus unidades son las mismas
que las medidas o unidades originales de la variable.
S=
(XI - X)2
n-1
(XI - )2
N
Las unidades de la varianza muestral son las mismas en las que se mide la variable
elevada al cuadrado.
EJEMPLOS:
1.- Halle la varianza, la desviacin estndar y el coeficiente de variacin de una empresa
con respecto a sus utilidades, las cuales fueron en los ltimos 6 semestres: 100, 230,
210, 240, 235, 230
x
100
(x x)
-107,50
(x x)2
11.556,2
5
230
210
240
235
230
(x x)2 = 14.387,50
x = x = 100 + 230 + 210 + 240 + 235 + 230
n
x = 207,50
2.- Halle la varianza y la desviacin estndar de una empresa que presentan los
valores siguientes : 11,22,45,66,11,33,25,54,66,17,12,15,21,34,11,68
DATOS AGRUPADOS
= (f. PMC)
N
X = (f. PMC)
N
Ejemplo:
A continuacin en el cuadro siguiente, la empresa Castillo Soto presenta el salario
semanal de 100 trabajadores. Halle la Media Aritmtica.
SALARIO
NMERO DE
SEMANAL
140 159
160 179
180 199
200 219
220 239
240 259
OBREROS
7
20
33
25
11
4
SOLUCIN
Se utiliza la frmula de la Media Aritmtica muestral, ya que se trata de una sola empresa.
X = (f. PMC)
N
la frmula nos indica que necesitamos agregar 2 columnas a la tabla dada.
SALARIO
NMEROD
Punto
SEMANAL
Medio de
(IC)
OBREROS
Clase(PMC)
140 159
160 179
180 199
200 219
220 239
240 -- 259
(f)
7
20
33
25
11
4
149,5
169,5
189,5
209,5
229,5
249,5
f . PMC
1046,50
3390,00
6253,50
5237,50
2524,50
998,00
(f. PMC) = 19.450,00
100
X = 194,50 $
7.2. Mediana: La clase que contiene la mediana es la primera clase para la cual la
frecuencia acumulada iguala o excede la mitad del nmero total de observaciones. Una
vez identificada esta clase se calcula la mediana por la siguiente frmula:
Donde:
N = Nmero de observaciones totales
Fi= Frontera inferior de clase que contiene a la mediana
Facu.ant. = frecuencia acumulada anteriores a la clase en donde se encuentra la mediana
i = LS-LI
NDC
LS = lmite superior de la clase que contiene a la mediana
LI = lmite inferior de la clase que contiene a la mediana
NDC = Nmero Deseado de Clase
Ejemplo:
A continuacin en el cuadro siguiente, la empresa Castillo Soto presenta el salario
semanal de 100 trabajadores. Halle la Mediana.
SALARIO
NMERO DE
SEMANAL
140 159
160 179
180 199
200 219
220 239
240 -- 259
OBREROS
7
20
33
25
11
4
SOLUCIN
NMEROD
SEMANAL
(IC)
OBREROS
140 159
160 179
180 199
200 219
220 239
240 -- 259
(f)
7
20
33
25
11
4
N = 100
7
27
60
85
96
100
=
50
Fi= 179,50
Facu.ant. = 27
= 33
i = amplitud
i = LS-LI
NDC
i = 20
Donde:
Fi = lmite inferior de la clase que contiene a la moda
SALARIO
NMERO DE
SEMANAL
140 159
160 179
180 199
200 219
220 239
240 -- 259
OBREROS
7
20
33
25
11
4
SOLUCIN
Fi = 179,50
d1 =
d2 =
i = amplitud
i = LS LI
= 20
NDC
NDC = Nmero Deseado de Clase
LS = lmite superior de la clase que contiene a la moda
LI = lmite inferior de la clase que contiene a la moda
EJERCICIOS
Nios
10
11
12
16
13
11
14
15
Xi = PMC
2
8.2. Varianza muestral
Xi = PMC
EJEMPLO:
Calcular la Varianza y la Desviacin Estndar de las edades de la poblacin de una aldea
mostrada en la tabla:
EDAD DE LA
POBLACIN
HABITANTES
(IC)
0 20
(f)
9
21 41
18
42 62
63 83
26
84 -- 104
SOLUCIN
Se utiliza la Varianza muestral, ya que solo se habla de una aldea y no de todas las
aldeas.
Xi = PMC
EDAD DE
LA
HABITANTES
PMC
POBLACI
(f)
(Xi)
f. PMC
N (IC)
0 20
10
90
(Xi X)
-41,34
(Xi X)2
f(Xi X)2
1709,0
15381
7446,96
21 41
18
31
558
-20,34
0
413,72
42 62
52
364
0.66
0,44
3,08
63 83
26
73
1898
21,66
469,16
12198,1
84 -- 104
94
376
42,66
1819,8
6
7279,52
8
n = 64
f(xi x )2 =
42.308,72
X = (f. PMC) = 3.286
n
VARIANZA
64
X = 51,34
DESVIACIN ESTNDAR
PROBABILIDADES
1. PROBABILIDADES: Es la posibilidad numrica, medida entre 0 y 1, de que ocurra un
evento.
2. EVENTOS:
Es una coleccin de resultados relacionados entre si de un
experimento aleatorio, es un subconjunto del espacio muestral de un experimento
aleatorio. Los eventos pueden ser dependientes, independientes o mutuamente
excluyentes.
3. AXIOMAS DE PROBABILIDAD La probabilidad es un nmero que se asigna a cada
miembro de una coleccin de eventos de un experimento aleatorio y que satisface las
siguientes
PROPIEDADES:
Si S es el espacio muestral y E cualquier evento del experimento aleatorio,
a) P(S) = 1
b) 0 P(E) 1
c) Para los eventos E1 y E2 con E1E2 = y P(E1U E2) = P(E1)+P( E2)
De estos axiomas se infieren los siguientes resultados:
P() = 0 ; P(E) = 1 P(E)
4. Axiomas
1. Teorema de la Adicin
2. Teorema de la probabilidad Condicional
3. Complemento
4. Teorema de bayes
1. REGLAS DE ADICIN
Una regla bsica de adicin importante es la siguiente:
P(AUB) = P(A) + P(B) P(AB)
Y si los eventos son mutuamente excluyentes P(AB) = luego:
P(AUB) = P(A) + P(B)
2. PROBABILIDAD CONDICIONAL
La probabilidad condicional puede expresarse como la probabilidad de un evento A
dado un evento B y se expresa como:
P(A/B) = P(AB)
P(B)
P(AB) = P(BA)
P(B/A) = P(BA)
P(A)
3. COMPLEMENTO
P (A) = 1 - P (A) =
P (B) = 1 - P (B) =
CONTAMINACIN
ALTA
si
PROCESO UHT
PROCESO NORMAL
10
50
SI
NO
240
200
En este ejemplo sea A el evento leche comercial con contaminacin alta y sea B el evento
leche comercial sometida a Proceso UHT.
Halle:
P (A)
2) P (B)
1)
3)
4)
5)
6)
7)
8)
9)
10)
P (A B)
P (A UB)
P (A)
P (B)
P (A B)
P (A B)
P (A/B)
P (B/A) (Teorema de Bayes)
0,50
= (0,04)(0,50) = 0,17
0,12
TALLER N 1
Ojos castaos
Ojos no castaos
A: Pelo Castao
Pelo castao
15
25
Pelo no castao
10
50
B: Ojos no Castaos
Se pide:
1. P(A)
2. P(B)
3. P(A)
4. P(B)
5. P(AB)
6. P(AUB)
7. P(AB)
8. P(BA)
9. P(A/B)
10. P(B/A) TEOREMA DE BAYES
Un club nocturno tiene los siguientes datos sobre la edad y el estado civil de 140
clientes
SOLTERO
CASADO
Menor de 30
288
36
30 o ms
672
204
79
a)
b)
c)
d)
e)
f)
g)
h)
100
74
83
81
85
82
80
84
Media Aritmtica
Mediana
Moda
Cuartiles
Percentiles
Varianza
Desviacin Estndar
Coeficiente de variacin
2. Se toman 8 mediciones del dimetro interno de anillos para los pistones del motor de
un automvil y los datos en milmetros son: 74.001, 74.003, 74.015, 74.000, 74.005,
74.002, 74.005 y 74.004, calcular:
a)
b)
c)
d)
e)
f)
g)
h)
Media Aritmtica
Mediana
Moda
Cuartiles
Percentiles
Varianza
Desviacin Estndar
Coeficiente de variacin
4.
Media Aritmtica
Mediana
Moda
Cuartiles
Percentiles
Varianza
Desviacin Estndar
Coeficiente de variacin
5.8
6.2
5.9
7.2
10.0
12.2
8.5
5.7
11.2
7.9
6.4
12.4
3.9
8.1
9.2
11.5
a)
b)
c)
d)
e)
f)
g)
h)
Media Aritmtica
Mediana
Moda
Cuartiles
Percentiles
Varianza
Desviacin Estndar
Coeficiente de variacin
793
667
700
626
512
444
701
633
567
490
768
565
720
595
732
556
454
656
600
670
800
675
436
490
520
750
715
490
654
34.7
34.2
33.6
36.6
33.1
37.6
33.6
34.5
35.0
33.4
32.5
35.4
34.6
37.3
34.1
35.6
35.4
34.7
34.1
34.6
35.9
34.6
34.7
36.3
36.2
34.6
35.1
33.8
34.7
35.5
35.7
35.1
36.8
35.2
36.8
37.1
33.6
32.8
36.8
34.7
35.1
35.0
37.9
34.0
32.9
32.1
34.3
33.6
35.3
34.9
36.4
34.1
33.5
34.5
32.7
94.3
93.7
87.6
96.3
91.7
86.7
87,7
86.4
94.6
87.5
83.0
90.6
93.1
93.1
84.2
91.2
89,4
97.8
90.3
85.1
90.4
88.6
95.3
89.6
90.5
86.6
84.1
83.0
78.3
95.6
92.4
82.6
93.2
79.0
88.3
88.2
83.1
94.3
81.0
84.1
93.2
84.6
86.1
81.4
83.7
94.1
83.6
95.2
79.5
82.9
96.1
85.4
90.1
84.9
87.3
98.0
89.7
84.1
86.4
86.4
84.5
87,6
87.3
88.2
1520
1223
1060
180
1300
1890
475
1530
1020
1540
1215
2260
1790
1330
1500
1280
1935
1000
1680
1016
2100
900
1501
1238
1730
1594
1102
1020
1746
1608
2130
760
1424
1109
58
68
67
53
31
49
80
60
52
67
58
61
69
67
78
75
76
40
70
72
70
61
75
83
66
73
63
70
79
67
45
70
57
81
76