Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadisticas Uni Curso Docente PDF
Estadisticas Uni Curso Docente PDF
12/11/2009
UNI Norte
ndice
Introduccin ............................................................................................................. 3
Recomendaciones Metodolgicas ........................................................................... 4
Captulo I. Estadstica Descriptiva ........................................................................... 8
1.1 Introduccin. Tipos de Variables ............................................................................ 8
1.2 Anlisis de datos, TDF y Grficos ........................................................................ 11
1.3. Medidas de Tendencia Central ........................................................................... 25
Media Aritmtica..................................................................................................... 25
La Mediana ............................................................................................................ 27
La Moda ................................................................................................................. 28
Otras medidas de tendencia central. ...................................................................... 30
La Media Geomtrica. ............................................................................................ 30
La Media Cuadrtica. ............................................................................................. 30
Cuartiles, Deciles y Percentiles. ............................................................................. 30
1.4 Medidas de Dispersin o de Variabilidad ............................................................. 31
El Rango. ............................................................................................................... 32
El Desvo Estndar................................................................................................. 32
La Varianza. ........................................................................................................... 34
El Coeficiente de variacin ..................................................................................... 34
1.5 Otras medidas tiles en Estadstica Descriptiva. ................................................. 35
La Asimetra o Sesgo. ............................................................................................ 35
La Curtosis. ............................................................................................................ 36
Captulo II. Muestras y Poblacin. ......................................................................... 38
2.1 Muestreo Aleatorio Simple ................................................................................... 38
2.2 Muestreo Estratificado ......................................................................................... 40
2.3 Muestreo por Conglomerados ............................................................................. 41
2.4 Muestreo Sistemtico .......................................................................................... 42
Captulo III. Teora Elemental de Probabilidades .................................................. 44
3.1 Introduccin a las Probabilidades ........................................................................ 44
3.2 Trminos Bsicos. ............................................................................................... 44
Probabilidades, definicin Clsica: ......................................................................... 45
Probabilidades, definicin frecuencial: ................................................................... 45
Ley de los Grandes Nmeros. ................................................................................ 46
3.3 Propiedades de la Probabilidad ........................................................................... 46
Regla del producto. ................................................................................................ 47
Regla de la Suma. .................................................................................................. 47
3.4 Probabilidad condicionada ................................................................................... 48
3.5 Uso de la Probabilidad condicional en el Teorema de Bayes .............................. 50
3.5.1 Regla de la probabilidad total ........................................................................ 50
3.5.2 Planteo del Teorema de Bayes ..................................................................... 51
Estadstica Bsica para Docentes de Educacin Secundaria
UNI Norte
Introduccin
Este libro de Texto dirigido a profesores de secundaria, cubre desde sptimo hasta
undcimo grado la mayora de temas que aborda la malla de contenidos de educacin
secundaria del Ministerio de Educacin de Nicaragua, MINED. ste texto tiene un
enfoque utilitario, prctico, respetando el principio que la Estadstica debe ser una
herramienta fundamental para describir procesos y tomar decisiones en el trabajo
cotidiano de cualquier profesional. En el mismo se trat de romper la dicotoma entre
teora y realidad, respondiendo permanentemente a la pregunta Cundo puedo usar
esta teora? Qu me permite conocer o responder la misma? Si podemos describir la
estadstica como: un conjunto de tcnicas para describir grupos de datos y para tomar
decisiones en ausencia de una informacin completa. Un libro de estadstica debe
respetar esta definicin!
Para hacer los ejercicios de este texto y construir grficos digitales se sugiere utilizar el
programa estadstico INFOSTAT, el cual dispone de una versin de uso libre que se
puede descargar gratuitamente desde la pgina www.infostat.com.ar .
UNI Norte
Recomendaciones Metodolgicas
Ensear Estadstica con informacin construida en la clase y al mismo tiempo descifrar
cmo hacer que una investigacin sea el hilo conductor del curso.
Una historia
Un deseo
Ante mi sorpresa los alumnos no supieron que decir y el profesor muy seriamente me
explic que si alguien se suba una escalera apoyada en una pared y esta se
comenzara a deslizar se poda saber por la derivada la velocidad de cada dentro de un
UNI Norte
intervalo, por ejemplo entre 3 y 2 metros antes de caer al suelo. Me imagin cayendo
con la escalera y al mismo tiempo haciendo el clculo con que me iba a dar el golpe y
sinceramente no qued convencido de la utilidad presentada! Creo que los estudiantes
tampoco.
Un ejemplo de docencia a discutir.
Podemos describir la estadstica como: un conjunto de tcnicas para describir grupos
de datos y para tomar decisiones en ausencia de una informacin completa. Un curso
de estadstica debe respetar esta definicin!
La primera pregunta que surge es De dnde sacar los datos?. La enseanza clsica
dira que se debe recurrir a los ejercicios de los libros de texto donde hay ejemplos
resueltos y que no tienen complicaciones extraas. Un primera debilidad de este tipo
de enseanza es que la realidad es complicada, llena de ruidos y estos ejemplos no
nos preparan para estos ruidos, sin embargo la principal debilidad es ensear con
ejemplos que llegan fuera del contexto del estudiante y este no logra apropiarse de
ellos ni sentirse motivado.
La metodologa que se sugiere usar, comienza por definir como sujeto de estudio al
propio estudiante, cada uno de ellos sern la unidad de investigacin y cada uno
aportar la informacin de s mismo que luego compartir con los dems. Durante el
proceso de enseanza se sugiere recorrer los siguientes pasos:
A) Definir los objetivos a resolver con la informacin que se usar en el curso, el cual
se enfoca como una investigacin. Un ejemplo de objetivo podra ser: describir las
causas que inciden
UNI Norte
B) Luego se definen conceptos bsicos para poder luego construir conocimiento, por
ejemplo: se explica el concepto de variable, luego se discute cuales variables pueden
servir para alcanzar el objetivo definido previamente.
UNI Norte
Se sugiera que al inicio los ejercicios numricos se hagan manualmente, luego con
calculadora cientfica y finalmente con un programa de computadora, por ejemplo
INFOSTAT.
Un Deseo
Solo espero que disfruten enseando estadstica al mismo tiempo que sus estudiantes
aprendan a mirar el mundo desde una perspectiva cuantitativa.
UNI Norte
Objetivos
Reflexionar sobre el uso de la estadstica a travs de situaciones de la vida
cotidiana.
Introducir a la recoleccin de datos a partir de un problema del entorno.
Construir conceptos bsicos de estadstica desde la experiencia del estudiante.
Ejemplificar
los diferentes
abstraer datos. Una definicin que describe la estadstica de manera utilitaria es la que
dice que es: un conjunto de tcnicas para describir grupos de datos y para tomar
decisiones en ausencia de una informacin completa. La estadstica a diferencia de la
matemtica no genera resultados exactos, los resultados siempre tienen asociada un
grado de incertidumbre o error. La estadstica trata de lograr una aproximacin de la
realidad, la cual es siempre mucho ms compleja y rica que el modelo que podemos
abstraer. Si bien esta ciencia es ideal para describir procesos cuantitativos, tiene serios
problemas para explicar el porqu cualitativo de las cosas
Estadstica Bsica para Docentes de Educacin Secundaria
UNI Norte
En general podemos hablar de dos tipos de estadsticas, las descriptivas que nos
permiten resumir las caractersticas de grandes grupos de individuos y las
inferenciales que nos permite dar respuestas a preguntas (hiptesis) sobre poblaciones
grandes a partir de datos de grupos pequeos o muestras.
Construccin de Variables a partir de informacin.
Para poder analizar datos, ya sea de forma manual o por computadora, hay que
entender que trataremos a partir del estudio de la realidad observable
crear un
modelo numrico terico donde se estudian variables para describirlas y analizar sus
relaciones. Para hacer esto primero es necesario definir algunos trminos tericos.
Variables Cuantitativas, son las que sus caractersticas estn expresadas en valores
numricos, stas asumen cualquier valor y pueden variar en cualquier cantidad, sobre
una escala aritmtica e infinita y pueden subdividirse en dos tipos continuas o
medibles y discretas o contables.
UNI Norte
ordenamiento de datos en fila y columnas donde cada fila es un individuo, una parcela,
una muestra, una unidad experimental o una encuesta determinada y cada columna:
una variable. Los programas Access, Excel, Infostat y SPSS ordenan los datos en
forma de matriz. Por ejemplo en una encuesta (cuestionario) cada pregunta que se
tiene, genera al menos, una variable generalmente discreta. Hay casos donde una
pregunta puede generar muchas variables de tipo dicotmico, SI- NO, que se suele
codificar como 1= SI y 0= NO.
Peso de un estudiante.
Color de ojos.
Temperatura semanal.
Tipo de techo.
Dimetro de un tornillo
10
UNI Norte
Creacin de la
matriz de datos
Definicin de
anlisis a
realizar
Ejecucin de
anlisis en
computadora
Interpretacin
de resultados
Estadstica
descriptiva
de
las
variables.
decisiones.
un grupo de datos.
Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando informacin atpica o anormal y corregir los casos que la informacin atpica
se deba a una mala digitacin o error en la recoleccin de datos.
Estadstica Bsica para Docentes de Educacin Secundaria
11
UNI Norte
Las Escalas Ordinales, son discontinuas y se usan donde hay un orden jerrquico
de un conjunto de objetos o eventos con respecto a algn atributo especfico, por
ejemplo ordenar los ingresos en tres niveles: alto =1, medio = 2 y bajo = 3.
Las Escala de Razn Constante, tienen todas las propiedades de las Escalas de
intervalos ms un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor 0 representa ausencia del valor.
Un caso especial de escala ordinal es la escala de Likert, esta escala es muy usada en
las ciencias sociales y se usa para medir actitudes, Una actitud es una predisposicin
aprendida par responder consistentemente de una manera favorable o desfavorable
ante un objeto de sus smbolos. As las personas tenemos actitudes hacia muy
diversos objetos o smbolos, por ejemplo: actitudes hacia la poltica econmica, un
Estadstica Bsica para Docentes de Educacin Secundaria
12
UNI Norte
profesor, la ley, nosotros, etc. Las actitudes estn relacionadas con el comportamiento
que mantenemos. Estas mediciones de actitudes deben interpretarse como sntomas
y no como hechos. Esta escala es bipolar porque mide tanto el grado positivo como
negativo de cada enunciado y consiste en un conjunto de tem presentado en forma de
afirmaciones o juicios ante los cuales se pide reaccin a los sujetos en estudio en una
escala de 5 puntos, cada punto tiene un valor numrico. Un ejemplo de cmo calificar
con afirmaciones positivas es Le gusta cmo se imparte la clase de estadstica?:
1- Muy en desacuerdo, 2- En desacuerdo, 3- Ni de acuerdo, ni en desacuerdo,
4- De acuerdo, 5-Muy de acuerdo.
Estar de acuerdo con la idea presentada significa un puntaje mayor.
datos de 15 variables al
menos por ejemplo: Edad, Sexo, Procedencia, etc. Y luego ordnelos en forma de
matriz de datos, recodifique la informacin cualitativa en numrica.
las
13
UNI Norte
del llenado de la base de datos creando variables numricas discretas, por ej. Si
quiero clasificar las becas que otorga una Universidad puedo codificarlas de la
siguiente manera: Beca interna =1, Beca externa =2 y No beca =0.
Si las opciones que genera una variable discreta permite hacer combinaciones de las
respuestas se sugiere crear muchas variables dicotmicas del tipo Si o No (1,0).
Veamos un ejemplo: Si se pregunta: que prcticas de en los cultivos
realiza un
Para crear una base de datos hay que recordar que se est obteniendo una matriz de
datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto
de las filas los datos para cada
Encuesta
Sexo
Edad
Ingresos
Comunidad
semanales C$
Labor
realizada
31
1,394
35
1,311
43
1,300
28
1,304
45
1,310
36
1,443
21
1,536
32
1,823
Esta matriz se codifica as: la variable Sexo: 1= varn, 2 = mujer. Para la variable
comunidad hay 4 tipos diferentes donde: 1= Estel, 2= Condega, 3= Pueblo Nuevo y
14
UNI Norte
discuta las posibles respuestas, diga si las preguntas estn bien formuladas, sugiera si
alguna de ellas est de ms y que preguntas propone para completar la informacin.
Hoja de Encuesta
Nmero de ficha___________
Fecha: ______________________________________________________
Primer Apellido_______________________________________________
Segundo Apellido______________________________________________
Nombres:_____________________________________________________
Ao____________
Direccin: _____________________________________________________
Estado Civil: ____________
Nmero de personas que habitan la vivienda__________________________
Nivel de estudio de ellos__________________________________________
Edad de cada una de ellos_________________________________________
Profesin: _____________________________________________________
Ejercicio 1.5:
Defina variables para caracterizar a los estudiantes del curso con el objetivo de
determinar posibles causas que tengan influencia en el rendimiento acadmico
del grupo.
15
UNI Norte
GENERACION DE DATOS
NOMBRE
ALTU
RA
Abel
Adely
Alexis
Aracely
Candelario
Carlos
Cesar
Cleotilde
Danny T
Danny
David N
Deice
Edwin
Ronal
Sara
Sayda
Seyla
Tania
Uriel
Yilmar
74
70
80
70
78
85
70
75
70
85
77
75
80
80
80
78
75
90
70
78
1.75
1.55
1.85
1.54
1.65
1.8
1.7
1.5
1.7
1.67
1.63
1.52
1.75
1.73
1.6
1.5
1.7
1.65
1.65
1.8
2
2
2
2
1
2
2
1
2
2
2
2
1
2
2
2
2
2
2
2
25
18
24
20
24
19
19
20
18
18
18
20
18
21
17
18
20
19
22
18
BE Opinin
CA
S
0
0
1
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
3
3
2
4
5
5
5
1
4
4
2
3
3
3
2
5
5
4
2
4
16
UNI Norte
Nmero de clases
30-50
5-7
51-100
6-10
101-250
7-12
+250
10-20
El valor central de una clase se llama marca de clase, este valor se usa para construir
los grficos de polgonos de frecuencia. Veamos un ejemplo de cmo se construye una
Tabla de Distribucin de Frecuencias. Es importante resaltar que con las variables
nominales no se construyen intervalos, lmites marcas de clase, esto no tiene sentido
con este tipo de variable.
1,443
1,536
1,394
1,623
1,650
1,480
1,355
1,350
1,430
1,520
1,550
1,425
1,360
1,430
1,450
1,680
1,540
1,304
1,260
1,328
1,304
1,360
1,600
Secuencia de actividades
17
UNI Norte
Se calcula el Rango de los datos, valor mayor menos valor menor: 1680- 1,260 =
420 C$.
Ancho de clase: El rango se divide en cuatro, 420/4= 105 C$, se ajusta a 100 C$ y
de esta manera el nmero de clases queda en cinco.
Se construye los lmites inferiores y superiores de cada clase como intervalos
semiabiertos,
Luego se cuentan las frecuencias por clase, esto es la Frecuencia Absoluta
Se calcula la Frecuencia Relativa (Frecuencia Absoluta / n)
Se hace Frecuencia Acumulada. que es la suma de las frecuencias absolutas.
Tambin se pueden hacer las frecuencias expresadas en porcentajes.
Tabla de Distribucin de frecuencias, T DF.
Clase
Lmite Inferior
Lim. Superior
Marca de
Frecuencia
Frecuencia
Frecuencia
Igual a
Menor a
clase
Absoluta
Relativa
Acumulada
1,200
<1,300
1,250
0.04
1,300
<1,400
1,350
0.33
1,400
<1,500
1,450
0.29
16
1,500
<1,600
1,550
0.17
20
1,600
<1,700
1,650
0.17
24
Total
24
1.00
18
UNI Norte
Texto..
0.35
frecuencia relativa
0.28
0.21
0.14
0.07
0.00
1100
1200
1300
1400
1500
1600
1700
1800
C$
Se puede observar que la informacin que lleva el grfico es completa, incluye todos
los datos y permite explicar el contenido del mismo por ejemplo: la barra de mayor
altura contiene la moda y al no ser un grfico simtrico concluyo que la media y
mediana son diferentes y que los datos son sesgados hay un agrupamiento de
frecuencias a la izquierda del centro.
19
UNI Norte
Grficos. Los grficos nos permiten presentar la informacin que san los datos de
manera resumida y grfica, fcil de entender. Los grficos pueden ser univariados,
bivariados y multivariados, segn el nmero de variables involucradas.
Frecuencia de personas
30
20
10
0
0
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90
Edad
Para describir los datos ste grfico univariado se acompaa de estadstica descriptiva
como medias, medianas, desvos estndares e intervalos de confianza.
20
UNI Norte
598 personas de origen rural. Este Grfico creado con frecuencias y porcentajes,
permite resaltar segmentos de clases determinadas.
otros
19%
primaria
45%
ninguno
15%
secundaria
21%
21
UNI Norte
75.5
75.2
75.0
74.5
74.0
73.5
Nota Promedio
73.5
73.0
73.0
72.5
72.5
72.0
Matematica
Contabilidad
Programacin
Algebra
Asignatura
22
UNI Norte
30
20
10
0
13
20
27
34
41
48
55
62
69
76
120
100
98
eficiente la informacin de
80
hasta 6 o 7 variables. Es
ideal
para
usar
con
60
escala
43
Likert o variables
dicotmica, SI y NO.
30
20
19
0
Escuela Cercana
Electricidad
Agua Potable
Telfono
Asistencia Mdica
23
UNI Norte
50
cruzada de frecuencias y
41
estadstica
30
de
independencia.
23
20
Porcentaje
19
Sexo
13
10
9
varn
mujer
primaria
secundaria
univers itario
solo lee
Nivel educativo
puede
construir
frecuencias
porcentajes
24
UNI Norte
Un
Grfico
permite
ver
rpidamente lo que dicen los datos
Media Aritmtica
La media aritmtica o simplemente media de un conjunto de mediciones es la medida
de tendencia central ms usada y conocida. Esta medida se simboliza como x (x con
raya) cuando representa la media muestral y como (letra griega minscula) para
Estadstica Bsica para Docentes de Educacin Secundaria
25
UNI Norte
x = ( x i / n), donde
1
= 1
Media Aritmtica
Variable Nota = xi
X1
X2
X3
X4
X5
X6
X7
Valor de xi
62
68
92
88
55
79
89
Luis Dicovskiy Riobo
26
UNI Norte
Luisa
Rosa
Diana
X8
X9
X10
10
1
92
67
69
761.
xi =
10
1
La Mediana
La segunda medida de tendencia central es la mediana. La mediana m de un conjunto
de mediciones x1, x2, x3,...., xn es el valor de x que se encuentra en el punto medio o
centro cuando se ordenan los valores de menor a mayor.
Si las mediciones de un conjunto de datos se ordenan de menor a mayor valor y n es
impar, la mediana corresponder a la medicin con el orden (n + 1) / 2. Si el nmero
de mediciones es par, n = par, la mediana se escoge como el valor de x a la mitad de
las dos mediciones centrales, es decir como el valor central entre la medicin con
rango n/2 y la que tiene rango (n/2) + 1.
Reglas para calcular la mediana
Ordenar las mediciones de menor a mayor
Datos ordenados
1
2
3
4
5
6
7
8
Valor de xi
55
62
67
68
69
79
88
89
Luis Dicovskiy Riobo
27
UNI Norte
Juan
Luisa
9
10
92
92
La Moda
La moda es la medida de tendencia central ms fcil de calcular y tambin es la ms
sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin. Por esta
razn la moda se suele usar para una evaluacin rpida de la tendencia central. La
moda se define como el valor ms frecuente de una distribucin. En una tabla de
frecuencias, la frecuencia mayor es la que contiene a la moda. Esta medida se usa ms
y tiene ms sentido cuando se describen datos nominales, de hecho es la nica medida
de tendencia central que funciona con este tipo de escala.
28
UNI Norte
La mediana suele ser la medida preferida cuando se emplea una escala ordinal, estas
son las situaciones donde el valor asignado a cada caso no tiene otro significado ms
que el indicar el orden entre los casos. Por ejemplo saber en una clase cuales alumnos
estn dentro del 50% con mejores notas y cuales dentro del 50% con peores notas.
Tambin se suele preferir la mediana cuando unos pocos valores extremos
distorsionan el valor de la media. Por ejemplo si tengo 9 personas con 0 ingresos y uno
sola que tiene ingresos de 10 unidades, la media me puede dar a entender que la
mayora recibe 1 unidad, cuando esto no es real.
29
UNI Norte
x g 4 (4)(5)(4)(6) 4.68
Una ventaja de su uso es que considera todos los valores de la distribucin y es menos
sensible que la media aritmtica a los valores extremos, sin embargo es de clculo
complicado y si un valor vale 0 se anula.
La Media Cuadrtica.
Se construye a partir de suma de los cuadrados de un conjunto de valores. Su forma de
clculo es
xc 2
xc
42 52 42 62
4.81
4
Se utiliza cuando se quiere evitar los efectos de los signos. sta media solo puede
tomar valores positivos.
30
UNI Norte
anmalos de la distribucin.
Diagrama de caja, variable: cantidad de carne consumida por ao.
18.7
Kg
14.9
11.2
Mediana
7.5
3.7
31
UNI Norte
El Rango.
El Rango, Recorrido o Amplitud de un conjunto de mediciones, es la diferencia entre el
valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades, en la
escala de medicin, para incluir los valores mnimo y mximo. Es la medida de
dispersin ms fcil de calcular, pero tambin es la menos estable al estar fuertemente
influenciada por valores extremos atpicos.
El Desvo Estndar.
El Desvo Estndar es la medida de dispersin ms ampliamente usada y es la ms
estable ya que depende de todos los valores de la distribucin. Es la media de
desviacin de los valores con respecto a la media, aunque una definicin completa
sera: la raz cuadrada de la suma de las desviaciones alrededor de la media, elevadas
al cuadrado y divididas entre el nmero de casos menos uno en el caso de S.
32
UNI Norte
Cuando se trabaja con muestras el desvo estndar se simboliza con una S y con la
letra sigma minscula cuando se usan datos de una poblacin. Su frmula de
clculo tradicional es:
=(
33
UNI Norte
((55 76.1) 2 (62 76.1) 2 (67 76.1) 2 (68 76.1) 2 (69 76.1) 2 (79 76.1) 2
(88 76.1) 2 (89 76.1) 2 (92 76.1) 2 (92 76.1) 2 ) / 9
= 13.6
Se sugiere hacer estos clculos usando una calculadora cientfica en funcin
estadstica.
La Varianza.
La varianza es el desvo estndar elevado al cuadrado y se simboliza con S 2 cuando
es muestral, o 2 cuando es poblacional. Este es una medida que se usa en muchas
pruebas de Hiptesis estadsticas inferenciales, por ejemplo el Anlisis de Varianza,
ANDEVA. Pero para fines descriptivos se prefiere usar el desvo estndar en vez de la
varianza, que suele ser un valor mayor y difcil de interpretar.
El Coeficiente de variacin
El coeficiente de variacin, CV, es un cociente entre el desvo estndar y la media de
los datos, expresado en porcentaje, CV =
100 . Este
coeficiente permite
34
UNI Norte
La Asimetra o Sesgo.
La Asimetra es una medida necesaria para conocer cunto se parece nuestra
distribucin a la distribucin terica de una curva normal, curva con forma de
campana,
( )
35
UNI Norte
( )
frecuencia relativa
0.34
Asimetria 0.93
0.25
0.17
0.08
0.00
15
22
28
34
41
47
54
60
Cereal
La Curtosis.
La curtosis es una medida que indica o mide lo plano o puntiaguda que es una curva de
distribucin. Cuando esta es cero, curtosis = 0, significa que se trata de una curva
Normal. Si es positiva, quiere decir que la curva o distribucin o polgono es ms
puntiaguda o levantada que la curva normal (curva leptocrtica). Si es negativa quiere
decir que es ms plana (curva mesocrtica).
=( )
Curtosis =
Ejercicio 1.8:
Tomando como fuente de datos las variables continuas recolectadas a partir de los
datos que generen los estudiantes en clase deben construir :
36
UNI Norte
distribucin de frecuencias.
espacios:
37
UNI Norte
Objetivos
Explicar principios bsicos de muestreo con ejemplos cotidianos.
Diferenciar las diferentes formas de realizar muestreos que permitan estudiar el
contexto social y productivo.
Aprender a calcular de forma ordenada el tamao de una muestra con variables
construidas en el aula.
Llamaremos poblacin a un conjunto homogneo de elementos en el que se estudia
una caracterstica dada. El censo es la forma de estudio de todos los elementos de una
poblacin. Frecuentemente no es posible estudiar toda la poblacin ya que suele ser
econmicamente inviable o llevar tanto tiempo que es impracticable.
38
UNI Norte
El muestreo aleatorio simple debe utilizarse cuando los elementos de la poblacin son
homogneo respecto a las caractersticas a estudiar, es decir a priori no conocemos
que elementos de la poblacin tendrn valores altos de ella. El primer problema al
aplicar esta forma de muestreo, es calcular el n, nmero de de elementos de la
muestra.
Clculo de n Grficamente: Se sabe que a ms grande la muestra mejor sta
estima la media de la poblacin, sin embargo hay un momento que la media que se
calcula a partir de la muestra casi no cambia, aunque sta aumente de tamao, en ese
momento el tamao de la muestra comienza a ser ptimo.
68
82
88
65
79
89
92
67
69
75
79
71
78
75
x1
x2
x3
x4
x5
x6
x7
x8
x9
x 10
x 11
x 12
x 13
x 14
x 15
72
70
74
77
75
76
78
79
78
77
77
77
77
77
77
39
UNI Norte
nota
77
75
72
70
p1
p2
p3
p4
p5
p6
p7
p8
p9
promedio
p10
p11
p12
p13
p14
p15
% de piezas de la
muestra
60-300
10
301-1000
1001-5000
+ 5000
40
UNI Norte
miembros a cada estrato y escogiendo los elementos por muestreo aleatorio simple
dentro del estrato.
41
UNI Norte
Si el orden de los elementos es tal que los ms prximos tienden a ser ms semejantes
que los alejados, el muestreo sistemtico tiende a ser ms preciso que el aleatorio
simple al cubrir ms homogneamente toda la poblacin.
42
UNI Norte
43
UNI Norte
los
mismos.
Esta
ciencia
comenz
Sin
aleatorio:
44
UNI Norte
Es la definicin ms antigua y se atribuye al matemtico francs Pierre Laplace (17491827); tambin se conoce con el nombre de probabilidad a priori pues, para calcularla,
es necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y
el nmero de resultados o sucesos elementales que entran a formar parte del suceso.
La aplicacin de la definicin clsica de probabilidad puede presentar dificultades de
aplicacin cuando el espacio muestral es infinito o cuando los posibles resultados de un
experimento no tienen iguales probabilidades. Ej: En un proceso de fabricacin de
artculos puede haber algunos defectuosas y si queremos determinar la probabilidad de
que uno que sea defectuoso, no podemos utilizar la definicin clsica pues
necesitaramos conocer previamente el resultado del proceso de fabricacin.
Para
= lim
45
UNI Norte
Por ejemplo si en una regin hay 640 campesinos que siembran frijol de forma manual
y 160 con bueyes. En este caso hay 2 eventos: Siembra manual y Siembra con bueyes
y existen las probabilidades, P (bueyes) y la P (manual) asociados a la frecuencia de
ocurrencia de cada evento. La probabilidad que al elegir una parcela al azar esta fue
sembrada con bueyes, P (bueyes) es de 160/800 = 0.20 20 %.
0 P(A) 1
Tiene dos reglas bsicas que la estructuran: la regla del producto y la regla de la
suma.
46
UNI Norte
), A interseccin B.
Regla de la Suma.
Para que dos eventos A y B se puedan sumar directamente, estos deben ser
incompatibles, es decir ellos no pueden ocurrir al mismo tiempo
= 0.
+ = (
).
= + (
) . Esta
En el ejemplo de arrojar dos veces una moneda al aire, la probabilidad que salga una
vez cara y el otro sol sin importar el orden, es la probabilidad de los eventos cara, sol
y sol, cara. Debido a que son cuatro los eventos posibles = cara cara, sol cara,
cara sol y sol-sol y cada uno con igual probabilidad, cada uno de esto eventos tiene
una P = 0.25, de ocurrencia. Por lo tanto la ocurrencia de cara-sol ms sol cara
Estadstica Bsica para Docentes de Educacin Secundaria
47
UNI Norte
\ =
()
()
Si p (B) 0
La condicin que P (B) > 0, esto es necesario para una buena definicin de
probabilidad condicional. Es de notar que si A y B son sucesos independientes, la P
(A\B) es igual a la P(A), es otro enfoque de mirar independencia. Cmo regla general
se enuncia que:
Dos eventos A y B son independientes si y slo si: P (A\B) = P (A) y P (B\A) = P (B)
que es lo mismo: (
) = P (A) x P (B)
48
UNI Norte
Varones
Mujeres
Total
por semana
No consume
30
10
40
1-5 veces
50
25
75
Ms de 5 veces
20
15
35
100
50
150
Total
(+5 )
( )
Varn
Mujer
20
20
30
30
56
44
Total
106
94
49
UNI Norte
Cul es la probabilidad que un estudiante, sin importar el sexo, sea del aula B?
Cul es la probabilidad que un estudiante sea del aula A, si el estudiante es mujer?
A1 A2 ... An = y Ai Aj = i j
A1
A2
An
Y si el conjunto de sucesos Ai que forman una particin del espacio muestral y sucede
que p (Ai) 0 Ai. Entonces si ocurre un suceso B dentro del mismo espacio muestral
y se cumple que:
= + +. . +
50
UNI Norte
A1
A2
B
An
= \ + \ +. . + \ =
\ ( )
=
51
UNI Norte
\ =
P B\Ai P(Ai )
n
i=1 P B\Ai P(Ai )
P= 0.27
P= 0.50
P= 0.23
Varn
Mujer
P= 0.25
P= 0.43
P= 0.33
Mujer
No
Consume
1-5 Gaseosas
+ 5 Gaseosas
Resolviendo por Bayes, la probabilidad que una mujer no consuma gaseosas es:
\ =
P M\NoC P(NoC)
P M\NoC P NoC + P M\1 5 P 1 5 + P M\ +5 P(+5)
\ =
0.27 (0.25)
= 0.20
0.27 (0.25) + 0.50 (0.33) + 0.23 (0.43)
52
UNI Norte
Prob.
Mquina
Prob.
Tipo de
produccin
0.45
0.30
0.25
0.03
0.97
0.04
0.96
0.05
0.095
53
UNI Norte
P B / D
PB .PD / B
P A.PD / A PB .PD / B PC .PD / C
0.300.04
12
0.316
0.450.03 0.30.04 0.250.05 38
P A / D
0.450.03
135
0.355
0.450.03 0.30.04 0.250.05 380
PC / D
0.250.05
125
0.329
0.450.03 0.30.04 0.250.05 380
54
UNI Norte
Ejercicio 3.5 Cierto artculo es manufacturado por tres fbricas: F1, F2 y F3. Se sabe
que la primera produce el doble de artculos que la segunda y que sta (F2) y la tercera
producen el mismo nmero de artculos (durante un perodo de tiempo especificado, el
mismo para las tres). Se sabe tambin que el 1.5% de los artculos producidos por las
dos primeras fbricas es defectuoso, mientras que en la tercera los es el 3.5%.
Se colocan juntos todos los artculos producidos por las tres fbricas y se escoge uno
al azar.
Cul es la Probabilidad de que un artculo sea Defectuoso?
Cul Fbrica tiene la mayor probabilidad de haber producido el artculo Defectuosos?
Ejercicio 3.6
En un aula hay 6 estudiantes realizando un examen, dos son mujeres y cuatro son
varones. Cul es la probabilidad que finalice una mujer de segunda dado que el
primero en finalizar fue un hombre?
Si la solucin es:
\ =
( ) 8/30 2
=
=
()
4/6
5
55