Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Villarreal
UNIDAD
N2:
PRESENTACIN
DE
DATOS
ESTADSTICOS
PROBABILIDAD
UNIDAD N 5: TABLAS DE CONTINGENCIA
CONCEPTOS IMPORTANTES.
ESTADSTICA: Proviene del latn status (estado). Es
considerada como una disciplina perteneciente a
la Matemtica Aplicada que se dedica al estudio
cuantitativo de fenmenos colectivos. Proporciona
mtodos para:
- La recoleccin de datos
- Su ordenamiento, resumen y presentacin
- Su anlisis e interpretacin y
- Posterior enunciado de conclusiones
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
Estadstica
Descriptiva
Estadstica
Inferencial
CONCEPTOS IMPORTANTES.
POBLACIN: Es el conjunto de individuos u objetos
que comparten una caracterstica comn, en la
que el investigador est interesado.
Puede ser finita o infinita
MUESTRA: Es un subconjunto de la poblacin.
Debe ser representativa, es decir se deben
mantener las mismas caractersticas de la
poblacin de estudio.
EJEMPLO: una poblacin puede ser definida como los alumnos de la escuela San Francisco.
Los alumnos pueden ser listados e individualizados a travs de los registros ulicos
POBLACIN FINITA.
Personas portadoras de una enfermedad determinada en Santiago del Estero POBLACIN
INFINITA
Unidad de observacin
Dato
Alumno
Nmero de
materias rendidas
CONCEPTOS IMPORTANTES.
VARIABLE: Cualquier caracterstica que vara
de una unidad de muestreo a otra en la
poblacin o en la muestra.
Ejemplos: estado de salud de un alumno,
nmero de hermanos de cada alumno, medir
la altura de cada alumno, etc.
POBLACION
MUESTRA
INDIVIDUO
CONTINUA
Toma infinitos valores dentro
del intervalo
VARIABLES
CUALITATIVA
Los valores que puede
asumir son cualidades
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
A TRABAJAR!!
Hacemos la Actividad 1, pg. 35
Clasifique en base al siguiente listado las variables socieducativas, en cualitativas
nominales u ordinales y cuantitat. Discretas o continuas.
RELIGIN
N DE ALUMNOS PROMOCIONADOS POR
SECCIN.
BARRIOS
NIVEL DE EDUCACIN ALCANZADO POR EL
TUTOR
EDAD DE LOS ALUMNOS
SEXO
N DE INASISTENCIAS MENSUALES
ALTURA DE LOS ALUMNOS
LUGAR DE NACIMIENTO
PESO DE LOS ALUMNOS
HORAS DE JUEGO
N DE MATERIAS QUE CURSAN
N DE HERMANOS QUE TIENE CADA
ALUNMO
GRADO DE SATISFACCIN POR LA
ASIGNATURA
SUPERFICIE CONSTRUIDA POR ESCUELA
N DE ESCUELAS POR DEPARTAMENTO
CATEGORAS DE ESCUELA
SERIE DE DATOS
Categoras: xi
(Estado de salud)
Frecuencias: fi
(n de alumnos)
Sano
24
Enfermo
Total
30
i 1
f i 30
Ntese que i ahora se refiere a las categoras x1= Sano, f1=24; x2= Enfermo, f2= 6.
Los datos organizados en tabla de simple entrada para variable cualitativa, pueden
presentarse mediante grficos, que tiene la finalidad de que la informacin entre por los ojos.
El grfico que puede usarse en ste caso es el grfico de barras.
Con respecto al ejemplo:
Alumnos de un Jardn de Infantes de Crdoba
30
25
20
15
sano
10
enfermo
5
0
sano
enfermo
enfermo
sano
enfermo
sano
10
15
20
25
30
f
i 1
f1 f 2 24 6 30
As, a la frecuencia relativa de la clase i sima se la simboliza con fri y se la calcula de la siguiente
manera:
i
ri
i
f
i 1
ri
Si se multiplica las frecuencias relativas por 100, se obtienen los porcentajes, o tambin
conocida como la frecuencia relativa porcentual.
En este ejemplo, sera.:
i
xi
(ESTADO DE
SALUD)
fi
fri
Sano
24
24/30=
0,80
80
Enfermo
6/30= 0,20
20
30
100
Total
Se pueden representar estos datos mediante un grfico de barras, slo que en el eje vertical van
los porcentajes.
Otro grfico adecuado para representar series de frecuencias de variable cualitativa es el grfico
de sectores circulares, llamado grfico de tortas o pie charts.
Para su construccin, se elige un radio de por ejemplo 3cm (el valor del radio se elige segn el
espacio que se disponga) y se grafica un crculo. La superficie de dicho crculo representa el total
de alumnos (30), que le corresponde un ngulo de 360. Se puede discriminar mediante sectores
circulares la porcin correspondiente a los alumnos sanos y a los enfermos. Los grados
correspondientes a los sectores se obtienen multiplicando la frecuencia relativa por 360.
Siguiendo el ejemplo de estudio:
xi
(ESTADO DE SALUD)
fi
fri
360. fri
Sano
24
24/30= 0,80
360x0,80= 288
Enfermo
6/30= 0,20
360x0,20= 72
30
360
20%
sano
enfermo
80%
fi
fr
Fi
5/30=0,17
17
0,17
10
17
0,20
16
20
0,10
19
10
0,13
23
13
0,10
26
10
0,13
30
13
Total
30
1,0
100
INTERPRETACIN.
- El nmero 6 en la columna de fi significa que 6
alumnos tienen 2 hermanos.
- El nmero 19 en la columna de Fi significa que
19 alumnos tienen 3 hermanos o menos.
- El nmero 20 en la columna de porcentajes
significa que el 20% de los alumnos tienen 2
hermanos.
Frecuencia
5
4
3
2
1
Nmero de hermanos
Lic. En Educac. Inicial - UNSE - UNIDAD 1 y 2
ACTIVIDAD 3 PAG. 36
A los padres de 50 alumnos de seccin de 5 aos de jardn de infantes
MC:muy conforme
C: conforme
D: disconforme
I: indiferente
MD : muy disconforme
a. Indicar el tamao de la
muestra
b. Presentar los datos en una
tabla de frecuencias:
absoluta, relativa y relativa
porcentual.
c. Presentar los datos en un
grfico de barras
d. Realizar la conclusin
correspondiente.
Pasos a seguir:
1) Se ubica el valor mayor (99cm) y el menor (70cm) que toma la variable.
2) Se obtiene la diferencia, la que se denomina Rango o amplitud de variacin y se designa con la
letra R.
R = xmax xmin = 99cm 70cm = 29 cm
3) El nmero de intervalos aproximado se puede calcular con la siguiente frmula:
n de intervalos =
log( n 1)
log( 2)
Donde
n:n de valores de la serie o tamao
de la muestra.
log: logaritmo decimal.
log( n 1) log( 25 1)
4,7004 5
log( 2)
log( 2)
intervalos
4) El rango se divide entre el n de clases o intervalos de clases, 5 para este caso (se recomienda
que el nmero de intervalos no sea menor que 5 ni mayor que 15, pues en el primer caso se
reduce demasiado la informacin y el el segundo no se cumple con el objetivo del agrupamiento)
obtenindose una idea aproximada de la longitud o amplitud del intervalo de clase.
a=
Rango
29
5,8 6
nde int ervalos 5
5) Se delimitan las clases buscando preferentemente valores enteros para sus lmites. Se debe
elegir el lmite inferior del 1er intervalo de tal manera que contenga el menor valor de la serie
(70cm). La eleccin recae en el 70. El lmite superior del 1er intervalo, se obtiene sumando al Li la
amplitud.
Li del 1er intervalo= 70
Ls del 1er intervalo= Li+a = 70+5 = 75
70 - 75
El lmite inferior del 2do intervalo debe coincidir con el lmite superior del primer intervalo.
Li del 2do intervalo =75
Ls del 2do intervalo= Li + a= 75 +5=80
75 - 80
Xi
(marca de
clase)
fi
fri
70 a 75
72,5
4/25= 0,16
75 a 80
77,5
0,20
80 a 85
82,5
0,16
85 a 90
87,5
0,20
90 a 95
92,5
0,04
95 a 100
97,5
0,24
25
1,00
Total
[75 ; 80)
Abierto, no tomamos el Ls
7) Se agrega una tercera columna, titulada marca de clase o punto medio de clase que se
designa con xi que contiene los valores correspondientes a los puntos medios de cada uno de los
intervalos y se calcula as:
Li1 Ls1
70 75
x1
72,5
2
2
Li2 Ls2
75 80
x2
77,5
2
2
Un grfico adecuado para representar una serie de frecuencias de v.c.continua es el histograma. Su
construccin es sencilla: se utiliza el sistema de coordenadas cartesianas ortogonales, en el eje de las
ordenadas (vertical) se marcan las frecuencias fi y en el de las abscisas (horizontal) la variable segn la
cual se efectu la clasificacin (altura). Consiste en rectngulos adyacentes (uno por cada clase) con
bases materializadas por la amplitud de clases. La altura est dada por la frecuencia correspondiente a
cada clase. Cuando las clases son iguales, el rea del histograma es proporcional a la frecuencia total.
97,5
N alumnos
6
5
77,5
87,5
72,5
82,5
POLGONO
DE
FRECUENCIA
3
92,5
2
1
70
75
80
85
90
95
100
Altura (cm)
HISTOGRAMA
El Histograma y el Polgono de frecuencia son dos grficos que brindan la misma informacin. Si se
escogi la cantidad adecuada de intervalos, NO se produce lo que se denomina serrucho. En este
caso, como hay serrucho, debera reelegirse la cantidad de intervalos para obtener un histograma
adecuado
8
7
6
5
4
3
2
1
70
76
82
88
94
100 106
HISTOGRAMA
sin serrucho
POLIGONO DE FRECUENCIA
El polgono de frecuencia comienza un intervalo antes del primero de la tabla y finaliza uno
despus.
85
N alumnos
96
6
73
79
POLGONO
DE
FRECUENCIA
3
2
91
1
70
76
82
88
94
100
106
Altura (cm)
La media es la medida de posicin y tendencia central ms empleada para describir los datos;
constituye lo que la mayora de la gente denomina promedio.
A la media aritmtica se la representa con:
x1 x2 .... xn
x
x
i 1
n: tamao de la muestra
Ejemplo: Se registr los das de inasistencias en un ao, de una muestra de cinco alumnos de la
seccin maternal del jardn y se desea averiguar cual es el promedio de inasistencias de esa
muestra. La variable de estudio es:
X= n de inasistencias de los alumnos
Los valores de la variable son: xi= 0, 16, 12, 5, 7.
x
0 16 12 5 7
40
8
5
5
d x x 0
i
xi
di xi x
0 8= -8
5 8 = -3
7 8 = -1
12
12 8= 4
16
16 8 = 8
total
Una desventaja de la media es su sensibilidad a valores extremos, de modo que un valor excepcional puede
afectarla de una manera drstica, en este caso no representa en forma adecuada al centro de dicho conjunto y
tiende a dirigirse a ese valor extremo.
Si por equivocacin, en lugar de colocar 16 ponemos 66 veamos que ocurre:
X= inasistencias de alumnos
xi= 0, 66, 12, 5, 7.
0 66 12 5 7
90
x
18
5
5
La inasistencia promedio toma el valor 18, alejndose el promedio hacia
el valor extremo 66.
La media aritmtica no representa el centro del conjunto de datos. Este
problema o desventaja se resuelve utilizando otra medida de resumen de
datos denominada MEDIANA.
La mediana de un conjunto de datos es una la medida de tendencia central que divide a la serie
ordenada de datos en dos partes iguales, de tal forma que el 50% de los datos so menores o iguales
a la mediana y el otro 50% mayores o iguales a ella. La mediana se designa con Me.
b) Clculo de la mediana en una serie simple de datos.
Se consideran dos casos, cuando el tamao de la muestra (n) es par o es impar.
Considerando el ejemplo anterior, se desea determinar el valor mediano de las inasistencias de los
alumnos:
El tamao de la muestra n es impar
X= inasistencias de alumnos
xi= 0, 66, 12, 5, 7.
Para su clculo, debemos ordenar primero los datos en forma ascendente o descendente.
0,5,7,12,66
Si el nmero de observaciones es impar, la mediana es el valor de la variable que se localiza
exactamente en la mitad de la lista.
0, 5, 7, 12, 66
Me= 7 inasistencias
Interpretacin: el 50% de los alumnos tiene inasistencias menores o iguales a 7.
Lic. En Educac. Inicial - UNSE UNIDAD 3
n 1
2
Considerando otro ejemplo, en el caso de que n sea par, supongamos que contamos las
inasistencias de 6 alumnos.
X= Inasistencias de los alumnos
Xi= 0, 66, 12, 5, 7, 10.
Primero ordenamos los datos: 0, 5, 7, 10, 12, 66.
La muestra posee tamao n=6, o sea que la posicin de los valores centrales es: 6 1 7 3,5
2
2
Los valores centrales ocupan el tercer y cuarto lugar, la mediana se obtiene como el promedio
de los dos valores centrales.
0, 5, 7, 10, 12, 66.
7 10 8,5
8
2
2
EL Modo es el valor de la variable que ocurre con mayor frecuencia. Se designa frecuentemente
como Mo.
Se debe hacer notar aqu que el Mo es un valor de variable y la frecuencia de este valor sugiere su
importancia estadstica.
Cuando dos valores ocurren con la misma frecuencia y sta es la ms alta, ambos valores son
modas, por lo que el conjunto es BIMODAL. Cuando ms de dos valores ocurren con la misma
frecuencia y sta es la mas alta, todos los valores son modas, por lo que el conjunto es
MULTIMODAL.
Cuando ningn valor se repite, se dice que no hay moda.
Lic. En Educac. Inicial - UNSE UNIDAD 3
EJEMPLO:
Calcular la/s moda/s para el siguiente conjunto de datos:
SERIE A:6, 7, 1, 0, 0, 0, 7, 4, 3, 2, 8, 0
Cul es el nmero que ms se repite (mayor frecuencia)?
El 0
N de alumnos
(fi)
Total
25
25
x
i 1
25
5 veces
3 veces
2
25
25
x1 f1 x2 f 2 .... x5 f 5 1 n
x
xi f i
f1 f 2 ... f 5
n i 1
MEDIA
PONDERADA
N de
alumnos
(fi)
xi*fi
0*1=0
1*9=9
2*7=14
3*5=15
4*3=12
Total
25
50
1 n
1
x xi f i .50 2
n i 1
25
Podemos concluir diciendo que
los alumnos en promedio
poseen 2 hermanos.
2
3) Luego de ubicar la posicin de la mediana, se busca en la columna de frecuencias
acumuladas el menor valor que contiene al resultado obtenido con la frmula anterior. La
mediana ser el valor de la variable q corresponde a la frecuencia acumulada elegida.
Veamos un ejemplo:
Alumnos de la primera seccin del Jardn de una escuela rural, clasificados segn el nmero de
hermanos..
n 1 44 1 45
POSICIN
22,5
N de
N de
Frecuencias
2
2
2
hermanos
(xi)
alumnos (fi)
acumuladas
(Fi)
10
30
40
44
total
44
Me = 4
N de
hermanos
(xi)
N de
alumnos (fi)
30
Total
44
1 n
x xi fi
n i 1
N alumnos
fi
Marca de
clase
xi
Xi*fi
[10;12)
12
11
132
[12;14)
19
13
247
[14;16)
15
105
[16;18)
17
102
[18;20)
19
114
Total
50
1
x
n
x
i 1
fi
700
1
50
* 700 14kg
f
M e Linf
FanteriorMe
f Me
*a
N
alumnos
fi
Fi
[10;12)
12
12
[12;14)
19
31
[14;16)
38
[16;18)
44
[18;20)
50
Total
50
f
M e Linf
50
25
2
FanteriorMe
f Me
*a
50
12
25 12
13
2
M e 12
* 2 12
* 2 12 * 2
19
19
19
12 1,37 13,37kg
Mo Linf Mo
D1
*a
D1 D2
12
[12;14)
19
[14;16)
[16;18)
[18;20)
Total
50
Mo Linf Mo
D1
*a
D1 D2
7
7
Mo 12
* 2 12 * 2 12 0,74 12,74kg
12 7
19
MEDIA
ARITMETICA
MEDIANA
MODO
V. CUALITATIVA
ORDINAL
NO
SI
(en algunos
casos)
SI
V. CUALITATIVA
NOMINAL
NO
NO
SI
V.
CUANTITATIVA
DISCRETA
SI
SI
SI
V.
CUANTITATIVA
CONTINUA
SI
SI
SI
INTRODUCCIN
La teora de probabilidad tiene sus orgenes en la teora de la
casualidad. Histricamente, la teora de la Probabilidad comenz
con el estudio de los juegos de azar, tales como la ruleta y las
cartas.
Por ejemplo, para tomar decisiones en cualquiera de nuestros
mbitos cotidianos, analizamos todos los factores que puedan
incidir en dicha decisin, que certeza hay de que ocurran ciertos
eventos y cuales de que no ocurran. Sin darnos cuenta, aplicamos
conceptos intuitivos de la probabilidad.
Antes de estudiar la teora de probabilidad, es importante conocer
el concepto de azar.
Lic. En Educac. Inicial - UNSE UNIDAD 4
N de casos favorables a A
P( A)
N total de casos igualmente posibles
Ejemplos:
La probabilidad de extraer un as de espada de
una baraja de 52 naipes, es iguala a 1/52.
La probabilidad de sacar un as de espadas rojo
es cero, puesto que no hay figuras de espadas
rojas en la baraja.
La probabilidad de extraer 6 manzanas de un
cajn que trae 20 manzanas es 6 / 20
Donde:
-El nmero de resultados favorables es 3, ya que A= { 2, 4, 6}, tiene tres
elementos.
-El nmero total de resultados es 6, ya que M= { 1, 2, 3, 4, 5, 6} tiene 6
elementos.
Lic. En Educac. Inicial - UNSE UNIDAD 4
P( A B)
P( B / A)
P( A)
P( A B)
P( A / B)
P( B)
Poco
comprometido
Comprometido
Total
Desocupado
20
10
35
Trabajo
permanente
10
15
10
35
Trabajo
temporario
15
10
30
Total
45
35
20
100