Documentos de Académico
Documentos de Profesional
Documentos de Cultura
sociales
por marubas23amas | buenastareas.com
CAPITULO I
1. INTRODUCIN.
Matemticas Bsicas.
Por qu estudiar estadstica?
2. ESTADSTICA.
La estadstica y su empleo.
Qu es la estadstica?
Estadstica descriptiva.
Estadstica inferencial.
3. POBLACIN Y MUESTRA.
La poblacin y su clasificacin.
La muestra.
Ejercicios prcticos tema 3
4. MUESTREO.
El muestreo aleatorio.
El muestreo sistemtico.
El muestreo estratificado.
El muestreo por conglomerados.
5. VARIABLES.
Variable.
Variable aleatoria.
Variable continua.
Variable discreta.
Variable Cuantitativa.
Variable Cualitativa.
1. INTRODUCCIN.
Por qu estudiar estadstica?
2. ESTADSTICA.
La estadstica y su empleo?
La estadstica es una de las herramientas ms ampliamente utilizadas en la investigacin
cientfica. Se emplea en las instituciones gubernamentales y educativas, en los negocios
en la industria y en otras organizaciones. El empleo juicioso de las tcnicas estadsticas
permite obtener conclusiones tiles a partir de un conjunto de datos numricos.
Sin embargo el trmino estadstica tiene distintos significados para diferentes personas.
Para algunos no es ms que informacin numrica, para otros es un mtodo para
obtener, presentar y describir grandes cantidades de datos y para otros es un mtodo
para tomar decisiones en situaciones de incertidumbre. Los objetivos principales de este
captulo son aclarar los significados de estadstica, definir sus conceptos bsicos
utilizados con mayor frecuencia.
Nos enfocaremos en la divisin de la estadstica en dos reas principales, la estadstica
Ejemplo: Un gerente de personal desea conocer las aptitudes de cinco oficinistas que
trabajan en una compaa. Se aplica una prueba de aptitudes a los cinco empleados y las
calificaciones son 82, 85, 95, 92 y 91. La medida estadstica que emplea el gerente de
personal es la aptitud promedio o media aritmtica, la cul es la suma de los valores
obtenidos dividida entre el nmero de observaciones.
82 + 85 + 95 + 92 + 91 = 445 = 89
55
El resultado se limita a los datos obtenidos en este caso particular y no aplica ninguna
inferencia o generalizacin acerca de las aptitudes de otros oficinistas. Este mtodo es de
naturaleza descriptiva, debido a que el promedio condensa y describe la informacin
obtenida.
Adems los datos pueden representarse en numerosas formas visuales. Una de ellas
utilizadas con mayor frecuencia es la grfica de barras.
Estadstica Inferencial.
3. POBLACIN Y MUESTRA.
La poblacin y su clasificacin.
La poblacin es uno de los conceptos bsicos que existe en la estadstica, llamamos
poblacin a la totalidad de todas las posibles observaciones y mediciones bajo
consideracin es una situacin dada un problema.
Es un conjunto de individuos uobjetos acerca del cual se quiere saber algo o tambin, es
el total de la informacin, o de los objetos con una caracterstica en comn de inters para
un estadstico o una investigacin particular.
Cada situacin diferente implica una poblacin diferente. Si el problema consiste en
evaluar el coeficiente intelectual promedio de todos los nios de las primarias del Estado
de Michoacn, entonces los C.I. de todos los nios constituyen la poblacin. Si la finalidad
de una investigacin es determinar qu proporcin de todas las unidades producidas en
cierto proceso de manufactura es defectuosa, entonces la poblacin consiste en las
mediciones de calidad de todas las unidades producidas mediante ese proceso.
A la poblacin generalmente se le clasifica en dos categoras finitas e infinitas. Una
poblacin finita es aquella que incluye un nmero limitado de medidas y observaciones.
Por ejemplo son poblaciones finitas el conjunto de las alturas de todos los estudiantes que
actualmente estn presentes en el aula, o el conjunto de calificaciones del presente ciclo
escolar en la Licenciatura en Psicologa Educativa. Se dice que una poblacin es infinita si
incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por
conteo, por ejemplo la poblacin formada por los nacimientos de personas del presente y
futuro, o el conjunto de estrellas que forman el universo.
Muestra.
Si los valores numricos que provienen de una variable provienen de factores fortuitos y si
un determinado valor no se puede predecir exactamente con anticipacin, esa variable se
denomina variable aleatoria.
Para representar las variables aleatorias utilizaremos letras maysculas como X, Y y Z.
De esta manera podremos referirnos a la variable aleatoria edad como X o a la variable
aleatoria estatura como Y. Los valores individuales de una variable aleatoria se
representarn con letras minsculas tales como x, y, y z. Si por ejemplo, la variable
aleatoria X tiene 6 valores, nos referimos a esos valores como x1, x2, x3, x4, x5, x6. Los
subndices servirn para distinguir un valor de la variable aleatoria de otro.
Variable continua.
Una variable continua es aquella que tericamente puede tomar cualquier valor dentro de
un intervalo de valores. Es decir, una variable continua semide uniformemente. Otra
manera de explicar lo que es una variable continua consiste en decir que, sin importar que
tan cerca puedan estar dos valores de una variable, es posible tericamente hallar otra
variable cuyo valor se pueda colocar entre ellos. Un ejemplo de variables continua es la
estatura humana. Sin tener en cuenta que tan prxima sea la estatura de dos personas,
es posible tericamente encontrar otra persona que sea ms alta que la ms baja y a la
vez ms baja que la ms alta de las dos.
Nuestra posibilidad de identificar a tal persona en la prctica puede dificultarse por las
limitaciones de los instrumentos de medida disponibles. Otras variables continuas pueden
ser aquellas que se miden con una escala de peso o de temperatura.
Variable discreta.
Cuando los valores que puede tomar una variable estn separados entre s por una
determinada cantidad, la variable se denomina discreta. Una caracterstica de la variable
discreta es la presencia de vacios o interrupciones entre los valores que se pueden
tomar. Como ejemplos de la variable discreta puede citarse, el nmero de admisiones en
un hospital durante un da determinado, el nmero de accidentes automovilsticos que se
producen dentro de los lmites de una ciudad durante un mes, el nmero de colonias de
bacterias en una placa de agar y el nmero de estudiantes de primer ao en un sistema
escolar determinado.
Variable cuantitativa.
Se dice que una variable, es una variable cuantitativa siempre que los valores que puede
asumir sean los resultados de medidas numricas. Ejemplos de variable cuantitativa son
CAPITULO II
6. NIVELES DE MEDICIN.
Nominal
Ordinal
De intervalo
De razn.
7. MEDIDAS DE TENDENCIA CENTRAL.
Media aritmtica.
Mediana.
Moda.
Ejercicios prcticos del tema 7
8. MEDIDAS DE DISPERCIN
Desviacin tpica.
Datos agrupados.
La varianza.Ejercicios prcticos tema 8
9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.
Distribucin de frecuencias.
Representacin grfica.
Ejercicios prcticos tema 9
6. NIVELES DE MEDICIN.
La medicin puede definirse como la asignacin de nmeros a objetos y eventos de
acuerdo con ciertas reglas; la manera como se asignan esos nmeros determina el tipo
de escala de medicin (Stevens, 1946; Cohen y Cohen, 1975;Saris y Stronkhorst, 1984).
Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema se
transforma en explicitar a)las reglas para asignar nmeros, b)las propiedades
matemticas de las escalas resultantes, y c)las operaciones estadsticas aplicables a las
medidas hechas con cada tipo de escala.
Las propiedades del sistema numrico asociadas con las escalas de medicin son la
identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957): 1-Identidad: cada
nmero tiene un significado particular. 2-Magnitud: los nmeros tienen un orden inherente
ascendente o descendente. 3-Intervalos iguales: las diferencias entre nmeros en
cualquier punto de la escala son las mismas (la diferencia entre 10 y 20 es la misma que
entre 100 y 110). 4-Cero absoluto: el punto cero en la escala de medicin representa la
ausencia de la propiedad que se estudia.
A continuacin se presenta un resumen de las caractersticas, propiedades y aplicaciones
de cada una de las escalas mencionadas (Stevens, 1957; Cohen y Cohen, 1975; Saris,
1984)
Escala nominal. En esta escala las unidades observacionales (UO) se agrupan en clases
excluyentes segn determinada propiedad, con lo que sedefine una particin sobre el
conjunto de tales unidades. Los nmeros se usan como identificadores o nombres.
Cuando se estudia el desempleo de un pas y se incluye la variable sexo, se codifica
masculino como 1 y femenino como 2, por ejemplo; los nmeros 1 y 2 representan
categoras de datos: son simples identificadores y son completamente arbitrarios. La
operacin matemtica permitida es el conteo.
Escala ordinal: Surge a partir de la operacin de ordenamiento; en esta escala se habla
de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto est cerca o
lejos del segundo puesto. Los valores de la escala representan categoras o grupos de
pertenencia, con cierto orden asociado, pero no una cantidad mensurable. La escala
ordinal tiene las propiedades de identidad y magnitud. Los nmeros representan una
cualidad que se est midiendo, y expresan si una observacin tiene ms de la cualidad
medida que otra UO. La distancia entre puntos de la escala no es constante: no se puede
determinar la distancia entre las categoras, slo es interpretable el orden entre sus
valores. Ejemplos: situacin socioeconmica, nivel educativo.
Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de
la distancia entre puntos de escala de la misma amplitud. Aqu puede establecerse orden
entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente
entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero
arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones
aritmticas de multiplicacin y divisinno son apropiadas. Cumple con las propiedades de
identidad, magnitud e igual distancia. La igual distancia entre puntos de la escala significa
que puede saberse cuntas unidades de ms tiene una UO comparada con otra, con
relacin a cierta caracterstica analizada.
Escala de razn. Corresponde al nivel de medicin ms completo. Tiene las mismas
propiedades que la escala intervalos, y adems posee el cero absoluto. Aqu el valor cero
no es arbitrario, pues representa la ausencia total de la magnitud que se est midiendo.
Con esta escala se puede realizar cualquier operacin lgica (ordenamiento,
comparacin) y aritmtica. A iguales diferencias entre los nmeros asignados
corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.
Ejemplos: longitud, peso, distancia, ingresos, precios.
A manera de conclusin es importante tener siempre presente la escala de medicin que
se est usando, pues no todos los procedimientos estadsticos son apropiados para
cualquier anlisis. En general, las variables estadsticas se clasifican en variables
continuas o cuantitativas y variables discretas o cualitativas, segn el nivel de escala en
que estn medidas. Las variables continuas se refieren a magnitudes medidas en escala
de intervalos o de razn, mientras que las variables discretas comprenden magnitudes
medidas en escalas de nivel nominal y ordinal.
total de puntos queobtiene una persona promedio al participar en esa prueba, saber cul
es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.
En otras palabras, para que una calificacin tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos criterios estadsticos.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno
se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65
puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por
debajo del promedio de la clase.
En resumen, el propsito de las medidas de tendencia central es:
Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.
Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el
puntaje central o tpico.
Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms
grupos.
La media aritmtica: comnmente conocida como media o promedio. Se representa por
medio de una letra M o por una X con una lnea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se
representa como Md.
La moda: que es el puntaje que se presenta con mayorfrecuencia en una distribucin. Se
representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms
til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy
bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la
moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores
extremos).
La media es considerada como la mejor medida de tendencia central, por las siguientes
razones:
Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media.
Es la medida de tendencia central ms conocida y utilizada.
Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que
las medianas y las modas de las distribuciones no se promedian.
La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la
mediana y la moda en muy pocos casos.
6 = 54
Frecuencia total = 63
430
Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor,
por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia
absoluta es 10, significa que el valor a que corresponde se repite 10 veces).
Moda (Mo)
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o
sea, cual se repite ms.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de
nias de un Jardn Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto
de valores no tiene moda.
Mediana (Med)
Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a
menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante
corresponde al nmero del caso que representa la mediana de la distribucin.
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.
Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de
valores antes y despus de l en un conjunto dedatos agrupados.
Segn el nmero de valores que se tengan se pueden presentar dos casos:
Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho
conjunto de datos.
Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores
centrales (los valores centrales se suman y se dividen por 2).
Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10
8. MEDIDAS DE DISPERCIN
A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de
informacin que aportan individualmente, no hay que dejar de sealar que en muchas
ocasiones esa informacin, no slo no es completa, sino que puede inducir a errores en
su interpretacin. Veamos algunos ejemplos.
Consideremos dos grupos de personas extrados como muestras respectivas de dos
poblaciones distintas: el primero est compuesto por 100 personas que asisten a la
proyeccin de una pelcula para nios, y el segundo por 100 personas elegidas entre los
asistentes a una discoteca juvenil.Pudiera ocurrir que, aun siendo las distribuciones de las
edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas.
(Da un ejemplo concreto en que esto ocurra).
Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes
entradas en miles de pesos, a lo largo de dos semanas correspondientes a pocas
distintas del ao.
1 semana
2 semana
10
30
20
40
30
50
50
50
60
60
80
60
100
60
350
350
La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los
dos casos) y, sin embargo, las consecuencias que se podran derivar de una y otra tabla
son bien distintas.
Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras
medidas, aparte de los valores de centralizacin, que nos indiquen la mayor o menor
desviacin de cada observacin respecto de aquellos valores.
Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son:
Rango o amplitud, desviacin media y desviacin tpica.
RANGO, AMPLITUD TOTAL O RECORRIDO
El rango se suele definir como la diferencia entre los dos valores extremos que toma la
variable. Es la medida de dispersin ms sencilla y tambin, por tanto, la que proporciona
menos informacin. Adems, esta informacin puede ser errnea, pues el hecho de que
no influyan ms de dos valores del total de la serie puede provocar una deformacin de la
realidad.
Comparemos, por ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero estn desigualmenteagrupadas, pues mientras la
primera tiene una mayor concentracin en el centro, la segunda se distribuye
uniformemente a lo largo de todo el recorrido.
El uso de esta medida de dispersin, ser pues, bastante restringido.
DESVIACIN MEDIA
En teora, la desviacin puede referirse a cada una de las medidas de tendencia central:
Ntese que se toman las desviaciones en valor absoluto, es decir, que la frmula no
distingue si la diferencia de cada valor de la variable con la media es en ms o en menos.
Ya se habr advertido que esta expresin sirve para calcular la desviacin media en el
caso de datos sin agrupar. Veamos un ejemplo:
Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacin media de estos
valores.
2
-3
3
2
3
3
4
-1
1
4
-1
1
4
-1
1
5
0
0
6
1
1
7
2
2
8
3
3
8
3
3
DM = 1,8
Veamos ahora cmo se calcula la desviacin media en el caso de datos agrupados en
intervalos.
donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de
los intervalos correspondientes.
Adems, las desviaciones son de cada centro, o marca de clase, a la media aritmtica. Es
decir,
Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los
100 empleados de una cierta empresa:
Clase
ni16-20
2
20-24
8
24-28
8
28-32
18
32-36
20
36-40
18
40-44
15
44-48
8
48-52
3
veamos cmo se procede:
Clase
ni
xm
ni xm
ni
16-20
2
18
36
16,72
33,44
20-24
8
22
176
24-28
8
28-32
18
32-36
20
36-40
18
40-44
18
44-48
8
48-52
3
100
DM = 6,09
La desviacin media viene a indicar el grado de concentracin o de dispersin de los
valores de la variable. Si es muy alta, indica gran dispersin; si es muy baja refleja un
buen agrupamiento y que los valores son parecidos entre s.
La desviacin media se puede utilizar como medida de dispersin en todas aquellas
DESVIACIN TPICA
Es sin duda la medida de dispersin ms importante, ya que adems sirve como medida
previa al clculo de otros valores estadsticos.
La desviacin tpica se define como la raz cuadrada de la media de los cuadrados de las
desviaciones con respecto a la media de la distribucin. Es decir,
3,24
16
5,8
33,64Primero hallamos = 10,2
luego S =
Clculo de la desviacin tpica para datos agrupados en clases y agrupados por
frecuencias
Mtodo largo: Se aplica la siguiente frmula
donde:
I: amplitud de la clase
D: distancia en clases desde cada una en concreto a la clase que contiene a la media
supuesta A.
Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen as:
Clases
F
150 155
155 160
160 165
165 170
170 175
175 180
180 185
185 190
190 195
195 200
3
6
12
18
25
17
10
7
4
1
103
Resp: S = 9,56
9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.
Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y
categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que
pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente
con las frecuencias de clases se denomina distribucin de frecuencias
El caso que se describe a continuacin, variables discretas se denomina distribucin por
conteo de valores individuales. Supongamos que un determinado colectivo, representado
por la variable estadstica Xi, que para mayor sencillez consideraremos como
unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un
suceso) X1, X2, , Xn (supuesto que sean n los valores de la variable considerada.)
Definiremos como frecuencia de un dato el nmero de veces que este aparece en el
colectivo; consecuentemente, si unavariable estadstica toma r valores, cada uno de los
cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de
datos representado por la variable seran N, siendo N la suma de las respectivas
frecuencias de cada dato (N=Xi).
Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada
dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La
frecuencia absoluta nos habla del nmero de veces que un dato aparece en un
colectivo, ms ello no nos dice demasiado en orden al establecimiento de comparaciones
sobre la importancia de este dato. Para obtener una idea de la importancia que un dato
posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se
utiliza el concepto frecuencia relativa, que se definir como: el coeficiente entre la
frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/Xi).
Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:
Xn
Fn
fn/N
Donde:
N=fi y fi/N=1
Otro es el caso de las clases representadas en forma de intervalos, variables continuas,
llamados intervalos de clases que poseen extremos llamados lmite inferior y lmite
superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene
el lmite correspondiente.
La longitud, tamao o amplitud de un intervalo de clases (C) es la diferencia entre los
limites superior e inferior (C=lim sup lim inf). El Recorrido (R) es la diferencia entre el
dato mayor y el menor del conjunto da datos en estudio (R=Xn X1)
En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar
a un resumen efectivo de la informacin original. A menudo es necesariorepresentar una
clase, o ms particularmente, un intervalo por un nico valor, este representar a todo el
intervalo y se denominar marca de clases. Matemticamente el punto medio de cada
intervalo corresponde a lo que denominamos marca de clase, se denotar por Xi, y
constituir el valor representativo de cada intervalo. El nmero de observaciones que
correspondan a cada intervalo se denominar frecuencias absolutas.
Tabla #2: Variables Continuas
Intervalos
(C)
Marcas de Clases
Xi
Frecuencias Absolutas
fi
X1-X2
X1
f1
X2-X3
X2
f2
Xn-1-Xn
Xn
Fn
Donde
N = fi = Nmero de observaciones
C = X X" = Amplitud del intervalo
Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como
la siguiente:
Tabla #3: Variable Ordinales
Variable
Frecuencias
Caracterstica A
Fa
Caracterstica B
Fb
Caracterstica Z
Fz
Reglas Generales para construir las distribuciones de frecuencias por intervalos
A = ( X1, X2, , Xn )
1. Efectuar el arreglo ordenado (Ascendente o Descendente) de la poblacin o muestra
2. Obtener la frecuencia absoluta mediante la tabulacin o conteo de los datos
(homogenizar los datos)
R = (valor mayor valor menor) = Xn X1
3. Encontrar el rango o recorrido (R) de los datos:
4. Encontrar el nmero de clases o intervalos de clases (K). El nmero de clases debe ser
tal que se evite el detalle innecesario, pero que no conduzca a la prdida de ms
informacin de la que puede ser convenientemente ignorada. Para este clculo se utiliza
la formula de Sturges
K = 1 + 3.322(log. N)
5- Determinar la amplitud dela clase ( C ):
R
C = -------K
Nota: el resultado siempre se aproxima al siguiente entero si excede al nmero entero
Solucin:
1. A= ( 7.42, 8.15, , , , 90.99, 93.91 )
donde: X1 = valor mnimo = 7.42
Xn= valor mximo = 93.91
2. Efectuar el arreglo ordenado de la poblacin o muestra:
R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49
3. Encontrar el rengo o recorrido de los datos: "R"
K=1+3.322(log N)
Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra:
K = 1 + 3.322 (log 30)
= 1 + 3.322 (1.477) el log fue obtenido segn calculadora
= 1+ 4.9069
= 5.9069 ~6 aproximado al siguiente entero
4. Encontrar en nmero de clases "K" , segn la frmula de Sturges:
5. Determinar la amplitud de la clase: "C"
Nota: obsrvese que se va a trabajar con una cifra significativa mscmoda, o sea como
los datos estn dados en centsimos, se calculo C hasta los milsimos para evitar que
algn dato coincida con el lmite de clases
Clases
P.M.
Xi
fi
fr
fa
fa
fra
fra
7.420 21.835
14.628
10
0.33
10
30
0.33
1.00
21.835 36.250
29.043
4
0.13
14
20
0.46
0.67
36.250 50.665
43.458
5
0.17
19
16
0.63
0.54
50.665 65.080
57.873
3
0.10
22
11
0.73
0.37
65.080 79.495
72.288
3
0.10
25
8
0.83
0.27
79.495 93.910
86.703
5
0.17
30
5
1.00
0.17
Total
XXX
30
1.00
XXX
XXX
XXX
XXX
Simbologa utilizada:
XI = Punto medio o marca de clases
fi = frecuencia absoluta
fr = frecuencia relativa
fa = frecuencia absoluta acumulada descendente
fa = frecuencia absoluta acumulada ascendente
fra = frecuencia relativa acumulada descendente
fra = frecuencia relativa acumulada ascendente
Nota:
i. Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( X1=7.42 ) y el
lmite superior es el resultado de X1+C = 7.42+14.415 = 21.835.
ii. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el
lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ).
iii. Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xn=93.91 )
Polgono de frecuencias:
El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los
centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias
de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro
de clase se seala mediante un punto y luego los puntos consecutivos se unen por lneas
rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia uniendo
los puntos medios de las bases superiores de cada rectngulos mediante lneas rectas.
Ojivas:
Las ojivas se refieren a los grficos que se construyen utilizando unadistribucin
acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin
de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que
se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del
CAPITULO III
Por ejemplo:
Sea el mismo conjunto A={a,b,c,d}, cuntas ordenaciones sin repeticin se pueden
obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
que siempre ocurren son los eventos seguros, y los que nunca son los eventos
imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier
proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razn, se
define como experimento aleatorio al proceso en el que se pueden predecir con certeza la
ocurrencia de sus eventos, con excepcin del seguro o del imposible. Hay que hacer la
observacin que esta definicin habla en trminos generales y no especficamente sobre
algn experimento en particular.
A aqulla variable que est asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.Cuando hablamos de varios eventos dentro del mismo experimento se
pueden dar varios casos.
Si dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente
excluyentes, es decir, que la interseccin de ambos eventos es vaca.
Por otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es
decir, un evento A ocurre dado que ocurri un evento B. Si existe este tipo de relacin
entre eventos se dice que son eventos dependientes o condicionados (el
evento A depende del evento B, o el resultado del evento A est condicionado al resultado
del evento B). Por otro lado, si no existe tal relacin entre eventos se dice que
son eventos independientes. Los criterios de dependencia o de independencia se
definirn ms adelante, en trminos de probabilidad condicional.
Probabilidad de eventos
Para calcular la probabilidad de eventos es necesario que stos se comporten de una
manera ms o menos estable. Precisamente, se echa mano de la regularidad estadstica,
que es la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el
nmero de repeticiones de un experimento en condiciones prcticamente constantes,
la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.
Sin embargo, al momento de definir la probabilidad de un evento podemos tomar en
cuenta los siguientes criterios:
1. La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y
depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su
Posibilidades y probabilidades
Se habla muy comnmente en sitios de apuestas, como en las autdromos o hipdromos,
de que "las apuestas a tal o cual participante es de x a y", es decir, que las posibilidades
de que gane es de x a y. Esta manera de expresarse se refiere al uso de razones.
En trminos generales, la posibilidad de que ocurra un evento se determina mediante la
razn de la probabilidad de que ocurra a la probabilidad de que no ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las
posibilidades de que ocurra son x a y, es decir
Tales que x y y son enteros positivos.
Por ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de que las
dos monedas caigan cara es de . Esto quiere decir si alguien apuesta a que las dos
monedas no caen simultneamente en cara, la posibilidad de ganar la apuesta es de
es decir, 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento,
entonces se acostumbra mencionar las posibilidades en contra del evento.
Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un
cuatro es 1/6, es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se
acostumbra decir que las posibilidades en contra, esto es, de no obtener un cuatroes de 6
a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es fcil
obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la
probabilidad p de que ocurra tal evento es
Por ejemplo: En la Copa Mundial de Futbol Francia 1998 se deca que el equipo mexicano
tena una posibilidad de 1 a 75 de llegar a ser el campen del torneo.
Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser campen,
entonces se tiene que
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinacin con el tercer axioma de la
probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre las
posibilidades que le asignan a algunos eventos. Esto quiere decir que el clculo de las
probabilidades de dos eventos mutuamente excluyentes a partir de las posibilidades
otorgadas de manera subjetiva resulta como un criterio de consistencia.
Por ejemplo: Un criminlogo piensa que las posibilidades de que en la prxima semana la
cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que
sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la
cantidad o sea la misma es de 7 a 4.
Si se desea saber si son consistentes las probabilidades correspondientes habra que
hacer los clculos.
Las probabilidades de aumente la cantidad de delitos, sea igual la cantidad de delitos, y
de que aumente o sea igual la cantidad de delitos es, respectivamente, de
y dado que (como son eventos mutuamente excluyentes) no es lo mismo que 7/11,
entonceslos criterios del criminlogo pueden ser cuestionados.
Propiedades de la probabilidad de eventos no elementales