Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad IIB
Unidad IIB
OBJETIVO DE APRENDIZAJE
Reconocer variables y sus escalas de medicin, Agrupar datos en tablas Construir graficas apropiadas para representar los datos
An as, todas las encuestas tienen algunas caractersticas en comn. A diferencia de un censo donde todos los miembros de la poblacin son estudiados, las encuestas recogen informacin de una porcin de la poblacin de inters, dependiendo el tamao de la muestra en el propsito del estudio. La muestra es seleccionada cientficamente de manera que cada persona en la poblacin tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden ser proyectados con seguridad de la muestra a la poblacin mayor. La informacin es recogida usando procedimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. La intencin de la encuesta no es describir los individuos particulares quienes, por azar, son parte de la muestra sino obtener un perfil compuesto de la poblacin. Una encuesta recoge informacin de una muestra. Una muestra es usualmente slo una porcin de la poblacin bajo estudio. El estndar de la industria para todas las organizaciones respetables que hacen encuestas es que los participantes individuales nunca puedan ser identificados al reportar los hallazgos. Todos los resultados de la encuesta deben presentarse en resmenes completamente annimos, tal como tablas y grficas estadsticas. La observacin Otra tcnica til para el progreso de investigacin, consiste en observar a las personas cuando efectan su trabajo. Como tcnica de investigacin, la observacin tiene amplia aceptacin cientfica. Los socilogos, siclogos e ingenieros industriales utilizan extensamente sta tcnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organizacin. El propsito de la organizacin es mltiple: permite al analista determinar que se est haciendo, como se est haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, dnde se hace y por que se hace. Tipos de Observacin Se pueden observar de tres maneras bsicas. Primero, puede observar a una persona o actitud sin que el observado se d cuenta y su interaccin por aparte del propio analista. Quiz esta alternativa tenga poca importancia para el anlisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias. Segundo, el analista puede observar una operacin sin intervenir para nada, pero estando la persona observada enteramente consciente de la observacin. Por ltimo, puede observar y a la vez estar en contacto con las personas observas. La interaccin puede consistir simplemente en preguntar respecto a una tarea especfica, pedir una explicacin, etc. Preparacin para la observacin
1. Determinar y definir aquella que va a observarse. 2. Estimular el tiempo necesario de observacin. 3. Obtener la autorizacin de la gerencia para llevar a cabo la observacin. 4. Explicar a las personas que van a ser observadas lo que se va a hacer y las razones para ello. Conduccin de la observacin 1. Familiarizarse con los componentes fsicos del rea inmediata de observacin. 2. Mientras se observa, medir el tiempo en forma peridica. 3. Anotar lo que se observa lo ms especficamente posible, evitando las generalidades y las descripciones vagas. 4. Si se est en contacto con las personas observadas, es necesario abstenerse de hacer comentarios cualitativos o que impliquen un juicio de valores. 5. Observar las reglas de cortesa y seguridad. Secuela de la observacin 1. Documentar y organizar formalmente las notas, impresionistas, etc. 2. Revisar los resultados y conclusiones junto con la persona observada, el supervisar inmediato y posiblemente otro de sistemas.
ms fcilmente tres propiedades esenciales de una distribucin como son: Forma, tendencia central o acumulacin y dispersin o variabilidad. De esta forma, el histograma da una idea del proceso, lo que un simple examen de los datos tabulados no hace. Hay muchos mtodos para construir histogramas. Cuando los datos son numerosos, es muy til reunirlos en clases y se recomienda utilizar entre 4 y 20 clases (o celdas). A menudo conviene elegir un nmero total de clases igual aproximadamente a la raz cuadrada del tamao de la muestra. Las clases deben tener amplitud uniforme y se construye la primera de ellas comenzando con un limite inferior solo un poco menor que el valor mas pequeo de los datos. Se construye la ultima clase finalizando con un limite superior solo un poco mayor que el valor ms grande de los datos. Para realizar el histograma se marcan las clases sobre el eje de abscisas, y sobre cada clase se levanta un rectngulo de altura proporcional al numero de observaciones de la variable (frecuencia absoluta) que caen en la clase. El agrupamiento de los datos en clases condensa los datos originales, lo que da como resultado una perdida de algo de detalle. As, cuando el numero de observaciones es relativamente pequeo, o cuando las observaciones solo toman pocos valores, puede construirse el histograma a partir de la distribucin de frecuencias de los datos sin agrupar, dando lugar a los diagramas de barras. Las distribuciones de frecuencias son la herramienta ms sencilla y ms utilizada y eficaz cuando estamos rodeados de montones de datos, que no nos dicen nada si no hacemos ms que enumerarlos. Al expresar estos datos en forma de una distribucin de frecuencias, ya nos proporcionan diversas ideas. Puesto que las distribuciones de frecuencias se utilizan muy a menudo en el control de calidad, es necesario conocer la finalidad de las mismas y su interpretacin y uso. Dada la importancia de las distribuciones de frecuencias, derivada de que en todo proceso hay un momento en el que nos encontramos con un conjunto de datos sobre las variables a tratar, es de gran importancia formalizar el proceso de recogida, ordenacin y presentacin de los datos que, en la mayora de las ocasiones,
aparecern dispuestos en tablas de frecuencias de simple o doble entrada que servirn para analizar las distribuciones de las variables. Dada una variable X con valores x1 , x 2 ,, x N aparecen una serie de conceptos generales que se mencionan a continuacin: Frecuencia absoluta
x de la variable X, el numero de veces f que se repite ese valor. Frecuencia relativa f i : Se denomina frecuencia relativa del valor x de la variable X la relacin por cociente entre el nmero de veces que aparece el valor x y el nmero total de valores de la variable (N). sea, f i = f/N. Frecuencia absoluta acumulada F:: Se denomina frecuencia absoluta O
acumulada del valor xi a la suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a xi . Frecuencia relativa acumulada F i : Es la frecuencia absoluta acumulada dividida por el nmero total de valores =F/ N. De todas estas definiciones se extraen las siguientes deducciones: de la variable. Su valor es Fi
nmero total de elementos ( ni ,= N) igual La ltima frecuencia relativa acumulada es la unidad La ltima frecuencia relativa acumulada es el total de La suma de todos las frecuencias relativas acumular es
elementos (N).
Al conjunto de valores que ha tomado una variable, junto con sus frecuencias, se le denomina distribucin de frecuencias de la
caracterstica o variable. Para que una distribucin de frecuencias quede determinada es necesario conocer todos los valores de la variable y uno cualquiera de los conceptos de frecuencia que acabamos de definir, ya que el paso de uno a otro es inmediato. Adems, segn la forma en que se presenten los valores de la variable ser posible distinguir dos tipos de distribuciones de frecuencias: Las que no estn agrupadas en intervalos, que surgen cuando la informacin se dispone asociando a cada valor o categora de la variable su frecuencia. Aquellas cuyos valores observados generalmente aparecen agrupados en intervalos o clases [L i , L i 1 ] debido al elevado nmero de observaciones, y, por tanto, las frecuencias correspondientes a cada intervalo se obtienen sumando las de los respectivos valores de la variable que contiene. Cuando se trabaja con distribuciones agrupadas por intervalos o clases es necesario que las frecuencias observadas se asignen de alguna forma a los puntos del intervalo. Se podr optar por suponer que los valores del intervalo se distribuyen uniformemente a lo largo de el o por considerar como representativo de todos los puntos del intervalo un nico valor, por ejemplo, el punto medio del mismo, que denominaremos marca de clase (X;) y que, en consecuencia, se obtendr mediante X i = (L i 1 + L i )/2. Aunque la agrupacin de valores tiene la ventaja de simplificar el manejo de la informacin, presenta en cambio un importante inconveniente consistente en la perdida, en mayor o menor medida, de una parte de dicha informacin. La distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la tabla de frecuencias siguiente:
Ii [L 0 , L i ] =N 1 /N /N
Xi x1
ni n,
fi f 1 =n 1 /N [L 1 ,L 2 ]
Ni N 1 =n 1 x2 n2
Fi F1 f 2 =n 2 F 2 =N2/N
N2=n 1 +n 2
[L 2 , L 3 ] +n 3 [L k 1 , L k] +n k =N
x3 F 3 =N3/N xk Fk=Nk/N=1
n3
f 3 =n 3 /N
N 3=n 1 +n 2
nk
fk=n k /N
N k =n 1 +...
=N
=1
Cuando se trabaja con distribuciones de frecuencias uno de los problemas es la determinacin del nmero apropiado de clases. Aunque no existe una regla precisa para el nmero de clases, generalmente tratamos de no tener ni muchas ni muy pocas en la distribucin de frecuencias. El uso de demasiadas clases tiende a producir irregularidades en las frecuencias de las clases y obscurece la concentracin de valores. Por el contrario, si usamos un nmero excesivamente pequeo de clases, estas tienden a resumir y cierta informacin valiosa se pierde en el proceso. En la prctica, trataremos de no tener una distribucin de frecuencias con menos de 5 y ms de 15 clases. Para determinar el numero aproximado de clases, se puede hacer uso de la Regla de Sturges: k = 1 + 3.32 log( N ) K= nmero de clases, n= nmero total de observaciones de la muestra, log = logaritmo comn base 10. Adems el ancho del intervalo vendra dado por
ic =
Se debe dejar en claro que la Regla de Sturges es una aproximacin del nmero de clases, siempre es posible tomar una ms o una menos de lo que la formula nos da. Por ejemplo, si tenemos 142 observaciones, tenemos entonces
K = 1 + 3,32 log 142 = 8 clases Otro ejemplo, con n=40, tenemos; K = 1 + 3,3 2 log 40 = 6,29 El sentido comn acepta de buen agrado 6, 7 o 8 clases. El uso de esta formula puede dar resultados irrazonables cuando el numero de observaciones es muy grande o muy pequeo. Por esta razn la Regla de Sturges no es un sustituto del buen juicio. Ejemplo Los niveles de colinesterasa Se midieron los niveles de colinesterasa en un recuento de eritrocitos en mol/min/ml de 34 agricultores expuestos a insecticidas agrcolas, obtenindose los siguientes datos: Individuo Nivel Individuo Nivel Individuo Nivel 1 2 3 4 5 6 7 8 9 10 11 12 10,6 12,5 11,1 9,2 11,5 9,9 11,9 11,6 14,9 12,5 12,5 12,3 13 14 15 16 17 18 19 20 21 22 23 24 12,2 10,8 16,5 15,0 10,3 12,4 9,1 7,8 11,3 12,3 9,7 12,0 25 26 27 28 29 30 31 32 33 34 11,8 12,7 11,4 9,3 8,6 8,5 10,1 12,4 11,1 10,2
Niveles de Colinesterasa
es decir, una sugerencia de 6 intervalos. Como el mayor valor es 16.5 y el menor = 7.8, la longitud sugerida es
ic =
Parece, por tanto, razonable tomar como amplitud 1.5, obteniendo como intervalos en los que clasificar los datos [7.5 - 9), [9 10.5), [10.5 - 12) , [12 13.5) , [13.5 - 15) , [15 16.5] Los datos del de los Niveles de Colinesterasa, agrupados en los intervalos all obtenidos, proporcionan las cuatro siguientes distribuciones de frecuencias Distribuciones de Frecuencias
ic
7.5-9 9-10.5
f 3 8
fi 0.088
F 3
Fi 0'088
34 1
Diagrama de Sectores
Est representacin grfica consiste en dividir un crculo en tantos sectores circulares como modalidades presente el carcter cualitativo, asignando un ngulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con rea proporcional tambin a ni. As, los ngulos que corresponden a las cuatro modalidades de la tabla adjunta sern: Nmero de casos Rehusaron ciruga Rehusaron radiacin Empeoraron por una enfermedad ajena al cncer Otras causas 26 3 10 1 ngulo(grados) 234 27 90 9
Para obtener 234 se procede de la siguiente manera el total de datos es 40 que corresponde al 100% de los datos, adems representara 360 de la circunferencia. Mediante una regla de 3 podemos establecer que X =
con este proceso podemos obtener los otros datos de la tabla. Y su representacin en un diagrama de sectores ser:
Diagrama de Rectngulos
Esta representacin grfica consiste en construir tantos rectngulos como modalidades presente el carcter cualitativo en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la frecuencia absoluta o relativa (segn la distribucin de frecuencias que estemos representando), consiguiendo de esta manera rectngulos con reas proporcionales a las frecuencias que se quieren representar. La representacin grfica de la distribucin de frecuencias absolutas del ejemplo anterior ser de la forma:
Histograma
Al ser esta representacin una representacin por reas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no. Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser Frecuencia (rea) = amplitud del intervalo altura la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia. Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuacin anterior se cumpla. En el ejemplo de los Niveles de Colinesterasa, al tener los intervalos igual amplitud, la representacin grfica ser:
Si tuviramos una distribucin de frecuencias como la siguiente, correspondiente a puntuaciones obtenidas en un test psicolgico y en la que los intervalos son de diferente amplitud i 0-20 20-30 30-40 40-45 45-50 50-60 60-80 80-100 Total f 8 9 12 10 9 10 8 4 70 fi 8/70 9/70 12/70 10/70 9/70 10/70 8/70 4/70 1
Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de 2/70 para que el rea sea la frecuencia relativa 8/70. Procediendo de la misma manera con el resto de los intervalos obtendramos como representacin grfica la figura siguiente:
Obsrvese que la suma de todas las reas debe ser 1, tanto si los intervalos de la distribucin de frecuencias relativas son o no de igual amplitud.