Está en la página 1de 14

Unidad II

OBJETIVO DE APRENDIZAJE

Al finalizar la unidad el alumno podr :

Reconocer variables y sus escalas de medicin, Agrupar datos en tablas Construir graficas apropiadas para representar los datos

Tcnicas de Recoleccin de Datos


En estadstica se utilizan una variedad de mtodos a fin de recopilar los datos sobre ciertas situaciones entre estos mtodos tenemos la entrevista, la encuesta y la observacin. Cada una tiene desde luego ventajas y desventajas. En general se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigacin optima. La entrevista Las entrevistas se utilizan para recabar informacin en forma verbal, El se puede entrevistar al personal en forma individual o en grupos algunos prefieren este mtodo a las otras tcnicas. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicacin. Una de las ventajas de la entrevista ofrece al analista una excelente oportunidad para establecer una corriente de simpata con el personal usuario, lo cual es fundamental en transcurso del estudio. La encuesta La encuesta se usa ms frecuentemente para describir un mtodo de obtener informacin de una muestra de individuos. Esta muestra es usualmente slo una fraccin de la poblacin bajo estudio. Por ejemplo, antes de una eleccin, una muestra de electores es interrogada para determinar cmo los candidatos y los asuntos son percibidos por el pblico un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto una entidad del gobierno comisiona una encuesta para obtener informacin para evaluar legislacin existente o para preparar y proponer nueva legislacin. No tan slo las encuestas tienen una gran variedad de propsitos, sino que tambin pueden conducirse de muchas maneras, incluyendo por telfono, por correo o en persona.

An as, todas las encuestas tienen algunas caractersticas en comn. A diferencia de un censo donde todos los miembros de la poblacin son estudiados, las encuestas recogen informacin de una porcin de la poblacin de inters, dependiendo el tamao de la muestra en el propsito del estudio. La muestra es seleccionada cientficamente de manera que cada persona en la poblacin tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden ser proyectados con seguridad de la muestra a la poblacin mayor. La informacin es recogida usando procedimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. La intencin de la encuesta no es describir los individuos particulares quienes, por azar, son parte de la muestra sino obtener un perfil compuesto de la poblacin. Una encuesta recoge informacin de una muestra. Una muestra es usualmente slo una porcin de la poblacin bajo estudio. El estndar de la industria para todas las organizaciones respetables que hacen encuestas es que los participantes individuales nunca puedan ser identificados al reportar los hallazgos. Todos los resultados de la encuesta deben presentarse en resmenes completamente annimos, tal como tablas y grficas estadsticas. La observacin Otra tcnica til para el progreso de investigacin, consiste en observar a las personas cuando efectan su trabajo. Como tcnica de investigacin, la observacin tiene amplia aceptacin cientfica. Los socilogos, siclogos e ingenieros industriales utilizan extensamente sta tcnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organizacin. El propsito de la organizacin es mltiple: permite al analista determinar que se est haciendo, como se est haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, dnde se hace y por que se hace. Tipos de Observacin Se pueden observar de tres maneras bsicas. Primero, puede observar a una persona o actitud sin que el observado se d cuenta y su interaccin por aparte del propio analista. Quiz esta alternativa tenga poca importancia para el anlisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias. Segundo, el analista puede observar una operacin sin intervenir para nada, pero estando la persona observada enteramente consciente de la observacin. Por ltimo, puede observar y a la vez estar en contacto con las personas observas. La interaccin puede consistir simplemente en preguntar respecto a una tarea especfica, pedir una explicacin, etc. Preparacin para la observacin

1. Determinar y definir aquella que va a observarse. 2. Estimular el tiempo necesario de observacin. 3. Obtener la autorizacin de la gerencia para llevar a cabo la observacin. 4. Explicar a las personas que van a ser observadas lo que se va a hacer y las razones para ello. Conduccin de la observacin 1. Familiarizarse con los componentes fsicos del rea inmediata de observacin. 2. Mientras se observa, medir el tiempo en forma peridica. 3. Anotar lo que se observa lo ms especficamente posible, evitando las generalidades y las descripciones vagas. 4. Si se est en contacto con las personas observadas, es necesario abstenerse de hacer comentarios cualitativos o que impliquen un juicio de valores. 5. Observar las reglas de cortesa y seguridad. Secuela de la observacin 1. Documentar y organizar formalmente las notas, impresionistas, etc. 2. Revisar los resultados y conclusiones junto con la persona observada, el supervisar inmediato y posiblemente otro de sistemas.

Elaboracin e Interpretacin de Cuadros de Frecuencia


Cuando los datos de una variable estn dispersos, la dispersin sigue un cierto patrn. Inicialmente los datos no nos dicen nada por s mismos, pero si los dividimos en clases o celdas ordenadamente, puede aclararse la forma de su dispersin, es decir, puede aclararse la forma de como estn distribuidos. Esta forma de la distribucin de los datos inherente a su variabilidad se denomina distribucin de frecuencias. Normalmente es posible ver la forma general de una distribucin si se recogen cien o ms valores y se prepara convenientemente una tabla de frecuencias con diez o veinte clases. Pero la distribucin se puede ver aun con mayor claridad en forma de representacin grafica mediante un histograma de frecuencias. El histograma es una representacin visual de los datos en la que pueden observarse

ms fcilmente tres propiedades esenciales de una distribucin como son: Forma, tendencia central o acumulacin y dispersin o variabilidad. De esta forma, el histograma da una idea del proceso, lo que un simple examen de los datos tabulados no hace. Hay muchos mtodos para construir histogramas. Cuando los datos son numerosos, es muy til reunirlos en clases y se recomienda utilizar entre 4 y 20 clases (o celdas). A menudo conviene elegir un nmero total de clases igual aproximadamente a la raz cuadrada del tamao de la muestra. Las clases deben tener amplitud uniforme y se construye la primera de ellas comenzando con un limite inferior solo un poco menor que el valor mas pequeo de los datos. Se construye la ultima clase finalizando con un limite superior solo un poco mayor que el valor ms grande de los datos. Para realizar el histograma se marcan las clases sobre el eje de abscisas, y sobre cada clase se levanta un rectngulo de altura proporcional al numero de observaciones de la variable (frecuencia absoluta) que caen en la clase. El agrupamiento de los datos en clases condensa los datos originales, lo que da como resultado una perdida de algo de detalle. As, cuando el numero de observaciones es relativamente pequeo, o cuando las observaciones solo toman pocos valores, puede construirse el histograma a partir de la distribucin de frecuencias de los datos sin agrupar, dando lugar a los diagramas de barras. Las distribuciones de frecuencias son la herramienta ms sencilla y ms utilizada y eficaz cuando estamos rodeados de montones de datos, que no nos dicen nada si no hacemos ms que enumerarlos. Al expresar estos datos en forma de una distribucin de frecuencias, ya nos proporcionan diversas ideas. Puesto que las distribuciones de frecuencias se utilizan muy a menudo en el control de calidad, es necesario conocer la finalidad de las mismas y su interpretacin y uso. Dada la importancia de las distribuciones de frecuencias, derivada de que en todo proceso hay un momento en el que nos encontramos con un conjunto de datos sobre las variables a tratar, es de gran importancia formalizar el proceso de recogida, ordenacin y presentacin de los datos que, en la mayora de las ocasiones,

aparecern dispuestos en tablas de frecuencias de simple o doble entrada que servirn para analizar las distribuciones de las variables. Dada una variable X con valores x1 , x 2 ,, x N aparecen una serie de conceptos generales que se mencionan a continuacin: Frecuencia absoluta

f : Se denomina frecuencia absoluta del valor

x de la variable X, el numero de veces f que se repite ese valor. Frecuencia relativa f i : Se denomina frecuencia relativa del valor x de la variable X la relacin por cociente entre el nmero de veces que aparece el valor x y el nmero total de valores de la variable (N). sea, f i = f/N. Frecuencia absoluta acumulada F:: Se denomina frecuencia absoluta O

acumulada del valor xi a la suma de las frecuencias absolutas de los valores de la variable X anteriores o iguales a xi . Frecuencia relativa acumulada F i : Es la frecuencia absoluta acumulada dividida por el nmero total de valores =F/ N. De todas estas definiciones se extraen las siguientes deducciones: de la variable. Su valor es Fi

La suma de las frecuencias absolutas sin acumular es igual al

nmero total de elementos ( ni ,= N) igual La ltima frecuencia relativa acumulada es la unidad La ltima frecuencia relativa acumulada es el total de La suma de todos las frecuencias relativas acumular es

elementos (N).

Al conjunto de valores que ha tomado una variable, junto con sus frecuencias, se le denomina distribucin de frecuencias de la

caracterstica o variable. Para que una distribucin de frecuencias quede determinada es necesario conocer todos los valores de la variable y uno cualquiera de los conceptos de frecuencia que acabamos de definir, ya que el paso de uno a otro es inmediato. Adems, segn la forma en que se presenten los valores de la variable ser posible distinguir dos tipos de distribuciones de frecuencias: Las que no estn agrupadas en intervalos, que surgen cuando la informacin se dispone asociando a cada valor o categora de la variable su frecuencia. Aquellas cuyos valores observados generalmente aparecen agrupados en intervalos o clases [L i , L i 1 ] debido al elevado nmero de observaciones, y, por tanto, las frecuencias correspondientes a cada intervalo se obtienen sumando las de los respectivos valores de la variable que contiene. Cuando se trabaja con distribuciones agrupadas por intervalos o clases es necesario que las frecuencias observadas se asignen de alguna forma a los puntos del intervalo. Se podr optar por suponer que los valores del intervalo se distribuyen uniformemente a lo largo de el o por considerar como representativo de todos los puntos del intervalo un nico valor, por ejemplo, el punto medio del mismo, que denominaremos marca de clase (X;) y que, en consecuencia, se obtendr mediante X i = (L i 1 + L i )/2. Aunque la agrupacin de valores tiene la ventaja de simplificar el manejo de la informacin, presenta en cambio un importante inconveniente consistente en la perdida, en mayor o menor medida, de una parte de dicha informacin. La distribucin de frecuencias de una variable suele presentarse ordenadamente mediante la tabla de frecuencias siguiente:

Ii [L 0 , L i ] =N 1 /N /N

Xi x1

ni n,

fi f 1 =n 1 /N [L 1 ,L 2 ]

Ni N 1 =n 1 x2 n2

Fi F1 f 2 =n 2 F 2 =N2/N

N2=n 1 +n 2

[L 2 , L 3 ] +n 3 [L k 1 , L k] +n k =N

x3 F 3 =N3/N xk Fk=Nk/N=1

n3

f 3 =n 3 /N

N 3=n 1 +n 2

nk

fk=n k /N

N k =n 1 +...

=N

=1

Cuando se trabaja con distribuciones de frecuencias uno de los problemas es la determinacin del nmero apropiado de clases. Aunque no existe una regla precisa para el nmero de clases, generalmente tratamos de no tener ni muchas ni muy pocas en la distribucin de frecuencias. El uso de demasiadas clases tiende a producir irregularidades en las frecuencias de las clases y obscurece la concentracin de valores. Por el contrario, si usamos un nmero excesivamente pequeo de clases, estas tienden a resumir y cierta informacin valiosa se pierde en el proceso. En la prctica, trataremos de no tener una distribucin de frecuencias con menos de 5 y ms de 15 clases. Para determinar el numero aproximado de clases, se puede hacer uso de la Regla de Sturges: k = 1 + 3.32 log( N ) K= nmero de clases, n= nmero total de observaciones de la muestra, log = logaritmo comn base 10. Adems el ancho del intervalo vendra dado por

ic =

dato mayor dato menor k

Se debe dejar en claro que la Regla de Sturges es una aproximacin del nmero de clases, siempre es posible tomar una ms o una menos de lo que la formula nos da. Por ejemplo, si tenemos 142 observaciones, tenemos entonces

K = 1 + 3,32 log 142 = 8 clases Otro ejemplo, con n=40, tenemos; K = 1 + 3,3 2 log 40 = 6,29 El sentido comn acepta de buen agrado 6, 7 o 8 clases. El uso de esta formula puede dar resultados irrazonables cuando el numero de observaciones es muy grande o muy pequeo. Por esta razn la Regla de Sturges no es un sustituto del buen juicio. Ejemplo Los niveles de colinesterasa Se midieron los niveles de colinesterasa en un recuento de eritrocitos en mol/min/ml de 34 agricultores expuestos a insecticidas agrcolas, obtenindose los siguientes datos: Individuo Nivel Individuo Nivel Individuo Nivel 1 2 3 4 5 6 7 8 9 10 11 12 10,6 12,5 11,1 9,2 11,5 9,9 11,9 11,6 14,9 12,5 12,5 12,3 13 14 15 16 17 18 19 20 21 22 23 24 12,2 10,8 16,5 15,0 10,3 12,4 9,1 7,8 11,3 12,3 9,7 12,0 25 26 27 28 29 30 31 32 33 34 11,8 12,7 11,4 9,3 8,6 8,5 10,1 12,4 11,1 10,2

Niveles de Colinesterasa

Aplicando la frmula de Sturges obtenemos: k = 1 + 3.322 log34 = 1 + 3.322 1.53148 = 6.08757

es decir, una sugerencia de 6 intervalos. Como el mayor valor es 16.5 y el menor = 7.8, la longitud sugerida es

ic =

16.5 7.8 = 1.45 6

Parece, por tanto, razonable tomar como amplitud 1.5, obteniendo como intervalos en los que clasificar los datos [7.5 - 9), [9 10.5), [10.5 - 12) , [12 13.5) , [13.5 - 15) , [15 16.5] Los datos del de los Niveles de Colinesterasa, agrupados en los intervalos all obtenidos, proporcionan las cuatro siguientes distribuciones de frecuencias Distribuciones de Frecuencias

ic
7.5-9 9-10.5

f 3 8

fi 0.088

F 3

Fi 0'088

0.0236 11 0'324 21 0'618 31 0'912 32 0'941 34 1

10.5-12 10 0.294 12-13.5 10 0.294 13.5-15 1 15-16.5 2 0.029 0.059

34 1

Graficas de Variables continuas y Discretas


La representacin grfica de una distribucin de frecuencias depende del tipo de datos que la constituya. Datos correspondientes a un carcter cualitativo La representacin grfica de este tipo de datos est basada en la proporcionalidad de las reas a las frecuencias absolutas o relativas. Veremos dos tipos de representaciones:

Diagrama de Sectores
Est representacin grfica consiste en dividir un crculo en tantos sectores circulares como modalidades presente el carcter cualitativo, asignando un ngulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con rea proporcional tambin a ni. As, los ngulos que corresponden a las cuatro modalidades de la tabla adjunta sern: Nmero de casos Rehusaron ciruga Rehusaron radiacin Empeoraron por una enfermedad ajena al cncer Otras causas 26 3 10 1 ngulo(grados) 234 27 90 9

Para obtener 234 se procede de la siguiente manera el total de datos es 40 que corresponde al 100% de los datos, adems representara 360 de la circunferencia. Mediante una regla de 3 podemos establecer que X =

26 * 360 = 234 , continuado 40

con este proceso podemos obtener los otros datos de la tabla. Y su representacin en un diagrama de sectores ser:

Diagrama de Rectngulos
Esta representacin grfica consiste en construir tantos rectngulos como modalidades presente el carcter cualitativo en estudio, todo ellos con base de igual amplitud. La altura se toma igual a la frecuencia absoluta o relativa (segn la distribucin de frecuencias que estemos representando), consiguiendo de esta manera rectngulos con reas proporcionales a las frecuencias que se quieren representar. La representacin grfica de la distribucin de frecuencias absolutas del ejemplo anterior ser de la forma:

Histograma
Al ser esta representacin una representacin por reas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no. Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser Frecuencia (rea) = amplitud del intervalo altura la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia. Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuacin anterior se cumpla. En el ejemplo de los Niveles de Colinesterasa, al tener los intervalos igual amplitud, la representacin grfica ser:

Si tuviramos una distribucin de frecuencias como la siguiente, correspondiente a puntuaciones obtenidas en un test psicolgico y en la que los intervalos son de diferente amplitud i 0-20 20-30 30-40 40-45 45-50 50-60 60-80 80-100 Total f 8 9 12 10 9 10 8 4 70 fi 8/70 9/70 12/70 10/70 9/70 10/70 8/70 4/70 1

Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de 2/70 para que el rea sea la frecuencia relativa 8/70. Procediendo de la misma manera con el resto de los intervalos obtendramos como representacin grfica la figura siguiente:

Obsrvese que la suma de todas las reas debe ser 1, tanto si los intervalos de la distribucin de frecuencias relativas son o no de igual amplitud.

Polgono de Frecuencias Acumuladas


Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la grfica de una funcin que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del ltimo. As, para el ejemplo de los Niveles de Colinesterasa, el polgono de frecuencias relativas acumuladas tendr una representacin grfica de la forma:

También podría gustarte