Está en la página 1de 26

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERIA E.A.P.

INGENIERIA CIVIL

CURSO: ESTADISTICA

Tema 1: Introduccin a la estadstica, Recoleccin, Organizacin y Presentacin de Datos

Lic. Selene Yengle Del Castillo Docente del Curso

Cajamarca, Enero 2009.

INTRODUCCION AL CURSO En este curso se dar inicio al estudio de la Estadstica, que es una disciplina cientfica para la investigacin moderna, ya que se utiliza en cualquier rea del conocimiento. En el campo de la Ingeniera se aplica para solucionar problemas, extraer conclusiones y tomar decisiones de manera cientfica. La Estadstica es una herramient a fundamental para el Ingeniero, ya que ste en el campo laboral se enfrenta a un conjunto de datos que deben ser transformados en informacin que a la vez tiene que ser analizada y clasificada. El objetivo bsico de la estadstica es hacer inferencia acerca de una poblacin con base a la informacin contenida en una muestra. "Inferencia acerca de una poblacin", qu significa esto? Inferir significa "inducir una cosa de otra, llevar consigo, conducir a un resultado". Es decir se pretende establecer inferencia acerca de una poblacin, entendiendo a la poblacin como un conjunto de individuos, organismos o entes inanimados de los cuales queremos conocer alguna o algunas caractersticas para que nos ayuden a tomar una decisin u obtener alguna conclusin de suma importancia, y nada sabemos sobre la distribucin, existencia, ubicacin, valor de esta o estas caractersticas que nos interesa saber. Piense usted por ejemplo, que estamos interesados si nuestra poblacin juvenil consume o no droga. O, con mayor precisin, necesitamos saber en la actualidad qu fraccin de nuestra poblacin consume drogas, entendiendo que el consumo de drogas lo tenemos tipificado en alguna escala o nivel. De manera que nuestro objetivo es saber con toda la exactitud posible, que fraccin de toda nuestra poblacin juvenil consume droga. Por razones materiales, de recursos humanos, de imposibilidad fsica y en definitiva de costos, no podemos efectuar una encuesta a toda la poblacin. Necesitamos entonces hacer una consulta a un gran nmero de jvenes, donde este nmero ser concomitante con la eliminacin de las barreras que impiden consultar a toda la poblacin juvenil. Definido este nmero de jvenes a los cuales, mediante tcnicas de consulta adecuadas, se entender como una muestra de la poblacin en estudio. Sobre esta muestra haremos anlisis estadstico para poder inferir qu fraccin de jvenes de la poblacin juvenil consume drogas. Es decir, de un anlisis adecuado sobre una muestra concluiremos con una inferencia que la extenderemos o aplicaremos a toda la poblacin, y adems daremos a conocer alguna "medida de equivocacin" en esa inferencia. Con estos resultados nuestros gobernantes, las familias tomarn grandes polticas de decisin. Con este ejemplo queremos decir sobre la importancia de la estadstica.

CONCEPTOS BASICOS DE LA ESTADISTICA 1. Definicin de Estadstica

Por estadstica entendemos una batera de recursos cientficos por los cuales podemos recolectar, organizar, resumir, presentar y analizar datos numricos de un conjunto de observaciones. La estadstica se emplea en aquellos casos en los que tenemos una gran cantidad de observaciones y cuya aparicin se rige por las leyes del azar. Es decir, se aplica a fenmenos cuya medicin requiere una coleccin de observaciones, pues hay algunos fenmenos que se presentan en masa, pero para los que no se requiere observacin alguna, pues se conocen a priori. Para saber el porcentaje de hombres mayores de un metro setenta en una poblacin, son necesarias una serie de medidas. En cambio no es necesario ninguna observacin para saber la cantidad que integran un matrimonio. Para que sean de utilidad los datos estadsticos tienen que tener dos caractersticas bsicas: 1) Deben ser pertinentes: deben guardar una relacin con el tema en cuestin. 2) Deben ser insesgados: no deben tener deformaciones provenientes de prejuicios o de errores de los instrumentos empleados. La Estadstica es una ciencia que crea, desarrolla y aplica mtodos y procedimientos para analizar informacin de manera confiable en condiciones de certidumbre e incertidumbre, brindando apoyo en la optimizacin de toma de decisiones. 2. CLASIFICACION DE LA ESTADISTICA

La Estadstica puede ser clasificada en funcin a los siguientes criterios: 2.1. Por el Nivel de Confiabilidad de las conclusiones: Se puede clasificar a la Estadstica en: Descriptiva e Inferencial. Estadstica Descriptiva o Deductiva: procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa. El resumen de los datos puede hacerse mediante tablas, grficos o valores numricos. Los conjuntos de datos que contienen observaciones de ms de una variable permiten estudiar la relacin o asociacin que existe entre ellas. Estadstica Inferencial o Inductiva: mtodos empleados para inferir algo acerca de una poblacin basndose en los datos obtenidos a partir de una muestra. Los datos estadsticos son clculos aritmticos realizados sobre los

valores obtenidos en una porcin de la poblacin, seleccionada segn criterios rigurosos. 2.2. Por el Cumplimiento o no del Desarrollo de sus metodologas: De acuerdo a este criterio la Estadstica se puede clasificar en: Paramtrica y No Paramtrica. En el primero se formulan asunciones sobre la distribucin de la variable en estudio debido a que son requisitos para aplicacin de determinadas tcnicas estadsticas. En la segunda, no es necesario verificar estas asunciones ya que se cuenta con otras tcnicas estadsticas diseadas especialmente obviar ciertas asunciones o para aplicarse a casos que no pueden ser tratados con la estadstica Paramtrica. 2.3. Por el Grado de Participacin del tomador de decisiones: Segn este criterio la Estadstica se puede dividir en: Bayesiana y No Bayesiana. El nombre utilizado es en alusin al Reverendo Thomas Bayes (1702-1761) quien hizo aportes valiosos a la teora de las probabilidades. La Estadstica Bayesiana se diferencia fundamentalmente de la No Bayesiana en el hecho de que la primera se incorpora como parte de la metodologa de anlisis en la opinin del tomador de decisiones mediante la asignacin de valores de probabilidad.

3.

Etapas de un estudio estadstico

3.1. Planteamiento del problema: definir objetivo de la investigacin y precisar el universo o poblacin de la misma y planear los mtodos por los que se recogern los datos. 3.2. Recoleccin y Organizacin de la informacin, mediante tcnicas que permitan luego aplicar criterios para codificar esos datos. 3.3. Presentacin de los datos: los cuales deben expresarse de forma que su lectura sea sencilla. Existen 3 formas de presentacin: con palabras para pocos datos-, mediante tablas estadsticas y mediante grficos estadsticos. 3.4. 3.5. Inferencia estadstica: en los casos en los que se trabaja con muestras. Interpretacin: explicar el sentido de todos los datos obtenidos.

4.Poblacin y muestra
Dentro de una investigacin es importante establecer cual es la poblacin y si de esta se ha tomado una muestra, cuando se trata de seres vivos, en caso de objetos se debe establecer cual ser el objeto, evento o fenmeno a estudiar. 4.1. Poblacin (population), es la totalidad del fenmeno a estudiar, donde las unidades de poblacin poseen una caracterstica comn, la que se estudia y da origen a los datos de la investigacin. Un censo, por ejemplo, es el recuento de todos los elementos de una poblacin. Desde luego, es de fundamental importancia comenzar el estudio definiendo la poblacin a estudiar. Las poblaciones suelen ser muy numerosas, por lo que es difcil estudiar a todos sus miembros; adems de que esto no es posible, no es necesario. Es como si se quisiera estudiar la composicin qumica del agua de un ro y para ello se intentar analizar todo el agua que corre por su cauce, cuando solamente se puede tomar unas muestras para realizar ese estudio y llegar a conclusiones generalizables con respecto a la composicin qumica del agua a todo el ro. Ejemplo: Los miembros del Colegio de Ingenieros del Per, Los Centros de Salud del departamento de Cajamarca, Todos los software existentes, etc. 4.2. Muestra (sample) es un conjunto de unidades, una porcin del total, que representa la conducta del universo en su conjunto. Una muestra, en un sentido amplio, no es ms que eso, una parte del todo que se llama universo o poblacin y que sirve para representarlo. Cuando un investigador realiza un experimento, una encuesta o cualquier tipo de estudio, trata de obtener conclusiones generales acerca de una poblacin determinada. Para el estudio de ese grupo, tomar un sector, al que se conoce como muestra. Es por ello que debe cumplir los siguientes criterios: Debera ser representativo y esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). 4.3. Unidad de Anlisis o Unidad Estadstica, es cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es una unidad de anlisis; si estudiamos la edad de cada habitante, cada habitante es una unidad de anlisis. 5. MUESTRA REPRESENTATIVA Se considera que una muestra es representativa cuando posee las mismas caractersticas de la poblacin de la cual ha sido seleccionada. Desde el punto de vista experimental slo interesan las muestras representativas, pero el concepto

matemtico prevalece, debido a que por la naturaleza de los experimentos estadsticos, nunca es posible determinar con certeza que la muestra es representativa. 6. MUESTREO 6.1. Definicin.- Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de la poblacin. Este se realiza una vez que se ha establecido un marco muestral representativo de la poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos diseos de la muestra. Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra. Ejemplo: Consideremos como una poblacin a los estudiantes de la Universidad Nacional de Cajamarca, determinando por lo menos dos caracteres a ser estudiados: Religin de los estudiantes y sexo. 6.2. Tipos de muestreo.- Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Las muestras de juicio evitan el anlisis estadstico necesario para hacer muestras de probabilidad. Los tipos de muestreo ms comunes son: 6.2.1. Muestreos aleatorios: Muestreo aleatorio simple con y sin reemplazo.- Todos los elementos de la poblacin tiene la misma probabilidad de ser seleccionados y por lo tanto muestras de igual tamao tiene la misma probabilidad de ser tomadas. Muestreo sistemtico.- La muestra se obtiene numerando a la poblacin y tomando cada k-simo elemento. k=N/n Muestreo aleatorio estratificado.- Se divide a la poblacin en estratos ms homogneos y se toma una submuestra aleatoria de cada estrato. El objetivo de este diseo es minimizar la varianza dentro cada estrato y maximizar la varianza entre estratos.

Muestreo por conglomerados.- Se divide a la poblacin en conglomerados en donde las diferencias entre individuos sean tan grandes como sea posible y luego se toma como muestra a uno o ms conglomerados. En este caso, se busca que la varianza dentro cada conglomerados sea lo ms grande posible, mientras que la varianza entre conglomerados sea mnima.

6.2.2.

Muestreos no aleatorios

Muestreo dirigido ( o muestreo adaptado) El investigador selecciona las unidades que, segn su juicio, son representativas de la poblacin. En este tipo de muestreo se desconoce la probabilidad de cada unidad de ser elegida y no se pueden aplicar los mtodos de estimacin por intervalos de confianza, solo los mtodos de estimacin puntual. Muestreo por cuotas

Es frecuente en encuestas de opinin, cada sector de la poblacin aporta una cuota para integrar la muestra, las cuotas no necesariamente son de igual tamao. Muestreo deliberado Se toma una muestra que sea accesible, y en cierto grado representativa, se utiliza para estudios piloto o de sondeo. Por ejemplo: de la poblacin ms cercana, de la gua telefnica, en un crucero, el lote que est ms accesible, etc.

7. VARIABLES 7.1. Definicin.- caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. Cada elemento puede tener una o varias variables o caractersticas de inters. En los individuos de la poblacin peruana, de uno a otro es variable: El tipo de empresa {Industrial, Comercial, Servicios} Var. Cualitativa Nominal Su nivel de felicidad declarado {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal El nmero de hijos {0,1,2,3,...} Var. Numrica discreta La inversin en millones de soles en Escuelas {162 ; 174; ...} Var. Numrica continua 7.2. Tipo de Variable.- Es la categora a la que pertenece la variable, pudiendo se cualitativa o cuantitativa. 7.2.1. Variable Cualitativa.- Son aqullas en que las observaciones sobre un determinado fenmeno se describen slo como poseedoras o no, de ciertas cualidades o propiedades o atributos. Ejemplos: Las profesiones de los profesores de una universidad, las diferentes marcas de cigarrillos existentes en el mercado, sexo, estado civil, etc. En algunos contextos, como el de los estudios sociales, las variables cualitativas reciben tambin el nombre de atributos. Las variables cualitativas se clasifican en: Nominal si sus valores no se pueden ordenar y Ordinal si sus valores se pueden ordenar. 7.2.2. Variable Cuantitativa.- Son aquellas en que las observaciones de un determinado fenmeno, pueden hacerse sobre caractersticas que pueden ser transformadas en datos numricos por simple medicin o conteo. Ejemplos: Nmero de hijas hembras por matrimonio, montos de prstamos hipotecarios, nmero de llamadas recibidas en una central telefnica en una hora, estaturas, edades, etc. Como las mediciones de las variables resultan en datos, es usual hablar de tipos de datos en lugar de tipos de variables. Las variables cuantitativas se clasifican en discretas y continuas. Son variables discretas todas aqullas que slo toman valores enteros, como: nmero de empleados de distintas empresas, cantidad de clientes que llegan a la taquilla de un banco en una hora, nmero de habitaciones por apartamento, etc. Mientras que las variables continuas pueden tomar valores enteros o no enteros, como: precios, ingresos, temperaturas, velocidades, etc.

8.

Escala de Medicin de la Variable

Es una medida del nivel de informacin y la clase de operaciones que se podr ejecutar con una variable. Las escalas de medicin pueden ser: Nominal: Se dice que los datos obtenidos de una variable cualitativa han sido medidos en una escala nominal si pueden clasificarse en categoras en las que no se implica ningn orden. Por ejemplo: sexo (femenino, masculino), estado civil (casado, soltero, divorciado) Ordinal: Se dice que los datos obtenidos de una variable cualitativa han sido medidos en una escala ordinal si pueden clasificarse en categoras en las que puede asignarse algn orden. Por ejemplo: seccin de 7mo grado (A, B, C, etc.), nivel de satisfaccin (poco satisfecho, medianamente satisfecho, muy satisfecho) De intervalo: Se dice que los datos obtenidos de una variable cuantitativa han sido medidos en una escala de intervalo si las diferencias entre las mediciones es igual y significativa, pero donde el cero no indica ausencia de la variable medida. Por ejemplo la temperatura (la diferencias entre 10 grados y 12 grados es la misma que entre 30 y 32 grados, pero 0 grados no significa ausencia de temperatura, simplemente es una referencia) De razn o cociente: Se dice que los datos obtenidos de una variable cuantitativa han sido medidos en una escala de razn si, adems de que las diferencias entre las mediciones es igual y significativa, existe un punto cero verdadero. Por ejemplo la edad (el valor cero en la edad representa la ausencia de la variable que se mide). 9. Parmetros y Estadsticos

Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y de sus muestras, diferencindose entre ellas las que se refieren a las mismas poblaciones y a las muestras. Para el caso de las poblaciones, las medidas que las describen se denominan parmetros, y suelen estar representadas con letras griegas. Por otro lado, para el caso de aquellas medidas que describen a una muestra se les llama estadsticos o estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s). Los parmetros y estimadores son funciones definidas sobre los valores numericos de caracteristicas medibles de una poblacin o muestra respectivamente.

PRESENTACION ORDENADA DE DATOS


Gnero Hombre Mujer Frec. 4 6

Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra. Distribucin Unidimensional de Frecuencias Frecuencia.- Nmero de veces que se repite cada dato. Frecuencia de Clase.- Nmero de datos de cada clase o intervalo. Clases de Frecuencias: Frecuencia Absoluta Simple( fi ni).- nmero de veces de cada caso obtenida como resultado del conteo de los datos. Las propiedades son: fi 0 y

f
i =1

= n, donde n es el tamao de muestra total de datos.

Frecuencia Absoluta Acumulada( Fi Ni).- Se tiene en cuenta las siguientes propiedades: F1 = f1 y Fk = fn . . Donde: F1 = f1
F2 = f1 + f2 Fk

= f1 + f2 ++ fk

Frecuencia Relativa Simple( hi).- esta frecuencia se encuentra dividiendo cada frecuencia absoluta simple (fi ni) entre n. Se obtiene utilizando la formula siguiente: hi = fi n , Se tiene en cuenta las sgtes propiedades : 0 hi 1 y

h
i =1

=1

Asimismo tenemos la Frecuencia Relativa Simple Porcentual (hi %), que se obtiene de la siguiente manera: hi% = hi x 100%.

Frecuencia Relativa Acumulada( Hi).- Se obtiene aplicando las siguientes j formulas: h Hi = i H j = hi n i =1 Adems, se tiene en cuenta las sgtes propiedades: H1=h1 y Hk = 1 F H1 = 1 n Donde: H1 = h1 F2 H2 = H2 = h1 + h2 n ... F Hk = k n
Hk = h1 + h2 ++ hk

Asimismo tenemos la Frecuencia Relativa Acumulada Porcentual (Hi%), que se obtiene de la siguiente manera: Hi% = Hi x 100%. Tablas de Distribucin de Frecuencias

1 Para Variables Cuantitativas Discretas: La tabla de Distribucin de Frecuencias toma la siguiente forma:
Valores Variable (Yi)

fi f1 f2 fK n

Fi F1 F2 FK ---

hi h1 h2 hK 1

Hi H1 H2 HK=1 ---

hi% H1% H2% hK% 100%

Hi% H1% H2% 100% ---

Y1 Y2 YK TOTAL

2 Para Variables Cuantitativas Continuas:


Intervalo de Clase Marca defi Clase (Yi) I1 Y1 f1 I2 Y2 f2 IK YK fK TOTAL --n Donde: I1 = Xmin ; Xmin+A I2 = Xmin+ A; Xmin+ 2A .. Fi F1 F2 FK --hi h1 h2 hK 1 Hi H1 H2 Hk --hi% h1% H2% hK% 100% Hi% H1% H2% Hk% ---

Ik

Marca de Clase (Yi): Tambin llamado punto medio, se obtiene utilizando la siguiente formula: X + X min + A Yi = min 2 Para Construir esta Tabla se sigue los siguientes pasos:
1.1.

Determinar el Rango (R): Donde:

R= Xmax Xmin

Xmax : mximo valor de todos los datos Xmin: mnimo valor de todos los datos

1.2.

Determinar el nmero de intervalos (K): Un nmero aproximado de intervalos nos da la Regla de Sturgess: K=1+3.3 Log(n) Donde: n: tamao de la muestra y K toma valores entre 5 y 20.

En otros casos este nmero de intervalos la puede determinar el mismo investigador, este nmero de intervalos debe estar como mnimo entre 5 y 20. 1.3. 1.4. 1.5. Determinar la amplitud (A): Encontrar una diferencia entre:
A= Rango K

R R , Donde: R : Rango prima

Construir los intervalos y la tabla de distribucin de frecuencias

3 Para Variables Cualitativas:


En este caso la tabla de distribucin de frecuencias ser de la siguiente forma: Variable (Yi) Caracterstica A Caracterstica B Caracterstica Z TOTAL fi f1 f2 fz n hi h1 h2 hz 1.00 hi% H1% H2% hz% 100%

CUADROS Y GRAFICOS ESTADISTICOS


Una vez redactados y organizados los datos, pasamos a realizar un anlisis estadstico en forma grfica y numrica. I. CUADROS ESTADSTICOS

La finalidad de los cuadros estadsticos es ofrecer informacin resumida de la fase de lectura e interpretacin. Se puede representar variables cualitativas, cuantitativas o una combinacin de ambas. Las partes de un cuadro son: Nmero: que viene hacer la identificacin del cuadro. Ttulo: El ttulo debe ser colocado en la parte superior central y debe reunir dos condiciones bsicas: Que sea completo y debe contestar a cuatro interrogantes: Qu? : Se refiere a la poblacin que se estudia. Cmo?: Se refiere a como estn distribuidas las variables. Donde?: Se refiere al lugar a que se refiere la informacin. Cuando?: Es el periodo del tiempo a que se refiere el estudio. Cuerpo: Es el conjunto de celdas donde estn anotados los datos numricos. Fuente: Sirve para nombrar la entidad responsable de donde se obtuvieron los datos. Notas Explicativas: Se utiliza en caso de ser necesario.

Los Tipos de Cuadros Estadsticos, son:

Cuadros Simples.- Se utilizan para representar informacin con una sola variable ya sea cualitativa o cuantitativa. Cuadros Compuestos.- Se utiliza para representar informacin con dos variables ya sea cualitativa, cuantitativa o una combinacin de ambas.

II. GRAFICOS ESTADSTICOS Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de informacin depender de la presentacin de los datos, siendo la forma grfica uno de los ms rpidos y eficientes, aunque tambin uno de los que ms pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones bsicas al realizar las grficas. Existen tambin varios tipos de grficas, o representaciones

grficas, utilizndose cada uno de ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la informacin. Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier grfica a fin de que la informacin sea transmitida de la manera ms eficaz posible y sin distorsiones: 1. El eje que represente a las frecuencias de las observaciones (comnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podra dar impresiones errneas al comparar la altura, longitud o posicin de las columnas, barras o lneas que representan las frecuencias. 2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la grfica deben ser iguales. 3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de informacin o el objetivo que se persigue al representarla, de otra manera la representacin grfica se convierte en un instrumento ineficaz, que produce ms confusin que otra cosa, innecesario o productor de malinterpretaciones. Por ejemplo, si se desea representar la proporcin de poblacin masculina en un pas conviene ms usar una grfica de pastel o circular que una grfica de barras al compararla contra la poblacin femenina; por un lado se puede apreciar dicha proporcin, por el otro se aprecia cul de las dos poblaciones es mayor. Hay un punto que conviene remarcar: existe software que permite la construccin rpida y eficiente de grficas a partir de bases de datos o hojas de clculos, pero no importa cun bonita, bien delineada, bien coloreada o bien presentada est una grfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver ms sobre el objetivo de estas herramientas y la Estadstica: la transmisin eficiente de la informacin. Los grficos tienen la ventaja de permitir apreciar ms rpidamente los datos y as determinar con rapidez las conclusiones para la toma de decisiones. Las partes de un grfico son: Ttulo, Grfico propiamente dicho y/o leyenda, y Fuente . Los Tipos de Grfico mas utilizados son : Grfico de Barras, Grfico de sectores pastel, Diagrama de frecuencias, Histograma de frecuencias, Ojivas, Polgonos de Frecuencia y Grfico de Lneas. II.1. GRAFICO DE BARRAS

A) Barras Simples.- estn representadas por una serie de rectngulos que pueden ser horizontal o vertical. Se utiliza para representar informacin con una sola variable que puede ser de tipo cualitativa o cuantitativa discreta. B) Barras Dobles.- se utilizan para representar informacin con las variables y hacer comparaciones. C) Barras Compuestas Proporcionales.- sirven para representar informacin en una sola figura. Se recomienda que todas las barras deben tener el mismo tamao y el espacio entre barra y barra debe ser de la misma magnitud. Adems estos grficos mayormente son usados para variables cualitativas. II.2. GRAFICO DE SECTORES PASTEL Este grfico es un diagrama circular en forma de pastel cuyos valores han sido convertidos en porcentajes para facilitar su comparacin. Este grfico se utiliza para representar datos cualitativos o cuantitativos discretos. Pero no usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.) II.3. DIAGRAMA DE FRECUENCIAS Tambin conocido como grfico de bastones, est constituido por un conjunto de segmentos perpendiculares al eje X con una longitud directamente proporcional a las frecuencias absolutas o relativas; para ello en el eje X se colocan los valores de la variable Yi y en el eje vertical u ordenada van los valores de las frecuencias absolutas o relativas.Si en la representacin se refiere a las frecuencias absolutas o relativas acumuladas, se denominar Diagrama de Frecuencias Acumuladas, colocndose los valores de la variable Yi en el eje horizontal y en el vertical las frecuencias acumuladas. II.4. HISTOGRAMA DE FRECUENCIAS Es usado para describir datos referentes a variables continuas, que por lo general se agrupan en Tabla de Frecuencias con intervalos. Se construyen levantando sobre el eje de las abcisas, rectngulos sucesivos que tengan por base la amplitud del intervalo de clase y una altura igual a su frecuencia absoluta simple (fi) relativa porcentual hi%. II.5. POLIGONOS DE FRECUENCIAS

Los Polgonos de Frecuencias Simples, sirven para representar frecuencias simples en variables continuas y se construye como sigue: En cada punto medio o marca de clase (Yi) de cada intervalo se levanta un segmento de lneas punteadas de altura igual a la respectiva frecuencia fi hi%, tambin se grafican los puntos (Yi, fi) (Yi, hi%); luego se unen los puntos formando una lnea poligonal y se cierra esta agregando los puntos medios de intervalos adicionales anterior y posterior al conjunto de intervalos. Punto medio anterior (Yo) Punto medio posterior (Yk+1) : Yo = Y1 A

: Yk+1 = Yk + A

Los Polgonos de Frecuencias Acumuladas (OJIVA), se usa para representar frecuencias acumuladas absolutas relativas en variables continuas y se construye como sigue: En el eje horizontal se ubica los extremos del intervalo adicional anterior y los puntos medios o marcas de clase (Yi) de los dems intervalos, luego se grafican los puntos con ordenadas proporcionales a las frecuencias acumuladas. Finalmente, se unen estos puntos formando as el Polgono Acumulativo. Punto medio anterior (Yo) II.6. GRAFICO DE LINEAS Tambin conocido como Grfico de Series de Tiempo, est constituido por una lnea poligonal que se construye sobre el plano cartesiano. En el eje horizontal se ubica el tiempo X (aos, meses semanas, etc.). En el eje vertical los valores de las observaciones correspondientes de la variable Y (produccin, poblacin, ventas, exportaciones, etc.). : Yo = Y1 A

10.2. Tipos de grficos


Para las distribuciones de frecuencias la representacin grfica ms comn es el histograma. Un ejemplo es el que se presenta a continuacin y que representa el nmero de "visitas" que ha tenido este hipertexto de acuerdo a la hora de la visita.

En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcndose de manera continua las fronteras entre cada uno de los stos. De esta manera, el histograma est compuesto rectngulos, cuyo nmero coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos rectngulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia de cada intervalo. Es importante observar que resulta difcil utilizar este tipo de representacin cuando existen intervalos abiertos o cuando los intervalos no son iguales entre s. Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues al cambiarla la presentacin visual de un histograma puede variar. Un applet que muestra cmo el nmero de clases y su ancho pueden hacer variar fue desarrollado por Webster West de la Universidad del Sur de Carolina.

El programa Excel no permite crear de manera automtica histogramas, pues proporciona el ancho de las columnas de tal manera que quedan separadas. Sin embargo, existe la manera de hacerlas.

Un tipo de grfico muy parecido al histograma es la grfica de columnas. Para este tipo de grfica, elaboradas con rectngulos tambin, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectngulos (o barras) no tienen que aparecer juntas entre s. Otra observacin pertinente es que se pueden representar en la misma grfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una grfica con varias series, correspondiendo cada una de ellas a cada observacin de la muestra (o poblacin), y tenindose una grfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre s, pero distinta de las dems. El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los dems. Es interesante observar que la escala horizontal no es continua (es nominal).

Existe la posibilidad, y si los recursos lo permiten, de representar grficos compuestos de una manera "tridimensional", es decir, con grficos que posean no slo dos ejes, sino tres; y en los que los rectngulos son sustitudos por prismas de base rectangular (ocasionalmente el software en el mercado permite utilizar prismas cuya base son polgonos regulares de ms de cuatro lados, pirmides o cilindros). Un ejemplo es el siguiente:

donde se representa el porcentaje del PIB gastado en docencia e investigacin por cinco pases en el lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12). Es importante considerar que este tipo de grficos puede complicarse mucho, haciendo que la informacin sea menos legible.

Tambin es posible realizar grficas de barras horizontales, los cuales se parecen mucho a las grficas de columnas, con la salvedad importante de que la funcin de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una poblacin dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la poblacin de un pas ficticio llamado "Timbuctulandia":

A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se compara la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la poblacin de un sexo y el lado derecho para el otro, el resultado es una "pirmide" casi simtrica (depender de la poblacin en particular).

Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolucin del peso o estatura de una persona a travs del tiempo, el desempeo acadmico de un estudiante a lo largo de su instruccin escolar, las variaciones presentadas en la medicin realizada en algn experimento cada segundo o minuto) se pueden utilizar las grficas de lneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, unindose consecutivamente con lneas:

Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo).

Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es el polgono de frecuencias. La diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra despus de la ltima. El resultado es que se "sujeta" la lnea por ambos extremos al eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un polgono. El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

El Excel no crea automticamente polgonos de frecuencias, sino que produce grficas de lneas. Sin embargo, es posible arreglrselas para hacerlas.

Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas menor que. Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por sto la aplicacin de la tcnica es parcial): 1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. 2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga, en la ojiva menor que la frecuencia que se representa en cada frontera

de clase son el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la frontera). Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribucin porcentual:

En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una llamada grfica de reas, la cual consiste en rellenas el rea que se encuentre debajo de las lneas que resultan de una grfica de lneas. El ejemplo que se presenta es la comparacin del total de las especies de las familias del orden Carnivora y las que estn amenazadas, en Mxico, (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):58):

Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es decir, cuando se est usando una escala categrica, conviene utilizar una grfica llamada de pastel o circular. Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de conocimiento en el ao de 1992 se puede usar algo as como sigue (Fuente: ANUIES,1995):

De hecho, si se desea resaltar una de las categoras que se presentan, es vlido tomar esa "rebanada" de la grfica y separarla de las dems:

Para hacer una grfica de este tipo en papel. Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado, comparar dos grficos circulares (por ejemplo, si se quisieran comparar las proporciones de matrculas en licenciatura por reas de conocimiento en licenciatura para dos aos distintos) resulta muy difcil y, por tanto, no es muy aconsejable.

Por otro lado, en ocasiones existen categoras con pocas frecuencias (por ejemplo, dos o tres con frecuencias relativas menores al 1% cada una), haciendo que la grfica resulte "pesada" y las etiquetas se encimen. Una posible solucin es juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), pero entonces habra que ponderar si se hace una grfica extra con dichas observaciones nicamente, haciendo la anotacin pertinente, o simplemente se ignoran por no resultar significativas.

Actualmente, y mucho en los medios masivos de comunicacin, se utilizan grficos para ilustrar los datos o los resultados de alguna investigacin. Regularmente se utilizan dibujos para representar dicha informacin, y el tamao o el nmero de estos dibujos dentro de una grfica queda determinado por la frecuencia correspondiente. A este tipo de grfica se le llama pictograma y stos son dos ejemplos:

El de la izquierda representa la poblacin de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y Neptuno tiene ms 17 veces ms masa que la Tierra). Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de grficas, las posteriores s. Otros programas contemporneos (como el Corel Draw o el Harvard Graphics) s son capaces.

Cuando se pretende ilustrar la dispersin de las observaciones realizadas, y as trabajar algunas cosas como correlaciones se puede utilizar una grfica de dispersin. Por ejemplo, el ejemplo de la izquierda es la dispersin que se presenta al comparar el nmero de tesis doctorales en ciencias exactas contra el nmero de total de tesis doctorales (todo en Mxico) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

La grfica de la derecha es resultado de comparar el dimetro (en miles de kilmetros) de los planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centmetro cbico). Es interesante observar que los puntos parecen "seguir" una lnea imaginaria que se asemeja a una recta, con excepcin de un caso atpico: Mercurio. Uno de los usos de este tipo de grficas es precisamente encontrar si las observaciones siguen algn patrn lineal (una lnea de tendencia) o si existen valores atpicos. Para el caso del Excel, el programa es capaz de graficar las lneas de tendencias que siguen un conjunto de datos.

Un tipo de grfico similar a las grficas de dispersin son las grficas de burbujas, en las cuales se presenta la dispersin de las observaciones de la misma forma que aqullas, pero se le aade la posibilidad de visualizar otra variable representada en el tamao del punto, pues stos se convierten en crculos (burbujas) con radios proporcionales a las magnitudes que representan.

Este ejemplo compara la distancia que existe en cada uno de los planetas interiores de nuestro sistema solar al Sol contra el tiempo que necesitan para recorrer sus rbitas, y el tamao de las burbujas indica la masa de cada planeta. Adems existen otros tipos de grficos, cada uno con caractersticas particulares que les proporcionan cierta intencionalidad para su uso, como son las grficas de radar y las grficas polares.