P. 1
Adquisición de datos

Adquisición de datos

|Views: 857|Likes:
Publicado porGlocos Reyes

More info:

Published by: Glocos Reyes on Feb 28, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

03/27/2013

pdf

text

original

Sections

  • DIAGRAMA DE BARRAS
  • HISTOGRAMA
  • POLÍGONO DE FRECUENCIAS
  • DIAGRAMA DE SECTORES

Adquisición de datos

La adquisición de datos o adquisición de señales, consiste en la toma de muestras del mundo real (sistema analógico) para generar datos que puedan ser manipulados por un ordenador u otras electrónicas (sistema digital). Consiste, en tomar un conjunto de señales físicas, convertirlas en tensiones eléctricas y digitalizarlas de manera que se puedan procesar en una computadora o PAC. Se requiere una etapa de acondicionamiento, que adecua la señal a niveles compatibles con el elemento que hace la transformación a señal digital. El elemento que hace dicha transformación es el módulo de digitalización o tarjeta de Adquisición de Datos (DAQ).
Contenido
[ocultar]

1 Proceso de adquisición de datos 2 ¿Cómo se adquieren los datos? 3 Tiempo de conversión 4 La etapa de acondicionamiento de la señal 5 Ejemplo 6 Ventajas 7 Un tipo de ejercicio de adquisición 8 Véase también 9 Bibliografía 10 Enlaces externos

[editar]Proceso Definiciones

de adquisición de datos

Dato: Representación simbólica (numérica, alfabética...), atributo o característica de un valor. No tiene sentido en sí mismo, pero convenientemente tratado (procesado) se puede utilizar en la relación de cálculos o toma de decisiones. Adquisición: Recogida de un conjunto de variables físicas, conversión en voltaje y digitalización de manera que se puedan procesar en un ordenador. Sistema: Conjunto organizado de dispositivos que interactúan entre sí ofreciendo prestaciones más completas y de más alto nivel. Una vez que las señales eléctricas se transformaron en digitales, se envían a través del bus de datos a la memoria del PC. Una vez los datos están en

memoria pueden procesarse con una aplicación adecuada, archivarlas en el disco duro, visualizarlas en la pantalla, etc... Bit de resolución: Número de bits que el convertidor analógico a digital (ADC) utiliza para representar una señal. Rango: Valores máximo y mínimo entre los que el sensor, instrumento o dispositivo funcionan bajo unas especificaciones. Teorema de Nyquist: Al muestrear una señal, la frecuencia de muestreo debe ser mayor que dos veces el ancho de banda de la señal de entrada, para poder reconstruir la señal original de forma exacta a partir de sus muestras. En caso contrario, aparecerá el fenómeno del aliasing que se produce al infra-muestrear. Si la señal sufre aliasing, es imposible recuperar el original. Velocidad de muestreo recomendada: ±2*frecuencia mayor (medida de frecuencia) ±10*frecuencia mayor (detalle de la forma de onda) Los componentes de los sistemas de adquisición de datos, poseen sensores adecuados que convierten cualquier parámetro de medición de una señal eléctrica, que se adquiriere por el hardware de adquisición de datos. Los datos adquiridos se visualizan, analizan, y almacenan en un ordenador, ya sea utilizando el proveedor de software suministrado u otro software. Los controles y visualizaciones se pueden desarrollar utilizando varios lenguajes de programación de propósito general como VisualBASIC, C++, Fortran, Java, Lisp, Pascal. Los lenguajes especializados de programación utilizados para la adquisición de datos incluyen EPICS, utilizada en la construcción de grandes sistemas de adquisición de datos, LabVIEW, que ofrece un entorno gráfico de programación optimizado para la adquisición de datos, y MATLAB. Estos entornos de adquisición proporcionan un lenguaje de programación además de bibliotecas y herramientas para la adquisición de datos y posterior análisis. De la misma manera que se toma una señal eléctrica y se transforma en una digital para enviarla al ordenador, se puede también tomar una señal digital o binaria y convertirla en una eléctrica. En este caso el elemento que hace la transformación es una tarjeta o módulo de Adquisición de Datos de salida, o tarjeta de control. La señal dentro de la memoria del PC la genera un programa adecuado a las aplicaciones que quiere el usuario y, luego de procesarla, es recibida por mecanismos que ejecutan movimientos mecánicos, a través de servomecanismos, que también son del tipo transductores.

Un sistema típico de adquisición utiliza sensores, transductores, amplificadores, convertidores analógico - digital (A/D) y digital - analógico (D/A), para procesar información acerca de un sistema físico de forma digitalizada. [editar]¿Cómo

se adquieren los datos?

La adquisición de datos se inicia con el fenómeno físico o la propiedad física de un objeto (objeto de la investigación) que se desea medir. Esta propiedad física o fenómeno podría ser el cambio de temperatura o la temperatura de una habitación, la intensidad o intensidad del cambio de una fuente de luz, la presión dentro de una cámara, la fuerza aplicada a un objeto, o muchas otras cosas. Un eficaz sistema de adquisición de datos pueden medir todos estos diferentes propiedades o fenómenos. Un sensor es un dispositivo que convierte una propiedad física o fenómeno en una señal eléctrica correspondiente medible, tal como tensión, corriente, el cambio en los valores de resistencia o condensador, etc. La capacidad de un sistema de adquisición de datos para medir los distintos fenómenos depende de los transductores para convertir las señales de los fenómenos físicos mensurables en la adquisición de datos por hardware. Transductores son sinónimo de sensores en sistemas de DAQ. Hay transductores específicos para diferentes aplicaciones, como la medición de la temperatura, la presión, o flujo de fluidos. DAQ también despliega diversas técnicas de acondicionamiento de Señales para modificar adecuadamente diferentes señales eléctricas en tensión, que luego pueden ser digitalizados usando CED. Las señales pueden ser digitales (también llamada señales de la lógica) o analógicas en función del transductor utilizado. El acondicionamiento de señales suele ser necesario si la señal desde el transductor no es adecuado para la DAQ hardware que se utiliza. La señal puede ser amplificada o desamplificada, o puede requerir de filtrado, o un cierre patronal, en el amplificador se incluye para realizardemodulación. Varios otros ejemplos de acondicionamiento de señales podría ser el puente de conclusión, la prestación actual de tensión o excitación al sensor, el aislamiento, linealización, etc. Este pretratamiento del señal normalmente lo realiza un pequeño módulo acoplado al transductor. DAQ hardware son por lo general las interfaces entre la señal y un PC. Podría ser en forma de módulos que pueden ser conectados a la computadora de los puertos (paralelo, serie, USB, etc...) o ranuras de las tarjetas conectadas a (PCI, ISA) en la placa madre. Por lo general, el espacio en la parte posterior de una tarjeta PCI es demasiado pequeño para todas las conexiones necesarias, de modo que una ruptura de caja externa es obligatorio. El cable entre este recuadro y el PC es

cara debido a los numerosos cables y el blindaje necesario y porque es exótico. Las tarjetas DAQ a menudo contienen múltiples componentes (multiplexores, ADC, DAC, TTL-IO, temporizadores de alta velocidad, memoria RAM). Estos son accesibles a través de un bus por un micro controlador, que puede ejecutar pequeños programas. El controlador es más flexible que una unidad lógica dura cableada, pero más barato que una CPU de modo que es correcto para bloquear con simples bucles de preguntas. Driver software normalmente viene con el hardware DAQ o de otros proveedores, y permite que el sistema operativo pueda reconocer el hardware DAQ y dar así a los programas acceso a las señales de lectura por el hardware DAQ. Un buen conductor ofrece un alto y bajo nivel de acceso. Ejemplos de Sistemas de Adquisición y control: · DAQ para recoger datos(datalogger) medioambientales (energías renovables e ingeniería verde). · DAQ para audio y vibraciones (mantenimiento, test). · DAQ + control de movimiento(corte con laser). · DAQ + control de movimiento+ visión artificial (robots modernos). [editar]Tiempo

de conversión

Es el tiempo que tarda en realizar una medida el convertidor en concreto, y dependerá de la tecnología de medida empleada. Evidentemente nos da una cota máxima de la frecuencia de la señal a medir. Este tiempo se mide como el transcurrido desde que el convertidor recibe una señal de inicio de "conversión" (normalmente llamada SOC, Start of Conversión) hasta que en la salida aparece un dato válido. Para que tengamos constancia de un dato válido tenemos dos caminos:   Esperar el tiempo de conversión máximo que aparece en la hoja de características. Esperar a que el convertidor nos envíe una señal de fin de conversión.

Si no respetamos el tiempo de conversión, en la salida tendremos un valor, que dependiendo de la constitución del convertidor será:   Un valor aleatorio, como consecuencia de la conversión en curso El resultado de la última conversión

[editar]La

etapa de acondicionamiento de la señal

Con más detalle, en una etapa de acondicionamiento podemos encontrar estas etapas, aunque no todas están siempre presentes:  Amplificación

que eliminará interferencias. en las señales cuasi-continuas. con el consiguiente error. Las señales alternas. que es un filtro pasabajo pero con un corte muy brusco. (como el termistor.Otra aplicación habitual en el acondicionamiento de la señal es el aislamiento eléctrico entre el transductor y el ordenador. Para conseguir la mayor precisión posible la señal de entrada debe ser amplificada de modo que su máximo nivel coincida con la máxima tensión que el convertidor pueda leer. como por ejemplos las galgas "extesométricas". bien por su constitución interna. necesitan un tipo distinto de filtro. incluidos los 50/60 Hz de la red eléctrica. que elimina totalmente las señales de mayor frecuencia que la máxima a medir.La etapa de acondicionamiento de señal a veces genera excitación para algunos transductores. conocido como filtro antialiasing. Por ejemplo.     Excitación Filtrado Multiplexado Aislamiento Linealización Amplificación Es el tipo más común de acondicionamiento. que necesitan de la misma. que puede devolver resultados erróneos. de modo que con un sólo convertidor podemos medir los datos de diferentes canales de entrada. Se aconseja que los multiplexores se utilizen antes del conversor y después del condicionamiento del señal.El multiplexado es la conmutación de las entradas del convertidor. ya que se si no se eliminasen aparecerían superpuestas a la señal medida. Filtrado . Excitación .El fin del filtro es eliminar las señales no deseadas de la señal que estamos observando. Cuando el sistema de adquisición y la señal a medir están ambas referidas a masa pueden aparecer problemas si hay una diferencia de potencial entre ambas masas. Un motivo adicional para usar aislamiento es el garantizar que las lecturas del convertidor no son afectadas por diferencias en el potencial de masa o por tensiones en modo común. "termistores" o "RTD". su frecuencia máxima de conversión será la original dividida por el número de canales muestreados. apareciendo un "bucle de masa". para proteger al mismo de transitorios de alta tensión que puedan dañarlo. que es una resistencia . ya que de esta manera no molestará a los aislantes que podamos tener. Aislamiento . (como la temperatura) se usa un filtro de ruido de unos 4 Hz. Multiplexado . Puesto que el mismo convertidor está midiendo diferentes canales. tales como la vibración.

variable con la temperatura) o bien por la configuración en que se conectan (como el caso de las galgas. suele ser una buena idea el hacer esta corrección mediante circuitería externa. que se suelen montar en un puente de Wheatstone). y por tanto la información recibida se procesa para obtener una serie de señales de control. Aunque la linealización puede realizarse mediante métodos numéricos en el sistema de adquisición de datos. Salvo que la señal de entrada sea eléctrica.Muchos transductores. En este diagrama podemos ver los bloques que componen nuestro sistema de adquisición de datos: Como vemos. el transductor debe tomar poca energía del sistema bajo observación. presentan una respuesta no lineal ante cambios lineales en los parámetros que están siendo medidos. . como los termopares. Por tanto. para no alterar la medida. podemos decir que el transductor es un elemento que convierte energía de un tipo en otro. Linealización . los bloques principales son estos:     Transductor El acondicionamiento de señal El convertidor analógico-digital La etapa de salida (interfaz con la lógica) El transductor es un elemento que convierte la magnitud física que vamos a medir en una señal de salida (normalmente tensión o corriente) que puede ser procesada por nuestro sistema. [editar]Ejemplo A veces el sistema de adquisición es parte de un sistema de control.

que normalmente no puede excitar la entrada de un convertidor.a.(Normalmente en tensión). sobre todo cuando el sistema admite señales positivas y negativas con respecto a masa. La adaptación entre los rangos de salida del convertidor y el de entrada del convertidor tiene como objetivo el aprovechar el margen dinámico del convertidor. RS-485 o Ethernet para conectar a un ordenador o estación de trabajo. momento en el cual la salida binaria del convertidor nos da tanto la magnitud como el signo de la tensión que ha sido medida. ya que para ésta entran en funcionamiento las redes de protección que el convertidor lleva integrada). cuya impedancia típica suele estar entre 1 y 10 k.  Acoplar la impedancia de salida de uno con la impedancia de entrada del otro. de modo que para infinitos valores de la entrada la salida sólo puede presentar una serie determinada de valores. Por tanto la cuantificación implica una pérdida de información que no podemos olvidar. ya que puede hacer que obtengamos datos erróneos. Este paso hay que tenerlo siempre en cuenta. la adaptación de impedancias es imprescindible ya que los transductores presentan una salida de alta impedancia. de modo que la máxima señal de entrada debe coincidir con la máxima que el convertidor (pero no con la máxima tensión admisible. El convertidor analógico/digital es un sistema que presenta en su salida una señal digital a partir de una señal analógica de entrada. La etapa de salida es el conjunto de elementos que permiten conectar el s. y puede ser desde una serie de buffers digitales incluidos en el circuito convertidor. de modo que las etapas posteriores al convertidor puedan leer estos datos adecuadamente. La codificación es el paso por el cual la señal digital se ofrece según un determinado código binario. en el caso de sistemas de adquisición de datos comerciales. (normalmente de tensión) realizando las funciones de cuantificación y codificación. [editar]Ventajas . La cuantificación implica la división del rango continuo de entrada en una serie de pasos. Por otro lado.d con el resto del equipo. hasta una interfaz RS-232. Esta adaptación suele ser doble y se encarga de:  Adaptar el rango de salida del transductor al rango de entrada del convertidor.El acondicionamiento de señal es la etapa encargada de filtrar y adaptar la señal proveniente del transductor a la entrada del convertidor analógico / digital.

facilidad de automatización.35gigabytes [editar]Véase tipo de ejercicio de adquisición también    Procesamiento de señales Análisis de datos Dispositivos de entrada:  Escáner 3D . esta capacidad la tendremos que multiplicar por dos y eso nos daría 75. el control de máquinas y de producción. Se utiliza en la industria. gran capacidad de almacenamiento. [editar]Un Ejemplo 1 Tenemos 300 señales a monitorizar. Todas ellas de 4 bytes y queremos guardar la información de todo el proceso cada segundo. se adquieren gran cantidad de datos para poder analizar.¿qué capacidad ha de tener el disco duro del PC servidor para tener un histórico de todo un año? 300segundos * 4bytes = 1200bytes * segundo 3600 * 24 * 365 = 31536000 1200 * 31536000 = 37. Ejemplo 2 En un sistema de adquisición de datos entran 210 señales por segundo. ¿qué capacidad ha de tener el disco duro del PC servidor para tener un histórico de todo un mes? 210segundo * 8bytes = 1680bytes * segundo 3600 * 24 * 30 = 2592000 1680 * 2592000 = 4. la detección de fallas y el control de calidad entre otras aplicaciones. la investigación científica.8 GB. Pero teniendo en cuenta que siempre se tiene que tener una copia de seguridad.Flexibilidad de procesamiento.8GB Tendríamos que tener una capacidad de 37. de 8 bytes cada una. rápido acceso a la información y toma de decisión. posibilidad de realizar las tareas en tiempo real o en análisis posteriores (a fin de analizar los posibles errores).7 GB. etc. posibilidad de emular una gran cantidad de dispositivos de medición y activar varios instrumentos al mismo tiempo.

la física. la sociología y a muchos otros campos de la ciencia y de la ingeniería. desempeña un papel cada vez más importante en casi todas las áreas del quehacer humano. la estadística son las calificaciones logradas entonos los problemas de un curso del semestre. a lo que debe su nombre. C. las calificaciones de los alumnos y los sueldos del profesorado. La palabra Estadística tiene varias acepciones para cada persona.: "Diseño de Hardware Electrónico". I) INTRODUCCION La estadística o los métodos estadísticos. las ciencias políticas. Así para el gerente de de una central de energía eléctrica. Todas estas personas están empleando correctamente el término estadística y sin embrago cada una le da un significado ligeramente diferente y la usa para un propósito un poco distinto. Para el director de una escuela. 1997. la química. Y para un universitario. G. la biología. Loveday. ref nº SLAA013. la educación. el comercio. Aunque en un principio tenía que ver solamente con asuntos de Estado. la comunicación. la electrónica. Editorial Paraninfo. la estadística puede ser la información sobre la cantidad de contaminantes que están siendo emitidos hacia la atmósfera. como se llama algunas veces. la medicina. es la información acerca del ausentismo. Editorial Marcombo. Hoy la estadística y el análisis estadístico están presentes en casi todas las . en la actualidad la influencia de la estadística se ha extendido a la agricultura.   Pallás Areny. la economía.  Conversión analógica-digital Hardware:  PXI  Software:     LabVIEW Measurement Studio para Visual Studio LabWindows/CVI para Lenguaje C MATLAB [editar]Bibliografía  Texas Instruments: "Understanding Data Converters Application Report". Ramón: "Adquisición y Distribución de Señales". la psicología.

.También llamada Estadística Deductiva. así como de sacar conclusiones válidas y tomar decisiones con base en este análisis. 1. debido a que tales inferencias no llegan a ser precisas por completo. El propósito de este curso es presentar una introducción a los principios generales de la estadística. 2.profesiones. en especial para los gerentes. Se han convertido. es aquella que a partir de una muestra representativa de una población se pueden inferir conclusiones importantes. es la que busca únicamente describir y analizar un grupo determinado. presentar y analizar datos. 4. se refiere a un grupo de individuos u objetos. será también de gran valor como referencia para todos aquellos que estén aplicando la estadística en su campo de investigación particular.. organizar.. Por ejemplo. resumir. POBLACION Y MUESTRA Población. ESTADISTICA DESCRIPTIVA. para sacar conclusiones se usa el lenguaje de Probabilidad. que le será útil a todos los individuos sin importar su campo de especialización. La población puede ser finita ó infinita. la población que comprende todas las piezas producidas en un día . DEFINICION ESTADISTICA Se ocupa de los métodos científicos para recolectar. las alturas y los pesos de los estudiantes de una universidad o la cantidad de piezas defectuosas y no defectuosas producidas en una fábrica un día determinado. 3. ESTADISTICA INDUCTIVA. por ejemplo. en una herramienta de suma utilidad.Ó Estadística Inferencial. sin sacar conclusiones o inferencias acerca de un grupo mas grande.También llamado universo.

pero no 2.842. se le llama variable continua.000 familias es un ejemplo de datos discretos. teóricamente.. que puede tomar cualquiera de los valores de un conjunto predeterminado llamado dominio de la variable. O 65. . Ejemplo 1 El número N de niños en una familia. toma cualquier valor entre dos valores dados. El número de hijos en cada una de 1. 2. que puede tomar cualquiera de los valores 0. mientras que las enumeraciones o los conteos dan lugar a datos discretos. mientras que las alturas de 100 estudiantes universitarios son un ejemplo de datos continuos. que puede ser de 62 pulg. es una variable discreta. mientras que la población que consta de todos los resultados posibles (cara o cruz) en lanzamientos sucesivos de una moneda es infinita. REDONDEO DE DATOS . H. Muestra. 63. 6. entonces a esta variable se le llama constante. las mediciones dan lugar a datos continuos.. En general.5 o 3.Pequeña parte de la población en estudio. Si no es así. Si la variable solo toma un valor. es una variable continua.8341 pulg.8 pulg. respectivamente. como X. Y. 1. VARIABLES DISCRETAS Y CONTINUAS Una variable es un símbolo. A los datos que se pueden describir mediante una variable discreta o continua se les llama datos discretos o continuos.. se denomina variable discreta. 5. A una variable que.determinado en una fábrica es finita. dependiendo de la exactitud de las mediciones. x o B. 3. Ejemplo 2 La altura H de un individuo.

escolaridad y barrio.81 que de 72.8 a la unidad mas cercana.465 a la centésima más cercana se tiene un dilema. Para determinar el mercado potencial de un nuevo producto. por ejemplo 72. Ejemplo. Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien fundamentadas acerca de las causas y. De manera semejante. el departamento de personal habrá de determinar si ese fenómeno se dio . los hospitales tienen expedientes con el número de pacientes que usan los servicios de rayos X. puesto que 72. 72.575 se redondea a 183. Y deben cerciorarse de que el grupo contenga una gran diversidad de personas que representen variables como nivel de ingresos. 183.81. Obtener datos de observaciones o registros. raza. pues esta información ayuda a preparar los informes de los médicos y a hacer la facturación. ya que 72. En estos casos se acostumbra redondear al entero par anterior al 5.58. Utilizar los datos referentes al pasado para tomar decisiones sobre el futuro. Al redondear 72. y 116 500 000 redondeado al millón mas cercano es 116 000 000.8 está mas cerca de 73 que de 72. Los estadísticos seleccionan sus observaciones de manera que todos los grupos relevantes estén representados en los datos.82. Colección de Datos Representar a todos los grupos. REPRESENTACION TABULAR Para que los datos sean útiles. es 73. De manera que 72. los analistas podrían estudiar a 100 consumidores que viven en cierta zona geográfica. Por ejemplo. sobre los efectos probables de ciertas características en algunas situaciones. si los expedientes del hospital indican que más pacientes usaron los servicios de rayos X en Junio que en Enero. Los datos provienen de observaciones reales o de documentos que se conservan para usos ordinarios.El resultado de redondear un número.46 que de 72. Esta práctica es especialmente útil para minimizar errores de redondeo acumulados cuando se tiene un gran número de operaciones.8146 redondeado a la centésima más cercana (o a dos decimales) es 72.465 se redondea a 72.465 está exactamente igual de lejos de 72. por tanto. hemos de organizar nuestras observaciones de manera que podamos seleccionar tendencias y llegar a conclusiones lógicas.8146 está más cerca de 72.46.47. ya que 72. 7.

sale basura! . habrá de ajustar su programa de contrataciones y vacaciones para tenerla en cuenta. En la actualidad las computadoras permiten a los estadísticos reunir enormes volúmenes de observaciones y condensarlas instantáneamente en tablas. si son diferentes tipos de automóviles fabricados por todas las empresas automotrices o si son los diversos colores de abrigos fabricados por determinada compañía. Para poder confiar en la interpretación de unos datos cualesquiera. aquello en torno a lo cual los datos tienden a agruparse. que valores aparecen con mayor frecuencia y otros aspectos. Podemos simplemente reunirlos y conservarlos en orden. Buscamos cosas como el intervalo (los valores máximos y mínimos). las tendencias notorias. Tendremos que representar los puntos graficados (observaciones) de datos por orden alfabético o por algún otro principio organizador. Si las observaciones se miden en números. La finalidad de organizar los datos es permitirnos ver rápidamente todas las características posibles de los datos que hemos recabado. . mejor conoceremos la población de donde proviene y mejores serán las decisiones que tomemos. Pero si los datos son trabajadores calificados (digamos carpinteros. Cuando los datos se organizan en forma compacta y útil. Se trata de formas compactas y utilizables. los encargados de la toma de decisiones consiguen información confiable del ambiente y se valen de ella para llegar a decisiones inteligentes. también podemos listar los puntos de datos por orden ascendente de valor numérico.sólo en el presente año o si es una indicación de una tendencia constante. De ser así. albañiles ó electricistas) que se necesitan en los sitios de construcción. Este método da origen a una distribución de frecuencia y se explica mas adelante. necesitaremos organizarlos de modo diferente. gráficas y números. ¡Entra basura. antes se prueban formulando las siguientes preguntas: ¿De dónde proceden los datos? ¿Apoyan o contradicen los datos la otra evidencia con que se cuenta? ¿Existen datos que ignoramos y que nos harían llegar a una conclusión diferente? ¿Cuántas observaciones tenemos? ¿Es lógica la conclusión? Hay muchas maneras de clasificar los datos. pero cabe preguntar. ¿son confiables? No olvide que la exactitud de los datos que salen de la computadora depende de los que entran en ella. Cuanto mas abundante sea la información de este tipo que obtengamos de la muestra. Una forma útil de hacerlo consiste en dividir los datos en categorías o clases similares y luego contar el número de observaciones que caen dentro de cada categoría.

con sus correspondientes frecuencias de clase. Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente de magnitud. que está ordenado en forma alfabética. a lo que se le llama frecuencia de clase. se le conoce como distribución de frecuencias o tabla de frecuencias. obtenidas del registro universitario.. A una disposición tabular de los datos por clases. Ejemplo.II) DISTRIBUCIONES DE FRECUENCIA 1. DEFINICION Datos Sueltos. el rango es 74-60= 14 pulg. Ordenación. Se les llama Datos Sueltos a los datos que no han sido organizados numéricamente. A la diferencia entre el número mayor y el menor se le conoce como rango de los datos. 2. y determinar el número de individuos que pertenecen a cada categoría. Por ejemplo.Tabla 2-1 Estaturas de 100 estudiantes hombres de la universidad XYZ |Estatura |(pulg) |60-62 |63-65 |66-68 |69-71 |72-74 |Número de |Estudiantes |5 |18 |42 |27 |8 | | | | | | | . ORDENAMIENTO DE DATOS Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías. Un ejemplo es el conjunto de estaturas de 100 estudiantes hombres. si la estatura mayor de los 100 estudiantes es 74 pulg y la menor es 60.

A los datos así organizados y reunidos en clases. c) Tamaño o Amplitud de un Intervalo de Clase . el número menor (59.5 y 62. Se acostumbra usar los términos clase e intervalo de clase indistintamente. Como hay cinco estudiantes en esta clase. como el 60-62 de la tabla 2-1. comprende las estaturas entre 60 y 62 pulg y se indica en el rango 60-62. la frontera superior de clase. CONSTRUCCION DE UNA DISTRIBUCION DE FRECUENCIA a) Intervalos de Clase y Límites de Clase El símbolo que define una clase. el número más pequeño (60) es el límite inferior de clase. aunque el intervalo de clase es en realidad un símbolo de la clase. b) Fronteras de Clase Si se miden estaturas con exactitud de 1 pulg. se llama intervalo de clase. además de que se obtienen relaciones evidentes.5). mientras que el número más grande (62) es el límite superior de clase. A los números 60 y 62 se les conoce como límites de clase.5) es la frontera inferior de clase y el número mayor (62. se les llama datos agrupados. Aunque el proceso de agrupamiento generalmente quita detalles originales de los datos. como en la anterior distribución de frecuencias. por ejemplo. las fronteras de clase se obtienen promediando los límites superior e inferior de un intervalo de clase. 3.5000. es muy ventajosa pues proporciona una visión amplia y clara. indicados brevemente por los números exactos 59.| |Total 100 | La primera clase (o categoría). en teoría el intervalo de clase 60-62 incluye todas las medidas desde 59. Estos números. la correspondiente frecuencia de clase es 5. En la práctica.5000 hasta 62.5 se llaman fronteras de clase o límites verdaderos de clase.

la amplitud del intervalo de clase es c=62. A la marca de clase también se le denomina punto medio de la clase. según los datos.5=65. c es igual a la diferencia entre dos límites inferiores (o superiores) de clases sucesivas. d) Marca de Clase La marca de clase.El tamaño o la amplitud de un intervalo de clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce como amplitud. la frecuencia relativa de la clase 66-68 de la tabla 2-1 es 42/100=42%. la marca de clase del intervalo 60-62 es (60+62)/2=61. por ejemplo.5-59.5=3. tamaño o longitud de clase. Determinar el número de observaciones que corresponden a cada intervalo de clase. es decir. Se suelen tomar entre 5 y 20 intervalos de clase. Por ejemplo. En tal caso. De este modo. Si todos los intervalos de una distribución de frecuencia son de la misma amplitud. Para los datos de la tabla 2-1. Los intervalos de clase se eligen también de modo tal que las marcas de clase (o puntos medios) coincidan con los datos realmente observados. 4. . hallar las frecuencias de clase.5-62. Dividir el rango en un número adecuado de intervalos de clase del mismo tamaño. Si esto no es posible. a esta amplitud común se le denota por c. Reglas Generales para Construir Distribuciones de Frecuencia Determinar el número mayor y el menor en los datos sueltos con el fin de especificar el rango (la diferencia entre ambos). DISTRIBUCION DE FRECUENCIA RELATIVA La frecuencia relativa de una clase es su frecuencia dividida entre la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. usar intervalos de clase de distintos tamaños o intervalos de clase abiertos. se obtiene promediando los límites inferior y superior de clase. que es el punto medio del intervalo de clase.

5. Un histograma o histograma de de frecuencias consiste en un conjunto de rectángulos que tienen a) sus bases en el eje X horizontal. brevemente. a la tabla resultante se le llama distribución de frecuencias relativas. tabla de frecuencias acumuladas o. es 5+18+42=65. REPRESENTACION GRAFICA DE DISTRIBUCION DE FRECUENCIA a) Construcción de Histogramas Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las distribuciones de frecuencias. una distribución acumulada. las alturas de los rectángulos son proporcionales a las frecuencias de clase. sus centros en las marcas de clase y longitudes iguales a los tamaños de los intervalos de clase. .5 pulg. incluyendo hasta el intervalo de clase 66-68 de la tabla 2-1. b) Construcción de Polígonos de Frecuencia Un polígono de frecuencia es una gráfica de línea de las frecuencias de clase dibujada con respecto a la marca de clase. Por ejemplo. Puede obtenerse uniendo los puntos medios de las partes superiores de los rectángulos del histograma. Una tabla que presenta tales frecuencias acumuladas se llama distribución de frecuencias acumuladas. y b) áreas proporcionales a las frecuencias de clase. DISTRIBUCION DE FRECUENCIA ACUMULADA La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase. la frecuencia acumulada. Si todos los intervalos de clase son del mismo tamaño.Si se sustituyen las frecuencias de la tabla 2-1 por las correspondientes frecuencias relativas. lo que significa que 65 estudiantes tienen estaturas por debajo de 68. 6. distribución de frecuencias o tabla de frecuencias relativas. inclusive.

sin especificar el tipo. se estará mencionando el caso menor que . como ojivas o más y menores que . mientras que la antes considerada es una distribución acumulada menor que .[pic] Figura 2-1 c) Ojivas y Ojivas Porcentuales Una gráfica que recoja las frecuencias acumuladas por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera es denominada un polígono de frecuencias acumuladas u ojiva. [pic] Figura 2-2 7. etcétera. Las correspondientes ojivas se conocen. entonces. Como de este modo se obtienen estaturas de 59. es deseable considerar una distribución de frecuencias acumuladas de todos los valores mayores o iguales que la frontera de clase inferior de cada intervalo de clase. Siempre que se hable de distribuciones acumuladas u ojivas. de 62. Para ciertos propósitos. se le suele conocer como una distribución acumulada o mas . en la figura 2-2 se ilustra esta gráfica para la distribución de estaturas de los estudiantes de la tabla 2-1. OTROS GRAFICOS a) De Pastel [pic] .5 pulg o más.5 pulg o más.

ppt. Una curva de frecuencia en forma de U tiene máximos en ambos extremos. Una curva de frecuencias multimodal tiene más de dos máximos 8. en la práctica adoptan ciertas formas características. como se ilustra en la figura 2-3.b) Piramidal [pic] c) Tipos de Curvas de Frecuencia Las curvas de frecuencia que aparecen. Una curva de frecuencias bimodal tiene dos máximos. [pic] Las curvas de frecuencia simétricas o en forma de campana se caracterizan porque las observaciones equidistantes del máximo central tienen la misma frecuencia. la cola de la curva a un lado del máximo es mas larga que al otro lado. En una curva en forma de J o de J invertida hay un máximo en un extremo. En las curvas de frecuencia moderadamente asimétricas. CONSTRUCCION DE GRAFICAS POR COMPUTADORA Remitirse al archivo Graficación. o sesgadas. III) MEDIDAS DE TENDENCIA CENTRAL 1. Interpretación de Tendencia Central .

ya que no tendremos necesidad de consultar nuestras observaciones iniciales. Notación de sumatoria El símbolo [pic]denota la suma de todos los [pic] desde j=1 hasta j=N. se denotará esa suma simplemente con [pic] 2. ó simplemente media. por definición. que puede valer 1. También reciben el nombre de medidas de localización. N se llama subíndice. llamados estadísticos resumidos. Media Aritmética La media aritmética. [pic] Cuando no ocasione confusión. para describir ciertas características de dicho conjunto. Igual que los promedios. podríamos servirnos de números individuales. Las Representaciones resultantes de las distribuciones de frecuencia nos permitieron discernir las tendencias y patrones de los datos. 2. La letra j en [pic].En el capítulo anterior aprendimos a construir tablas y gráficas donde se usaban datos brutos. de un conjunto de N números [pic] se denota por [pic] (léase X barra ) y se define por [pic] (1) . 3. las medidas de tendencia central nos indican el punto medio o típico de datos que cabe esperar. Y estos números nos permitirán tomar decisiones más rápidas y satisfactorias. A partir de ellos lograremos una comprensión mas precisa de los datos de la que podríamos conseguir con nuestras tablas y gráficas. Notación de índices Denotemos por [pic] (léase X sub j ) cualquiera de los [pic] valores [pic] que toma una variable [pic]. ¿Pero que sucedería si necesitáramos medidas mas exactas de un conjunto de datos? En ese caso.

Media Geométrica La media geométrica G de un conjunto de N números positivos [pic] es la raíz N-ésima del producto de esos números: [pic] . 12 y 10 es [pic] Si los números [pic] ocurren [pic] veces. o punto medio del intervalo.Ejemplo 1 La media aritmética de los números 8. 6 y 2 ocurren con frecuencias 3. en ese orden. 5. su media aritmética es [pic] Cuando los datos se presentan en una distribución de frecuencias. respectivamente (es decir. el número total de casos). todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase. Ejemplo 2 Si 5. 2. la media aritmética es [pic] (2) donde [pic] es la frecuencia total (es decir. 8. 3. 3. con frecuencias [pic]). 4 y 1.

Mediana y Moda para datos agrupados La Mediana La mediana de un conjunto de números ordenados en magnitud es el valor central o la media de los dos valores centrales. 6. la mediana obtenida por interpolación. 4 y 8 es [pic] 4. 8 y 10 tiene mediana 6 Ejemplo 5 El conjunto de números 5. está dada por [pic] donde: |[pic] |frontera inferior de la clase de la mediana (es decir. la frecuencia total) . 9. 15 y 18 tiene mediana [pic] Para datos agrupados. 7. 5. 11. 4. 8. Ejemplo 4 El conjunto de números 3. la clase que contiene a la mediana) | |[pic] | |número de datos (es decir. 5. 8. 12.Ejemplo 3 La media geométrica de los números 2.

La moda puede no existir e incluso no ser única. y 9 cuenta con dos modas. que corresponde a la recta vertical que divide un histograma en dos partes de área igual. 9. 4 y 7. es decir. 5. 4. el valor más frecuente. 5. 7. 7. 12 y 18 tiene moda 9. 9. 2. La distribución con una sola moda se llama unimodal. la mediana es el valor X (abscisa). La moda llega a obtenerse de una distribución de frecuencias o de un histograma a partir de la fórmula: . 3. Ese valor de X se denota por [pic]. 10. 7. 5. Ejemplo 7 El conjunto 3. Ejemplo 8 El conjunto 2. 8. 7. 10. 4. 5. 10. para ajustar los datos. la moda será(n) el (los) valor(es) de X correspondiente(s) al(os) máximo(s) de la curva. En el caso de datos agrupados donde se haya construido una curva de frecuencias. 11. y se le conoce como bimodal. 12. Ejemplo 6 El conjunto 2.|[pic] | |[pic] |[pic] | |suma de las frecuencias de las clases inferiores a la clase de la mediana |frecuencia de la clase de la mediana |tamaño del intervalo de clase de la mediana | Geométricamente. 9. 4. Ese valor de X suele denotarse por [pic] La Moda La moda de un conjunto de números es el valor que ocurre con mayor frecuencia. 15 y 16 carece de moda.

es posible considerar los valores que dividen al conjunto en cuatro partes iguales. mientras que los valores que dividen a los datos en 100 partes iguales se conocen como percentiles y se indican con [pic]. IV) MEDIDAS DE DISPERSION 1.[pic] donde: |[pic] | |[pic] | |[pic] | |[pic] |Frontera inferior de la clase de la clase modal (clase que contiene a la moda) |Diferencia de la frecuencia modal con la frecuencia de la clase inferior inmediata |Diferencia de la frecuencia modal con la frecuencia de la clase superior inmediata |tamaño del intervalo de la clase modal | 5. el valor central (o la media aritmética de los dos valores centrales) que divide al conjunto en dos partes iguales es la mediana. Extendiendo esta idea. segundo y tercer cuartiles respectivamente. Estos valores. . Cuartiles. Deciles y Percentiles Si un conjunto de datos se ordena de acuerdo con su magnitud. los cuales se denotan por [pic]. se denominan como primero. donde [pic] es igual a la mediana. denotados por [pic]y [pic]. Dispersión o Variación La dispersión o variación de los datos es el grado en que los datos numéricos tienden a esparcirse alrededor de un valor promedio. El quinto decil y el 50º percentil coinciden con la mediana. De forma similar los valores que dividen los datos en 10 partes iguales son llamados deciles.

3. 3. [pic]. 12 es 12-2=10 3. 11. 8. así [pic]. [pic] y [pic]). 5. 3.2. El Rango El rango de un conjunto de números es la diferencia entre el número mayor y el menor del conjunto. Ejemplo 2 Calcule la desviación media del conjunto 2. 6. (El valor absoluto de un número es el número sin el signo asociado y se indica con dos líneas verticales colocadas a los lados del número. La Desviación Media La desviación media o la desviación promedio de un conjunto de N números [pic] se abrevia DM y se define como: [pic] (1) donde [pic] es la media aritmética de los números y [pic] es el valor absoluto de la desviación de [pic] respecto de [pic]. 10. 5. Media aritmética [pic] [pic] . 5. 8. Ejemplo1 El rango del conjunto 2.

Algunas veces se usa el rango intercuartilar [pic]. 5. la desviación media puede expresarse [pic] (2) donde [pic]. Una propiedad interesante de la suma [pic] radica en que es mínima cuando [pic] es mínima (es decir. Desviación Cuartílica El rango semiintercuartilar o desviación intercuartilar de un conjunto de datos se denota por [pic] y se define como [pic] (3) donde [pic] y [pic] son el primer y el tercer cuartiles de los datos.Si [pic] ocurren con frecuencias [pic] respectivamente. la desviación media con referencia a la mediana es mínima). En ocasiones la desviación media se define en términos de desviaciones absolutas con respecto a la mediana u otro promedio. 4. donde las [pic] representan las marcas de clase y las [pic] son las frecuencias de clase correspondientes. Rango entre Percentiles 10-90 El rango percentilar de un conjunto de datos se define como Rango Percentilar [pic] (4) . Esta forma es útil para datos agrupados. en lugar de hacerlo en relación con la media. aunque el rango semiintercuartilar es más común como medida de dispersión.

La Desviación Estándar La desviación estándar o típica de un conjunto de N números [pic] se denota por [pic] y se define como: [pic] (5) donde [pic] representa las desviaciones de cada uno de los números [pic]. es útil para datos agrupados. De esta forma. respecto de la [pic]. Por lo tanto. reemplazando N en los denominadores de las expresiones de las ecuaciones (5) y (6). Además cuando se necesita el mejor estimado. desviación de la media cuadrática. prácticamente no existe diferencia entre las dos definiciones. se usarán las formas (5) y (6). por [pic]. 7. La Varianza . como se le llama en forma común. Si [pic] ocurren con frecuencias [pic] respectivamente. 6. calculada de acuerdo con la primera definición. Por lo tanto [pic] es la media cuadrática de las desviaciones en relación con la media o.Donde [pic] y [pic] son los percentiles 10º y 90º de los datos. ya que el valor resultante representa un mejor estimado de la desviación estándar de la población original. la desviación estándar suele expresarse [pic] (6) donde [pic]. Algunas veces la desviación estándar de los datos de una muestra se define con (N-1). siempre podemos obtenerlo multiplicando la desviación estándar. Para los valores grandes de N (de modo preciso N>30).

Por lo tanto [pic] y [pic] representan la varianza de una muestra y la varianza de una población. en las formas equivalentes: [pic] (7) [pic] (8) donde [pic] denota la media de los cuadrados de los distintos valores de [pic]. cuyos intervalos de clase son del mismo tamaño c. por lo tanto. se representa como [pic] en las ecuaciones (5) y (6). respectivamente. Métodos Cortos para Calcular la Desviación Estándar Las ecuaciones (5) y (6) pueden expresarse. se tiene [pic] o [pic] y el resultado (10) se convierte en [pic] (11) . Cuando es necesario distinguir la desviación estándar de una población de la desviación estándar de una muestra obtenida de dicha población.La varianza de un conjunto de datos se define como el cuadrado de la desviación estándar. Si [pic] son las desviaciones de [pic] con respecto a una constante arbitraria [pic]. los resultados de (7) y (8) se convierten. respectivamente en [pic] (9) [pic] (10) Cuando los datos se encuentran agrupados en una distribución de frecuencias. mientras que [pic] denota el cuadrado de la media de los distintos valores de [pic]. con frecuencia se utiliza el símbolo [pic] para esta última y [pic] (sigma griega minúscula) para la primera. respectivamente.

45% de los casos están incluidos entre [pic] y [pic] (es decir.73% de los casos están incluidos entre [pic] y [pic] (es decir. tres desviaciones estándar a cada lado de la media) [pic] C. respectivamente. La desviación estándar puede definirse como [pic] donde [pic] es un promedio cercano a la media aritmética.27% de los casos están incluidos entre [pic] y [pic] (es decir. B. y la misma media [pic]. la mínima es aquella en que [pic]. Propiedades de la Desviación Estándar A. De todas las desviaciones estándar. una desviación estándar a cada lado de la media) b) 95. Suponga que dos conjuntos con [pic] y [pic] números (o dos distribuciones de frecuencia con frecuencias totales [pic] y [pic]) tiene varianzas dadas por [pic] y [pic]. dos desviaciones estándar a cada lado de la media) c) 99. esta propiedad proporciona una razón importante para definir la desviación estándar como se hizo antes. En distribuciones normales: a) 68. Entonces la varianza combinada de ambos conjuntos (o dos distribuciones de frecuencias) estará dada por [pic] .Esta fórmula ofrece un método muy breve para calcular la desviación estándar y debe utilizarse siempre para datos agrupados cuando el tamaño de los intervalos de clase sea igual.

Sin embargo. Una medida de este efecto es sustituida por la dispersión relativa. V) MOMENTO SESGO Y CURTOSIS 1. Dispersión Absoluta y relativa La variación real o dispersión. determinada a partir de la desviación estándar u otra medida de dispersión. al medir una distancia de 1. Obsérvese que el coeficiente de variación es independiente de las unidades usadas. la misma se denota por [pic] y está dada por Coeficiente de variación [pic] que por lo general se expresa en forma de porcentaje. se define la cantidad .Obsérvese que se trata de una media aritmética ponderada de las varianzas.000 pies. Por este motivo es útil para comparar distribuciones con unidades diferentes. se denomina dispersión absoluta. tiene un efecto muy diferente si la misma variación de 10 pulg se presenta en una distancia de 20 pies. 8. El resultado puede generalizarse a tres o más conjuntos. Una desventaja del coeficiente de variación es que no sirve cuando la media es cercana a cero. que se define como [pic] si la dispersión absoluta es la desviación estándar [pic] y el promedio es la media [pic]. una variación (o dispersión) de 10 pulg. entonces la dispersión relativa se denomina coeficiente de variación o coeficiente de dispersión. Momentos Si [pic] son los [pic] valores de la variable [pic].

se define como: [pic] (2) Si [pic] entonces [pic]. El r-ésimo momento respecto de cualquier origen A se define como: [pic] (3) donde [pic] son las desviaciones de [pic] respecto de [pic]. Por eso la ecuación (1) se le llama el r-ésimo momento con respecto a cero. El r-ésimo momento respecto de la media [pic]. si [pic].[pic] (1) llamada el r-ésimo momento. 2. la ecuación (3) se reduce a la ecuación (1). Si [pic]. entonces [pic] es la varianza. los momentos anteriores están dados por [pic] (4) [pic] (5) [pic] (6) . El primer momento con [pic] es la media aritmética [pic]. respectivamente. Momentos para Datos Agrupados Si [pic] ocurren con las frecuencias [pic].

Por lo tanto una mediada de la asimetría está dada por la diferencia: media-moda. expresado en forma adimensional y está dado por Coeficiente momento de curtosis [pic] . por lo general. Las fórmulas son adecuadas para calcular momentos a partir de datos agrupados. mientras que la curva que es achatada. Asimetría La asimetría es el sesgo o la distorsión de la simetría de una distribución. En las distribuciones asimétricas. lo que lleva a la definición [pic] 4. se define como mesocúrtica. La distribución normal que no es muy picuda ni muy achatada. Si sucede lo contrario se considera que está sesgada hacia la izquierda o que es de asimetría negativa. se denomina leptocúrtica. Curtosis La curtosis mide que tan puntiaguda es una distribución. 3. que hacia la izquierda. comparada con una distribución normal. [pic] Una medida de la curtosis utiliza el cuarto momento con respecto a la media. se dice que está sesgada hacia la derecha o que es de asimetría positiva. recibe el nombre de platocúrtica. Una distribución con un pico relativamente alto.donde [pic]. la media tiende a caer en el mismo lado de la moda y en el de la cola más larga. Esta puede hacerse adimensional si se divide entre una medida de dispersión tal como la desviación estándar. Si la curva de frecuencias de una distribución tiene una cola mas larga hacia la derecha del máximo central.

Por esto. entonces la asimetría y la curtosis de la población serían [pic] y [pic]. que es positiva en una distribución leptocúrtica. Cuando se requiere distinguir los momentos. respectivamente. ----------------------Sesgada a la derecha (sesgo positivo) Sesgada a la izquierda (sesgo negativo) En forma de J En forma de J invertida En forma de U Bimodal Simétrica o en forma de campana . Para la distribución normal. si los momentos se denotan como [pic] y [pic]. Así. las medidas de asimetría y las medidas de curtosis de una muestra. negativa en una distribución platocúrtica e igual a cero en la distribución normal. Los subíndices siempre son símbolos latinos. se define a la curtosis como [pic]. De manera similar. los símbolos griegos correspondientes serían [pic] y [pic]. [pic]. para determinada población. si las medidas de asimetría y curtosis de la muestra se denotan por [pic] y [pic]. con frecuencia se acostumbra usar símbolos latinos para las muestras y símbolos griegos para las poblaciones.que con frecuencia se denota como [pic].

73% a) Mesocúrtica a) Platocúrtica a) Leptocúrtica .Multimodal 68.45% [pic] [pic] 99.27% [pic] [pic] [pic] [pic] 95.

El cálculo de la amplitud en grados sexagesimales del sector correspondiente se realiza así: ángulo = frecuenc . Se utiliza para la representación de variables cuantitativas continuas. Se utiliza para la representación de variables cuantitativas discretas. si se utiliza la frecuencia absoluta acumu POLÍGONO DE FRECUENCIAS. Histograma acumulativo.REPRESENTACIÓN GRÁFICA DE DATOS Las tablas estadísticas representan toda la información de modo esquemático y están preparadas para los cálcu estadísticos nos transmiten esa información de modo más expresivo. Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia. cada intervalo se representa sobre el ej rectángulo que se dibuja sobre él con altura igual o proporcional a su frecuencia absoluta. nos van a permitir. el poligono de fecuencias se obtiene uniendo por una poligonal los puntos medios del histograma. Si la frecuencia absoluta que se diagrama de barras que se obtiene es: diagrama de barras acumulativo HISTOGRAMA. Si se utilizarán rectángulos de amplitud diferente. discretas o continuas. Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el impacto visual de lo DIAGRAMA DE SECTORES. el polígono de frecuencias se obtiene uniendo por una poligonal. Consiste en dibujar sectores sobre sectores proporcional a su frecuencia absoluta. Para una variable discreta. Se utiliza para todo tipo de variable estadística. Se utilizan para variables estadísticas cuantitativas. Como los intervalo quedan adosados. incluso sacar alguna conclusión sobre el comportamiento de la m estudio. cuantitativa o cualitativa. con un sólo golpe de v observar sus caracteícticas más importantes. cada sector se rellena con un color diferente. Los gráficos estadísticos más usuales son: DIAGRAMA DE BARRAS. cada valor de la variable se representa p él se dibuja una barra de longitud igual o proporcinal a su frecuencia absoluta. el área del rectángulo es la que tendría qu absoluta correspondiente a ese intervalo. los extremos supe Para una variable continua.

absoluta (ni) 3 6 10 8 3 30 . uno de los datos que se han tomado ha uno.Hemos preguntado a 20 personas por el número medio de días que practican deporte a la seman respuestas: Nº días (xi) 0 1 2 3 4 5 6 7 Total fr. 24) 22 [24 . los resultados obtenidos se reflejan en la siguiente tabla: Intervalo marca clase (xi) [20 . 40) 38 Total fr. absoluta (ni) 1 2 4 7 1 1 3 1 20 Realiza en tu cuaderno el diagrama de barras.En un preconocimiento médico realizado a 30 niños.. 36) 34 [36 .Ejemplo 2. Con el pulsador de "gráfico" puedes. al variar su valor. Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el correspondiente gráf Ejemplo 3.. elegir diferente representación gráfica: 1 para dia de frecuencia y 3 para el diaframa de sectores. 28) 26 [28 . 32) 30 [32 . el poligono de frecuencias y el diagrama de sectores correspond resultados.

.........../h . Actividad 5. 30 vehículos Entre 70 y 80 Km.... Unidad de Epidemiología Clínica y Bioestadística.................... 60 " Entre 110 y 120 Km. y representa la correspondiente tabla de frecuencias................Un aparato de radar instalado a la entrada de una población (velocidad máxima permitida... 80 " Entre 100 y 110 Km..................... Con el pulsador de "gráfico" puedes................... Representación gráfica en el Análisis de Datos Autores: Pértega Díaz S.. Pita Fernández S...../h ............... Puedes cambiar los valores de las frecuencias absolutas y observar su imfluencia en el correspondiente gráfic Actividad 4.. al variar su valor............. el poligono de frecuencias y el diagrama de sectores correspondi resultados. 60K " estadística" de infracciones...............Utilizando la encuesta que has realizado en la actividad 2........... Diagrama de barras .... 1....... en el gráfico más adecuado.. elegir diferente representación gráfica: 1 para His frecuencia y 3 para el diaframa de sectores.......... 40 " Entre 80 y 90 Km..... Complexo Hospitalario Universitario de A Coruña (España) Cad Aten Primaria (Pendiente de publicación) Actualizada el 02/04/2001.....Realiza en tu cuaderno el Histograma......................../h .. Diagrama de sectores Fig............./h ..../h .......... De más de 60 a 70 Km........ 2........ Tabla de contenidos: Imprimir documento [¿Problemas con PDF?] Tablas y Figuras Análisis descriptivo Comparación de dos o más Fig.. construye la tabla de frecuencias. pa considerado..... 10 " Dibuja un Histograma que refleje estos valores./h ....... 90 " Entre 90 y 100 Km....

Gráfico de líneas Fig. 10. Histograma Fig. 12. el tipo de gráfico más utilizado es el histograma. 9. son varias las publicaciones que podemos consultar1. de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. la imagen proporcionada por el gráfico de sectores no es lo suficientemente clara y por lo tanto la situación ideal es cuando hay alrededor de tres categorías. representando sobre cada intervalo un rectángulo que tiene a este segmento como base. la información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan. del tipo de variables que estemos manejando2. 13. estadio TNM. etc. Aunque se aconseja que la presentación de datos numéricos se haga habitualmente por medio de tablas. un primer paso consiste en presentar esa información de forma que ésta se pueda visualizar de una manera más sistemática y resumida. Diagrama de barras agrupadas Fig. de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase (Figura 2). En este caso se pueden apreciar con claridad dichos subgrupos. número de recidivas. Cuando se dispone de datos de una población. la tensión arterial o el índice de masa corporal. Diagrama de caja Fig. Un ejemplo se muestra en la Figura 1. Si el número de categorías es excesivamente grande. 11. En losgráficos de sectores. se divide un círculo en tantas porciones como clases tenga la variable. se quiere conocer la frecuencia y el porcentaje del total de casos que "caen" en cada categoría. Para variables numéricas continuas.. 4. Los diagramas de barras son similares a los gráficos de sectores. profesión. Polígono de frecuencias Fig. Se describirán los distintos tipos de gráficos que podemos utilizar y su correspondencia con las distintas etapas del proceso de análisis. etc. Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores (número de hijos. en cada caso. Diagrama de dispersión Fig. 5.). 6. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de . Para construir un gráfico de este tipo. como el sexo. En este artículo se abordará la representación gráfica de los resultados de un estudio. también conocidos como diagramas de "tartas". A la hora de representar los resultados de un análisis estadístico de un modo adecuado. 7. La claridad de dicha presentación es de vital importancia para la comprensión de los resultados y la interpretación de los mismos. Una forma muy sencilla de representar gráficamente estos resultados es mediante diagramas de barras o diagramas de sectores. Análisis descriptivo. Distribución de frecuencias: edad en 100 pacientes Fig. constatando su utilidad en el proceso de análisis estadístico y la presentación de datos. Diagrama de barras de error Fig. 8. se divide el rango de valores de la variable en intervalos de igual amplitud. Gráfico P-P Fig. tales como la edad. en ocasiones un diagrama o un gráfico pueden ayudarnos a representar de un modo más eficiente nuestros datos. Como se puede observar. y antes de abordar análisis estadísticos más complejos. Diagramas de líneas superpuestos Fig. Los datos que nos interesan dependen. Diagrama de dispersión (regresión logística) Fig. Se representan tantas barras como categorías tiene la variable. Para variables categóricas3. Curvas ROC La realización de los estudios clínico-epidemiológicos implica finalmente emitir unos resultados cuantificables de dicho estudio o experimento. 3.grupos Relación entre dos variables numéricas Otros gráficos Bibliografía Tabla I.

si la variable es simétrica. Uniendo los puntos medios del extremo superior de las barras del histograma. comprobar la normalidad de alguna de las variables numéricas de las que se dispone. No se debe olvidar que cuando los tamaños de las dos poblaciones son diferentes. En este caso resulta muy útil undiagrama de barras de error. como son los gráficos P-P o Q-Q. se dibujan dos barras representando el porcentaje de pacientes que tienen o no alguna enfermedad coronaria. por medio del test t de Student. es conveniente utilizar las frecuencias relativas. se presenta en la Figura 4. La línea central en la caja es la mediana. Por último. no implica necesariamente que la diferencia entre ambos grupos pueda ser estadísticamente significativa. junto con su 95% intervalo de confianza. de la forma más simple. la comparación de variables continuas en dos o más grupos se realiza habitualmente en términos de su valor medio. si en una muestra dada. dependen del tipo de variables que estemos manejando. Dicha figura pretende mostrar. se confrontan las proporciones acumuladas de una variable con las de una distribución normal. Así . el primer tramo está comprendido entre los 18 y 19 años. Por otro lado. por ejemplo. LaFigura 5 muestra un gráfico de cajas correspondiente a los datos de la Tabla I. En él se compara el índice de masa corporal en una muestra de hombres y mujeres. por lo tanto. de resumir una variable de tipo numérico es utilizando el concepto de percentiles. gráficamente. aunque en ocasiones coinciden con los valores extremos de la distribución. análisis de la varianza o métodos no paramétricos equivalentes. suele ser necesario. por lo tanto. que la distribución de la variable se aleja de la normalidad. dos grupos de barras: uno para los sujetos con antecedentes cardiacos familiares y otro para los que no tienen este tipo de antecedentes. Cuando se trabaja con dos variables cualitativas podemos seguir empleando gráficos de barras o de sectores. valorar su desviación de la normalidad. mediante diagramas de cajas4. posibles errores en nuestros datos. Un diagrama de cajas o un histograma son gráficos sencillos que permiten comprobar. el 1er y 3er cuartil de la distribución. Sus extremos son. esta vez representando los cuantiles de distribución de la variable respecto a los cuantiles de la distribución normal. se obtiene una imagen que se llama polígono de frecuencias. En los primeros. la frecuencia de sujetos que padecen una enfermedad coronaria es más frecuente en aquellos que tienen algún familiar con antecedentes cardiacos. Si se divide este rango en intervalos de dos años. al igual que el correspondiente histograma y el diagrama de cajas. Por lo tanto. se construye el histograma que se muestra en la Figura 3. En la Figura 6se muestra el gráfico P-P correspondientes a los datos de la Tabla I que sugiere. de un modo puramente visual. Los gráficos Q-Q se obtienen de modo análogo. Esto resulta especialmente útil para comprobar. Procediendo así sucesivamente.5. Para cada grupo. utilizando los datos anteriores. resultan además de gran ayuda cuando se dispone de datos en distintos grupos de sujetos. Otro modo habitual. Como se verá más adelante. los puntos se concentran en torno a una línea recta. la Tabla I muestra la distribución de frecuencias de la edad de 100 pacientes. Como ejemplo. ya que en otro caso el gráfico podría resultar engañoso. para posteriores análisis. se representa su valor medio. Cuando se quieren comparar las observaciones tomadas en dos o más grupos de individuos una vez más el método estadístico a utilizar. pero sí nos puede servir para valorar la magnitud de la misma. en qué rangos se encuentra la mayor parte de los datos. La caja central indica el rango en el que se concentra el 50% central de los datos. Un ejemplo. y así se ha de reflejar en el tipo de gráfico utilizado. así como los gráficos apropiados para visualizar esa relación. y en lo que respecta a la descripción de los datos. En cada grupo. De este modo. Existen otros métodos gráficos específicos para este propósito.los datos en cada intervalo y el área de los rectángulos. Podemos querer determinar. Conviene recordar que el hecho de que dichos intervalos no se solapen. la simetría y el "apuntamiento" de la distribución de una variable y. Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos). entre los que se encuentra el 4/100=4% del total. como se hace en la Figura 7. Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos. Comparación de dos o más grupos. Si la variable seleccionada coincide con la distribución de prueba. y muy útil. dicha línea se encontrará en el centro de la caja. los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal. comprendida entre los 18 y 42 años. la primera barra tendrá altura proporcional a 4. En general. como en la Figura 8. A partir de dicha muestra podemos representar.

permitiendo grandes cambios en su apariencia y facilidad de exportación a otros programas para presentar finalmente los resultados del estudio. Un diagrama de dispersión es el método adecuado para valorar el resultado de un modelo de regresión logística (Figura 12). es posible elaborar otros gráficos. incluso para representar los resultados obtenidos por métodos de análisis más complicados. Cuando lo que interesa es estudiar la relación entre dos variables continuas. Por último. Relación entre dos variables numéricas. En particular. Los coeficientes de correlación (Pearson. por lo tanto. dos diagramas de líneas superpuestos para visualizar los resultados de un análisis de la varianza con dos factores (Figura 11). Estos diagramas son especialmente útiles aquí: no sólo permiten ver si existe o no diferencia entre los grupos. Spearman. Este tipo de gráficos son. Más bien podremos considerarlos dos modos distintos pero complementarios de visualizar los mismos datos. Distribución de una muestra de pacientes según el hábito de fumar. STATGRAPHICS. Cuando se dispone de todos los datos. La mayoría de los paquetes estadísticos (SPSS. podemos construir el diagrama de dispersión de laFigura 10. No olvidemos que las hipótesis de normalidad y homocedasticidad son condiciones necesarias para aplicar algunos de los procedimientos de análisis paramétricos. EGRET. es difícil precisar cuándo es más apropiado utilizar un gráfico que una tabla. pueden utilizarse dos diagramas de cajas. Existen incluso algunos análisis concretos que están basados completamente en la representación gráfica. señalar que también en esta situación pueden utilizarse los ya conocidos gráficos de barras. un modo sencillo de comprobar... S-PLUS.) valoran hasta qué punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la otra.) ofrecen grandes posibilidades en este sentido. en el eje horizontal. gráficamente. es mediante diagramas de dispersión. la elaboración de curvas ROC (Figura 13) y el cálculo del área bajo la curva constituyen el método más apropiado para valorar la exactitud de una prueba diagnóstica. Hemos visto. el método de análisis adecuado es el estudio de la correlación. Otros gráficos. sino que además nos permiten comprobar la normalidad y la variabilidad de cada una de las distribuciones. el valor de una variable y en el eje vertical el valor de la otra. La creciente utilización de distintos programas informáticos hace especialmente sencillo la obtención de las mismas. porcentaje de casos en una categoría. Ejemplo de gráfico de sectores. y valorar hasta qué punto dicha relación puede modelizarse por la ecuación de una recta. representando aquí como altura de cada barra el valor medio de la variable de interés. como una herramienta imprescindible en la presentación de resultados y el proceso de análisis estadístico. Figura 1.. En él puede observarse claramente como existe una relación directa entre ambas variables. donde cada punto puede representar distintas cosas según lo que nos interese en cada momento (el valor medio de una variable. Además de los gráficos vistos. para visualizar este tipo de asociaciones. especialmente útiles en la etapa de selección de variables cuando se ajusta un modelo de regresión lineal. sobre todo cuando interesa estudiar tendencias a lo largo del tiempo (Figura 9). Los gráficos de líneas pueden resultar también especialmente interesantes. por lo tanto. etc). si existe una correlación alta. No son más que una serie de puntos conectados entre sí mediante rectas. Partiendo de una muestra arbitraria. uno para cada grupo. etc. . incluso tridimensionales. Un ejemplo sencillo de variables altamente correlacionados es la relación entre el peso y la talla de un sujeto. como la importancia y utilidad que las representaciones gráficas pueden alcanzar en el proceso de análisis de datos.mismo. el valor máximo en cada grupo. pero ofrecen grandes posibilidades para la representación de datos y pueden ser utilizados en múltiples situaciones. No obstante. donde se confronta. Los tipos de gráficos mostrados hasta aquí son los más sencillos que podemos manejar. La mayoría de los textos estadísticos y epidemiológicos4 hacen hincapié en los distintos tipos de gráficos que se pueden crear. Podemos utilizar. por ejemplo.

. Estadio TNM en el cáncer gástrico. Ejemplo de gráfico de barras.Figura 2.

Distribución de frecuencias de la edad en 100 pacientes. . Ejemplo de un histograma correspondiente a los datos de la Tabla I. Edad 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 41 42 Nº de pacientes 1 3 4 7 5 8 10 8 9 6 6 4 3 4 5 3 2 3 1 2 3 1 1 1 Figura 3.Tabla I.

. Figura 5.Figura 4. Polígono de frecuencias para los datos de la Tabla I. Ejemplo de un diagrama de caja correspondiente a lo datos en la Tabla I.

.Figura 6. Gráfico P-P de normalidad para los datos de la Tabla I.

Barras de error. Variación en el índice de masa corporal según el sexo. Relación entre la presencia de alguna enfermedad coronaria y los antecedentes cardiacos familiares en una muestra. . Diagrama de barras agrupadas. Figura 8.Figura 7.

Número de pacientes trasplantados renales en el Complexo Hospitalario "Juan Canalejo" durante el periodo 1981-1997. Gráfico de líneas.Figura 9. .

Diagrama de dispersión entre la talla y el peso de una muestra de individuos. Figura 11. Dos diagramas de líneas superpuestos.Figura 10. . Variación en el peso medio de una muestra de recién nacidos según el control ginecológico del embarazo y el hábito de fumar de la madre.

Probabilidad de padecer cirrosis hepática.Figura 12. según un modelo de regresión logística ajustando por el % de protrombina y el presentar o no hepatomegalia. . Diagrama de dispersión (regresión logística).

Graphical display of categorical data. [Medline] Altman DA. The box-plot: an exploratory analysis for biomedical publications. 110 (11): 916-21. London: Chapman & Hall. 1997. Johnson TA. 312: 572. Parker RA. Am Heart J 1988. Practical statistics for medical research. J Clin Epidemiol 1993.. Amara IA. repr. Lang TA. . 3. The box plot: a simple visual method to interpret data. 4. Bibliografía 1. Ann Intern Med 1989. [Medline] Simpson RJ. Bland JM. [Medline] [Texto completo] Singer PA. 1997. and reviewers. Kendrick JS. Secic M. 46(3): 231-6. Annotated Guidelines for authors. How to report statistics in medicine. 5. 2. Philadelphia: Port City Press. Altman DG. [Medline] Williamson DF. 6. 1997. BMJ 1996. Editors. Curva ROC para el porcentaje de protrombina en la predicción de cirrosis. 1th ed.Figura 13. Statistics Notes: Presentation of numerical data. Feinstein AR. 116 (6 Part 1): 1663-5.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->