REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DE EDUCACIÓN SUPERIOR UNIVERSIDAD BOLIVARIANA DE VENEZUELA DIRECCIÓN GENERAL ACADEMICA DIRECCIÓN DE PLANIFICACIÓN Y DISEÑO

CURRICULAR PROGRAMA DE FORMACIÓN DE GRADO “GESTIÓN DESARROLLO LOCAL”

SOCIAL

DEL

ANÁLISIS DEL DATO ESTADÍSTICO
GUIA DIDÁCTICA Por los profesores

Deivis Cardoza Emilio Silva José Silva Julio César Falcón Melsi Goitte Ramón Roberto Herrera C.

TERCERA EDICIÓN AGOSTO 2.006 CARACAS-VENEZUELA
1

ÍNDICE

Presentación Unidad I Unidad II Unidad III Unidad IV Unidad V Bibliografía La Estadística: Herramienta fundamental en diversos escenarios de aplicación Organización de los Datos Representación de los Datos Medidas de Posición, de Tendencia Central y de Dispersión Introducción a la Probabilidad, Muestreo y Estimación

3 7 23 40 57 93 102

2

ANÁLISIS DEL DATO ESTADÍSTICO GUÍA DIDÁCTICA PRESENTACIÓN La Guía Didáctica de "Análisis del Dato Estadístico” está diseñada para que los profesores-facilitadores de la UBV contribuyan al logro, por parte de los estudiantes, de la competencia en el uso de las herramientas estadísticas, integradas en todos los Programas de Formación en la UBV. La Estadística es una herramienta fundamental para la formulación, ejecución y seguimiento de cualquier proyecto socio-comunitario y de investigación. El egresado de la UBV tiene que manejar con soltura un leguaje estadístico revestido con una gran sencillez y comprensibilidad, que permita una fluida comunicación dentro de un grupo de trabajo interdisciplinario, y que al mismo tiempo pueda apoyar la resolución de una gran cantidad de situaciones que requieran el estudio de un conjunto de datos para su mejor compresión y aporte de soluciones. Por tanto, no se está buscando de que el egresado de la UBV se convierta en un experto especialista en Estadística, sino más buen que desde su disciplina profesional pueda hacer un adecuado uso de aquella especialidad matemática para su propia área de trabajo individual y colectivo. Esta Guía Didáctica expone de manera sencilla, sustancial y consistente los principales métodos de la Estadística y sus relaciones. La sencillez de esta Guía no disminuye su validez didáctica, apta para todo aquel que se inicia en el estudio de la Estadística Descriptiva e Inferencial. Esta herramienta es indispensable para los proyectos socio-comunitarios y de investigación que aspiren a tener base cuantitativa, pues un proyecto sin datos estadísticos presenta una gran debilidad. Esta unidad curricular básica ha sido diseñada de maneja de suministrar una herramienta de gran utilidad, la cual, apoyada en la antropogogía como estrategia didáctica, impulsará el trabajo autónomo, creativo, responsable y participativo de los alumnos en la ejecución eficaz de las tareas propias de Proyecto I y Proyecto II. La estructura de la Guía consta de cinco Unidades divididas en Temas. Unidad I Unidad II Unidad III La Estadística: Herramienta escenarios de aplicación Organización de los Datos Representación de los Datos fundamental en diversos

3

de ejemplos propios de la vida cotidiana individual y colectiva del estudiante en su ámbito académico y social. pues de esa manera se podrá facilitar el proceso educativo y dialógico de enseñanza-aprendizaje de las ideas y planteamientos matemáticos de la Estadística. Sugerencias para uso de la Guía Para los profesores: La Guía constituye una orientación para apoyar la actividad. informes y exposiciones que deberán ser realizados en forma individual por el alumno. debe ser utilizada en forma secuencial y flexible. agregar. 4. El profesor–facilitador debe orientar y adaptar esta propuesta al grupo de estudiantes que tiene a su cargo. y a su vez se contrarrestará la tendencia equivocada. aclarando conceptos y explicando los ejercicios (actividades) que se les propongan y no entiendan. 3) Contenido. de Tendencia Central y de Dispersión Introducción a la Probabilidad. Son de varios tipos: 4.2) Grupales o Cooperativos: Incluyen investigaciones. combinar o eliminar contenidos. Estructura del Unidad Cada Unidad está compuesta de cuatro partes: 1) Objetivo. debates y otros trabajos y experiencias realizadas en equipo por los estudiantes. 4. En todo momento el profesor debe hacer uso constante. El profesor actuará como compañero facilitador del aprendizaje (es un estudiante más de la sección pero con Título Universitario). negativa y prejuiciada de considerarla como algo muy difícil y aburrido y de escaso provecho y nula importancia. y así se podrá percibir y valorar objetivamente la utilidad práctica de esta disciplina. Muestreo y Estimación En estas Unidades se presentan los contenidos y las correspondientes actividades didácticas que se realizan en el lapso académico estimado para esta Unidad Curricular. de manera que podrá cambiar.3) Comunitarias: Actividades centradas en la interacción socio comunitario y el trabajo participativo. ensayos. 4) Actividades. en forma amena y sencilla. 4 . Se presentan como estrategias de aprendizaje/evaluación para ser realizadas por los estudiantes bajo la guía y supervisión del profesor-facilitador. 2) Competencia a lograr.Unidad IV Unidad V Medidas de Posición.1) Individuales: Incluyen resúmenes.

entre otros. cada alumno podrá elaborar con mayor facilidad su portafolio de aprendizaje. y tiene varias finalidades:  Sirve como insumo para la evaluación. Para los estudiantes El estudiante debe comprometerse con su proceso de aprendizaje. Debe acudir a los encuentros programados con el profesor para comentar. 1) Validar la ejecución de las actividades por parte de cada grupo y al mismo tiempo evaluar la evolución del proceso de aprendizaje individual. respondiendo las preguntas que se presenten u ofreciendo algunas ideas del material mediante el uso de diversas metodologías pedagógicas. como por ejemplo mapas conceptuales. Aprendizaje por Proyecto. problemas estadísticos y otros relacionados que puedan surgir. para lo cual llevará un registro. leyendo cuidadosamente la guía consultando los textos de estadística a su alcance y cumpliendo con las actividades asignadas. en el se reunirán todos los aportes y resultados de las actividades grupales e individuales. El desarrollo del portafolio de aprendizaje queda a libre decisión de los integrantes del curso. 2) Presentar la nueva propuesta de actividad. indagar. y para encontrar orientación acerca de temas relacionados.  Podrá presentado en eventos científicos y exposiciones de interés.  Sirve como registro de la actividad creadora de los estudiantes para ser recopilado como testimonio de producción de saber en la UBV. Al final de cada Unidad se propone realizar una prueba diagnóstica a fin de validar el avance del proceso de aprendizaje o logro de las competencias 5 . La actividad a ejecutar por el profesor–facilitador en cada sección de facilitación del proceso de aprendizaje constará de dos partes.El profesor–facilitador llevará el registro de la evolución del proceso de aprendizaje. Se sugiere usar metodologías pertinentes con respecto a los lineamientos institucionales de la UBV en materia de evaluación. así como la metodología de evaluación de cada uno de los estudiantes. Los alumnos se agruparan en equipos de trabajo para realizar las actividades asignadas. Tablas de resumen acerca de la teoría presentada a consideración. De esa manera. ampliar lo conocimientos que ha adquirido por si mismo. con quienes se reunirá para validar el desarrollo de sus actividades y aprendizaje.

com. y que sirva de apoyo y estímulo para el desarrollo profesional y la creación de su propio conocimiento individual y colectivo. 6 . Como propuesta organizativa para las actividades asignadas. los equipos de trabajo contarán como máximo con el 20% del total de alumnos de la sección.esperadas. que disfruten de la aventura de aprender haciendo. ponemos a su disposición los siguientes correos electrónicos: mgoitte@yahoo.es. Independientemente de los mecanismos de evaluación a implementarse. Con el fin de que el lector pueda aportar ideas y sugerencias para enriquecer y mejorar la Guía Didáctica. Esperamos que esta Guía sea realmente útil para todos ustedes. el verdadero objetivo sea alcanzar resultados cualitativos que reflejen el aprendizaje de los conocimientos de la Unidad Curricular. Dentro del equipo de trabajo se nombrará un coordinador quien ejercerá dicha función (asignándole a cada uno su aporte en la ejecución de la actividad) y apoyará positivamente la discusión y ejecución de las actividades a realizar en cada Unidad. más allá de obtener cualquier nota o resultado cuantitativo. y silvachapellin@yahoo. estos deben tener carácter formativo para que.

y ayudar a tomar mejores decisiones sobre dicho fenómeno además de predecirlo a futuro. COMPETENCIAS A LOGRAR: 1) 2) 3) 4) 5) Definir y analizar la Estadística. Definir y diferenciar población y muestra. haciendo más fácil y práctica la transmisión de esa información. 7) Comprender la importancia de obtener buenos datos y los métodos para su obtención. 8) Comprender cada uno de los procesos que involucra una investigación estadística.1 ¿Qué es la Estadística? Es un conjunto de métodos y técnicas a usarse para recolectar. organizar. CONTENIDO: TEMA 1 1. presentar. Ejemplos: 7 . y reconocer la diferencia entre una variable discreta y una continua y la escala o nivel de medición de un grupo de datos. Mencionar y definir las diferentes ramas de la Estadística. las ventajas y la necesidad de las muestras. teniendo ese estudio el fin de generar conocimientos de los mismos. 9) Definir la fuente y la técnica de muestreo a emplear en la recolección de datos. simular. Explicar el objetivo.UNIDAD I: LA ESTADÍSTICA: Herramienta fundamental en diversos escenarios de aplicación. clasificar. analizar. Citar algunas aplicaciones de la Estadística en la vida real. OBJETIVO: El estudiante comprende la importancia de la Estadística. Estadística se refiere a información numérica que puede presentarse tanto en forma grafica como en tablas. 1.1 ¿Qué significa Estadística? En nuestro lenguaje cotidiano. O sea. la Estadística es el estudio de la incertidumbre y capacita para enfrentar el azar. controlar y evaluar hechos sujetos a un estudio numérico como base para la descripción.1. explicación y comparación de un fenómeno (al cual están asociado tales hechos) que afecta a grupos de naturaleza diversa. 6) Definir los conceptos de dato y variable. sus conceptos básicos y aplicaciones. explicar. 10) Diseñar el instrumento para la recolección de datos.

 El número de decesos anuales debidos al alcoholismo. extraña o poco común. 3) Inferir sobre grupos numerosos en estudio.  El salario promedio de los habitantes de la parroquia La Vega.2 ¿Por qué y para qué se estudia la Estadística? Hay tres razones para estudiar Estadística: 1) Hay datos en todas partes. La Estadística se ocupa de la caracterización y aplicación de técnicas para: 1) Diseñar una investigación. 1. la Estadística:  Es una herramienta que ayuda a interpretar los datos generando información y conocimiento de la realidad.  El número de goles anotados por la vino tinto. 1.3 ¿Cuál es la utilidad de la Estadística? El verdadero alcance de la Estadística no puede circunscribirse a las formulaciones abstractas numérico-algebraicas propias de su concepción técnicometodológica. se tomarán decisiones que involucren datos. La Estadística es algo más que números. a partir de los datos de la investigación. y las soluciones y decisiones a tomar pueden ser o no ser de orden cuantitativo. 3) No importa cual sea la línea de trabajo.  La cantidad de estudiantes de la UBV por cada Programa de Formación de Grado y por cada sede a nivel nacional.  Ayuda a obtener la información indispensable en la planificación de las soluciones necesarias que las comunidades requieren en diversos otros escenarios.1. Esos tres elementos tienen su origen en situaciones cotidianas de la vida real que el ser humano debe resolver de diversas maneras. 8 . y asimilarla e interpretarla en función de revelar el carácter teórico-práctico y abstracto-concreto de la vinculación entre conocimiento y realidad. 2) Resumir los datos de la investigación. bien sea un experimento comparativo.1.  El porcentaje de graduados de las universidades públicas del país. Luego. 2) Las técnicas estadísticas se usan para tomar decisiones que afectan nuestro bienestar. una encuesta por muestreo. Si son de ese orden. un estudio observacional. cuentas y fórmulas de apariencia complicada. El número de niños que viven en una determinada parroquia de Caracas. o de construcción de un modelo. quien estudie y use la Estadística debe contextualizarla en su justa dimensión.

la Economía. dejaría de tener sentido cualquier tendencia a descontextualizar la Estadística en particular. individuos u objetos a los que se le consideran en estudio una o varias características comunes. cantidades. representándose esta con letras griegas minúsculas.  Las que deben obtener sus resultados con la máxima exactitud posible. Partiendo de este criterio. la Sociología. Parámetro es una medida numérica obtenida por el manejo y procesamiento de los datos de la población descrita por dicha medida. la Educación. como un compendio de conocimientos misteriosos y de escasa o nula utilidad real. 9 . Ejemplo: Los pacientes de los hospitales públicos del país.  Los que deben estudiarse desde el punto de vista cualitativo y cuantitativo.1.4 Ciencias y fenómenos que requieren del uso de la Estadística En vista de la utilidad de la Estadística en diversas áreas. Partiendo de las anteriores consideraciones. la Física y la Meteorología. o se presentan con diferentes intensidades o frecuencias. tales fenómenos podemos clasificarlos en: Los que no pueden estudiarse por simple observación porque es muy grande la cantidad de objetos o casos a considerar en esos fenómenos. el tiempo en que estos ocurren es muy distante. como es el caso de la Demografía.  1. como la Biología. y la Matemáticas en general.2 Población y Parámetro Población es el conjunto total de elementos. Permite procesar información que sirve de base a la ejecución de cualquier proyecto. 1.  Las que la usan para estudiar fenómenos cualitativos y cuantitativos. como las investigaciones socio-económicas.  Los que al estudiarse cuantitativamente reproducen errores que necesitan de la Estadística para corregirlos o eliminarlos. lo cual implica que muchas veces se confundan con esta. como la Astronomía. Cada una de estas ciencias se aboca a estudiar fenómenos que por sus características particulares requieren de diferentes tratamientos al aplicarles los métodos estadísticos. etc. las ciencias que la necesitan se clasifican en:  Las que obligatoriamente la requieren.

4.727.2 Estadística Inferencial o Inductiva (o Inferencia Estadística) 10 . las características esenciales de la muestra en cuestión sin que sobrepasen los conocimientos que proporcionan los datos.104 39.355 32. Estadígrafo o Estimador Muestra es un subconjunto o parte de la población.10% Población Total 24. generalmente minúsculas.) Cuadro 1: Hogares y personas en situación de pobreza Primer Semestre 2.393 28. por medio de ciertas medidas.776. Estadístico.05% Pobres Extremos 6.852 100% 1.85% Pobres 7.3 Símbolo del Parámetro μ σ σ2 Muestra y Estadístico.004 Categoría Cantidad Porcentaje No Pobres 9.E. representándose esta con letras latinas.1 Estadística Descriptiva o Deductiva (o Análisis Estadístico) Consiste en procedimientos usados para tratar y organizar los datos de una muestra en estudio con el fin de sistematizarlos.610. Ejemplo: De acuerdo a los datos suministrados por el Instituto Nacional de Estadística (I. procedimientos que permiten describir y analizar. Ejemplo: De la población anterior. gráficas y tablas. los pacientes del hospital de los Magallanes de Catia. Medida Media Desviación Estándar Varianza 1.4 Tipos de Estadística Símbolo del Estadístico X S S2 1.Medida Media Desviación Estándar Varianza 1. condensarlos y presentarlos mediante cuadros.4. Estadígrafo o Estimador es una medida numérica obtenida por el manejo y procesamiento de los datos de la muestra descrita por dicha medida.113. reducirlos.N.

se investiga una población en base a muestras. generalizaciones e inducciones válidas mediante el procesamiento de los datos de esa muestra. Es importante diferenciar en el estudio estadístico que se realiza si los datos provienen de una población o de una muestra. 1. responda las preguntas y agréguelo a su portafolio. analizamos sus características particulares. presupuesto y suficiente tiempo antes y después del levantamiento. De los 1.5 Consideraciones acerca de la Población y la Muestra Para estudiar las características de los elementos que integran una población o de algún fenómeno que la afecte. podemos analizarlos mediante los métodos que provee la Estadística Descriptiva. Una muestra debe ser representativa de la población de la que ha sido extraída.Es un conjunto de técnicas que se utilizan para una población con el propósito de seleccionar una muestra representativa de esta y obtenerle estimaciones. De allí que gran número de veces. en lugar de realizarse un censo. y todos sus elementos deben contener características en la misma proporción en que se hallan para la población total. Para realizar un censo se requiere de gran cantidad de personas entrenadas. Ejemplo: La cooperativa de enlatados de Río Caribe pidió a una muestra de 1.960 encuestado 1. tomamos decisiones u obtenemos conclusiones. En el caso del censo. Si disponemos de los datos de las características de todos los individuos que componen una población. se puede ejecutar un censo o escoger una muestra. En el caso de una muestra. tenemos que investigar todos y cada uno de los elementos de la población. 11 .176 dijeron que comprarían el atún si lo ponían en venta. y mediante la Inferencia Estadística se determinan las características de la población total.960 consumidores probar una variedad de atún enlatado con orégano llamado Delicias de Sucre. y simplificar éstas obteniendo algunas medidas que las representan (estadísticos). siendo que el alcance de los conocimientos aportados por esos datos es sobrepasado por las estimaciones antes referidas. y en base a los resultados deducimos las leyes que rigen a la muestra o al fenómeno (a través de las Probabilidades) e inferimos sobre las características de la población total para hacer previsiones sobre los mismos.  ¿Que información obtuvo la cooperativa de enlatados de Río Caribe acerca de la aceptación del atún con orégano por parte de la población?  ¿Es éste un ejemplo de Estadística Descriptiva o Estadística Inferencial?  Tome este ejemplo. investigamos solo un conjunto parcial de los elementos que integran una población. planificación. reduciendo los datos a tablas o distribuciones.

2) Se recolecta una muestra de la población siguiendo un procedimiento establecido e idóneo. dada en forma numérica o gráfica. 3) Los datos de la muestra se convierten en información útil (la cual. pero para conocer de manera muy aproximada las características de la población (parámetros) es necesario recurrir a la Estadística Inferencial. 4) Se aplican las teorías de inferencia estadística a la información de la muestra para obtener conclusiones sobre la población muestreada (estas conclusiones o respuestas se denominan inferencias).Si los datos provienen de un conjunto parcial de la población (muestra).6.6 Datos y Variables 1.1 Definiciones Dato Estadístico es una cantidad o categoría susceptible de ser observable y medible en una población o muestra. 1. Variable Estadística es una característica o propiedad 12 . Estos pasos se indican en la siguiente figura. Por otra parte. Para dar así una solución estadística a un problema. En general se le denomina simplemente como Dato. se denomina Estadísticas de la Muestra). un objetivo típico en Estadística es describir la población con base en información obtenida mediante la observación de relativamente pocos elementos individuales. también usaremos la Estadística Descriptiva para analizarlos y obtener algunas medidas (estadísticos) que nos describan las características de los datos de la muestra. En conclusión. se desarrolla una secuencia de pasos: 1) La situación bajo investigación se define cuidadosa y completamente.

es decir. entonces ese valor no es un dato y sí lo es en caso contrario. categoría o atributo. Asume cantidades decimales e ininterrumpidas en su extensión. 1.2 ¿Para qué necesitamos recolectar datos?  Mide el desempeño de un servicio o proceso de producción en curso que realizan las distintas comunidades.7 Tipos de variables Variables Cualitativas o Categóricas: son aquellas características o variables que no son numéricas.  Ayuda en el proceso de toma de decisiones cuando se estudia un determinado evento. 1. cualquier número entre dos dados. es decir.Peso de los alumnos -. Si un valor no aparece en algún componente o elementos de la población o muestra. Las variables asumen los datos como valores.Kilómetros recorridos -. Discretas: son respuestas numéricas surgidas del proceso de conteo.Número de empleado por empresa -.  Facilita la administración de recursos de diversa índole a ser empleados en la concreción y/o ejecución de las decisiones.que varía de acuerdo con alguna escala o dimensión al asumir diferentes valores (cantidades o categorías) por parte de los componentes de una población o muestra. es decir. Ejemplos: -. es decir. Una variable está asociada a una colección de datos.6. Asume cantidades específicas e interrumpidas en su extensión. 13 . y recíprocamente ocurre lo mismo. cualidad. números enteros o exactos.Estado civil -. denotan modalidad.Estatura. Ejemplos: -. producen respuestas numéricas.Numero de hijos por familia -.Género Cuantitativa o Numérica: son aquellas características o variables que son cantidades. Ejemplos: -. Generalmente se le denomina solamente como Variable.Número de televisores vendidos en el año Continuas: son respuestas numéricas surgidas del proceso de medición.

En cambio. Tal variación.8 Escalas o Niveles de Medición de los Datos La medición es la asignación de valores numéricos a atributos. Las variables se representan con letras mayúsculas del alfabeto latino. hay otro valor observable (potencialmente). pero colocándoseles subíndices para diferenciarlas. o sea. aquellas pueden dar resultados diferentes. Si la variable es cualitativa.Explicando de otra forma la clasificación de las variables cuantitativas. No importan lo próximas que sean dos mediciones de un mismo objeto en dos instantes distintos. que ocurre de modo natural. El problema de la variación se complica al reconocer que esta también ocurre en quienes miden y en los instrumentos que se usan para medir. por lo que sería deseable disponer de un proceso de medición válido y confiable. cada categoría asumida por está se halla asociada a un grupo de datos. Se requiere prestar atención a la variación 14 . decimos que para una variable discreta se dan de modo inherente separaciones entre valores observables sucesivos. ha dado motivo para que las características o propiedades que se miden sean denominadas como variables. los datos se pueden clasificar con las mismas denominaciones que tengan las respectivas variables a la que están asociadas. hay por lo menos un valor no observable (potencialmente). elementos. Si se mide cierta propiedad de dos objetos. los resultados pueden ser diferentes. es decir. categorías. y entre estos. Por otra parte. podemos hablar de datos cualitativos y cuantitativos. La medición corresponde a las características o propiedades propias de los objetos en estudio y no de los objetos en sí mismos. TEMA 2 1. existen datos discretos y continuos. una variable continua puede tomar todos los valores a lo largo de un intervalo. Si el proceso es válido entonces mide lo que se desea medir. una variable discreta es aquella tal que entre 2 valores cualesquiera observables (potencialmente). con la cual debe haber inevitablemente un error de medida. Una variable continua siempre se registra en forma discreta. nunca se puede medir exactamente a la variable continua. sucesos u otros valores según ciertas escalas o reglas. y los datos se representan con el mismo tipo de letra de las correspondientes variables con las que están vinculadas. Un proceso de medición que sea confiable proporciona datos con poca variación y mayor exactitud respecto al objeto a medirse. pero a diferencia de una variable discreta. y entre valores registrables adyacentes la magnitud de la distancia queda determinada por la precisión de la medición. Por tanto. una variable continua tiene la propiedad de que entre 2 valores cualesquiera observables (potencialmente).

1 Escala de Medición Nominal o Clasificatoria Es una escala adoptada por variables cualitativas.8. resta. Calificación Superior Bueno Aceptable Pobre Inferior 1.2 Escala de Medición Ordinal o de Rango Escala en la que se establece un orden jerárquico entre datos o categorías de variables cualitativas. Por tal motivo se han propuesto criterios de validez y confiabilidad referentes a aspectos que conviene tener en cuenta para evaluar la calidad de los datos. 1. es decir. y en la misma no existe un cero absoluto o verdadero. Si el símbolo es numérico.3 Escala de Medición de Intervalo Escala en la que se establece distancias o intervalos iguales entre valores numéricos. o la siguiente lista de las calificaciones que los alumnos dieron a un profesor de la UBV en el curso de PIUNI.8. que se define como un sistema de valores y condiciones relacionales que asigna un grado o valor a una variable en base a los sujetos u objetos sometidos a medición. Tiene la 15 Frecuencia 6 28 25 12 3 . número de revistas deportivas. la cual consiste en la clasificación en dos o más categorías. que no tienen vinculación entre sí y se les asignan nombres o símbolos. mujer). Uno de esos criterios a considerar es la Escala o Nivel de Medición de Datos. Esta escala se utiliza para variables cuantitativas. Cualquiera que sea el símbolo.y a como esta puede afectar la calidad de los datos. Al igual que en el nivel ordinal. Ejemplo: El escalafón militar. únicamente se cuantifican frecuencias en cada categoría. número de estudiantes con credencial que entran a juego de fútbol y que sean mujeres. no se le aplican operaciones matemáticas (suma. y no representa la ausencia de la característica en estudio.8. La técnica estadística a emplearse en el análisis de los datos obtenidos depende del uso de una de las cuatro escalas de medición que se dan a continuación. este sustituye a las palabras. En esta escala no se indica la magnitud de la diferencia entre categorías. multiplicación y división). y sólo se cuantifica la frecuencia o el número de casos asociados a una categoría. este se fija arbitrariamente en forma relativa. Ejemplos: Género (hombre. 1. ni se aplican operaciones matemáticas básicas a los nombres o símbolos que las representan.

Kelvin o Réaumur. o los dados en la aplicación de una encuesta o un experimento. El siguiente cuadro resume las escalas aquí referidas. como el Calendario Gregoriano o el Musulmán. y la distancia y relación proporcional entre dos números tiene sentido. el salario diario de los miembros de la comunidad. y además el valor cero tiene significado y representa la ausencia de la característica estudiada. Por otra parte. o los obtenidos por la realización de un estudio u observación directa. y se fija el cero absoluto inicial 1. y esa medición representa otro valor de la temperatura cuando se mide en Grados Fahrenheit. la temperatura en Grados Centígrados no posee un cero absoluto.8. Modo de Medir Asignación de nombres y Nominal o símbolos (pudiendo ser Clasificatoria numéricos) Asignación de nombres y Ordinal o de símbolos (pudiendo ser Rango numéricos) Asignación de símbolos numéricos comparándolos con De Intervalo una unidad de medición. Ejemplos: El tiempo calendario. Ejemplos: El peso de las personas. ordenar y obtener diferencias de mediciones Clasificar. y además la distancia entre las medidas tiene significado. En esta escala sí es posible realizar diferentes operaciones matemáticas. los datos publicados por fuente gubernamentales. la densidad de un objeto.4 Escala de Medición de Razón o de Proporción Es la escala más alta. 1.propiedad de orden de la Escala de Medición Ordinal. la altura de las personas. Tiene todas las características de la escala de intervalo.9 Fuentes de los datos Tipo de Escala Usos admisibles Clasificar Clasificar y ordenar Clasificar. ya que 0º no implica ausencia de temperatura. y se fija el cero relativo inicial Asignación de símbolos De Razón o de numéricos comparándolos con Proporción una unidad de medición. Por ejemplo. 16 . ordenar y obtener diferencias y proporciones de mediciones Son los sujetos u objetos que generan o contiene la información a usarse en una investigación estadística.

1.  Computadora portátil con sus respectivos medios de almacenaje. video-filmadora. En la práctica es aconsejable utilizar fuentes primarias. la cual debe ser resguardada mediante un instrumento de recolección de datos. que son primarias si los datos suministrados por una persona o una institución fueron obtenidos directamente por estos. 17 .Los datos necesarios para la investigación estadística pueden hallarse a través de diferentes fuentes.1 Relación entre Técnica e Instrumento Técnica: Se entiende como Técnica el procedimiento o forma particular de obtener datos o información. agencias u organizaciones no gubernamentales. La aplicación de una técnica conduce a la obtención de información.10 Técnicas e Instrumentos de Recolección de Datos 1. y si no lo obtuvieron tenemos fuentes secundarias. si por la naturaleza del fenómeno y de los recursos disponibles no es posible usar esas fuentes. y si se obtienen por personas.  Una libreta en la que el investigador anota lo observado. entre otros. registrar o almacenar información. grabador de audio. Las dependencias gubernamentales que suministran los datos son fuentes oficiales. que se utiliza para contener. Sin embargo. La fuente primaria más notable es la que publica la información de los Censos Nacionales.  Dispositivos como cámara fotográfica. Son ejemplos de instrumentos:  Un cuestionario en cuya estructura queda registradas las respuestas suministradas por el encuestado (formulario para rellenar). estos se denominan fuentes privadas. Instrumento de Recolección de Datos: Es un dispositivo o formato (en papel o digital).10. es aconsejable emplear las secundarias siempre y cuando los datos facilitados se hayan obtenido de manera técnicamente rigurosa.

Grabador. Computadoras. Cámara de video. Esta modalidad utiliza como instrumento la guía de encuesta. Grabador. Encuesta Oral: Se fundamenta en un interrogatorio cara a cara o vía telefónica en el cual el encuestador pregunta y el encuestado responde. La encuesta puede ser oral o escrita. En esta Guía desarrollaremos la técnica de la Encuesta. Cuestionario: Se realiza de forma escrita mediante un instrumento o formato en papel. Oral DISEÑO DE INVESTIGACION DE CAMPO Encuestas Cuestionario Escrita Guía de entrevista. Se le denomina cuestionario auto-administrado porque debe ser llenado por el encuestado sin intervención del encuestador. Su duración es bastante corta por lo cual se realizan pocas preguntas. 1. Observación Diario de Campo. Estructurada Escala de Estimación. o en relación a un tema en particular. siempre es respondido de forma escrita por el encuestado. muestra o población de sujetos acerca de si mismo. Guía de encuesta.10.2 Tipos de cuestionarios 18 . Encuesta: Se define como una técnica que pretende obtener información que suministra un grupo. Estructurada Grabador.Diagrama de Técnicas e Instrumentos para la Recolección de Datos TECNICAS DISEÑO DE INVESTIGACION DOCUMENTAL Análisis Documental Análisis del contenido INSTRUMENTOS Fichas. Cuadro de Registro y clasificación de categorías Lista de Cotejo. el cual como su nombre lo indica. Entrevistas No Estructurada Libreta de Notas. Encuesta escrita: Se realiza a través de un cuestionario auto-administrado. Cámara de video. Cámara de video. medios magnéticos o electrónicos contentivo de una serie de preguntas. No Estructurada Cámaras fotográfica y de video.

Preguntas Cerradas: Son aquellas que establecen previamente las opciones de respuesta. 5) No incluir preguntas que induzcan a la respuesta (preguntas guías). 3) Evitar preguntas que abusen de la memoria del encuestado. se puede consultar el libro “Estadística General”. la edad y el salario. 2) Ordena las preguntas de lo general a lo particular. Esto con la finalidad de establecer la validez del cuestionario. Para mayores detalles al respecto. tales como. 6) Omitir preguntas que originen múltiples interpretaciones. 11) Una vez construido el cuestionario se recomienda aplicar una prueba piloto o sondeo preliminar a un pequeño grupo que no forme parte de la muestra. Ejemplo: ¿Posee usted un televisor? Si No Preguntas Abiertas o de desarrollo: Son las que no ofrecen opciones de respuesta. y corregir cualquier falla y elaborar una versión definitiva del instrumento. sino que se da la libertad de responder al encuestado. 1. aquellas que se interroga sobre dos puntos en una misma pregunta.4 Planeamiento y ejecución de un estudio estadístico comunitario La descripción de los datos producidos por experimentos comparativos. es decir. es decir estas deben tener una correspondencia con los objetivos específicos de la investigación. de Ernesto Rivas.10.3 Recomendaciones para la elaboración del cuestionario 1) Las preguntas del cuestionario no se inventan a capricho. Ejemplo: ¿Que actividades deportivas realiza durante el último mes? Preguntas Mixtas: Es aquel cuestionario que combina preguntas abierta y cerradas. 1.10. pero que sea equivalente en cuanto a su característica. encuestas. estudios convencionales o construcción de modelos es un paso para lograr inferir resultados obtenidos de los estudios particulares hacia las 19 . 10)Utilizar escalas de rangos para preguntas sobre tópicos muy personales. 4) Obviar preguntas sobre temas o conocimientos especializados. 9) Emplear frases de enlace cuando sea necesario. 8) Incluir preguntas que permitan verificar respuestas anteriores o preguntas de control. quien construye su respuesta de manera independiente. 7) Separar las preguntas de “doble cañón”.

recursos disponibles y necesarios. 2) Desarrollo del instrumento para la obtención de los datos Este paso tiene un carácter subjetivo. fenómeno u objeto y finalidad de la investigación.2. alcance y limitaciones.6. Estos estilos deben tomarse en cuenta para el planeamiento y ejecución de la investigación estadística. Es necesario el estudio de antecedentes y experiencias similares. la descripción se apoya en el análisis estadístico de los datos. Previamente se ha de definir el universo estadístico.poblaciones de interés. y a aquella la podemos clasificar en los siguientes estilos o maneras: 1) Descripción rígida (sin exploración): dispone el uso de técnicas de análisis prescritas sin el examen previo de los datos. así como el alcance de la investigación en el espacio y el tiempo. La necesidad de hacerlo ya la expusimos previamente en la sección 1. La recolección de datos es el fin del planeamiento y ejecución de la investigación estadística. 4) Organización y presentación de los datos Este se realiza mediante: 20 . 3) Recolección de los datos Este es el paso mas importe dentro de la investigación estadística desde el punto de vista operativo. ya que en él se necesita del esfuerzo creativo y constructivo del investigador. 2) Exploratorio: se emplea cuando no tenemos preguntas específicas que guíen la recolección de datos. es decir. y luego hay que diseñar el instrumento para la recolección de la información. definir los tipos de casos que han de ser estudiados. abarcándose los siguientes pasos: 1) 2) 3) 4) 5) 6) Formulación de problema especifico de la investigación Desarrollo del instrumento para la obtención de los datos Recolección de los datos Organización y presentación de los datos Análisis estadístico Interpretación de los resultados 1) Formulación de problema especifico de la investigación Este paso consiste en la definición del evento. Para poder lograr su exacta definición es necesario detener conocimiento sobre el objeto a investigar. En otras situaciones. 3) Confirmatorio: se usa cuando formulamos preguntas precisas en una investigación y recolectamos datos con el fin de darles respuesta.

4.3) La Clasificación: Se determina cada variable evaluada en los instrumentos. ejecución y seguimiento de proyectos y trabajos de investigación. 4. Se interpreta los resultados emitiendo en este momento opinión sobre lo estudiado. 4.La Revisión: Consiste en la inspección de los registros donde se han reunido los datos para corregir los errores.11 ACTIVIDADES Individual Lea la guía con cuidado antes de realizar las siguientes actividades. Grupal Cooperativo  Busque información estadística en la prensa. ¿Cuáles de esas variables son cualitativas y cuantitativas? Determine su nivel de medición. 1. sexo.2) El agrupamiento: Significa volcar en una hoja todos los datos contenidos en los cuestionarios (instrumentos).4) La Presentación (tablas y gráficos): Luego de la agrupación de los datos estos se pueden presentar ordenados en tablas ó cuadros y mediante la representación de graficas.  Resuelve los siguientes ejercicios e incorpórelos a su portafolio de aprendizaje: 21 .1) 5) Análisis estadístico En este paso se calcula todas las medidas o características numéricas (parámetros o estadísticos según sea el caso). los que están asociados a la variable en cuestión. y de todas las hojas antes usadas para registrar los datos se escogen. e inclúyalo en su portafolio de aprendizaje. altura y color de ojos. las respuestas ilógicas y las omisiones. de entre estos últimos.  Escribe un ensayo sobre la utilidad de la Estadística en la formulación.  Recolecte dentro de su grupo familiar las observaciones y datos referentes a las variables edad. 4. 6) Interpretación de los resultados Consiste en traducir las medidas o características numéricas obtenidas en el lenguaje relativo al objeto o evento estudiado. Comente su utilidad y aplicación e inclúyalo en su portafolio.

¿Cuál es la variable cualitativa y cuál la cuantitativa?  Determine si los siguientes datos son cualitativos y cuantitativos. 4.  Recuerde sistematizar todas y cada una de las actividades y generar un reporte para tu portafolio. Internet. nunca con bolígrafo. las cuales clasificará según sus características.004. 3. De ejemplos. Formule el problema e identifique las variables presentes que serán consideradas dentro de su diagnóstico. Tome los cuadros correspondientes al primer semestre del año 2. 6. además de su correspondiente nivel de medición. 22 . 5. Inclúyalo en su portafolio. Considere las variables Población y Fuerza de Trabajo. Busque en la página Web del INE la información poblacional que allí se suministra sobre la fuerza de trabajo (población ocupada). Diseñe el instrumento para la recolección de los datos. Comunitario Trasládese en compañía de su profesor de Proyecto I (II) a la comunidad o lugar donde se ejecutará el Proyecto I (II). y de ejemplos. 4. 1. Altura de los árboles de Caracas. Duración de llamadas a larga distancia. Tipos de vivienda en la comunidad. 2. Aplique el instrumento y recolecte los datos en campo. Investigue y elabore tres tipos diferentes de encuestas (instrumentos). Color de la vegetación. 2. siguiendo las recomendaciones presentada en la guía. Número de camas en el hospital. Explique la diferencia entre una población y una muestra. Numero de vivienda.1. Diga la utilidad de esta investigación y de las variables escogidas. INE. 3. Recuerda trabajar en campo usando sólo lápices de grafito. 6. 3. FUNDACREDESA. Explique la diferencia entre variables cualitativas y cuantitativas. Tipo de teléfono. 2. 4. Todos y cada uno de los grupos escogerán un conjunto de estas variables. 7. 5. 1.

10. 1) Así obtenemos una mejor percepción visual. clasificarlos en base a determinados criterios. 3) La Clasificación: Se determina cada variable evaluada en los instrumentos. de entre estos últimos. expresar (resumidamente) y agrupar en una hoja los datos tal como aparecen descritos en el respectivo instrumento a ser asociado a dicha hoja. los que están asociados a la variable en cuestión. 2) El Agrupamiento: Luego de ejecutarse el paso anterior. y observar aquellas respuestas absurdas. conceptual y sectorizada del volumen de información a ser expuesta en forma manejable para su procesamiento estadístico con las técnicas a ser estudiadas en la presente Guía Didáctica.1 Necesidad de organizar los datos Para poder realizar un análisis lógico de los datos obtenidos en una investigación y contenidos en una serie de instrumentos. 2) Manejar la clasificación de distribuciones de datos y frecuencias 3) Construir distribuciones de frecuencias para datos simples y agrupados. otros) para la elaboración de tablas de datos simples y agrupados. COMPETENCIAS A LOGRAR: 1) Explicar la necesidad de organizar los datos. erróneas o ilógicas.2 ¿Qué se entiende por Observación. corresponde seleccionar. es necesario efectuar: La Revisión: Consiste en constatar y hacer recuento todos los instrumentos contentivos de los datos con el objeto de detectar los espacios en blanco u omisiones. y recordando el paso 4 de la Sección 1. es necesario ordenarlos en forma lógica. 2. En ese sentido. es decir.4 del Unidad I. CONTENIDO: TEMA 1 2. SPSS. Stargrafic. 5) Usar paquetes computacionales (Excel. y de todas las hojas antes usadas para registrar los datos se escogen. Clase y Frecuencia? 23 . corrigiéndolas cuando sea posible. 4) Elaborar una presentación organizada para distribuciones de frecuencias.UNIDAD II: ORGANIZACIÓN DE LOS DATOS OBJETIVO: Organizar datos estadísticos en una distribución de frecuencias.

En el segundo caso. Es decir. y la cantidad de estas es la frecuencia del dato. cuya frecuencia en todo caso viene dada por la cantidad o porcentaje de datos que caen en esa categoría. Si cada observación aparece repetida una sola vez. no hay Distribución de Frecuencias sin Distribución de Datos. y dispuestos de manera separada y consecutiva. entonces la cantidad de datos resulta igual a la cantidad de observaciones (N = n). Una Clase es un grupo determinado de datos u observaciones estudiados. y se distribuyen de forma que un mismo dato u observación no tenga ubicación simultánea en clases diferentes. y ordenados según la escala o nivel de medición empleada al efecto. En el primer caso. Una Distribución de Frecuencias es un agrupamiento de datos en grupos mutuamente excluyentes. Necesariamente deben aplicarse técnicas de conteo con el fin de identificar y cuantificar las observaciones de manera cuidadosa para evitar errores. ya sea en forma unitaria o grupal conforme a las categorías o valores de una variable. pudiéndose colocar estos en orden de magnitud de ser así posible (de acuerdo a la escala o nivel de medición a usarse). 2. Si la variable es cualitativa. un dato es un valor numérico repetido por las observaciones. la cantidad N de observaciones es igual a la cantidad n de datos (N = n) pues cada observación es un dato en sí misma. dando el número o porcentaje de observaciones a cada grupo. y aquella tendrá su respectiva denominación de acuerdo al tipo de frecuencia a 24 . los cuales se pueden ubicar en k grupos. Se entiende por Frecuencia a la cantidad o porcentaje de observaciones asociadas a un dato o a una clase.Una Observación (o Unidad Estadística) es un dato asumido por una variable cuando esta es cualitativa. cada dato u observación se asocia a una y sólo una de las k clases dadas. O sea. Si la variable es cuantitativa. cada observación es un dato y cada categoría asumida por la variable viene siendo una clase. o es una repetición de un dato propio de una población o muestra cuando la variable es cuantitativa. el número N de observaciones de todos los datos es mayor o igual al número n de datos obtenidos (N ≥ n). es decir. La más sencilla es escoger una observación de una serie dada y en una hoja se le colocan al lado tantas rayitas como repeticiones se encuentren en la serie. Este procedimiento se ejecuta para todas las observaciones previa aplicación de algún criterio que permita ordenarlas.3 Distribuciones de Datos y Frecuencias Una Distribución de Datos en un conjunto de datos obtenidos de una serie de observaciones. en la cual se van tachando a medida que se van encontrando. y la frecuencia de una clase es la suma de las frecuencias de los datos que la conforman. cada dato está asociado a una serie de observaciones que lo repiten. cada dato está asociado a una sola observación.

Cuando a estos datos les asociamos sus respectivas frecuencias.2 Frecuencia Absoluta Acumulada (fa o Fa) Es la suma de las frecuencias absolutas comprendidas hasta un determinado dato (fa) o hasta cierta clase (Fa).4 Tipos de Distribuciones de Datos y Frecuencias 2. resumir o hacer más fácilmente manejable la información. estamos ante una Distribución de Frecuencias para Datos Simples o no Agrupados. toda serie de N observaciones se puede representar como una distribución de n datos simples y viceversa. y de uno se construye el otro.4. por lo que uno es equivalente al otro.5. se puede hablar de una Distribución de Frecuencias Relativas. 2. Por otra parte.1 Frecuencia Absoluta (f o F) Es la cantidad f de veces que se repite cada uno de los n datos dentro de una colección de estos.2 Distribución de Datos Agrupados A partir de una Distribución de Datos Simples o no Agrupados previamente elaborada. Cuando a estas clases les asociamos sus respectivas frecuencias. 25 .4. A veces a la Frecuencia Absoluta se le denomina Frecuencia Absoluta Simple. Luego tenemos las correspondientes expresiones que simbolizan lo antes dicho: Datos Simples N = ∑f j j =1 n Datos Agrupados N = ∑F j j =1 k 2.5 Tipos de Frecuencia 2. es decir. condensar. cada uno de los n datos es tomado de manera unitaria y por separado. Por ejemplo. 2.1 Distribución de Datos Simples o no Agrupados Así se le denomina cuando a los datos no se les han aplicado algún tratamiento de agrupación. La suma de n o k frecuencias (para datos simples o agrupados. o el número de observaciones F asociadas a cada una de las k clases. respectivamente) da el número N de todas las observaciones. los datos se agrupan en k clases o grupos con el fin de sintetizar.definirse en la Sección 2. 2. estamos ante una Distribución de Frecuencias para Datos Agrupados.5.5.

Datos Simples faj = f1 + f2+…+fj, j = 1,…, n 2.5.3 Frecuencia Relativa (h o H)

Datos Agrupados Faj = F1 + F2+…+Fj, j = 1,…, k

Se define como el porcentaje que resulta de dividir cada frecuencia absoluta sobre la sumatoria de todas las frecuencias absolutas de n datos o k clases, y luego multiplicar ese cociente por 100%, obteniéndose h o H respectivamente. A veces a la Frecuencia Relativa se le denomina Frecuencia Relativa Simple. Datos Simples
hj = fj N ×100%, j = 1,2,..., n

Datos Agrupados
Hj = Fj N ×100%, j = 1,2,..., k

2.5.4 Frecuencia Relativa Acumulada (ha o Ha) Es la suma de las frecuencias relativas comprendidas hasta un determinado dato (ha) o una cierta clase (Ha). Datos Simples haj = h1 + h2+…+hj, j = 1,…, n Datos Agrupados Haj = H1 + H2+…+Hj, j = 1,…, k

TEMA 2
2.6 Construcción de Distribuciones de Frecuencias para Datos Simples y Agrupados Si la variable X es cualitativa, hallaremos las frecuencias absolutas y relativas de cada una de las k modalidades de la variable. Aquí cada clase se expresa como una modalidad representada de acuerdo a la Escala de Medición Nominal u Ordinal de la variable. Si la escala no es ordinal, no tiene sentido calcular las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas. Modalida d F H Fa Ha de Clase c1 F1 H1 Fa1 Ha1 c2 F2 H2 Fa2 Ha2 c3 F3 H3 Fa3 Ha3 . . . . . . . . . . . . . . . ck Fk Hk = 100% Fak Hak = 100% N N

26

Ejemplo: Un estudio hecho en un conjunto de 25 varones con objeto de determinar su grupo sanguíneo ha conducido a los siguientes resultados: A, B, A, A, A, AB, O, A, A, A, O, B, O, A, B, O, B, O, A, B, B, A, A, O, B La variable que indica el tipo sanguíneo es cualitativa, y no hay jerarquía entre los atributos o modalidades. Luego obtenemos la siguiente Distribución de Frecuencias. Tipo de sangre A B O AB F H

11 44% 7 28% 6 24% 1 4% N = 25 100%

Si la variable X es cuantitativa (discreta o continua), hallaremos las frecuencias de cada uno de los valores o datos de la variable si son pocos, y se hará de manera similar a como se expuso anteriormente. Ejemplo: Observemos la siguiente tabla en la que se expresan las calificaciones obtenidas en un ejercicio evaluado en escala de 1 a 10 puntos. Tenemos una distribución de frecuencias asociadas a una variable cuantitativa. Calificaciones 1 2 3 4 5 6 7 8 9 10 f 1 2 1 2 3 4 3 1 2 1 N = 20 h 5% 10% 5% 10% 15% 20% 15% 5% 10% 5% 100% fa ha 1 5% 3 15% 4 20% 6 30% 9 45% 13 65% 16 80% 17 85% 19 95% 20 100%

2.7) Pasos necesarios en la construcción de una Distribución de Frecuencias para Datos Agrupados En caso de asumir la variable cuantitativa X una cantidad relativamente numerosa de valores, los agrupamos en clases y hallamos sus frecuencias. Aquí la clase se representa por un número, y a esta se halla asociado un intervalo de la recta real llamado Intervalo de Clase, y una Marca de Clase Xm o valor que representa ese intervalo, tal como veremos a continuación.

27

Nº de Clase 1 2 3 . . . k

Intervalo de Clase [Li1, Ls1] [Li2, Ls2] [Li3, Ls3] . . . [Lik, Lsk]

Xm Xm1 Xm2 Xm3 . . . Xmk

F F1 F2 F3 . . . FK N

Fa Fa1 Fa2 Fa3 . . . FaK = N

H H1 H2 H3 . . . HK 100%

Ha Ha1 Ha2 Ha3 . . . HaK = 100%

Ejemplo: Una cooperativa de producción fundada hace algunos años se dedicó a vender productos agrícolas que producía. Como consecuencia del paro petrolero y de escasez de alimentos enlatados en las comunidades a las que servía la cooperativa, se propuso negociar productos enlatados a fin de aumentar la oferta de productos y de esta manera ampliar sus servicios a la comunidad. Dada la gran variedad de productos así como de sus precios, la cooperativa necesita desarrollar una investigación estadística de productos y precios que ofrecían a fin de encontrar las variaciones en los precios y las tendencias de preferencia de la comunidad. A continuación presentamos una serie de datos de los precios de los nuevos productos ofrecidos por la cooperativa. 1.560 1.630 1.220 3.550 1.630 2.735
1)

1.870 3.240 1.630 3.030 3.240 2.330

1.890 2.330 2.010 2.750 1.893 3.240

2.330 2.550 1.150 2.330 2.111 2.567

3.030 2.010 3.020 2.110 1.630 2.789

1.990 3.030 1.893 1.630 2.010 1.234

Definimos la variable X, determinamos el número N de observaciones, y se ordena la serie de datos de menor a mayor (por filas o columnas)

Sea X la variable que indica el precio de cada producto enlatado vendido por la cooperativa. Vemos que X es cuantitativa y discreta. Hay N = 36 observaciones que ordenaremos por columnas en forma creciente. Para hacer esto, de cada una de las m columnas (filas) de la agrupación anterior se selecciona la menor de las observaciones, y de allí se escoge la menor de las m cantidades así obtenidas por columna. Luego, en una nueva columna (fila) a escribirse en otra agrupación posterior, se expresan las repeticiones de ese valor a la vez que se tachan en la agrupación anterior, y en ésta se aplica el procedimiento de nuevo sin tomar en cuenta los valores ya tachados.

28

030 3.234 X4 = 1.893 1..020 3.630 1.150 x2 = 1.030 x31 = 3. en la Distribución de Frecuencias Absolutas para Datos Simples cada uno de estos es tomado aisladamente del resto al representarlo con el símbolo Xj.030 x33 = 3.735 x27 = 2.735 2.567 2. n.111 2..330 2.789 x29 = 3..870 1.240 3. 2.030 3.750 x28 = 2..010 X11 = 2. 2. donde j asumirá el valor de la posición de cada observación.735 X17 = 2.010 2.330 X14 = 2. donde j asumirá el valor de la posición de cada dato y X = Xj (j = 1.890 x12 = 1.240 x36 = 3. j = 1.330 2. No sería posible obtener la tabla que veremos a continuación sin la tabla anterior donde las observaciones están ordenadas en forma creciente.030 X21 = 3.110 x19 = 2.567 X16 = 2..567 x26 = 2. Dada la variable X.330 x23 = 2.550 f 1 3 3 1 Dada la variable X. n).550 Interpretación: Al observar los precios ordenados podemos decir que hay 18 productos con precios por debajo de Bs.111 f 1 2 1 3 1 1 X X13 = 2.630 1..630 1. 29 .560 X5 = 1.630 x10 = 1.330 2.630 x7 = 1.893 x14 = 1. Ambas tablas son equivalentes. 2) Determinamos la cantidad de datos n y la correspondiente Distribución de Frecuencias para Datos Simples.990 x15 = 2. j = 1. X X1 = 1.010 2.789 f 4 1 1 1 1 1 X X19 = 3.893 X9 = 1.110 2. N.111 x20 = 2. donde a cada dato Xj se le asocia su correspondiente frecuencia absoluta fj.150 1. 2.789 3.330 2.990 X10 = 2.010 x17 = 2.240 X22 = 3. La cantidad de observaciones realizadas es de 36 precios correspondientes a 36 productos enlatados diferentes.110 X12 = 2.220 1.550 X15 = 2.330 x22 = 2.893 x13 = 1.150 X2 = 1.560 1.020 X20 = 3.010 x18 = 2. Esa tabla es un ejemplo de una Distribución de Frecuencias Absolutas para Datos Simples.030 x32 = 3.890 1.111 y el resto un precio mayor.550 x25 = 2. pues de una se puede extraer la otra. las observaciones se denotan con el símbolo xi.234 1.220 x3 = 1..234 x4 = 1.220 X3 = 1..550 De aquí obtenemos la siguiente tabla.630 X6 = 1.1.750 2.….893 1.750 X18 = 2.630 x6 = 1.330 x21 = 2.030 3. donde el número de datos es n = 22. 3.870 f 1 1 1 1 5 1 X X7 = 1.990 2.010 x16 = 2.240 3.240 x35 = 3.630 x8 = 1.550 2.890 X8 = 1.630 x9 = 1.330 x24 = 2.010 2.240 x34 = 3.630 1.240 3.020 x30 = 3.560 x5 = 1. x1 = 1.870 x11 = 1.630 1.

Xmás grande = Bs. Xmás pequeño = Bs.350 A = 3. 3. Interpretación: Hay 5 productos enlatados que tienen un precio de Bs. el dato X5 = 1. Un procedimiento útil para este fin es la Regla de 2 a la k. Como en esta distribución los datos están ordenados del menor al mayor valor. tenemos que Xmás grande = Xn y Xmás pequeño = X1.630 está asociado a las observaciones x5. Tomamos el menor valor entero para k de tal manera que 2k sea mayor o igual a N (numero de observaciones consideradas). calculamos 26 = 64. Se recomienda que el número de clases este entre 5 y 25 (5 ≤ k ≤ 25). las cuales asumen cada una el valor 1. 4) Calculo el número k de clases Necesitamos determinar la cantidad de clases o grupos en que debemos separar a los distintos datos de la distribución. x6. Entonces 25 = 32. x8 y x9. 3) Calculamos la Amplitud. La idea es hacer más fácil el manejo de la información vinculada a numerosas observaciones o datos. 1.630. Existen muchas maneras de definir la cantidad de clases a considerar. A = 2. El valor encontrado para k será el número de clases para la agrupación.200 Interpretación: La variación de precios entre el mayor y el menor es de Bs. entonces en este caso se usarán 6 clases. Ahora asumimos el valor de k = 6.350 – 1. Rango o Recorrido de la distribución de datos considerada Para esto primero determinamos el valor mayor Xmás grande y el valor menor Xmás pequeño de la Distribución de Datos Simples. y como 32 es menor que N = 36. Rango o Recorrido mediante la siguiente formula: A = Xmás grande – Xmás pequeño = Xn – X1. Siempre el valor de 2k tiene que ser mayor o igual que N (o sea. y como ahora 64 es mayor que N = 36. Asumimos (por tanteo) un valor de k = 5.En el presente caso.2. Ahora usamos esta regla para hallar el número de clases del ejercicio considerado. 1. x7.150. el valor de k = 5 no es útil.630. 30 . N ≤ 2k). que se repite con una frecuencia f5 = 5.150. Luego calculamos la Amplitud.200.

Tratar esa cantidad de clases es un trabajo más práctico que usar 22 datos o 36 observaciones. este se redondea por exceso y se escoge como el valor buscado para DC. Ls1] y [Li2.Interpretación: Los datos los agruparemos en 6 clases o grupos para poder obtener la mayor información posible de la distribución considerada. Aquí cada intervalo se tomará cerrado en sus extremos. Se selecciona así para garantizar que los intervalos de clase puedan contener a todos los datos. En la presente Guía Didáctica no estudiaremos los procedimientos para obtenerlos. Hay casos en que los intervalos de clase se pueden tomar abiertos o semiabiertos en sus límites. En tal caso no se está representando una resta ni un intervalo que no sea cerrado en sus extremos. k. Para hallar esa distancia podemos utilizar la siguiente formula: Dc = A + 1 ( X másgrande − X máspequeño ) + 1 = k k Si el resultado dado por esta fórmula da un número decimal. DC = Li2 – Li1 = Ls2 – Ls1. Con respecto a la clase j = 1. y estará separado de los intervalos adyacentes a una distancia de una unidad de longitud para cada uno. para las clases 1 y 2 los respectivos intervalos [Li1. Lsj] se representa como Lij – Lsj tal como aparece en algunos libros de Estadística. El tamaño de cada intervalo debe ser el mismo para todas las clases. aunque pueden abarcar una distancia mayor. 31 . 5) Cálculo de la distancia entre los límites consecutivos de los Intervalos de Clase (DC) y su correspondiente longitud (Ic) Un Intervalo de Clase se define como aquel sector de la recta real que contiene una clase o conjunto de datos que se encuentra ubicado entre dos extremos o límites establecidos. pudiéndose consultar en otros textos de Estadística. Ls2] estarán separados de esa manera pues se debe cumplir que Li2 – Ls1 = 1. Por ejemplo. y el valor de esa distancia debe ser un número entero. el intervalo de clase que la contiene posee como extremos un límite inferior Lij y un límite superior Lsj. Sea DC la distancia existen entre los límites inferiores o superiores consecutivos para dos intervalos de clases. Siguiendo el ejemplo dado. Por razones de orden práctico. a veces cada intervalo [Lij. no decimal. La sucesión de estos intervalos deben abarcar por lo menos la distancia desde el menor valor Xmás pequeño hasta el valor mayor Xmás grande.….

Luego. Para calcular el límite inferior Li2 de la clase j = 2. k.517.2) Cálculo de los límites superiores Ls Para calcular el limite superior Ls1 de la clase 1. sumamos al Li1 el valor DC y tendremos Li2 = Li1 + DC = 1. para calcular Ls2 le sumamos DC a Ls1 y tendremos Ls2 = Ls1 + DC = 1. Entonces Li2 = 1. a Li2 le restamos la unidad. 6.350.150 como límite inferior de la clase j = 1. Nº de Intervalo 32 . Es fácil deducir que Ic = Dc – 1.Sea Ic la longitud que tiene cualquier intervalo de clase [Lij.516. por lo cual tenemos que Dc = 367 e Ic = 366.3)Tabulación de los Intervalos de Clase Ahora determinamos los intervalos de clases que usaremos.1) Cálculo de los límites inferiores Li Tomamos Li1 = Xmás pequeño = 1.516 + 367 = 1. j = 1. Recordemos que su tamaño o longitud es Ic = Lsj – Lij = Dc – 1.516. A la clase j le corresponde el intervalo [Lij. Xmás grande = 3. Lsj]. pues todos los intervalos tienen igual tamaño. k. Lsj].….883. j = 1.350. 367. 1. k = 6 Aplicamos la formula: Dc = 2. y así sucesivamente hasta completar los 6 límites inferiores de los correspondientes intervalos de clases.883. Entonces Ls2 = 1. En base a los cálculos anteriores. La diferencia entre los valores extremos consecutivos de cada clase es Bs. y así sucesivamente hasta completar los 6 límites superiores de los correspondientes intervalos de clases.150. y así Ls1 = Li2 – 1 = 1.150 + 367 = 1. 6) Determinamos los Intervalos de Clases 6.517 – 1 = 1. tenemos que Xmás pequeño = 1. 6.83 6 A este resultado lo aproximamos al entero inmediatamente superior.150 y el mayor Bs. Expondremos esta información por medio de una tabla.200.…. A = 2. 3. Ls1 = 1.220 + 1 = 366. por lo que Ic = Lsj – Lij.517. Interpretación: Determinamos que el precio menor de la distribución es Bs. el cual es igual para todos los intervalos de clase.

516.353] Interpretación: La clase o grupo 2 consta de todos los precios registrados de enlatados mayores o iguales a Bs. 1.801 3. 2.883.884.617] [2. Se calcula a partir de la semisuma de sus límites.517. 2. 2. 3. Xm1 = Li1 + Ls1 1.251.985.333. 1.517 y menores o iguales a Bs. 366.516] [1. 1.333 . 1. 2.250] [2.333 2 2 De igual manera determinamos el resto de las marcas de clase. 3.150 + 1.333 1.984] [2.Clase 1 2 3 4 5 6 de Clase [1. Xm1 = 1. 2. Xm j = Li j + Ls j 2 .516] [1.150 y Bs. 1.….617] [2. 1.353] Xm 1. 1.251.618. y el precio promedio de estos valores extremos es de Bs.985. k Calculamos el valor medio Xm1 de la clase j = 1. 1.884. a la tabla anterior le anexamos una columna contentiva de dichas cantidades. 7) Calculamos la Marca de Clase La Marca de Clase es el punto medio del respectivo intervalo de clase al cual pertenece.065 2. Luego. 8) Calculamos la Frecuencia Absoluta de cada clase 33 .150. 1.984] [2.883] [1.883] [1. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.770 2. asociándolas a sus correspondientes clases.150.516 = = 1.618. y la variación entre estos dos límites o extremos es de Bs.250] [2.434 2. j = 1.164 Interpretación: El primer grupo de precios está definido entre Bs. 2.517.

tenemos que Faj es la cantidad de observaciones contenidas entre el correspondiente intervalo de clase más las de los anteriores siguiendo el orden. la frecuencia absoluta Fj de la clase j = 1.517.251.065 2. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.333 1. 2.516] [1.164 F 3 7 9 6 3 8 N = 36 Interpretación: Los precios de 7 productos enlatados son mayores o iguales a Bs.250] [2. 2.770 2.883] [1.434 2. 1.150.517.630 y X6 = 1. 1. 2.De la distribución de frecuencias para datos simples.884.770 2. 2.884. Es decir.618. k. 1.517 y menores o iguales a 1.883]. 1.150.….801 3. Para el caso de la clase j = 2.517. 3.984] [2.985.516] [1. Faj = F1 + F2 +…+ Fj.…. X5 = 1. 2.333 1.434 2.353] Xm 1. el respectivo intervalo de clase es [1.617] [2.065 2. 1. 3.883] hay 7 observaciones.985. es decir. Las frecuencias así obtenidas las anexamos a la tabla en una columna adjunta a la de las marcas de clase.618. Luego tenemos que F2 = f4 + f5 + f6 = 7.250] [2. en el intervalo [1.801 3. k es la suma de las frecuencias de los datos pertenecientes a esa clase. y los datos X4 = 1. Las frecuencias absolutas acumuladas aquí obtenidas se ubican en la tabla anterior por orden de clase en una columna anexa a la de la frecuencia absoluta.870 conforman la clase 2.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 34 .883. 1.984] [2. 1.883] [1. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.251. 2.617] [2.517. 9) Calcularemos la Frecuencia Absoluta Acumulada (Fa) Para la clase j = 1.560.353] Xm 1. Para la clase j = 3 tenemos que Fa3 = F1 + F2 + F3 = 3 + 7 + 9 =19.

2.884.884.517.00% 16. 3.517.985.164 ← ← → F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 → Fa 36 33 26 17 11 8 ← Para la clase j = 3 tenemos que Fa 3 = F3 + F4 + F5 + F6 = 9 + 6 + 3 + 8 = 26.516] [1. 1.250] [2.434 2.333 1. 1.618.353] Xm 1.617] [2. 1.250.770 2.617] [2. En algunos textos la Frecuencia Absoluta Acumulada Faj aquí referida para la clase j viene siendo la Frecuencia Absoluta Acumulada hacia Arriba Fa j .150. 10) Calculamos la Frecuencia Relativa (H) Aplicando la fórmula respectiva para la clase j = 2.22% 99.618. 2. Intervalo de Clase [1.065 2.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 H 8.333 1. mientras que la Frecuencia Absoluta Acumulada hacia Abajo es Fa j = Fj + Fj+1 + …+ Fk-1 + Fk.33% 19.801 3.770 2.251.065 2. 2. tenemos que H2 = F2 × 100% N Nº de Clase 1 2 3 4 5 6 = 7 × 100% 36 = 19. 3.801 3.150. 2. 2.250] [2. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1.985.99% 35 .44% De igual manera se calcula la frecuencia relativa de cada una de las clases restantes. 1.883] [1. 2.984] [2.67% 8.251.434 2.884.353] Xm 1.984] [2.Interpretación: Los precios de 19 productos enlatados son menores o iguales a Bs.516] [1. 1.33% 22.44% 25. Interpretación: Los precios de 26 productos enlatados son mayores o iguales a Bs.883] [1. 2.

1.985. 1.33% + 19. 2. 36 → ← . 11) Calculamos la Frecuencia Relativa Acumulada (Ha) Para la clase j = 1. 2.517. Para la clase j = 3 tenemos que Ha3 = H1 + H2 + H3 = 8.617] [2.250] [2.44% + 25. en forma análoga se puede definir Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ). puede que ese valor de la última clase se ubique en el entorno de 99. De aquí se deduce que necesariamente la frecuencia relativa acumulada de la clase j = k tiene que ser Hak = 100%.770 2. Así como nos hemos referido a la Frecuencia Absoluta Acumulada hacia → ← Arriba ( Fa ) y hacia Abajo ( Fa ).987.Interpretación: El 19.164 F 3 7 9 6 3 8 N = 36 Fa 3 10 19 25 28 36 H 8.78% de los productos tienen precios que oscilan entre Bs.0 % = 52.44% 77.150.884.33% 22.065 2.78% 99.44% de los productos enlatados tienen precios mayores o iguales a Bs.353] Xm 1.333 1. 2. 2.801 3.619. 1.984] [2.99% Ha 8. Nº de Clase 1 2 3 4 5 6 Intervalo de Clase [1. La frecuencia relativa H3 = 25.99 %.251. 1. 1.00% 16. significa que el 25% de los productos referidos tienen precios que oscilan entre Bs. significa que el 77.618.….884 y Bs.78%. 3. La frecuencia acumulada Ha4 = 25 de la cuarta clase.78% de la quinta clase.78% 69.252 y Bs.434 2.883] [1.516] [1.00% de la tercera clase.44% 25. significa que 6 productos enlatados tienen precios que oscilan entre Bs. es decir. 2.99% La última tabla así obtenida es la Distribución de Frecuencias para Datos Agrupados del problema tratado hasta ahora. 2.22% 99. aunque a veces por errores de cálculo a nivel de centésimas. 1.150 y Bs. k.619. Interpretación: La frecuencia absoluta F4 = 6 de la cuarta clase. 2.78% 52. De igual manera calculamos las restantes frecuencias y las anexamos. o incluso de milésimas.33% 19. significa que 25 productos tienen precios que oscilan entre Bs.150 y Bs. tenemos que Haj es el porcentaje de observaciones contenidas en el correspondiente intervalo de clase más los porcentajes de observaciones de las anteriores clases siguiéndolas en orden creciente.251.67% 8. 2. La frecuencia relativa acumulada Ha5 = 77.33% 27.883. Haj = H1 + H2+…+Hj. 1.517 y menores o iguales a Bs.

7 para construir una tabla donde aparezcan ordenados en forma creciente los datos con sus respectivas frecuencias absolutas. Manejarlos de cualquiera de las 37 .1.252 y Bs. para cada uno de estos se calcula la frecuencia absoluta. Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta.150 y Bs. X f 18 2 21 1 23 3 26 4 30 1 34 2 37 6 40 1 Posteriormente. 2. no hay intervalos de clase.Del ejemplo anterior contesten las siguientes preguntas: ¿Cuántos productos enlatados tienen precios entre Bs. Como los datos se toman unitariamente y no agrupados en clases. se ejecutan los pasos 8.251? ¿Cuál es el precio promedio del 25% de los productos enlatados? ¿En qué precios oscilan por lo menos 28 productos enlatados? Nota 1: Al tener una Distribución de Frecuencias para Datos Simples o no Agrupados. 9.986? ¿Cuántos productos enlatados tienen precios entre Bs. acumulada (hacia arriba y hacia abajo). La Distribución de Frecuencias para Datos Agrupados expresa información muy resumida y austera acerca de estos. relativa. 34 23 40 37 30 26 37 23 26 34 18 37 37 21 18 37 26 37 26 23 A esta serie de observaciones se le aplica los pasos 1 y 2 de la Sección 2. por lo que se pierde información y la segunda distribución mencionada es una aproximación de la primera.2. y relativa acumulada (hacia arriba y hacia abajo. 2. X 18 21 23 26 30 34 37 40 f 2 1 3 4 1 2 6 1 N = 20 fa 2 3 6 10 11 13 19 20 → fa 20 18 17 14 10 9 7 1 ← h 10% 5% 15% 20% 5% 10% 30% 5% 100% ha 10% 15% 30% 50% 55% 65% 95% 100% → ha 100% 90% 85% 70% 50% 45% 35% 5% ← Nota 2: La Distribución de Frecuencias para Datos Simples expresa información muy detallada y abundante acerca de los datos. 10 y 11 de la sección antes mencionada.

y se distribuyeron en 6 grupos por edades. 1. 2.7 se han aplicado para una variable cuantitativa.510. Nota 4: Dependiendo de las particularidades del problema a estudiar y de la variable usada para una distribución de frecuencias para datos agrupados.300. Nota 3: Todos los pasos de la Sección 2.930.629. 1.540. 1.8 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en esta unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.dos maneras es más práctico y explícito en su contenido que tenerlos desordenados y dispersos. En este caso hablamos de una Distribución Abierta.890. 1.250.250 y 3. 1.670. En ese caso no se podrían calcular el rango ni nada referido propiamente a intervalos de clase. ¿Cómo se llaman los datos 1. 1.495. pero algunos se pueden usar y adaptar para cualquier variable cualitativa. 1.650. 1. Ejemplo: En una Unidad de Barrio Adentro fueron atendidas 200 personas en un día de consulta.500 en esta serie de datos? 38 .345. 1.510. el primer y el último intervalo) pueden no tener definidos el límite inferior Li1 y el límite superior Lsk. respectivamente.500. y si tal variable hace uso de una Escala de Medición Ordinal tiene sentido determinar las frecuencias absolutas acumuladas y frecuencias relativas acumuladas para cada categoría que asuma la variable en cuestión. 1. los intervalos asociados a las clases j = 1 y j = k (o sea. 1. 3.590. Edades Número de (años) asistentes Menos de 29 16 30-39 25 40-49 51 50-59 80 60-69 20 Más de 70 8 2. 2.475. Grupal Cooperativo  Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió de la siguiente forma: 1. 1.

5. 2. Calcule los elementos de los datos agrupados. Fa. Fa. H y Ha. Intervalo de Clase. 3. 5 3 1 5 7 8 11 12 4 2 14 12 13 9 6 5 15 5 3 4 6 8 9 1 8 9 5 8 9 2 3 3 3 1 10 1 2 1 11 7 4 2 12 10 9 1 14 8 2 10 6 Organice y agrupe los datos en clases. F. calcule el valor medio de la clase. F. resuelve y agrégalos a tu portafolio. resuelve y agrégalos a tu portafolio de aprendizaje. Agrúpelos ordenados de mayor a menor. Resuelve y agrégalos a tu portafolio.  Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida. Agrupe la serie de datos en clases. número de k clases.2. Número de N observaciones. H y Ha. Fa. Interprete los resultados. calcule el valor medio de cada clase. Punto Medio de cada clase. 39 . ellos se reúnen una vez a la semana para realizar el seguimiento de los principales problemas de la comunidad y adelantar acciones a favor de su resolución. F. 4. numero de n datos. Determine si son datos discretos o continuos. H y Ha. H y Ha. F. Interprete los resultados. Revíselos. Comunitario  Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II) siga el siguiente tratamiento: 1. y calcule el valor medio de cada clase. De análisis de las 51 reuniones convocadas el año pasado se encontraron los siguientes datos.  La Junta Comunal de una comunidad de los Valles del Tuy esta compuesta por quince miembros o representantes. se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos: 77 26 62 58 18 50 62 51 63 34 65 71 84 44 61 38 41 60 54 58 60 52 58 45 59 53 66 54 51 83 56 62 71 36 63 63 Agrupe la serie de datos en clases. Fa. Interprete los resultados. En cada reunión se levanta un acta donde se deja constancia de la asistencia.

1. y solo debe utilizarse en los casos en que se requiera exponer resultados brevemente. luego de haberse agrupado y calculado los valores de frecuencia requerida. entendiéndoseles como una ordenación de datos numéricos en filas y columnas 40 . 3. el 25% de los productos enlatados. COMPETENCIAS A LOGRAR: 1) Comprende la función de las tablas. podrá presentar los datos usando técnicas de tabulación y graficación para extraer conclusiones descriptivas. las formas de presentación de los datos son la textual. TEMA 1 3. 5) Uso de herramientas computacionales (Excel. de los cuales Bs. o sea. 4) Interpreta las representaciones gráficas.253 presentan una frecuencia de 9.1 Forma Textual Es la que se realiza a través de palabras ó símbolos algebraicos. 2. CONTENIDO: En la práctica se realiza la representación de los datos. cuadros y gráficos para presentar los datos procesados. con el propósito de representarlos.2 Forma Tabular Es aquella que se realiza a través de las tablas o cuadros estadísticos.UNIDAD III: REPRESENTACIÓN DE LOS DATOS OBJETIVO: Cuando el estudiante culmine este Unidad. Ejemplo: Los enlatados que vende una cooperativa de producción presentan precios que están agrupados en varias clases. entre otras). Esta forma es quizás la menos aconsejable. En cualquier caso.253 representa el precio más alto del 69. SPSS. 3) Grafica los datos.45% de los productos enlatados que vende la cooperativa. pues en el caso de que el texto sea muy largo cansaría al lector y no le permitiría comprender totalmente lo expuesto.558 y Bs. 2. los precios que están en el intervalo entre Bs. En la práctica se utiliza como un complemento de la forma tabular o de la forma grafica. En gran parte el carácter de este proceso es publicitario por la forma de informar al interesado los resultados y datos obtenidos en una investigación. la tabular y la gráfica. 2) Representa e interpreta datos en tablas. dentro de la investigación estadística.

Ejemplo: Consideremos el ejemplo estudiado en la Sección 2. cuando las notas se encuentra al final del cuadro se denominan notas al pie. ¿Cuándo? (referencia cronológica). y así poder apreciar de la mejor forma las características y la cuantía del fenómeno estudiado y establecer comparaciones entre dichos datos. 3. ¿Dónde? (referencia geográfica). 2) 3) Encabezamiento: Comprende los títulos de cada columna de datos.1 Componentes del Cuadro Estadístico Las partes que componen un Cuadro Estadístico son: 1) Título: Comprende el número del cuadro (cuando el mismo forma parte de un grupo). Notas: Aparecen en cual parte del cuadro. Cuerpo: Consiste en las cifras o símbolos que se encuentran colocados en las filas y columnas del cuadro debajo del encabezamiento y a la derecha de la columna matriz. contesta el titulo las preguntas: ¿Qué? (tema de los datos). y explican algunas aclaratorias sobre los datos y casi siembre la fuente de los datos. 4) 5) 41 . Al respecto. Columna Matriz: Abarca las designaciones de cada fila de datos y se encuentra en la parte izquierda del cuadro. la forma tabular contiene en sí misma todas las cantidades que conforman una Distribución de Frecuencias para Datos Simples o Agrupados.2.con las especificaciones correspondientes acerca de la naturaleza de los datos (simples o agrupados). el tema del cuadro y a veces una nota complementaria.7 del Unidad II.

…. el orden del enunciado será el siguiente: 2)  Referencia Geográfica.150 – 1..434 2.884 – 2.617] [2.22 % Ha (%) 8.618 – 2.770 2.78 69. Fuente: Gerencia de Ventas de la Cooperativa de Producción de Río Caribe.517 – 1. Foto 2.984] [2.516] [1.Cuadro 3 Título ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RÍO CARIBE 2. 3. gráficos. Foto 1.  Naturaleza de los datos.99 Nota: Representan los productos enlatados ofrecidos por la Cooperativa en Marzo de 2.67 % 8. Cuadro 2..333 1.2 Pasos recomendados para elaborar un Cuadro Estadístico 1) Numeración del Cuadro. fotos y figuras de un informe deben esta numerados según su tipo de presentación y en orden correlativo.251 – 2.33 Cuerpo 1 2 3 4 5 6 27.801 3.065 2. .003..353] Xm 1.2. Título propiamente dicho.985 – 3. Grafico 2. Es preciso redactar con claridad y expresar concisamente los datos que se presentan en el cuadro...33 19. Figura 1.883] [1....33% 22. centrado en la parte superior del cuadro.44 77. Figura 2.44 % 25.. Los cuadros. Por ejemplo: Cuadro 1.250] [2. Deberá colocarse sin subrayar. En general.003 Encabezamiento 42 (Bolívares) Nº de Clase Columna Matriz Intervalo de Clase [1. Grafico 1..78 52..00 % 16. y usando letras mayúsculas para todo el enunciado.164 F 3 7 9 6 3 8 Fa 3 10 19 25 28 36 H (%) 8. Foto 3.  Referencia Cronológica.78 99.

6) 3. y las designaciones que comprenden deberán escribirse en lo posible horizontalmente.954. 1. Presentación de notas y fuentes.  En lo que refiere a meses del año o los días de semana se comenzarán con enero y lunes respectivamente. 5) Tamaño del cuadro. Así mismo se dispondrán en un orden lógico de izquierda a derecha.3 Ventajas de la presentación tabular 1) Se sigue un orden o plan de acuerdo a la finalidad de la investigación. Las notas preferiblemente se colocarán al pie del cuadro.003 (Bolívares) 3) Encabezamiento. pero si se trata de la importancia de los últimos años se ordenarán los años de manera descendente ejemplo: 1. 1. Detalles de clasificación o unidades.  Cuando su función sea analizar una tendencia de un fenómeno se ordenarán en forma ascendente ejemplo: 1. Todo cuadro deberá en lo posible hacerse en tamaño carta.2. 43 .959.956. Cuando se trate de la fuente de los datos.957. El arreglo puede hacerse de la siguiente manera: 4)  Cuando se trate de datos cualitativos. esta deberá presentarse citando al autor y el año de la publicación. 2) Facilita la observación de la relación existente entre los diversos datos presentados en un mismo cuadro o entre cuadros diferentes. Estas deberán colocarse entre paréntesis y utilizando mayúsculas únicamente al iniciar la palabra. Columna matriz o principal.955. 1. éstos deberán ordenarse alfabéticamente. debiendo ser claras y concisas. Ejemplo: Cuadro 3 ESTADO SUCRE: PRECIOS DE LOS PRODUCTOS ENLATADOS COOPERATIVA DE PRODUCCION DE RIO CARIBE 2. Debe disponerse en la parte superior del cuadro.958. y debe planearse de tal manera que no sea ni muy largo y angosto. 1. 1.956. ni muy ancho ni corto.

Suministrar información de manera gráfica es un verdadero arte funcional que no sólo sirve para presentar los datos sino también para expresar ideas que se desean destacar. 4) Facilita el resumen de los principales resultados obtenidos. La utilidad de los gráficos estriba en la ideal global que dan sobre la situación investigada. presentándolos en un espacio más reducido y revelando diversos detalles comparables de los mismos a nivel general y específico. edad y genero de los habitantes de una comunidad. El volumen de información que aportan no es tan extenso como la que se entrega en una tabla de varias columnas a leerse por separado. eficiencia y precisión. altura de los brotes. quien presente un gráfico aporta su imaginación y temperamento para comunicar un mensaje a ser asimilado para quien vaya destinado. Por tanto. Los gráficos se clasifican en dos grupos. pero los gráficos también le dan coherencia a grandes conjuntos de datos. Por esta razón. TEMA 2 3. La forma de presentar cualquier idea a través de gráficos dependerá del nivel del destinatario. notas finales de los alumnos del primer año. es preciso presentar dicha información mediante algún tipo de gráfico estadístico que facilita la visualización y descripción del comportamiento de las variables y sus particularidades más notables. En base a los planteamientos anteriores. La excelencia del gráfico consiste en la comunicación de ideas complejas con claridad. etc.3) Favorece el descubrimiento de irregularidades en los datos por omisiones o errores de indagación o clasificación. enfermedades. evitando la distorsión en el mensaje de los datos.3 Forma Gráfica Una vez que la información estadística está expuesta en forma tabular.  Gráficos Cartesianos: Son los que se basan en un sistema de coordenada cartesianas conformados por el Eje X (horizontal) y el Eje Y (vertical). Tenemos los Histogramas (de Frecuencia y de Frecuencia relativa). del lugar de exposición y de otros factores a analizar para escoger el diseño que facilite la mejor y más adecuada comunicación posible.). se definen los gráficos como representaciones visuales de la información procesada estadísticamente y que permiten generar apreciaciones que también son visuales y estadísticas. quien haga uso de esta necesita a menudo una visión rápida del comportamiento de las variables (ventas. los 44 . tipología de las viviendas.

Para ambos tipos de gráficos antes definidos son válidos los siguientes principios generales:  Los gráficos se han de explicar enteramente por sí mismos. es preciso aplicar las siguientes reglas:  En el eje donde se ubiquen las frecuencias. el cero siempre debe colocarse explícitamente. de Frecuencia Relativa. Los elementos componentes de todo gráfico son: 1) 2) 3) 4) 5) 6) 7) Título Principal. Acumulativos u Ojivas. los Diagramas de Barra y los Diagramas a Doble Columna. Deben evitarse elementos superfluos que lo recarguen exageradamente. Región de datos y símbolos. El contenido de un gráfico deberá ser tan completo como sea posible.  No se debe tratar de abarcar demasiada información en un solo gráfico. los Pictogramas. Descriptores o indicadores de señales y marcas. 3. Los elementos de estos gráficos deben ser consistentes con los de otros gráficos anteriormente usados. estas deben estar fuera del área del gráfico. Cuando las variables se inician con valores muy altos. Región a ser ocupada por el gráfico. además de representar eficientemente las distribuciones de datos y de frecuencias. los Polígonos (de Frecuencia.  En caso de agregarse notas.Gráficos de Línea o Diagramas Lineales.1 Gráficos Cartesianos Para cada uno de los gráficos que describiremos a continuación. Notas. Los más usados vienen siendo los Cartogramas.3. Pictógrafos o Diagramas Pictóricos. y de Frecuencia Relativa Acumulada u Ojivas Porcentuales).  Gráficos Simbólicos: Son los que hacen uso de mapas geográficos. Descripción del gráfico.  Los elementos del gráfico deben ser claramente distinguibles y visualmente prominentes. Es mejor hacer varios gráficos en distintos espacios que comprimir toda la información en uno solo.  Los gráficos tienen que dar una visión general y no una imagen detallada de un conjunto de datos. dibujos y figuras geométricas. Título Secundario o Subtítulo. el 45 . Las presentaciones detalladas se deben reservar para las tablas. y los Diagramas o Gráficos Circulares (o Sectoriales o de Pastel). Una regla práctica segura es evitar más de 3 gráficos en un mismo espacio. y en ese caso deben ser visualmente discernibles.

Una de las maneras más fáciles de engañar al lector es hacer. y en general debe evitarse el recargamiento del gráfico. Los ejes. Si es necesario mencionar puntos particulares de la curva. El Histograma proporciona una presentación visual fácil de interpretar de la Distribución de Frecuencias ya mencionada. La longitud de los ejes y la equivalencia entre las unidades de medición deben seleccionarse de modo que la gráfica resulte balanceada a lo largo y ancho. el rango muy pequeño en términos de las proporciones de las unidades de medición que se usan para estos ejes coordenados. Las unidades de medición de las variables deben destacarse claramente. esto debe hacerse en forma clara con una línea en zigzag. se incurre en un mal uso de los gráficos. 1) Histograma: Es la reproducción gráfica de una Distribución de Frecuencias para Datos Agrupados en un sistema de coordenadas cartesianas. teniendo cada uno en el Eje X como base un intervalo de clase y en el Eje Y como altura la respectiva Frecuencia Absoluta (Histograma de Frecuencia o Histograma propiamente dicho) o la Frecuencia Relativa (Histograma de Frecuencia Relativa). Todos los puntos de un intervalo de clase tienen una misma altura dada por la respectiva frecuencia en el Eje Y. Los intervalos de clase se dibujan consecutivamente de igual tamaño y sin separación (juntos).      eje donde se coloquen estos se puede comenzar el mismo valor por donde inicia la variable o por un valor cercano. por lo que los rectángulos son adyacentes. y de ser necesario se dibujan líneas de fondo para facilitar la lectura de los valores. 46 . letreros y notas deben ser claros. y colocarse horizontal o verticalmente de acuerdo al eje. componiéndose aquel gráfico por una sucesión de rectángulos o barras. y el área de cada uno es proporcional a la frecuencia a la cual está asociada. títulos. Si en cualquiera de los ejes se hace necesario interrumpir la escala de los números. Otra manera de crear percepciones gráficas equivocadas es empezar sin indicación previa y explícita en cualquier otro valor distinto de cero en el eje donde aparezcan las frecuencias. estos deben indicarse con notas al pie. y los números que indican valores de la misma característica se han de dar con el mismo número de decimales. en el eje donde se ubiquen las frecuencias. La curva debe trazarse más gruesa que las coordenadas para que resalte. Debe mencionarse la fuente de información. Si estas reglas no se aplican adecuadamente.

885 y Bs. 3. 2.353 PRECIO S Interpretación: Entre Bs.621 – 2. siendo Bs. Además.253 – 2.987 2. en un sistema de coordenadas cartesianas se ubican los datos en el Eje X y se colocan las Frecuencias Absolutas en el Eje Y. 47 . 2) Gráfico de Línea o Diagrama Lineal: Partiendo de una Distribución de Frecuencias para Datos Agrupados de una variable cuantitativa discreta. Después de dibujarse los pares ordenados. 2.988 – 3.518 – 1. existe otro grupo importante de productos cuyos precios están ubicados entre Bs.988 y Bs.517 1. CANTIDAD DE ENLATADOS POR VARIACIÓN DE PRECIOS 9 8 7 6 5 4 3 2 1 0 CANTIDAD DE ENLATADO S 1.620 2.7 del Unidad II.252 están localizados los precios del grupo más numeroso de enlatados. con segmentos de línea recta estos se unen en forma consecutiva siguiendo las abscisas en orden creciente.252 2. 1.353.150 – 1.068 el precio promedio de los límites de precios de ese grupo. 2. Ejemplo: Veamos este gráfico sobre la vacunación de niños.885 – 2.884 1. Luego se definen pares ordenados donde la abscisa (componente horizontal) es un dato y la ordenada (componente vertical) del par en cuestión es la respectiva frecuencia absoluta de ese dato discreto.Ejemplo: El siguiente Histograma de Frecuencia proviene de la Distribución de Datos Agrupados del problema tratado en el problema de la Sección 2.

pues cada par ordenado que conecta a dos segmentos lineales tiene como abscisa a una marca de clase de un intervalo de clase sobre el cual están los segmentos referidos. 3. teniéndose dos gráficos a la vez. pero en el Eje Y usaremos los valores de la Frecuencia Absoluta Acumulada.7. el par ubicado sobre el primer intervalo de clase se une con un segmento al límite inferior Li1 en el Eje X. Ejemplo: Consideremos el problema de la Sección 2.3) 48 .2) 3. y lo mismo se hace entre el par que se encuentra sobre el último intervalo de clase y su límite superior Lik en dicho eje. Por otra parte. Polígono de Frecuencia: Es semejante a un histograma y a un gráfico de líneas. el Polígono de Frecuencia se puede dibujar en el mismo sistema de coordenadas donde aparece el correspondiente Histograma de Frecuencia. aquellos en los que la secuencia de sus segmentos no encierra área alguna por sí misma a menos que la pueda encerrar con el Eje X. En un sistema de coordenadas cartesianas. pero en el Eje Y usaremos los valores de la Frecuencia Relativa. La curva obtenida se denomina Ojiva. Generalmente. y ambas se pueden dibujar simultáneamente. La escala en el Eje X corresponde a las marcas de clase y la escala en el Eje Y corresponde a la Frecuencia Absoluta. Es pertinente referirnos a la Ojiva hacia Arriba (u ojiva propiamente dicha) y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la Frecuencia Absoluta Acumulada hacia → ← Arriba ( Fa ) y hacia Abajo ( Fa ).3) Polígono: Es una sucesión de diferentes segmentos consecutivos que comparten de a dos un mismo extremo común. Así obtenemos un área cerrada por el polígono y el eje nombrado. es decir. nos interesan los polígonos abiertos.1) 3. La primera ojiva es creciente y la otra es decreciente. Polígono de Frecuencia Absoluta Acumulada o Polígono Acumulativo: Es semejante a los anteriores. Polígono de Frecuencia Relativa: Es semejante a los polígonos anteriores.

33 8. Este gráfico también es conocido como Ojiva Porcentual.78 100 1150 – 1516 1517 – 1883 1884 – 2251 2252 – 2619 2620 – 2986 2987 – 3353 PREC IOS PR OM EDIOS Gráfico de Barra: En uno de los ejes de un sistema de coordenadas cartesianas cada intervalo representa una categoría asumida por una variable cualitativa.4) Polígono de Frecuencia Relativa Acumulada: Es semejante a los polígonos anteriores. estas se interceptan en un par ordenado tal que su abscisa se denomina Mediana. concepto que estudiaremos en el siguiente Unidad.67 25 22. un valor numérico de una variable discreta.45 52. Ejemplo: De nuevo consideremos el problema de la Sección 2.33 PRECIOS PROMEDIOS 3.78 69. La primera ojiva es creciente y la otra es decreciente. pero en el Eje Y usaremos los valores de la Frecuencia Relativa Acumulada.33 27. o un 4) 49 .7.22 8. y ambas se pueden dibujar en un mismo sistema de coordenadas cartesianas.45 16.78 77. Aquí es válido referirnos a la Ojiva Porcentual hacia Arriba y hacia Abajo cuando en el Eje Y se expresan respectivamente los valores de la → ← Frecuencia Relativa Acumulada hacia Arriba ( Ha ) y hacia Abajo ( Ha ).PORCENTAJE DE ENLATADOS POR PRECIOS PROMEDIOS PORCENTAJE DE ENLATODS 30 25 20 15 10 5 0 1150 – 1516 1517 – 1883 1884 – 2251 2252 – 2619 2620 – 2986 2987 – 3353 19. PO RC ENTAJE DE C REC IMIENTO DE LO S ENLATADO S PO R PREC IO S PRO MEDIO 120 100 80 60 40 20 0 8. Si ambas ojivas se grafican a la vez en un mismo sistema de coordenadas.

Los intervalos deben ser de igual tamaño. Ejemplo: Tomemos el diagrama de barras del problema de la Sección 2. Ejemplo: La siguiente gráfica es tomada de un estudio hecho a un grupo de 25 varones para determinar su grupo sanguíneo 50 . teniendo cada una a un intervalo como uno de sus lados y a la frecuencia como la longitud del otro lado. siendo el Histograma de Frecuencia un caso particular al respecto.252. Las barras pueden ser simples cuando representan una sola variable. además que entre Bs. los valores o los intervalos de clase. Tal como dijimos anteriormente. 3. podemos representar una distribución de frecuencias asociada a una variable cualitativa dibujando cada cualidad como un intervalo. y verticales si están en el Eje X.988 y Bs.intervalo de clase de una Distribución de Frecuencias para Datos Agrupados de cualquier variable cuantitativa. y compuestas cuando en cada intervalo hay tantas columnas como variables a considerar.355 se concentran un segundo grupo de precios de enlatados. Luego se dibuja una serie de rectángulos o barras. 1. En el otro eje se ubican las respectivas frecuencias asociadas a las categorías.7. 2.885 y Bs. Las barras son horizontales si los intervalos están en el Eje Y. 2. PRECIOS PROMEDIO DE LOS ENLATADOS POR TIPO PRECIOS 2620 – 2986 1884 – 2251 1150 – 1516 0 1 2 3 4 5 6 7 8 9 CANTIDAD DE ENLATADOS Interpretación: Se puede observar que la mayor concentración de precios de enlatados se encuentra entre Bs. Muchas veces estos se ubican separados a igual distancia para mejor efecto visual en caso de tenerse numerosas barras.

A cada intervalo parten dos barras en sentido contrario. 4) Gráfico a Doble Columna: Lo tenemos cuando a ambos lados de uno de los ejes se ubican columnas que parten de intervalos definidos en ese eje. 51 . dirigidas cada una en sentido inverso o contrario con respecto a la otra con la que comparte el mismo intervalo (arriba y abajo en dirección vertical. siguiéndose las mismas indicaciones dadas para los Diagramas de Barras. Ejemplo: Tomamos una Pirámide Poblacional por años y sexo de una determinada región geográfica. un Diagrama a Doble Columna está formado por dos diagramas de barras que están asociados a un mismo eje. cada intervalo del Gráfico de Barras puede representar cada uno de los valores asumidos por una variable discreta. o izquierda y derecha en dirección horizontal). compartiendo el mismo intervalo aunque ambas barras aparezcan dibujadas en forma separada. Ejemplo: Tomemos el siguiente gráfico de barras donde se expresan las calificaciones de un ejercicio evaluado en la escala de 1 a 10 puntos. En pocas palabras.Igualmente.

Del Gráfico a Doble Columna se puede hacer un Diagrama de Barras Compuestas para dos variables. 52 .

y cada sector se identifica a través de un color o sombreado.2 Diagramas Simbólicos Tal como se puede deducir sobre los diagramas que veremos a continuación. Tiene la ventaja de exponer ciertos aspectos geográficos y relaciones espaciales que no se pueden revelar por cualquier otra forma de presentación. 1) Cartograma: Es un mapa de una región geográfica a ser usado para presentar información estadística sobre características consideradas acerca de dicha región. Ejemplo: En el siguiente cartograma observamos la urbanización en el mundo atendiendo a la industrialización. el uso de Diagramas Simbólicos una manera fácil de transmitir una visión general de la información para el entendimiento del público cualquiera sea su nivel. Este tipo de gráfico es propio de la ciencia de la Cartografía. Sin embargo. estos últimos proporcionan más información y permiten una apreciación estadística más rigurosa. la información numérica debe aparecer en el gráfico y guardar la correspondiente proporción con el dato numérico. Las diferentes maneras de presentar un cartograma son las siguientes:  Cada punto o mancha colocada sobre el mapa representa un valor. Al respecto.3. 53 .  El mapa se divide por sectores. y comparándolos con los anteriormente expuestos.  Sobre el mapa se superpone determinada figura que representa los valores relacionados con el fenómeno a presentar.TEMA 3 3.

siendo este equivalente a una determinada cantidad de observaciones que se debe indicar con claridad en su encabezamiento. La frecuencia absoluta de cada modalidad se representa por unidades y/o fracciones de un mismo pictograma. Pictógrafo o Diagrama Pictórico: Es un gráfico consistente en un dibujo o símbolo que por su forma es alegórico. Ejemplo: Consideremos las exportaciones de frutas que ha efectuado El Salvador desde 1. puesto que un observador siempre muestra indecisión en la comparación de alturas.985 hasta 1. La repetición de un mismo pictograma debe hacerse de igual forma y proporción.988. El inconveniente que se puede dar es cuando se busca de dibujar una fracción del pictograma. Ejemplo: Representamos el número de partidos ganados. sugerente o representativo de la naturaleza del dato del fenómeno que se quiere representar. por lo que se requiere asociar la frecuencia a reflejar con las medidas de la figura. perdidos o empatados de un equipo. sino otra distinta: el tamaño del pictograma suele ser proporcional a la frecuencia que representa.2) Pictograma. 3) Diagrama o Gráfico Circular (o Diagrama Sectorial o de Pastel): Consiste en considerar el área completa del círculo como equivalente al 54 . siendo medidas en colones (¢). lo que requiere cierto cuidado. A veces no se usa la regla anterior. áreas y volúmenes si el pictograma se presenta de dos o más maneras diferentes.

67% 8.884 .2.1.33% 22. Por tanto. partiendo de la siguiente interpolación proporcional o regla de tres: 100 % H 360 º g 360º ×H 100% g= Aplicamos este procedimiento tantas veces como cantidades de frecuencias relativas existan en una Distribución de Frecuencias consideradas para una variable cualitativa o para Datos Agrupados de una variable cuantitativa. siendo que la proporción entre 100% y H es igual a la existente entre los 360º del círculo y el ángulo g limitado por los radios del sector circular mencionado.7.1.33% 19. Resuelve e interprete. y mediante el uso de un transportador. a g lo podemos hallar. 35. determinado luego el área cubierta por el sector circular correspondiente a cada frecuencia relativa parcial H de esa misma población o muestra. y después dibujar en el círculo.986 2. 55 . Ejemplo: Usando las frecuencias relativas calculadas para el problema de la Sección 2.987 .251 2. obtenemos el siguiente diagrama circular. 20.516 1.883 1. y construye una distribución de frecuencia relativa con los siguientes datos: 15. 10. 3.620 .22% 22% 8% 17% 8% 19% 26% Trace una circunferencia.252 .619 2. PORCENTAJE DE ENLATADOS POR NIVELES PRECIOS INTERVA LOS DE PRECIOS 1.2.2.3.517 . 8. 12.4 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en este Unidad y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.150 .00% 16.44% 25.354 Nº DE ENLATA DO S 3 7 9 6 3 8 % 8.100% o frecuencia relativa total de la población o muestra a representar.

 Usa los gráficos de torta para presentar la distribución de frecuencia relativa de los ejercicios anteriores.  Comunitaria  Con los datos recolectados en campo (durante las actividades de Proyecto I o II) y ya ordenados. represéntelos utilizando tantos cuadros como los respectivos gráficos.Grupal Cooperativa A los problemas resueltos propuestos en el unidad anterior así como a los datos tomados en campo. constrúyale los histogramas de frecuencia y los polígonos aquí estudiados. 56 .

concentración y variabilidad. harán falta otras técnicas descriptivas para transmitir una idea de la información contenida en aquellos. 7. COMPETENCIAS A LOGRAR: 1. y por otro lado es difícil usarlos para hacer inferencia estadística pues en particular el histograma de una muestra no necesariamente va a ser idéntico al de la población. Usar paquetes computacionales (Excel. y si lo fuesen sería necesario medir el grado de similitud o diferencia entre ambos histogramas. SPSS.1 Necesidad del uso de medidas numéricas descriptivas Los métodos gráficos son útiles para obtener una descripción general rápida de las observaciones y datos recolectados para su presentación. 3. Interpretar las diferencias entre las diversas Medidas de Dispersión para un conjunto de datos agrupados o no agrupados. Entender la importancia de analizar la dispersión de un grupo de datos. tendencia central y variación) y sus mediciones descriptivas de resumen. de Tendencia Central y de Dispersión. Calcular diversas Medidas de Posición y de Tendencia Central para un conjunto de datos simples o agrupados. Comprender las propiedades de la posición y la tendencia central. CONTENIDO: TEMA 1 4. Por eso se desea usar los datos de una muestra para calcular un grupo de esas medidas (estadísticos) con el fin de transmitir una adecuada imagen mental de la distribución de frecuencias en cuanto a su ubicación. Los respectivos estadísticos a estudiarse aquí son las Medidas de Posición. 57 . 5. Estas dificultades descriptivas de los métodos gráficos pueden superarse mediante medidas descriptivas numéricas. 4. 6.UNIDAD IV: MEDIDAS DE POSICIÓN. 2. entre otros) para calcular las medidas de tendencia central y de dispersión. Interpretar las diferencias entre las diversas Medidas de Tendencia Central para un conjunto de datos simples o agrupados. Hay limitaciones en el uso de esos métodos pues en caso de no poderse presentar los gráficos. y que sean útiles para hacer inferencia estadística respecto a la población. DE TENDENCIA CENTRAL Y DE DISPERSIÓN OBJETIVO: Analizar e interpretar las características o propiedades de los datos numéricos (posición. Calcular diversas Medidas de Dispersión para un conjunto de datos simples o agrupados.

Por debajo de un valor Pi se encuentra el i % de las observaciones. El Segundo Cuartil Q2 o Cuartil Medio es un valor tal que el 50% o las dos cuartas partes) de las observaciones son menores que ese valor. 9. y se denotan en forma respectiva como P1. o lo que es lo mismo. el 50% o las dos cuartas partes de las observaciones son mayores que ese valor.…. P99. aquí los estadísticos están solamente referidos para cualquier variable cuantitativa X. Los Deciles son 9 valores que dividen al conjunto de datos en 10 partes cada una con igual cantidad de observaciones ordenadas ascendentemente.Obviamente. i = 1. Por debajo de Qi se encuentra el (i × 25) % de las observaciones. para una distribución de datos simples los procedimientos para el cálculo de estas medidas no son los mismos a emplearse en el caso de una distribución de datos agrupados. 2 . Q2 y Q3. 4. 58 . i = 1. Por ejemplo. i = 1. y el (100 – i × 25) % de estas son mayores que Qi.….…. Se denominan Cuantiles o Fractiles. D9. en base a los planteamientos expuestos al comienzo.2 Medidas de Posición Consideraremos un tipo especial de medida que determina cualquier posición intermedia o lejana dentro de una distribución de datos. El Primer Cuartil Q1 o Cuartil Inferior es un valor tal que el 25% o la cuarta parte de las observaciones son menores que ese valor. y se utilizan sobre todo para resumir o describir las propiedades de conjuntos grandes de observaciones ordenadas de menor a mayor. y el (100 – i × 10) % son mayores que Di. o lo que es lo mismo. Tenemos los Centiles o Percentiles.3. Todas las medidas a estudiarse estarán referidas al estudio de muestras. Los Cuartiles son 3 valores que dividen al conjunto de datos en 4 partes cada una con igual cantidad de observaciones ordenadas ascendentemente. P2. y se denotan en forma respectiva como Q1. 99. pero se pueden generalizar para poblaciones. el 75% o las tres cuartas partes de las observaciones son mayores que ese valor.…. Por debajo de Di se encuentra el (i × 10) % de las observaciones. y el (100 – i) % son mayores que Pi. Los Centiles o Percentiles son 99 valores que dividen al conjunto de datos en 100 partes cada una con igual cantidad de observaciones ordenadas ascendentemente. Deciles y Cuartiles. D2. Además. y se denotan en forma respectiva como D1. el 30% de las observaciones son menores que D3 y el 70% de estos son mayores que D30.

i = 1. 2.El Tercer Cuartil Q3 o Cuartil Superior es un valor tal que el 75% o las tres cuartas partes de las observaciones son menores que ese valor. se elige como cuartil al valor de la observación específica en esa posición. para el rendimiento que reciben los trabajadores por el fideicomiso de sus prestaciones sociales. y el cuartel asume el valor numérico de la observación que ocupa esa posición. obtenemos una serie de N observaciones ordenadas de menos a mayor. La posición j de esa observación varía de acuerdo al tipo de cuartil. Vemos que el valor de un cuartil no necesariamente va a coincidir con el de alguna observación. 3. Entonces Qi = xj. Regla 1: Si el valor obtenido para j es un número entero. el 25% o la cuarta parte de las observaciones son mayores que ese valor. i = 1. establecidas por el BCV. se redondea a j por defecto o exceso al número entero más cercano. por lo que se hace necesario el uso de ciertas reglas al respecto. Regla 2: Si el valor obtenido para j se encuentra en el justo medio de dos números enteros (es decir. o lo que es lo mismo. si ese valor es un número fraccionario cuya parte decimal no consta solamente con el dígito 5). se redondea a j por defecto y el cuartil es el promedio de los valores correspondientes a las observaciones xj y xj+1. habiendo aproximadamente j observaciones con valores menores a Qi de acuerdo a esta expresión: i-ésimo Cuartil Qi: j= i × ( N + 1) . Regla 3: Si el valor obtenido para j no es un número entero o el valor medio entre dos números enteros (es decir. si ese valor es un número fraccionario cuya parte decimal sólo consta del dígito 5). 3 4 El valor resultante de esa formulación para j no necesariamente va a dar un valor entero. Entonces Q i = x j + x j +1 2 . 1) Cuartiles para una Distribución de Datos Simples De una distribución de n datos simples. Ejemplo: Suponga un conjunto de observaciones que corresponden a las tasas anuales de interés. 59 . Entonces Qi = xj. sea xj la observación que le es más cercana de entre las que son menores a Qi. 2. lo cual depende de la cantidad N de observaciones ordenadas. Para esta serie y un cuartil Qi dado.

4 = = = 32.6 28.1 32.4 29.9 30.7%.4 + 33 65.2 32.6 29. y en consecuencia: Q3 = x 13 + x 14 32. c) Se establece el valor de la posición j que está asociada al Tercer Cuartil Q3 (i = 3). o el 75% de las personas reciben una tasa de interés mayor a 29%. definiendo la cantidad de estas.4 29.6 28.Orden Tasa de Interés (%) 1 10 2 3 4 5 6 7 8 30 9 10 11 12 13 14 33 15 16 17 38 20.5 32.4 35. 60 .7 2 2 2 Interpretación: El 75% de las personas reciben una tasa de interés menor de 32.5 4 4 4 Por la Regla 2 tenemos j = 13. j= i × ( N + 1) 3 × (17 + 1) 54 = = = 13.9 b) 30.1 Se establece el valor de la posición j que está asociada al Primer Cuartil Q1 (i = 1).4 58 = = = 29 2 2 2 Interpretación: El 25% de las personas reciben una tasa de interés menor de 29% por el fideicomiso de sus prestaciones sociales.2 32.1 Vamos a ejecutar los siguientes pasos para hallar Q1 y Q3.5 29. el 25% de las personas reciben una tasa de interés mayor a 32.5 29.5 4 4 4 Por la Regla 2 tenemos j = 4.1 32. o lo que es igual.6 28.7% por el fideicomiso de sus prestaciones sociales. 1) Se ordenan las observaciones de menor a mayor. y en consecuencia: Q1 = x 4 + x 5 28.5 30.5 30.6 + 29. j= i × ( N + 1) 1× (17 + 1) 18 = = = 4.5 32.6 28. x3 x4 x5 x6 x7 x8 30 x9 x10 x11 x12 x13 x14 33 x15 x16 x17 38 Orden Tasa de Interés (%) x1 10 x2 20.2 37.6 29.2 37. siendo N = 17 en este caso.4 35.

respectivamente). Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos. construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones. Q2 o Q3.2) Cuartiles para una Distribución de Datos Agrupados Dada una distribución de frecuencias para datos agrupados. y desde allí trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser el cuartil buscado (Q1. a) Tabla 2 61 . y desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta. El valor porcentual del cuartil (25%. En el próximo ejemplo se realizará el cálculo solamente para el caso de Q1. 50% o 75%) se ubica en el Eje Y. a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente cualquiera de los cuartiles. Partiendo de la Tabla 1. y los demás serán resueltos por el estudiante de manera análoga al procedimiento que aplicaremos aquí. Tabla 1 Edades (años) Nº de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar el Primer Cuartil Q1 ejecutaremos los siguientes pasos.

y si su valor no resulta entero. por lo que el Primer Cuartil Q1 está ubicado en 4 el intervalo de clase Lij – Lsj de la Columna I. Si Faj-1 = respectivamente. y 41 ≤ 50 ≤ 92. a medida que avanzamos en la Columna III (frecuencias acumuladas) siguiendo el número de clase. se redondea con las mismas reglas aplicadas a la posición j es el cálculo de los cuarteles para observaciones ordenadas. El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. 4 N N < < Fa j . entonces Q1 = Lij o Q1 = Lsj. estando contabilizadas tales observaciones en la Columna II (frecuencias absolutas). entonces parte de las 4 4 observaciones menores a Q1 se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj. por lo que en este último hay N −Fa 4 j− 1 observaciones mayores que Lij y 62 . Las condiciones anteriores se cumplen para la clase j = 3 pues Faj-1 = Fa2 = 41. N 200 = = 50 4 4 En la Tabla 2. o Faj = Si Fa j −1 N . Entonces Q1 se encuentra en el intervalo Li3 – Ls3 = 40 – 49. c) Recordemos que Q1 siempre va a estar dentro del intervalo Lij N 4 – Lsj. siendo menores a Q1 las observaciones de este y de los otros intervalos anteriores. vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el número j de clase tal que Fa j −1 ≤ N ≤ Fa j . Faj = Fa3 = 92.Nº de clases 1 2 3 4 5 6 III Número de Edades Número de asistentes (años) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200 N de observaciones 4 I II b) Determinamos la cantidad aproximada menores a Q1.

3 Q i = Li j +  Fj Para nuestro ejemplo. o sea 4 N  Ic Q1 − Li j =  − Fa j -1  × . la distancia que separa a Lij y Q1 es el espacio que ocupan las N −Fa j −1 observaciones ubicadas entre ambos valores. Por lo tanto. Entonces hay N < Fa 3 pues se 4 N − Fa 2 = 50 – 41 = 9 4 observaciones entre Li3 y Q1. la formulación para Q1 es: 4   Fj Ic N   − Fa j -1  4  × Ic Q1 = Li j +  Fj En general. y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj. j Luego.menores que Q1. vemos que Fa 2 < cumple que 41 < 50 < 92. y así: 4   F3 Ic 9 N   − Fa 2  4  × Ic Q1 = Li 3 +  F3 63 . Entonces la distancia entre Li3 y 3 Q1 es  N  Ic − Fa 2  × = 1. en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa allí un espacio de tamaño F unidades de longitud.53. i = 1. El espacio ocupado en ese intervalo por cada una de las F3 = 51 observaciones es F = 51 = 0. 2. existen aproximadamente i ×N observaciones 4 menores que el cuartil Qi. las cuales se encuentran en el intervalo Li3 – Ls3 = 40 – 49 de tamaño Ic = Ls3 – Li3 = 49 – 40 = 9. cuya expresión correspondiente es:  i ×N  − Fa j -1   4  × Ic . Por otra parte.17.

1) MEDIA ARITMÉTICA (MEDIA O PROMEDIO) 64 . representándose así una gran cantidad de valores unitarios por uno sólo. Ese valor lleva implícita la idea de variación. la Mediana. generalmente se usan los Cuartiles para tal propósito descriptivo.53 ≈ 42 Q1 = 40 +  51 Interpretación: El 25% de las personas asistentes al ambulatorio de Barrio Adentro tienen una edad promedio menor de 42 años aproximadamente. la Moda. ¿Cuándo debe usarse los Cuantiles o Fractiles en cualquiera de los casos anteriores? Estas medidas brindan información acerca de la concentración y variación de una serie de observaciones y datos. El problema es hallar el valor más representativo de una serie de valores. habiendo así mayor densidad de frecuencia en la parte central de los gráficos. el Eje Medio y el Rango Medio. si tenemos una cantidad que varía en el espacio o en el tiempo. pero se necesitan varias mediciones de esa especie para tener una descripción adecuada de la serie.3 Medidas de Tendencia Central Al estudiarse la información estadística mediante los gráficos cartesianos. en el comportamiento de los datos con respecto a sus respectivas frecuencias se observan valores más comunes que otros. ubicándoseles en su zona central. 200  − 41  4  × 9 = 40 + 1. Las Medidas de Tendencia Central son los valores más representativos de una distribución de datos y frecuencias. Cada medida es un valor típico descriptivo en la que un conjunto de datos muestra una tendencia bien determinada a agruparse o aglomerarse alrededor de cierto punto central. En función de tener la menor cantidad de mediciones posibles. es decir. A veces cada una de estas medidas es denominada promedio. y en general se aprecia una tendencia de agrupación en el vecindario de los valores más repetidos. TEMA 2 4. se necesita obtener su grado o nivel generalmente predominante. Estas medidas son la Media Aritmética (y en particular la Media Ponderada).53 = 41. pero esta se desprecia pues sólo interesa obtener el que más se impone. nombre que en general se reserva para la Media Aritmética.

La formulación de la Media es: X= ∑x i =1 N i N = x 1 + x 2 + . que es aproximadamente 858 personas.8 ≈ 858 5 5 Interpretación: Esto significa que en promedio aproximadamente 858 personas diariamente en esos cinco días. En virtud de las propiedades de la suma.289 = = 857.002 personas x5 = 1..289..283 personas N = 5 observaciones o datos X= X = ∑x i =1 5 i 5 = x 1 + x 2 + .8.283 4. 1. + x 5 5 295 + 768 + 941 + 1.. x1 = 295 personas x2 = 768 personas x3 = 941personas Luego: x4 = 1.002 + 1. definimos la Media como la suma de todas las observaciones dividida entre la cantidad N de estas. y encuentra que 295. Identificaremos los valores a emplear en la formulación.002 + 941 + 768 + 1.1. 768.283 = 4.289 ÷ 5 = 857. + x N N La Media es un valor que equilibra los valores de las observaciones que le son mayores y menores.1) Media para una Distribución de Datos Simples Partiendo de una serie de observaciones asociada a esa distribución.002. el orden de las observaciones no altera el resultado para la Media. Ejemplo: El gerente de un local de Mercal desea estudiar la concurrencia a la tienda. entraron 65 . y 1. La Media o promedio de personas que diariamente entraron en la tienda es de 4. El total de personas que entró al Mercal durante los cinco días anteriores es de 295 + 1. y es sensible a mediciones extremas que no estén equilibradas a su alrededor.. 941.283 personas entraron a la tienda durante los pasados cinco días.

36 12 24%=0. F2 = 18 alumnos. La formulación es: XP = ∑p j =1 k j =1 k j ⋅ Fj j ∑p = ∑ p j ⋅ F j pues j =1 k ∑p j =1 k j = 100% = 1 Ejemplo: En una clase de un colegio público hay 20 alumnos de primer grado. F1 = 20 alumnos. ¿cuántos estudiantes hay en promedio en los tres salones de clase? Cursos Primer Grado Segundo Grado Tercer Grado Total Alumnos Porcentajes 20 40%=0. F3 = 12 alumnos.40 p2 = 36% = 0.24 ⋅ 12) = 17.00 Para k = 3 categorías.40 18 36%=0. dividido entre la suma de todas las ponderaciones.36 p3 = 24% = 0.24 Interpretación: Aproximadamente un promedio de 17 alumnos estudian en cada uno de los tres primeros grados. Si los estudiantes de primero representan el 40%. 18 de segundo y 12 de tercero.36 ⋅ 18) + ( 0.24 50 100%=1. La Media Ponderada es: X P = ∑ p j ⋅ F j = ( 0. Media Ponderada: Es la suma de los productos obtenidos de cada valor ponderado por su respectiva ponderación de acuerdo al fenómeno estudiado. los de segundo el 36% y los de tercero el 24% del total existente. Las ponderaciones pueden ser las k frecuencias relativas asociadas a las frecuencias absolutas de las clases de una variable cualitativa. 66 .40 ⋅ 20) + ( 0. identificamos los valores señalados.36 ≈ 17 j =1 3 p1 = 40% = 0.Diga si en el ejemplo de Mercal la media está afectada por los valores extremos.

X f X1 18 2 f1 X2 21 1 f2 X3 23 3 f3 X4 26 4 f4 X5 30 1 f5 X6 34 2 f6 X7 37 6 f7 X8 40 1 f8 La Media Ponderada es: 67 . La formulación es: X = ∑f j ⋅ X j j =1 n ∑f j =1 n = ∑f j =1 n j ⋅X j pues N ∑f j =1 n j =N j La Media Aritmética de una serie de N observaciones es la misma Media Ponderada de la distribución de frecuencias para n datos simples obtenidos de la serie mencionada.5 ≈ 30 20 20 De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples. + x 20 20 18 + 18 + . x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37 x3 = 21 x8 = 26 x13 = 34 x18 = 37 x4 = 23 x9 = 26 x14 = 37 x19 = 37 x5 = 23 x10 = 26 x15 = 37 x20 = 40 La Media Aritmética es: X = X = ∑x j =1 20 j 20 = x 1 + x 2 + .. Estos son las N = 20 observaciones ordenadas crecientemente por fila. + 40 590 = = 29..En una distribución de frecuencias para n datos simples obtenidos de N observaciones asociadas a una variable cuantitativa. Esta última es ventajosa utilizarla cuando abundan numerosas observaciones reflejadas en datos con frecuencias elevadas. Ejemplo: Las edades de los integrantes de una sección de 20 estudiantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta... las ponderaciones vienen siendo sus respectivas frecuencias absolutas.

X =
X =

∑f
j =1

8

j

⋅Xj =

20

f1 ⋅ X 1 + f 2 ⋅ X 2 + ... + f8 ⋅ X 8 20

( 2 ⋅ 18) + (1⋅ 21) + ... + (1⋅ 40) = 590
20 20

= 29,5 ≈ 30

Interpretación: La edad promedio de cada estudiante de la sección es de aproximadamente 30 años. Nota: En el ejemplo de la concurrencia de personas a Mercal, si aplicamos la fórmula de la Media Ponderada resulta que fj = 1, j = 1,…, 5.
1.2)

Media para datos agrupados en k clases Se calcula de manera similar a la Media Ponderada, estando las N observaciones distribuidas en k intervalos de clase, para los cuales las correspondientes marcas de clase son los valores a ser ponderados con las respectivas frecuencias absolutas. La formulación es:

X =

∑F
j =1

k

j k

⋅ Xm j =
j

∑F
j =1

k

j

⋅ Xm j N pues

∑f
j =1

∑F
j =1

k

j

=N

Ejemplo: A partir de la Tabla 1 (las edades de los asistentes a un centro ambulatorio de Barrio Adentro) construimos la Tabla 3 de la siguiente manera: a) Calculamos la edad promedio (marca de clase) de los límites de edades de cada grupo (Columna II). Calculamos el número de asistentes acumulados (frecuencias acumuladas) en cada clase de edades (Columna IV).
b)

Calculamos el producto de la edad promedio de cada clase (Columna II) por el número de asistentes de dichas clases (Columna III), se suman esos valores obtenidos para cada clase (Columna V), y tal resultado se divide entre el total de asistentes, obteniéndose el resultado de la Media. Tabla 3
c)

Nº de clases

I Edades (años)

II Edad Promedio

III Número de

IV Número de

V Edad Promedio

68

asistentes 1 2 3 4 5 6 20-29 30-39 40-49 50-59 60-69 70-79 Totales 24,5 34,5 44,5 54,5 64,5 74,5 16 25 51 80 20 8 N = 200

asistentes acumulados 16 41 92 172 192 200

× Número de asistentes 392 862,5 2.269,5 4.360 1.290 596 9.770

La Media es:

X=
X=
X =

∑F ⋅X
i i =1

6

i

200

=

F1 ⋅ X 1 + F2 ⋅ X 2 + ... + F6 ⋅ X 6 200
200

(16 ⋅ 24,5) + ( 25 ⋅ 34,5) + ( 51⋅ 44,5) + ( 80 ⋅ 54,5) + ( 20 ⋅ 64,5) + ( 8 ⋅ 74,5)

392 + 862,5 + 2.269,5 + 4.360 + 1.290 + 596 9.770 = = 48,85 ≈ 49 200 200

Interpretación: Cada uno de los 200 pacientes que asistieron al ambulatorio de Barrio Adentro tiene una edad promedio aproximada de 49 años. Nota: No se puede calcular la Media Aritmética donde existen clases abiertas (ejemplo: 70 años y más). Lo recomendable es usar la Mediana. En cualquier caso, la Media Aritmética para datos agrupados puede asumir un valor igual o muy cercano al de la Media Aritmética para la serie de observaciones de donde se extrajeron los datos agrupados. Por otra parte, se redondean esos valores para tal medida de tendencia central según la variable empleada, como en los anteriores ejemplos sobre edades. ¿Cuándo debe usarse la Media Aritmética en cualquiera de los casos anteriores? Debido a que su cálculo se basa en todas las observaciones, cualquier valor extremo afecta mucho la media aritmética. Se debe usar cuando no este afectada por los valores extremos. 2) MEDIANA

Es un valor MD que divide en dos grupos a una distribución de datos, de tal manera que uno de los grupos tiene 50% de las observaciones menores a MD

69

y el otro grupo posee 50% de las que son mayores a dicho valor. Es decir, ambos grupos tienen igual cantidad de observaciones. Esta Medida de Tendencia Central es también una Medida de Posición pues por su definición coincide con el Segundo Cuartil Q2, o sea, MD = Q2. 2.1)Mediana para una Distribución de Datos Simples De una distribución de n datos simples obtenemos una serie de N observaciones ordenadas de menos a mayor. Para esta serie, sea xj la observación más cercana a la Mediana MD de entre las que son menores a dicho valor. Dependiendo de N, el valor de MD puede o no puede coincidir con el de xj, existiendo reglas que permiten clarificar este hecho. Regla 1: Si la cantidad N de observaciones es impar, entonces la Mediana está representada por el valor numérico de la observación correspondiente a la posición j =
N +1 . Entonces MD = xj. 2

Ejemplo: En un hospital público de la ciudad de Caracas, los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50, 52, 57, 135, 78, 50, 212, 50, 120. ¿Cuál es la Mediana de los tiempos? Procederemos a ejecutar los siguientes pasos: a. Se ordenan e identifican las observaciones de menor a mayor. x1 50
b.

x2 50

x3 50

x4 52

x5 57

x6 x7 x8 x9 78 120 135 212

Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. En nuestro caso, N = 9, y por la Regla 1 tenemos que
j= N + 1 9 + 1 10 = = =5 2 2 2

MD = xj = x5 = 57 Interpretación: El 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio menor a 57 minutos, o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo promedio mayor a 57 minutos. Regla 2: Si la cantidad N de observaciones es par, entonces consideramos que la Mediana está entre las dos observaciones xj y xj+1 que

70

2)Mediana para una Distribución de Datos Agrupados Dada una distribución de frecuencias para datos agrupados en k clases.están en las posiciones centrales las observaciones ordenadas. Entonces MD = . ¿Cuál es la Mediana de los tiempos? Interprete. N = 10. 135. cuyo valor porcentual (que es 50%) se ubica en el Eje Y. o que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo mayor a 58. 212. En nuestro caso. 2 j = Ejemplo: En un hospital público de la ciudad de Caracas. x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212 Se establece la posición de la Mediana de acuerdo a la cantidad de observaciones. a través del correspondiente polígono de frecuencias relativas acumuladas (u ojiva porcentual) se puede determinar gráficamente la Mediana. 120. La Mediana es la semisuma de los valores numéricos de estas dos 2 x j + x j +1 observaciones. 50.5 minutos en promedio. 2. 52. Procederemos a ejecutar los siguientes pasos: a) x1 50 b) Se ordenan e identifican las observaciones de menor a mayor. Ese valor viene siendo la abscisa del punto de intersección de la ojiva porcentual hacia arriba con la ojiva porcentual hacia abajo. 78. 60.5 2 2 2 Interpretación: Esto significa que el 50% de los pacientes fueron atendidos aproximadamente en un tiempo menor a 58. asociadas respectivamente a las → ← frecuencias relativas acumuladas hacia arriba ( Ha ) y hacia abajo ( Ha ). y luego partiendo de ese punto trazamos una línea paralela al Eje Y hasta tocar el Eje X en otro punto que va a ser la Mediana. 50. 57. los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50. siendo N . desde allí se traza una línea paralela al Eje X hasta tocar la ojiva en un punto de esta.5 minutos en promedio. 71 . y por la Regla 2 tenemos que j= N 10 = =5 2 2 MD = x j + x j +1 2 = x 5 + x 6 57 + 60 117 = = = 58.

Tabla 1 Edades (años) Nº de asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Para hallar la Mediana ejecutaremos los siguientes pasos. Partiendo de la Tabla 1. Ejemplo: Las edades de los asistentes a un centro ambulatorio de Barrio Adentro en una de las parroquias caraqueñas se distribuyeron en 6 grupos. pues ya dijimos que la Mediana es igual al Segundo Cuartil Q2.La manera como calcularemos a MD es similar al procedimiento efectuado para el Primer Cuartil Q1. construimos una distribución de frecuencias absolutas acumuladas para datos agrupados en k = 6 intervalos de clase que contienen un total de N = 200 observaciones. a) Nº de clases 1 2 3 4 5 6 III Número de Edades Número de asistentes (años) asistentes acumulados 20-29 16 16 30-39 25 41 40-49 51 92 50-59 80 172 60-69 20 192 70-79 8 200 Totales N = 200 N 2 I Tabla 2 II b) Determinamos la cantidad aproximada o N +1 2 de observaciones menores a MD si N es par o impar. N 200 = = 100 2 2 72 . respectivamente.

en el intervalo Lij – Lsj de tamaño Ic = Lsj – Lij tenemos que cada una de las Fj observaciones contenidas en ese intervalo ocupa allí un espacio de tamaño F unidades de longitud. siendo menores a MD las observaciones de este y de los otros intervalos anteriores. a medida que avanzamos en la Columna III siguiendo el número de clase. o sea Ic   MD – Lij =  2 − Fa j -1  × F . Por lo tanto. como parte de las 2 2 Lij – Lsj. la formulación para MD   j es: N N   − Fa j -1  Md = Li +  2  × Ic j Fj 73 . El valor encontrado para j es uno fijo o constante de entre los k asociados a cada clase. estando contabilizadas tales observaciones en la Columna II. y las cuales son parte de las Fj observaciones pertenecientes al intervalo Lij – Lsj. Faj = Fa4 = 172. vamos sumando o acumulando crecientemente la cantidad de observaciones de cada intervalo hasta hallar el número j de clase tal que Fa j −1 ≤ N ≤ Fa j . observaciones menores a MD se encuentran las Faj-1 observaciones ubicadas entre los intervalos de clase anteriores a Lij – Lsj. Por otra parte. 2 2 N N Si Fa j −1 < < Fa j . c) Recordemos que MD siempre va a estar dentro del intervalo N N o Faj = . Las condiciones anteriores se cumplen para la clase j = 4 pues Faj-1 = Fa3 = 92. entonces MD = Lij o MD = Lsj.En la Tabla 2. Entonces MD se encuentra en el intervalo Li4 – Ls4 = 40 – 49. j Luego. por lo que la 2 Mediana MD está ubicada en el intervalo de clase Lij – Lsj de la Columna I. la distancia que separa a Lij y MD es el espacio que ocupan las N −Fa 2 j− 1 Ic observaciones ubicadas entre ambos valores. Si Faj-1 = respectivamente. y 92 ≤100 ≤ 172. por lo que en este último hay N −Fa 2 j− 1 observaciones mayores que Lij y menores que MD.

obtenemos una serie de N observaciones ordenadas de menos a mayor. vemos que Fa 3 < cumple que 92 <100 < 172. Se requiere tener ordenadas las observaciones al tratar de hallar la Mediana.11. y se puede calcular en distribuciones abiertas. Para esta serie. la cual no se ve influenciada por los valores extremos existentes en aquellas. Si son varios valores distintos los que se repiten a la vez con una misma frecuencia mayor que las de otras observaciones.Para nuestro ejemplo. ¿Cuándo debe usarse la Mediana en cualquiera de los casos anteriores? Siempre que una observación extrema esté presente. donde no se puede encontrar la Media. 3) MODA 3. 74 .9 ≈ 51 MD = 50 +  80 Interpretación de la Mediana: El 50% de las personas que asistieron al ambulatorio de Barrio Adentro tienen una edad promedio aproximadamente menor a 51 años. y así: 2  F4 N   − Fa 3  2  × Ic MD = Li 4 +  F4  200  − 92   2  × 9 = 50 + 0. la Moda Mo es el valor de aquella observación que aparece con mayor frecuencia (el que más se repite o el más típico). es adecuado usar la mediana en lugar de la media para describir el conjunto de observaciones o de datos agrupados. entonces la serie aquí dada es pluri-modal. El espacio ocupado en ese intervalo por cada una de las F4 = 80 observaciones es MD es  Ic 9 = = 0. Entonces hay N < Fa 4 pues se 2 N − Fa 3 = 100 – 92 = 8 2 observaciones entre Li4 y MD.9.9 = 50.1)Moda para una Distribución de Datos Simples De una distribución de n datos simples. la cual no depende del orden de las observaciones. Entonces la distancia entre Li4 y F4 80 N  Ic − Fa 3  × = 0. las cuales se encuentran en el intervalo Li4 – Ls4 = 50 – 59 de tamaño Ic = Ls4 – Li4 = 59 – 50 = 9.

y la moda será el valor del dato que tenga la mayor frecuencia. 60. 75 . x1 = 18 x6 = 23 x11 = 30 x16 = 37 x2 = 18 x7 = 26 x12 = 34 x17 = 37 x3 = 21 x8 = 26 x13 = 34 x18 = 37 x4 = 23 x9 = 26 x14 = 37 x19 = 37 x5 = 23 x10 = 26 x15 = 37 x20 = 40 40 37 30 26 37 23 26 34 18 37 37 21 18 37 26 37 26 23 Estos son las N = 20 observaciones ordenadas crecientemente por De esta serie de observaciones obtenemos la siguiente distribución de frecuencias absolutas para n = 8 datos simples. Ejemplo: Las edades de los 20 integrantes de una sección de estudiantes de la UBV se obtuvieron luego de aplicárseles una encuesta. x2 y x3. Interpretación: El mayor tiempo de espera de los pacientes es un promedio de aproximadamente 50 minutos. Para nuestro ejemplo. 52. 50. 57. 212. la Moda es Mo = 50 pues ese valor es repetido tres veces por las observaciones x1. 120. X f X1 18 2 f1 X2 21 1 f2 X3 23 3 f3 X4 26 4 f4 X5 30 1 f5 X6 34 2 f6 X7 37 6 f7 X8 40 1 f8 Vemos que Mo = X7 = 37 pues ese es el dato cuya frecuencia f7 = 6 es la mayor de todas. Para hallar la Moda. 78. x2 50 x3 50 x4 52 x5 57 x6 60 x7 x8 x9 x10 78 120 135 212 Se observa la observación que más se repite y ese valor es la Moda. procederemos a ejecutar los siguientes pasos: a) x1 50 b) Se ordenan e identifican las observaciones de menor a mayor. 50. 34 23 fila. Si en la serie de N observaciones estas son numerosas y se repiten muchos valores. 135.Ejemplo: En un hospital público de la ciudad de Caracas. construimos la respectiva distribución de frecuencias absolutas para n datos simples. los tiempos en minutos que necesitaron varios pacientes para ser atendidos en las diferentes consultas fueron: 50.

a) A partir de la Columna II calculamos el valor d1 como la diferencia entre la frecuencia absoluta Fj del Intervalo Modal y la frecuencia absoluta Fj-1 que le antecede (o sea. y se le denomina Intervalo Modal. Primero hay que encontrar EL Intervalo Modal en el cual esta situada la Moda. Aunque ahora veremos una formulación para la Moda. Está localizada en el intervalo de clase de mayor frecuencia.2)Moda para una Distribución de Datos Agrupados La Moda Mo es el valor alrededor del cual los datos tienden a concentrarse más densamente.Interpretación: El grupo de 6 estudiantes de 37 años cada uno es por edad el más numeroso de la sección. Es posible que la distribución que los agrupe sea pluri-modal. la Clase Modal es j = 4 pues la mayor frecuencia viene dada por Fj = F4 = 80 (Columna II). siendo aquel que tiene la máxima frecuencia absoluta. 3. el cual será más exacto a medida que disminuya el tamaño del intervalo de clase y aumente la cantidad de observaciones O datos. para la Moda no siempre se tiene un valor exacto sino aproximado. en algunos textos se le toma como la marca de clase con mayor ordenada en un polígono de frecuencia (absoluta). y también determinamos el valor d2 que se obtiene como la diferencia entre la frecuencia absoluta del Intervalo Modal y la frecuencia b) 76 . d1 = Fj – Fj-1). En nuestro ejemplo representado por la Tabla 4. y el Intervalo Modal (Columna I) es Lij – Lsj = Li4 – Ls4 = 50 – 59. Tabla 4 I II Edades Número de (años) asistentes 20-29 16 30-39 25 40-49 51 50-59 80 60-69 20 70-79 8 Totales N = 200 Nº de clases 1 2 3 4 5 6 Procederemos a ejecutar los siguientes pasos. Sin embargo. Ejemplo: Construimos la Tabla 4 de la Tabla 1 donde aparecen contabilizados los pacientes por edades atendidos en un Unidad de Barrio Adentro.

34 × 9 = 50 + 3. 4) EJE MEDIO Es una medida de resumen que se usa para superar posibles problemas que introducen los valores extremos de las observaciones o datos. d2 = Fj – Fj+1).absoluta Fj+1 que le sucede (o sea. La ocurrencia de algún valor extremo no afecta a la Moda al igual que la Mediana. Fj+1 = F5 = 20. ¿Cuándo debe usarse la Moda en cualquiera de los casos anteriores? Cuando queremos conformarnos con tener una idea superficial de la concentración de la distribución. y con el resto de los valores mencionados anteriormente hallamos la Moda Mo con la siguiente formulación: c) Mo = Li j + d1 × Ic d1 + d 2 Como Ic = Ls4 – Li4 = 59 – 50 = 9. A Intervalo Modal Lij – Lsj le calculamos su longitud Ic = Lsj – Lij.06 = 53. y por tanto d1 = 80 – 51= 31 y d2 = 80 – 20 = 60. procedimiento idéntico tanto para datos simples o agrupados. En particular. resulta: Mo = Li 4 + d1 × Ic d1 + d 2 Mo = 50 + 31 × 9 = 50 + 0.06≈ 53 31 + 60 Interpretación de la Moda: Gran parte de los asistentes al centro ambulatorio tienen una edad promedio de aproximadamente 53 años. La formulación es: EM = Q1 + Q 3 2 Ejemplo: Calcularemos el Eje Medio para las tasas de interés del BCV estudiadas cuando se calcularon el Primer y Tercer Cuartil cuando 77 . El Eje Medio EM se obtiene con la semisuma del Primer y Tercer Cuartil. tenemos Fj-1 = F3 = 51. la Moda se usa sólo para fines descriptivos porque varía más entre distintas muestras que otras medidas de tendencia central.

85 2 2 2 Interpretación: Todas las personas reciben por el fideicomiso de sus prestaciones sociales una tasa promedio aproximada de 30. x + x 10 540 + 690 RM = 1 = = 615 2 2 ¿Cuándo debe usarse el Rango Medio en cualquiera de los casos anteriores? 78 . respectivamente.85%. En el primer caso. 610. Determine el Rango Medio del número de visitantes: 690. 540. 670.630. tenemos que X1 = x1 y Xn = xN. Como Q1 = 29% y Q3= 32. entonces: EM = Q1 + Q3 29 + 32. a) Se ordenan e identifican las observaciones de menor a mayor. 690. al comparar la serie de N observaciones con los n datos simples. x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 540 560 610 630 670 670 690 690 690 690 Se busca el menor y el mayor valor del conjunto observaciones. 670. 560.tenemos una serie ordenada de observaciones. 690. o como la semisuma del límite inferior y el límite superior del primer y último intervalo de clase. Para las N = 10 observaciones ya ordenadas. cuando tenemos datos agrupados en k clases.7%. 690. Las correspondientes formulaciones son: Para N observaciones ordenadas o n datos simples: Para datos agrupados en k clases: RM = x1 + x N X 1 + X n = 2 2 Li + Ls k RM = 1 2 Ejemplo: Los números de visitantes durante los últimos 10 años a la cueva del Guácharo fueron los que se presentan a continuación.7 = = = 30. b) c) Se obtiene el Rango Medio. 5) RANGO MEDIO El Rango Medio RM se obtiene con la semisuma del valor más pequeño y el valor más grande de un conjunto de N observaciones ordenadas ascendentemente.7 61. tenemos que x1 = 540 y xN = x10 = 690.

670. 1. Grupal Cooperativo  Del análisis de las evolución de enfermedades endémicas de una región del país se encontró que los casos de dengue hemorrágico en los últimos quince años varió: 1. 2. 2.549 252. 1.286 299.Cuando se procesan datos donde no se presente un valor extremo. 1. 1.890.470 641.831 211.126 196.495.004. 1. 3.930.300.510.651 423. 1. 1. lo que hace que se utilice poco este promedio 4.257 75.517 242.757 282.222 198. el Rango Medio y El Eje Medio. 1.510.633 82.629. y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema.149 166. 1.475.034 350.500.327 315. El siguiente cuadro muestra a las personas en pobreza extrema por entidad federal correspondientes al primer semestre del año 2.845 199.650. Interprete cada una de las medidas. Entidades Federales Zulia Carabobo Miranda Lara Aragua Bolívar Distrito Capital Sucre Táchira Portuguesa Anzoátegui Mérida Falcón Barinas Guárico Trujillo Monagas Apure Yaracuy Cojedes Vargas Personas en pobreza extrema 905.590. 1.345.332 504.024 179.884 479.287 440.250 Calcule la Mediana.540.597 212.408  79 . 1.4 ACTIVIDADES (PARA OBSERVACIONES O DATOS SIMPLES) Individual  Lea con cuidado los contenidos presentados en relación a medidas de tendencia central para observaciones o datos no agrupados.

Diga cuál de las promedios refleja la realidad de las personas pobres extremos. Rango Medio.5 ACTIVIDADES (PARA DATOS AGRUPADOS) Individual  Lea con cuidado los contenidos presentados en relación a las medidas de posición y de tendencia central para datos agrupados. 2.713 27. Comunitaria  Con los datos recopilados en su trabajo de campo correspondiente a Proyecto I (II). 4. Primer Cuartil.201 40. Interprete los resultados y agréguelo a su portafolio. se aplicó una encuesta con el fin de conocer la edad de los habitantes de una comunidad y encontraron los siguientes datos 77 34 18 44 63 41 84 58 38 58 54 53 52 51 59 62 54 63 56 62 36 62 26 50 Calcule el Primer Cuartil e interprete. y consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema. Tercer Cuartil y Eje Medio. ¿Qué medidas tomaría para ir disminuyendo el número de personas en pobreza extrema que se encuentran en las grandes entidades federales?  Durante un diagnóstico realizado en una comunidad de los paramos del Estado Mérida. Grupal Cooperativo 80 . el Eje Medio? 2. 3. el Rango Medio. ¿Cuál es la cantidad media de personas pobres por entidad federal: la Mediana. De acuerdo a los valores descritos en el cuadro.Nueva Esparta Delta Amacuro Amazonas 49. Calcule Media.293 Nota: Ordenada por el total de pobres Fuente: INE / Unidad de Medición de Condiciones de Vida 1. siga el siguiente tratamiento: 1. Revíselos. Agrúpelos ordenados de mayor a menor. Mediana. ¿la Media de las personas en pobreza extrema está afectada por algunas entidades federales? ¿Es la mejor medida? 4.

TEMA 3 4. Sueldo (Miles de Bs. Interprete las medidas anteriores. Primer Cuartil. la Mediana. Tiempo (en minutos) 1-3 4-6 7-9 10-12 13-15 16-18 Número de personas 4 8 16 9 5 2 Determine e interprete la Media Aritmética.  Se tiene de una muestra de los tiempos que necesitaron 42 personas de una cooperativa para ensamblar un armario. Los sueldos de una muestra de la población de Caracas revelaron los siguientes datos. Mediana y Moda. y diga algunas conclusiones.6 Medidas de Dispersión Las Medidas de Tendencia Central carecen de significación por sí solas pues de nada vale conocer únicamente el comportamiento central de una serie de valores si se desconoce la manera como se alejan o se acercan esos valores con 81 . organizados en una distribución de frecuencias. Tercer Cuartil.) 100-199 200-299 300-399 400-499 500-599 600-699 700-799 800-899 900-999 • • • • Número de personas 616 125 151 80 20 48 25 7 2 Determine Media Aritmética. la Moda y el Primer Cuartil. ¿Qué sueldo menor en promedio gana el 50% de la población? Compare Media Aritmética. Mediana. Moda.

los resultados que obtenemos por las Medidas de Tendencia Central tienen mayor significado con la ayuda de las Medidas de Dispersión o Variabilidad.respecto a un valor representativo de estos y obtenido calculando la apropiada medida de tendencia central.  Medidas de Dispersión Relativa: sus valores se obtienen de los cocientes fraccionales entre medidas de dispersión absoluta y de tendencia central. las medidas de dispersión relativa asumen valores abstractos o porcentuales. En el primer caso. y como ambas vienen expresadas en las mismas unidades de medición. RECORRIDO U OSCILACIÓN TOTAL AMPLITUD TOTAL. La dispersión será mayor o menor de acuerdo a la magnitud de esas diferencias.  Medidas de Dispersión Absoluta: sus valores vienen expresados en las mismas unidades de medición del conjunto de observaciones o datos a ser estudiado. la Varianza y la Desviación Estándar. o que tengan un mismo valor para una medida de dispersión absoluta pero habiendo a la vez distinta variabilidad de sus respectivas observaciones o datos con respecto a una medida de tendencia central. la cual se entiende como la manera en que los valores de una serie difieren unos de otros. domesticamos al azar y aprendemos a vivir bajo incertidumbre. Controlándola Se obtiene restando el valor más bajo del valor más alto de un conjunto de N observaciones. Este hecho nos permite comparar la dispersión en dos o más conjuntos de datos para determinar el que tiene mayor o menor dispersión. La más importante entre las medidas de dispersión relativa es la del Coeficiente de Variación. La variabilidad no se puede eliminar pero sí reducir. Las Medidas de Dispersión se dividen en dos grupos. Las medidas más importantes son el Rango. las cuales son complemento de aquellas y determinan la homogeneidad o heterogeneidad de los conjuntos de datos referidos a un valor de tendencia central tomado como referencia. al comparar la serie de N observaciones con los n datos simples. Por lo tanto. Lo anterior implica la necesidad de caracterizar numéricamente la dispersión. la comparación sería imposible en caso de haber dos conjuntos con distintas unidades de medición. Las respectivas formulaciones son: Para N observaciones ordenadas o n datos simples: R = xN – x1 = Xn – X1 82 . 1) RANGO. Sin estas medidas de dispersión relativa. tenemos que X1 = x1 y Xn = xN. o restando el límite inferior de la ultima clase menos el límite superior de la primera clase cuando tenemos datos agrupados en k clases. y sólo hacen referencia al conjunto en cuestión.

habiendo casos en los que se obtienen intervalos exagerados cuando la distribución tiene una concentración en un espacio reducido. R = xN – x1 = x5 – x1 = 106 – 97 = 9 Interpretación: La variación de los pesos con respecto a todos los pesos de la caja es de 9 Kg. ¿Cuándo debe usarse el Rango en cualquiera de los casos anteriores? El Rango se usa cuando las observaciones o datos son muy escasos o demasiado dispersos. Para las N = 5 observaciones ya ordenadas. y por tanto estos difieren mucho de los valores extremos. a) Se ordenan e identifican las observaciones de menor a mayor. Determine el Rango. No da una idea verdadera de la concentración de los valores. tenemos que x1 = 97 y xN = x5 = 106. además que esa medida es útil para conocer los valores extremos o la dispersión total.Para datos agrupados en k clases: R = Lsk – Li1 Vemos que el Rango representa la medida del mayor espacio en que se encuentran todos los valores de una distribución. 97. 106. y 103. c) Se obtiene el Rango. y por otra parte para un mismo problema el Rango aumenta o queda igual con el número de observaciones pero no disminuye en ningún caso. listas para embarcarse a Francia son: 102. Las desventajas de esta medida están en que no utiliza todas las observaciones sino dos de estas. 101. Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa. x1 97 b) x2 x3 x4 x5 101 102 103 106 Se busca el menor y el mayor valor del conjunto observaciones. 2) O TÍPICA VARIANZA Y DESVIACIÓN ESTÁNDAR 83 . Con el Rango la variabilidad se puede expresar en un sólo número. se puede ver muy afectada por alguna observación extrema hasta el punto de perder importancia como medida de dispersión cuando los valores extremos son muy lejanos.

2. S = S2 = ∑ (x N j =1 j − X) 2 N Así como coinciden la Media de una serie de N observaciones y la Media de una distribución de frecuencias para n datos simples asociados a dichas observaciones. Todas esas diferencias o desvíos se promedian en su totalidad mediante expresiones cuadráticas cuya justificación matemática escapa al alcance de los objetivos de este Unidad. es más práctico y razonable considerar las diferencias o desvíos entre cada uno de estos valores y una medida de tendencia central que sirva de referencia. el cual es un valor que se denomina Desviación Media. siendo pertinente ampliar el alcance de esta idea a los valores restantes para que todos (y no dos) se vean reflejados o influyan en una medida de dispersión. esas expresiones son numéricamente muy precisas y útiles para representar la dispersión y para su posterior uso en Estadística Inferencial. j =1 n 84 . S2 = ∑ (x N j =1 j − X) 2 N .Para medir mejor la dispersión de los datos en términos de su totalidad. Además. son más exactas que el simple promedio de esas diferencias. y por eso se le aplica la operación matemática de la raíz cuadrada para obtener la Desviación Estándar. y que aparece en cualquier libro de Estadística pero no lo estudiaremos en la presente Guía Didáctica. Como no tendría sentido tomar en cuenta todas las diferencias posibles (aunque sean tomadas positivamente como distancias.1) Varianza y Desviación Estándar para una Distribución de Datos Simples Para una serie de N observaciones ordenadas tenemos las respectivas formulaciones para la Varianza S2 y la Desviación Estándar S que daremos a continuación. la Varianza viene dada en unidades cuadráticas. también ocurre lo mismo entre las formulaciones anteriores y las siguientes para tales datos. es necesaria pero no suficiente la concepción del rango como una sola diferencia o distancia de dos valores. Sin embargo. siendo este un valor medido en las mismas unidades simples en que los datos vienen dados. Tal como veremos ahora. teniendo en cuenta que N = ∑f j . Se escoge la Media Aritmética pues es aquella medida de tendencia central que equilibra a todas las observaciones y no solamente a dos. obviando sus verdaderos signos) para las observaciones o datos.

listas para embarcarse a Francia son: 102. b) La Columna II contiene las desviaciones respecto a la Media. 97. + x 5 5 97 + 101 + 102 + 103 + 106 509 = = 101. que se obtienen restando de la columna I el valor de la Media o promedio para cada valor de la columna I.S2 = ∑ fj ⋅(Xi − X ) j =1 n 2 N . 106. 101. Determinemos la Varianza y la Desviación Estándar.. y 103. S = S2 = ∑ f ⋅ (X n j =1 j j − X) 2 N Ejemplo: Los pesos en kilogramos de una muestra de cajas de frutas de una cooperativa. Para el cálculo de esas medidas. de las cajas de frutas. La Columna I representa los N = 5 pesos en Kg. I x x1 = 97 x2 = 101 x3 = 102 x4 = 103 x5 = 106 Total: 509 II x −X x 1 − X = -5 x 2 − X = -1 x3 − X = 0 x4 − X = 1 x5 − X = 4 ( x1 − X ) 2 ( x2 − X )2 (x − X ) ( x4 − X )2 (x − X ) 2 3 2 5 (x − X ) III 2 = 23 =1 =0 =1 = 18 Total: 43 d) La Varianza S2 es el resultado de dividir el total de la Columna III entre el número N de observaciones..8 ≈ 102 Kg. realizaremos los siguientes pasos con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas. La Media es: a) X = X = c) ∑x j =1 5 j 5 = x 1 + x 2 + . 85 . 5 5 La Columna III se obtiene elevando al cuadrado cada valor de la columna II.

2) Varianza y Desviación Estándar para una Distribución de Datos Agrupados Si tenemos una distribución de frecuencias para datos agrupados en k clases. S = S2 = ∑ (x 5 j =1 j − X) 2 N = 8. y la Varianza S2 y la Desviación j =1 k Estándar S tienen las respectivas formulaciones: S2 = ∑ F ⋅ ( Xm j =1 j k i − X) 2 N .6 ≈ 9 Kg2. recordemos que N = ∑F j .S2 = ∑(x 5 j =1 j − X) 2 5 S2 = ( 97 − 102) 2 + (101− 102) 2 + (102 − 102) 2 + (103 − 102) 2 + (106 − 102) 2 5 S2 = 43 = 8. se quedaron en el hospital después de una operación. escogidos al azar. 2. S = S2 = ∑ F ⋅ ( Xm k j =1 j j − X) 2 N Ejemplo: El administrador del un hospital público hizo una investigación acerca del número de días que 200 pacientes. 5 e) Ahora hallaremos la Desviación Estándar S. Interpretación: La diferencia con respecto al peso promedio de 102 Kg. ≈ 3 Kg. Estancia en el hospital (en días) 1-3 4-6 Número de pacientes 18 90 86 .6 = 2. correspondientes a las 5 cajas es de aproximadamente 3 Kg.93 Kg.

71 ≈ 8 días 5 La Columna IV se obtiene elevando al cuadrado cada valor de la Columna III. e) Intervalos de Clases 1–3 4–6 7–9 10 – 12 13 – 15 16 – 18 19 – 21 22 – 24 Total f) 87 .401 La Varianza S2 es el resultado de dividir el total de la Columna V entre el número total de pacientes. + F8 ⋅ Xm8 = 7. con los cuales vamos a construir una tabla con ciertas columnas que nos facilitarán la obtención de estas medidas. a) La Columna I representa el número promedio de días de estancia en el hospital por cada una de las k = 8 clases. X = d) ∑F j =1 8 j ⋅ Xm j = 200 F1 ⋅ Xm1 + F2 ⋅ Xm2 + .. La Columna V se obtiene multiplicando la Columna IV por la Columna II. c) La Columna III se obtiene restando el valor de la Media o promedio con cada valor de la Columna I..7-9 10-12 13-15 16-18 19-21 22-24 44 21 9 9 4 5 Para el cálculo de la Varianza y la Desviación Estándar realizaremos los siguientes pasos.125 200 4. IV V I II III 2 2 ( Xm − X ) Xm F F ⋅ ( Xm − X ) Xm − X Xm 1 − X = -6 Xm1 = 2 F1 = 18 36 648 Xm 2 − X = -3 Xm2 = 5 F2 = 90 9 810 Xm 3 − X = 0 Xm3 = 8 F3 = 44 0 0 Xm 4 − X = 3 Xm4 = 11 F4 = 21 9 189 Xm 5 − X = 6 Xm5 = 14 F5 = 9 36 324 Xm 6 − X = 9 Xm6 = 17 F6 = 9 81 729 Xm 7 − X = 12 Xm7 = 20 F7 = 4 144 576 Xm 8 − X = 15 Xm8 = 23 F8 = 5 225 1. b) La Columna II contiene la cantidad de pacientes atendidos según la cantidad de días que permanecieron en el hospital.

dentro de m desviaciones de la Desviación Estándar S con respecto de la Media X . X + m⋅ S). …. y en otro caso S2 > 0 y S > 0. es decir. + F j ⋅ ( Xm8 − X ) 2 2 2 200 S2 = g) 648 + 810 + 0 + 189 + 324 + 729 + 576 + 1. Si no existe variabilidad. Nota: La Varianza S2 sirve para hallar la Desviación Estándar S. Además.69 ≈ 5 días Interpretación: La diferencia respecto al número promedio de 8 días. es de aproximadamente 5 días.125 4. La utilidad de esta regla radica en que permite determinar unos límites para acotar o enmarcar una parte de los datos en su dispersión con respecto a la Media.. 200 200 Ahora hallaremos la Desviación Estándar S. y para un conjunto de n datos X1. por lo menos t = intervalo ( X – m⋅ S. Ejemplo: 1    1 − 2  × 100% de los datos se encuentran en el  m  88 . también válida para distribuciones de datos agrupados pues sólo se requiere conocer la Media y la Desviación Estándar para su aplicación. En consecuencia. Si algunos datos están muy alejados de la Media. son muy sensibles ante la presencia de datos extremos pues en esencia son medias o promedios de otra especie. entonces S2 y S tomarán valores muy elevados. y ambas se basan en los desvíos de los datos con respecto a la Media. pues a mayor o menor dispersión de estos hay mayor o menor Desviación Estándar. 3. Xn. respectivamente. o sea.3) Regla de Tchebishev Esta regla dice que para m = 2.S = 2 ∑ F ⋅ ( Xm 8 j =1 j j −X) 2 200 = F1 ⋅ ( Xm1 − X ) + F2 ⋅ ( Xm2 − X ) + . 2.401 = = 22 días2. correspondientes a las 200 estadías de los pacientes. el valor de la Desviación Estándar está en relación directa con la dispersión de los datos. entonces todos los datos coinciden con la Media y S2 = S = 0. S = S2 = ∑ F ⋅ ( Xm 8 j =1 j j − X) 2 200 = 22 = 4..

lo cual se cumple con creces pues en realidad allí están todos los datos. Siendo que n = 5. 89 . respectivamente. 106. Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medición.Para el problema de los pesos de las cajas de frutas. el Coeficiente de Variación CV es igual al cociente entre la Desviación Estándar y la Media. Su Media es X = 101. y 103. SX = 11 CVX = SX 11 ×100% = × 100% = 10.93. como por ejemplo Kilogramos y Centímetros.58 ≈ 107 Kg. y a su vez son menores que 106.47% Y 230 Interpretación: La fábrica colombiana Y tiene mayor variación en los salarios que la fábrica venezolana X. Entonces: Fábrica venezolana X X = 102.78% X 102 Fábrica colombiana Y Y = 230.94 y menores que 106. X Esta medida se emplea fundamentalmente con el objeto de: 1. 106.94 ≈ 96 Kg. Ejemplo: En una fábrica venezolana X la Media y Desviación Estándar de los salarios es de Bs 102 y Bs 11.58). En una fábrica colombiana Y la Media y Desviación Estándar de los salarios es de $ 230 y $ 54.8 y su Desviación Estándar es S = 2. 3) 3  1 =  1 − 2  × 1 0 0 % × 100% 4  2  = 75% de los datos deben estar en el COEFICIENTE DE VARIACIÓN Tanto para datos simples como agrupados.94 . entonces tenemos que por lo menos n⋅ t = 3. tenemos que los datos son: 102.58. La formulación es CV = S × 100%. SY = 54 CVY = SY 54 ×100% = × 100% = 23. es decir. 101. respectivamente. Interpretación: Hay por lo menos 4 cajas de frutas cuyos respectivos pesos son mayores a 95.. Para m = 2 tenemos que por lo menos t = intervalo (95. y multiplicando ese cociente por cien para ser expresado en porcentaje. ser mayores que 95.75 ≈ 4 datos están en ese intervalo. 97.

Por otra parte. aunque tienen similar dispersión. Entonces: Empresa X = 3. lo cual expresaremos en la siguiente escala. pero los grupos tienen muy alejados grados de dispersión. sea X la variable que indica las notas del curso de Matemáticas. respectivamente. SX = 2 Curso de Física Y = 14.800 Empresa Y = 14. ¿cuál de los dos cursos es más consistente y cuál tiene la Media más representativa? Tenemos que: Curso de Matemáticas X = 12. CV 0% a 10% 11% a 15% 16% a 25% 26% o más Interpretación Muy homogéneo Homogéneo Heterogéneo Muy heterogéneo Ejemplo: En una sección de educación básica. 42. En una empresa Y la Media de los salarios es de Bs. y en los que la Media y Desviación Estándar de uno de los grupos son diferentes para el otro.500 Interpretación: La empresa Y tiene menor variación en los salarios que la empresa X. respectivamente. 14. cuya Media y Desviación Estándar son Y = 14 Pts. sea Y la variable que indica las notas del curso de Física.5 Pts. cuya Media y Desviación Estándar son X = 12 Pts y SX = 2 Pts. pero ambos grupos pueden tener igual o similar grado de dispersión. y entre SX y SY. SY = 2. Dada la similitud entre X y Y .. SY = 130 Y CVY = SY 130 ×100% = × 100% = 0. Ejemplo: En una empresa X la Media de los salarios es de Bs. 3.500 con una Desviación Estándar de Bs. pueden haber valores similares para el par de Medias y el par de Desviaciones. Igualmente. 130. SX = 42 X CVX = SX 42 ×100% = × 100% = 1. y puesto que en un mismo curso hay dos puntuaciones de distinta especie.10% X 3.89% Y 14. y SY = 2.500. Comparar dos grupos de datos con iguales unidades de medición.5 90 . 3.800 y la Desviación Estándar es de Bs..800.2. Determinar si cierta Media es consistente u homogénea con cierta Desviación Estándar.

4. por lo que la Media más representativa es la del curso de Matemáticas. 0. 91 .CVX = SX 2 ×100 = × 100 = 16. 1 y 2. Grupal Cooperativo  Para cada uno de los ejercicios siguientes. Como es mayor la dispersión relativa CVY de los datos en el curso de Física. 6. Consulte la bibliografía a fin de ampliar sus conocimientos y considerar la opinión de otros autores sobre el tema. 10.7 ACTIVIDADES Individual  Lea con cuidado los contenidos presentados en relación a las medidas de dispersión para datos simples (no agrupados) y agrupados. Los datos se organizaron en la tabla siguiente. determine e interprete el Rango. A continuación tenemos las ganancias semanales de un grupo de 20 taxistas (expresadas en miles de bolívares).67% X 12 CVY = SY 2. la Desviación Estándar y el Coeficiente de Variación. Así mismo. establezca una conclusión al menos acerca de la dispersión.5 ×100 = × 100 = 17. Una muestra de archivos personales de ocho empleados de una alcaldía indicó que durante un período de seis meses tuvieron el siguiente número de inasistencias: 2.85% Y 14 Interpretación: El curso de Matemáticas es más homogéneo que el curso de Física. Resuelve los siguientes ejercicios: 1. 4. Se observa que CVX = CVY. Índice 100-119 120-139 140-159 160-179 180-199 200-219 Número de productos 5 7 9 16 10 3 3. esto quiere decir que las calificaciones en Matemáticas se haya más concentrada alrededor de la Media en comparación a las de la otra materia. la Varianza. El Departamento de Control de Calidad de una afamada marca de atún mide con un índice la calidad de su producto. 3. 2.

147 185 95 92 93 115 127 126 143 157 101 93 123 133 83 51 135 125 129 132 92 .

93 . La probabilidad de un evento es medida por valores comprendidos entre 0 y 1. Ejemplo: La probabilidad de que el sol salga mañana es muy alta. 6) Construir intervalos de confianza para estimar la media y la proporción de una población. 3) Mencionar y explicar cómo se calculan probabilidades de acuerdo a cada uno de los tres planteamientos de probabilidad. La probabilidad de una imposibilidad es 0. CONTENIDO: TEMA 1 5. 8) Uso del paquete computacional SPSS (entre otros) para el cálculo de estimadores. MUESTREO Y OBJETIVO: Calcular e interpretar probabilidades asociadas a un evento aleatorio dado y seleccionar una muestra de una población dada como medio para estimar ciertos parámetros poblacionales. su valor asignado estará más próximo a 1. La noción de azar se presenta cuando no se puede predecir con certeza el resultado de un determinado Fenómeno Aleatorio. 2) Calcular el tamaño de un espacio muestral dado. es decir. lo que conduce al estudio profundo de las ideas anteriores a través de un área de las Matemáticas denominada Teoría de la Probabilidad. COMPETENCIAS: 1) Definir el concepto de probabilidad.1 ¿Qué es Probabilidad? La Probabilidad es la posibilidad numérica de que ocurra un evento. siendo aquel hecho que bajo ciertas condiciones puede ocurrir o dejar de suceder. 5) Mencionar y explicar los métodos de muestreo probabilística.UNIDAD V: INTRODUCCIÒN ESTIMACIÓN A LA PROBABILIDAD. 4) Definir población y muestra. Mientras mayor sea la probabilidad de que ocurra un evento. En todas las situaciones un elemento común a estas es la presencia de la incertidumbre. la probabilidad de que apruebes este curso sin estudiar está al otro extremo. muy cercana a 1. 7) Seleccionar el tamaño de la muestra requerido para la estimación de la media y de la proporción de una población. está cercana a 0.

En el caso contrario al antes descrito estamos en presencia de un Experimento Determinista. Supone un mayor o menor grado de incertidumbre. Supongamos que la población es conocida y nos interesa calcular la probabilidad de observar una muestra particular. Así.2 Experimento Aleatorio Un Experimento es un proceso por medio del cual se obtiene una observación. 5.3 Espacio Muestral (de un experimento aleatorio) Es el conjunto de todos los resultados posibles del experimento. y lo podemos denotar con la letra griega “Ω” (omega) o con la letra mayúscula E. D}.Esta rama del conocimiento es el vehículo que le permite al investigador en Estadística usar la información contenida en una muestra para hacer inferencia o para describir la población de la cual se ha obtenido la muestra. Exactamente lo opuesto es cierto en los problemas estadísticos cuando asumimos que la población es desconocida y la muestra es conocida. Ejemplo: En un proceso de fabricación extraemos un artículo elegido entre los artículos fabricados y observamos si es o no es defectuoso. 5. la Teoría de la Probabilidad actúa desde la población hacia la muestra. pero no sabemos de antemano cual de ello va a salir. jamás se podrá predecir el resultado que se va a obtener ya que puede ocurrir más de uno que sea posible. Si denotamos por B cuando es artículo es bueno y por D cuando es defectuoso. moviéndose de la muestra hacia la población. Un Experimento Aleatorio es aquel que se caracteriza por dar resultados inciertos porque al repetirlo bajo análogas condiciones. mientras que la Estadística actúa opuestamente. 94 . el resultado puede ser cara o sello. Cada resultado del experimento (o elemento del Espacio Muestral) se denomina Punto Muestral. El proceso de lanzamiento de la moneda es un experimento aleatorio. ambos serían los puntos maestrales y podríamos tomar Ω = {B. Ejemplo: Si lanzamos una moneda al aire. dato o medición. y lo que deseamos es hacer inferencias acerca de la población.

2. 5. Así cómo existen espacios maestrales finitos. lanzamos un dardo hacia un tablero y hay una extensión continua de puntos donde puede caer. Debido a las múltiples aplicaciones que tiene la Teoría de la Probabilidad en la vida cotidiana. 6} Cada uno de los seis posibles resultados del lanzamiento viene siendo un punto muestral. Como un suceso es una colección específica de puntos maestrales. 5. la Probabilidad puede ser Subjetiva (un juicio probable) u Objetiva (un acontecimiento probable). 3. existen cuatro modelos para su cálculo: 95 . por lo que la probabilidad posee grados según su acercamiento o alejamiento de la certidumbre (certeza).4 Suceso o Evento de un Experimento Aleatorio Es un subconjunto del espacio muestral que se caracteriza por ser resultado de un experimento aleatorio. esta es igualmente válida para poblaciones y muestras.Otro ejemplo: El espacio muestral S del experimento de lanzar un dado está dado por las seis caras de este. Por lo tanto. La Probabilidad ocupa un lugar importante en la toma de decisiones puesto que permite proyectar (inferir) resultados de un evento determinado.4. En el campo de la Estadística. tal como veremos luego. Por ejemplo. un suceso particular ocurrirá si ocurre cualquier punto muestral de dicho suceso. el resto de los planteamientos a estudiarse en la Unidad III estarán referidos a poblaciones. S = {1. también existen los que son infinitos. Esto permitió dar un valor numérico a la probabilidad de ocurrencia o no ocurrencia de un acontecimiento o resultado. Luego.5 Los Modelos de Probabilidad En la antigüedad se denominaba probable a lo que según las apariencias puede ser declarado verdadero o cierto. debido al carácter amplio y general de la Probabilidad. 5. Recordando las consideraciones hechas sobre ambos conceptos en el Módulo I de la Unidad I. Estas ideas de probabilidad y azar dieron origen a la Teoría de la Probabilidad como disciplina de carácter matemático. el cálculo de Probabilidades es útil para la Estadística Inferencial. Se representa por una letra mayúscula.

5. 4}. Para calcular la probabilidad de un evento A aplicando este modelo. y el denominador es la cantidad total de elementos pertenecientes al espacio muestral Ω . registra la frecuencia con que ha ocurrido un evento en el pasado. Aquí se supone que los sucesos elementales son equiprobables. 2. se utiliza la siguiente fórmula: P(A) = Ejemplo: Número de veces que ha ocurrido el evento en el pasado Número total de observacio nes 96 .5. y estima la probabilidad de que el evento ocurra nuevamente con base a su comportamiento histórico ya investigado. Tomando el espacio muestral Ω = {1. La probabilidad clásica de un evento A se determina mediante la Regla de Laplace. expresada así: P(A) = Número de casos posibles para el Espacio Muestral Ω El numerador de esa expresión es la cantidad de elementos o puntos maestrales que conforman al suceso A.3 =0.1 El Modelo Clásico Fija la probabilidad sin depender de ninguna experiencia y por lo tanto no está apoyada en ninguna inferencia inductiva. 4. Se relaciona con los juegos de azar y las apuestas. el cual tiene éxito si el resultado del experimento es la cara 3 y 4.2 El Modelo Empírico o de Frecuencia Relativa Utiliza datos que se han observado empíricamente en una investigación estadística.33%. 3. tenemos P(A) =  2 1 = = 0. Modelo Clásico (a priori)  Modelo Empírico o de Frecuencia Relativa (a posteriori)  Modelo Subjetivo 5.3333… = 33. 6 3 Número de casos favorables para el Evento A 5. 5. Ejemplo: Sea el experimento aleatorio de lanzar un dado una vez. 6} y el evento A = {3.

Aquí la probabilidad representa una relación entre una proposición y un cuerpo de evidencia. ¿Cuál es la probabilidad de que una mujer sea elegida a la Presidencia de la República Bolivariana de Venezuela? En cierto modo se puede considerar el enfoque de este modelo como una generalización de la probabilidad obtenida a partir de una frecuencia en una serie larga de pruebas. pero no es una relación puramente lógica. siendo que algunos de estos últimos serán estudiados más adelante en los próximos módulos.16 = 0. y también a partir de situaciones en que la información que dispone un individuo es más incompleta y precaria. el individuo hace comparaciones entre la situación en que se encuentra (que no necesariamente se va a repetir) y las situaciones típicas caracterizadas por el azar. en un gran número de aplicaciones usuales de las probabilidades.1666… = 16. En esa interpretación personal de la probabilidad. y aquellas servirán para hallar las probabilidades de otros sucesos en base a las mismas reglas. Por ejemplo.66% 30 Este modelo se usa esencialmente en distribuciones de frecuencias para datos estudiados en Estadística. Es una relación cuasilógica y el valor numérico asociado a ella representa un grado de creencia subjetiva expresada en un juicio probable. por lo que es útil el siguiente resumen comparativo de conceptos estadísticos y probabilísticas. Conceptos Empíricos (Estadísticos) Población Muestra Frecuencia relativa Variable Estadística Histograma de Frecuencia Relativa Histograma de Frecuencia Relativa Acumulada Características Estadísticas (Estadísticos) 5. ¿Cuál es la probabilidad de que falte este mes que tiene 30 días? P (Falta) = 5  = 0.3 El Modelo Subjetivo Se utiliza cuando no hay datos históricos disponibles y sólo se cuenta con opiniones o criterios subjetivos. y su Conceptos Teóricos (Probabilísticos) Espacio Muestral Suceso Probabilidad Variable Aleatoria Curva de Probabilidad Curva de Distribución Características (Parámetros) Probabilísticas 97 . Por otra parte.5. más que pensar en la repetición de un experimento y en su frecuencia.Alicia faltó 5 veces a clases el mes pasado. en base a ciertas reglas el individuo asigna probabilidades a los sucesos elementales.

al igual que las razones que justifican el uso de las muestras se analizaron en la Sección 1. al menos hipotéticamente. 5.6 Población y Muestra Los conceptos de Población y Muestra fueron estudiados en las Secciones 1. Para que una muestra sea aceptable. y también debe existir la posibilidad de medir la confiabilidad de las estimaciones obtenidas de la muestra (totales.). medidas u observaciones. Todo esto es objeto de estudio de la Teoría de Muestreo.5.6 Muestreo El Muestreo es el conjunto de procedimientos que nos permite diseñar la muestra más apropiada para un experimento o investigación.  Interpretar las estimaciones de manera precisa. TEMA 2 5. cuando medimos el peso de los habitantes de una comunidad.3 del Unidad I de la Unidad I. esta debe ser representativa de la población de la cual se obtuvo. Los objetivos del muestreo son:  Realizar estimaciones de valores de una población a partir de las medidas obtenidas de la muestra. A menos que se indique lo contrario. tenemos el conjunto de calificaciones obtenidas en una sección de estudiantes de la UBV que cursan Análisis del Dato Estadístico.2 y 1. Por ejemplo.  Calcular medidas de confiabilidad de esas estimaciones. Se aconseja el muestreo en los siguientes casos: 98 .interpretación se hace planteando la analogía o comparación entre ambos tipos de sucesos. las poblaciones a ser estudiadas aquí son finitas. A diferencia de las poblaciones finitas. Por ejemplo. garantizándose que la muestra seleccionada sea representativa de la población de origen para no tener que trabajar con la totalidad de esta y controlar los errores cometidos en su estudio. una población infinita contiene una infinidad de elementos. porcentajes. promedios. Una población es finita si consta de un número finito o fijo de elementos. etc. La muestra es representativa si posee todas las características de la población en la misma proporción en que se encuentran manifiestan en el seno de esta.

 Fácil verificación posterior en base al diseño utilizado.  Se requiere una alta preparación estadístico-matemática de muestrista.  En poblaciones muy homogéneas tales que la muestra represente con fidelidad a la población.  Más confiabilidad de los datos obtenidos en base a la posibilidad de controlar más fácilmente las informaciones recopiladas. el tipo de muestreo a desarrollar se clasifica en función de las características de la población y del criterio de selección previamente determinado en una investigación.  Más alcance en la investigación. tabulaciones o proyecciones con respecto a áreas o pequeños grupos.  Dificultad de la tabulación cruzada de algunas características.  Presenta el error de muestreo y otros ajenos a ese proceso. Algunas veces se hace uso de la Teoría Combinatoria para obtener determinado tipo de muestras. Enmarcado dentro del proceso del diseño. Las ventajas del muestreo son:  Economía y rapidez en su realización.6 Clasificación del Muestreo En Estadística.  Existe la creencia de que las investigaciones sobre la población ofrecen un margen más sólido y eficiente de exactitud que los resultados obtenidos de una muestra. Cuando la población es infinita o muy grande de tal forma que resulte muy difícil su enumeración total. antes de recopilar cualquier dato. Las limitaciones del muestreo son:  No permite hacer cálculos. 5.  Menos personal y recursos.  Ahorro de dinero si la muestra es representativa pues en tal caso no hay necesidad de trabajar con todos los elementos de la población. formación y control de personal.  Más entrenamiento. 1) Muestreo Probabilístico y no Probabilístico 99 .  Mayor rapidez de procesamiento y presentación de resultados. un Diseño de una Muestra es un plan definitivo determinado por completo. con el fin de tomar posteriormente una muestra de una población de referencia.  Cuando el proceso de investigación de las características de una población sea destructivo.

es decir. En términos de probabilidad. A menudo suele presentar grandes sesgos y por esa razón es poco fiable. Este tipo de muestreo no es probabilístico. Por lo tanto la población es agotable y por supuesto finita. Aleatorio Simple y Sistemático. Es decir. y se aplica para poblaciones que en la práctica se consideran infinitas o inagotables. la probabilidad que tiene cada elemento de la población de integrar esa muestra es M . y donde cada elemento de la población tiene la misma posibilidad de ser incluido en la muestra. si la población tiene N elementos y la muestra es de M elementos. de ser N el tamaño de la población. será 1/N la probabilidad de ser escogido cada elemento para formar parte de la muestra sin importar el tamaño de esta. Al contrario. Aquí cambia la probabilidad de selección de cada elemento que formará la muestra. N! M   maneras de obtener una muestra de tamaño M de una  N  3) Muestreo Aleatorio Simple Es un procedimiento de muestreo probabilístico mediante el cual extraemos de una población una muestra representativa de la misma. En cambio. el cual es mucho más confiable. 2) Muestreo con y sin Reemplazo Tenemos un Muestreo con Reemplazo cuando cada elemento de la población puede elegirse más de una vez.El Muestreo no Probabilístico es aquel donde la selección no se hace al azar sino el criterio del investigador. y la probabilidad de elegir así una muestra es = N! ⋅( M − N )! . Este tipo de muestreo es el más sencillo y usado. independientemente de la opinión del investigador. Esto ocurre cuando cada elemento seleccionado se vuelve a regresar a la población de la cual se extrajo después de anotar sus características en un instrumento al aplicarle alguna técnica de recolección de información. hay   M    N    −1 población de tamaño N. Para este caso. si la selección de los elementos de la muestra se realiza aleatoriamente. entonces se está haciendo un Muestreo Probabilístico o Aleatorio. En este caso. en una Muestra sin Reemplazo el elemento seleccionado para integrar la muestra deja de ser seleccionable al no poder elegirse más de una vez. A este tipo de muestreo se le suele llamar Irrestrictamente Aleatorio. 100 . N Un muestro probabilística o aleatorio puede ser sin Reemplazo. una vez extraído no se regresa a la población.

y siendo esa información importante para nuestra investigación. Esto último se hace a fin de disminuir la variabilidad de la población y de buscar mayor homogeneidad dentro de cada estrato. A veces este tipo de muestreo no es necesariamente aleatorio. Si el orden de los elementos es tal que los individuos próximos tienden a ser más semejantes que los alejados. 6) Muestreo por Conglomerados Se divide la población total en un número determinado de subdivisiones relativamente pequeñas y se seleccionar al azar algunos 101 . Ejemplo: Si en una población el 20% son mujeres y el 80% hombres. el muestreo sistemático tiende a ser más preciso que el aleatorio simple al cubrir más homogéneamente toda la población. se mantendrá la misma proporción en la muestra. Se elige un individuo al azar y a continuación se eligen todos los demás a intervalos constantes hasta completar la muestra. Esencialmente. podemos mejorar el muestreo aleatorio por medio de la estratificación. procedimiento que consiste en dividir a la población en una cantidad de sub-poblaciones o estratos que no se mezclen y en la que en cada uno sus elementos sean los más parecidos entre sí. y luego de hacer esa distribución se toma una muestra de cada estrato. el procedimiento completo (primero la estratificación y luego el muestreo aleatorio) se conoce como Muestreo Aleatorio Simple Estratificado. y que en cada uno de los estrato separados haya tanta homogeneidad como sea posible.4) Muestreo Sistemático Es cuando los elementos de la población están ordenados por listas. 5) Muestreo Estratificado Es cuando nos interesa que la muestra tenga la misma composición a la de la población cuando esta se divide en clases o estratos. el objetivo de la estratificación es formar estratos de tal forma que haya una relación entre un estrato particular y la respuesta que se busca en el estudio estadístico. Si para cada estrato se obtiene una muestra aleatoria simple. Si tenemos información acerca de la constitución o composición de una población. El verdadero riesgo del muestreo sistemático yace en la posible presencia de periodicidades ocultas y la obtención de resultados sesgados o parcializados.

102 . este también se llama Muestreo por Áreas.elementos de esas subdivisiones o conglomerados para incluirlos en la muestra general. Si los conglomerados son subdivisiones geográficas.

McGraw-Hill Interamericana. 2. McGraw-Hill Interamericana. Volumen I y II. SOTO. 7. 2. 12. 6.982. 2. 4. CENAMEC. R.004. Sociedad Fondo Editorial Dirección de 2.994. Caracas. Métodos de Graficación. Editorial Espasa-Calpe SA. México. México.999. 2. Caracas. 1. S.003. 3. LIND. Caracas.998. Elementos de Probabilidad. Apuntes de Estadística para Biólogos. México. 103 . Madrid. Editorial Prentice-Hall Hispanoamericana. G. J. Y SIMON. F. México.004. FREUND. G. Irwin MacGraw Hill. COMPLEMENTARIA 1.BIBLIOGRAFÍA BÁSICA 1. 1. 1. Estadística. 5. 2. Elementos de Demografía. Estadística Aplicada: Problemario. G. Ediciones de la Biblioteca de la Universidad Central de Venezuela. HAMDAM. N. 2. SPIEGEL. J. Publicaciones ULA.001. Probabilidad y Estadística. S. Probabilidad y Estadística. Editorial Erro.000. ANDERSON. International Thomson. P. 8. El proyecto de Investigación.. D. TAPINOS. ORTEGA.. ALSON.001. 1. Caracas. J. A. 2.998. Ediciones del Vicerrectorado Académico de la Universidad Central de Venezuela. 1. ARIAS. Métodos Estadísticos en Educación. 9. Caracas.994. W. Caracas. MASON. Estadística Elemental. Iniciación a la Estadística. Mérida. FUENLABRADA DE LA VEGA. Y MARSHALL. 11. 10. 1. Bogotá. SCHILLER Y SRINIVASAN. R. BAUCE. Editorial José Martí. D. SENIGNI. A.001. Estadística para Administración y Economía.

LINCOYÁN. Editora Principios. D.968.ine. 8. 1. CRÁMER.ve/ine/indexine. Métodos Estadísticos Aplicados a las Ciencias Sociales.966.ucv. M. G. Estadística General. Caracas. RIVAS. 1. GLASS. Madrid. McGraw-Hill Interamericana. Fondo Educativo 5.A. Fondo de Cultura Económica. y RAYMOND.bcv.html http://www. México. Editorial Prentice-Hall Internacional. California.eclac. 1. Introducción a la Estadística. Caracas.973. BLALOCK. Ediciones. E.968.net/cursecon/2/dem. Ediciones de la Biblioteca de la Universidad Central de Venezuela. VIRTUAL Adicionalmente a los libros antes mencionados. R. Bogotá.987. Ediciones de la Biblioteca de la Universidad Central de Venezuela.992. Estadística General. MENDENHALL. 1. Y STANLEY. Caracas. D. México. 1.cl/celade http://www. Análisis Estadístico para la Educación y las Ciencias Sociales.981.982. SALAMA. Probabilidad y Estadística. 1. A Y RICHARD.998.005). 1. WAYNE.eumed.ve http://www. 10. 4. 1. México.ucv.996. McGraw Interamericana.asp 104 .gov. Elementos de la Teoría de Probabilidades.euler.faces.974. R. Estadística: Metodología y aplicaciones. Madrid. MCCOLLOUGH. 1. J.ciens. http://www. 6.972. Introducción a la Probabilidad y la Estadística. Estadística con aplicaciones a las Ciencias Sociales y la Educación. HABER. se recomiendan las siguientes páginas web de Internet (año 2. 13. Wadsworth Internacional Iberoamericana. WALPOLE. Interamericano.htm http://www. México. S. 7. Aguilar 3. Estadística Social. H.ve http://www. C. GONZÁLEZ.2. O.org. 1. H.ve/gl-autor. 9. McGraw Hill Interamericana. 1. Introducción a la Geoestadística. 1. México. 11. McGraw Hill Interamericana. R. 12. W.

gov.es/111044/p104a.platino.htm 105 .http://www.uned.ve http://www.

Sign up to vote on this title
UsefulNot useful