Está en la página 1de 64
Introduccion a la estadistica EVOLUCION DE LA ESTADISTICA Desde los comienzos de la civilizacién han existide formas sencillas de estadisticas, pues ya se Utlizaban representaciones grificas y otros simbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nimero de personas, animales 0 ciertas cosas. Hacia el afi 3000 ann.e. los babilonios usaban ya pequefias tablllas de arcila para recopilar datos en tablas sobre la produccién agricola y de les géneros vendidos o cambiades mediante trueque. Los egipcios analizaban fos datos de la poblaciin y la renta del pais macho antes de construir las pirdmides en el siglo XXX ane. Los libros biblicos de nimeros y erénicas ineluyen, en algunas partes, trabajos de estadistica. El primero contiene dos censos dela poblacién de Israel y el segundo describe el bienestar material de las diversas tribus judias. El imperio romano fue el primer gobierno que recopilé una gran cantidad de datos sobre la poblacion, superficie y renta de todos los territorios bajo su control, Durante la Edad Media solo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la iglesia en los aftos 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg6 un censo. La informacion obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzé en Inglaterra a principios del siglo XVI, y en 1662 aparecié el primer estudio estadistico notable de poblacién, titulado Observations on the London Bills of Mortatity (Comentarios sobre las partidas de defuncién en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Bresiau, en Alemania, realizado en 1691, fue utilizado por el astrénomo ingles Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, los investigadores aceptaron la necesidad de reducir lainformacién avalores numérices para evitar la ambigiedad de las descripciones verbales. En nuestros dias, la estadistica se hha convertido en un método efectivo para describir con exactitud los valores de los datos economicos, politicos, sociales, psicolégicos, biolégicos y fisicos, ysirve como herramienta para relacionar y analizar dichos datos. E trabajo del experto estadlstico no consiste ya solo en reunir y tabular los datos, sino sobre todo et proceso de interpretacion de esa informacién. El desarrollo de la teoria de la probabilidad ha aumentado el alcance de las aplicaciones de la estadistica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilisticas; los resultados de estas se pueden utilizar para analizar datos estadisticos. La probabilidad es util para comprobar la fiabilidad de fas inferencias estadisticas y para predicar el tipo y la cantidad de datos necesarios en determinade estudio estadistico. Hoy en dia es importante para realizar el control de calidad de un producto, con respecto de su duracion, resistencias, ete. Lo cual va a permitir tomar una decision adecuada sobre la produccién. FUENTE: http/wewedim.uchile.cl/dodMA34B/historia.pdf Introduccion 4) “5 alaestadistica OBJETIVOS: + Conocer los métodos estadisticos y las caracteristicas de la poblacion o muestra. + Adquirir una visién descriptiva de una coleccién de datos organizados de acuerdo con un criterio determinado. + Interpretar correctamente la informacién estadistica proveniente de hechos reales. + Definir las principales medidas de tendencia central. 7 + Obtener conclusiones basadas en los datos experimentales y las medidas de tendencia central. + Conocer algunas medidas de dispersion. INTRODUCCION La estadistica se remonta a épocas muy antiguas y se caracteriza por encontrarse asociada a los censos poblacionales y registros de bienes y servicios de un determinado pueblo. El término estadistica se deriva del vocablo “Estado”, porque la funcién primordial de los estados 8 y ha sido llevar registros de poblacién, nacimientos, defunciones, impuestos, egresos, etc. En la Antigiedad, conforme la poblacién ha ido creciendo, resultaba casi imposible obtener informacién de cada persona, es por ello que surge la necesidad de buscar un método que nos ayude a realizar estimaciones de acuerdo con un conjunto de muestra, tomado de toda la poblacion. Es desde ahi que nace la estadistica. As{ por ejemplo, la cultura egipcia conté con recopilaciones regulares de datos de su administraci6n estatal e incluso diviniz6 a Saphkit, denominada la diosa de los libros y las cuentas; los romanos Hlevaban sus registros numéricos con fines tributarios, en el caso del imperio incaico llevaban registros de su poblacién y otras cuentas a través de los quipus, por medio de los quipus interpretados a través de los tiempos, conocemos la cantidad de habitantes que conformaban el imperio y cada uno de sus cuatro suyos; también se conoce la cantidad posible de alimentos que almacenaban en los tambos para épocas en las cuales habfa sequia. 655 Lumbreras Editores 2QUE ES LA ESTADISTICA? Se entiende por estadistica a un conjunto de datos, asi como se habla de estadistica de ingresantes a universidades, nivel de desempleo, crecimiento del PBI, etc. Es por ello que no existe una definicion especifica de estadistica, se dan varios conceptos, de los cuales mencionaremos algunos de ellos. * Disciplina relacionada con los métodos cientificos destinados a recopilar, organizar, clasificar, presentar, resumir y analizar los datos, tanto para la deduccién de conclusiones como para tomar decisiones. + Rama de la matemética encargada de recopilar, organizaryy procesar datos con el fin de inferir las caracteristicas de la poblacién objetivo. + Es la dencia que estudia cada fendmeno mediante la recoleccién de un gran ntimero de datos referentes al mismo, para su posterior tratamiento, con la finalidad de obtener conclusiones sobre aquel. + _ Eslaciencia que nos proporciona un conjunto de métodos y procedimientos para la recoleccion, clasificaci6n e interpretaci6n de datos en forma confiable para tomar una adecuada decision. Si bien es cierto, hay varios expertos para estadistica, todos coinciden en que se encarga de recopilar datos, analizar y brindar conclusiones con Ja finatidad de tomar decisiones. Podemos resumirlo en un grafico. [Tecectona recorila ESTADISTICA — DATOS para atm interpreta La estadistica es un potente auxiliar de muchas ciencias y actividades humanas, sociologia, sicologia, geografia humana, econémica, etc. Es una herramienta indispensable para la toma de decisiones. También es ampliarnente empleada para mostrar los aspectos cuantitativos de_una situaci6n muy particular. La estadistica esta relacionada con el estudio de procesos, cuyo resultado €s mas © menos imprescindible, y con la finalidad de obtener conclusiones para tomar decisiones razonables segiin lo observado, EI resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser de naturaleza cualitativa o cuantitativa y, en este Gltimo caso, disereta 0 continua. Son muchas las predicciones de tipo sociolégico 0 econémico que pueden hacerse a partir de la aplicacién exclusiva de razonamientos probabilisticos a conjuntos de datos objetivos como son, por ejemplo, los de naturaleza demogréfica. Las predicciones estadisticas dificilmente hacen referencia a sucesos concretos, pero describen con considerable precisién en el comportamiento global de grandes conjuntos de sucesos particulares. Son predicciones que, en general, no acostumbran resultar titles para saber quién de entre los miembros de una poblacién importante va a encontrar trabajo 6 a quedarse sin él; 0 en ‘cuales miembros va a verse aumentada o disminuida una familia concreta en los préximos meses. En cambio, puede proporcionar estimaciones fiables del proximo aumento o disminuci6n de la taza de desempleo referido al conjunto de la poblacién o de la posible variacién de los indices de natalidad 0 mortalidad. 656 Introduccién a la estadistica MESTADISTICA DESCRIPTIVA Es la que se encarga de recopilar, clasificar, presentar, analizar e interpretar un-conjunto de datos. Ejemplos 1. Elgerente de un bazar mensualmente realiza un balance de los ingresos que obtiene. En los meses de junio, julio, agosto y setiembre obtuvo $/.1300; $/.1000; §/.1200; $/:1300, respectivamente. El gerente desea conocer e! fromeiio mens desu ingresosgutenidoe 1300+ 1000+ 1200+ 1300 57.1200) Se realiza un estudio de mercado en el sector del cono norte de Lima a pedido de un cliente, cuyo objetivo es poner un negocio. Se entrevistaron a 200 personas y pudo obtenerse los siguientes resultados a Ja pregunta: "cQué cree que hace falta en este sector, en cuanto a servicios?" Servicios _| N° personas Farmacia 80 Minimercado 92 Discoteca 12 Otros 16. Un ama de casa durante sus seis dltimas compras leva un control sobre fa duracién de su balon de gas; como se muestra en el cuadro siguiente: MLA erase || 0 | 2 | w=] a Rede ae Con lo cual podria decir que el balén de gas dura en promedio 28 dias ya que 28+26-+ 304324 28+24 6 28 ESTADISTICA INFERENCIAL Uamada también inductiva o de pronéstico, Ja cual nos proporciona la teoria necesaria para inferir o estimar la generalizacién 0 toma de decisiones sobre la base de una informacién parcial mediante técnicas descriptivas. Elemplos i: Consideremos el ejemplo anterior, en que el gerente desea predecir su ingreso mensual para el mes de octubre, EI proceso de estimar es de estadistica inferencial. Se podria predecir que su ingreso mensual en octubre seré alrededor de §/.1200, cabe sefalar que todo proceso de prediccién esté afectado por un determinado error; denominado error de estimacion cuando dicho error sea més pequefo 0 cercano al valor real significara que la muestra con la que se ha trabajado ha sido adecuada. Como otro ejemplo podriamos mencionar que en épocas de elecciones muchas compajias de estudio de mercado lanzan sus predicciones sobre qué candidato y con qué tanto por ciento de aceptacién serd el candidato con la mayor posibilidad de ganar; puede ser que todas estas compafias coincidan en el primer lugar; pero va a ser mas confiable aquella que haya tenido el mayor acercamiento, es decir, el menor margen de error en el proceso de prediccién. Por lo tanto, ello significaré que la muestra con la que han trabajado es lo mas representaliva posible ya que ha reflejado de manera més proxima la intencién de voto de los electores. 657 Lumbreras Editores CONCEPTOS DE TERMINOS USADOS EN ESTADISTICA POBLACION Es el conjunto universal del cual se van a ‘obtener datos, Son los objetos u observaciones que presentan en comin una determinada caracteristica particular a ser analizada de lo cual se desea informacién. Efemplo Los alumnos que cursan el 5" afio de educacién secundaria en Lima metropolitana. Es un subconjunto de la poblacién, una muestra debe ser representativa de tal manera que se puede hacer deducciones de ella respecto de la poblacién completa. Ejempio Los alumnos de colegio Bertolt Brecht que cursan el S® afio de educacién secundaria VARIABLE Una variable estadistica es una caracteristica dela poblacién que interesa al investigadory que puede tomar diferentes valores. Las variables se lasifican de la siguiente manera. Variable cualitativa Son aquellas que estén asociadas con una caracteristica cualitativa, es decir, son variables cuyos valores son cualidades, propiedades o atributos que presenta la poblacin y que son objeto de estudio. A su vez esta variable se puede clasificar en lo siguiente: Variable cualitativa nominal Son aquellas que surgen cuando se define la categoria y no lleva ninguna ordenaci6n las posibles modalidades. Es decir, no existe una 658 jerarquia: todos se consideran en un mismo nivel Ejemplo Variable Dominio de la variable Profesion que Ingenieria desean estudiar | Medicina al terminar 5° Derecho y ciencias afiodeeducacion | politicas secundaria. Variable cualitativa ordinal Es cuando el investigador no solo busca un nivel de clasificacién, sino también busca ordenar sus casos en términos del grado que poseen una determinada caracteristica. Por 1o general en este caso existe una jerarquia. Ejemplos Variable Dominio de la variable Nivel Bajo socioeconémico | Medio Alto Variable Dominio de ka variable Nivel de Primaria educacién Secundaria alcanzado Superior incompleta Superior completa Maestria Doctorado Variable cuantitativa ‘Se llama asi cuando la variable est4 asociada_ con una caracteristica cuantilativa, es decir, que se obtiene como resultado de mediciones © conteos. A su vez la variable cuantitativa se clasifica en lo siguiente: CAPITULO XVII ala estadistica Variable cuantitativa discreta Son aquellas que se obtienen por el procedimiento de conteo (necesariamente son valores enteros no negativos). Variable cuantitativa continua Son aquellas que se obtienen por el procedimiento de una medicién (pueden tomar valores no necesariamente enteros). Variable Dominio de la variable Peso S2kg S7.2kg 61,3 kg 64kg DATO Representa el valor o respuesta que adquiere la variable en cada unidad de andlisis. Asimismo, es el resultado de la observacién, entrevista © recopilaci6n en general. Los datos son la materia prima de la estatistica elemento ptimario de toda observacién o busqueda. (cuantitativo) 0 por una palabra (ct pero ademas el dato tiene una significado més alla que de! simple valor estadistico. itativo), + Eldato tiene naturaleza, que es la unidad de medida. Introducci + Tiene contexto, porque pertenece a una realidad + Tiene historia, antecedentes, causas, etc. ‘+ Significado o valor frente a una realidad. + Perspectiva o comportamiento futuro. + Puede ser interpretado con un significado dentro de una teoria, objetivos, etc. Ejemplo Aqui se detallan los 3 elementos basicos y puede apreciarse que cada categoria de las seis variables tienen su cédigo. Muestra: Padres de familia del C.E. 1775 Unidad de analisis: Padre de familia Variables: 3. superior Tenencia de vivienda: 1. alquilada 2 propia 3. otra Namero de hijos: ©. sinhijos 1 1a3 2 4amas Tipo de trabajo 1. dependiente 2. independiente 659 Aritmética El objetivo de la investigacin estadistica es descubrir respuestas a determinadas interrogantes a través de la aplicacién de procedimientos cientificos, El punto de partida de la investigacién es la existencia de un problema que habré que definir, examinar, valorary analizar criticamente, para poder luego formulary entender su solucién. La investigaci6n es un proceso de produccién de conocimientos cientificos; es un proceso sistematico a través del cual se recogen datos e informacién de la realidad objetiva para dar respuesta a las interrogantes que se plantean. No hay investigacién grande © pequefa, simplemente investigar es buscar respuestas para plantear soluciones. Cuando se aplica el método cientifico al estudio de los problemas econémicos se habla de investigacin econémica, asimismo se tiene investigaciGn educativa, investigacion agropecuaria, etc. Toda investigacién requiere de datos, sin datos no hay investigacién, entonces surgelanecesidad de definirmétodosdeandli tratamiento de datos, con el propésito de obtener algunas medidas 0 indicadores que expresan la dimensi6n o niveles de las variables estudiadas, es decir, realizar la operacionalizacién de las variables; en este contexto, la estadistica surge como ciencia auxiliar de la investigacién, que por su naturaieza, estructura y métodos, en este Proceso, el andlisis estadistico también cumple con los diversos pasos de toda investigacién. En este contexto, se hablard de investigacién estadistica aplicada, orientada al anélisis estadistico de los fenémenos sociales, econémicos y demogréficos, dentro de los tres objetivos de la estadistica, como sondeseripcién, analisis experimental y prediccién. 660 ETAPAS DE LA INVESTIGACION ESTADISTICA Lainvestigacion estadisticaporsunaturaleza es en su primera etapa de tipo descriptiva, se preocupa de la confiabilidad, validez y significacién de los datos, de las muestras, asi como de los métodos y técnicas de recoleccién yanélisis estadisticos. Es importante distinguir entre investigacién estadistica yla estadistica como técnica o ciencia auxiliar para la investigacién cientifica, social, educativa, econémica, etc. La investigacion social, econémica © de otro tipo, estudia et fenémeno en su totalidad, dentro de un marco te6ricoy conceptual con el propésitode contribuir al conacimiento cientifico; por ejemplo hay que distinguir entre hecho estadistico y hecho social, econémico, educative, etc. La investigacion estadistica se preocupa fundamentalmente de Ja dimensi6n y Ia relacidn de los elementos que caracterizan al fenémeno en estudio. La investigacién estadistica es un proceso donde se distinguen cinco etapas. Pianeamiento o preparacion Se tendran en cuenta los siguientes aspectos. 1. Fundamentaci6n y comprensién del estudio € identificacién de las variables. 2. Determinacién de objetivos. 3. Organizacién de las variables, precision de los datos e informacién requerida. Recopllacién de los datos o recoleccion de datos La recopilacion © recoleccién de datos es el momento en el cual el investigador se pone en contacto con los objetos 0 elementos sometidos a estudio, con el propésito de obtener los datos o respuestas a las variables analizadas. Los métodos de recolecci6n son diversos CAPITULO XVII Introduccion a la estadistica y dependen de las posibilidades de acceso © contacto con los elementos investigados, del tamafio de la poblacién 0 muestra de la ‘oportunidad de obtener datos y del presupuesto y de las exigencias de! tiempo, dentro de ellos tenemos la entrevista, el censo, la encuesta, etc Organizacién y presentacién de datos Después de la recopilacién de los datos, se procede a su organizacién, clasificacién y tabulacién, de modo que se facilite la Presentacién en tablas, cuadros o graficos. Como tarea previa a la organizacién es indispensable realizar una evaluacién, critica, conteccién y ajuste de los datos, el propésito es superar las omisiones, inconsistenciasy desechar las respuestas no significativas 0 erréneas que puedan afectar luego en el andlisis de manera significativa. Realizadas las correcciones 0 ajustes, se procede a la clasificacién o establecimiento de categorias o intervalos, para la agrupaci6n de los datos. Finalmente, se procede a la tabulacién 0 procesamiento de los datos. El avance tecnolégico permite hoy en dia que medios mecanicos como la computadora permitan manipular los datos de una manera més rdpida, inclusive hay paquetes estadisticos Goftware) que permiten realizar un estudio bastante rapido de las variables a investigar, asi como la elaboracién de diagramas y cuadros, y en algunos casos hasta ciertas conclusiones del andlisis de las muestras correspondientes. Los cuadros y tablas estadisticos, como primera fase de la reduccién de datos, facilita el calculd de los indicadores (porcentajes, promedios, proporciones, indices, tasas, etc,) con los cuales se inicia la descripcién, andlisis € interpretacién de los datos, variables e informacién estadistica. Analisis ¢ interpretacion de los datos En esta etapa se aplican los argumentos mateméticos y teéricos de la estadistica. A través de métodos estadisticos se calculan indicadores umedidas de resumen, se establecen relaciones entre variables, se estiman valores, se ejecutan pruebas estadisticas, etc. como elementos de referencia para la descripcién, andlisis °e interpretacién de! comportamiento de los datos, Losmétodosde anélisis dedatosestadisticos son numerosos y pueden consistir en una simple observaci6n, hasta recurrir a métodos més elaborados 0 sofisticados matematicamente. Es importante destacar que al estadista le corresponde fundamentalmente, proporcionar indicadores, modelos estadisticos, informacion estadistica de un determinado fenémeno para el desarrollo de las investigaciones en general. Formulacién de conclusiones y Preparacién del informe En toda investigacion debe analizarse el cumplimiento de los objetivos, en funcién de los resultados fundamentales. Esta contrastacion permite elaborar un resumen de los aspectos sustantivos, que Iuego se expresarén en forma de conclusiones y sugerencias orientadoras en Ja toma de decisiones. Estos informes estarin acompahados de cuadros y gréficos con su debida interpretacién, de tal manera que permita una visién real del problema en concreto, ademds de establecer un andlisis, deben también de sugerir altemativas de solucién que permitan posteriormente tomar una decisién adecuada. Ejemplo Informe de la venta de cuadernos en el 661 Lumbreras Editores Aritmética RECOLECCION DE DATOS El trabajo de recoleccién de datos se puede realizar mediante dos modalidades 1. La kécnica de investigacién documental 0 bibliografica. La técnica del trabajo de campo. Por su parte, el trabajo de campo puede realizarse de dos maneras. a. La observacién y la exploracién en el terreno, que consiste en el contacto directo del investigador con el objeto de estudio. b. La encuesta y la entrevista, que é consisten en el acopio de testimonios orales y escritos dle personas vivas. TECNICAS DE RECOLECCION DE DATOS Como ya mencionamos anteriormente el uso de tales técnicas depende de muchos aspectos por lo que a continuacién detallamos las siguientes técnicas més frecuentes: La observacion La observacion en el proceso de investigacién es la accién de mirar con rigor, en forma sistematica y profunda, con el interés, de describir la imporiancia de atyuello que se observa. La observacin es el método basico que Se utiliza para adquirir informacién acerca del mundo que nos rodea, y por lo tanto, constituye la técnica primordial de la investigacién cientifica. Técnica documental La técnica documental es un tipo de observacién que recopila 0 busca sus datos en documentos, fuentes escritas 0 graficas de todo tipo. Entre ellos tenemos 662 1. Documentos académicos. Constituidos por la bibliografia mas importante para conocer el estado del conocimiento de una ciencia. 2. Actas e informes. Donde las actas son documentos que recogen lo ocurrido en el momento mismo en que esta pasando; en tanto que los informes son documentos escritos después de ocurrido el acontecimiento, 3. Documentos personales. Como las autobiografias, diarios, cartas, historias de vidas y estudios de casos. 4. fotografias, planos, videos, etc. Entrevista Laentrevistaes una situaciondeinterrelacion © didlogo entre personas, es una técnica donde una persona llamada entrevistador, encuestador ‘© empadronador solicita al entrevistado, le Proporcione algunos datos o informacién. La entrevista es un didlogo intencionado entre personas. El éxito de la entrevista como técnica de recoleccién depende de la eficiencia de! trabajo del entrevistador y de las preguntas adecuadas que haya considerado para el estudio o investigacién. Cuestionario Elcuestionarioesun instrumentoconstituido Por un conjunto de preguntas sistematicamente elaboradas, que se formulan al encuestado © entrevistado, con el propésito de obtener los datos de las variables consideradas en el estudio. Cuando las preguntas se organizan y se imprimen, se obtiene el formulario cédula, que es el instrumento que se utiliza para registrar las respuestas o datos. Posteriormente este sera utilizado para el almacenamiento de los datos enun medio mecénico. CAPITULO XVII Introduccién a la estadistica 2C6mo se prepara un cuestionario? La preparacién y presentacién del cuestionario suponen elaborar el formulario, que es el disefio de los documentos donde se registran los datos referentes a la unidad de investigacién; ademds, que permite obtener los datos para lenar los cuadros estadisticos establecidos. Su preparacién se efectia durante la fase del planeamiento de la encuesta, después de que estaban definidos aquellos aspectos que son fundamentales para conseguir informacién de buena calidad y facil de procesar. Sobre las formas y clases de preguntas tendremos las siguientes: Preguntas abfertas Llamadas ilimitadas, son aquellas que el investigado responde con su propio vecabulario, sin que se le ponga alguna alteativa, conjunto de palabras o frases. Ejemplos 1. Describa brevemente las tareas que realiza en el cargo que ocupa. 2 Anote a temética de las revislas especializadas que usted conoce. 3. cCudles son los cursos que mas le agradan? 4. iQué programas de television suele ver? 5. iQué actividades realiza los fines de semana? 4 6 (Qué obras ha leido en los iiltimos seis meses? 7. iQué opinién le merece ia politica del actual gobierno? 8. éQué opina del TLC? Preguntas cerradas dicotomicas ‘Aquellas que solo pueden responderse por un SI 0 NO, © simplemente cuando solo presentan dos alternativas. Ejemplos + Sabe leer? sO) noc) + Sexo masculine ( ) femenino( ) + Trabaja actualmente? sic) noc ) + dEsta Ud. de acuerdo con el aborto? si) Not) + Ha viajado al extranjero? sic) No( ) + ita postulado alguna vez? siQ) NOC) + Nacionalidad Peruana ( ) extranjera( + {Cuenta en su domicilio con el servicio de tenet? . sic) noc) + {Cree que hemos mejorado econémicamente? sO) NOC) Preguntas cerradas de eleccion multiple Son aquellas que proponen un conjunto de allernativas en la respuesta. Ejemplos 1. Categorfa docente Principal Ou ‘Asociado C2 Auxiiar O38 Jefedeprictica (4 2. Edad Menores de 20ahos ( 1 De 20 2 29 afios C2 De 30a 39 afios C3 De 40a 49 afos C4 Desdahosymés (5 3. ZA qué se debe que seamos un pais poco desarrollado? 1.( ) Poco esfuerzo de sus habitantes 2(_ ) Dominio de los pases desarrollados 3(_) Fita de conocimientos y teenologia 4.(_) Errores de los gobemantes 5() Herencia colonial 6( ) Otres 663 Lumbreras Editores 4. iQué cosa buena para el pais quisieras que ocurra en el siguiente ano? 1.) Més inversion y trabajo. 2.( ) Menos pobreza 3.(_) Mens corrupcién y delincuencia 4(_) Aumento de salarios 5.() Mejora de la educacion Preguntas literales Son preguntas abiertas cuyas respuestas se expresan con una palabra 0 cantidad. Fjemplos + dul es su estado civil? + Cudl es su ocupacién actual? * Cudl es su ingreso total? * Lugar de nacimiento * — éCudntos hijos tiene? + Qué grado de instruccién tiene? + Acuanto asciende su gasto diario? Preguntas con respuesta en grados de intensidad Cuyas respuestas indican un grado de intensidad dentro de una escala creciente o decreciente, ascendente o descendente. Ejemplos 1.__Lagestién del rector de la universidad es Muy buena ( ) Buena( ) Regular( ) Maia) Noopina( ) 2, éEsté usted de acuerdo con la politica econémica del gobierno? Muy de acuerdo ( ) De acuerdo ( ) Endesacuerdo( ) No responce ( ) 3. éQué le parece el servicio que se brinda? Muy bueno () Bueno( ) Aritmética Regular( ) Malo) No sabe no opina ( ) 4. éCémo calificaria la situacién econémica en nuestro pais? Muy bueno ( ) Bueno ( ) Regular( ) Malo ( ) Nosabe no opina( ) La encuesta o investigacién estadistica es una técnica de recoleccién de datos, donde se obliene la informacién tal como se necesita, Preparada exprofesamente _y con objetivos estadisticos. Permite observar y registrar caracteristicas en las unidades de analisis de una determinada poblacion o muestra, detimitada en el tiempoy enel espacio. En toda encuesta se hace uso de un cuestionario, cuyas respuestas se registran en el formulario 0 cédula Cuando una encuesta esta dirigida a ta tolalidad de elementos de yna poblacién, se llama censo; en tanto, cuando esta dirigida @ una parte representativa, (muestra de una poblacién) se lama encuesta por muestreo Hay cuatro maneras de obtener los datos y Ja informacién con la técnica de la encuesta. 1, Con una entrevista 0 ‘didlogo con el encuestado basado en un cuestionario. 2. Por empadronamiento, donde el empadronador pregunta o encuesta al empacronado y registra los datos en el formulario, 3. Porcorreo, cuando se envian los formularios or correo al domicilio del empadronado 0 unidad de andlisis. 4. Por teléfono o fax, cuando las preguntas se formulan telef6nicamente. ‘Veamos un ejemplo de encuesta CAPITULO XVII Introducci6n a la estadistica Estudio: PERFIL SOCIO ECONOMICO Y ACADEMICO_ DEL ESTUDIANTE UNIVERSITARIO Esta encuesta es ESTRICTAMENTE CONFIDENCIAL, tiene como finalidad recolectar datos sobre aspectos socio econémicos, familiares y académicos del estudiante, a fin de disponer de un marco de referencia, por tanto, agradecemos responder con, Ja mayor sinceridad y seriedad. Coloque una “x” en el paréntesis de su respuesta. CODIGO © MATRICULA ARO o aCLO: Expeciaitads F Ao muologg a I 1_DATOS GENERALES LL. SEXO: 12. EDADenafos: | 7 1.3. dn qué distrito vive o reside Hombre (0 Fecha de nae ‘actuaimente? Mvier ©) rs fos] % gan paged 1.4, LUGAR DE NACIMIENTO: 15, ESTADO GIL: Provincia: Sottero 9 Casado Departamento: Vado Divorciado () Distrito: Conviviente_() __ Separado_() Il__ANTECEDENTES EDUCATIVOS DE LA SECUNDARIA 21. dEn qué colegio terminé la educacion secundaria? | 22 aDeénde esta ubicado su colegio? Estatal Noestatal ( ) Distrito: Provincia: 23. dOudndo (fecha) terminé la educacién secundaria? 2.4. éQué ano de estudio repitié alguna vez? 200+ 0) 4) 9) 25, Indique las Sasignaturas que maste agradaban durante | 2.6. Qué asignaluras desaprobo alguna ver en fa secundasia, secundaria? LCF 1 2 nate Rie. 2 a C6.56 s 21. Gas Ud. sigulendotn profesion que penstestuda® SIG), NOC) iQue camera profesional le gustaria equi? athile yi«- I. ANTECEDENTES ECONOMICOS DEL ESTUDIANTE. 4, Gabaja actualmente en algo? 3.2. {Qué hace 0 qué cargo desempera? siC) noe4 Z le? 33. Si Wabsje, den cuéntos délares estima sus ingresos | 3A. Sino wabsja, de quién depende econdmicamerte? mensuales? (D1 menos de 50 (92 deSta 100 ms = (3 detolatso (94 de 151 a200 = en oer pane (OS de 201.0300 (_)6 mas de 300 es Lumbreras Editores i {V._ASPECTOS ACADEMICOS UNIVERSITARIOS 411. {Cuindo posto por primera vez a ana universidad?™ 2008 43. En qué asignaturas 0 casos eth raliculado actualmente? ‘ 1b 2 ew. rate Aritmetica “42, (Rabndo igresb por primera vez a esta universidad? 2010 7A, IQue asignaluras de semesines © alos anteriores fe {ata aprobar? 45. din qué cido 0 afwo de studios esd matiicuado ee 46, Ales, cuinto estirta quegasta en Derecho de ensenanza Sl. 9 25 Material de ensefanza §), 22° Pasojes,rfrigenis, etc §). {5° Total PS ‘AT. Ha seguido otra profesion? SiC) No ‘48 fey 606 Superior completa Oe 5. 401-800 0) CB 6 501-600 com Cy 7. més de 600 aS or 55, Actividad econdmica de sus padres 5.6. La casa: vive actualmente es Padre Madre Aiquitada Compra venta ( ) IC } Comercio ambulatorio (1 Propia () 2) Obxero C2 Sf) Empleado puiblico 5:7. Su familias tiene 4) Empleado privado OM Videograbadora () 5{_) Empresa propia Os Auloménil Owe, he 6{_) Profesional independiente ( 6 Maquina de escribir ( } ; 7() Agricultor cy Computadora = () L SAK B( )Tabajadorevenmuat (8 lnternet oO ; OBSERVACIONES Y¥ COMENTARIOS: Fecha Responsable: 666 CAPITULO XVII Introduccién a la estadistica ORGANIZACION Y PRESENTACION DE DATOS Cuando se realiza la recopilacion de antecedentes con fines estadisticos, se obtiene tuna gran cantidad de datos, algunas veces estos estan en su forma natural o empirica (fuentes primarias) y otras ya estén organizadas en tablas, cuadros y grdficos (fuentes secundarias). Los datos pueden estar incompletos, incorrectos, desordenados, pero en todos los casos constituyen los datos basicos para iniciar un estudio, conocer y analizar el comportamiento Y las caracteristicas de los elementos de una poblacién. Eneltrabajoestadistico, siempre sedisponen de muchos datos que, definitivamente tienen que ser clasificados, ordenados y presentados adecuadamente, de tal manera que facilite la comprensién, la descripcién y el andlisis del fenémeno estudiado y obtener conclusiones validas para la toma de decisiones. Supongamos que interesa analizar las caracteristicas socio econémicos de la mano de obra ocupada en la industria textil. En primer lugar, hay que conseguir una lista completa de las fabricas 0 empresas. De este modo queda determinada la fuente de datos (empresas textiles), identificadas las unidades de andlisis (wabajadores) y el tamafo de la poblacién. A continuacién se definen las variables y se construye el cuestionario, luego mediante una encuesta 0 un formulario se recopilan los datos que inleresa sobre las caracteristicas socio econémico (variables) de cada trabajador. En el trabajo estadistico, lo que se tiene disponible en un primer momento es un material numérico, producto de la observacion © recopilacién de datos, que son categorizados, ordenados, procesados y presentados en ‘cuadros 0 grificos. Hay un proceso de resumen estadistico que se concreta con el célculo de indicadores. Haydos formas de presentarordenadamente los datos estadisticos 1. En forma tabular, como son los cuadros y tablas estadisticas. 2. Mediante graficos y diagramas. Fundamentalmente se usa la forma tabular, los graficos se utiizan complementariamente para ilustrar mediante figuras el comportamiento de las variables y facilitar la comprensi6n de los fenémenos estudiados. CUADRO ESTaDisTICO En general un cuadro estadistico completo consta de 8 partes. Namero del cuadro Es el cédigo 0 elemento de identificacién que permite ubicar el cuadro en el interior de un documento. El niimero se anota junto con la palabra cuadro. Tituto Es Ja descripcion resumida del contenido del cuadro. La redaccién del titulo debe ser breve, clara y completa, de modo que se puede deducir sin ambiguedad qué tipo de informacién contiene el cuadro. Un titulo completo debe indicar Qué "Qué hay en el cuadro" se refiere al hecho observado o la caracteristica principal. Por ejemplo; Viviendas _particulares, poblacién econémicamente activa de 15 anos y més, indicadores econémicos, alumnos matriculados, etc, 667 Lumbreras Editores Aritmética Donde Se refiere al lugar geografico 0 institucién a la que corresponde la informacién. Por ejemplo: Del Pera, del departamento de Tacna; de América, de la empresa textil Cahuide S.A., de la ciudad de Trujillo, del sector minero, etc. ‘Como Come estén ordenados o clasificados los datos en el cuadro. La variable ubicada en la fila se identifica con la preposicién “por” y la que esté en la columna que se le antepone “segéin”. Por ejemplo, por material predominante en las paredes exteriores segin regi6n natural y 4rea; por nivel educativo segtin ramas de actividad, por fuentes de financiamiento seguin programas; por sexo segin estado civil, etc. Cuando ‘A qué momento o periodo de tiempo esta referida la informacién, puede ser un momento especifico 0 puntual, como también un periodo de varios afios, meses 0 semanas, etc. Por ejemplo: Censo de poblacién del 11 de julio de 1993, aho 1985, ejercicio 1987, periodo 1980-1995, etc. CUADRO 1 POBLACION ECONOMICAMENTE ACTIVA DE 15 Y MAS ANOS DE LA REGION LORETO POR NIVEL DE EDUCACION ALCANZADO SEGUN PROVINCIAS, CENSOS DE POBLACION DE 1993. TOTAL 1/ 141750 100,0 75 44,1 32,4 160 Maynas 78890 100,0 52 360 38,1 207 ‘A. Amazonas 22508 100,0 13,5 522 243 10,0 Loreto 11038 100,0 12,5 60,5 19,7 73 M.Ramén Castilla 6564 100.0 1490 538 235 a7 Requena 11828-| 1000 72 585 255 88 Ucayali 10922 1000 44 59,7 271 88 11 Exciuye alos que no especificaron nivel de educacion, 2/Se refiere a algin grado 0 fo de estudio. Fuente: INEI. Censos Nacionales de 1983. ‘laboracién: Estudios y Ediciones RA. Diciembre 1994. Efempto (Ver cuadro 2) Qué —_: viviendas particulares Cémo = por tipo de abastecimiento de agua segtn provincias Cuando : Censo de poblacién de 1993 CAPITULO XVII ala estadistica Concepto o encabezamiento Es la descripci6n de fas filas y columnas de un cuadro estadistico, el encabezamiento se ubica enla parte superior del cuerpo del cuadro. Indica las variables y sus Categorias 0 intervalos, también puede indicar un periodo de tiempo. Numero de cuadro: CUADRO2 DEPARTAMENTO DE AREQUIPA. VIVIENDAS PARTICULARES a/ POR TIPO DE — ABASTECIMIENTO DE AGUA, SEGUN PROVINCIAS, CENSO 1993 Unidad de medicién: (valores porcentuales) Encabezamiento ‘o conceptos Cuerpo Neetdeper a Vivienda pantcular, ¢s aquella destinada a servir de alojamiento a uno 0 mas hogares. Fuente: INE. Censos nacionales de 199%. resultados definitivos. Departamentos de Arequipa. Tomo Il Elaboraci6n: Estudios y Ediciones CV. Por ejemplo en el cuadro 2, los conceptos se refieren al tipo de abastecimiento clasificada en seis categorias (red publica, pilos, camién, cisterna, rio 0 acequia, otro) y las provincias clasificadas en seis categorias. En tanto que en el cuadro 3 referido a las mujeres en edad fértil del Paraguay, el nimero de hijos tiene 5 categorias, y los métocios anticonceptivos 2 categorias (modernos y tradicionales) y estas se subdividen en 6 y 4 categorias, respectivarnente, Cuerpo del cuadro Es el contenido numérico del cuadro. Es la parte donde se colocan los datos correspondientes a las caracteristicas 0 variables indicados en el encabezamiento 0 en los conceptos, es decir, presenta la distribucién de los elementos segtin la clasificacién en categorias de las variables. Esrecomendable colocat las cifras de los grandes totales en forma horizontal y en a parte superior del cuerpo del cuadro. Nota de pie de paginas o Hamadas Se usa para aclarar algunos términos o siglas, y también para indicar qué elementos estén o no incluidos en algunos de los conceptos del cuadro. 669 Lumbreras Editores Aritmética Fuente Es la indicaci6n al pie del cuadro, que sirve para nombrar la publicacién, entidad, estudio o fuente de donde se obtuvieron los datos utilizados, La identificacién de la fuente permite, si fuera el caso, comprobar la informacion o para obtener informacin complementaria. Nota de unidad de medida Se escribe debajo del titulo original, se usa cuando se abrevia la escritura de las cifras y para expresar en qué unidades esta expresada la variable. Elaboracion Es una indicacin que se coloca debajo de la fuente, y sirve para mencionar el responsable, que ufiizando datos originales o de la fuente, elaboré el cuadiro estadistico final, indica la responsabilidad de la poblacién del cuadro. A veces resulta ttl indicar la fecha de elaboracién. Ejemplo Néimero de cuadro: CUADRO 3 PREVALENCIA DEL USO DE METODOS ANTICONCEPTIVOS EN anid 6 PAISES LATINOAMERICANOS Bolivia | Colombla | Brasil | Ecuador | Paraguay | Pert: Encabezamiento Neo zentindn, 1994 | 1995 | 1996 | 1994 | 1995-1996 | 1996 \USAN 45,3 722 49.2 498 64 'METODOS MODERNOS: WW 593, 457 as 33 Pldera 28 129 m2] 135] 62 bw at i is 76| 120 Esteril. Femenina 46 25,7 98 68 95 Vasectomia 00 Or a 00 02 Inyeccion: 08 43 26 65 80 Condén 13 25 Os 62 44 seh Met Vaginales o1 14 06 07} 07 Norplant 09 o7 a1 oo| a3 werovostmbicionaes | 276 129 as as| 2a Ritmo 20 52 16 er | 180 Retiro: Ww 59 35 33 32 Usanyuyos hierbes) | 39 18 ao s2z| 16 NOUSN siz; m8 a2] ai| aso Ne de casos saa | esor | re] 916 | 4506 | 6885 ites Incluye 30:02 y 31% del método Bilings Fuente: Encuesta nacional de demografia y salud, 1994. Bolivia. Encuesta nacional de demografia y salud, 1995, Colombia. Fuente: Pesquisa nacional sobre demografia e Saude, 1996, Brasil. Encuesta demografiay salud materna e infantil, 1954. Ecuador. Encuesta demografia y salu familiar, 1996. Pert. Encuesta nacional de demogralia y salud reproductiva, Paraguay, 1995-1996 670 CAPITULO XVII TABLAS ESTADISTICAS Las tablas de frecuencia 0 de distribucién son tablas de trabajo estadistico, que presentan la distribucién de un conjunto de elementos agrupados o clasificados en las diversas categorias de la variable, En estas tablas, como producto de la operacién de tabulacién, se observa cudntos elementos (frecuencias © repeticién) hay en cada categoria, valor © intervalo de la variable. La tabla de frecuencia constituye Ja agrupacion de elementos que tienen caracteristicas comunes. Estas tablas presentan diversos tipos de frecuencia (absolutas, relativas ‘oacumuladas) ‘Tablas para variables cuantitativas Realizadas las observaciones 0 recopilacion de datos, denotaremos la variable por X y los datos originales por X;;X2iXxi-iX, donde X, representa la i-ésima observacién de la variable |. Es decir, que X, =dato de la primera observaci6n X,= dato de la segunda observacion X= dato de la tercera observacion X, = dato de la n-ésima observacin En este caso, el subindice / es un némero entero, que expresa el orden de la observacién. Asimismo, diremos que este conjunto de n observaciones constituye una muestra de tamanion. No olvidemos que habra tantos valores de X como elementos tengan la poblacién o muestra. SisetieneX;; Xp; Xs; X4; Xs; Xeobservaciones, entonces n=6 constituye el numero de ‘observaciones realizadas, es decir, la muestra tiene 6 elementos, En general, para construir una tabla de frecuencia, se requiere realizar dos operaciones. Introducci6n a la estadistica Clasificacion Consiste en determinar las categorias, los distintos valores que toman las variables 0 los intervalos de clase. Tabulactén Consiste en distribuir los elementos de la poblacién en la respectiva categoria o intervalo. Aqui se contabiliza cuantos elementos hay en cada categoria, es decir, determinar cudntas veces se repite (frecuencia) cada valor. Tablas de frecuencia de variable discretas Ejemplo En la siguiente muestra de 20 pequefias empre- as, se considera el ntimero de trabajadores por empresa. 6; 6; 4; 4; 3; 3; 4; 4; 5; 5; 4; 5; 6; 2; 4; 3; 4; 6; 5; 3 Con estos datos, determine la distribucién (tabla de frecuencia) de las empresas segtin el ntimero de trabajadores. : Resolucion Aqui los tres elementos basicos serén Poblacion o muestra: 20 empresas (n= 20) Variable: X=ntimero de trabajadores por empresa Datos: X, (i= 1; 2; 3;...;20) Lo que significa que habré 20 datos cuyos valores H=4 Xy=4 X= Xp=4 XyQ=5 Xp=5 Xy=6 Xe=2 Xig=4 Xg=B Xy=4 Xws6 Xo=3 Xoo=3 Para la construccién de la tabla de frecuencias, tal como se indicé anteriormente, primero se clasifican 0 determinan los distintos valores de X;y luego se tabula. Vearnos. Clasificacién En este caso se identifican los distintos valores que tiene X,, primero se ubican el mayor y menor valor deX;como 0M Xin =2-¥ Xitc=6, ‘es decir, los valores de la variable van de 2a 6 que al final de la serie 2; 3; 4; 5; 6 empleados; la variable original X, tiene cinco valores distintos 671 Lumbreras Editores Aritmética a los distintos valores que toma la variable X; lo vamos a denotar por y, resultando Hae ns ey 4 vio Eneste caso y, (i=; 2; 3; 4; 5). Sim = ntimero de valores distintos de X,, entonces m=5. En general, y,(/=1;2;..;m) donde m 50 60 70 80 90 Pew de bs ‘60 empleados ‘por intervalos fenke) + Una representacion gréfica _conocida como diagrama escalonado es aquella que se genera de manera similar que un histograma, con la diferencia de tas alturas de los rectngulos correspondientes a cada intervalo de clase son frecuencias absolutas © relativas acumuladas. + Una ojiva es la representacién grafica de una distribucién de frecuencias absolutas 0 las frecuencias relativas acumuladas. Diagrama clreular Este sistema de representacin se emplea principalmente con fines comparativos, cuando se quiere mostrar los diversos componentes de una serie de valores de la variable comparada con el total ‘A esie tipo de representaci6n grafica también se le conoce como grafico de sectores odel pastel. 681 Lumbreras Editores Para construir el grafico de sector se utiliza una circunferencia, cuyo circulo se divide en sectores tales que sus medidas angulares centrales y la superficie del sector circular sean proporcionales a los valores de la variable que representa. Al total le coresponde el circulo completo, es decir, los 360° de la circunferencia, (N° personas) DP (ngulo) Por ejemplo para los empleados que tienen 4 hijos se tendré 60 360° 12 x > «=m empleados con 2 hijos empleados con 1 hijo 55% 10% ‘empleados con 4 hijos 20% ‘Total = 60 empleados Este diagrama no tiene uso si la variable es continua. Pictograma Es aquella representacion por medio de simbolos que por su forma sugiere la naturaleza de los datos. Consiste en tomar como unidad un simbolo arbitrario para el que debemos fijar previamente el valor que le asignamos como tal unidad. De nuestro. ejemplo tomaremos como unidad eee 682 Grado de instruccién de los 60 empleados de una empresa. CAPITULO XVII Introducci6n a la estadistica Pictograma Para citar un ejemplo, consideraremos fos siguientes datos: + Numero de empleados provenientes de la costa = 20 + Numero de empleados provenientes de la sierra = 30 * Numero de empleados provenientes de la selva = 10 ‘Tomando como unidad j empleados, se tiene Empleados provenientes dela cous enon rnd ase ti Empleados provenientes dela wm Dado un conjunto de datos sabemos que el promedio de ellos es un valor que representa el centro del conjunto de los valores dados, por lo ‘que afirmamos que los promedios son medidas de centralizacién, Desarrollamos a continuacion Jas principales: MEDIA ARITMETICA (MA, x) Llamado también media 0 promedio aritmético, es el mas usado por todos nosotros y el més facil de calcular. Asi podemos determinar Por ejemplo: salario medio, precio medio, Tendimiento medio, temperatura media, etc. La media aritmética se utiliza en datos no tabulados como en datos tabulados. Para datos no tabulados Dado un conjunto.de N numeros Oj ys Og nj Oy la media aritmética se define yao Gt Oy. +O N Fjemplos Los gastos diarios en movilidad de una persona es 3; 2; 5; 4; 6; 3. Su promedio de gastos en movilidad seré, eee 353 2. Se tienen las notas de un alumno obtenidas cen 6 materias, las cuales son 11; 13; 14; 14; 16; 16, Su promedio sera =_ +134 144 14+ 16416 = 6 Para datos tabulados Sean x; X35 Xs; i Xx las marcas de clase de los K intervalos de una distribucion respectivamente y ademés fi; fy; fy; ~i fr SOM las frecuencias absolutas de los N intervalos respectivamente. La media aritmética se define ee RRA Ha Mat aX at on He Hl 7 & Dxxh ned Fe. 7 Aunque, sabemos tambien [ entonces reemplazando = f fy fs xan, x A tayx 2p agx Bt tage ee Gey 7 XX, XN $y My + Xg Xg HANK MQ, De ahi se tendré K X= Sox, xh; j (ty: frecuencia relativa) A 683 Lumbreras Editores Aritmética Ejemplo En la siguiente tabla corresponde al ingreso mensual promedio (en soles) de cierto numero de familias. ua x | & | fe 1300; 500) | 400 | 40 | 40% [500 ; 700) | 600 | 36 | 36% {700; 900) | 800 | 14} 14% 19001100) | 1000 | 10 } 10% | 100 400% 40 + 600%36 + 800%14 + 1000% 10 100, = 4(40) + 6(36) + 8(14) + 10(10) 160 +216 + 112 + 100 ¥= 588 sino también k= Dhx, 40%(400) + 369%(600) + 1494(800) + 10%(1000) 588 Caracteristicas de la media aritmética + Ensucélculointervienentodos los datos, por lo tanto se ven influidos por ta variacién de cualquiera de ellos. En particular, tienen el inconveniente de que los valores extremos producen grandes modificaciones. ‘+ Eslamedia més utilizada; a comparacion de la media geométrica que es poco utilizada pero més adecuada cuando se trala de promediar incrementos porcentuales que actian de forma sucesiva. + Lamedia aritmética ponderada es bastante til cuando se considera que los distintos valores promediados tienen unaimportancia desigual. Eselvalorquedividealtotalde observaciones (n) debidamente ordenadas © tabuladas en 2 partes de igual tamajo. La mediana dependeré de la cantidad de datos mas no de los valores de estos. Para datos no tabulados Cuando se tengan datos obtenidos de una muestra se tendran 2 casos. En primer lugar, tendremos que ordenarlos en forma ascendente o descendente. 1. Cuando se tiene un mtimero impar de datos. La mediana serd igual al valor del término central, Ejempio Si se tiene el nmero de hijos de 7 familias Notamos que el dato central es 2, porlo que diremos que el cuarto dato es la llamada mediana, entonces Me = 2 2. Cuando se tiene un mimero par de datos. La mediana es igual a la semisuma de los dos términos centrales. Ejemplo Se tiene la cantidad de alumnos que asistieron a un aula de clases en os diltimos 6 dias: 26; 20; 21; 30; 25; 21 Ordenando 20; 21; [21; 25};29;30 a Entonces 21425 _ ay. Me 23 CAPITULO XVII Introduccién a la estadistica Para datos tabulados Cuando se tengan datos, los cuales estan clasificados por una cantidad de intervalos, tendremos que hallar el dato que hace dividir en. dos partes de igual tamafo a la muestra y para ello nos ayudaremos de la proporcionalidad. Seaunadistribucién de K intervalos de ancho de clase comin con frecuencias absolutas shite donde Fy=n donde n ; total de datos w : anchode clase comin Notamos que la mediana se encuentra en el -€simo intervalo, por lo que en ese intervalo tendremos Me 2-Fiy fi Ln w donde Lm + limite inferior del intervalo donde esta la Me. : : limite superior del intervalo donde esta la Me: Por proporcionalidad diremos que por lo que llegamos a Efemplo Si se tienen los siguientes datos clasificados, halle la mediana. 4 [alr 120;30) 130,40) 40;50) 150,60) 60;70) wouan bx 0s ancho de dase entonces diremos por proporcionalidad os 5-10 . Me=40+x=48 > x=8 Lumbreras Editores Determinamos primero el intervalo de la clase mediana. Este es aquel primer intervalo cuya frecuencia relativa acumulada sea igual o excedaa 05. Luego, aplicamos la formula Nosotros aqui en el caso de la mediana encontramos un valor que divide en dos partes de igual tamafo a la distribucién, pero también a podemos dividir en 4; 10; 100 partes que tengan e! mismo tamafio, lo cual a continuacion desarrollamos. Cuartites (Q) Son valores que dividen a un conjunto de datos ordenados ascendente o descendente’en 4 partes de igual tamafio. nit —+— 1/4 —+— nf —4— 44 (25K) (25%) (25H) (25H) a a Qe Q@ 5 donde Q, : primer cuartil Q : segundo cuartil Qs: tercer cuartil A=la;b] yn: total de datos Flemplo Si se tiene el gasto semanal en soles de 200 personas elegidas al azar, halle los cuartiles. 686 Aritmética i (60; 120) 1120 ; 180) (180 ; 240) {240 ; 300) [300 ; 360] 88sesia Resolucion Cantidad de datos por cuartil Por proporcionalidad RB 5 x=50 = Qy=60+x=110 ° 2 > y=I5 2 Q)=1804y=195 2 = > 2224 » Qy=240+2=264 De lo anterior se diré oa ea) a) a Q Qs (110) (195) (264) Los nuevos intervalos estimados [60; 110) (110; 195) [195 ; 164) [264 ; 360] nos permiten afirmar que, por ejemplo el 25% de los encuestados gasta al menos S/.264 pero a lo més §/.360 en una semana. Esto titimo debe interpretarse como una estimacion y no como una certeza; ya que depende de los gastas reales de cada persona. CAPITULO XVII Introduccién a la estadistica Deciles (D) Son valores que dividen a un conjunto de datos ordenados en forma ascendente 0 descendente en 10 partes de igual tamafio. of ee en eee ee i S10) So an eerie 107! r (10%) 40%) 0%) (10%) (10%) (10%) (10%) 10%) (0%) (10%) ao Dp mR bh mh hm hm & & & »b donde A=|a; 5] y 7: total de datos Del ejemplo anterior tenemos i f 160; 120) | 60 (120; 180) | 30 [180 ;240) | 40 [240;300) | 50 [300 ; 360] | 20 halle el cuarto decil. ‘Resolucion a 200 Cantidad de datos por deci: [= 20 +20-+-20-] 60. 30 40 50 20 60 120 180 240 300 360 x D, D, Dy ——e ee 6 Por proporcionalidad, en forma andloga al caso de los cuattiles am 7 ~ Dy=1204x=160 Lumbreras Editores Aritmética Percentiles (P) ‘Son valores que dividen la muestra ordenada en forma ascendente 0 descendente en 100 partes de igual tamafo. nn nen tem n 100 * 100 yoo + 100-100 *~ 100 1%) (1%) (1%) (1%) (1%) (1%) a 3 or Py Steele fy} donde A=[a;b] y n: total de datos Ejemplo Del ejemplo anterior 160 ; 120) 1120 ; 180) 1180 ; 240) 1240 ; 300) 1300 ; 360) halle el percentil 37. Resolucton Cantidad de datos por percentil 555 ha Por proporcionalidad 14_ 30 = entonces x= 28 * 60 Pep =120-4x= 148 Propiedades de ta mediana Utiliza menos informacién que la media ya que solo depende del orden de los datos, pero su mayor ventaja es que no se ve influida por los valores extremos. Larelacién entre la media y la mediana vaa determinar la simetria de la distribucién, asi tenemos Me <* : la distribucién es asimétrica positiva. ‘Me =X : la distribucién es simétrica. ‘Me >x : la distribucién es asimétrica negativa. MODA (Mo) Es el valor que se presenta con mayor frecuencia en un grupo de datos. Ala distribucién que tiene una sola moda se Je llama unimodal. A la distribucién que tiene 2 modas se le llama bimodal. Aladistribucion que tiene mas de2modas se Je Hama multimodal (trimodal, tetramodal, etc.) En el caso que ningiin valor se repita mas que los otros se dice que no existe moda. Para datos no tabulados Cuando se tenga datos no clasificados solamente tendriamos que ver cual se repite més. CAPITULO XVI Introduccién a Ia estadistica Fjemplos 1. Sise tiene las edades de 9 personas: 17; 18; 16; 15; 18; 16; 18; 15; 17 entonces se diré que la edad 18 es la que mas se repite (3 veces). En este caso la distribucién es unimodal, por consiguiente ka Mo = 18. 2. Sise tienen las notas, en el curso de matemética, de 10 alumnos de un cierto colegio, las cuales son 17; 11; 12; 12; 16; 12; 13; 16; 15; 16, entonces se dira asi que las notas 12 16 se repiten la misma cantidad de veces (3 veces). En este caso la distribucién es bimodal 3. Sise tiene el némero de infracciones cometidas por una persona en estos siete tltimos meses a bordo de su automévil en las autopistas del cercado de Lima, las cuales son 12; 1; 5; 10; 3; 75-4, entonces se diré que no existe un dato que se repita mas que otro, por lo que en este caso no existe moda. Para datos tabulados Cuando se tengan datos clasificados en una cierta cantidad de intervalos, para poder hallar la moda sera necesario construir el histograma de la distribucién e identificar la clase modal (aquella clase con mayor altura). Tenga en cuenta que la distribucién puede ser multimodal. donde Lg: limite inferior de la clase modal L, + limite superior de la clase modal w= ancho de dase comin f, + frecuencia de la clase modal fips + frecuencia de la clase inmediata anterior a la clase modal Inet : frecuencia de la clase inmediata posterior a la clase modal Lumbreras Editores Aritmética Se observa que la Mo =Ly +x. Entonces, realizando semejanza con los triéngulos sombreados tenemos que a (Sm pe career pein d, d, d,+d, d+d, Ee, FJemplo [160 ; 200} halle la moda. 5 i 4, 5 tau] zt |- 120] 25] CAPITULO XVII Introduccién a la estadistica Aplicactén 1 Dados los siguientes datos. 9; 9; 10; 10; 115 12; 13; 14; L Halle X+ Me + Mo Resolucton Debemnos hallar independientemente % Me y Mo Veamos 949410410411 + 12+13+14+14+14+16+20 12 = 126 Dado que el ntimero de datos es par y estén ordenados. Me = 12418 = 125, Elvalor que se repite con mayor frecuencia es 14. Mo=14 2. ¥+Me +Mo=39,16 Aplicactén 2 Las edades de 6 personas presentan como media a 22,5 ademas como moda y mediana a 19. fy= 3 f= 10 14=220-146 = 74 F, =33410=43 F,=33+10430+74=147 Piden 43+147=190 FytFy=190 Lave © Problema 2 Jorge que es profesor de Matematica ha perdido las actas de promedios de las notas (de 0a 20) de los alunos, pero recuerda que los promedios Presentaban una distribucién simétrica con 6 intervalos de clase de ancho de clase comin, ademés en sus archivos encuentra la siguiente informacién hy = 0045; hy = 0, 6 5 = 7,5; Dx; 34 ‘Si para aprobar el curso se necesita obtener por Jo menos 11 de promedio, iqué tanto por ciento desaprobé el curso? A) 18% B) 50% ©14,24% D) 74% E) 80% Resolucion Sea w el ancho de clase comin Notas x f 75-20 75-w as 75+ 75+ Ww 75+ 3w CAPITULO XVII (7,5-210)+(7,5—w)+7,5+(7,5+w)+ (7,54+2w)+(7,5+3w)=54 ie i ‘Sea 22K el total de datos Reemplazando Notas x t (0; 3) 15 K 1356) 45 2K (6:9) 1S 8K [9; 12) 10,5 8K [12; 15) 13,5 2K (15; 18) | 165 K 2K Observe que es una variable continua 17 pn = x22N 25, 75%= x% Por lo tanto los desaprobados 100% -25, 75% = 74,24% Desaprobo el 74, 24%. Introduccién a la estadistica EI siguiente histograma fue el resultado de un estudio realizado en un taller de mecénica automotriz, sobre el tiempo de reparacién de un motor, éCudntas reparaciones se terminaron en un tiempo mayor o igual a 13,5 horas? ‘ntimero de reparaciones 9 Se 9 HW A315) 17) (horas) A) 90 B) 80 C) 75 D)S0 E) 36 Resolucién Piden G+40+10=75 Se terminaron 75 reparaciones. a 699 Lumbreras Editores Problema 4 Dado el cuadro N°dehijos | N° de familias 0-2 300 3-6 1200 7-9 600 10-12 300 13-15 100 ‘2Cuantas farnilias tienen de 4 hasta 8 hijos? A) 1300 B) 1.400 ©) 950 1D) 1.050 £) 1100 Resolucién Observe que la variable es discreta Enh; 1200 1200 1200 1200 4 4 4 4 AL tN) hay 900 personas Enh ee Se Sele oa Is ar hay 400 personas Piden 900 + 400 = 1300 Tienen 1300 familias. Enuna encuesta realizadaa 1200 personas sobre la preferencia de los periédicos A; B; Cy D, se obtuvo el grafico. 700 Halle cuantas personas son tal que si noprefieren el periédico D, entonces prefieren el periédico C. Se sabe ademas que el 25%, prefiere el periédico A A) 800 B) 1000 ©) 1100 ) 900 E) 890 Resolucion Sean las proposiciones P= prefieren el periédico D q _ : prefieren el periddico C 1; si no prefieren el periédico D, entonces prefieren el periédico C. Formalizando r=(~p)>q=pvq r= prefieren el periédico D © prefieren el periddico C. ‘Ademés el angulo central DP nimero de personas Angulo central 90° | 30° | 360° N° Personas n(A) | n(B) | 1200 donde nA) : niimero de personas que prefieren el periddico A. n(B) : namero de personas que prefieren el periédico B. pea ST 20 nla) ~ 1B) CAPITULO XVII Introduccién a la estadistica (A) = 300 n(B) = 100 Pero piden 1200 -n(A)-n(B) = 800 cLAve B El total es 800 personas. CLAVE A Problema? Dado el poligono de frecuencias Problema 6 f De la siguiente distribucién de frecuencia, halle 8K} - 1a Me, El ancho de clase es comin y hry = 0,2 ee SK 4 x f A (. pl sm @ 3K = 3K bar, » ab cai 1-0) so | 90 K L- >] 9 m = fs) a ‘ Calcule la media. Teel @q_| 20 A) 49,63 B) 47,25 ©5226 A) 78 B) 85, on D) 62,41 E) 48,62 ee) sat Resolucion AN|RR RR Lumbreras Editores * fi xf 20 K 20K 32 5K 160K 4 6K 264K 56 8K 448K 68 3K 204K 80 15K 120K 5 = 20K 160K + 264K + 448K + 204K-+ 120K K+SK+6K48K+3K+1,5K Problema 8 Dado el siguiente histograma, calcule la Me. El area es 1180 u’ y el ancho de clase es comin A) 42,3 B) 50 40 D)39 E) 39,8 702 Aritmética Resolucin Sea w el ancho de clase comin 13 + 6w = 73 w=10 En el primer intervalo se observa 13°18 28 Los SABC y ABDE son congruentes opuestos por el vértice B y lados opuestos iguales, entonces tiene igual area. Siguiendo este proceso, se observa que el drea del poligono de frecuencias es igual al area del diagrama de barras. 1180 = w (total de datos); dado que w=10 118 = (ab) + (6) + (a) + Bat 2b) + (Ga), 118= 10a +25 59.=Satb Ademés, a yb son nimeros enteros, a>b>a-b 59=Sa+b; a-b ee is 9 7 w 9 1 Nocumple ‘Luego a=10;b=9 Total de datos: 118 10 30 Me =38+2=40 Me =40 CAPITULO XVIt Introducci6n a la estadistica Problema S Mo = 40 + 6,25 Dado el siguiente histograma, calcule la moda ar eel t Problema 16 Del siguiente histograma, halle ¥ + Me +Mo, si el ancho de clase es comin. t af ed h dela 10 20 30 40 50 60 es A) 46,25 B) 42,50 ©) 40,20 e lal ad D) 48,5, E) 47,25 ae alee tees UI] ae Resoluclén 0 3 Dado que el intervalo [40 ; 50) tiene la mayor /, es mas probable que el dato que se repita mas Aa B) 100 ©) 60 veces se encuentre en dicho intervalo, entonces 5) 70: E920. a dicho intervalo se le denomina clase modal. R n ee og Se observa que la distribuci6n es simétrica y por ae teoria ¥ = Me, ademas es unimodal. 40 Mo 50 Por lo tantoX = Me = Mo e igual al punto medio del alcance. Entonces: ss a Piden X%+Me+Mo 20420 +20= 60 ¥+Me +Mo = 60 ‘703

También podría gustarte