0% encontró este documento útil (0 votos)
130 vistas54 páginas

Estadística I - 2DO AÑO MIL

Cargado por

piritaguaribryan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
130 vistas54 páginas

Estadística I - 2DO AÑO MIL

Cargado por

piritaguaribryan
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF o lee en línea desde Scribd
UNIVERSIDAD MILITAR DE LAS FUERZAS ARMADAS FACULTAD DE CIENCIAS Y ARTES MILITARES AERONAUTICAS COLEGIO MILITAR DE AVIACION GRUPO ACADEMICO BOLIVIA CURSO: DOCENTE: Iy.52./igal. £ $2I0P ACU peeeeen Esramsuicas Nybade dee, usbadistiea I wicha Chengase Oe gladis Vita, des evi ViMa concep es NOCIONES GENERALES DE LA ESTADISTICA “Apr Cats ane Rihine oye Caldercn” 1.1. Introduccidn, Soe seeeddddcin se sucle pensar en una relacién de datos Cuando coloquialmente se habla de estadistica numéricos presentada de forma ordenada y sistemdtica. Csta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez esté mis extendido debido a la influencia de nuestro entorno, ya que hoy dia es cas! imposible que cualquier medio de difusién, periddico, radio, televsién, etc., no nos aborde diariamente con cualquier tipo de informacién estadistica. ‘Sélo cuando nos adentramos en un mundo mas especifico como es el campo de la investigacién de las Ciencias Sociales: Medicina, Biologia, Psicologia, percibimos que la Estadistica se convierte en la Unica herramienta que permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su sede POO SS SVSS SEE EEUU SEE SUUESLE variabilidad intrinseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Desde un punto de vista mas amplio, podemos decir que la Estadistica se utiliza como tecnologia al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La Estadistica es la rama de las matemdticas aplicadas que permite estudiar fendmenos ‘cuyos resultados son en parte inciertos, Al estudiar sistemas bioligicos, esta incertidumbre se debe al desconocimiento de muchos de los mecanismos fisioldgicos, a la incapacidad de medir todos los determinantes de la enfermedad y a los errores de medida que inevitablemente se producen. Asi, al realizar observaciones en clinica 0 en salud publica, los resultados obtenidos contienen una parte sistemstica o estructural, que aporta informacién sobre las relaciones entre las variables estudiadas, y una parte de “ruldo” aleatorio. Cl objeto de la estadistica consiste en extraer la maxima informacién sobre estas relaciones estructurales a partir de los datos recogidos. a RNR Sein. Jou Miguel Expnoz Tejera Pigina? : ESTADISTICA 1.2, Historia de la Retadisticn: Su raiz: STATUS®cosas del estado, Durante e/ siglo pasado, era considerada como la Crancia del Estado. Sus origenes: EI recuento, Las eivilzaciones antiguas recogian datos sobre poblacién, producctdn agricola y renta. Tal cantided de informacidn debia ser resumida en valores numdricos para su interpretacion y uso en la toma de decisiones politicas, 61.3. Definicién: La Estadistica se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando a variabilidad ¢ incertidumbre sea una causa intrinseca de los mismos; as{ como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones, “La estadistica es la ciencia que permite tomar decisiones en situaciones de incertidumbre” A qué nos referimos cuéndo hablamos de variabilidad? Cuando nos referimos a una determinada caracteristica ([Link] de dcido Grico) en los individuos de una poblacién nos estamos refiriendo a una distribucién de valores. La observacién de un determinado grupo de pacientes nos proporciona informacién acerca de esta distribucién. Los resultados que observamos se relacionan con la distribucién poblacional. Sin embargo, observaciones distintas proporcionan resultados distintos (aunque compatibles), por ejemplo, un mismo tratamiento aplicado a grupos distintos de pacientes proporcionard resultados distintos. La Bivestadistica es la rama de’la estadistica que estudia la utiizacién de métodos estadisticos en problemas médicos y biolégicos. Ensefia y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variabilidad no es la excepcidn sino la regla. Cote ui ESTADISHEAL 1.4, Divisidn de ta Estadistica bretenden ic mas alli del conjunto de datos, ¢ inferencial cuando el objetivo del estudio es derivar las conclusiones pbtenidas a un conjunto de datos mis amplio. @ 1.4.1, Estadistica Descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gréficos que resumen y presentan la informacién contenida en ellos. 1.4.2. Estadistica Inferencial Apoyaindose en el cilculo de probabilidades y a partir de datos muestrales, efectia estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Su tarea fundamental es la de hacer inferencias acerca de la ° ~ 2 . . . 2 Podemos clasiticar la Estadistica en descriptiva, cuando tos resultados del andlisis nw > > > > > > , ? ) ) ) poblacién a partir de una muestra extraida de la misma. El andlisis de una base de datos siempre partird de técnicas simples de resumen de los datos y presentacidn de los resultados. A partir de estos resultados iniciales, yen funcién del disefio det estudio y de las hipétesis preestablecidas, se aplicarén las técnicas de inferencia estadistica que permitirin obtener conclusiones acerca de las relaciones entre las variables estudiadas. Las técnicas de estadistica descriptiva no Precisan de asunciones para su interpretacién, pero la informacién que proporcionan no es fdcilmente generalizable. La estadistica inferencial permite esta generalizacién, ero requiere ciertas asunciones que deben verificarse para tener un grado razonable de seguridad en las inferencias. 1.5. Conceptos Basicos ‘Vamos a definir algunos conceptos basicos y fundamentales a los cuales haremos referencia continuamente: ) Unidad estadistica, Individué Elemento: personas u objetos que contienen cierta E informacidn que se desea estudiar y que pertenecen a la poblacién en estudio Poblacién: conjunto de individuos 0 elementos que’ camplen ciertas propiedades y entre : ‘ los cuales se desea estudiar un determinado fenémeno. aT Pagina Seng loud Miguel spoons Tefrna users ~ nai a i SubEONIUNtY "representative: de una poblacidn, ‘Stadisti leo: f = ‘nein defrida sobre os valores ‘uméricos de una muestra. rametro: 1 y funcidn de 4a Poblacién, NcISN detinida sobre los Valores numéricos de caracterlsticas medibles Caracteristica observable que varfa entre los diferentes individuos de una poblac ‘8s variables pueden dividirse en cualitativas y cuantitativas, Modalidades o categorias: posible valores de une variable. Las modalidades deben ser a la ez exhaustivas y mutuamente excluyentes (cada elemento Pose una y sélo una de las Modalidades Posibles), Las Modalidades pueden agruparse en clases (intervalos), 1.6.1 Tipos de Variables Variables Cualitativas: Se usan con datos que representan categorias que son mutuamente excluyentes, aunque Se utilcen ndmeros para cada categoria no representan cantidades, Para su medicién usamos escalas: Nominales No hay relacién entre las categoias. Una scala nominal slo permite daitear (ng Jerarquizar ni ordenar). Ej: Género, nacionalidad, stuacién geogrsfica Distinguimos dog tipos de variables cualitativas o categéricas nominal Pagina 5 oc ppp999900eoee "| OCbbdd ddd édeed e eeseee DVVVIVS SVS VeSVUEVHYOHEHEUY (RAR Pe Dicotdmicas o binarias Sano/enfermo, hombre/mujer Policotémicas (con varias categorins): grupo sanguineo (A/1/AB) Ordinales Sus posibles categorias se encuentran jerarquizadas y ordenadas. Cj.: Mejoria 2? tratamiento, satisfaccién de un usuario, grado de dolor Es buena idea codifcar las variables cualitativas asignando un cédigo mumérico 9 cade categoria (“etiqueta”) para poder procesarlas con facilidad. iOjo! Aunque se codifiquen como mimeros, debemos recordar siempre ef significado verdadero tipo de as variables con las que estamos trabajando ys cuando vayamos a usar programas estadisticos. iNo todo esta permitido con cualquier tipo de variable! Variables Cuantitativa: Se usan con datos que se expresan mediante cantidades numéricas que permiten hacer operaciones matematicas. Existen los siguientes tipos: « Discretas: sélo puede tomar valores enteros. Ej.: N° de hijos, n° de intervenciones lores estén en un conjunto infinito. Las poder Ej * Continuas: Si sus posibles val meg categorizar en intervalos (trataremos este tema en la clase prictica con SPSS) Edad, peso, tensidn arterial En la tabla se resumen los distintos tipos de variables y su utilidad: TIPO DE VARIABLE PARA QUE SIRVE Cualitativa Nominal | Clasificar Cualitativa Ordinal ~_Derarquizar ‘Cuantitativa Discreta Contar. ‘Cuantitativa Continua Medir Pagina 6 Se. ng. Jud Miguel Espinoza Tejrina ESTADISTICA 1.7, Muestreo Cuando se decide cuantificar sdlo una parte delas unidades de una poblacién y a partir de esta Informacién estimar sus pardmetros, entonces estamos planteando un problema de mucstreo. La estadistica habitualmente estudia sélo una muestra de individuos. Se entiende por ‘muestra al subconjunto de una poblacién de mayor tamafio, Se entiende por poblacién 0 Universo al conjunto de todos los individuos o elementos (unidades de anilisis) que cumplen Giertas caracteristicas. Al procéso de extraccién de una muestra a partir de una poblacién Se le denomina muestreo. A la interpretacién del tratamiento estadistico de unos datos que acaba generalizéndolos a toda la poblacién se le llama INFERENCIA, El muestreo es una herramienta de la investigacién cientifica, su funcién bisica es determinar qué parte de la realidad en estudio (poblacién o universo) debe de examinarse Con fa finalidad de hacer inferencias sobre el todo de la que procede. Un proceso inductive (que va de lo particular a lo general) se asocia inevitablemente a la Posibilidad de cometer errores. El error es mayor en la medida que la muestra sea mas pequelfa, y sobre todo, Cuando la muestra no refleja o “representa” la realidad sobre la que Fecaen las conclusiones de la inferencia, Eleerror que se comete debido al hecho de que se sacan conclusiones sobre cierta poblacién, @ partir de la observacién de sélo una parte de ella, se denomina error de muestreo, Dentro del proceso de seleccién de una muestra, la poblacién suele dividirse en unidades de muestreo las cuales deben de cubrir por entero a la poblacién, en otras palabras, todo Pagina 7 aagaacessaasssss tte \ Peececeooosas ® oe PPPPPP PR PR e CoC VT VOLE LEE DOLOLO DV VUNNIIddddddbbb bbb bbbbddn SStTADISHEAY mmiembra de la poblacién o unidhad de analisis perte © 8 una y sto 9 una ¥ sdl0 Una Unidad de muestreo. Una unidad! de muestreo puede contener un conjunto de unidades de andtsis, incluso, un conjunto de unidades de muestreo correspondientes a una etapa posterior. La lista de tas unidades de muestreo, recibe el nombre de marco muestral. Ejemplo 1.1, ‘Supongamos que se estudia una poblacién de escolares a fin de conocer la prevalencia de cierta dolenci listado de escolares, se tiene un listado de colegios (alguno de los cuales se elegirs Cada escolar es una unidad de andlisis, pero, en lugar de contar con un n para el estudio). Una vez hecha esta seleccién, se toman algunas aulas de los colegios elegidos. Finalmente, dentro de estas ultimas se eligen alumnos que integran la muestra definitiva. El listado de colegios primero, el de las aulas que tiene cada colegio seleccionado y el de hifios, correspondiente a cada aula elegida dentro de los colegios de la muestra, constituyen el marco muestral del estudio. Puesto que hay tres procesos escalonados de seleccidn, existen en este caso las llamadas unidades de muestreo de primera, segunda y tercera etapa. Podemos resumir en estos cuatro puntos las ventajas que la utilizacién de muestras presenta con respecto a la enumeracién completa de la poblaci Coste reducido. Si los datos se obtienen de una pequeiia fraccidn del total, los gastos de recogida y tratamiento de los datos se reducen, Incluso si la obtencién de informacién en toda la poblacién es factible, suele ser mucho mas eficiente la utilizacién de técnicas de muestreo. Mayor rapidez. Los datos pueden ser mas facilmente recolectados y estudiados si se utiliza una muestra que si se emplean todos los elementos de la poblacién. Por tanto, el uso de a Se. ng José Miguel Eplnara Terie Pagina 8 ESTADISTICA téenieas de muestreo es especialmente Important cuando se necesita la Informaciin con cardeter urgente, Mayor Mexibitidad y mayores posibilidaties de estudio, La disponibilidad de registros conyptetos es linitada, Muy @ menudo, la Unica alternativa posible para ta realizacién de un estudio es la obtencidn de datos por muestreo, Mayor control de calidad del proceso de recogida de datos. Al recoger datos en un numero menor de efectivos, resulta may facil recoger un numero mayor de variables por ‘ndeviduo, asi conta tener un mejor control de ta calidad del proceso de recogida de datos, La teoria de muestreo persigue un doble objetivo, Por un lado, estudia las técnicas que permiten obtener muestras representativas de la poblacién de forma eficiente, Por otro lado, indica cémo utilizar los resultados del muestreo bara estimar los pardmetros poblacionales, conoclendo a la vez el grado de incertidumbre de las estimaciones, Asi, la teoria de muestreo pretende dar respuesta a varias preguntas de interés: éCémo se eligen a los individuos que componen la muestra? + éCudntos individuos formardn parte de la muestra? eCémo se cuantifican las diferencias existentes entre los resultados obtenidos en la muestra y los que hubiéramos obtenido si el estudio se hubiera llevado a cabo en toda la poblacién? icas de Muestreo La caracteristica mas importante de una muestra es que debe ser Fepresentativa de la Poblacién objeto de estudio para poder extrapolar los resultados a la poblacién total Las noclones de muestra representativa y de muestra probabilistica suelen identiicarse errdneamente como una y la misma, Como consecuencia puede ocurrir que, al admitir que Ja muestra no fue seleccionada por via del azar, el investigador sienta que su estudio carece del rigor cientifico necesario, La nocién que mejor sintetiza la idea de representatividad es la siguiente: “Lo que debe procurarse es que la muestra tenga internamente el mismo grado de diversidad que la poblaciétr’ name a mene (MSc. Ing. Joué Miguel Espinoze Tejerina eae aaaqaceee? ESTHET TES a9 ree Wt tf Z ; P Sooo e Cov ov eevreseeV NUNN Kdb dsb bbbbbbOEbbbdS ewes SSTADISTIEAS 1.9. Tipos de Muestreo, Puntos a considerar 1+ Defi claramente a poblaiin de estudlo. Pueden ser personas, clicas, fuentes de abastecimiento de agua. 2. Enfoque del estudio. Serd a nivel nacional, regional, local Entre mayor sea la muestra tendrd a ser mds representativa y menor serd ef error de muestreo, St se desea hacer cruces de variables se recomienda no tener menos de 50 casos en cfu de las subcategorias de la variable principal Los métodos para seleccionar una muestra representativa son numerosos, dasificarlos en: Probabilistico x podernos, ‘+ Aleatorio Simple + Estratificado + Sistemdtico + Por Conglomerado No Probabilistico + Por conveniencia + Por cuota + Accidental o Bola de Nieve 1.9.1. Probabilistico: Es requisito que todos y c/u de los elementos de la poblacién tengan ta misma probabilidad de ser seleccionados (azar) Se debe tener disponible un listado completo de todos los elementos de la poblacién, a esto se le llama MARCO DE MUESTREO. MSc, ng José Miguel Espinons Torna Pagina 10 | _ESTADISTICA Aleatorio Simple (Muestreo Simple al Azar) Cada sueto tiene Una probabilidad igual de ser seleccionado para el estudio. ‘Se necesita una lista numerada de las unidades de ta poblacién que se quiere mi Opciones: + Fichas de loteria o bolitas numeradas: + Tabla de niimeros aleatorios Ateatorio Simple/Muestreo Simple al Azar, Pasos: + Determinar el tamafio de ta muestra + Numerar los individuos de 1a n + Tirar unidades al azar (probabilidad igual) Ejemplo: Cobertura de la vacuna anti-sarampién entre 1200 nifios de una escuela X : + Muestra = 60 + Hacer una lista de todos los nifios + Numerarlos de 1 a 1200 * Seleccién aleatoria de 60 nimeros Muestreo Aleatorio Sistematico, Se toman todes los indviduos de la lista y se selecciona c/3, c/7, 0 cualquier otro ndmero, Para comenzar se utiliza un nimero al azar Ejempio: Poblacisn (N): 12,000 Muestra requerida (n): 600 Calcular el intervalo de muestreo (k) = 12,000 / 600 = 20 Escoger el Ler numero al azar (1 -20}=>1era unidad Afiadir k para escoger la siguiente unidad y asi sucesivamente hasta completar n, 123456789 10 11 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 33-34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51653 5455... ler# =12 K=20 SC MSc. ng, Jo4é Miguel Espinoze Tajerine e e e e e e ~ bb bbb 06h h6 6 sed6 CCU OH SHOVES SS vO VOVETEHEES J" EStADIENICAL Mucstreo tstratificada, Cuando t Westra incluye subgrupos representatives (estratos) de los vlementos de estudio con eaactensticas especficas: urbano, rural, nivel de instruccién, afio académicy, conver, SeXO, Grupo dtnico, edad, paridad etc. Fn cada estrato para obtener el tamatio de la muestra se puede utlizar ef inves © sistematico, Ejempio: Cadetes del Colegio Militar de Aviacién 2018 Lago militar =20% 1 aito militar =18% MI aifo militar =15% treo aleatorio 1V ao militar =12% Muestreo por Conglomerados Son unidades geogréficas (distritos, pueblos, organizaciones, linicas) Facultad de Ciencias Econémicas Facultad de Ciencias Juridicas y Sociales Facultad de Quimica y Farmacia Umitantes: financieras, tiempo, geografia y otros obstaculos, Se reducen costos, tiempo y energia al considerar que muchas veces las unidades de analisis Se encuentran encapsuladas 0 encerradas en determinaclos lu: igares fisicos © geogréficos: Conglomerados Unidad de analisis: sujeto o sujetos Unidad Muestral en este caso: conglomerado a través del cual se logra el acceso a la unidad de anilisis, Seleccién en 2 etapas: + Los racimos © conglomerados + En los racimos se seleccionan a los sujetos a ser medidos, Poblacién, Localidades, Viviendas. Croquis. Pégina 12 (MSc. ng. José mtigul Espinoze Tajerina igi sss . —Staorsmeas 1.0.2. to Prabebitistice: 2 cece de lon indivi no depende de Wo probabsidad, sina del proceso de tome om decmores del trvestigador (ls uestras selectionedes por decisiones subjetves erator a estar sesgantas). + Muestreo par convenience ‘= Muestreo por custas, Accidental © bola de nieve Muestreo por Conveniencia Es fa muestra que esti disponible en el tiempo © pentodo de investigacién. Semple: Todos fos pacientes que asistan a una dinica en particular cierto dia, semana, ueden ser requerides para participar. Desventaja: la muestra puede ser poco representativa de la poblaciin que se desea estudiar, Nuestreo por Cuotas ‘Todos los elementos conocidos de la poblacién tienen que aparecer en la muestra. Se debe asegurar que estos aparezcan en la misma proporcién que en la poblacén. Elinvestigador entrevista a todas las personas de cada categoria que pueda encontrar hasta ‘que haya lienado la cuota Muestreo Accidental o Bola de Nieve ‘Se aprovecha o utiliza personas disponibles en un momento dado que se corresponda con el propésito del estudio. De los tres tipos de muestreo no probabilistico resulta ef mas deficiente <€Cudl es el tamatio apropiado de la muestra? Depende del paradigma o enfoque: *Enfoque Cuantitativo Cualitativo *Muestreo probabilistico 0 no probabilistico (MSc. ng. ld Diguel Espinoza Tojorina Pagina 13 aaaee? qeeee « « e e Ls « « © « € © e e e S : s : « « e a ” ° fst9msnen tog UNIDAD IT 2 DISTRIBUCION DE FRECUENCIAS 2 2.4, INTRODUCCION + ~~ Cuando el niimero de datos recolectados es pequetio, no hay ningdin problema para hallar ~~ una informacién representativa 0 para tener una idea significativa det grupo, en cambio ~~ cuando ta informacidn es muy grande, es necesarlo distribulr esta informacién en cases o ~~ categorias y determinar el nimero de datos que pertenecen a cada clase, nimero que > constituye la frecuencia de la clase. » Un cuadro de distribucién de frecuencias es una tabla en la cual, se agrupan en clases fos » valores posibles de una variable y se registra el nimero de valores observados que » corresponden a cada clase. > > Los datos organizados en un cuadro de frecuencia se denominan datos agrupados, por el , contrario, para los datos no agrupados, se enumeran todos los valores observados en » una variable aleatoria. : > » Distribucin de. frecuencias: Agrupamiento de datos en categorias mutuamente » | excluyentes, que indican el ntmero,de observacianes en [Link], i ° eee SS Ane loge DES sends a cafege site » 2.2. DISTRIBUCION DE FRECUENCIAS RELATIVAS . > Puede resultar conveniente convertir las frecuencias de clase en frecuencias de clase ° relativas para mostrar el porcentaje de! numero total de observaciones en cada clase. ® Para convertir una distribucién de frecuencias en una distribucidn de frecuencias relativa, cada frecuencia de clase se divide entre el nimero total de observaciones. + Laorganizacién de datos mediante distribucién de frecuencias, utilizada para resumir ° 2 > : los datos originales y facilitar su comprensién, tiene como principal ventaja el > obtener una imagen visual répida de la forma de la distribucién, sin realizar célculos 2 adicionales, es decir, se puede ver dénde se concentran los datos, y determinar si > hay valores extremadamente grandes 0 sumamente pequefios. > > > > > > a eR ACRE NS A RENT Pagina 14 (MS Ing Jord Miguel Eplnozs Teferna | Space rteaa AAOTTD EAC tei, ——_£sta0rsneas sin embargo, existen dos desventajas de utilizar tales formas de € on se plerde la Wdentidad exacta de cada valor, y (2) na se sabe bien ety Jos valores dentro de cada clase. Ejemplo: En la tabla siguiente se tienen los tiempos de horas de vuelo que requieren 39 ganizacién: (1) 10 5¢ distribuyen Oficiales de la FAB, para poder obtener el brevete como Aviador Militar, Supsngase que se desea organizar estos datos en 5 clases de tamafios iguales. Construir una tabla de distribucidn de frecuencias. Tiempo que requieren 30 oficiales dela FAB 10 14 15 3 7. 16 12 14 i 13 15, 18 9 14 14 9 15 Fry 13 i 10 10, 37 16 32 i 16 2 14 15 2.3. PASOS PARA LA CONSTRUCCION DE UN CUADRO DE FRECUENCIAS Para elaborar una distribucién de frecuencias es necesario seguir una serie de pasos. EL primero de ellos es anotar los datos en una tabla que muestre las clases (categorias) y el niimero de observaciones en cada categoria. EI objetivo final es obtener una tabla que muestre a simple vista la forma de los datos. PASO 1: Ordenar los datos (Organizar la tabla anterior) Se debe organizar los datos en el orden magnitud creciente o decreciente, por comodidad uno organiza los datos de menor a mayor Tiempo que requieren 30 oficiales de la FAB 9 Fry 13 14 16 9 a 13 14 16 10 a 13 15, 16 10 12 4 15, 17 10 12 14 15 17 11 2 14 35 18 ST MS ng, oud Miguel Eplnoze Tejera Pagina 15 evrereer Bee ee kk OOOO Oe CSREES | bbddcscddddddddes y eee dds vue PASO 2: Rango o Amplitud(R) ves extremos del conjunto de datos Rango® Vous Vial Es la diferencia de tos R= i-9 Reo PASO 3: Determinar ef mimero de clases (K) El objetivo es usar suficientes grupos, 0 clases, que Indiquen la forma de ta distribucién. Aqui se necesita algin criterlo, Demasiadas clases 0 muy pocas pueden no revelar la forma basica del conjunto de datos. La forma de cémo agrupar los datos muchas veces depende del objeto de estudio para el cual se realiza el anilisis de los datos, con lo cual, no hay una Unica manera de presentar los datos en intervalos de clase. ‘Sin embargo, si a priori no se sabe cémo agrupatlos, existe una técnica que sirve para determinar la forma en que podriamos presentar dichos datos de manera agrupada (o en dlases), Dicha técnica es la siguiente: ‘+ El primer paso consiste en determinar fa cantidad de intervalos (k). Por lo general se utiizan 2 formas, que dependen del tamafio de la muestra, es decir, de n. Sin < 100, entonces = 1433" login) Sin> 100, entonces kad (Como dichas formas no garantizan un n° entero, se recomienda utilizar el redondeo estadistico). En nuestro ejemplo ya nos indica el mimero de clases que es igual a 5 clases. Pagina 16 ESTADISTICAL PASO 4: Determinar el interyalo 0 amplitud(C) * _Etintervato de clases indica el rango de los valores incluidos dentro de una dase y ‘Puede ser determinado restando el mite Superior de la clase del limite Inferior Generalmente et intervalo o amplitud de clases debe ser el mismo para todas ellas. Todas Tas clases juntas deben cubrir por lo menas la distancia que hay desde el menor hasta el mayor valor que Se tiene en los daros sin procesar, 2 formula que puede utiizarse para determinar el Intervalo de Clases aproximado es: R k PASO 5: Establecer los limites de cada clase Es necesario establecer los limites de clase claros de manera que cada observacién ertenezca a solo una clase. Esto significa Sobrepongan 0 que no sean claros, cifras, que se deben evitar los limites de clase que se Por ejemplo, estableciendo una forma de redondear 2) Limites Nominales inferior o superior Indican los valores incluidos dentro de la clase. Ademas siempre debemos ‘aseguramos que cada elemento quede solo en una clase siempre que sea posible haremos que las clases tengan fa misma longitud, €s decir haremos que abarquen intervalos iguales, Unites wominaies | ton Ue ba 19-10), m [11 - 12) vil [13 = 14) vil [15 - 16) Vil (07 - 18) ul MSc. ng ond MigulEspinote Teron Pégina 17 ESTADISHIEAL b) Limites Reales 0 fronteras de clase 1 los puntos especificos de la escola de medicidn, que sirven para separar clases ‘adyacentes cuando se trata de variables continuas, Los limites reales de cada clase pueden determinarse, identificarse los puntos que estin tos puntos que estén a fa mitad entre los limites superior e inferlor, respectivamente de las clases adyacentes. Para determinar los timites reales se suma el valor de 0,5 al limite superior de ta clase y el mismo valor le restamos al limite inferior de la clase, Siguiendo con nuestro ejemplo. Umites Reales bee ba 18,5 - 10,5/ [10,5 = 12,5] [22,5 - 14,5) [14,5 - 16,5[ (26,5 - 18,5, * PASO 6: Marca de Clase 0 Punto Medio (X\) También conocido-como marcas de clase, se localiza a la mitad entre los limites inferiores. de dos clases consecutivas. Se puede calcular sumando el limite inferior de la clase al limite superior de la misma, y dividiendo el resultado entre 2. Lm Lie 85+ 10,5 ee aes OO0 886 66 664 bbb Hobe EESSES+EébbEbLCD - 2 2 = Umites 2 Lmites Nominales | conteg| ‘wenle |Marca de Close » eb ee 2 [2 - 10) im _| [5 - 10,51 95 » [11 - 12) vin_| (40,5 - 12,5[| 11,5 2 (a3 - 14) vin |f12,5 - 14 s{| 13,5 = (15 - 16) vi_| (145 - 16,51) 15,5 ” figcaey Nes agai 73 2 aR RUS TBS DT TT IRS Pagina 18 Tere 2 2 » a «) Frecuencia Absoluta (1.) | frecuencia absoluta de ta dase f, es el nimero de observaciones del conjunto original de datos. ESTADISTICA Miner Nominaes | conten | mites Reoles| marco de | Frecuencle Absoluta Us ba tie bas Close he = Xi (9 = 19) a | 05 - 10,51 35 a [4 = 12) ww | i905 -125¢[ 145 £ [13-147 ww | 1125-145 [135 8 115-36) wi [145 - 165) | 155 z 37 - 18) m_| 65-185; [17.5 a | N= Ee =30 +) Frecuencia Relativa (1,) Frecuencia relativa (7,)es la proporcién que representa la frecuencia absoluta en relacién con el total. Son erneee cogs, | hme meskes | laces oc Frecuencia | Frecuencia Absolute Ue bs ole tt Clase Absoluta t x fe [9 - 10) m 185 - 10.51 35 4 O33 [21 = 12) vn | yos- i257 | 145 @ 0.266 [13 - 14) wm | 25-145; [135 a 0,266 [15 ~ 16) vi 14s - 165; | _ 155 7 0233 [17 - 18) im 1165 -1asp | 175 3 010 N=it=30 1 =0,988 "Nota: Es importante tomar por To manos 3 alfa Higa despuds dela coma decimal 9 Frecuencia Relativa porcentual(1.) Frecuencia relativa porcentual (.) relativa, esta se convierte en porcentaje, es aquella ue al multiplicar por 100 a la frecuencia PEPLRRRARARAREENEETS? POOOROREES - Feraowniens ei maven de | trecuencin | trecuencta wmotes | canteo | Hater Reales |” Cinte | “abvonna | manent ears etal ” te t Freewencha Nelation Porcentual tw wot | im | fas 10.5 - a way | wn | pos sas | ne a aie arg |v | as sys | ee 0 0.266 uss wn | pas 15 | thd 7 a acta || jas as | a2 1 a0 Hf, 0,08 a8 66666666 6b456b5 PASO 8: Frecuencias Acumuladas Absolutas, Relativas y Porcentual Frecvencias absolutas acumulada: para poder calcular este tipo de frecuencias hay que tener en cuenta que la varlable estadistica ha de ser cuantitativa o cualitativa ordenable, sée6 En otro caso no tiene mucho sentido el cdlculo de esta frecuencia. La frecuencia absoluta acumutada de un valor de la variable, es el niimero de veces que ha aparecido en la muestra lun valor menor o igual que el de la variable y lo representaremos por fa, se puede acumular, en la tabla estadistica) en orden ascendente (fat) o descendente (fal). Una distribucién de frecuencias acumuladas, identifica el nimero de observaciones acumuladas incluidas bajo el limite exacto superior de cada clase de a distribucién. Puede determinarse la frecuencia acumulada para una clase, agregando la frecuencia observada ara dicha clase a la frecuencia acumulada a la clase precedente. Frecuencia | Frecuencia | Frecuencia | Freeuencla | Frecuencia Absoluta ‘Frecuencia Absoluta | Relative Relativa Absoluta fe Relativa f Porcentual fe Porcentual to ts W6éees+ey‘'y?‘VPyregmerfreree.°rT.,. Voooeoe drove EESEEEEd O33 33 4 0266 266 [ave 0133-0,266 | 13,34 26,6 0266 26,6 |12+8 = 20 _[0,39900,266 = 0,665 | 39,9 +26,6>66,5 0233 23,3 [2007 = 27 [006510233 =0,898 [66,5423 -89,8 0,10 7 2743 = 30 | 0,89800,10 = 0,998 |89,80 10 >93,8 =0,908 sae Tat L} a wevves Pagina 20 Cuando se construyen cuadros de distribucién de frecuendias, principalmente para Sondensar grandes cantidades de datos y de exhibirlos de manera fécil, suele ser Sconsejable, presentarlos en forma gréfica y estos son: @) Histograma ‘Se utitza para representar una tabla de frecuencias de intervalos de clase. Sobre el eje horizontal se representan los Limites Reales y sobre ef eje vertical, fas frecuencias de los intervalos. El gréfico consiste en un conjunto de recténgulos adyacentes cuya base representa un intervalo de clase y cuya altura representa la frecuencia del intervalo, — _— f TEMPO DE ESPERA DEL CLIENTE ediciones de madis hors por un a 4) Poligono de frecuencia Se construye uniendo los puntos medios de los la rectangulo. Si se quiere cerrar el recténgulo, otro posterior al Ultimo y se prolonga el pol intervalos, hasta formar una figura de varios dos opuestos de las bases de cada se agregan dos intervalos: uno anterior y ligono hasta los puntos medios de estos Frecuencia Absoluta eee MSc. ng Jo Miguel epnossTeorine Pégina 21 bbb boobed, ¢) Ojiva i Es una gréfica de distribucién de frecuencias acumuuladas se denomina OJIVA. Para = distribucién de frecuencias acumuladas del tipo menor que esta grafica indica la »> frecuencia acumulada debajo de cada limite exacto de cada clase de la distribucién > de frecuencias. 2 Cuando dicha grafica de linea esta suavizada, Se denomina ojiva. > Para el eje de las X se toma los limites reales y para el eje de las Y se toma la » frecuencia absoluta acumulada, > 12 > 1 2 » os : * od » » a2 » ad 2 a D> » n ; a = 2 2 DS ESTADISTICAL 2.4, CURVAS DE FRECUENCIAS Una curva de frecuencias es un poligono de frecuencia 2.4.1. Tipos de Curvas de una Distribucién de Frecuencias 2.5. OTRAS REPRESENTACIONES GRAFICAS Las representaciones graficas anteriores Poseen un fuerte atractivo visual. Es decir, estén disefiados para captar la atencién del le ctor. Pero existen también otras representaciones, Entre las més utilizadas se encuentran la graf ca de barras, la grafica circular y la gréfica de lineas; tas cuales suelen aparecer en publicaciones de periddicos o revistas, Las 2.5.1. Grafica de Barras Es especialmente itil para mostrar cual de intervalo o de raz6n (0 cociente). As manera vertical u horizontal, barras existen espacios entre nominal, Quiera de los niveles de medicién: nominal, ordinal, simismo, la gréfica de barras puede realizarse de Una diferencia con los histogramas es que en los Graficos de las barras debido a que los datos se miden en la escala MSc. ng oud Miguel Espincza Torin Pagina 23 PAPHHHMEH AEE HE SEG AAAAARERKERAAT HS, ’ > , > 2 » » , > > > , > > > » > > > » > > > > > > » > > > . . 2 > > . ° 2 ° 2 2 > a a a a ae fstab nen Gration do Darran compuosto: Remwuneracionas medias (ato 7) necta «G485ET 2.5.2. Grafica Circular Es especialmente util para mostrar los datos del nivel nominal. Para elaborarlo es nececario ™arcar los porcentajes de manera uniforme sobre un citculo. Se trazan lineas desde ef centro del circulo y se divide este en sectores. El drea, sector 0 “rebanada” obtenida representan los porcentajes. 2.5.3. Grafica Lineal ‘Son especialmente efectivas en los negocios porque se puede mostrar el cambio en una variable a través del ti mpo. Con frecuencia, en la misma gréfica de lineas se representan 1800 41600 | 4400 1200 — 1000 ‘200 ‘600 400 200 dos 0 més series de cifras. Por tanto, una gr fica puede mostrar la tendencia de varias series, lo cual permite su comparacién répida en un periods o intervalo de tiempo. : sc, ng Jord Miguel Espnore Terie Pagina 24 ESTADISTICAT UNIDAD IIT MEDIDAS DE TENDENGIA CENTRAL Y DE POsIcion 3.4, INTRODUCCION En el capitulo anterior se estudié la manera de como agrupar, simple y abrevieda un conjunto de datos abtenidos por medio estos datos tabulados se los presento mediante graficos, en deseripeiones fundamentales de la variable y de su distriby tendencia central y los métodos para encontrarlas. 1 Calcular y analizar en forma de una investigacion, Ademas, este tema, encontraremos otras ucIGN Como ser: las medidas de 3.2. DEFINICION Una medida de tendencia central o de posicién, debe su nombre al hecho de que sus valores re el menor y el mayor valor de un Conjunto de datos, es decir brindan de alguna manera info distribucién, tienden a ocupar posiciones centrales o intermedias ent entre las mas importantes y las més utilizadas son: La Media Aritmética, la Mediana, la Moda, la Media Geométrica, la Media Arménica, y ta Media Cuadratica, 3,3. MEDIA ARITMETICA E la medida de tendencia central més conocida, de mayor uso y facil de calcular, suele Namarse simplemente Media y es igual a la suma de los valores observados dividida por el numero total de observaciones, 3.3.1. Media Aritmética para datos no agrupados Sea el siguiente conjunto de datos x1, x2; Xs, Xa [MEAD + x34 xn ie Nn H Poblacién Fenn ee 5 {MS Jud ig apo Torn arent SOCORRO SHOHRKRORKRARRARARHRAREREASBEBAABSZAAAAAAa-.« er Ee ee ee Ne ete FATADIERIER * Muestra + Ejemplo: En una casa comercial de venta de artefactos electrodomésticos, se verde fos primeros 5 ins del mes de mayo los siguientes montos: Miércoles Jueves Viernes 31 4.567+9.203 +20.708+4.053418.300 w = 11.1462 Bs/dia 3.3.2. Media Aritmética Ponderada La media aritmética ponderada es una media aritmética, en fa cual se considera a cada uno de los valores de acuerdo con su importancia en el grupo. Las férmulas para encontrar la media aritmética ponderada, tanto para una poblacién como para una muestra, son exactamente las mismas. +++ Xai los valores observados Sea el siguiente conjunto de datos x1, X2, Xs. Sea el siguiente conjunto de datos P1, P2, Ps, P,: factores de ponderacién (pesos) Pix + Pxy + By tee t Py B+P, +P, +....P, (MSc. ng ore Miquel Espinoza Tejrina Pagina 26 _ESTADISTICA | Las cakficactones en una clase de lenguaje tienen cuatro componentes, con los pesos indicados: tectura (25 %), lectura comprensiva (45 %), ortografia (20 %) y elaboraciin de trabajo (10%). Si un alumna fue calificado respectivamente con un: 6, 5, 7 y 9. Cul seré ‘su nota media? Halla su nota media si todos los componentes tuvieran el mismo peso. éCémo conseguiria sacar mayor nota? 100 3.3.3. Media Aritmética para datos agrupados En una distribucién de frecuencia la media aritmética es igual al cociente de la sumatoria del producto de cada marca de clase por sus respectivas frecuencias absolutas, dividido entre el numero total de observaciones. marca de clase Sea el siguiente conjunto de datos X1y Xay Xs, frecuencia absoluta Sea el siguiente conjunto de datos fr, far fay [Poblacién w= > Muestra J ae tg Dud gue! taper Tefre Pagina 27 » » ~~» ESTADISTICAL a as ae * Ejemplo: 2 2 Hallar la media aritmética de la siguiente tabla de frecuencia a > : tate tenn | wnras [mmese] pas y be ba Clase Absoluta 7 2 co t > [8,5 - 10,5] 95 4 38 > [10,5 - 12,5[ 14,5 8 92h > (12,5 - 14,5, 13,5 8 108 [245 - 165/ 15,5 7 > 65 - 13, 5/ 175 3 52,5 _| > N=30 > > > , > 2 = 133 » 30 ¥ Ventajas y desventajas de Ia Media Aritmética . Entre las ventajas y las desventajas de la Media Aritmética tenemos: . ~ [Link] concepto ampliamente conocido y empleado en todas las actividades, Es un valor fécilmente calculable por simple suma o divisién entre sus datos observados, , Es un valor Gnico, es decir que un conjunto de datos posee solo una media aritmética, % Es muy sensible a los valores extremos * El cdlculo de la media aritmética de una dlasificacién de datos, solo es una aproximacién del valor que se obtenda, respect al célcuo si los datos no estaban clasificados * No se puede caicular la Media Aritmética de una dlasificacién de datos abierta, por elem, cuando el primer intervalo no posee extreme inferior o el utimo intervalo no pose extremo superior Pogina 2n ESTADISTICA 3.4, MEDIANA (A/, ) Es otra medida de tendencia central que se utiliza con mucha frecuencia es la median, que es el valor situado al centro de un. Conjunto de observaciones ordenadas por magnitud reciente o decreciente, ademés la mediana es una medida promedio, que divide al ‘conjunto de observaciones en dos partes iguales, 50% para un lado y 50% al otro fado. 3.4.1. Mediana para datos no agrupados En un Conjunto de datos no agrupados la mediana se calcula de la siguiente manera. 2) Cuando el niimero de datos en impar Inicialmente se debe ordenar los datos, en el orden de magnitud creciente o decreciente, Para luego determinar la mediana utilizando la siguiente formula x = Xena Ejemplo: @Dadbo el conjunto de datos hallar la mediana? Pe EASE Tae Qi a ekg ler Paso: ordenar Sees a eS ee, Be ae Me te AES Me= Xoo > D> Mn=4 ») Cuando el niimero de datos en par Inicialmente se debe ordenar los datos, decreciente, para luego calcular la Median 105 dos valores del conjunto de datos, Ejemplo: éDado el conjunto de datos hallar la mediana? 2 5 7 6 4 Jer Paso: ordenar Peed Be giitg Vig c, xX % MM Ke ing agg en el orden de magnitud creciente o 'a, la mediana es la media aritmética de aT ine ey (MSc. ng. 3004 Miguel Espinoza Tejerine Pogina 29 PAAAOOnese 99998 ° 1, Mediana para datos agrupados fos agrupades se suele utilizar ef método de distribucién de frecuencias Para encontfar Ta” mediana ae interpolacién, que exige la construccién de una tabla dk acumuladas absolutas. 4 2 » > > . 2 En primer lugar, se localiza la clase que con > ° . > > ) ) iene el valor de ta mediana, para después determinar la posicién de la mediana dentro dela clase, mediante interpolacién. La clase que contiene la mediana, es la dase cuyo frecuencia acumulada absoluta sea inmediatamente superior al valor de la mitad del total de abservaciones, una vez que $e identifica a esta clase, utilizando ta siguiente formula: se determina el valor de la mediana ane ye 5 Fac 2 5 7 Me te inferior del intervalo de fa clase Foc Es la frecuencia acumulada absoluta que precede (antes) ala clase que contiene 18 mediana C: intervato de fa clase. fa: Frecuencia absoluta del intervalo de la clase Pdgina 30 igual Espinoza Teer Limites Nominoles us bn $3,5{ 5 43,5 [43,5 = 54,5 (54,5 - 65,51 [65,5 - 7651 _| [76,5 - 87,5 Me = er Paso: Localizamos la clase que contiene la Mediana 42 «2-2 Faery f= 15 Me= 54s E117}, Ventajas y desventajas de la Mediana I ==> Me=57,43 7 La mediana es facil de comprender y puede ser rapidamente calculada a pattir de cualquier tipo de datos ¥ La mediana esta afectada por el nimero de observaciones y no por la magnitud de ‘cualquier valor extremo Y Se puede calcular la mediana inclusive de datos de una variable cualitativa ordinal * Para calcular la mediana antes se debe ordenar los datos, ‘cuando el ntimero de datos es alto, €s fécil comprender que esto significara un gran consumo de tiempo NN ‘MSc. ne Sou Miguel Espinozs Tjorne Pagina 31 ESTADISTICA! x _Qertos proceeimientos estadisticns que usan la mediana, son mis complejos que con ke media, x La mediana no es adecuada para manipulacione: 3.8, MODAN) algebraicas posteriores Es otra medikta de tendencia central es la moda o modo y es el valor que ocurre con mas ‘alta frecuencia en un conainto de observaciones. En algunos conjuntos de datos, la moda puede no exist, ono ser Unica en otros casos, 3.5.1, Moda para datos no agrupados Esta dado por el valor mas repetido en el conjunto de observaciones. Bjemplo Hallar fa moda del siguiente conjunto de datos. ae Se Ml a et A OS OR eo 2 oe My=2 3.5.2. Moda para datos agrupados Para datos agrupados en una distribucién de frecuencias con intervalos de clases iguales, la moda se obtiene mediante el método de interpolacién, que esta dada por la siguiente formula. \ \ Dende: 1.,:Es el limite inferior det intervato de ta clase ‘dy Diferencia entre ta far de la clase modal y la_fi: de ta clase precedente (anterior) ds Diferencia entre la_fu de ta clase modal y la fi! de ta clase siguiente C: intervalo de ta clase. Sc, tg tout Miguel Espnoze Teleing ESTADISTICAL Ejempio Dado la tabla de frecuencias hallar la Moda? Frecuencia Lmites Nominales Marca de | Frecuencia | Absoluta be ba Clase | Absoluta | Acumulada Mi fo Fa [24,5 32,5) 27 4 4 (32,5 - 43,5, 38 4 8 (43,5 - 54,5, 49 9 17 (54,5 - 65,51 60 15 32 (65,5 - 76,5, 74 5 37 (76,5 - 87,5[ 82 5 42 Ne42 Mo= L,+ a eG) Jer Paso: Localizamos la clase que contiene la Moda Datos: Losas q=6 i d, =10 Cnat Mo= 545 +(e Mo ~58,62 3.6. RELACION ENTRE LA MEDIA, MEDIANA Y MODA } En el caso de distribuciones unimodales, la mediana esta con frecuencia comprendida entre la media y la moda (incluso més cerca de la media). En distribuciones que presentan cierta inclinacién, es mas aconsejable el uso de la mediana, Sin embargo, en estudios relacionados con propésitos estadisticos y de inferencia suele ser inds apta fa media, LY fina 33 (MSc. Ing. Joué Miguel Espinoze Tejerine: Pagi ° ° ° ° > > > > > ) ) ) ) ) , ) , } ) ; ) E hides se ESTADISTICAL Cuando una distribucién de frecuencia es simétrica, ta media, mediana y moda coinciden en Su vator (X= Me = Mo), En el caso de una distribucién binomial sinétrica, es necesario calcular et promedio de las mod En una distribucidn sesgada a fa izquierda, la moda ¢s menor a ta mediana, y esta a su vez menor que la media (X < Mo < Me) En una distribucién sesgada a la derecha la relacién se invierte, fa moda es mayor a la ‘mediana, y esta a su vez mayor que la media (Mo > : suele utilizar cuando el simbolo d absoluto del elemento. Por ejemplo, para calcular la media de errores de medida. La media cuadritica de un conjunto de observaciones: x1, 12, [Link]-- Xn es fa raiz cuadrada de la Ma de los cuadrados de las observaciones. 3.8. FRACTILES Los fractiles son medidas que nos permiten dividir el conjunto de observaciones en partes iguales, los fractiles mas utilizados son: 3.8.1. Los Cuartiles (0, ) Divide el conjunto de observaciones en 4 partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos nn 2 Rn A RRR : Pagina 36 ESTADISTICAL a) Los Cuartiles para datos no agrupados b) Los Cuartiles para datos agrupados ! aee fa 3.8.2, Los Deciles (D, ) Divide el conjunto de observaciones en 10 partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. a) Los Deciles para datos no agrupados p= e,t ‘ 10 "2. b) Los Deciles para datos agrupados 3.8.3. Los Percentiles (7) Divide el conjunto de observaciones en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. PSO coincide con la mediana, a) Los Percentiles para datos no agrupados itn naa 10 +4 b) Los Percentiles para datos agrupados 100) fa (-sarrc Pot, +10 Me. ag Jd gue Eapnone Teer — Pagina 37 TRSeegqaagagqaeaes = e co e ; eTNTTTS rerrrr? Ejemplo 1, Segdin el siguiente Cuadro de Distribucidn de Frecuencia, a) La Media Aritmética b) La Mediana ©) La Moda d) Termino de Asimetria e) Cuartil 3 f) Decil 8 9) Percentil 85 630 > F 2 15375 80 b) La Mediana er Paso: Localizamos la clase que contiene ta Mediana as a 345 25 Me=7545 Il (MSc. ng. José Miguel Espinoze ESTADISTICA | ESTADISTICAL ——____tstaoisnica Ree NCL: Septet aie et c) La Moda / Mo= 1b, +(e aed, ‘Aer Paso: Localizamos la clase que contiene la Moda Datos: Ne sas d= 2-12 =9 d, = 21-6 =15 =5 9 Mo =74,54(—2_)+ ‘ Syp"s Mo 76,37 d) El término de Asimetria x . ° ° > ° ° ° > > ° . > . > , , » , J » > » > > > >» > ) > > ) ) » ) » > » » > > » > ESTADISTICA| Ejempto Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacién media de estos valores, OM=1,8 4.3.1, Desviacién Media para datos agrupados Para datos agrupados, en cuadro de distribucién de frecuencias la Desviat calcula utilizando la siguiente formulas: Sea el siguiente conjunto de datos x1, x2, Xs). Xu: Marca de clase Sea el siguiente conjunto de datos f., fa, fay fy: frecuencia absoluta Deviacién Media Muestral y Poblacional pu, = Saal 24. Avi gy Zest 4 n NS e NRE 4.4, La Varianza La Varianza es la principal medida de dispersién, ¢s la mas precisa y de mayor uso, més amplio es en la estadistica inferencial. SU uso Esta medida se obtiene calculando la media aritmética de la ‘muestra, y luego realizando ta sumatoria de las diferencias al cuadrado de todos los valores con respecto de la neces Luego se divide por el numero de observaciones. the Pégina 42 4.4.1, Varianza para datos no agrupados Sea ef sigulente conjunto de datos x1, Xa Xa formula es la siguiente: ates) net Xn: datos observados, su Hee Varianza Poblacional: 7? = Raalhony 4.4.1, Varianza para datos agrupados Para datos agrupados, en cuadro de distribucién de frecuencias la Varianza se calcula utilizando la siguiente formulas: Sea el siguiente conjunto de datos x1, Xa, Xs, Sea el siguiente conjunto de datos f1, fay fs. ini Marca de clase frecuencia absoluta Ejemplo. 4.5. Desviacién Estandar (Desviacién Tipica) La desviacién esténdar es la medida de dispersién més comin, que indica qué tan dispersos estén los datos con respecto a la media. Mientras mayor sea la desviacién estandar, mayor serd la dispersién de los datos. El simbolo o (sigma) se utiliza frecuentemente para representar la desviaci6n estandar de una poblacién, mientras que §se utiliza para representar la desviacin estandar de una muestra. Son las raices cuadradas de la Varianza de una Poblacién o Muestra respectivamente. 0 estan sesgados a la derecha; ‘si P = 0 estan distribuidos normalmente. Para ef caso de los datos del ejemplo anterior se tiene: _ 118.7-78.33) _ 9 03 P 12.14 Los datos estan un poco sesgados hacia la derecha. 5.1.1. Coeficiente de asimetria de Fisher Otra estimacidn del sesgo o coeficiente de asimetria se hace a través de momentos estadisticos (diferencias cohtra la media) como lo sugiere Fisher: LTA AN LI MSc. ng oud Miguel Eplnons Tajrine Pagina 49 _ESTADISTICAL My Sesgo= 2, “ayrT BO) Para la distribucién normal debe ser 0. trica si 7! °, asinétrica hacia la Se puede considerar que una distribucién es sin izquierda con ¥1<0 0 hacia la derecha YI> 0. Por ejemplo: be una distribucién con sesgo negativo 0 sesgada hacia la izquierda con Sesgo ret Nee ON se 1.01 Ejemplo De una distribucién con ESTADISTICAI 5.2, CURTOSIS, Ota caracteristica a medir de una curva de frecuencias es su perfil con respecto a la Curva Normal. & la curva normal se llama Mesocurtica, ala mas delgada Leptocurtica y la mas achatada Platicurtica, En la distribucién normal si no es acampanada Y es mas picuda o aplanada de lo normal se dice que tiene una Curtosis diferente de cero que es lo normal, si es mayor es mas picuda ‘© més plana al revés, Leptocurtica Mesocurtica Platicurtica &2>0 g2=0 R<0 COEFICIENTE DE CURTOSIS Mide ef grado de abstabuciin de Arecueneia, distabucion normal (que thataniient dhe ke Fespecto a Mt cura de tiene eveticremte igual at L soe ‘ la Gs ~ 89 mes st 12 distribucién es mesocirtica (plana normal) si ¥2=0 leptocirtica si ¥2>0 mag Puntiaguda que la normal o platicirtica (mas plana que la normal) con 72 <0, (MSW. Jud Miquel Eaptncan Tejera Pagina $1 ee ee ee re aa ee es ERE ES Pees fee Sat ed ale Rest oe oe ee ee, ee 5.2.1, Coeficiente de Curtosis de Fisher CAF evaltia la proximidad de los datos a su media x. Cuanto mayor sea la surna (xi x)3, mayor serd la asimetria, Sea el conjunto X=(x1, x2,..., xN), entonces la férmula de la asimetria de Fisher es: siendo 7 la media y 8, la desviacidn tipica Cuando los datos estén agrupados 0 agrupados en intervalos, la formula del coeficiente de asimetria de Fisher se convierte en: Siendo x, uno de los datos 0, en datos agrupados en intervalos, la marca de clase, ¥ la media, ny la frecuencia absoluta de ¥, 0 de cada intervalo i i S, la desviacién tipica + Si CAF > > > > > > J ) ) Giencias de la conducta (Editorial Trillas). William Mendenhall; Robert J., Beaver; Barbara M Beaver. Introduccién a la probabilidad y estadistica. Editorial Color S.A. México. 2004. Diferentes publicaciones de Revistas Cientificas, Informes técnicos, Boletines y . v publicaciones varias erin consultadas en el transcurso de la materia segin el tema. ANEXOS se, ng. José Miguel Expinoze Tejerina Pagina 54

También podría gustarte