Está en la página 1de 93

UNIVERSIDAD FEDERICO HENRQUEZ Y CARVAJAL

FACULTAD DE HUMANIDADES ESCUELA DE EDUCACIN CTEDRA DE ESTADSTICA

PROGRAMA Y MANUAL DE CLASES Asignatura Clave Pre-rrequisito Crditos Horas Tericas Horas prcticas Duracin Docente Fecha : : : : : : : : : ESTADSTICA I EST-200 MAT-102 3 (48 horas) 28 20 16 semanas (1 cuatrimestre) Lic. Juana De los Santos, M.A. Perodo Mayo-Agosto del 2012.

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

NDICE
CAPTULO INTRODUCCIN OBJETIVOS METODOLOGA Y ACTIVIDADES MATERIALES DIDCTICOS Y DE APOYO SISTEMA DE EVALUACIN Captulo I. ESTADSTICA. HISTORIA Y CONCEPTOS 1.1 Historia de la estadstica 1.2 Conceptos de estadstica 1.3 Importancia de la estadstica 1.4 Relacin de la estadstica con otras ciencias 1.5Desarrollo actual de la estadstica en la Repblica Dominicana PRCTICA CAPTULO I Captulo II. LA ESTADSTICA PARA LA TOMA DE DESICIONES 2.1 Tipos de estadstica 2.1.1 Estadstica descriptiva 2.1.2 Estadstica inferencial 2.2 Instrumentos de recoleccin de datos 2.3 Muestreo PRCTICA CAPTULO II Captulo III. LAS VARIABLES 3.1 Conceptos y generalidades 3.2 Tipos de variables 3.2.1 Variables por medicin 3.2.2 Variables por influencia 3.3 Escalas de medicin y manejo de datos PRCTICA CAPTULO III Captulo IV. DISTRIBUCIN DE FRECUENCIAS 4.1 Concepto 4.2 La distribucin normal 4.3 La distribucin de Poisson PRCTICA CAPTULO IV Captulo V. LAS MEDIDAS EN ESTADSTICA 5.1 Conceptos 5.2 Medidas de posicin 5.3 Medidas de centralizacin 5.4 Medidas de dispersin 5.5 Medidas de forma PRCTICA CAPTULO V Captulo VI. LOS GRFICOS 6.1 Definicin y clasificacin 6.2 Diagrama de tallo y hojas 6.3 Histograma de frecuencias 6.4 Diagrama de barras 6.5 Diagrama de pastel o circular 6.6 Plano de ejes cartesianos PG. 5 6 7 9 10 11 11 12 17 17 19 27 31 31 31 32 34 39 43 47 47 49 49 49 51 54 59 59 60 62 63 67 67 67 67 70 71 75 79 79 87 87 88 88 88 3

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO VI BIBLIOGRAFA

89 93

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

INTRODUCCIN
La estadstica ha formado parte del saber humano desde tiempos inmemoriales. Como ciencia, aunque relativamente nueva, se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. En ese sentido, este manual se ha elaborado con la finalidad de que el estudiante adquiera los conocimientos y las competencias necesarias de estadstica descriptiva para su desarrollo profesional y personal. Conceptualizamos la estadstica para predicciones pero nos circunscribimos a los mtodos de la estadstica descriptiva. Entendemos que estos conocimientos son necesarios para todas las reas del saber, ya que en cada una de ellas se realizan investigaciones. Adems de que siempre ser necesario hacer estimaciones acerca de la realidad de nuestra profesin o campo laboral. El presente manual agota dos captulos relativos a conceptos, historia, desarrollo y evolucin de la estadstica, desde antes de la era cristiana hasta nuestros das. Y hace un breve recuento del desarrollo de la misma en el pas. Y en los captulos subsiguientes se adentra en los conceptos de variables distribucin de frecuencias, muestreo y grficos con ejercicios y ejemplos para mejor comprensin del estudiante. Esperamos que de este material obtengan el mayor conocimiento posible. As como tambin que lo conserven como material de consulta, para materias futuras y para su vida profesional y laboral.

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

OBJETIVOS
General: Como objetivo general de esta asignatura se persigue que el estudiante aprenda, conozca y pueda aplicar y utilizar los diferentes mtodos estadsticos para el anlisis de datos dentro del marco de la estadstica descriptiva. As como tambin, que pueda utilizar los conceptos de la materia en los contextos y situaciones pertinentes. Especficos: Como objetivos especficos que el estudiante debe lograr al final de esta asignatura tenemos los siguientes: 1. Conocer los orgenes de la estadstica como ciencia aplicada y como concepto, as como su evolucin histrica, cientficos que aportaron a su desarrollo y crecimiento, sus ramas. Tambin se persigue que el estudiante conozca el desarrollo y uso de la estadstica en la Repblica Dominicana. 2. Conceptualizar y diferenciar los tipos de estadstica. Los alcances de la misma dentro de su tipologa, su importancia y uso en diferentes reas. 3. Aprender la forma de recoleccin de datos de una poblacin, el tratamiento de dichos datos para su consecuente anlisis y elaboracin de conclusiones respecto a los mismos. 4. Utilizar y aplicar los mtodos estadsticos adecuados para la poblacin y el tipo de estudio a realizar. 5. Ensear y desarrollar las habilidades y competencias necesarias para la elaboracin de grficos variados de la informacin obtenida en una investigacin.

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

METODOLOGA Y ACTIVIDADES
El desarrollo de la asignatura se realizar de la siguiente manera: El perodo del que se dispone para el desarrollo de los contenidos de la materia es de cuatro meses, equivalentes a 16 semanas, durante las cuales se impartirn clases una vez por semana en sesiones o jornadas de tres (3) horas cada una, en congruencia con los crditos aprobados de la misma. En ese sentido, se pretende en la primera semana, luego de la presentacin del docente y los estudiantes, exponer y discutir con los estudiantes el programa del curso, los objetivos, las unidades de contenido, as como las actividades y tareas fuera y dentro del aula que debern realizar. Tambin, en esta primera parte, se dar a los estudiantes una evaluacin diagnstica, para compararla con la evaluacin final y, ponderar si los objetivos fueron alcanzados o no. Para esta asignatura se ha preparado un manual en el cual se recopilan los diferentes contenidos a ser desarrollados en el transcurso de la misma. El mismo contiene, al final de cada captulo, una prctica de lo estudiado y explicado, y que el estudiante deber realizar. Estos ejercicios forman parte de las horas de prctica de la asignatura y la estrategia de llenado, individual o grupal, en el aula o en la casa, lo determinar el docente de acuerdo a la conveniencia de los alumnos y la disponibilidad de tiempo. Los contenidos se dividirn en tres bloques y al final de cada uno se har una evaluacin parcial de los mismos. Por lo tanto, para ir acorde con el tiempo, cada semana se agotar un captulo y su correspondiente prctica. En el primer bloque se agotarn los dos primeros captulos con sus prcticas y en la cuarta semana de clases se realizar la evaluacin de este primer bloque primer parcial. En ese mismo orden, en el segundo bloque se agotarn los captulos 3 y 4 con sus prcticas, a razn de un captulo por semana, y su evaluacin se realizar en la octava semana de clases, la cual equivale al segundo parcial. Finalmente, en el tercer bloque se agotarn los captulos 5 y 6 del programa con sus correspondientes prcticas. La evaluacin final, la evaluacin del curso y del profesor se llevarn a cabo en la ltima semana de clases, semana nmero 15 16. Las actividades a realizarse dentro de la clase sern exposiciones grupales, trabajos individuales y en grupo, tanto dentro como fuera del aula, cuya organizacin se describe a continuacin. Luego de presentado el curso y de que cada estudiante cuente con los materiales didcticos esenciales para el desarrollo de la asignatura, se proceder a dividirlo en grupos de acuerdo al qurum del curso. Cada semana, un grupo, o un estudiante, expondr el tema de la semana, tomando en cuenta las pautas previamente dadas por la maestra para dicha exposicin y con lmite de tiempo. Luego de cada exposicin, la maestra proceder a explicar ms detalladamente los tpicos bsicos que deben obtenerse de ese captulo y dar participacin a los estudiantes para que aclaren sus dudas, pregunten o aporten al tema, ya sea con datos tericos o con experiencias personales. Asimismo, por su parte, el alumno deber entregar un resumen de 5 a 10 pginas del captulo dado, hecho a mano y utilizando bolgrafos azul, rojo y negro. El azul para los ttulos y subttulos, el negro para los textos y el rojo para los subrayados. Dependiendo del tiempo que se disponga, se realizar la prctica del captulo contenida en el manual de la clase, y de no ser posible realizarla y discutirla en la clase, se dejar como tarea para la casa y se revisar, calificar, sellar y firmar antes de iniciar la siguiente clase. Tambin, al final de cada clase, la maestra dar a los alumnos un listado de palabras relacionadas con el tema discutido, las cuales sern buscadas en varios diccionarios y 7

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

enciclopedias, organizadas en orden alfabtico y que sern definidas en el cuaderno de dibujo (con hojas en blanco, sin lneas) previamente solicitado. Se requieren bolgrafos rojo, azul y negro. Con el azul se escribirn los ttulos o las palabras para el diccionario, con el rojo se subrayarn los ttulos y palabras a definir en el diccionario y con el negro de escribirn los textos, las definiciones del diccionario temtico y las preguntas tericas de las prcticas por captulo. El subrayado deber hacerse con regla para que quede lo mejor posible. El cuaderno rayado se utilizar para los apuntes de los alumnos con relacin a las explicaciones de la maestra durante la clase. Al final de la materia, para completar los puntos de la prctica, se elaborar un trabajo final, con las especificaciones que la maestra aportar. El mismo deber ser entregado va e-mail en la fecha determinada, de acuerdo al calendario acadmico.

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

MATERIALES DIDCTICOS Y DE APOYO


Para el curso de esta materia, cada estudiante deber tener los siguientes materiales didcticos y de apoyo: 1. Manual-Compendio de ESTADSTICA I 2. Cuaderno normal 3. Cuaderno de dibujo (para elaborar diccionario temtico) 4. Lpiz No. 2 5. Lapiceros Rojo, Azul y Negro 6. Borrador en goma, sacapuntas y corrector lquido 7. Juego de reglas. (Rectas, tringulos transportador) 8. Resaltadores 9. Calculadora

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

SISTEMA DE EVALUACIN
En esta asignatura, el sistema de evaluacin ser como sigue: Las horas de teora sern evaluadas en base a 70 puntos y las horas de prctica en base a 30 puntos, para un total de 100 puntos. Ahora bien, estas puntuaciones se obtendrn de la manera siguiente: BLOQUE TERICO: Primer parcial + Reportes de lectura 20 puntos Segundo parcial + Prctica Manual 20 puntos Tercer parcial + Diccionario temtico 30 puntos Sub-total 70 puntos BLOQUE PRCTICO: Exposicin + Trabajo final 20 puntos Asistencia + participacin 10 puntos Sub-total 30 puntos TOTAL GENERAL 100 puntos

10

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo I. LA ESTADSTICA: HISTORIA Y CONCEPTOS


1.1 Historia de la estadstica
El trmino alemn Statistik, introducido originalmente por Gottfried Achenwall en (1749), se refera al anlisis de datos del Estado, es decir, la "ciencia del Estado" (o ms bien, de la ciudad-estado). Tambin se llam aritmtica poltica de acuerdo con la traduccin literal del ingls. No fue hasta el siglo XIX cuando el trmino estadstica adquiri el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar britnico Sir John Sinclair (1754-1835). En su origen, por tanto, la Estadstica estuvo asociada a los Estados o ciudades libres, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de datos acerca de estados y localidades contina ampliamente a travs de los servicios de estadstica, nacionales e internacionales. En particular, los censos comenzaron a suministrar informacin regular acerca de la poblacin de cada pas. As pues, los datos estadsticos se referan originalmente a los datos demogrficos de una ciudad o estado determinados. Y es por ello por lo que en la clasificacin decimal de Chester Dewey empleada en las bibliotecas, todas las obras sobre estadstica se encuentran ubicadas al lado de las obras de o sobre la demografa. En la Biblia observamos en uno de los libros del Pentateuco, bajo el nombre de Nmeros, el censo que realiz Moiss despus de la salida de Egipto. Textualmente dice: "Censo de las tribus: El da primero del segundo ao despus de la salida de Egipto, habl Yavh a Moiss en el desierto de Sina en el tabernculo de la reunin, diciendo: "Haz un censo general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por cabezas los nombres de todos los varones aptos para el servicio de armas en Israel". Igual tipos de datos en varios libros que conforman la Biblia. Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 A.c.., datos relativos a la poblacin y a la riqueza del pas. De acuerdo al historiador griego Herodoto, dicho registro de riqueza y poblacin se hizo con el objetivo, de preparar la construccin de las pirmides. En el mismo Egipto Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. Pero fueron los romanos, maestros de la organizacin poltica, quienes supieron mejor emplear los recursos de las estadsticas. Cada 5 aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar 11

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

nacimientos, de funciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de la riqueza contenida en las tierras conquistadas. Otro pueblo que desarroll y utiliz la estadstica fueron los Babilonios, quienes vivieron en Mesopotamia, en unos claros de tierras frtiles entre los ros Tigris y ufrates, hacia finales del milenio IV a.C. Desarrollaron una forma abstracta de escritura basada en smbolos cuneiformes. Sus smbolos fueron escritos en tablas de arcilla mojada cocidas al sol. Y gracias a las que han sobrevivido hasta nuestros das se ha podido conocer, entre otras cosas, gran parte de las matemticas babilnicas as como los sus aportes a la estadstica. El aspecto ms asombroso de las habilidades de los clculos de los Babilonios, fue su construccin de tablas para ayudar a calcular. Hacia el ao 3000 A.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Sin embargo, el aporte ms importante de los Babilonios a la estadstica fue el Teorema de Pitgoras. Este teorema, aunque ms aplicado en trigonometra, represent un aporte muy valioso para la estadstica, sobre todo porque demostr conexiones entre las desviaciones estndar y variables independientes con el Teorema de Pitgoras, as como la correlacin entre variables aleatorias dependientes y la ley de cosenos. La civilizacin China muestra registros sobre el uso de estadstica, realizada en los censos, aproximadamente en el ao 2000 a.C . Confucio, en uno de sus clsicos "Shu-King" escrito hacia el ao 550 a.C., nos narra cmo el Rey Yao en el ao 2238 mand hacer una estadstica agrcola, industrial y comercial. Dichos datos representan la primera referencia escrita sobre estadstica que se conoce. Sin embargo, los aportes ms relevantes de los chinos a la estadstica, provienen de su desarrollo de las matemticas y la geometra. El trabajo ms antiguo existente sobre geometra en China proviene de la filosofa Mohista (c. 330 a.C.), compilado por los seguidores de Mozi (470 a.C.-390 a.C.). El Mo Jing describe diversos aspectos de muchos campos relacionados con la ciencia fsica, y proporcion informacin sobre las matemticas. La dinasta Han (202 a.C.-220 d.C) produjo obras matemticas que presumiblemente se ampliaron en otras que ahora estn perdidas. La ms importante de ellas es Los Nueve Captulos sobre el Arte de Matemticas, cuyo ttulo completo apareci en 179 d.C., pero que previamente existi, en parte, bajo otros ttulos. . Los chinos tambin 12

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

desarrollaron el tringulo de Pascal y la regla de tres mucho antes de que se conociera en Europa. Zu Chongzhi (siglo V), de las Dinastas del Sur y del Norte, calcul el valor de (pi=3.1415926 y establece la relacin entre la circunferencia y su dimetro) con siete decimales, que fue el ms preciso valor de durante casi 1000 aos, adems de aportes al chi cuadrado Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos. Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. John Graunt fue un innovador en el anlisis estadstico. Entre los siglos XIX y XX, la Estadstica se propag a travs de diversas disciplinas: la astronoma y la geodesia, la psicologa, la biologa, hasta las ciencias sociales. Y tambin profundiz en el conocimiento del rol de la probabilidad, siendo desplazada la analoga de los juegos de azar, por modelos probabilsticos para efectuar medidas bajo incertidumbre. De este modo se llega a los inicios de la inferencia estadstica, cuyo dominio de aplicacin se extiende gradualmente, desde fines de este perodo. A Gottfried Achenwall se le conoce como el Padre de la Estadstica. l fue quin introdujo y utiliz el trmino statistik para referirse al anlisis de datos. Sin embargo, son muchos los personajes que, a travs de la historia de la humanidad, le han aportado y han desarrollado la estadistica. Entre ellos tenemos los siguientes, entre otros: A. M. Legendre, matemtico y estadstico francs, 1752-1833. Cre un sistema para describir el movimiento planetario, que involucra el mtodo de los mnimos cuadrados, tan utilizado en la Estadstica de hoy, como mtodo de estimacin de parmetros. Karl Gauss, matemtico, astrnomo, fsico alemn, 1773-1855. Desemboc en la ley de probabilidad normal independientemente de Laplace, como descripcin probabilstica del error, pero encontr su asociacin con el mtodo de mnimos cuadrados. Dise la famosa campana de Gauss o de distribucin normal. Adolphe Quetelet, matemtico, meteorlogo, astrnomo, estadstico, socilogo belga, 17811840. Se le ha llamado el padre de la Estadstica moderna, por observar la extraordinaria regularidad con que se reproducan ciertos fenmenos sociales, como crmenes o suicidios. 1835. Simen Denis Poisson, matemtico y fsico francs, 1781-1840. Public en 1837 el germen de dos elementos asociados a su nombre: La distribucin de Poisson y La generalizacin de la ley de los grandes nmeros de Bernoulli. William Playfair (1759-1823) expone su idea de que los grficos permiten una comunicacin ms eficiente que las tablas de frecuencia. Es considerado como el inventor de los grficos lineales, de barras y de sectores. Playfair public el libro titulado The Commercial and Political 13

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Atlas (1786) el cual contiene 43 grficos de series de tiempo y por primera vez, es usado un grfico de barras. En 1801 utiliza el primer grfico de sectores en su obra Playfairs Statistical Breviary. Sir Francis Galton (1822-1911) cre el concepto estadstico de regresin y correlacin, y fue el primero en aplicar mtodos estadsticos para estudiar las diferencias humanas, basado en el uso de cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadstico estadounidense quien desarrollo la primera mquina tabuladora basada en tarjetas perforadas y mecanismos elctrico-mecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada en el censo de 1890 en estados unidos que redujo la tabulacin de los datos de 7 aos (censo de 1880) a 2.5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR), que bajo la presidencia de Thomas J. Watson fue renombrada a International Business Machines (IBM) en 1924. Major Greenwwod (1880-1949) investiga los problemas de salud asociados al trabajo en fbricas. Desarroll la Epidemiologa y en 1919 cre el Ministerio de la Salud en Inglaterra, responsable de datos estadsticos mdicos. Sir John Sinclair (1754-1835). Fue la primera persona que introdujo el trmino estadstica en Inglaterra con su trabajo Statistical Account of Scotland (1791-1799) trabajo compilado en 21 volmenes. Orgenes en probabilidad La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, la ciencia y la filosofa para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas complejos. La idea de Probabilidad est ntimamente ligada a la idea de azar y nos ayuda a comprender nuestras posibilidades de ganar un juego de azar o analizar las encuestas. Pierre-Simon Laplace afirm: "Es notable que una ciencia que comenz con consideraciones sobre juegos de azar haya llegado a el objeto ms importante del conocimiento humano". Comprender y estudiar el azar es indispensable, porque la probabilidad es un soporte necesario para tomar decisiones en cualquier mbito. Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento cientfico que se conoce a la materia. El Ars coniectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemticas. En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica. La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teora de la discusin de errores de observacin. La reimpresin (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos lmites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad. Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinacin de observaciones desde los principios de la teora de probabilidades. Laplace represent la Ley de probabilidades de errores mediante una curva y dedujo una frmula para la media de tres observaciones. Tambin, en 1871, 14

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

obtiene la frmula para la ley de facilidad del error (trmino introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo producto de las probabilidades de un sistema de errores concurrentes. El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin de la localizacin del planeta enano Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para , el probable error de una observacin simple es bien conocido. El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadstica y quien introdujo la nocin del hombre promedio (lhomme moyen) como un medio de entender los fenmenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.

1.2 Conceptos de estadstica


Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc. Slo cuando nos adentramos en un mundo ms especfico como es el campo de la investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones prcticas que entraan incertidumbre. La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. La estadstica es la ciencia que estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. Antiguamente, se haca referencia de la estadstica como la rama de las matemticas encargada de reunir, organizar y analizar datos numricos, lo cul ayudaba a resolver problemas como el diseo de experimentos y toma de decisiones. 15

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Se define tambin como el conjunto de indicadores numricos que caracterizan diferentes aspectos de la vida social, incluyendo la produccin, las relaciones polticas, culturales de la vida cotidiana. O bien, la recopilacin, presentacin anlisis e interpretacin de los datos numricos. La estadstica se refiere a las colecciones sistemticas de datos relativos a un fenmeno. Desde los comienzos de la civilizacin han existido formas sencillas de la estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. La palabra "estadstica" procede del latn statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "poltico"). La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: - Recogida de datos. - Organizacin y representacin de datos. - Anlisis de datos. - Obtencin de conclusiones. Conceptos utilizados en Estadstica. Poblacin. Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo o sujeto. Unidad estadstica, cada uno de los elementos que componen la poblacin. Muestra. Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo. El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Frecuencia: es el nmero de repeticiones de un dato en la distribucin o del total de observaciones. Smbolos estadsticos = infinito

= sigma = sumatoria

< = menor que > = mayor que

= igualdad equivalente

Estudios experimentales y observacionales Un objetivo comn para un proyecto de investigacin estadstica es investigar la causalidad, y en particular extraer una conclusin en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadsticos para estudiar causalidad: estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo. 16

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

1.3 Importancia de la estadstica


Son muchos los fenmenos o sucesos que no tienen respuesta alguna, es por esto, que se debe proceder a hacer estudios pertinentes que aclaren la situacin que se desea analizar, este hecho se logra por medio de la experimentacin constante que muestra cada uno de los resultados que se van obteniendo con ayuda de la estadstica la cual permite que aquellas situaciones impredecibles se pueden volver cada vez mas explicativas. La Estadstica puede dar respuesta a muchas de las necesidades que la sociedad actual puede experimentar. Su tarea fundamental es la reduccin de datos que se obtiene a partir de experimentos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla. Debemos reconocer que la estadstica permite la recoleccin de datos importantes para el estudio de situaciones que a diario se presentan y permite dar respuesta a todos estos problemas de una forma til y significativa. Para que una investigacin pueda ser realmente vlida se debe tener en cuenta las tcnicas de muestreo, las cuales facilitan la obtencin de resultados precisos e importantes para tener en cuenta al momento de darle solucin a la situacin que se est estudiando y de esta forma inferir en conclusiones sobre las poblaciones a partir del anlisis de las muestras. En todo momento se utiliza la estadstica, es por esto, que de alguna manera debemos reconocer que esta ciencia ha trascendido a travs del tiempo y cada da adquiere mas valor, el censo de una poblacin es una de las causas mas simples del reconocimiento de la estadstica, tambin por medio de sta podemos observar la planificacin del estado en cuanto a los estratos socioeconmicos, aunque sin desconocer que otros temas de mucha mas importancia la enriquecen, como lo son las demandas de los productos, la investigacin de mercados la cual se basa en un estudio que permite conocer las necesidades y deseos de los consumidores, el control de calidad de los productos, etc.

1.4 Relacin de la estadstica con otras ciencias


La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica, debido al gran campo de aplicacin que posee. La investigacin en Psicologa, Sociologa y Educacin, al igual que ocurre en otras ciencias, en buena medida se basa en el manejo de recursos estadsticos como elementos indispensables para llegar a conclusiones aceptables por el resto de la comunidad cientfica. Dada la peculiaridad de su objeto de estudio, inabordable en la mayora de los casos si no es a travs de perspectivas complejas de relacin entre variables, la atencin de los investigadores en las ciencias humanas y sociales se concentra cada vez ms en la llamada Estadstica Multivariante. Los diseos complejos de investigacin y anlisis, las aportaciones ms recientes de la informtica para la aplicacin de tcnicas avanzadas de manipulacin de datos y la discusin de estos aspectos desde perspectivas tericas y aplicadas, preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano es el estudio de cmo se investiga, haciendo de ello su especialidad. Paralelamente, otras especialidades dentro de estas ciencias utilizan el conocimiento ya elaborado y retransmitido, preocupadas ms por los resultados y posibilidades que por las condiciones de aplicacin y el fundamento de uso, de tal forma que se ha propiciado 17

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

la utilizacin de las tcnicas estadsticas, sin considerar la adecuacin de stas a las condiciones en las que se aplican. A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por avances vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982; Rossi y otros, 1983), y muy especialmente en la psicologa (Judd y otros, 1995), lo que favorece una absorcin de poca calidad por parte de los especialistas en reas no metodolgicas. Por otro lado, la adopcin de procedimientos informticos para realizar tareas metodolgicas no parece ser una solucin inmediata, considerando la ansiedad que generan los ordenadores, fenmeno muy generalizado (Faria y Arce, 1993). La fusin de esta creciente complicacin de las herramientas de anlisis, junto con la discrepancia entre los objetivos de formacin y la necesidad de uso de los recursos estadsticos, consigue finalmente que el especialista en reas aplicadas tienda a descuidar aspectos muy bsicos, previos a la aplicacin de estos recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la aplicacin de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el sentido de aplicarse para permitir la ejecucin de una prueba o el ajuste de un modelo, no porque son las estrategias ms adecuadas, sino porque son las ms cmodas La fsica estadstica o mecnica estadstica es la parte de la fsica que trata de determinar el comportamiento agregado termodinmico de sistemas macroscpicos a partir de consideraciones microscpicas utilizando para ello herramientas estadsticas junto a leyes mecnicas. La fsica estadstica puede describir numerosos campos con una naturaleza estocstica (reacciones nucleares, sistemas biolgicos, qumicos, neurolgicos, etc.). La estadstica industrial es la rama de la estadstica que busca implementar los procesos probabilsticos y estadsticos de anlisis e interpretacin de datos o caractersticas de un conjunto de elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y en el control de los procesos industriales y organizacionales. La historia es la ciencia que tiene como objeto de estudio el pasado de la humanidad y como mtodo el propio de las ciencias sociales. Se denomina tambin historia al periodo histrico que transcurre desde la aparicin de la escritura hasta la actualidad. Es considerada "la ciencia de las ciencias" por englobar en su estudio multitud de otras ciencias, a priori sin relacin a ella. Ms all de las acepciones propias de la ciencia histrica, historia en el lenguaje usual es la narracin de cualquier suceso, incluso de sucesos imaginarios y de mentiras. En medicina se utiliza el concepto de historia clnica para el registro de datos sanitarios significativos de un paciente, que se remontan hasta su nacimiento o incluso a su herencia gentica. En la historia la estadstica cumple una funcin primordial para poder ubicar en el tiempo y en el espacio cada uno de los acontecimientos desde la creacin del universo. La bioestadstica, de forma general, es la aplicacin de la estadstica a la biologa. Debido a que las cuestiones a investigar en biologa son de naturaleza muy variada, por ejemplo, la medicina, ciencias agropecuarias y forestales, la bioestadstica ha expandido sus dominios para incluir cualquier modelo cuantitativo, no slo estadstico, que pueda ser usado para responder a estas necesidades. La bioestadstica puede ser considerada como una rama, altamente especializada, de la informtica mdica que puede ser, a su vez, complementada por la bioinformtica. 18

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Algunos campos de investigacin usan la estadstica tan extensamente que tienen terminologa especializada. Estas disciplinas incluyen: Ciencias actuariales Fsica estadstica Estadstica industrial Estadstica Espacial Matemticas Estadstica Estadstica en Medicina Estadstica en Nutricin Estadstica en Agronoma Estadstica en Planificacin Estadstica en Investigacin Estadstica en Derecho Estadstica en Restauracin de Obras Estadstica en Literatura Estadstica en Astronoma Estadstica en la Antropologa (Antropometra) Estadstica en Historia Estadstica Militar Geoestadstica Bioestadstica Estadsticas de Negocios Estadstica Computacional Estadstica en las Ciencias de la Salud Investigacin de Operaciones Estadsticas de Consultora Estadstica de la educacin, la enseanza, y la formacin Estadstica en la comercializacin o mercadotecnia Cienciometra Estadstica del Medio Ambiente Estadstica en Epidemiologa Estadstica econmica (Econometra) Estadstica en Ingeniera Geografa y Sistemas de informacin geogrfica, ms especficamente en Anlisis espacial Demografa Estadstica en psicologa (Psicometra) Calidad y productividad Estadsticas sociales (para todas las ciencias sociales) Cultura estadstica Encuestas por Muestreo Anlisis de procesos y quimiometra (para anlisis de datos en qumica analtica e ingeniera qumica) Estadsticas Deportivas

1.5 Desarrollo actual de la estadstica en la Repblica Dominicana


Durante el siglo XX, la creacin de instrumentos precisos para asuntos de salud pblica (epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa de desempleo, econometra, etc.) necesit de avances sustanciales en las prcticas estadsticas. Hoy el uso de la estadstica se ha extendido ms all de sus orgenes como un servicio al Estado o al 19

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

gobierno. Personas y organizaciones usan la estadstica para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras reas. La estadstica es entendida generalmente no como un sub-rea de las matemticas sino como una ciencia diferente aliada. Muchas universidades tienen departamentos acadmicos de matemticas y estadstica separadamente. La estadstica se ensea en departamentos tan diversos como psicologa, educacin y salud pblica. Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos cristalizados en una roca o de bienes manufacturados por una fbrica en particular durante un periodo dado. Tambin podra ser un proceso observado en varios ascos instantes y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones prcticas, en lugar de compilar datos de una poblacin entera, usualmente se estudia un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadsticamente lo cual sigue dos propsitos: descripcin e inferencia. El concepto de correlacin es particularmente valioso. Anlisis estadsticos de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la poblacin bajo consideracin) tienden a variar conjuntamente, como si hubiera una conexin entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte podra resultar en que personas pobres tienden a tener vidas ms cortas que personas de mayor ingreso. Las dos variables se dicen que estn correlacionadas. Sin embargo, no se puede inferir inmediatamente la existencia de una relacin de causalidad entre las dos variables. El fenmeno correlacionado podra ser la causa de una tercera, previamente no considerada, llamada variable confusora. Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas en la muestra pueden ser extendidas a la poblacin completa. Un problema mayor es el de determinar que tan representativa es la muestra extrada. La estadstica ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los datos, as como mtodos para disear experimentos robustos como primera medida, ver diseo experimental. El concepto matemtico fundamental empleado para entender la aleatoriedad es el de probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama de las matemticas aplicadas que usa la teora de probabilidades y el anlisis matemtico para examinar las bases tericas de la estadstica. El uso de cualquier mtodo estadstico es vlido solo cuando el sistema o poblacin bajo consideracin satisface los supuestos matemticos del mtodo. El mal uso de la estadstica puede producir serios errores en la descripcin e interpretacin, afectando las polticas sociales, la prctica mdica y la calidad de estructuras tales como puentes y plantas de reaccin nuclear. Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser difcilmente interpretados por un inexperto. Por ejemplo, el significado estadstico de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada por una variacin aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadsticas bsicas (y el escepticismo) que una persona necesita para manejar informacin en el da a da se refiere como cultura estadstica. Sin un dominio certero sobre la misma, como instrumento de simple cuantificacin la Estadstica apareci en nuestro pas "desde los primeros aos de su descubrimiento" (Trujillo y la 20

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Estadstica. Nicols Rizik H. Editora Montalvo, 1945). En la Repblica Dominicana se impone un examen de las diferentes fases de evolucin, la cual dividiremos en perodos, contados a partir del 1942, de la manera siguiente: 1492-1843; 1844-1904; 1905-1934; 1935-1960; y 1961 hasta 1975. Y posteriormente haremos un resumen reciente de los acontecimientos acaecidos en el quinto perodo, desde 1971 a 1998. PRIMER PERIODO 1492-1843. Entre los acontecimientos Estadsticos importante de este perodo figuran las informaciones Estadsticas sobre el repartimiento de Indios de 1514; el Censo de Osorio de 1606, el cual contiene un recuento de la poblacin, esclavos, ingenios, hatos, estancias de jengibres y puertos en las costas; los "censos "de 1780 (parroquial); el de 1819 y el censo de 1824 efectuado por el invasor haitiano. En realidad estos "censos" (que ms bien eran recuentos) y la recoleccin de informaciones limitadas, ligadas al comercio exterior, constituyen las actividades Estadsticas ms importantes de este perodo. Un hecho que merece ser citado es que aparece en el archivo de Monte Plata, en el ao 1821, un acta que dice que el ayuntamiento de aquella comn vot la suma de sesenta pesos para instalar un servicio de Estadstica", sin embargo, no se conoce ningn otro hecho que d continuidad histrica a ste. SEGUNDO PERIODO 1844-1904. Segn Don Vicente Tolentino Rojas, a partir de 1844, ao de la Independencia Nacional, figura "en todas las cartas constitucionales, como expresa atribucin del congreso, la de determinar todo lo concerniente a la formacin peridica de la Estadstica general de la Repblica". Es decir, se muestra el ms alto nivel de la necesidad de organizar el sistema Estadstico. Las Estadsticas se producen en el sector poblacin, debido a la necesidad de contar con informaciones sobre este importante aspecto, por consideraciones de tipo poltico, religioso y legal. As en 1845 se dicta la" ley sobre ayuntamientos; que otorga a los cabildos del pas el derecho de organizar las Estadsticas de poblacin. Otro intento de organizacin sectorial se produce en 1844, esta vez con las Estadsticas de comercio exterior fundamentalmente; esto se materializa con el decreto del entonces Presidente Ulises Heureaux, de fecha 17 de junio de ese ao, mediante el cual se creaba, adscrito a la contadura General de Hacienda "Un Negociado de Estadstica Mercantil, a cargo de un director y de los dems empleados, que al curso de los trabajos revelar". De acuerdo con las atribuciones fijadas en el mismo, para el negociado en referencia, estas se referan tan solo a la indagacin de las cifras del comercio Exterior, comercio de cabotaje, navegacin exterior costanera y navegacin interior o fluvial. En ste ao el Congreso Nacional, voto por un decreto la suma de RD$4,500.00 para remunerar el trabajo de la Estadstica mercantil del ao anterior, bajo las estipulaciones hecha por el ministro de Hacienda y Comercio que lo era entonces el seor Eugenio Generoso Marchena. Ambos intentos, aunque importantes, no llegaron a cumplir los limitados objetivos que se haban propuesto. En 1866 la ley suprimi las atribuciones dadas a los ayuntamientos, aparentemente por la ineficiencia de los mismos en cumplir con la tarea encomendada, y " en 1887 el ministro de Hacienda y Comercio se quejaba de la falta de datos ciertos sobre el comercio de exportacin y urga el que fueran dictadas disposiciones precisas, tanto para asegurarlos intereses fiscales, cuanto para hacer la Estadstica verdad." Entretanto, la Iglesia sigue valindose de " Censos Parroquiales" para estimar la poblacin y se realizan los Censos Parroquiales del 1863y 1887, los cuales enumeraban solamente la poblacin catlica, pero por ser esta la gran mayora sirvieron de buena base para estimar la poblacin total del pas. A fines del siglo XIX, en especial del 1885 a 1900, puede notarse una fuerte presin de parte de intelectuales y polticos por la creacin de los mecanismos burocrticos necesarios para la 21

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

organizacin del sistema Estadstico Dominicano. Esto se puede apreciar en las memorias del 883 y 1887 del ministerio de justicia, Fomento e Instruccin pblica, referentes a los datos de nacimientos y defunciones. La Estadstica de nacimientos acusan un sub-registro de un 25% y las defunciones de un 45%. Es decir, slo se registra el 75% de los nacimientos ocurridos y el 55% de las defunciones. En 1888, Jos Ramn Abad en" La Repblica Dominicana, resea general Geogrfico Estadstico" hace hincapis varias veces sobre la necesidad de organizar las Estadsticas Nacionales, dice" La cuenta y el libro en que se anotan las grandes operaciones de los pueblos, es la ciencia de la Estadstica, y sin contar con ella, sin tenerla establecida en todas sus ramas y derivaciones accesorias, no es posible que haya seguridad ni acierto en la direccin y manejo de los negocios pblicos. Un indicador del avance en cuanto a la importancia y necesidad de la Estadstica, lo constituye el "Censo de poblacin y otros datos Estadsticos de la ciudad de Santo Domingo". Levantado el 6 de diciembre de 1892. "Patrocinado por un grupo de altruistas ciudadanos, entre los que figuraban el poeta Jos Joaqun Prez, el pintor Luis Desangles, el escritor Vetilio Arredondo y otros intelectuales y muncipes prominentes de esa poca". El Censo efectu el conteo de la poblacin por sexo, estado civil, nacionalidad, alfabetismo. Adems, recolect informaciones sobre nacimientos y defunciones. Por otra parte obtuvo cifras sobre nmero de calles de la ciudad, de iglesias, cuarteles municipales, edificios pblicos, construcciones de mampostera y de madera, establecimientos de enseanzas, bibliotecas pblicas, libreras, peridicos, abogados, mdicos, agrimensores, dentistas, boticas, medios de locomocin y otros aspectos. Este perodo 1844-1904 es de suma importancia pues en el mismo adquiere el pas el grado de desarrollo socioeconmico que permite a un grupo bien formado tomar conciencia del valor de la Estadstica y la necesidad de que sea organizada en forma adecuada por el Estado. Las condiciones estn dada para que se produzca la ley que crea la oficina de Estadstica y con ello pasaremos al estudio del Tercer Perodo. TERCER PERIODO 1905-1934. En este perodo se crean los organismos administrativos y se implantan las disposiciones legales que permiten comenzar a echar las bases del sistema Estadstico Dominicano, el cual, sin embargo, no logra crecer y desarrollarse bastante en estos aos, sino que lo hace en perodos posteriores. En el 1905, siendo Presidente de la Repblica Carlos F. Morales Languasco, por resolucin 4607, publica en la Gaceta Oficial" 1616 del 9 de Septiembre, se crea la oficina Estadstica. Y aqu una limitacin de sta ley, a quien se menciona de la siguiente manera: " La Oficina de Estadstica estar obligada a requerir a los particulares todos los datos que stos puedan suministrarle". Con la disposicin, la obtencin de datos provenientes de particulares estaba sujeta a la buena voluntad de stos. Es evidente que un sistema Estadstico no puede organizarse sobre esa base. La ley 4879 publicada en la gaceta oficial 1997 del 3 de Junio del 1909, llamada" Ley sobre Estadstica Nacional" mejora sustancialmente la de 1905 y puede decirse que para esa poca, es una legislacin con carcter moderno. Segn la ley de referencia, La Estadstica de la Repblica Dominicana se llevara obligatoriamente y con toda seguridad. Establece, adems la obligatoriedad de ofrecer informaciones tanto a funcionarios pblicos como a particulares, llenando en este caso el gran vaco de la ley del 1905. En esta ley de 1909 se crean las siguientes secciones que forman parte de la oficina de Estadstica: 1. Seccin de Estadstica Demogrfica 2. Seccin de Censo 3. Seccin Sociogrfica 4. Seccin Comercial y Administrativa. 22

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

La Seccin de Estadstica. Demogrfica tendra a su cargo los datos sobre la poblacin, nacimientos y defunciones; la de Censo se encargara del movimiento migratorio, crecimiento vegetativo recopilacin y conservacin de documentos sobre censos; La Sociogrfica de las Estadsticas escolares, judiciales y eclesisticas y la seccin comercial y administrativa de las Estadsticas referentes a la administracin municipal, puertos, cabotajes y aduanas, correos, impuestos y ferrocarriles. El 24 de Diciembre del 1920 se levant el primer Censo Nacional de la poblacin, tarea efectuada por las fuerzas invasoras norteamericanas que a la Sazn ocupaban el pas. Este Censo contiene informaciones sobre poblacin por edad, Sexo y Estado Civil, sobre vivienda, agricultura y otras indagaciones. La experiencia censal del pas, en esa poca, era prcticamente nula y el Censo contiene deficiencias tales, como: 1.- Subnumeracin. 2.- Tabulacin de slo algunos grupos de edades, lo que limita al anlisis demogrfico y socioeconmico en general. 3.- Falta de "simultaneidad". Todava en los aos de 1921 y 1922 mediante rdenes ejecutivas 663 y 769, se aprobaron 3 mil dlares primero y quinientos pesos despus para continuar la recopilacin de datos. Estas deficiencias pueden explicarse, en parte, por las siguientes razones: 1.- El estado de intranquilidad poltica que viva el pas, ocupado entonces por fuerzas norteamericanas. 2.- Falta de experiencia y conocimientos sobre el tema, por parte de los responsables del trabajo. 3.- Una fuerte epidemia de viruela que atac la poblacin el pas en ese ao del 1920. 4.- Recursos Econmicos y materiales insuficientes 5. - La no asistencia de Asesores tcnicos en la oficina central. A pesar de sus limitaciones, esta publicacin contiene importantsimas informaciones para el ao que se efectu y constituye nuestra primera publicacin Censal con cierta amplitud en las caractersticas demogrficas y socioeconmicas examinadas. Fue publicado en 1923. En 1975, la UASD efectu una segunda edicin. Desde 1911 hasta finalizar este perodo, con excepcin del Censo, no se producen acontecimientos de trascendencia en la historia Estadstica Dominicana. CUARTO PERIODO 1935-1960. Este es, definitivamente, el perodo en que las Estadsticas en la Repblica Dominicana adquieren una organizacin y desarrollo que hacen que las consideren como algo imprescindible en una moderna administracin de gobierno. Dos acontecimientos importantes suceden en el ao de 1935: la realizacin del Censo de ese ao, levantado el 13 de mayo de 1935, y la promulgacin de la ley del 1 de noviembre de 1935 mediante la cual se encomienda el servicio de Estadstica a una oficina central, bajo la dependencia directa del Poder Ejecutivo por conducto de la Secretaria de Estado de la Presidencia. De la ejecucin de este Censo se encarg el Partido Dominicano. Segn la organizacin de la Oficina en ese ao, esta contaba con siete secciones: Demogrfica, Censo, Sociogrfica, Produccin, Economa, Climatolgica, Gobierno y Administracin y por ltimo Publicaciones. Debemos resaltar que los datos correspondientes al Censo de 1935, fueron publicados parcialmente en sus ms destacadas caractersticas por la Direccin General de Estadstica, y sus resultados han sido comparados, hasta donde ha sido posible, con los del Censo del 1950. La Oficina Nacional de Estadstica (ONE) es el rgano rector de las estadsticas oficiales del pas. Fue creada el 1 de noviembre de 1935, mediante la 23

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Ley No. 1023, bajo la dependencia del Poder Ejecutivo y de la Secretara de Estado de la Presidencia. Esta Ley entra en vigencia el 1 de enero de 1936. El 26 de mayo de 1948 se crea la Oficina Nacional de Censo y a partir de 1950, el pas inicia los Censos de Poblacin y Agropecuarios, que deben ser realizados con una periodicidad de cada diez aos. La ONE es una institucin de servicios que depende del Ministerio de Economa, Planificacin y Desarrollo (MEPYD). Est ubicada en los pisos 8 y 9 del Edificio de Oficinas Gubernamentales Juan Pablo Duarte, sito en la Avenida Mxico esquina Leopoldo Navarro, del Sector Gazcue. A la fecha ha tenido 29 directores, siendo el primero Don Vicente Tolentino Rojas, quien es considerado uno de los padres de la Estadstica en la Repblica Dominicana. Desde sus inicios, la ONE produce informacin sistemtica y es la responsable de realizar la recoleccin, revisin, elaboracin y publicacin de las estadsticas nacionales, relacionadas con las actividades econmicas, agrcolas, comerciales, industriales, financieras, sociales, condiciones de la poblacin y los censos nacionales, as como la coordinacin de los servicios estadsticos del pas. A partir del 1 de Enero de 1936, fecha en que entr en vigencia la ley de 1935, hasta el ao de 1948, la oficina de Estadstica tuvo como Director a Don Vicente Tolentino Rojas, quien llev acabo una brillante labor al frente de la misma y es con justicia considerado uno de los padres de la Estadstica en la Repblica Dominicana. En 1940 se autoriz efectuar el Censo Agropecuario Nacional mediante decreto 389 del Poder Ejecutivo. En Diciembre de 1928, se acogi el proyecto de levantar cada a diez aos un Censo agrcola mundial, y el primero fue lo realizado por algunos pases, sin participacin de la Repblica Dominicana en 1930. En este perodo se materializan un conjunto de actividades que vinculan las Estadsticas Dominicana a la organizacin Estadstica Internacional; entre las cuales se pueden citar: lacreacin del Instituto Interamericano de Estadstica (IASI). En 1943, mediante la ley 318 del 8 de julio, se estableci "el levantamiento cada 15 aos de un Censo Nacional que incluye los de poblacin, edificios y viviendas, agropecuarios, de industria y comercio y aquellos que el Poder Ejecutivo disponga en su oportunidad. En 1948, para atender los problemas propios de la planificacin y ejecucin de los Censos Nacionales se cre mediante decreto 5137 del 26 de mayo, la Oficina Nacional de Censo, dependiente de la Direccin General de Estadstica. A partir de 1950, el pas viene efectuando cada diez aos Censos de poblacin y agropecuarios, cumpliendo as disposiciones legales y acuerdos internacionales sobre el particular. La realizacin del Censo de 1950 se enmarc dentro del "programa del Censo de las Amricas", aprobado por una resolucin del primer congreso Demogrfico Interamericano reunido en Mxico en 1943. En esos momentos ya el pas contaba con los servicios de algn personal tcnico nativo que se haba especializado en el exterior; se dispona en cierta manera de una metodologa definida y se haba asimilado las experiencias adquiridas en los censos anteriores. Dicho censo culmin el domingo 6 de agosto de 1950. Es bueno resaltar en el aspecto acadmico, que en 1944 un pequeo grupo de dominicanos fue favorecido con Becas del Gobierno para estudiar Estadstica en distintas Instituciones Norteamericanas. Ms tarde se realiz el Curso de Formacin de Estadstica del Caribe (CUFEC) representado por la Universidad Autnoma de Santo Domingo y el Instituto Interamericano de Estadstica ( IAS). Este constituy el primer curso de Estadstica dictado en el Pas. La ley vigente en la actualidad en asuntos referentes a Estadsticas y Censos es la No. 5096 del 6 de Marzo de 1959. Esta ley establece en Art. 19. Los Censos Nacionales se 24

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

levantarn en las siguientes fechas: el de poblacin y agropecuario en 1960 y cada 10 aos a contar de 1965. El cuarto Censo Nacional de Poblacin levantado el Domingo 7 de agosto de 1960, se caracteriz en primer lugar, por la abundancia de todo gnero de Recursos, no solo cont con un servicio tcnico nacional de experimentado y con la asesora tcnica de Organismos Internacionales, si no que tuvo una formulacin regular del presupuesto y una ayuda monetaria extranjera; a ello se agrega un buen programa de preparacin y ejecucin basado en las realidades y modalidades ambientales, y un plan consecuente ajustado a las recomendaciones Internacionales que rigen esta materia. En el 1946 se cre, en lo que entonces se llamaba Facultad de Filosofa, la primera ctedra de Estadstica a nivel Universitario1 siendo el profesor de la misma, hasta el 1948, Don Vicente Tolentino Rojas. En el ao de 1970, se levanta el 5to. Censo de Poblacin y Habitacin realizado el 9 y 10 de Enero de dicho ao. Este Censo presenta algunas peculiaridades entre las que podemos citar: a).- Es la Primera vez que en el pas el empadronamiento se efecta en ms de un da. b).- Se utiliza por primera vez el mtodo de muestreo para investigar algunas caractersticas. "En efecto, al 100% de la poblacin se formularon 10 preguntas adicionales al 50% de la poblacin de las reas urbanas y del 25% de las viviendas de reas rurales". c).- Se investiga por primera vez la poblacin econmicamente activa desagregada en ocupada y desocupada. Los censos anteriores no haban arrojado ninguna luz acerca de los niveles de desocupacin de la fuerza de trabajo. La Oficina se encuentra inmersa en un proceso de fortalecimiento y modernizacin institucional, impulsado por las necesidades de promover un cambio organizacional, para asumir el rol que le confiere la Ley. QUINTO PERIODO 1971-1998. En el periodo referenciado, las estadsticas, como herramientas de primer orden, ocupan el espacio que le corresponde en el marco de la planificacin socioeco- nmica gubernamental. De igual manera, las encuestas se constituyen en otro instrumento de la planificacin. Es as como se realizan Encuestas Demogrficas en el ao 1971; Encuestas sobre el Empleo y Desempleo en 1975; Encuesta de Fuerza de Trabajo (empleo) en 1980, entre otras. Cabe destacar las publicaciones que se iniciaron en este periodo como: "Repblica Dominicana en Cifras", boletn que se ha venido publicando anualmente, en donde se contemplan estadsticas de los diferentes sectores. Adems, se inicia en el ao 1986 la compilacin y publicacin de los "Indicadores Bsicos Diarios", el cual contiene el precio de la canasta agropecuaria, flujo de pasajeros por aeropuertos, materiales de construccin, tasa oficial de cambio, situacin energtica, informe sobre nivel de lluvias. En el ao 1981, se levanta el VI Censo Nacional de Poblacin y Vivienda, los das 12 y 13 de diciembre. Se realiz por enumeracin completa bajo el criterio de Censo de Hecho (o de facto) y de Derecho (o de jure), es decir, que se empadronaron en cada hogar los residentes habituales y adems, los que durmieron la noche del 11 al 12 de diciembre de 1981. Cabe destacar el uso por primera vez, del ingreso de los datos al computador mediante lector ptico, capaz de grabar en cintas magnticas la informacin tomada directamente de la boleta, la utilizacin de este equipo signific un cambio metodolgico de gran importancia. En este censo adems, se utiliz el Paquete Concord, software especializado que asigna la informacin faltante o inconsistente mediante criterios que aseguraron la coherencia de la informacin ingresada al computador. Las principales caractersticas investigadas fueron: 25

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

ubicacin geogrfica, identificacin del hogar, identificacin de los productores agropecuarios, datos de la vivienda, composicin del hogar, caractersticas personales. Por otro lado, el VII Censo Nacional Agropecuario, fue levantado en el mes de febrero de 1982. Se recogieron las informaciones relacionadas a todas las explotaciones agropecuarias a travs de los productores agropecuarios, entrevistados personalmente en el lugar de su vivienda. El VII Censo Nacional de Poblacin y Vivienda, se realiz en el ao 1993 los das 24 y 25 de septiembre, este fue un censo "de hecho", en virtud de que se empadron a todas las personas presentes en el territorio nacional a la hora cero ( 0 ) del levantamiento. Dicho Censo, se suscribi a todas las recomendaciones tcnicas de los organismos internacionales especializados en la materia, de manera de garantizar as la calidad de los datos. En el Censo de 1993, el ingreso de los datos al computador, se realiz mediante la utilizacin de lectores pticos, conectados al equipo central, capaces de almacenar la informacin tomada directamente de la boleta. Cabe destacar que por primera vez, se utilizaron los paquetes Cents y Concord y posteriormente, se hicieron algunos ajustes para poner el programa IMPS. La puesta en circulacin de este censo marca un hito en el desarrollo de las estadsticas del pas, ya que al mismo no slo se puede acceder por medio del material impreso, sino tambin mediante las computadoras a travs del disco compacto y en el Internet. Otras informaciones estadsticas que se producen actualmente, estarn a disposicin a travs del Internet y del CDROM. En la etapa actual del perodo que nos ocupa, hay todo un relanzamiento en cuanto a la divulgacin de las estadsticas, publicndose de forma sistemtica los boletines de Comercio Exterior 1996, y el de Construcciones en el Sector Privado 1996, amn de los Indicadores Bsicos, los cuales se estn procesando diariamente, Historia de los Censos de Poblacin en la Repblica Dominicana y Censo Nacional de Servidores Pblicos. Entre otros, se da inicio a un importante programa piloto de Encuestas Sociodemogrficas en el Nordeste del pas, con el fin de recoger informaciones actualizadas y de calidad. De igual forma, se han realizado acuerdos de cooperacin interinstitucionales, tanto con entidades publicas como privadas y organismos internacionales que permiten acometer de forma conjunta la recopilacin de informaciones referentes a hechos vitales, como nacimientos, defunciones. Un paso relevante es lo relacionado con las estadsticas sobre importaciones y exportaciones de productos, que siempre tuvieron en retraso en su disponibilidad a los usuarios. Esto se ha superado mediante el establecimiento de un acuerdo interinstitucional con la Direccin General de Aduana, el cual nos permite estar conectados Va Mdem, logrando tener informacin oportuna y de calidad. En estos momentos, se dan los pasos para convertir a la ONE en un Instituto Nacional con la correspondiente descentralizacin e independencia administrativa y la creacin en el pas de un Sistema Nacional de Informacin.

26

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO NO. 1 LA ESTADSTICA: HISTORIA Y CONCEPTOS


TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 1. Elaborar un resumen del captulo I. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Agrupar 2. Anlisis 3. Aritmtica 4. Censo 5. Datos 6. Error 7. Estadstica 8. Estado 9. Estudio 10. Fenmeno 11. Frmula 12. Frecuencia 13. Investigacin 14. Levantamiento 15. Margen 16. Muestra 17. Ordenar 18. Pentateuco 19. Poblacin 20. Poltica 21. Probabilidad 22. Registro 23. Representacin 24. Valor

27

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA NO. 1 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Conceptualice estadstica. 2. A quin se considera el padre de la estadstica y por qu? 3. Mencione los acontecimientos bblicos que denotan el uso de la estadstica en los siglos anteriores a la era cristiana. 4. Diga los aportes de los egipcios al desarrollo de la estadstica. 5. Cules aportes importantes hicieron los babilonios a la estadstica? 6. Resuma brevemente los aportes de los chinos a la estadstica y sus personajes. 7. Describa brevemente el desarrollo de la estadstica en la edad media. 8. Mencione (5) personajes importantes para la estadstica durante los siglos XIX y XX y sus aportes. 9. Defina probabilidad. 10. Describa brevemente los orgenes de la probabilidad desde el marco de la estadstica. 11. Enumere las fases de un estudio estadstico. 12. En estadstica, qu es una poblacin y cul es su diferencia con respecto de la muestra. 13. Resuma brevemente los cinco perodos en que se divide el desarrollo de la estadstica en la Repblica Dominicana. 14. Elabore con sus propias palabras la relacin que guarda la estadstica con otras ciencias. 15. Establezca la importancia de la estadstica.

28

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

29

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

30

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo II. LA ESTADSTICA PARA LA TOMA DE DESICIONES


2.1 Tipos de estadstica
En este apartado se describirn los diferentes tipos de la estadstica y el por qu de tal divisin. Se describir el alcance de la estadstica a partir del tipo de estudio que se est realizando y del marco terico sobre el cul se haya elaborado la investigacin. La estadstica trata de las tcnicas para recolectar, organizar, presentar, analizar un conjunto de datos numricos y a partir de ellos y de un marco terico, hacer las indiferencias de lugar. Es una herramienta fundamental para la investigacin cientfica y emprica en los campos de la administracin, educacin, sociologa, psicologa, medicina, gentica, informtica, ingeniera, contabilidad, economa, agricultura, etc. Se consagra en forma directa al gran problema universal de cmo tomar las decisiones inteligentes y acertadas en condiciones de incertidumbre. Sirve como fuente de instruccin para los niveles introductorios de estadstica descriptiva y por consiguiente, los conceptos manejados y las tcnicas empleadas han sido presentadas de la forma mas simple, claramente posibles. En ese sentido, la estadstica se usa como un valioso auxiliar y en los diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar informacin basada en datos cuantitativos. Constituye uno de los aspectos ms relevantes entre los estudiosos de las ciencias. La evolucin de la estadstica ha llegado al punto en que su proyeccin se percibe en casi todas las reas de trabajo. Tambin abarca la recoleccin, presentacin y caracterizacin de informacin para ayudar tanto en el anlisis e interpretacin de datos como en el proceso de la toma de decisiones. La estadstica es parte esencial de la forma profesional, es hasta cierto punto una parte necesaria para toda profesin; la herramienta matemtica para analizar datos experimentales y basados en la observacin. Posee un lenguaje que permite comunicar informacin basada en datos cuantitativos y es de gran importancia en la investigacin cientfica debido a que: -Permite una descripcin ms exacta. -Obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar. -Permite resumir los resultados de manera significativa y cmoda. -Permite deducir conclusiones generales. Sin embargo, para delimitar sus alcances, la estadstica ha sido dividida en dos grandes campos que son: la estadstica descriptiva y la estadstica inferencial.

2.1.1 Estadstica descriptiva


La estadstica descriptiva es la rama de las estadsticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas caractersticas de ese conjunto. Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo se llama variable estadstica. La estadstica descriptiva se dedica a analizar y representar los datos. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. Este tipo de estadstica se dedica a la descripcin, visualizacin y resumen de datos 31

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clsters, entre otros. Este tipo de estadstica consiste en recolectar los datos, organizarlos, presentarlos, analizarlos e interpretar los resultados. Son aquellos mtodos que incluyen la recoleccin, presentacin y caracterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto de datos. Y tambin es definida como cualquier tratamiento de datos que este diseado para resumir o describir algunas de sus caractersticas ms importantes sin intentar deducir nada que escape al alcance de los datos. El objetivo de la estadstica descriptiva es hacer que los datos se comprendan ms fcilmente, que sea ms sencillo referirse a ellos y analzalos. En resumen, la estadstica descriptiva se encarga de: - Tomar mediciones exactas. - Organizar la informacin obtenida con las mediciones. - Conocer el proceso en estudio a raz de las mediciones realizadas. - Y tomar decisiones determinsticas para mejorar el proceso.

2.1.2 Estadstica inferencial


De acuerdo con el diccionario de la Real Academia Espaola, inferir significa "sacar una consecuencia o deducir algo de otra cosa". El principal objetivo de la Estadstica consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u otros entes (poblacin) con base en las observaciones hechas sobre slo una parte (muestra) de dicho gran conjunto. La capacidad para "decir algo" sobre poblaciones con base en muestras est basada en supuestos con respecto a algn modelo de probabilidad que permite explicar las caractersticas del fenmeno bajo observacin. Al conjunto de procedimientos estadsticos en los que interviene la aplicacin de modelos de probabilidad y mediante los cuales se realiza alguna afirmacin sobre poblaciones con base en la informacin producida por muestras se le llama Inferencia Estadstica o Estadstica Inferencial. La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de un jopo o una caracterstica numrica (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos, entre otras. Es una parte de la estadstica que comprende los mtodos y procedimientos para deducir propiedades de una poblacin estadstica, a partir de una pequea parte de la misma. La estadstica inferencial comprende como aspectos importantes: La toma de muestras o muestreo. La estimacin de parmetros o variables estadsticas. El contraste de hiptesis. El diseo experimental. Los mtodos no paramtricos La estadstica Inferencial, es definida tambin como el proceso por el cual se deducen (infieren) propiedades o caractersticas de una poblacin a partir de una muestra significativa. Uno de los aspectos principales de la inferencia es la estimacin de parmetros estadsticos. Por ejemplo, 32

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

para averiguar la media, , de las estaturas de todos los soldados de un reemplazo, se extrae una muestra y se obtiene su media, 0. La media de la muestra (media muestral), 0, es un estimador de la media poblacional, . Si el proceso de muestreo est bien realizado (es decir, la muestra tiene el tamao adecuado y ha sido seleccionada aleatoriamente), entonces el valor de , desconocido, puede ser inferido a partir de cero. La inferencia siempre se realiza en trminos aproximados y declarando un cierto nivel de confianza. Por ejemplo, si en una muestra de n = 500 soldados se obtiene una estatura media 0 = 172 cm, se puede llegar a una conclusin del siguiente tipo: la estatura media, , de todos los soldados del reemplazo est comprendida entre 171 cm y 173 cm, y esta afirmacin se realiza con un nivel de confianza de un 90%. (Esto quiere decir que se acertar en el 90% de los estudios realizados en las mismas condiciones que ste y en el 10% restante se cometer error.) Si se quiere mejorar el nivel de confianza, se deber aumentar el tamao de la muestra, o bien disminuir la precisin de la estimacin dando un tramo ms amplio que el formado por el de extremos 171, 173. Recprocamente, si se quiere aumentar la precisin en la estimacin disminuyendo el tamao del intervalo, entonces hay que aumentar el tamao de la muestra o bien consentir un nivel de confianza menor. Finalmente, si se quiere mejorar la precisin hay que tomar una muestra suficientemente grande. Contiene mtodos que nos permiten hacer posible la estimacin de una caracterstica de la poblacin, sobre la base del estudio de una muestra. Bernoulli, De Moivre y Karl Gauss fueron los precursores del objeto de la estadstica inferencial. Tiene por objetivo describir las caractersticas de un conjunto, pero sin la necesidad de realizar el registro de datos a todos los elementos o unidades del conjunto o poblacin, sino a una parte de esta. La inferencia constituye la base terica del muestreo, permite conocer el todo con cierta aproximacin, a partir del estudio de una parte. La estadstica inferencial no nos da una certeza completa en sus resultados, sino que estn sujetas a una probabilidad de error. Una incorrecta seleccin de las unidades mustrales puede acarrear la imposibilidad de inferir correctamente las caractersticas de la poblacin. En resumen, la estadstica inferencial se encarga de: - Tomar muestras representativas de la poblacin en estudio. - Obtener mediciones muestrales representativas. - Generalizar estos resultados muestrales para toda la poblacin. - Tomar decisiones probabilsticas para mejorar el proceso en estudio. Diagrama del Proceso de Generalizacin de los resultados muestrales.

33

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

2.2 Instrumentos de recoleccin de datos


La recoleccin de datos se refiere al uso de una gran diversidad de tcnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de informacin, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observacin, etc. Todos estos instrumentos se aplicar en un momento en particular, con la finalidad de buscar informacin que ser til a una investigacin en comn. En la presente investigacin trata con detalle los pasos que se debe seguir en el proceso de recoleccin de datos, con las tcnicas ya antes nombradas. Los analistas utilizan una variedad de mtodos a fin de recopilar los datos sobre una situacin existente, como entrevistas, cuestionarios, inspeccin de registros (revisin en el sitio) y observacin. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigacin completa. El primer paso para realizar un anlisis estadstico es la recoleccin de datos. En ese sentido existen diversos instrumentos de recoleccin de datos, elaborados siguiendo una metodologa especfica. Dentro de estos instrumentos estn el cuestionario, la entrevista, la encuesta, los censos, exmenes, etc. Como dijimos ms arriba, una poblacin es cualquier grupo completo, ya sea de personas, animales o cosas y constituyen la totalidad de elementos o cosas bajo consideracin. La poblacin se refiere a un grupo finito de elementos. Asimismo, tenemos que los elementos de una poblacin son las unidades individuales que constituyen o conforman una poblacin. Y el Universo es un conjunto de cosas que no tienen lmite numrico. La muestra representa una porcin de la poblacin que se selecciona para fines de anlisis. La misma siempre debe de ser representativa de la poblacin total. Un parmetro es la medida de resumen que se calcula con el propsito de describir alguna caracterstica de la poblacin. Y un estadstico o estadgrafo sern las medidas de resumen que se calculan con el propsito de describir algunas caractersticas de una sola muestra de la poblacin. El cuestionario. Es un instrumento de investigacin que se utiliza, de un modo preferente, en el desarrollo de una investigacin en el campo de las ciencias sociales. Es una tcnica ampliamente aplicada en la investigacin de carcter cualitativa. Su construccin, aplicacin y tabulacin poseen un alto grado cientfico y objetivo. Constituye un medio til y eficaz para recoger informacin en un tiempo relativamente breve. Las caractersticas principales del cuestionario estn que es un procedimiento de investigacin, una entrevista altamente estructurada, consiste en un conjunto de preguntas respecto a una o ms variables a medir. Tiene las ventajas de requerir relativamente poco tiempo para reunir informacin sobre grupos numerosos y que el sujeto que responde, proporciona por escrito informacin sobre s mismo o sobre un tema dado. Presenta la desventaja de que quien contesta responda escondiendo la verdad o produciendo notables alteraciones en ella. Adems, la uniformidad de los resultados puede ser aparente, pues una misma palabra puede ser interpretada en forma diferente por personas distintas, o ser comprensibles para algunas y no para otras. Por otro lado, las respuestas pueden ser poco claras o incompletas, haciendo muy difcil la tabulacin. En su construccin pueden considerarse preguntas cerradas, abiertas o mixtas. 34

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Cuestionario Restringido o Cerrado: Es aquel que solicita respuestas breves, especficas y delimitadas. Presenta las ventajas de que requiere de un menor esfuerzo por parte de los encuestados, limitan las respuestas de la muestra, es fcil de llenar, mantiene al sujeto en el tema, es relativamente objetivo y es fcil de clasificar y analizar. Estas preguntas piden ser contestadas con: Dos alternativas de respuestas (respuestas dicotmicas): Si o No. Varias alternativas de respuestas: donde se seala uno o ms tems (opcin o categora) en una lista de respuestas sugeridas. Como no es posible prever todas las posibles respuestas, conviene agregar la categora Otros o Ninguna de las Anteriores, segn sea el caso. En otras ocasiones, el encuestado tiene que jerarquizar opciones o asignar un puntaje a una o diversas cuestiones. Cuestionario No Restringido o Abierto: Las preguntas abiertas no delimitan de antemano las alternativas de respuesta. Las preguntas abiertas son particularmente tiles cuando no tenemos informacin sobre las posibles respuestas de las personas o cuando esta informacin es insuficiente. Este tipo de cuestionario es aquel que solicita una respuesta libre la cul es redactada por el propio sujeto. Tiene la ventaja de que proporciona respuestas de mayor profundidad y la desventaja de que es de difcil tabulacin, resumen e interpretacin. Cuestionario Mixto: Es aqul que considera en su construccin tanto preguntas cerradas como abiertas.

La entrevista. Es un acto de comunicacin oral o escrito que se establece entre dos o ms personas (el entrevistador y el entrevistado o los entrevistados) con el fin de obtener una informacin o una opinin, o bien para conocer la personalidad de alguien. En este tipo de comunicacin oral debemos tener en cuenta que, aunque el entrevistado responde al entrevistador, el destinatario es el pblico que est pendiente de la entrevista. Se utilizan para recabar informacin en forma verbal, a travs de preguntas que propone el analista. Consta de tres fases o pasos que son: el inicio, durante el cul se establece el rapport o romper el hielo para crear un ambiente agradable durante el proceso. La fase de desarrollo que es la entrevista en s. Y el cierre, el cual se anuncia de 5 a 10 minutos antes de terminar la entrevista. Aqu se le da oportunidad al entrevistado de agregar o aclarar informaciones y el entrevistador resume y concretiza antes de la despedida. Los tipos principales de entrevista son: - Entrevista estandarizada o estructurada: es una especie de cuestionario oral. El entrevistador lee las preguntas y anota las respuestas que obtiene. Se suele utilizar en los procesos de seleccin de bsqueda pasiva, cuando hay muchos candidatos. - Entrevista libre o no estructurada: es como una charla de carcter informal, que permite la obtencin de datos subjetivos acerca del candidato. - Entrevista mixta: no se sirve de un cuestionario fijo, ni plantea unas preguntas prefijadas, sino que sigue una especie de gua de entrevista en las que se detallan, no las preguntas sino las reas que han de ser exploradas. En el diagrama siguiente se presentan las ventajas y desventajas al utilizar uno u otro tipo de entrevista: 35

Manual de Estadstica I.
Entrevista estructurada -Asegura la elaboracin uniforme de las preguntas para todos los que van a responder. -Fcil de administrar y evaluar. -Evaluacin ms objetiva tanto de quienes responden como de las respuestas a las preguntas. -Se necesita un limitado entrenamiento del entrevistador. -Resulta en entrevistas ms pequeas. -Alto costo de preparacin. -Los que responden pueden no aceptar un alto nivel en la estructura y carcter mecnico de las preguntas. -Un alto nivel en la estructura puede no ser adecuado para todas las situaciones. -El alto nivel en las estructuras reduce responder en forma espontnea, as como la habilidad del entrevistador para continuar con comentarios hacia el entrevistado.

Profesora Juana De los Santos, M.A.


Entrevista no estructurada -El entrevistador tiene mayor flexibilidad al realizar las preguntas adecuadas a quien responde. -El entrevistador puede explotar reas que surgen espontneamente durante la entrevista. -Puede producir informacin sobre rea que se minimizaron o en las que no se pens que fueran importantes. -Puede utilizarse negativamente el tiempo, tanto de quien responde como del entrevistador. -Los entrevistadores pueden introducir sus sesgos en las preguntas o al informar de los resultados. -Puede recopilarse informacin extraa -El anlisis y la interpretacin de los resultados pueden ser largos. -Toma tiempo extra recabar los hechos esenciales.

VENTAJAS

DESVENTAJAS

Preparacin de la Entrevista - Determinar la posicin que ocupa de la organizacin el futuro entrevistado, sus responsabilidades bsicas, actividades, etc. (Investigacin). - Preparar las preguntas que van a plantearse, y los documentos necesarios (Organizacin). - Fijar un lmite de tiempo y preparar la agenda para la entrevista. (Sicologa). - Elegir un lugar donde se puede conducir la entrevista con la mayor comodidad (Sicologa). - Hacer la cita con la debida anticipacin (Planeacin). Conduccin de la Entrevista - Explicar con toda amplitud el propsito y alcance del estudio (Honestidad). - Explicar la funcin propietaria como analista y la funcin que se espera conferir al entrevistado. (Imparcialidad). - Hacer preguntas especficas para obtener respuestas cuantitativas (Hechos). - Evitar las preguntas que exijan opiniones interesadas, subjetividad y actitudes similares (habilidad). - Evitar el cuchicheo y las frases carentes de sentido (Claridad). - Ser corts y comedio, abstenindose de emitir juicios de valores. (Objetividad). - Conservar el control de la entrevista, evitando las divagaciones y los comentarios al margen de la cuestin. - Escuchar atentamente lo que se dice, guardndose de anticiparse a las respuestas (Comunicacin). La encuesta. Es un estudio observacional en el cual el investigador busca recaudar datos de informacin por medio de un cuestionario prediseado, y no modifica el entorno ni controla el proceso que est en observacin (como s lo hace en un experimento). Los datos se obtienen a partir de realizar un conjunto de preguntas normalizadas dirigidas a una muestra representativa o al conjunto total de la poblacin estadstica en estudio, formada a menudo por personas, empresas o entes institucionales, con el fin de conocer estados de opinin, caractersticas o hechos especficos. El investigador debe seleccionar las preguntas ms convenientes, de acuerdo con 36

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

la naturaleza de la investigacin. Se utiliza para medir las relaciones entre variables demogrficas, econmicas y sociales. Tambin para evaluar las estadsticas demogrficas como errores, omisiones e inexactitudes y conocer profundamente patrones de las variables demogrficas y sus factores asociados como fecundidad y migraciones determinantes. Adems, evaluar peridicamente los resultados de un programa en ejecucin y saber la opinin del pblico acerca de un determinado tema. Etapas de una encuesta por muestreo - La planeacin: constituye el establecimiento de los objetos de la investigacin y la creacin de la estrategia general para obtener y analizar los datos, incluye adems, la elaboracin de presupuestos, revisin de literatura, definicin de objetivos especficos, etc. - La elaboracin de un diseo de investigacin: El diseo de la muestra esta relacionado estrechamente con la planeacin y por lo regular ocurre en forma simultanea, consiste en una programacin preparada de antemano con el objetivo de recolectar y analizar la informacin necesaria para satisfacer los objetivos del estudio, al costo mas bajo posible. - Diseo de la muestra (muestreo): Es el proceso de seleccionar ciertos elementos de la poblacin; En esta etapa, el investigador debe definir con claridad y cuidado la poblacin que se va a estudiar y la generalizacin de los datos de la muestra que dicha poblacin permitir. -Consiste en un conjunto de procedimientos para seleccionar los elementos de la poblacin y para convertir las informaciones de la muestra en clculos relativos al total de la poblacin. La muestra debe ser representativa de la poblacin de la cual se extrae. Los procedimientos aleatorios para elegir las unidades son la forma ms confiable de seleccin. -Diseo del cuestionario: Es el proceso de adaptar los diferentes objetivos del estudio a preguntas que permitan obtener la informacin necesaria. Esta etapa incluye la formulacin del tipo de pregunta, numero de estas, secuencia y los medios para mantener motivada a la persona encuestada. Sus principales objetivos son: 1-Obtener informacin aplicable a los propsitos de la encuesta o investigacin. 2-Recopilar las informaciones con el mximo de responsabilidad, validez y con precisin. -El trabajo de campo: En esta etapa de la investigacin se incluye el reclutamiento de entrevistadores, supervisores y otro personal de campo. Adems, incluye la capacitacin del personal de campo, preparacin de instrucciones escritas para los entrevistadores sobre el uso del cuestionario, la recopilacin de los datos en el campo y el control de calidad de las entrevistas, etc. -La verificacin y la codificacin: La verificacin y la codificacin son procesos afines diseados con el propsito de transcribir la informacin registrada en los cuestionarios a una forma adecuada para el anlisis estadstico. El objetivo bsico de la verificacin el eliminar las respuestas incompletas o inconsistentes, como tambin los errores en el uso del cuestionario. La codificacin es un proceso tcnico que consiste en convertir datos cualitativos en datos numricos que puedan ser almacenados, cantados o tabulados con rapidez y facilidad. - La preparacin para el anlisis: Esta etapa incluye un conjunto de actividades, como: digitacin de los datos, chequeos rutinarios para determinar la compatibilidad de las respuestas, plan de tabulacin de los datos. La digitacin es el procedimiento utilizado para el almacenamiento de la informacin y constituye el primer paso despus de la codificacin para registrar los datos, de manera tal que puedan ser fcilmente recuperados y tabulados. - Anlisis y preparacin del informe: Consiste en la presentacin e interpretacin de tablas simples y de mltiples entradas de los datos recopilados en la investigacin. El objetivo de esta etapa es proporcionar un resumen de los datos, capaz de satisfacer los propsitos de la investigacin, lo ms breve y comprensible posible. 37

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Puede incluir tablas de porcentajes, medidas de tendencia central, medidas de asociacin, pruebas de hiptesis, estimaciones, etc. Es importante tener presente tres aspectos bsicos en su planeacin. Estos son: el estilo en que se va a escribir, la mecnica de presentacin del material y la organizacin de los temas del informe. El Censo Es una investigacin que cubre a todos los miembros o elementos de una poblacin dada; un censo completo es a menudo innecesario, antieconmico y una molestia para el publico y tambin que es menos efectivo que una encuesta, para recoger ciertos tipos de informacin. Peridicamente se levantan diferentes tipos de censos en todo el mundo, entre los ms conocidos estn; el censo de poblacin y vivienda, censos agropecuarios, censos a las empresas mercantiles y manufactureras, etc. Proporcionan datos muy importantes sobre poblacin. Vivienda, empleos poblacin econmicamente activa, uso de la tierra, tamao de las fincas, ganadera, etc. En el pas se han organizado en total siete censos de poblacin, siendo el ltimo de estos el efectuado en 1993, del cual se derivo que la poblacin de la Repblica Dominicana era, hasta el momento, de 7,293.390 habitantes.

2.3 Muestreo
Una muestra, ya la hemos definido como una parte de un conjunto mayor llamado poblacin se selecciona cuidadosamente para representarla. Y muestreo es el proceso de seleccionar esa parte del todo. Es una herramienta de la investigacin cientfica cuya funcin bsica es determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observacin de slo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos. Asimismo, el muestreo Estadstico: son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Este puede ser de dos tipos: 1. Muestreo probabilstico: Es aqul en el que todos los elementos de la poblacin tienen la misma probabilidad de ser seleccionados como parte de la muestra. Forman parte de este tipo de muestreo todos aquellos mtodos para los que puede calcularse la probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. Se subdivide a su vez en: - Aleatorio: Se colocan en una tmbola el total de sujetos de la poblacin y se sacan al azar la cantidad de muestra determinada para trabajar. - Estratificado: Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos respecto a caracterstica a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Se puede estratificar por edad, por carrera u oficio, por nivel social, etc. - Sistemtico: Es la eleccin de una muestra a partir de los elementos de una lista segn un orden determinado, o recorriendo la lista a partir de un nmero aleatorio determinado. Por ejemplo: para una poblacin de 50 sujetos del cual debe extraerse una muestra de 5. lo primero es asignar una constante (K) la cul se determina dividiendo la poblacin entre la muestra: 50 = 10 . Luego seleccionar al primer sujeto aleatoriamente, ya sea designando a 38

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

5 alguien que diga un nmero del 1 al 50 o cerrando los ojos y sealando un nmero de la lista, etc. El nmero obtenido as ser el primer elemento de la muestra. Los dems se elegirn sumando a este la constante hallada. Si el primer sujeto fue el No. 3, el segundo ser 3+K = 3+10 = 13; el tercero ser 13+K = 13+10 = 23 y as sucesivamente. - Por conglomerados: Cuando la poblacin se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio. Estos conglomerados pueden ser empresas, ciudades, zonas geogrficas, barrios, etc. - Polietpico: Es muy utilizado en las encuestas polticas. Su nombre se debe a que se realiza por etapas. Se utiliza cuando la poblacin es muy heterognea. Para seleccionar una muestra de una poblacin se va dividiendo dicha poblacin de forma sucesiva conforme algn criterio determinado con anterioridad. De las partes que resultaron de la primera divisin se eligen algunas por muestreo aleatorio simple. A su vez estas partes se subdividen en otras y de ellas se vuelve a seleccionar algunas, tambin por muestreo aleatorio simple. Un ejemplo clsico de un muestreo polietpico resulta cuando se quiere seleccionar una muestra de una ciudad grande; la ciudad se divide en barrios y de ellos se eligen algunos por muestreo aleatorio simple; los barrios se dividen en calles, y dentro de ellas se seleccionan algunas tambin por muestreo aleatorio simple, y as sucesivamente. 2. Muestreo no probabilstico: Es aquel en que no todos los elementos de la poblacin tienen la misma probabilidad de ser seleccionados. Incluye todos los mtodos en que los elementos de la muestra no se seleccionan mediante procedimientos al azar o aleatorios, o con probabilidades de seleccin conocidas. Algunos procedimientos de seleccin del muestreo no probabilstico son: - De juicio o criterio: Es un proceso a travs del cual los elementos se escogen basndose en opiniones informadas que garantizan la representatividad de la poblacin que se estudia. - Por cuotas: Es un proceso de seleccin en el cual los elementos son elegidos en el campo mismo, por los entrevistadores, utilizando categoras prefijadas de elementos de la muestra, para obtener un nmero predeterminado de casos en cada categora. - Decisional: En este los elementos de la muestra son seleccionados de una poblacin por los entrevistadores que usan su propio criterio para decidir cuales son los informantes representativos. - De agrupacin causal: Son muestras formadas por ejemplos que se han reunido ocasionalmente o de acceso fcil, tales como los estudiantes inscritos en una clase que van pasando por una esquina. Dichas muestras no permiten generalizaciones que vayan mas all de las agrupaciones mismas y por lo general no tienen inters cientfico. - Por conveniencia: Del total de la poblacin, se elige un grupo que cumpla con las caractersticas establecidas pero que sea conveniente o de fcil acceso para el entrevistador. - Bola de nieve: Es aquel en que el entrevistador selecciona al primer sujeto a su juicio y al terminar la entrevista le pregunta a este a quines conoce que pueden dar informacin sobre la investigacin y este le recomendar a algunos sujetos, los cules a su vez recomendarn a otros haciendo el grupo ms grande paulatinamente hasta completar la muestra requerida.

39

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Ej.

Jua n

Pabl o Lu z

Pedr o Fran k

Jos

Mar a

Clara

Ana

Ahora mostramos una grfica resumen de los tipos de muestreo: MUESTREO

Probabilstico Aleatorio Estratificado Sistemtico


Por conglomerados

No probabilstico
De juicio o criterio

Por cuotas
Decisional De agrupacin causal

Polietpico

Bola de nieve

Antes de ejemplificar la seleccin de muestras, debemos hacer un alto y explicar que en estadstica existen reglas para los redondeos ya que estos son muy utilizados, y sern efectivos si se hacen adecuadamente. En ese sentido, los redondeos pueden hacerse por exceso o por defecto. Redondeo por exceso: Se har cuando los dgitos despus de punto (.) estn por encima de 5. Ej. 360.52 habitantes se redondea a 361 habitantes. 45.75 estudiantes se redondea a 46 estudiantes 14.8 kilos se redondea a 15 kilos. Redondeo por defecto: Se har cuando los dgitos despus de punto estn por debajo de 5. Ej. 3.2 personas se redondea a 3 personas 1,345.22 pesos se redondea 1,345.00 pesos 128.12 libras se redondea a 128 libras. Sin embargo, estos redondeos atendern al criterio y juicio clnico del investigador. Frmulas para determinar muestras. - Para una poblacin conocida. Partiendo del criterio estadstico que considera: Poblacin < 100,000 = poblacin finita Poblacin > 100,000 = poblacin infinita n =. Z2 Npq e2(N-1)+Z2pq . 40

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Donde, dada una poblacin de 15,000 habitantes. trabajar la investigacin. n = muestra (a determinar) Z = a determinar e = nivel de error Nc = nivel de confianza

Determinar la muestra necesaria para

N = poblacin = 15,000 habitantes p = probabilidad de que ocurra el fenmeno q = probabilidad de que no ocurra el fenmeno p+q = 1

Suponiendo que el nivel de error estimado es de un 5% (0.05) con un nivel de confianza de 95% (determinado de e-1 = Nc). Y que asignamos p = 60% (0.6) y siendo p+q=1, entonces q=40% (0.4). Para determinar Z se divide Nc /2 = 0.95/2 = 0.475. Se busca 0.475 en la tabla de ms abajo que contienen los valores de Z y vemos que 0.475 est en la fila 1.9 columna 0.06; entonces el valor de Z= 1.9+0.06 = 1.96. Ahora despejamos la frmula para saber con cul muestra trabajamos: n =. Z2 Npq . =. (1.96)2 (15,000) (0.6)(0.4) . 2 2 e (N-1)+Z pq (0.05)2(15,000-1)+(1.96)2(0.6)(0.4)
=.

13,829 . = 3360 habitantes 38.42

Determinamos que la muestra necesaria para hacer una investigacin para una poblacin de 15,000 es de 360 habitantes. Esta cantidad es representativa del total. - Para una poblacin desconocida. Muy utilizada en investigaciones con grupos sociales. n = . Z2 pq . e2 n = muestra (a determinar) Z = a determinar e = nivel de error Nc = nivel de confianza p = probabilidad de que ocurra el fenmeno q = probabilidad de que no ocurra el fenmeno p+q = 1

Suponiendo que el nivel de error estimado es de un 4% (0.04) con un nivel de confianza de 96% (determinado de e-1 = Nc). Y que asignamos p = 45% (0.45) y siendo p+q=1, entonces q=55% (0.55). Para determinar Z se divide Nc /2 = 0.96/2 = 0.480. Se busca 0.480 en la tabla de ms abajo que contienen los valores de Z y vemos que 0.475 est en la fila 2.0 columna 0.06; entonces el valor de Z= 2.0+0.06 = 2.06. Ahora despejamos la frmula para saber con cul muestra trabajamos: n = . Z2 pq . = . (2.06)2 (0.45)(0.55) . = . 1,050, 291 . = 3656 habitantes e2 (0.04)2 0.0016 Determinamos que la muestra necesaria para hacer una investigacin para una poblacin desconocida es de 360 habitantes. Esta cantidad es representativa del total aunque la poblacin sea de 80,000 habitantes u 80,000 millones.

41

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

0.00

0.01

Tabla para determinar valores de Z 0.02 0.03 0.04 0.05 0.06 0.07

0.08

0.09

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

PRCTICA CAPTULO NO. 2 LA ESTADSTICA EN LA TOMA DE DECISIONES


42

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 2. Elaborar un resumen del captulo II. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Bsico 2. Censo 3. Codificar 4. Cuestionario 5. Decisin 6. Deduccin 7. Descripcin 8. Determinismo 9. Dicotoma 10. Encuesta 11. Entrevista 12. Estructurado 13. Exactitud 14. Generalizar 15. Inferencia 16. Instrumento 17. Muestreo 18. Pregunta 19. Responsabilidad 20. Resumen 21. Validez 22. Verificar

PRCTICA NO. 2 PARA REALIZAR EN EL AULA. 43

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

I. DESARROLLE. 1. Defina estadstica descriptiva. 2. Defina estadstica inferencial 3. Establezca la diferencia entre la estadstica descriptiva y la inferencial. 4. Defina instrumento y qu es un instrumento de recoleccin de datos en estadstica. 5. Qu es una encuesta? 6. Qu es un censo? 7. Qu es una entrevista? 8. Conceptualice muestreo? 9. Elabore una diferenciacin entre los diferentes instrumentos de recoleccin de datos que vimos en este captulo y trate de dar un ejemplo de en cules tipos de investigacin debe utilizarse uno u otro. 10. Diferencie muestreo probabilstico de muestreo no probabilstico. 11. Qu es el muestreo por cuotas? 12. Qu es el muestro aleatorio simple? 13. Explique brevemente el muestreo aleatorio sistemtico. 14. Explique brevemente el muestreo Bola de Nieve.

44

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

45

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

46

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo III. LAS VARIABLES


3.1 Conceptos y generalidades
Los datos estadsticos han sido usados durante siglo por los gobiernos organizados como forma de ayudar a la toma de decisiones en la administracin del estado. Los datos estadsticos son concisos, especficos y capaces de ser analizados objetivamente por diferentes procedimientos. En funcin de sus caractersticas los datos se clasifican en cuantitativos y cualitativos; siendo los cuantitativos la base fundamental de estudio de la estadstica. El uso de la computadora ha hecho posible que los gobiernos, las empresas y otras organizaciones almacenen y procesen grandes cantidades de datos. Se obtienen mediante un proceso que incluye la observacin de conceptos, como calificaciones de exmenes, ingresos anuales de una ciudad, temperatura diaria durante todo el ao de una comunidad, velocidad de circulacin de los vehculos por una autopista, etc. En conceptos reciben el nombre de variables, ya que producen una serie de valores que tienden a mostrar cierto grado de variabilidad, al realizarse un conjunto de mediciones de manera sucesiva. Existen varios tipos de datos estadsticos, que se agrupan en dos clasificaciones: datos de caractersticas cuantitativas y cualitativas. Los datos de caractersticas cuantitativas: son aquellos que se pueden expresar numricamente y se obtienen a travs de mediciones y conteos. Un dato cuantitativo se puede encontrar en cualquier disciplina; sicologa, contabilidad, economa, publicidad, etc. Los datos de caractersticas cuantitativas y cualitativas se clasifican a su vez en: 1-Variables continuas: Es cuando los datos estadsticos se generan a travs de un proceso de medicin se dice que estos son datos continuos; son aquellas que aceptan valores en cualquier punto fraccionario de un determinado intervalo, o sea, que aceptan fraccionamiento en un determinado intervalo. 2-Variables discretas: Se generan a travs de un proceso de conteo. Son aquellas que no aceptan valores en puntos fraccionarios dentro de un determinado intervalo, o sea, son aquellas que no aceptan fraccionamiento dentro de un determinado intervalo. Datos de caractersticas cualitativas: Los datos de caractersticas cualitativas son aquellos que no se pueden expresar numricamente. Estos datos se deben convertir a valores numricos antes de que se trabaje con ellos. Los datos de caractersticas cualitativas se clasifican en: 1-Datos nominales: Comprenden categoras, como el sexo, carrera de estudio, material de los pisos, calificaciones, etc. Las caractersticas mencionadas no son numricas por su naturaleza, pero cuando se aplican, ya sea en una poblacin o una muestra, es posible asignar a cada elemento una categora y contar l numero que corresponde a cada elemento. De esta manera estas caractersticas se convierten en numricas. 2-Datos jerarquizados: Es un tipo de datos de caractersticas cualitativas que se refiere a las evaluaciones subjetivas cuando los conceptos se jerarquizan segn la preferencia o logro. Las 47

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

posiciones de una competencia de atletismo se jerarquizan en primer lugar, segundo lugar, tercer lugar, etc. Tanto los datos nominales como los jerarquizados, que por su naturaleza no son numricas, se convierten en datos discretos. Distribucin de frecuencias: Cuando se dispone se una gran masa o cantidad de datos a veces resulta muy difcil responder a ciertos cuestionarios que sobre una determinada variable se nos hagan. Existe una forma en estadstica de organizar las informaciones que nos permite responder a este y otros cuestionamientos. A esta forma de organizar las informaciones se le llama distribucin de frecuencias y consiste en el ordenamiento de los datos a travs de clases y frecuencias. Cuando los datos se presentan en una distribucin de frecuencias se les denomina datos agrupados. Cuando todos los datos observados de una variable se enumeran en forma desorganizada le vamos a denominar datos no agrupados. Frecuencia simple de clase: Al construir una distribucin de frecuencias, se tienen diferentes intervalos de valores que denominaremos clases. Se define frecuencia simple de clase al numero de veces que se repite cada clase. Se le identifica como fi, donde (f) se lee como frecuencia, e (i) define el orden de las clases. Frecuencia relativa simple: A la suma total de la frecuencia simple de clase le llamamos n; cuando cada valor de la frecuencia simple de clase se divide entre el total de casos u observaciones a este cociente le denominamos frecuencia relativa simple. La suma de la frecuencia relativa simple siempre ser igual a la unidad. Vamos a identificar la frecuencia relativa simple como fr. Frecuencia acumulada: La suma de la frecuencia simple de clase es denominada como frecuencia acumulada. Al calcular la frecuencia acumulada en una distribucin de frecuencia acumulada de la primera clase ser igual a la frecuencia simple de la misma clase. La segunda acumulada es igual a la primera acumulada mas la frecuencia simple de la segunda clase. El valor de la ultima frecuencia acumulada es igual al total de datos. La frecuencia acumulada se identifica como Fi. Frecuencia relativa acumulada: Es el cociente que se obtiene al dividir cada frecuencia acumulada entre el total de observaciones. O la suma sucesiva de la frecuencia relativa simple. Recorrido o rango: En una distribucin u ordenamiento de datos existe una diversidad de valores que varan de menor a mayor y viceversa. Se denomina recorrido o rango a la diferencia existente entre el valor mximo observado y el mnimo en una distribucin u ordenamiento. Intervalo de clase: Una clase esta definida por un limite inferior y un limite superior. A la diferencia entre l limite superior y l limite inferior de una clase se la llama intervalo de clase; Este indica el recorrido o rango de los valores incluidos en una clase. Punto medio de clase o marca de clase: Para fines de anlisis de datos, los valores de las clases se representan a travs del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los limites de clase. El punto medio de clase se identifica como Xi, donde Xi = (limite superior + limite inferior). 48

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Pasos para construir una distribucin de frecuencias: conocidos ya todos los elementos tericos necesarios para la construccin y comprensin de una distribucin de frecuencias vamos a proceder a mostrar los pasos requeridos para su ejecucin. 1 Determinar el recorrido o rango. R = X mx. - X mn. 2 Calcular el intervalo de clase, siempre que se conozca l numero de clases. i = se asignar arbitrario de acuerdo a la distribucin de los datos. 3 Calcular l numero de clases, siempre que se conozca el intervalo de clase. NC = R i En lo referente al punto medio de cada clase, este es usado para representar mediante un solo valor el recorrido de cada clase y sirve adems para los fines de anlisis estadsticos de los datos. Es importante sealar con relacin a la construccin de una distribucin de frecuencias que el lector o usuario tenia plena libertad en la pre-escogencia del intervalo de clase, en funcin de la naturaleza de los datos y su conveniencia tcnica. Se determina: Ls + Li 2 Presentacin de datos La presentacin de datos estadsticos constituye en sus diferentes modalidades uno de los aspectos de mas uso en la estadstica descriptiva. A partir podemos visualizar a travs de los diferentes medios escritos y televisivos de comunicacin masiva la presentacin de los datos estadsticos sobre el comportamiento de las principales variables econmicas y sociales, nacionales e internacionales. Existen tres formas diferentes de presentar los datos estadsticos, que son: 1-Presentacin escrita: Esta forma de presentacin de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta mas apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales. 2-Presentacin tabular: Cuando los datos estadsticos se presentan a travs de un conjunto de filas y de columnas que responden a un ordenamiento lgico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma ms exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes: Titulo: Es la parte ms importante del cuadro y sirve para describir todo l contenido de este. Encabezados: Son los diferentes subttulos que se colocan en la parte superior de cada columna. Columna matriz: Es la columna principal del cuadro. Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en la tabla. Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos. Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes. Una variable es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. 49

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

3.2 Tipos de variables


3.2.1 Variables por medicin
Variables cualitativas Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia. [editar]Variables cuantitativas Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas adems pueden ser: Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg, ...) o la altura (1,64 m, 1,65 m, 1,66 m, ...), que solamente est limitado por la precisin del aparato medidor, en teora permiten que siempre exista un valor entre dos variables, tambin puede ser el dinero o un salario dado y se puede identificar las clases de variables (cualitativas y cuantitativas). las clases de variables se pueden ser cualitativas y cuantitativas

3.2.2 Variables por influencia


Segn la influencia que asignemos a unas variables sobre otras, podrn ser: [editar]Variables independientes Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En investigacin experimental se llama as a la variable que el investigador manipula. [editar]Variables dependientes Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los valores de las variables independientes. Hayman (1974 : 69) la define como propiedad o caracterstica que se trata de cambiar mediante la manipulacin de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

50

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Otras Variable interviniente Son aquellas caractersticas o propiedades que de una manera u otra afectan el resultado que se espera y estn vinculadas con las variables independientes y dependientes. Variable moderadora Segn Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relacin entre la variable independiente primaria y las variables dependientes. Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir.

3.3 Escalas de medicin


Como sabemos las caractersticas personales como estatura , edad, gnero, habilidades, tamaos de un determinado grupo se los conoce como variables, sabemos que existe una gama muy diferenciada de variables de las cuales se pude extrapolar diferentes escalas para ser medibles, , la aplicacin de la bioestadistica para medir caracterstica y valores tanto cualitativos como cuantitativos a travs de la utilizacin de escalas que permitan medir de mejor manera un resultado obtenido. MEDICION DE VARIABLES Antes que una variable sea tratada estadisticamente debe ser observada/medida para un conjunto de unidades observacionales, las unidades observacionales son aquellos entidades que se observan, cuando las observaciones se cuantifican ( es decir se expresan numricamente) se dice que los numeros son medibles, una medicin es una observacin que se expresa fsicamente en forma numrica, es decir cuando se le otorga un valor determinado segn su magnitud. De lo anteriormente mencionado podemos deducir que existen diferentes formas de medir variables, algunas se las puede medir directamente por ejemplo la temperatura, la tensin arterial, la inteligencia, y otros en forma indirecta, como el grado de aprovechamiento de una determinada asignatura, la eficiencia, eficacia, el amor , ser romntico, ser buen mal estudiante, etc. Algunos de esos mtodos de evaluacin de medicin de variables (escalas) podran arrojar datos nmericos u otros podran ser expresados en palabras, de esto depende la credibilidad de la investigacin basada en la exactitud, conveniencia, y significado de las mediciones que podran ser el origen de las conclusiones, recomendaciones y acciones , fruto de la resolucin del fenmeno problema. Una ves que agrupamos estas caractersticas de los individuos de los elementos observados ( variables) en categoras en grupos clases, esta agrupacin de caracterstica comunes similares nos permite clasificarlas en :

51

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

CLASIFICACIN DE LAS ESCALAS Las Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al mismo tiempo se sub dividen en: Cualitativas: - Escala nominal o clasificatoria. Este tipo de variables no presentan un ordenamiento previo, ms al contrario es arbitraria, de ah que se haya ideado tres parmetros para entender mejor este tipo de escala; variable, escala y diferencia, por ejemplo: Variable: Profesin Escala: Ingeniero, mdico, abogado, odontlogo Diferencia: No existe diferencia entre los profesionales. Otros ejemplos son el estado civil, el sexo, etc. - Escala ordinal. Las variables susceptibles de ser medidas siguiendo un ordenamiento (orden), formada por una clase mutuamente excluyentes, que se agrupan de acuerdo a un orden pre-asignado. Por ejemplo: Variable: Grado de instruccin. Escala: Primaria, secundaria, superior, post-grado. Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes de grado primario con los de nivel superior existe no solo aos de experiencia, sino conocimiento. Otros ejemplos: Grado militar, jerarqua familiar, etc. Cuantitativas: - Escala discreta o discontinua. Se dice que si la variable medida es susceptible a ser contada, se puede construir una escala discreta, formada por nmeros enteros con incrementos fijos, donde las fracciones no son consideradas, para esto, se debe considerar la magnitud de los nmeros expuestos. Por ejemplo: Variable: Nmero de hijos Escala: 1 hijo, 2 hijos, 3 hijos, etc. Otros ejemplos: nmero de visitas, nmero de caries dental, etc. - Escala concreta o continua. Cuando uno cuenta con variables de tipo cuantitativo continuo o concreto se pude utilizar este tipo de escala, cuyo requisito es el de poder presentar nmeros relativos racionales (fraccionados, porcentuales y/o decimales) siendo esta medicin aproximada. Por ejemplo: Variable: Estatura Escala: 1,65 m., 1,66 m., 1,67 m., etc. Otros ejemplos: peso en gramos, estatura en pies y pulgadas, tiempo, edad, etc. Escala dicotmica. Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo esta variable de tipo cualitativo o cuantitativo dependiendo de la informacin o resultado que se busque, por ejemplo: Variable preferencia por un equipo de football Escala de medicin: San Carlos o Arroyo Hondo Respuesta: San Carlos o Arroyo Hondo Otro ejemplo: el sexo, etc.

52

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Otras escalas: Escala cronolgica. Es un tipo de escala cuantitativa continua, se la utiliza para estudiar algunos fenmenos en funcin al tiempo, algunos autores la tratan como si fuera una escala de variable independiente, permite conocer un determinado fenmeno a travs del tiempo, es decir permite un seguimiento temporalizado (en el pasado, en el presente en el futuro). Ej. Variable. Cambios fsicos de una nia. Escala de medicin: al 1 ao, 5 aos, 25 aos, etc. Otro ejemplo: El seguimiento de un determinada enfermedad por ejemplo el Sida, donde se podra realizar un seguimiento por memorizado de las patologas que se producen a raz de este fenmeno. Escala de intervalo. Las categoras se ordenan en unidades igualmente espaciadas, siendo posible medir las diferencias relativas en cada punto de la escala, no existe el cero absoluto, tenemos como ejemplo: Variable: Medicin de la temperatura corporal, Escala: Grados centgrado o Celcius (37) Diferencia: La hace los nmero mayores menores de 37 Escala de razn. En esta escala si existe el cero absoluto y la magnitud de diferencia entre los valores numricos entre si por ejemplo: Variable: Relacin entre las edades Escala: Juan recin nacido (0 aos), Jos 9 aos (9 aos ms), Joaqun 18 aos (9 aos ms que Jos y 18 aos ms que Juan), etc.

53

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO NO. 3 LAS VARIABLES


TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 3. Elaborar un resumen del captulo III. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Continua 2. Cronologa 3. Cualitativo 4. Cuantitativo 5. Determinismo 6. Discreta 7. Frecuencia 8. Intervalo 9. Jerarqua 10. Modalidad 11. Nominal 12. Orden 13. Razn 14. Valor 15. Variable

54

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA NO. 3 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Qu es una variable? 2. Enumere los tipos de variables. 3. Defina variables cualitativas. 4. Defina variables cuantitativas. 5. Qu son escalas de medicin? 6. Defina escala de medicin ordinal. 7. Escala nominal. 8. Escala de razn. 9. Escala cronolgica. 10. Escala de intervalo. 11. Diferencia entre escala nominal y ordinal. 12. Diferencia entre escala de razn y de intervalo.

55

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

56

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

57

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

58

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo IV. DISTRIBUCIN DE FRECUENCIAS


4.1 Concepto
En estadstica, distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el si de observaciones en cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Una distribucin de frecuencias es una tabla en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los datos y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su frecuencia absoluta. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma (Diagrama de barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias: Frecuencia absoluta o simple. Es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. Frecuencia relativa. Es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por Fr. La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada. Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fac. Frecuencia porcentual. Es la frecuencia relativa expresada en porcentajes. Se representa por F%.

59

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

4.2 La distribucin normal


En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico de una funcin gaussiana. Johann Carl Friedrich Gauss (30 de abril de 1777, Brunswick 23 de febrero de 1855, Gttingen), fue un matemtico, astrnomo, geodsico, y fsico alemn que contribuy significativamente en muchos campos, incluida la teora de nmeros, el anlisis matemtico, la geometra diferencial, la estadstica, el lgebra, la geodesia, el magnetismo y la ptica. Considerado el prncipe de las matemticas y el matemtico ms grande desde la antigedad, Gauss ha tenido una influencia notable en muchos campos de la matemtica y de la ciencia, y es considerado uno de los matemticos que ms influencia ha tenido en la Historia. Fue de los primeros en extender el concepto de divisibilidad a otros conjuntos. La importancia de esta distribucin normal radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son: Caracteres morfolgicos de individuos como la estatura; Caracteres fisiolgicos como el efecto de un frmaco; Caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; Caracteres psicolgicos como el cociente intelectual; Nivel de ruido en telecomunicaciones; Errores cometidos al medir ciertas magnitudes; etc.

60

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad, continuas y discretas. La campana de Gauss es empleada en estadstica y probabilidad, y debe su nombre a su descubridor, el matemtico, astrnomo y fsico alemn Carl Friedrich Gauss. Es una representacin grfica de la distribucin normal de un grupo de datos. stos se reparten en valores bajos, medios y altos, creando un grfico de forma acampanada y simtrica con respecto a un determinado parmetro. El punto mximo de la curva corresponde a la media, y tiene dos puntos de inflexin a ambos lados. Este grfico se usa en variables asociadas a fenmenos naturales: caracteres morfolgicos de individuos como la estatura o el peso, caracteres fisiolgicos como el efecto de un frmaco, caracteres sociolgicos como el consumo de un determinado producto por un mismo grupo de individuos, caracteres psicolgicos como el cociente intelectual. Para elaborar la distribucin normal, se procede a levantar la informacin. Una vez se ha terminado la recoleccin de datos se procede a ordenarlos. Este orden puede hacerse de forma ascendente o descendente. El orden ascendente, es el ms utilizado y se realiza tomando el valor ms pequeo hasta llegar al mayor. Y el orden descendente se realiza tomando primero el valor mayor y terminando con el menor. Ejemplos: Dados los siguientes datos correspondientes a las frecuencias simples del total de paales utilizados por un infante en un da. Proceda a ordenarlos para preparar la distribucin de frecuencias: 9 12 8 10 6 6 5 4 12 10 8 7 7 6 9 6 10 7 8 4 5 6 6 8 7 Para una muestra igual a 30 nios N = 30

61

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Orden ascendente: 4 6 7 8 10 Orden descendente: 12 9 8 6 6 12 9 7 6 5 10 8 7 6 5 10 8 7 6 4 10 8 7 6 4 4 6 7 8 10 5 6 7 8 10 5 6 7 9 12 6 6 8 9 12

El orden facilita el clculo del rango, el intervalo y los nmeros de clase para la elaboracin de la tabla de distribucin de frecuencia.

4.3 La distribucin de Poisson


En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado nmero de eventos durante cierto periodo de tiempo. Fue descubierta por Simon-Denis Poisson Pithiviers, (Francia, 21 de junio de 1781 - Sceaux (Altos del Sena), Francia, 25 de abril de 1840), que la dio a conocer en 1838 en su trabajo Investigacin sobre la probabilidad de los juicios en materias criminales y civiles. Poisson fue un fsico y matemtico francs al que se le conoce por sus diferentes trabajos en el campo de la electricidad, tambin hizo publicaciones sobre la geometra diferencial y la teora de probabilidades. La primera memoria de Poisson sobre la electricidad fue en 1812, en que intent calcular matemticamente la distribucin de las cargas elctricas sobre la superficie de los conductores, y en 1824, tambin demostr que estas mismas formulaciones podan aplicarse de igual forma al magnetismo. El trabajo ms importante de Poisson fue una serie de escritos de las integrales definidas, y cuando tan solo tena 18 aos, escribi una memoria de diferencias finitas. Poisson enseaba en la escuela Politcnica desde el ao 1802 hasta 1808, en que lleg a ser un astrnomo del Bureau des Longitudes. En el campo de la astronoma estuvo fundamentalmente interesado en el movimiento de la Luna. En 1809 fue nominado como profesor de matemticas puras en la nuevamente abierta facultad de ciencias. Su distribucin es usada mayormente en estadstica inferencial. Se utiliza para describir cierto tipo de procesos, entre los que se encuentran la distribucin de llamadas telefnicas que llegan a un conmutador, la demanda (necesidades) de los pacientes que requieren servicio en una institucin de salud, las llegadas de camiones a una caseta de cobro y el nmero de accidentes registrados en una cierta interseccin de calles. Estos ejemplos tienen en comn un elemento: pueden ser descritos mediante una variable aleatoria discreta que toma valores enteros (0, 1, 2). En estadstica descriptiva la predominante es la distribucin normal o gaussiana. 62

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO IV LA DISTRIBUCIN DE FRECUENCIAS


TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 4. Elaborar un resumen del captulo IV. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Absoluta 2. Acumulado 3. Ascendente 4. Campo 5. Descendente 6. Distribucin 7. Frecuencia 8. Muestral 9. Normal 10. Normalidad 11. Orden 12. Porcentaje 13. Rango 14. Relatividad 15. Tests

63

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA NO. 4 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Describa que es la distribucin normal. 2. Defina las diferentes frecuencias de la distribucin normal. 3. Quien fue Poisson? 4. Quien fue Gauss? 5. Que es la campana de Gauss? 6. Describa las formas de ordenamiento de datos.

64

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

65

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

66

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo V. LAS MEDIDAS EN ESTADSTICA


5.1 Conceptos
Las medidas descriptivas son valores numricos calculados a partir de la muestra y que nos resumen la informacin contenida en ella. Su importancia radica en que, por ser la estadstica una herramienta utilizada para la toma decisiones requiere de mediciones exactas y confiables. Esto garantizar que dichas decisiones sean acertadas y tener investigaciones exitosas en cualquier rea del saber.

5.2 Medidas de posicin


Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el mismo nmero de frecuencias. Los cuantiles ms conocidos son: a) Cuartiles ( Qi ) Son valores de la variable que dividen a la distribucin en 4 partes, cada una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su izquierda el 50% de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75% de los datos. (Q2 = Me) b) Deciles ( Di) Son los valores de la variable que dividen a la distribucin en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habr 9 deciles. (Q2 = D5 = Me ) c) Centiles o Percentiles ( Pi ) Son los valores que dividen a la distribucin en 100 partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total habr 99 percentiles. (Q2 = D5 = Me = P50) Clculo de los cuantiles en distribuciones no agrupadas en intervalos - Se calculan a travs de la siguiente expresin: , siendo : r = el orden del cuantil correspondiente q = el nmero de intervalos con iguales frecuencias u observaciones ( q = 4, 10, 100 ). N = nmero total de observaciones - La anterior expresin nos indica que valor de la variable estudiada es el cuantil que nos piden, que se corresponder con el primer valor cuya frecuencia acumulada sea mayor o igual a Clculo de los cuantiles en distribuciones agrupadas en intervalos - Este clculo se resuelve de manera idntica al de la mediana. - El intervalo donde se encuentra el cuantil i-esimo, es el primero que una vez ordenados los datos de menor a mayor, tenga como frecuencia acumulada ( Ni ) un valor superior o igual a ; una vez identificado el intervalo Ii ( Li-1 , Li ], calcularemos el cuantil correspondiente, a travs de la frmula:

5.3 Medidas de centralizacin


Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso se incluyen tambin los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las 67

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se esta observando, en este caso se observan variables cuantitativas Entre las medidas de tendencia central tenemos: Media o media aritmtica: La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos. La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos. Se le llama tambin promedio o, simplemente, media. Clculo de la media para datos no agrupados Clculo de la media para datos agrupados: Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Las principales propiedades de la media aritmtica son:3 Su clculo es muy sencillo y en l intervienen todos los datos. Su valor es nico para una serie de datos dada. Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de una medida de dispersin. Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor: Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado, esto es, el valor de es mnimo cuando. Este resultado se conoce como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros de dispersin ms importantes: la varianza. Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si entonces donde es la media aritmtica de los , para i = 1, ..., n y a y b nmeros reales. Es poco sensible a fluctuaciones muestrales, por lo que es un parmetro muy til en inferencia estadstica. Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son: Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren. Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes. En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores extremos. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos. Media ponderada. A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Esencialmente, la media muestral es el mismo parmetro que el anterior, aunque el adjetivo 68

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

"muestral" se aplica a aquellas situaciones en las que la media aritmtica se calcula para un subconjunto de la poblacin objeto de estudio. La media muestral es un parmetro de extrema importancia en la inferencia estadstica, siendo de gran utilidad para la estimacin de la media poblacional, entre otros usos. Mediana. La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor.7 Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2: En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores: Se toma como mediana Existen mtodos de clculo ms rpidos para datos ms nmerosos (vase el artculo principal dedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin. [editar]Clculo de la mediana para datos agrupados Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas: Ni-1< n/2 < Ni = N19 < 19.5 < N20 Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos) La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms. Moda. La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta.5 En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin. Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-53-7. El nmero que ms se repite es 5, entonces la moda es 5. Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda. Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta. La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que: Siendo la frecuencia absoluta del intervalo modal y las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al 69

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

5.4 Medidas de dispersin


Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza). Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica. Di = x - x La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Ejemplo Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

70

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

5.5 Medidas de forma


Las medidas de distribucin o de forma nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representacin grfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la informacin. Su utilidad radica en la posibilidad de identificar las caractersticas de 71

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

la distribucin sin necesidad de generar el grfico. Sus principales medidas son la Asimetra y la Curtosis. 1. ASIMETRA Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media. 72

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.

2. CURTOSIS Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente. 73

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.

Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadsticos. Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introduccin a esta ciencia.

74

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO V LAS MEDIDAS EN ESTADSTICA


TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 5. Elaborar un resumen del captulo V. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Asimetra 2. Clculo 3. Centralizacin 4. Curtosis 5. Curva 6. Desviacin 7. Dispersin 8. Distribucin 9. Exactitud 10. Forma 11. Medicin 12. Medida 13. Negativo 14. Positivo 15. Simetra 16. Tendencia

75

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA NO. 5 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Defina medidas en estadstica. 2. Indique la importancia de las mediciones en estadstica. 3. Enumere las diferentes medidas utilizadas en estadstica. 4. Qu son las medidas de tendencia central? 5. Qu son las medidas de posicin? 6. Qu son las medidas de dispersin? 7. Qu es la asimetra? 8. Que es la curtosis? 9. Cuando una distribucin es leptocrtica, platicrtica o mesocrtica? 10. Describa las medidas de tendencia central que conoce. 11. Describa las medidas de dispersin que conoce. 12. Describa las medidas de posicin que conoce.

76

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

77

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

78

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Captulo VI. LOS GRFICOS


6.1 Definicin y clasificacin
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia (coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para analizarla. En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de presentacin de datos, sin abordar su otra faceta como herramienta de anlisis. Grficos estadsticos Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros. Tipos de grficos estadsticos Barras Lneas Circulares reas Cartogramas Mixtos Histogramas Otros Dispersograma Pictogramas Grficos de barras verticales (Llamados por algunos software de columnas) Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua. Pueden usarse para representar:

una serie dos o ms series (tambin llamado de barras comparativas)

79

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos. para una serie para dos o ms series

Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total. Las barras pueden ser: Verticales Horizontales

80

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser: Verticales horizontales

Grficos de barras apiladas Se usan para mostrar las relaciones Las barras

entre

dos

o ms pueden

series

con

el

total. ser:

verticales horizontales

81

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: una serie dos o ms series

Estos grficos se utilizan para representar valores con grandes incrementos entre s.

82

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser: En dos dimensiones en tres dimensiones

Grficos de reas En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser: Para representar una serie para representar dos o ms series en dos dimensiones en tres dimensiones.

83

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Cartogramas Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.

Grficos Mixtos En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: en dos dimensiones en tres dimensiones.

84

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Histogramas Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.

OTROS Grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector. Dispersograma Los dispersogramas Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

85

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma. Pueden ser:

En dos dimensiones En tres dimensiones.

Conclusin Hasta ahora slo hemos utilizado unos tipos de grfico muy comunes como el grfico de columnas por ejemplo. Sin embargo, hoy da Excel dispone de muchos ms tipos de grficos. 86

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

Cada tipo de grfico se diferencia de los dems por la clase de marcas de datos que utiliza. Por ejemplo, el grfico de columnas utiliza columnas como marcas de datos; el de crculos, utiliza crculos; etc. El motivo de que haya tantos tipos de grficos diferentes no es solamente esttico. Cada uno de los tipos de grficos est especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si quieres obtener la mxima eficacia al crear tus grficos y presentar tus datos de la mejor manera posible debes tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica.

6.2 Diagrama de tallo y hojas


El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener simultneamente una distribucin de frecuencias de la variable y su representacin grfica. Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formar el tallo). Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, presentan ms informacin que estos.

6.3 Histograma de frecuencias


En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En trminos matemticos, puede ser definida como una funcin inyectiva (o mapeo) que acumula (cuenta) las observaciones que pertenecen a cada subintervalo de una particin. El histograma, como es tradicionalmente entendido, no es ms que la representacin grfica de dicha funcin. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso.

87

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

6.4 Diagrama de barras


Un diagrama de barras, tambin conocido como diagrama de columnas, es un diagrama con barras rectangulares de longitudes proporcional al de los valores que representan. Los grficos de barras son usados para comparar dos o ms valores. Las barras pueden estar orientadas horizontal o verticalmente.

6.5 Diagrama de pastel o circular


Los grficos circulares son denominados tambin grficos de pastel o grficas de 360 grados. Se utilizan para mostrar porcentajes y proporciones. El nmero de elementos comparados dentro de un grfico circular, pueden ser ms de 5, ordenando los segmentos de mayor a menor, iniciando con el ms amplio a partir de las 12 como en un reloj. Una manera fcil de identificar los segmentos es sombreando de claro a oscuro, siendo el de mayor tamao el ms claro y el de menor tamao el ms oscuro. El empleo de tonalidades o colores al igual que en la grfica de barras, facilita la diferenciacin de los porcentajes o proporciones. Son utilizados en aquellos casos donde nos interesa no slo mostrar el nmero de veces que se da una caracterstica o atributo de manera tabular sino ms bien de manera grfica, de tal manera que se pueda visualizar mejor la proporcin en que aparece esa caracterstica respecto del total.

6.6 Plano de ejes cartesianos


Fue Descartes el primero que utiliz el mtodo de las coordenadas para indicar la posicin de un punto (en el plano o en el espacio), por eso se suele decir coordenadas cartesianas. Otro nombre utilizado para el Sistema de Coordenadas Cartesianas es: Plano Cartesiano. El plano cartesiano est formado por dos rectas numricas, una horizontal y otra vertical que se cortan en un punto. La recta horizontal es llamada eje de las abscisas o de las equis (x), y la vertical, eje de las ordenadas o de las yes, (y); el punto donde se cortan recibe el nombre de origen. El plano cartesiano tiene como finalidad describir la posicin de puntos, los cuales se representan por sus coordenadas o pares ordenados. Las coordenadas se forman asociando un valor del eje de las x y uno de las y, respectivamente, esto indica que un punto se puede ubicar en el plano cartesiano con base en sus coordenadas. Para localizar la abscisa o valor de x, se cuentan las unidades correspondientes hacia la derecha si son positivas o hacia a izquierda si son negativas, a partir del punto de origen, en este caso el cero. Desde donde se localiza el valor de x, se cuentan las unidades correspondientes hacia arriba si son positivas o hacia abajo, si son negativas y de esta forma se localiza cualquier punto dadas sus coordenadas.

88

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA CAPTULO VI LOS GRFICOS


TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 6. Elaborar un resumen del captulo VI. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Barras 2. Circular 3. Diagrama 4. Ejes 5. Graficar 6. Grfico 7. Histograma 8. Hojas 9. Imagen 10. Interpretacin 11. Par 12. Pastel 13. Pictogramas 14. Puntos 15. Representacin 16. Tallo

89

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

PRCTICA NO. 6 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Defina grficos. 2. Indique la importancia de los grficos y su uso en estadstica. 3. Qu es plano de ejes cartesianos? 4. Defina los grficos de pastel. 5. Qu son los histogramas de frecuencia? 6. Qu son los diagramas de barras? 7. Qu es el diagrama de tallo y hojas?

90

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

91

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

92

Manual de Estadstica I.

Profesora Juana De los Santos, M.A.

BIBLIOGRAFA
Acosta S., David. (2006). Manual para presentar trabajos escritos. Bogot, Colombia. Dawson Saunders B, Trapp R.:BIOESTADISTICA MEDICA , Edt. Manual Moderno Ed. 1. Pags. Inext. De La Qintana H.:INTRODUCCION A LA ESTADISTICA DESCRIPTIVA, Edt. FAC. MEDICINA UMSA Ed. 1 Bolivia-1996 Pags. Inext Escuela de Salud Pblica::BIOESTADISTICA PARA LAS CARRERAS DE L AREA DE SALUD, Edt. Universidad de Chile Ed. 1. Chile 2000 Pags. Inext. Herrera A.: ESTADISTICA, Edt UMSA ed. San jos La Paz Bolivia 1999 Pags. Inext. Hopkins K, Hopkins B, Glass G.:ESTADISTICA BASICA para las ciencias sociales y del comportamiento, Edt. Simon Shuster cia Ed. 3. Mxico 1999 Pags. Inext. Hopkins K, Hopkins B, Glass G.:ESTADISTICA BASICA, Edt. Simon Shuster cia Ed. 1. Mxico 1997 Pags. Inext Kazmier L.:ESTADISTICA APLICADA A LA ADMINISTRACION Y A LA ECONOMIA, Rev tec. Alegra H, Espaa Edt. Mc Graw Hill Ed. 3. Pags. Inext. Maldonado R.:BIOESTADISTICA MEDICA, Edt. S/n Ed. 1. Bolivia 1998. Pags. Referencial Martinez F,Anto J, Catellanos P, Gili M, Marset P, Navarro V.:SALUD PUBLICA, Espaa Edt. Mc Graw Hill Ed. 1. Pags. Inext. Mendoza Padilla J.:BIOESTADISTICA, METODOLOGIA DE LA INVESTIGACION,SALUD Y POBLACIN, Edt. Fac. Odontologa -UMSAEd. 1. 200 Pags. Inext. Milton S.:ESTADISTICA PARA BIOLOGIA Y CIENCIAS DE LA SALUD, Espaa Edt. Mc Graw Hill Ed. 3. Pags. Inext. Moya R, Saravia G.: ESTADISTICA DESCRIPTIVA, conceptos y apicaciones, Edt. San marcos Ed. 2. Per-Brasil 1999 Pags. Inext. Publication Manual of the American Psychological Association (APA) Sixth Edition (2010) Romero, Liset. (2002). Estadstica para la toma de decisiones. UNICARIBE. Santo Domingo, Rep. Dom. Spiegel, Murray. (1991). Estadstica. Serie Schaum. McGraw-Hill. 2da.Edicin. Mxico, D.F. Zenteno L, Limachi C.:BIOESTADISTICA, Edt. Propia Ed. 1. Pags. Inext www.vitutor.com/estadistica/descriptiva/a_1.html www.fca.unam.mx www.google.com www.monografias.com www.one.gob.do www.wikipedia.com http://www.spssfree.com/spss/analisis3.html

93

También podría gustarte