Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROGRAMA Y MANUAL DE CLASES Asignatura Clave Pre-rrequisito Crditos Horas Tericas Horas prcticas Duracin Docente Fecha : : : : : : : : : ESTADSTICA I EST-200 MAT-102 3 (48 horas) 28 20 16 semanas (1 cuatrimestre) Lic. Juana De los Santos, M.A. Perodo Mayo-Agosto del 2012.
Manual de Estadstica I.
Manual de Estadstica I.
NDICE
CAPTULO INTRODUCCIN OBJETIVOS METODOLOGA Y ACTIVIDADES MATERIALES DIDCTICOS Y DE APOYO SISTEMA DE EVALUACIN Captulo I. ESTADSTICA. HISTORIA Y CONCEPTOS 1.1 Historia de la estadstica 1.2 Conceptos de estadstica 1.3 Importancia de la estadstica 1.4 Relacin de la estadstica con otras ciencias 1.5Desarrollo actual de la estadstica en la Repblica Dominicana PRCTICA CAPTULO I Captulo II. LA ESTADSTICA PARA LA TOMA DE DESICIONES 2.1 Tipos de estadstica 2.1.1 Estadstica descriptiva 2.1.2 Estadstica inferencial 2.2 Instrumentos de recoleccin de datos 2.3 Muestreo PRCTICA CAPTULO II Captulo III. LAS VARIABLES 3.1 Conceptos y generalidades 3.2 Tipos de variables 3.2.1 Variables por medicin 3.2.2 Variables por influencia 3.3 Escalas de medicin y manejo de datos PRCTICA CAPTULO III Captulo IV. DISTRIBUCIN DE FRECUENCIAS 4.1 Concepto 4.2 La distribucin normal 4.3 La distribucin de Poisson PRCTICA CAPTULO IV Captulo V. LAS MEDIDAS EN ESTADSTICA 5.1 Conceptos 5.2 Medidas de posicin 5.3 Medidas de centralizacin 5.4 Medidas de dispersin 5.5 Medidas de forma PRCTICA CAPTULO V Captulo VI. LOS GRFICOS 6.1 Definicin y clasificacin 6.2 Diagrama de tallo y hojas 6.3 Histograma de frecuencias 6.4 Diagrama de barras 6.5 Diagrama de pastel o circular 6.6 Plano de ejes cartesianos PG. 5 6 7 9 10 11 11 12 17 17 19 27 31 31 31 32 34 39 43 47 47 49 49 49 51 54 59 59 60 62 63 67 67 67 67 70 71 75 79 79 87 87 88 88 88 3
Manual de Estadstica I.
89 93
Manual de Estadstica I.
INTRODUCCIN
La estadstica ha formado parte del saber humano desde tiempos inmemoriales. Como ciencia, aunque relativamente nueva, se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. En ese sentido, este manual se ha elaborado con la finalidad de que el estudiante adquiera los conocimientos y las competencias necesarias de estadstica descriptiva para su desarrollo profesional y personal. Conceptualizamos la estadstica para predicciones pero nos circunscribimos a los mtodos de la estadstica descriptiva. Entendemos que estos conocimientos son necesarios para todas las reas del saber, ya que en cada una de ellas se realizan investigaciones. Adems de que siempre ser necesario hacer estimaciones acerca de la realidad de nuestra profesin o campo laboral. El presente manual agota dos captulos relativos a conceptos, historia, desarrollo y evolucin de la estadstica, desde antes de la era cristiana hasta nuestros das. Y hace un breve recuento del desarrollo de la misma en el pas. Y en los captulos subsiguientes se adentra en los conceptos de variables distribucin de frecuencias, muestreo y grficos con ejercicios y ejemplos para mejor comprensin del estudiante. Esperamos que de este material obtengan el mayor conocimiento posible. As como tambin que lo conserven como material de consulta, para materias futuras y para su vida profesional y laboral.
Manual de Estadstica I.
OBJETIVOS
General: Como objetivo general de esta asignatura se persigue que el estudiante aprenda, conozca y pueda aplicar y utilizar los diferentes mtodos estadsticos para el anlisis de datos dentro del marco de la estadstica descriptiva. As como tambin, que pueda utilizar los conceptos de la materia en los contextos y situaciones pertinentes. Especficos: Como objetivos especficos que el estudiante debe lograr al final de esta asignatura tenemos los siguientes: 1. Conocer los orgenes de la estadstica como ciencia aplicada y como concepto, as como su evolucin histrica, cientficos que aportaron a su desarrollo y crecimiento, sus ramas. Tambin se persigue que el estudiante conozca el desarrollo y uso de la estadstica en la Repblica Dominicana. 2. Conceptualizar y diferenciar los tipos de estadstica. Los alcances de la misma dentro de su tipologa, su importancia y uso en diferentes reas. 3. Aprender la forma de recoleccin de datos de una poblacin, el tratamiento de dichos datos para su consecuente anlisis y elaboracin de conclusiones respecto a los mismos. 4. Utilizar y aplicar los mtodos estadsticos adecuados para la poblacin y el tipo de estudio a realizar. 5. Ensear y desarrollar las habilidades y competencias necesarias para la elaboracin de grficos variados de la informacin obtenida en una investigacin.
Manual de Estadstica I.
METODOLOGA Y ACTIVIDADES
El desarrollo de la asignatura se realizar de la siguiente manera: El perodo del que se dispone para el desarrollo de los contenidos de la materia es de cuatro meses, equivalentes a 16 semanas, durante las cuales se impartirn clases una vez por semana en sesiones o jornadas de tres (3) horas cada una, en congruencia con los crditos aprobados de la misma. En ese sentido, se pretende en la primera semana, luego de la presentacin del docente y los estudiantes, exponer y discutir con los estudiantes el programa del curso, los objetivos, las unidades de contenido, as como las actividades y tareas fuera y dentro del aula que debern realizar. Tambin, en esta primera parte, se dar a los estudiantes una evaluacin diagnstica, para compararla con la evaluacin final y, ponderar si los objetivos fueron alcanzados o no. Para esta asignatura se ha preparado un manual en el cual se recopilan los diferentes contenidos a ser desarrollados en el transcurso de la misma. El mismo contiene, al final de cada captulo, una prctica de lo estudiado y explicado, y que el estudiante deber realizar. Estos ejercicios forman parte de las horas de prctica de la asignatura y la estrategia de llenado, individual o grupal, en el aula o en la casa, lo determinar el docente de acuerdo a la conveniencia de los alumnos y la disponibilidad de tiempo. Los contenidos se dividirn en tres bloques y al final de cada uno se har una evaluacin parcial de los mismos. Por lo tanto, para ir acorde con el tiempo, cada semana se agotar un captulo y su correspondiente prctica. En el primer bloque se agotarn los dos primeros captulos con sus prcticas y en la cuarta semana de clases se realizar la evaluacin de este primer bloque primer parcial. En ese mismo orden, en el segundo bloque se agotarn los captulos 3 y 4 con sus prcticas, a razn de un captulo por semana, y su evaluacin se realizar en la octava semana de clases, la cual equivale al segundo parcial. Finalmente, en el tercer bloque se agotarn los captulos 5 y 6 del programa con sus correspondientes prcticas. La evaluacin final, la evaluacin del curso y del profesor se llevarn a cabo en la ltima semana de clases, semana nmero 15 16. Las actividades a realizarse dentro de la clase sern exposiciones grupales, trabajos individuales y en grupo, tanto dentro como fuera del aula, cuya organizacin se describe a continuacin. Luego de presentado el curso y de que cada estudiante cuente con los materiales didcticos esenciales para el desarrollo de la asignatura, se proceder a dividirlo en grupos de acuerdo al qurum del curso. Cada semana, un grupo, o un estudiante, expondr el tema de la semana, tomando en cuenta las pautas previamente dadas por la maestra para dicha exposicin y con lmite de tiempo. Luego de cada exposicin, la maestra proceder a explicar ms detalladamente los tpicos bsicos que deben obtenerse de ese captulo y dar participacin a los estudiantes para que aclaren sus dudas, pregunten o aporten al tema, ya sea con datos tericos o con experiencias personales. Asimismo, por su parte, el alumno deber entregar un resumen de 5 a 10 pginas del captulo dado, hecho a mano y utilizando bolgrafos azul, rojo y negro. El azul para los ttulos y subttulos, el negro para los textos y el rojo para los subrayados. Dependiendo del tiempo que se disponga, se realizar la prctica del captulo contenida en el manual de la clase, y de no ser posible realizarla y discutirla en la clase, se dejar como tarea para la casa y se revisar, calificar, sellar y firmar antes de iniciar la siguiente clase. Tambin, al final de cada clase, la maestra dar a los alumnos un listado de palabras relacionadas con el tema discutido, las cuales sern buscadas en varios diccionarios y 7
Manual de Estadstica I.
enciclopedias, organizadas en orden alfabtico y que sern definidas en el cuaderno de dibujo (con hojas en blanco, sin lneas) previamente solicitado. Se requieren bolgrafos rojo, azul y negro. Con el azul se escribirn los ttulos o las palabras para el diccionario, con el rojo se subrayarn los ttulos y palabras a definir en el diccionario y con el negro de escribirn los textos, las definiciones del diccionario temtico y las preguntas tericas de las prcticas por captulo. El subrayado deber hacerse con regla para que quede lo mejor posible. El cuaderno rayado se utilizar para los apuntes de los alumnos con relacin a las explicaciones de la maestra durante la clase. Al final de la materia, para completar los puntos de la prctica, se elaborar un trabajo final, con las especificaciones que la maestra aportar. El mismo deber ser entregado va e-mail en la fecha determinada, de acuerdo al calendario acadmico.
Manual de Estadstica I.
Manual de Estadstica I.
SISTEMA DE EVALUACIN
En esta asignatura, el sistema de evaluacin ser como sigue: Las horas de teora sern evaluadas en base a 70 puntos y las horas de prctica en base a 30 puntos, para un total de 100 puntos. Ahora bien, estas puntuaciones se obtendrn de la manera siguiente: BLOQUE TERICO: Primer parcial + Reportes de lectura 20 puntos Segundo parcial + Prctica Manual 20 puntos Tercer parcial + Diccionario temtico 30 puntos Sub-total 70 puntos BLOQUE PRCTICO: Exposicin + Trabajo final 20 puntos Asistencia + participacin 10 puntos Sub-total 30 puntos TOTAL GENERAL 100 puntos
10
Manual de Estadstica I.
Manual de Estadstica I.
nacimientos, de funciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de la riqueza contenida en las tierras conquistadas. Otro pueblo que desarroll y utiliz la estadstica fueron los Babilonios, quienes vivieron en Mesopotamia, en unos claros de tierras frtiles entre los ros Tigris y ufrates, hacia finales del milenio IV a.C. Desarrollaron una forma abstracta de escritura basada en smbolos cuneiformes. Sus smbolos fueron escritos en tablas de arcilla mojada cocidas al sol. Y gracias a las que han sobrevivido hasta nuestros das se ha podido conocer, entre otras cosas, gran parte de las matemticas babilnicas as como los sus aportes a la estadstica. El aspecto ms asombroso de las habilidades de los clculos de los Babilonios, fue su construccin de tablas para ayudar a calcular. Hacia el ao 3000 A.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Sin embargo, el aporte ms importante de los Babilonios a la estadstica fue el Teorema de Pitgoras. Este teorema, aunque ms aplicado en trigonometra, represent un aporte muy valioso para la estadstica, sobre todo porque demostr conexiones entre las desviaciones estndar y variables independientes con el Teorema de Pitgoras, as como la correlacin entre variables aleatorias dependientes y la ley de cosenos. La civilizacin China muestra registros sobre el uso de estadstica, realizada en los censos, aproximadamente en el ao 2000 a.C . Confucio, en uno de sus clsicos "Shu-King" escrito hacia el ao 550 a.C., nos narra cmo el Rey Yao en el ao 2238 mand hacer una estadstica agrcola, industrial y comercial. Dichos datos representan la primera referencia escrita sobre estadstica que se conoce. Sin embargo, los aportes ms relevantes de los chinos a la estadstica, provienen de su desarrollo de las matemticas y la geometra. El trabajo ms antiguo existente sobre geometra en China proviene de la filosofa Mohista (c. 330 a.C.), compilado por los seguidores de Mozi (470 a.C.-390 a.C.). El Mo Jing describe diversos aspectos de muchos campos relacionados con la ciencia fsica, y proporcion informacin sobre las matemticas. La dinasta Han (202 a.C.-220 d.C) produjo obras matemticas que presumiblemente se ampliaron en otras que ahora estn perdidas. La ms importante de ellas es Los Nueve Captulos sobre el Arte de Matemticas, cuyo ttulo completo apareci en 179 d.C., pero que previamente existi, en parte, bajo otros ttulos. . Los chinos tambin 12
Manual de Estadstica I.
desarrollaron el tringulo de Pascal y la regla de tres mucho antes de que se conociera en Europa. Zu Chongzhi (siglo V), de las Dinastas del Sur y del Norte, calcul el valor de (pi=3.1415926 y establece la relacin entre la circunferencia y su dimetro) con siete decimales, que fue el ms preciso valor de durante casi 1000 aos, adems de aportes al chi cuadrado Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos. Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadsticas semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. John Graunt fue un innovador en el anlisis estadstico. Entre los siglos XIX y XX, la Estadstica se propag a travs de diversas disciplinas: la astronoma y la geodesia, la psicologa, la biologa, hasta las ciencias sociales. Y tambin profundiz en el conocimiento del rol de la probabilidad, siendo desplazada la analoga de los juegos de azar, por modelos probabilsticos para efectuar medidas bajo incertidumbre. De este modo se llega a los inicios de la inferencia estadstica, cuyo dominio de aplicacin se extiende gradualmente, desde fines de este perodo. A Gottfried Achenwall se le conoce como el Padre de la Estadstica. l fue quin introdujo y utiliz el trmino statistik para referirse al anlisis de datos. Sin embargo, son muchos los personajes que, a travs de la historia de la humanidad, le han aportado y han desarrollado la estadistica. Entre ellos tenemos los siguientes, entre otros: A. M. Legendre, matemtico y estadstico francs, 1752-1833. Cre un sistema para describir el movimiento planetario, que involucra el mtodo de los mnimos cuadrados, tan utilizado en la Estadstica de hoy, como mtodo de estimacin de parmetros. Karl Gauss, matemtico, astrnomo, fsico alemn, 1773-1855. Desemboc en la ley de probabilidad normal independientemente de Laplace, como descripcin probabilstica del error, pero encontr su asociacin con el mtodo de mnimos cuadrados. Dise la famosa campana de Gauss o de distribucin normal. Adolphe Quetelet, matemtico, meteorlogo, astrnomo, estadstico, socilogo belga, 17811840. Se le ha llamado el padre de la Estadstica moderna, por observar la extraordinaria regularidad con que se reproducan ciertos fenmenos sociales, como crmenes o suicidios. 1835. Simen Denis Poisson, matemtico y fsico francs, 1781-1840. Public en 1837 el germen de dos elementos asociados a su nombre: La distribucin de Poisson y La generalizacin de la ley de los grandes nmeros de Bernoulli. William Playfair (1759-1823) expone su idea de que los grficos permiten una comunicacin ms eficiente que las tablas de frecuencia. Es considerado como el inventor de los grficos lineales, de barras y de sectores. Playfair public el libro titulado The Commercial and Political 13
Manual de Estadstica I.
Atlas (1786) el cual contiene 43 grficos de series de tiempo y por primera vez, es usado un grfico de barras. En 1801 utiliza el primer grfico de sectores en su obra Playfairs Statistical Breviary. Sir Francis Galton (1822-1911) cre el concepto estadstico de regresin y correlacin, y fue el primero en aplicar mtodos estadsticos para estudiar las diferencias humanas, basado en el uso de cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadstico estadounidense quien desarrollo la primera mquina tabuladora basada en tarjetas perforadas y mecanismos elctrico-mecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada en el censo de 1890 en estados unidos que redujo la tabulacin de los datos de 7 aos (censo de 1880) a 2.5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR), que bajo la presidencia de Thomas J. Watson fue renombrada a International Business Machines (IBM) en 1924. Major Greenwwod (1880-1949) investiga los problemas de salud asociados al trabajo en fbricas. Desarroll la Epidemiologa y en 1919 cre el Ministerio de la Salud en Inglaterra, responsable de datos estadsticos mdicos. Sir John Sinclair (1754-1835). Fue la primera persona que introdujo el trmino estadstica en Inglaterra con su trabajo Statistical Account of Scotland (1791-1799) trabajo compilado en 21 volmenes. Orgenes en probabilidad La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teora de la probabilidad se usa extensamente en reas como la estadstica, la fsica, la matemtica, la ciencia y la filosofa para sacar conclusiones sobre la probabilidad discreta de sucesos potenciales y la mecnica subyacente discreta de sistemas complejos. La idea de Probabilidad est ntimamente ligada a la idea de azar y nos ayuda a comprender nuestras posibilidades de ganar un juego de azar o analizar las encuestas. Pierre-Simon Laplace afirm: "Es notable que una ciencia que comenz con consideraciones sobre juegos de azar haya llegado a el objeto ms importante del conocimiento humano". Comprender y estudiar el azar es indispensable, porque la probabilidad es un soporte necesario para tomar decisiones en cualquier mbito. Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento cientfico que se conoce a la materia. El Ars coniectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemticas. En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica. La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teora de la discusin de errores de observacin. La reimpresin (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos lmites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad. Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinacin de observaciones desde los principios de la teora de probabilidades. Laplace represent la Ley de probabilidades de errores mediante una curva y dedujo una frmula para la media de tres observaciones. Tambin, en 1871, 14
Manual de Estadstica I.
obtiene la frmula para la ley de facilidad del error (trmino introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo producto de las probabilidades de un sistema de errores concurrentes. El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin de la localizacin del planeta enano Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para , el probable error de una observacin simple es bien conocido. El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadstica y quien introdujo la nocin del hombre promedio (lhomme moyen) como un medio de entender los fenmenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.
Manual de Estadstica I.
Se define tambin como el conjunto de indicadores numricos que caracterizan diferentes aspectos de la vida social, incluyendo la produccin, las relaciones polticas, culturales de la vida cotidiana. O bien, la recopilacin, presentacin anlisis e interpretacin de los datos numricos. La estadstica se refiere a las colecciones sistemticas de datos relativos a un fenmeno. Desde los comienzos de la civilizacin han existido formas sencillas de la estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. La palabra "estadstica" procede del latn statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "poltico"). La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: - Recogida de datos. - Organizacin y representacin de datos. - Anlisis de datos. - Obtencin de conclusiones. Conceptos utilizados en Estadstica. Poblacin. Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo o sujeto. Unidad estadstica, cada uno de los elementos que componen la poblacin. Muestra. Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo. El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor. Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Frecuencia: es el nmero de repeticiones de un dato en la distribucin o del total de observaciones. Smbolos estadsticos = infinito
= sigma = sumatoria
= igualdad equivalente
Estudios experimentales y observacionales Un objetivo comn para un proyecto de investigacin estadstica es investigar la causalidad, y en particular extraer una conclusin en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadsticos para estudiar causalidad: estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo. 16
Manual de Estadstica I.
Manual de Estadstica I.
la utilizacin de las tcnicas estadsticas, sin considerar la adecuacin de stas a las condiciones en las que se aplican. A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por avances vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982; Rossi y otros, 1983), y muy especialmente en la psicologa (Judd y otros, 1995), lo que favorece una absorcin de poca calidad por parte de los especialistas en reas no metodolgicas. Por otro lado, la adopcin de procedimientos informticos para realizar tareas metodolgicas no parece ser una solucin inmediata, considerando la ansiedad que generan los ordenadores, fenmeno muy generalizado (Faria y Arce, 1993). La fusin de esta creciente complicacin de las herramientas de anlisis, junto con la discrepancia entre los objetivos de formacin y la necesidad de uso de los recursos estadsticos, consigue finalmente que el especialista en reas aplicadas tienda a descuidar aspectos muy bsicos, previos a la aplicacin de estos recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la aplicacin de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el sentido de aplicarse para permitir la ejecucin de una prueba o el ajuste de un modelo, no porque son las estrategias ms adecuadas, sino porque son las ms cmodas La fsica estadstica o mecnica estadstica es la parte de la fsica que trata de determinar el comportamiento agregado termodinmico de sistemas macroscpicos a partir de consideraciones microscpicas utilizando para ello herramientas estadsticas junto a leyes mecnicas. La fsica estadstica puede describir numerosos campos con una naturaleza estocstica (reacciones nucleares, sistemas biolgicos, qumicos, neurolgicos, etc.). La estadstica industrial es la rama de la estadstica que busca implementar los procesos probabilsticos y estadsticos de anlisis e interpretacin de datos o caractersticas de un conjunto de elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y en el control de los procesos industriales y organizacionales. La historia es la ciencia que tiene como objeto de estudio el pasado de la humanidad y como mtodo el propio de las ciencias sociales. Se denomina tambin historia al periodo histrico que transcurre desde la aparicin de la escritura hasta la actualidad. Es considerada "la ciencia de las ciencias" por englobar en su estudio multitud de otras ciencias, a priori sin relacin a ella. Ms all de las acepciones propias de la ciencia histrica, historia en el lenguaje usual es la narracin de cualquier suceso, incluso de sucesos imaginarios y de mentiras. En medicina se utiliza el concepto de historia clnica para el registro de datos sanitarios significativos de un paciente, que se remontan hasta su nacimiento o incluso a su herencia gentica. En la historia la estadstica cumple una funcin primordial para poder ubicar en el tiempo y en el espacio cada uno de los acontecimientos desde la creacin del universo. La bioestadstica, de forma general, es la aplicacin de la estadstica a la biologa. Debido a que las cuestiones a investigar en biologa son de naturaleza muy variada, por ejemplo, la medicina, ciencias agropecuarias y forestales, la bioestadstica ha expandido sus dominios para incluir cualquier modelo cuantitativo, no slo estadstico, que pueda ser usado para responder a estas necesidades. La bioestadstica puede ser considerada como una rama, altamente especializada, de la informtica mdica que puede ser, a su vez, complementada por la bioinformtica. 18
Manual de Estadstica I.
Algunos campos de investigacin usan la estadstica tan extensamente que tienen terminologa especializada. Estas disciplinas incluyen: Ciencias actuariales Fsica estadstica Estadstica industrial Estadstica Espacial Matemticas Estadstica Estadstica en Medicina Estadstica en Nutricin Estadstica en Agronoma Estadstica en Planificacin Estadstica en Investigacin Estadstica en Derecho Estadstica en Restauracin de Obras Estadstica en Literatura Estadstica en Astronoma Estadstica en la Antropologa (Antropometra) Estadstica en Historia Estadstica Militar Geoestadstica Bioestadstica Estadsticas de Negocios Estadstica Computacional Estadstica en las Ciencias de la Salud Investigacin de Operaciones Estadsticas de Consultora Estadstica de la educacin, la enseanza, y la formacin Estadstica en la comercializacin o mercadotecnia Cienciometra Estadstica del Medio Ambiente Estadstica en Epidemiologa Estadstica econmica (Econometra) Estadstica en Ingeniera Geografa y Sistemas de informacin geogrfica, ms especficamente en Anlisis espacial Demografa Estadstica en psicologa (Psicometra) Calidad y productividad Estadsticas sociales (para todas las ciencias sociales) Cultura estadstica Encuestas por Muestreo Anlisis de procesos y quimiometra (para anlisis de datos en qumica analtica e ingeniera qumica) Estadsticas Deportivas
Manual de Estadstica I.
gobierno. Personas y organizaciones usan la estadstica para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras reas. La estadstica es entendida generalmente no como un sub-rea de las matemticas sino como una ciencia diferente aliada. Muchas universidades tienen departamentos acadmicos de matemticas y estadstica separadamente. La estadstica se ensea en departamentos tan diversos como psicologa, educacin y salud pblica. Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos cristalizados en una roca o de bienes manufacturados por una fbrica en particular durante un periodo dado. Tambin podra ser un proceso observado en varios ascos instantes y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones prcticas, en lugar de compilar datos de una poblacin entera, usualmente se estudia un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadsticamente lo cual sigue dos propsitos: descripcin e inferencia. El concepto de correlacin es particularmente valioso. Anlisis estadsticos de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la poblacin bajo consideracin) tienden a variar conjuntamente, como si hubiera una conexin entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte podra resultar en que personas pobres tienden a tener vidas ms cortas que personas de mayor ingreso. Las dos variables se dicen que estn correlacionadas. Sin embargo, no se puede inferir inmediatamente la existencia de una relacin de causalidad entre las dos variables. El fenmeno correlacionado podra ser la causa de una tercera, previamente no considerada, llamada variable confusora. Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas en la muestra pueden ser extendidas a la poblacin completa. Un problema mayor es el de determinar que tan representativa es la muestra extrada. La estadstica ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los datos, as como mtodos para disear experimentos robustos como primera medida, ver diseo experimental. El concepto matemtico fundamental empleado para entender la aleatoriedad es el de probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama de las matemticas aplicadas que usa la teora de probabilidades y el anlisis matemtico para examinar las bases tericas de la estadstica. El uso de cualquier mtodo estadstico es vlido solo cuando el sistema o poblacin bajo consideracin satisface los supuestos matemticos del mtodo. El mal uso de la estadstica puede producir serios errores en la descripcin e interpretacin, afectando las polticas sociales, la prctica mdica y la calidad de estructuras tales como puentes y plantas de reaccin nuclear. Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser difcilmente interpretados por un inexperto. Por ejemplo, el significado estadstico de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada por una variacin aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadsticas bsicas (y el escepticismo) que una persona necesita para manejar informacin en el da a da se refiere como cultura estadstica. Sin un dominio certero sobre la misma, como instrumento de simple cuantificacin la Estadstica apareci en nuestro pas "desde los primeros aos de su descubrimiento" (Trujillo y la 20
Manual de Estadstica I.
Estadstica. Nicols Rizik H. Editora Montalvo, 1945). En la Repblica Dominicana se impone un examen de las diferentes fases de evolucin, la cual dividiremos en perodos, contados a partir del 1942, de la manera siguiente: 1492-1843; 1844-1904; 1905-1934; 1935-1960; y 1961 hasta 1975. Y posteriormente haremos un resumen reciente de los acontecimientos acaecidos en el quinto perodo, desde 1971 a 1998. PRIMER PERIODO 1492-1843. Entre los acontecimientos Estadsticos importante de este perodo figuran las informaciones Estadsticas sobre el repartimiento de Indios de 1514; el Censo de Osorio de 1606, el cual contiene un recuento de la poblacin, esclavos, ingenios, hatos, estancias de jengibres y puertos en las costas; los "censos "de 1780 (parroquial); el de 1819 y el censo de 1824 efectuado por el invasor haitiano. En realidad estos "censos" (que ms bien eran recuentos) y la recoleccin de informaciones limitadas, ligadas al comercio exterior, constituyen las actividades Estadsticas ms importantes de este perodo. Un hecho que merece ser citado es que aparece en el archivo de Monte Plata, en el ao 1821, un acta que dice que el ayuntamiento de aquella comn vot la suma de sesenta pesos para instalar un servicio de Estadstica", sin embargo, no se conoce ningn otro hecho que d continuidad histrica a ste. SEGUNDO PERIODO 1844-1904. Segn Don Vicente Tolentino Rojas, a partir de 1844, ao de la Independencia Nacional, figura "en todas las cartas constitucionales, como expresa atribucin del congreso, la de determinar todo lo concerniente a la formacin peridica de la Estadstica general de la Repblica". Es decir, se muestra el ms alto nivel de la necesidad de organizar el sistema Estadstico. Las Estadsticas se producen en el sector poblacin, debido a la necesidad de contar con informaciones sobre este importante aspecto, por consideraciones de tipo poltico, religioso y legal. As en 1845 se dicta la" ley sobre ayuntamientos; que otorga a los cabildos del pas el derecho de organizar las Estadsticas de poblacin. Otro intento de organizacin sectorial se produce en 1844, esta vez con las Estadsticas de comercio exterior fundamentalmente; esto se materializa con el decreto del entonces Presidente Ulises Heureaux, de fecha 17 de junio de ese ao, mediante el cual se creaba, adscrito a la contadura General de Hacienda "Un Negociado de Estadstica Mercantil, a cargo de un director y de los dems empleados, que al curso de los trabajos revelar". De acuerdo con las atribuciones fijadas en el mismo, para el negociado en referencia, estas se referan tan solo a la indagacin de las cifras del comercio Exterior, comercio de cabotaje, navegacin exterior costanera y navegacin interior o fluvial. En ste ao el Congreso Nacional, voto por un decreto la suma de RD$4,500.00 para remunerar el trabajo de la Estadstica mercantil del ao anterior, bajo las estipulaciones hecha por el ministro de Hacienda y Comercio que lo era entonces el seor Eugenio Generoso Marchena. Ambos intentos, aunque importantes, no llegaron a cumplir los limitados objetivos que se haban propuesto. En 1866 la ley suprimi las atribuciones dadas a los ayuntamientos, aparentemente por la ineficiencia de los mismos en cumplir con la tarea encomendada, y " en 1887 el ministro de Hacienda y Comercio se quejaba de la falta de datos ciertos sobre el comercio de exportacin y urga el que fueran dictadas disposiciones precisas, tanto para asegurarlos intereses fiscales, cuanto para hacer la Estadstica verdad." Entretanto, la Iglesia sigue valindose de " Censos Parroquiales" para estimar la poblacin y se realizan los Censos Parroquiales del 1863y 1887, los cuales enumeraban solamente la poblacin catlica, pero por ser esta la gran mayora sirvieron de buena base para estimar la poblacin total del pas. A fines del siglo XIX, en especial del 1885 a 1900, puede notarse una fuerte presin de parte de intelectuales y polticos por la creacin de los mecanismos burocrticos necesarios para la 21
Manual de Estadstica I.
organizacin del sistema Estadstico Dominicano. Esto se puede apreciar en las memorias del 883 y 1887 del ministerio de justicia, Fomento e Instruccin pblica, referentes a los datos de nacimientos y defunciones. La Estadstica de nacimientos acusan un sub-registro de un 25% y las defunciones de un 45%. Es decir, slo se registra el 75% de los nacimientos ocurridos y el 55% de las defunciones. En 1888, Jos Ramn Abad en" La Repblica Dominicana, resea general Geogrfico Estadstico" hace hincapis varias veces sobre la necesidad de organizar las Estadsticas Nacionales, dice" La cuenta y el libro en que se anotan las grandes operaciones de los pueblos, es la ciencia de la Estadstica, y sin contar con ella, sin tenerla establecida en todas sus ramas y derivaciones accesorias, no es posible que haya seguridad ni acierto en la direccin y manejo de los negocios pblicos. Un indicador del avance en cuanto a la importancia y necesidad de la Estadstica, lo constituye el "Censo de poblacin y otros datos Estadsticos de la ciudad de Santo Domingo". Levantado el 6 de diciembre de 1892. "Patrocinado por un grupo de altruistas ciudadanos, entre los que figuraban el poeta Jos Joaqun Prez, el pintor Luis Desangles, el escritor Vetilio Arredondo y otros intelectuales y muncipes prominentes de esa poca". El Censo efectu el conteo de la poblacin por sexo, estado civil, nacionalidad, alfabetismo. Adems, recolect informaciones sobre nacimientos y defunciones. Por otra parte obtuvo cifras sobre nmero de calles de la ciudad, de iglesias, cuarteles municipales, edificios pblicos, construcciones de mampostera y de madera, establecimientos de enseanzas, bibliotecas pblicas, libreras, peridicos, abogados, mdicos, agrimensores, dentistas, boticas, medios de locomocin y otros aspectos. Este perodo 1844-1904 es de suma importancia pues en el mismo adquiere el pas el grado de desarrollo socioeconmico que permite a un grupo bien formado tomar conciencia del valor de la Estadstica y la necesidad de que sea organizada en forma adecuada por el Estado. Las condiciones estn dada para que se produzca la ley que crea la oficina de Estadstica y con ello pasaremos al estudio del Tercer Perodo. TERCER PERIODO 1905-1934. En este perodo se crean los organismos administrativos y se implantan las disposiciones legales que permiten comenzar a echar las bases del sistema Estadstico Dominicano, el cual, sin embargo, no logra crecer y desarrollarse bastante en estos aos, sino que lo hace en perodos posteriores. En el 1905, siendo Presidente de la Repblica Carlos F. Morales Languasco, por resolucin 4607, publica en la Gaceta Oficial" 1616 del 9 de Septiembre, se crea la oficina Estadstica. Y aqu una limitacin de sta ley, a quien se menciona de la siguiente manera: " La Oficina de Estadstica estar obligada a requerir a los particulares todos los datos que stos puedan suministrarle". Con la disposicin, la obtencin de datos provenientes de particulares estaba sujeta a la buena voluntad de stos. Es evidente que un sistema Estadstico no puede organizarse sobre esa base. La ley 4879 publicada en la gaceta oficial 1997 del 3 de Junio del 1909, llamada" Ley sobre Estadstica Nacional" mejora sustancialmente la de 1905 y puede decirse que para esa poca, es una legislacin con carcter moderno. Segn la ley de referencia, La Estadstica de la Repblica Dominicana se llevara obligatoriamente y con toda seguridad. Establece, adems la obligatoriedad de ofrecer informaciones tanto a funcionarios pblicos como a particulares, llenando en este caso el gran vaco de la ley del 1905. En esta ley de 1909 se crean las siguientes secciones que forman parte de la oficina de Estadstica: 1. Seccin de Estadstica Demogrfica 2. Seccin de Censo 3. Seccin Sociogrfica 4. Seccin Comercial y Administrativa. 22
Manual de Estadstica I.
La Seccin de Estadstica. Demogrfica tendra a su cargo los datos sobre la poblacin, nacimientos y defunciones; la de Censo se encargara del movimiento migratorio, crecimiento vegetativo recopilacin y conservacin de documentos sobre censos; La Sociogrfica de las Estadsticas escolares, judiciales y eclesisticas y la seccin comercial y administrativa de las Estadsticas referentes a la administracin municipal, puertos, cabotajes y aduanas, correos, impuestos y ferrocarriles. El 24 de Diciembre del 1920 se levant el primer Censo Nacional de la poblacin, tarea efectuada por las fuerzas invasoras norteamericanas que a la Sazn ocupaban el pas. Este Censo contiene informaciones sobre poblacin por edad, Sexo y Estado Civil, sobre vivienda, agricultura y otras indagaciones. La experiencia censal del pas, en esa poca, era prcticamente nula y el Censo contiene deficiencias tales, como: 1.- Subnumeracin. 2.- Tabulacin de slo algunos grupos de edades, lo que limita al anlisis demogrfico y socioeconmico en general. 3.- Falta de "simultaneidad". Todava en los aos de 1921 y 1922 mediante rdenes ejecutivas 663 y 769, se aprobaron 3 mil dlares primero y quinientos pesos despus para continuar la recopilacin de datos. Estas deficiencias pueden explicarse, en parte, por las siguientes razones: 1.- El estado de intranquilidad poltica que viva el pas, ocupado entonces por fuerzas norteamericanas. 2.- Falta de experiencia y conocimientos sobre el tema, por parte de los responsables del trabajo. 3.- Una fuerte epidemia de viruela que atac la poblacin el pas en ese ao del 1920. 4.- Recursos Econmicos y materiales insuficientes 5. - La no asistencia de Asesores tcnicos en la oficina central. A pesar de sus limitaciones, esta publicacin contiene importantsimas informaciones para el ao que se efectu y constituye nuestra primera publicacin Censal con cierta amplitud en las caractersticas demogrficas y socioeconmicas examinadas. Fue publicado en 1923. En 1975, la UASD efectu una segunda edicin. Desde 1911 hasta finalizar este perodo, con excepcin del Censo, no se producen acontecimientos de trascendencia en la historia Estadstica Dominicana. CUARTO PERIODO 1935-1960. Este es, definitivamente, el perodo en que las Estadsticas en la Repblica Dominicana adquieren una organizacin y desarrollo que hacen que las consideren como algo imprescindible en una moderna administracin de gobierno. Dos acontecimientos importantes suceden en el ao de 1935: la realizacin del Censo de ese ao, levantado el 13 de mayo de 1935, y la promulgacin de la ley del 1 de noviembre de 1935 mediante la cual se encomienda el servicio de Estadstica a una oficina central, bajo la dependencia directa del Poder Ejecutivo por conducto de la Secretaria de Estado de la Presidencia. De la ejecucin de este Censo se encarg el Partido Dominicano. Segn la organizacin de la Oficina en ese ao, esta contaba con siete secciones: Demogrfica, Censo, Sociogrfica, Produccin, Economa, Climatolgica, Gobierno y Administracin y por ltimo Publicaciones. Debemos resaltar que los datos correspondientes al Censo de 1935, fueron publicados parcialmente en sus ms destacadas caractersticas por la Direccin General de Estadstica, y sus resultados han sido comparados, hasta donde ha sido posible, con los del Censo del 1950. La Oficina Nacional de Estadstica (ONE) es el rgano rector de las estadsticas oficiales del pas. Fue creada el 1 de noviembre de 1935, mediante la 23
Manual de Estadstica I.
Ley No. 1023, bajo la dependencia del Poder Ejecutivo y de la Secretara de Estado de la Presidencia. Esta Ley entra en vigencia el 1 de enero de 1936. El 26 de mayo de 1948 se crea la Oficina Nacional de Censo y a partir de 1950, el pas inicia los Censos de Poblacin y Agropecuarios, que deben ser realizados con una periodicidad de cada diez aos. La ONE es una institucin de servicios que depende del Ministerio de Economa, Planificacin y Desarrollo (MEPYD). Est ubicada en los pisos 8 y 9 del Edificio de Oficinas Gubernamentales Juan Pablo Duarte, sito en la Avenida Mxico esquina Leopoldo Navarro, del Sector Gazcue. A la fecha ha tenido 29 directores, siendo el primero Don Vicente Tolentino Rojas, quien es considerado uno de los padres de la Estadstica en la Repblica Dominicana. Desde sus inicios, la ONE produce informacin sistemtica y es la responsable de realizar la recoleccin, revisin, elaboracin y publicacin de las estadsticas nacionales, relacionadas con las actividades econmicas, agrcolas, comerciales, industriales, financieras, sociales, condiciones de la poblacin y los censos nacionales, as como la coordinacin de los servicios estadsticos del pas. A partir del 1 de Enero de 1936, fecha en que entr en vigencia la ley de 1935, hasta el ao de 1948, la oficina de Estadstica tuvo como Director a Don Vicente Tolentino Rojas, quien llev acabo una brillante labor al frente de la misma y es con justicia considerado uno de los padres de la Estadstica en la Repblica Dominicana. En 1940 se autoriz efectuar el Censo Agropecuario Nacional mediante decreto 389 del Poder Ejecutivo. En Diciembre de 1928, se acogi el proyecto de levantar cada a diez aos un Censo agrcola mundial, y el primero fue lo realizado por algunos pases, sin participacin de la Repblica Dominicana en 1930. En este perodo se materializan un conjunto de actividades que vinculan las Estadsticas Dominicana a la organizacin Estadstica Internacional; entre las cuales se pueden citar: lacreacin del Instituto Interamericano de Estadstica (IASI). En 1943, mediante la ley 318 del 8 de julio, se estableci "el levantamiento cada 15 aos de un Censo Nacional que incluye los de poblacin, edificios y viviendas, agropecuarios, de industria y comercio y aquellos que el Poder Ejecutivo disponga en su oportunidad. En 1948, para atender los problemas propios de la planificacin y ejecucin de los Censos Nacionales se cre mediante decreto 5137 del 26 de mayo, la Oficina Nacional de Censo, dependiente de la Direccin General de Estadstica. A partir de 1950, el pas viene efectuando cada diez aos Censos de poblacin y agropecuarios, cumpliendo as disposiciones legales y acuerdos internacionales sobre el particular. La realizacin del Censo de 1950 se enmarc dentro del "programa del Censo de las Amricas", aprobado por una resolucin del primer congreso Demogrfico Interamericano reunido en Mxico en 1943. En esos momentos ya el pas contaba con los servicios de algn personal tcnico nativo que se haba especializado en el exterior; se dispona en cierta manera de una metodologa definida y se haba asimilado las experiencias adquiridas en los censos anteriores. Dicho censo culmin el domingo 6 de agosto de 1950. Es bueno resaltar en el aspecto acadmico, que en 1944 un pequeo grupo de dominicanos fue favorecido con Becas del Gobierno para estudiar Estadstica en distintas Instituciones Norteamericanas. Ms tarde se realiz el Curso de Formacin de Estadstica del Caribe (CUFEC) representado por la Universidad Autnoma de Santo Domingo y el Instituto Interamericano de Estadstica ( IAS). Este constituy el primer curso de Estadstica dictado en el Pas. La ley vigente en la actualidad en asuntos referentes a Estadsticas y Censos es la No. 5096 del 6 de Marzo de 1959. Esta ley establece en Art. 19. Los Censos Nacionales se 24
Manual de Estadstica I.
levantarn en las siguientes fechas: el de poblacin y agropecuario en 1960 y cada 10 aos a contar de 1965. El cuarto Censo Nacional de Poblacin levantado el Domingo 7 de agosto de 1960, se caracteriz en primer lugar, por la abundancia de todo gnero de Recursos, no solo cont con un servicio tcnico nacional de experimentado y con la asesora tcnica de Organismos Internacionales, si no que tuvo una formulacin regular del presupuesto y una ayuda monetaria extranjera; a ello se agrega un buen programa de preparacin y ejecucin basado en las realidades y modalidades ambientales, y un plan consecuente ajustado a las recomendaciones Internacionales que rigen esta materia. En el 1946 se cre, en lo que entonces se llamaba Facultad de Filosofa, la primera ctedra de Estadstica a nivel Universitario1 siendo el profesor de la misma, hasta el 1948, Don Vicente Tolentino Rojas. En el ao de 1970, se levanta el 5to. Censo de Poblacin y Habitacin realizado el 9 y 10 de Enero de dicho ao. Este Censo presenta algunas peculiaridades entre las que podemos citar: a).- Es la Primera vez que en el pas el empadronamiento se efecta en ms de un da. b).- Se utiliza por primera vez el mtodo de muestreo para investigar algunas caractersticas. "En efecto, al 100% de la poblacin se formularon 10 preguntas adicionales al 50% de la poblacin de las reas urbanas y del 25% de las viviendas de reas rurales". c).- Se investiga por primera vez la poblacin econmicamente activa desagregada en ocupada y desocupada. Los censos anteriores no haban arrojado ninguna luz acerca de los niveles de desocupacin de la fuerza de trabajo. La Oficina se encuentra inmersa en un proceso de fortalecimiento y modernizacin institucional, impulsado por las necesidades de promover un cambio organizacional, para asumir el rol que le confiere la Ley. QUINTO PERIODO 1971-1998. En el periodo referenciado, las estadsticas, como herramientas de primer orden, ocupan el espacio que le corresponde en el marco de la planificacin socioeco- nmica gubernamental. De igual manera, las encuestas se constituyen en otro instrumento de la planificacin. Es as como se realizan Encuestas Demogrficas en el ao 1971; Encuestas sobre el Empleo y Desempleo en 1975; Encuesta de Fuerza de Trabajo (empleo) en 1980, entre otras. Cabe destacar las publicaciones que se iniciaron en este periodo como: "Repblica Dominicana en Cifras", boletn que se ha venido publicando anualmente, en donde se contemplan estadsticas de los diferentes sectores. Adems, se inicia en el ao 1986 la compilacin y publicacin de los "Indicadores Bsicos Diarios", el cual contiene el precio de la canasta agropecuaria, flujo de pasajeros por aeropuertos, materiales de construccin, tasa oficial de cambio, situacin energtica, informe sobre nivel de lluvias. En el ao 1981, se levanta el VI Censo Nacional de Poblacin y Vivienda, los das 12 y 13 de diciembre. Se realiz por enumeracin completa bajo el criterio de Censo de Hecho (o de facto) y de Derecho (o de jure), es decir, que se empadronaron en cada hogar los residentes habituales y adems, los que durmieron la noche del 11 al 12 de diciembre de 1981. Cabe destacar el uso por primera vez, del ingreso de los datos al computador mediante lector ptico, capaz de grabar en cintas magnticas la informacin tomada directamente de la boleta, la utilizacin de este equipo signific un cambio metodolgico de gran importancia. En este censo adems, se utiliz el Paquete Concord, software especializado que asigna la informacin faltante o inconsistente mediante criterios que aseguraron la coherencia de la informacin ingresada al computador. Las principales caractersticas investigadas fueron: 25
Manual de Estadstica I.
ubicacin geogrfica, identificacin del hogar, identificacin de los productores agropecuarios, datos de la vivienda, composicin del hogar, caractersticas personales. Por otro lado, el VII Censo Nacional Agropecuario, fue levantado en el mes de febrero de 1982. Se recogieron las informaciones relacionadas a todas las explotaciones agropecuarias a travs de los productores agropecuarios, entrevistados personalmente en el lugar de su vivienda. El VII Censo Nacional de Poblacin y Vivienda, se realiz en el ao 1993 los das 24 y 25 de septiembre, este fue un censo "de hecho", en virtud de que se empadron a todas las personas presentes en el territorio nacional a la hora cero ( 0 ) del levantamiento. Dicho Censo, se suscribi a todas las recomendaciones tcnicas de los organismos internacionales especializados en la materia, de manera de garantizar as la calidad de los datos. En el Censo de 1993, el ingreso de los datos al computador, se realiz mediante la utilizacin de lectores pticos, conectados al equipo central, capaces de almacenar la informacin tomada directamente de la boleta. Cabe destacar que por primera vez, se utilizaron los paquetes Cents y Concord y posteriormente, se hicieron algunos ajustes para poner el programa IMPS. La puesta en circulacin de este censo marca un hito en el desarrollo de las estadsticas del pas, ya que al mismo no slo se puede acceder por medio del material impreso, sino tambin mediante las computadoras a travs del disco compacto y en el Internet. Otras informaciones estadsticas que se producen actualmente, estarn a disposicin a travs del Internet y del CDROM. En la etapa actual del perodo que nos ocupa, hay todo un relanzamiento en cuanto a la divulgacin de las estadsticas, publicndose de forma sistemtica los boletines de Comercio Exterior 1996, y el de Construcciones en el Sector Privado 1996, amn de los Indicadores Bsicos, los cuales se estn procesando diariamente, Historia de los Censos de Poblacin en la Repblica Dominicana y Censo Nacional de Servidores Pblicos. Entre otros, se da inicio a un importante programa piloto de Encuestas Sociodemogrficas en el Nordeste del pas, con el fin de recoger informaciones actualizadas y de calidad. De igual forma, se han realizado acuerdos de cooperacin interinstitucionales, tanto con entidades publicas como privadas y organismos internacionales que permiten acometer de forma conjunta la recopilacin de informaciones referentes a hechos vitales, como nacimientos, defunciones. Un paso relevante es lo relacionado con las estadsticas sobre importaciones y exportaciones de productos, que siempre tuvieron en retraso en su disponibilidad a los usuarios. Esto se ha superado mediante el establecimiento de un acuerdo interinstitucional con la Direccin General de Aduana, el cual nos permite estar conectados Va Mdem, logrando tener informacin oportuna y de calidad. En estos momentos, se dan los pasos para convertir a la ONE en un Instituto Nacional con la correspondiente descentralizacin e independencia administrativa y la creacin en el pas de un Sistema Nacional de Informacin.
26
Manual de Estadstica I.
27
Manual de Estadstica I.
PRCTICA NO. 1 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Conceptualice estadstica. 2. A quin se considera el padre de la estadstica y por qu? 3. Mencione los acontecimientos bblicos que denotan el uso de la estadstica en los siglos anteriores a la era cristiana. 4. Diga los aportes de los egipcios al desarrollo de la estadstica. 5. Cules aportes importantes hicieron los babilonios a la estadstica? 6. Resuma brevemente los aportes de los chinos a la estadstica y sus personajes. 7. Describa brevemente el desarrollo de la estadstica en la edad media. 8. Mencione (5) personajes importantes para la estadstica durante los siglos XIX y XX y sus aportes. 9. Defina probabilidad. 10. Describa brevemente los orgenes de la probabilidad desde el marco de la estadstica. 11. Enumere las fases de un estudio estadstico. 12. En estadstica, qu es una poblacin y cul es su diferencia con respecto de la muestra. 13. Resuma brevemente los cinco perodos en que se divide el desarrollo de la estadstica en la Repblica Dominicana. 14. Elabore con sus propias palabras la relacin que guarda la estadstica con otras ciencias. 15. Establezca la importancia de la estadstica.
28
Manual de Estadstica I.
29
Manual de Estadstica I.
30
Manual de Estadstica I.
Manual de Estadstica I.
originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clsters, entre otros. Este tipo de estadstica consiste en recolectar los datos, organizarlos, presentarlos, analizarlos e interpretar los resultados. Son aquellos mtodos que incluyen la recoleccin, presentacin y caracterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto de datos. Y tambin es definida como cualquier tratamiento de datos que este diseado para resumir o describir algunas de sus caractersticas ms importantes sin intentar deducir nada que escape al alcance de los datos. El objetivo de la estadstica descriptiva es hacer que los datos se comprendan ms fcilmente, que sea ms sencillo referirse a ellos y analzalos. En resumen, la estadstica descriptiva se encarga de: - Tomar mediciones exactas. - Organizar la informacin obtenida con las mediciones. - Conocer el proceso en estudio a raz de las mediciones realizadas. - Y tomar decisiones determinsticas para mejorar el proceso.
Manual de Estadstica I.
para averiguar la media, , de las estaturas de todos los soldados de un reemplazo, se extrae una muestra y se obtiene su media, 0. La media de la muestra (media muestral), 0, es un estimador de la media poblacional, . Si el proceso de muestreo est bien realizado (es decir, la muestra tiene el tamao adecuado y ha sido seleccionada aleatoriamente), entonces el valor de , desconocido, puede ser inferido a partir de cero. La inferencia siempre se realiza en trminos aproximados y declarando un cierto nivel de confianza. Por ejemplo, si en una muestra de n = 500 soldados se obtiene una estatura media 0 = 172 cm, se puede llegar a una conclusin del siguiente tipo: la estatura media, , de todos los soldados del reemplazo est comprendida entre 171 cm y 173 cm, y esta afirmacin se realiza con un nivel de confianza de un 90%. (Esto quiere decir que se acertar en el 90% de los estudios realizados en las mismas condiciones que ste y en el 10% restante se cometer error.) Si se quiere mejorar el nivel de confianza, se deber aumentar el tamao de la muestra, o bien disminuir la precisin de la estimacin dando un tramo ms amplio que el formado por el de extremos 171, 173. Recprocamente, si se quiere aumentar la precisin en la estimacin disminuyendo el tamao del intervalo, entonces hay que aumentar el tamao de la muestra o bien consentir un nivel de confianza menor. Finalmente, si se quiere mejorar la precisin hay que tomar una muestra suficientemente grande. Contiene mtodos que nos permiten hacer posible la estimacin de una caracterstica de la poblacin, sobre la base del estudio de una muestra. Bernoulli, De Moivre y Karl Gauss fueron los precursores del objeto de la estadstica inferencial. Tiene por objetivo describir las caractersticas de un conjunto, pero sin la necesidad de realizar el registro de datos a todos los elementos o unidades del conjunto o poblacin, sino a una parte de esta. La inferencia constituye la base terica del muestreo, permite conocer el todo con cierta aproximacin, a partir del estudio de una parte. La estadstica inferencial no nos da una certeza completa en sus resultados, sino que estn sujetas a una probabilidad de error. Una incorrecta seleccin de las unidades mustrales puede acarrear la imposibilidad de inferir correctamente las caractersticas de la poblacin. En resumen, la estadstica inferencial se encarga de: - Tomar muestras representativas de la poblacin en estudio. - Obtener mediciones muestrales representativas. - Generalizar estos resultados muestrales para toda la poblacin. - Tomar decisiones probabilsticas para mejorar el proceso en estudio. Diagrama del Proceso de Generalizacin de los resultados muestrales.
33
Manual de Estadstica I.
Manual de Estadstica I.
Cuestionario Restringido o Cerrado: Es aquel que solicita respuestas breves, especficas y delimitadas. Presenta las ventajas de que requiere de un menor esfuerzo por parte de los encuestados, limitan las respuestas de la muestra, es fcil de llenar, mantiene al sujeto en el tema, es relativamente objetivo y es fcil de clasificar y analizar. Estas preguntas piden ser contestadas con: Dos alternativas de respuestas (respuestas dicotmicas): Si o No. Varias alternativas de respuestas: donde se seala uno o ms tems (opcin o categora) en una lista de respuestas sugeridas. Como no es posible prever todas las posibles respuestas, conviene agregar la categora Otros o Ninguna de las Anteriores, segn sea el caso. En otras ocasiones, el encuestado tiene que jerarquizar opciones o asignar un puntaje a una o diversas cuestiones. Cuestionario No Restringido o Abierto: Las preguntas abiertas no delimitan de antemano las alternativas de respuesta. Las preguntas abiertas son particularmente tiles cuando no tenemos informacin sobre las posibles respuestas de las personas o cuando esta informacin es insuficiente. Este tipo de cuestionario es aquel que solicita una respuesta libre la cul es redactada por el propio sujeto. Tiene la ventaja de que proporciona respuestas de mayor profundidad y la desventaja de que es de difcil tabulacin, resumen e interpretacin. Cuestionario Mixto: Es aqul que considera en su construccin tanto preguntas cerradas como abiertas.
La entrevista. Es un acto de comunicacin oral o escrito que se establece entre dos o ms personas (el entrevistador y el entrevistado o los entrevistados) con el fin de obtener una informacin o una opinin, o bien para conocer la personalidad de alguien. En este tipo de comunicacin oral debemos tener en cuenta que, aunque el entrevistado responde al entrevistador, el destinatario es el pblico que est pendiente de la entrevista. Se utilizan para recabar informacin en forma verbal, a travs de preguntas que propone el analista. Consta de tres fases o pasos que son: el inicio, durante el cul se establece el rapport o romper el hielo para crear un ambiente agradable durante el proceso. La fase de desarrollo que es la entrevista en s. Y el cierre, el cual se anuncia de 5 a 10 minutos antes de terminar la entrevista. Aqu se le da oportunidad al entrevistado de agregar o aclarar informaciones y el entrevistador resume y concretiza antes de la despedida. Los tipos principales de entrevista son: - Entrevista estandarizada o estructurada: es una especie de cuestionario oral. El entrevistador lee las preguntas y anota las respuestas que obtiene. Se suele utilizar en los procesos de seleccin de bsqueda pasiva, cuando hay muchos candidatos. - Entrevista libre o no estructurada: es como una charla de carcter informal, que permite la obtencin de datos subjetivos acerca del candidato. - Entrevista mixta: no se sirve de un cuestionario fijo, ni plantea unas preguntas prefijadas, sino que sigue una especie de gua de entrevista en las que se detallan, no las preguntas sino las reas que han de ser exploradas. En el diagrama siguiente se presentan las ventajas y desventajas al utilizar uno u otro tipo de entrevista: 35
Manual de Estadstica I.
Entrevista estructurada -Asegura la elaboracin uniforme de las preguntas para todos los que van a responder. -Fcil de administrar y evaluar. -Evaluacin ms objetiva tanto de quienes responden como de las respuestas a las preguntas. -Se necesita un limitado entrenamiento del entrevistador. -Resulta en entrevistas ms pequeas. -Alto costo de preparacin. -Los que responden pueden no aceptar un alto nivel en la estructura y carcter mecnico de las preguntas. -Un alto nivel en la estructura puede no ser adecuado para todas las situaciones. -El alto nivel en las estructuras reduce responder en forma espontnea, as como la habilidad del entrevistador para continuar con comentarios hacia el entrevistado.
VENTAJAS
DESVENTAJAS
Preparacin de la Entrevista - Determinar la posicin que ocupa de la organizacin el futuro entrevistado, sus responsabilidades bsicas, actividades, etc. (Investigacin). - Preparar las preguntas que van a plantearse, y los documentos necesarios (Organizacin). - Fijar un lmite de tiempo y preparar la agenda para la entrevista. (Sicologa). - Elegir un lugar donde se puede conducir la entrevista con la mayor comodidad (Sicologa). - Hacer la cita con la debida anticipacin (Planeacin). Conduccin de la Entrevista - Explicar con toda amplitud el propsito y alcance del estudio (Honestidad). - Explicar la funcin propietaria como analista y la funcin que se espera conferir al entrevistado. (Imparcialidad). - Hacer preguntas especficas para obtener respuestas cuantitativas (Hechos). - Evitar las preguntas que exijan opiniones interesadas, subjetividad y actitudes similares (habilidad). - Evitar el cuchicheo y las frases carentes de sentido (Claridad). - Ser corts y comedio, abstenindose de emitir juicios de valores. (Objetividad). - Conservar el control de la entrevista, evitando las divagaciones y los comentarios al margen de la cuestin. - Escuchar atentamente lo que se dice, guardndose de anticiparse a las respuestas (Comunicacin). La encuesta. Es un estudio observacional en el cual el investigador busca recaudar datos de informacin por medio de un cuestionario prediseado, y no modifica el entorno ni controla el proceso que est en observacin (como s lo hace en un experimento). Los datos se obtienen a partir de realizar un conjunto de preguntas normalizadas dirigidas a una muestra representativa o al conjunto total de la poblacin estadstica en estudio, formada a menudo por personas, empresas o entes institucionales, con el fin de conocer estados de opinin, caractersticas o hechos especficos. El investigador debe seleccionar las preguntas ms convenientes, de acuerdo con 36
Manual de Estadstica I.
la naturaleza de la investigacin. Se utiliza para medir las relaciones entre variables demogrficas, econmicas y sociales. Tambin para evaluar las estadsticas demogrficas como errores, omisiones e inexactitudes y conocer profundamente patrones de las variables demogrficas y sus factores asociados como fecundidad y migraciones determinantes. Adems, evaluar peridicamente los resultados de un programa en ejecucin y saber la opinin del pblico acerca de un determinado tema. Etapas de una encuesta por muestreo - La planeacin: constituye el establecimiento de los objetos de la investigacin y la creacin de la estrategia general para obtener y analizar los datos, incluye adems, la elaboracin de presupuestos, revisin de literatura, definicin de objetivos especficos, etc. - La elaboracin de un diseo de investigacin: El diseo de la muestra esta relacionado estrechamente con la planeacin y por lo regular ocurre en forma simultanea, consiste en una programacin preparada de antemano con el objetivo de recolectar y analizar la informacin necesaria para satisfacer los objetivos del estudio, al costo mas bajo posible. - Diseo de la muestra (muestreo): Es el proceso de seleccionar ciertos elementos de la poblacin; En esta etapa, el investigador debe definir con claridad y cuidado la poblacin que se va a estudiar y la generalizacin de los datos de la muestra que dicha poblacin permitir. -Consiste en un conjunto de procedimientos para seleccionar los elementos de la poblacin y para convertir las informaciones de la muestra en clculos relativos al total de la poblacin. La muestra debe ser representativa de la poblacin de la cual se extrae. Los procedimientos aleatorios para elegir las unidades son la forma ms confiable de seleccin. -Diseo del cuestionario: Es el proceso de adaptar los diferentes objetivos del estudio a preguntas que permitan obtener la informacin necesaria. Esta etapa incluye la formulacin del tipo de pregunta, numero de estas, secuencia y los medios para mantener motivada a la persona encuestada. Sus principales objetivos son: 1-Obtener informacin aplicable a los propsitos de la encuesta o investigacin. 2-Recopilar las informaciones con el mximo de responsabilidad, validez y con precisin. -El trabajo de campo: En esta etapa de la investigacin se incluye el reclutamiento de entrevistadores, supervisores y otro personal de campo. Adems, incluye la capacitacin del personal de campo, preparacin de instrucciones escritas para los entrevistadores sobre el uso del cuestionario, la recopilacin de los datos en el campo y el control de calidad de las entrevistas, etc. -La verificacin y la codificacin: La verificacin y la codificacin son procesos afines diseados con el propsito de transcribir la informacin registrada en los cuestionarios a una forma adecuada para el anlisis estadstico. El objetivo bsico de la verificacin el eliminar las respuestas incompletas o inconsistentes, como tambin los errores en el uso del cuestionario. La codificacin es un proceso tcnico que consiste en convertir datos cualitativos en datos numricos que puedan ser almacenados, cantados o tabulados con rapidez y facilidad. - La preparacin para el anlisis: Esta etapa incluye un conjunto de actividades, como: digitacin de los datos, chequeos rutinarios para determinar la compatibilidad de las respuestas, plan de tabulacin de los datos. La digitacin es el procedimiento utilizado para el almacenamiento de la informacin y constituye el primer paso despus de la codificacin para registrar los datos, de manera tal que puedan ser fcilmente recuperados y tabulados. - Anlisis y preparacin del informe: Consiste en la presentacin e interpretacin de tablas simples y de mltiples entradas de los datos recopilados en la investigacin. El objetivo de esta etapa es proporcionar un resumen de los datos, capaz de satisfacer los propsitos de la investigacin, lo ms breve y comprensible posible. 37
Manual de Estadstica I.
Puede incluir tablas de porcentajes, medidas de tendencia central, medidas de asociacin, pruebas de hiptesis, estimaciones, etc. Es importante tener presente tres aspectos bsicos en su planeacin. Estos son: el estilo en que se va a escribir, la mecnica de presentacin del material y la organizacin de los temas del informe. El Censo Es una investigacin que cubre a todos los miembros o elementos de una poblacin dada; un censo completo es a menudo innecesario, antieconmico y una molestia para el publico y tambin que es menos efectivo que una encuesta, para recoger ciertos tipos de informacin. Peridicamente se levantan diferentes tipos de censos en todo el mundo, entre los ms conocidos estn; el censo de poblacin y vivienda, censos agropecuarios, censos a las empresas mercantiles y manufactureras, etc. Proporcionan datos muy importantes sobre poblacin. Vivienda, empleos poblacin econmicamente activa, uso de la tierra, tamao de las fincas, ganadera, etc. En el pas se han organizado en total siete censos de poblacin, siendo el ltimo de estos el efectuado en 1993, del cual se derivo que la poblacin de la Repblica Dominicana era, hasta el momento, de 7,293.390 habitantes.
2.3 Muestreo
Una muestra, ya la hemos definido como una parte de un conjunto mayor llamado poblacin se selecciona cuidadosamente para representarla. Y muestreo es el proceso de seleccionar esa parte del todo. Es una herramienta de la investigacin cientfica cuya funcin bsica es determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error que se comete debido a hecho de que se obtienen conclusiones sobre cierta realidad a partir de la observacin de slo una parte de ella, se denomina error de muestreo. Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos. Asimismo, el muestreo Estadstico: son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Este puede ser de dos tipos: 1. Muestreo probabilstico: Es aqul en el que todos los elementos de la poblacin tienen la misma probabilidad de ser seleccionados como parte de la muestra. Forman parte de este tipo de muestreo todos aquellos mtodos para los que puede calcularse la probabilidad de extraccin de cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es posible optar por l. Se subdivide a su vez en: - Aleatorio: Se colocan en una tmbola el total de sujetos de la poblacin y se sacan al azar la cantidad de muestra determinada para trabajar. - Estratificado: Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen homogneos respecto a caracterstica a estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo que compondrn la muestra. Se puede estratificar por edad, por carrera u oficio, por nivel social, etc. - Sistemtico: Es la eleccin de una muestra a partir de los elementos de una lista segn un orden determinado, o recorriendo la lista a partir de un nmero aleatorio determinado. Por ejemplo: para una poblacin de 50 sujetos del cual debe extraerse una muestra de 5. lo primero es asignar una constante (K) la cul se determina dividiendo la poblacin entre la muestra: 50 = 10 . Luego seleccionar al primer sujeto aleatoriamente, ya sea designando a 38
Manual de Estadstica I.
5 alguien que diga un nmero del 1 al 50 o cerrando los ojos y sealando un nmero de la lista, etc. El nmero obtenido as ser el primer elemento de la muestra. Los dems se elegirn sumando a este la constante hallada. Si el primer sujeto fue el No. 3, el segundo ser 3+K = 3+10 = 13; el tercero ser 13+K = 13+10 = 23 y as sucesivamente. - Por conglomerados: Cuando la poblacin se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la realizacin del estudio. Estos conglomerados pueden ser empresas, ciudades, zonas geogrficas, barrios, etc. - Polietpico: Es muy utilizado en las encuestas polticas. Su nombre se debe a que se realiza por etapas. Se utiliza cuando la poblacin es muy heterognea. Para seleccionar una muestra de una poblacin se va dividiendo dicha poblacin de forma sucesiva conforme algn criterio determinado con anterioridad. De las partes que resultaron de la primera divisin se eligen algunas por muestreo aleatorio simple. A su vez estas partes se subdividen en otras y de ellas se vuelve a seleccionar algunas, tambin por muestreo aleatorio simple. Un ejemplo clsico de un muestreo polietpico resulta cuando se quiere seleccionar una muestra de una ciudad grande; la ciudad se divide en barrios y de ellos se eligen algunos por muestreo aleatorio simple; los barrios se dividen en calles, y dentro de ellas se seleccionan algunas tambin por muestreo aleatorio simple, y as sucesivamente. 2. Muestreo no probabilstico: Es aquel en que no todos los elementos de la poblacin tienen la misma probabilidad de ser seleccionados. Incluye todos los mtodos en que los elementos de la muestra no se seleccionan mediante procedimientos al azar o aleatorios, o con probabilidades de seleccin conocidas. Algunos procedimientos de seleccin del muestreo no probabilstico son: - De juicio o criterio: Es un proceso a travs del cual los elementos se escogen basndose en opiniones informadas que garantizan la representatividad de la poblacin que se estudia. - Por cuotas: Es un proceso de seleccin en el cual los elementos son elegidos en el campo mismo, por los entrevistadores, utilizando categoras prefijadas de elementos de la muestra, para obtener un nmero predeterminado de casos en cada categora. - Decisional: En este los elementos de la muestra son seleccionados de una poblacin por los entrevistadores que usan su propio criterio para decidir cuales son los informantes representativos. - De agrupacin causal: Son muestras formadas por ejemplos que se han reunido ocasionalmente o de acceso fcil, tales como los estudiantes inscritos en una clase que van pasando por una esquina. Dichas muestras no permiten generalizaciones que vayan mas all de las agrupaciones mismas y por lo general no tienen inters cientfico. - Por conveniencia: Del total de la poblacin, se elige un grupo que cumpla con las caractersticas establecidas pero que sea conveniente o de fcil acceso para el entrevistador. - Bola de nieve: Es aquel en que el entrevistador selecciona al primer sujeto a su juicio y al terminar la entrevista le pregunta a este a quines conoce que pueden dar informacin sobre la investigacin y este le recomendar a algunos sujetos, los cules a su vez recomendarn a otros haciendo el grupo ms grande paulatinamente hasta completar la muestra requerida.
39
Manual de Estadstica I.
Ej.
Jua n
Pabl o Lu z
Pedr o Fran k
Jos
Mar a
Clara
Ana
No probabilstico
De juicio o criterio
Por cuotas
Decisional De agrupacin causal
Polietpico
Bola de nieve
Antes de ejemplificar la seleccin de muestras, debemos hacer un alto y explicar que en estadstica existen reglas para los redondeos ya que estos son muy utilizados, y sern efectivos si se hacen adecuadamente. En ese sentido, los redondeos pueden hacerse por exceso o por defecto. Redondeo por exceso: Se har cuando los dgitos despus de punto (.) estn por encima de 5. Ej. 360.52 habitantes se redondea a 361 habitantes. 45.75 estudiantes se redondea a 46 estudiantes 14.8 kilos se redondea a 15 kilos. Redondeo por defecto: Se har cuando los dgitos despus de punto estn por debajo de 5. Ej. 3.2 personas se redondea a 3 personas 1,345.22 pesos se redondea 1,345.00 pesos 128.12 libras se redondea a 128 libras. Sin embargo, estos redondeos atendern al criterio y juicio clnico del investigador. Frmulas para determinar muestras. - Para una poblacin conocida. Partiendo del criterio estadstico que considera: Poblacin < 100,000 = poblacin finita Poblacin > 100,000 = poblacin infinita n =. Z2 Npq e2(N-1)+Z2pq . 40
Manual de Estadstica I.
Donde, dada una poblacin de 15,000 habitantes. trabajar la investigacin. n = muestra (a determinar) Z = a determinar e = nivel de error Nc = nivel de confianza
N = poblacin = 15,000 habitantes p = probabilidad de que ocurra el fenmeno q = probabilidad de que no ocurra el fenmeno p+q = 1
Suponiendo que el nivel de error estimado es de un 5% (0.05) con un nivel de confianza de 95% (determinado de e-1 = Nc). Y que asignamos p = 60% (0.6) y siendo p+q=1, entonces q=40% (0.4). Para determinar Z se divide Nc /2 = 0.95/2 = 0.475. Se busca 0.475 en la tabla de ms abajo que contienen los valores de Z y vemos que 0.475 est en la fila 1.9 columna 0.06; entonces el valor de Z= 1.9+0.06 = 1.96. Ahora despejamos la frmula para saber con cul muestra trabajamos: n =. Z2 Npq . =. (1.96)2 (15,000) (0.6)(0.4) . 2 2 e (N-1)+Z pq (0.05)2(15,000-1)+(1.96)2(0.6)(0.4)
=.
Determinamos que la muestra necesaria para hacer una investigacin para una poblacin de 15,000 es de 360 habitantes. Esta cantidad es representativa del total. - Para una poblacin desconocida. Muy utilizada en investigaciones con grupos sociales. n = . Z2 pq . e2 n = muestra (a determinar) Z = a determinar e = nivel de error Nc = nivel de confianza p = probabilidad de que ocurra el fenmeno q = probabilidad de que no ocurra el fenmeno p+q = 1
Suponiendo que el nivel de error estimado es de un 4% (0.04) con un nivel de confianza de 96% (determinado de e-1 = Nc). Y que asignamos p = 45% (0.45) y siendo p+q=1, entonces q=55% (0.55). Para determinar Z se divide Nc /2 = 0.96/2 = 0.480. Se busca 0.480 en la tabla de ms abajo que contienen los valores de Z y vemos que 0.475 est en la fila 2.0 columna 0.06; entonces el valor de Z= 2.0+0.06 = 2.06. Ahora despejamos la frmula para saber con cul muestra trabajamos: n = . Z2 pq . = . (2.06)2 (0.45)(0.55) . = . 1,050, 291 . = 3656 habitantes e2 (0.04)2 0.0016 Determinamos que la muestra necesaria para hacer una investigacin para una poblacin desconocida es de 360 habitantes. Esta cantidad es representativa del total aunque la poblacin sea de 80,000 habitantes u 80,000 millones.
41
Manual de Estadstica I.
0.00
0.01
Tabla para determinar valores de Z 0.02 0.03 0.04 0.05 0.06 0.07
0.08
0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Manual de Estadstica I.
TRABAJO PARA LA CASA. 1. REPORTE DE LECTURA NO. 2. Elaborar un resumen del captulo II. Debe hacerse a mano, utilizando bolgrafo negro para el texto, bolgrafo azul para los ttulos y sub-ttulos si los hay y bolgrafo rojo para subrayar o resaltar. Este resumen debe tener un mnimo de 5 pginas y un mximo de 10 pginas. Y debe incluir una presentacin, hecha tambin a mano. 2. DEFINICIN DE TRMINOS. Definir los siguientes trminos en el cuaderno destinado para tales fines. Utilizar, al igual que en el reporte de lectura, bolgrafo negro para las definiciones, el azul para cada trmino a definir y el rojo para subrayar. Se recomienda incluir palabras o conceptos que a su entender deberan estar y no se colocaron. 1. Bsico 2. Censo 3. Codificar 4. Cuestionario 5. Decisin 6. Deduccin 7. Descripcin 8. Determinismo 9. Dicotoma 10. Encuesta 11. Entrevista 12. Estructurado 13. Exactitud 14. Generalizar 15. Inferencia 16. Instrumento 17. Muestreo 18. Pregunta 19. Responsabilidad 20. Resumen 21. Validez 22. Verificar
Manual de Estadstica I.
I. DESARROLLE. 1. Defina estadstica descriptiva. 2. Defina estadstica inferencial 3. Establezca la diferencia entre la estadstica descriptiva y la inferencial. 4. Defina instrumento y qu es un instrumento de recoleccin de datos en estadstica. 5. Qu es una encuesta? 6. Qu es un censo? 7. Qu es una entrevista? 8. Conceptualice muestreo? 9. Elabore una diferenciacin entre los diferentes instrumentos de recoleccin de datos que vimos en este captulo y trate de dar un ejemplo de en cules tipos de investigacin debe utilizarse uno u otro. 10. Diferencie muestreo probabilstico de muestreo no probabilstico. 11. Qu es el muestreo por cuotas? 12. Qu es el muestro aleatorio simple? 13. Explique brevemente el muestreo aleatorio sistemtico. 14. Explique brevemente el muestreo Bola de Nieve.
44
Manual de Estadstica I.
45
Manual de Estadstica I.
46
Manual de Estadstica I.
Manual de Estadstica I.
posiciones de una competencia de atletismo se jerarquizan en primer lugar, segundo lugar, tercer lugar, etc. Tanto los datos nominales como los jerarquizados, que por su naturaleza no son numricas, se convierten en datos discretos. Distribucin de frecuencias: Cuando se dispone se una gran masa o cantidad de datos a veces resulta muy difcil responder a ciertos cuestionarios que sobre una determinada variable se nos hagan. Existe una forma en estadstica de organizar las informaciones que nos permite responder a este y otros cuestionamientos. A esta forma de organizar las informaciones se le llama distribucin de frecuencias y consiste en el ordenamiento de los datos a travs de clases y frecuencias. Cuando los datos se presentan en una distribucin de frecuencias se les denomina datos agrupados. Cuando todos los datos observados de una variable se enumeran en forma desorganizada le vamos a denominar datos no agrupados. Frecuencia simple de clase: Al construir una distribucin de frecuencias, se tienen diferentes intervalos de valores que denominaremos clases. Se define frecuencia simple de clase al numero de veces que se repite cada clase. Se le identifica como fi, donde (f) se lee como frecuencia, e (i) define el orden de las clases. Frecuencia relativa simple: A la suma total de la frecuencia simple de clase le llamamos n; cuando cada valor de la frecuencia simple de clase se divide entre el total de casos u observaciones a este cociente le denominamos frecuencia relativa simple. La suma de la frecuencia relativa simple siempre ser igual a la unidad. Vamos a identificar la frecuencia relativa simple como fr. Frecuencia acumulada: La suma de la frecuencia simple de clase es denominada como frecuencia acumulada. Al calcular la frecuencia acumulada en una distribucin de frecuencia acumulada de la primera clase ser igual a la frecuencia simple de la misma clase. La segunda acumulada es igual a la primera acumulada mas la frecuencia simple de la segunda clase. El valor de la ultima frecuencia acumulada es igual al total de datos. La frecuencia acumulada se identifica como Fi. Frecuencia relativa acumulada: Es el cociente que se obtiene al dividir cada frecuencia acumulada entre el total de observaciones. O la suma sucesiva de la frecuencia relativa simple. Recorrido o rango: En una distribucin u ordenamiento de datos existe una diversidad de valores que varan de menor a mayor y viceversa. Se denomina recorrido o rango a la diferencia existente entre el valor mximo observado y el mnimo en una distribucin u ordenamiento. Intervalo de clase: Una clase esta definida por un limite inferior y un limite superior. A la diferencia entre l limite superior y l limite inferior de una clase se la llama intervalo de clase; Este indica el recorrido o rango de los valores incluidos en una clase. Punto medio de clase o marca de clase: Para fines de anlisis de datos, los valores de las clases se representan a travs del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los limites de clase. El punto medio de clase se identifica como Xi, donde Xi = (limite superior + limite inferior). 48
Manual de Estadstica I.
Pasos para construir una distribucin de frecuencias: conocidos ya todos los elementos tericos necesarios para la construccin y comprensin de una distribucin de frecuencias vamos a proceder a mostrar los pasos requeridos para su ejecucin. 1 Determinar el recorrido o rango. R = X mx. - X mn. 2 Calcular el intervalo de clase, siempre que se conozca l numero de clases. i = se asignar arbitrario de acuerdo a la distribucin de los datos. 3 Calcular l numero de clases, siempre que se conozca el intervalo de clase. NC = R i En lo referente al punto medio de cada clase, este es usado para representar mediante un solo valor el recorrido de cada clase y sirve adems para los fines de anlisis estadsticos de los datos. Es importante sealar con relacin a la construccin de una distribucin de frecuencias que el lector o usuario tenia plena libertad en la pre-escogencia del intervalo de clase, en funcin de la naturaleza de los datos y su conveniencia tcnica. Se determina: Ls + Li 2 Presentacin de datos La presentacin de datos estadsticos constituye en sus diferentes modalidades uno de los aspectos de mas uso en la estadstica descriptiva. A partir podemos visualizar a travs de los diferentes medios escritos y televisivos de comunicacin masiva la presentacin de los datos estadsticos sobre el comportamiento de las principales variables econmicas y sociales, nacionales e internacionales. Existen tres formas diferentes de presentar los datos estadsticos, que son: 1-Presentacin escrita: Esta forma de presentacin de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta mas apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales. 2-Presentacin tabular: Cuando los datos estadsticos se presentan a travs de un conjunto de filas y de columnas que responden a un ordenamiento lgico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma ms exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes: Titulo: Es la parte ms importante del cuadro y sirve para describir todo l contenido de este. Encabezados: Son los diferentes subttulos que se colocan en la parte superior de cada columna. Columna matriz: Es la columna principal del cuadro. Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en la tabla. Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos. Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes. Una variable es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. 49
Manual de Estadstica I.
50
Manual de Estadstica I.
Otras Variable interviniente Son aquellas caractersticas o propiedades que de una manera u otra afectan el resultado que se espera y estn vinculadas con las variables independientes y dependientes. Variable moderadora Segn Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relacin entre la variable independiente primaria y las variables dependientes. Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir.
51
Manual de Estadstica I.
CLASIFICACIN DE LAS ESCALAS Las Escalas al igual que las variables se clasifican en cualitativas y cuantitativas, al mismo tiempo se sub dividen en: Cualitativas: - Escala nominal o clasificatoria. Este tipo de variables no presentan un ordenamiento previo, ms al contrario es arbitraria, de ah que se haya ideado tres parmetros para entender mejor este tipo de escala; variable, escala y diferencia, por ejemplo: Variable: Profesin Escala: Ingeniero, mdico, abogado, odontlogo Diferencia: No existe diferencia entre los profesionales. Otros ejemplos son el estado civil, el sexo, etc. - Escala ordinal. Las variables susceptibles de ser medidas siguiendo un ordenamiento (orden), formada por una clase mutuamente excluyentes, que se agrupan de acuerdo a un orden pre-asignado. Por ejemplo: Variable: Grado de instruccin. Escala: Primaria, secundaria, superior, post-grado. Diferencia: Existe diferencia entre diferentes niveles de la escala entre los estudiantes de grado primario con los de nivel superior existe no solo aos de experiencia, sino conocimiento. Otros ejemplos: Grado militar, jerarqua familiar, etc. Cuantitativas: - Escala discreta o discontinua. Se dice que si la variable medida es susceptible a ser contada, se puede construir una escala discreta, formada por nmeros enteros con incrementos fijos, donde las fracciones no son consideradas, para esto, se debe considerar la magnitud de los nmeros expuestos. Por ejemplo: Variable: Nmero de hijos Escala: 1 hijo, 2 hijos, 3 hijos, etc. Otros ejemplos: nmero de visitas, nmero de caries dental, etc. - Escala concreta o continua. Cuando uno cuenta con variables de tipo cuantitativo continuo o concreto se pude utilizar este tipo de escala, cuyo requisito es el de poder presentar nmeros relativos racionales (fraccionados, porcentuales y/o decimales) siendo esta medicin aproximada. Por ejemplo: Variable: Estatura Escala: 1,65 m., 1,66 m., 1,67 m., etc. Otros ejemplos: peso en gramos, estatura en pies y pulgadas, tiempo, edad, etc. Escala dicotmica. Es aquella escala que presenta tan solo dos opciones para medir la variable, siendo esta variable de tipo cualitativo o cuantitativo dependiendo de la informacin o resultado que se busque, por ejemplo: Variable preferencia por un equipo de football Escala de medicin: San Carlos o Arroyo Hondo Respuesta: San Carlos o Arroyo Hondo Otro ejemplo: el sexo, etc.
52
Manual de Estadstica I.
Otras escalas: Escala cronolgica. Es un tipo de escala cuantitativa continua, se la utiliza para estudiar algunos fenmenos en funcin al tiempo, algunos autores la tratan como si fuera una escala de variable independiente, permite conocer un determinado fenmeno a travs del tiempo, es decir permite un seguimiento temporalizado (en el pasado, en el presente en el futuro). Ej. Variable. Cambios fsicos de una nia. Escala de medicin: al 1 ao, 5 aos, 25 aos, etc. Otro ejemplo: El seguimiento de un determinada enfermedad por ejemplo el Sida, donde se podra realizar un seguimiento por memorizado de las patologas que se producen a raz de este fenmeno. Escala de intervalo. Las categoras se ordenan en unidades igualmente espaciadas, siendo posible medir las diferencias relativas en cada punto de la escala, no existe el cero absoluto, tenemos como ejemplo: Variable: Medicin de la temperatura corporal, Escala: Grados centgrado o Celcius (37) Diferencia: La hace los nmero mayores menores de 37 Escala de razn. En esta escala si existe el cero absoluto y la magnitud de diferencia entre los valores numricos entre si por ejemplo: Variable: Relacin entre las edades Escala: Juan recin nacido (0 aos), Jos 9 aos (9 aos ms), Joaqun 18 aos (9 aos ms que Jos y 18 aos ms que Juan), etc.
53
Manual de Estadstica I.
54
Manual de Estadstica I.
PRCTICA NO. 3 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Qu es una variable? 2. Enumere los tipos de variables. 3. Defina variables cualitativas. 4. Defina variables cuantitativas. 5. Qu son escalas de medicin? 6. Defina escala de medicin ordinal. 7. Escala nominal. 8. Escala de razn. 9. Escala cronolgica. 10. Escala de intervalo. 11. Diferencia entre escala nominal y ordinal. 12. Diferencia entre escala de razn y de intervalo.
55
Manual de Estadstica I.
56
Manual de Estadstica I.
57
Manual de Estadstica I.
58
Manual de Estadstica I.
59
Manual de Estadstica I.
60
Manual de Estadstica I.
La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad, continuas y discretas. La campana de Gauss es empleada en estadstica y probabilidad, y debe su nombre a su descubridor, el matemtico, astrnomo y fsico alemn Carl Friedrich Gauss. Es una representacin grfica de la distribucin normal de un grupo de datos. stos se reparten en valores bajos, medios y altos, creando un grfico de forma acampanada y simtrica con respecto a un determinado parmetro. El punto mximo de la curva corresponde a la media, y tiene dos puntos de inflexin a ambos lados. Este grfico se usa en variables asociadas a fenmenos naturales: caracteres morfolgicos de individuos como la estatura o el peso, caracteres fisiolgicos como el efecto de un frmaco, caracteres sociolgicos como el consumo de un determinado producto por un mismo grupo de individuos, caracteres psicolgicos como el cociente intelectual. Para elaborar la distribucin normal, se procede a levantar la informacin. Una vez se ha terminado la recoleccin de datos se procede a ordenarlos. Este orden puede hacerse de forma ascendente o descendente. El orden ascendente, es el ms utilizado y se realiza tomando el valor ms pequeo hasta llegar al mayor. Y el orden descendente se realiza tomando primero el valor mayor y terminando con el menor. Ejemplos: Dados los siguientes datos correspondientes a las frecuencias simples del total de paales utilizados por un infante en un da. Proceda a ordenarlos para preparar la distribucin de frecuencias: 9 12 8 10 6 6 5 4 12 10 8 7 7 6 9 6 10 7 8 4 5 6 6 8 7 Para una muestra igual a 30 nios N = 30
61
Manual de Estadstica I.
El orden facilita el clculo del rango, el intervalo y los nmeros de clase para la elaboracin de la tabla de distribucin de frecuencia.
Manual de Estadstica I.
63
Manual de Estadstica I.
PRCTICA NO. 4 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Describa que es la distribucin normal. 2. Defina las diferentes frecuencias de la distribucin normal. 3. Quien fue Poisson? 4. Quien fue Gauss? 5. Que es la campana de Gauss? 6. Describa las formas de ordenamiento de datos.
64
Manual de Estadstica I.
65
Manual de Estadstica I.
66
Manual de Estadstica I.
Manual de Estadstica I.
medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se esta observando, en este caso se observan variables cuantitativas Entre las medidas de tendencia central tenemos: Media o media aritmtica: La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos. La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos. Se le llama tambin promedio o, simplemente, media. Clculo de la media para datos no agrupados Clculo de la media para datos agrupados: Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como
Las principales propiedades de la media aritmtica son:3 Su clculo es muy sencillo y en l intervienen todos los datos. Su valor es nico para una serie de datos dada. Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de una medida de dispersin. Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor: Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado, esto es, el valor de es mnimo cuando. Este resultado se conoce como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros de dispersin ms importantes: la varianza. Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si entonces donde es la media aritmtica de los , para i = 1, ..., n y a y b nmeros reales. Es poco sensible a fluctuaciones muestrales, por lo que es un parmetro muy til en inferencia estadstica. Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son: Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren. Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente, tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de sus componentes. En el clculo de la media no todos los valores contribuyen de la misma manera. Los valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras palabras, se ve muy afectada por valores extremos. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos. Media ponderada. A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada. Esencialmente, la media muestral es el mismo parmetro que el anterior, aunque el adjetivo 68
Manual de Estadstica I.
"muestral" se aplica a aquellas situaciones en las que la media aritmtica se calcula para un subconjunto de la poblacin objeto de estudio. La media muestral es un parmetro de extrema importancia en la inferencia estadstica, siendo de gran utilidad para la estimacin de la media poblacional, entre otros usos. Mediana. La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor.7 Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2: En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores: Se toma como mediana Existen mtodos de clculo ms rpidos para datos ms nmerosos (vase el artculo principal dedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto por interpolacin. [editar]Clculo de la mediana para datos agrupados Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho). As, aplicando la formula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas: Ni-1< n/2 < Ni = N19 < 19.5 < N20 Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos) La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms. Moda. La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta.5 En cierto sentido la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin. Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-53-7. El nmero que ms se repite es 5, entonces la moda es 5. Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia diremos que no hay moda. Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta. La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que: Siendo la frecuencia absoluta del intervalo modal y las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al 69
Manual de Estadstica I.
Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:
70
Manual de Estadstica I.
Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .
Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Manual de Estadstica I.
la distribucin sin necesidad de generar el grfico. Sus principales medidas son la Asimetra y la Curtosis. 1. ASIMETRA Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media. 72
Manual de Estadstica I.
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.
2. CURTOSIS Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica
Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente. 73
Manual de Estadstica I.
La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.
Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadsticos. Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introduccin a esta ciencia.
74
Manual de Estadstica I.
75
Manual de Estadstica I.
PRCTICA NO. 5 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Defina medidas en estadstica. 2. Indique la importancia de las mediciones en estadstica. 3. Enumere las diferentes medidas utilizadas en estadstica. 4. Qu son las medidas de tendencia central? 5. Qu son las medidas de posicin? 6. Qu son las medidas de dispersin? 7. Qu es la asimetra? 8. Que es la curtosis? 9. Cuando una distribucin es leptocrtica, platicrtica o mesocrtica? 10. Describa las medidas de tendencia central que conoce. 11. Describa las medidas de dispersin que conoce. 12. Describa las medidas de posicin que conoce.
76
Manual de Estadstica I.
77
Manual de Estadstica I.
78
Manual de Estadstica I.
79
Manual de Estadstica I.
Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos. para una serie para dos o ms series
Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total. Las barras pueden ser: Verticales Horizontales
80
Manual de Estadstica I.
Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser: Verticales horizontales
Grficos de barras apiladas Se usan para mostrar las relaciones Las barras
entre
dos
o ms pueden
series
con
el
total. ser:
verticales horizontales
81
Manual de Estadstica I.
Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: una serie dos o ms series
Estos grficos se utilizan para representar valores con grandes incrementos entre s.
82
Manual de Estadstica I.
Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser: En dos dimensiones en tres dimensiones
Grficos de reas En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser: Para representar una serie para representar dos o ms series en dos dimensiones en tres dimensiones.
83
Manual de Estadstica I.
Cartogramas Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.
Grficos Mixtos En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser: en dos dimensiones en tres dimensiones.
84
Manual de Estadstica I.
Histogramas Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.
OTROS Grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector. Dispersograma Los dispersogramas Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.
85
Manual de Estadstica I.
Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma. Pueden ser:
Conclusin Hasta ahora slo hemos utilizado unos tipos de grfico muy comunes como el grfico de columnas por ejemplo. Sin embargo, hoy da Excel dispone de muchos ms tipos de grficos. 86
Manual de Estadstica I.
Cada tipo de grfico se diferencia de los dems por la clase de marcas de datos que utiliza. Por ejemplo, el grfico de columnas utiliza columnas como marcas de datos; el de crculos, utiliza crculos; etc. El motivo de que haya tantos tipos de grficos diferentes no es solamente esttico. Cada uno de los tipos de grficos est especialmente indicado para representar los datos de una manera distinta. Por lo tanto, si quieres obtener la mxima eficacia al crear tus grficos y presentar tus datos de la mejor manera posible debes tener esto muy en cuenta; que cada tipo de grafico esta destinado para una labor especifica.
87
Manual de Estadstica I.
88
Manual de Estadstica I.
89
Manual de Estadstica I.
PRCTICA NO. 6 PARA REALIZAR EN EL AULA. I. DESARROLLE. 1. Defina grficos. 2. Indique la importancia de los grficos y su uso en estadstica. 3. Qu es plano de ejes cartesianos? 4. Defina los grficos de pastel. 5. Qu son los histogramas de frecuencia? 6. Qu son los diagramas de barras? 7. Qu es el diagrama de tallo y hojas?
90
Manual de Estadstica I.
91
Manual de Estadstica I.
92
Manual de Estadstica I.
BIBLIOGRAFA
Acosta S., David. (2006). Manual para presentar trabajos escritos. Bogot, Colombia. Dawson Saunders B, Trapp R.:BIOESTADISTICA MEDICA , Edt. Manual Moderno Ed. 1. Pags. Inext. De La Qintana H.:INTRODUCCION A LA ESTADISTICA DESCRIPTIVA, Edt. FAC. MEDICINA UMSA Ed. 1 Bolivia-1996 Pags. Inext Escuela de Salud Pblica::BIOESTADISTICA PARA LAS CARRERAS DE L AREA DE SALUD, Edt. Universidad de Chile Ed. 1. Chile 2000 Pags. Inext. Herrera A.: ESTADISTICA, Edt UMSA ed. San jos La Paz Bolivia 1999 Pags. Inext. Hopkins K, Hopkins B, Glass G.:ESTADISTICA BASICA para las ciencias sociales y del comportamiento, Edt. Simon Shuster cia Ed. 3. Mxico 1999 Pags. Inext. Hopkins K, Hopkins B, Glass G.:ESTADISTICA BASICA, Edt. Simon Shuster cia Ed. 1. Mxico 1997 Pags. Inext Kazmier L.:ESTADISTICA APLICADA A LA ADMINISTRACION Y A LA ECONOMIA, Rev tec. Alegra H, Espaa Edt. Mc Graw Hill Ed. 3. Pags. Inext. Maldonado R.:BIOESTADISTICA MEDICA, Edt. S/n Ed. 1. Bolivia 1998. Pags. Referencial Martinez F,Anto J, Catellanos P, Gili M, Marset P, Navarro V.:SALUD PUBLICA, Espaa Edt. Mc Graw Hill Ed. 1. Pags. Inext. Mendoza Padilla J.:BIOESTADISTICA, METODOLOGIA DE LA INVESTIGACION,SALUD Y POBLACIN, Edt. Fac. Odontologa -UMSAEd. 1. 200 Pags. Inext. Milton S.:ESTADISTICA PARA BIOLOGIA Y CIENCIAS DE LA SALUD, Espaa Edt. Mc Graw Hill Ed. 3. Pags. Inext. Moya R, Saravia G.: ESTADISTICA DESCRIPTIVA, conceptos y apicaciones, Edt. San marcos Ed. 2. Per-Brasil 1999 Pags. Inext. Publication Manual of the American Psychological Association (APA) Sixth Edition (2010) Romero, Liset. (2002). Estadstica para la toma de decisiones. UNICARIBE. Santo Domingo, Rep. Dom. Spiegel, Murray. (1991). Estadstica. Serie Schaum. McGraw-Hill. 2da.Edicin. Mxico, D.F. Zenteno L, Limachi C.:BIOESTADISTICA, Edt. Propia Ed. 1. Pags. Inext www.vitutor.com/estadistica/descriptiva/a_1.html www.fca.unam.mx www.google.com www.monografias.com www.one.gob.do www.wikipedia.com http://www.spssfree.com/spss/analisis3.html
93