Está en la página 1de 8

Historia Desde los comienzos de la civilizacin han existido formas sencillas de estadsticas, pues ya se utilizaban representaciones grficas y otros

smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 A.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios anallizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C. Los libros bblicos de Nmerosy Crnicasincluyen,en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 A.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el ao 594 A.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descricpciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico.

Mtodos Estadsticos La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o medir cosas. Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar que la

informacin sea completa y correcta. El primer problema para los estadsticos reside en determinar qu informacin y cunta se ha de reunir. En realidad, la dificultad al compilar un censo est en obtener el nmero de habitantes de forma completa y exacta; de la misma manera que un fsico que quiere contar el nmero de colisiones por segundo entre las molculas de un gas debe empezar determinando con precisin la naturaleza de los objetos a contar. Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinin o una muestra electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la poblacin no es tarea fcil. Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la poblacin los cambios en el nmero de nacimientos y el nmero de fallecimientos en un determinado lapso. Los expertos en estudios de poblacin comprobaron que la taza de crecimiento depende slo del nmero de nacimientos, sin que el nmero de defunciones tenga importancia. Por tanto, el futuro crecimiento de la poblacin se empez a calcular basndose en el nmero anual de nacimientos por cada mil habitantes. Sin embargo, pronto se dieron cuenta de que las predicciones obtenidas utilizando ste mtodo no utilizaban mtodos correctos. Los estadsticos comprobaron que hay otros factores que limitan el crecimiento de la poblacin. Dado que el nmero de posibles nacimientos depende del nmero de mujeres, y no del total de la poblacin, y dado que las mujeres slo tienen hijos durante parte de su vida, el dato ms importante que se ha de utilizar para predecir la poblacin es el nmero de nios nacidos vivos por cada mil mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre fallecimientos y nacimientos slo es til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del pasado, el nmero de nacimientos por cada mil habitantes slo expresa la taza de crecimiento en el mismo perodo, y slo el nmero de nacimientos por cada mil mujeres en edad de procrear sirve para predecir el nmero de habitantes en el futuro. La estadstica es una Ciencia que tiene como finalidad facilitar la solucin de problemas en los cuales necesitamos conocer algunas caracteristicas sobre el comportamiento de algun suceso o evento. Caractersticas que nos permiten conocer o mejorar el conocimiento de ese suceso. Adems nos permiten inferir el comportamiento de suscesos iguales o similares sin que estos ocurran. Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, asi como realizar proyecciones del comportamiento de algn suceso. Esto es debido a que solo realizamos los clculos y el anlisis con los datos obtenidos de una muestra de la poblacin y no con toda la poblacin. Pues hacerlo con todos los datos o poblacin en algunos casos seria muy dificil y en otros casos casi imposible o imposible. Dificil porque podra tratarse de una situacin donde el nmero de datos es muy grande, como por ejemplo si quisieramos saber el promedio de goles por juego de un equipo de futbol, a pesar de

que se tienen los registros de todos los resultados de sus juegos, son muchisimos los juegos y llevaria tiempo revisar todos los archivos para obtener esos datos. O bien saber que porcentaje de personas tiene vehiculos en una determinada ciudad. Por otra parte podra ser casi imposible o imposible en una situacin, como por ejemplo, donde necesitamos conocer el promedio de edad de los habitantes en todo el mundo (son muchas personas) y teniendo en cuenta que para ello es necesario aplicar encuestas, entrevistas; o extraer datos de archivos y/o de observaciones de campo. Es posible que sea muy dificil y complicado o que simplemente no se pueda conseguir los datos de todas las personas. O bien saber que porcentaje de vehiculos azules hay en el mundo. Analizando esto podemos ver que tambin simplemente puede ser muy sencillo, como por ejemplo determinar el promedio de edad de los gobernadores de los Estados Unidos, pues son pocos y conocidos es sencillo obtener los datos. Esto nos lleva a la conclusin de que la estadstica tiene aplicacin en cualquier campo, sin importar que tan sencillo o complicado sea. Cuanto ms complicado sea, ms ayuda nos presta para resolver la situacin. Mostraremos las ideas expuestas con un caso practico de la vida real, el cual se presenta con muchisima frecuencia: Un estudiante que toma un curso en la escuela, siempre le interesa saber con anticipacin como ser su resultado al finalizar el curso. Que oportunidad tiene de aprobar el curso y con que calificacin, lo cual no es posible determinar con certeza hasta finalizar el curso. Pero con el uso de la estadstica puede conocer de forma aproximada esta informacin. El puede tomar las calificaciones (que son los datos) de todos los cursos anteriores y hacer un promedio (que seria la media aritmtica). Asi tendria una idea de cuales son en general los resultados que se obtienen en ese curso. Tambien puede obtener un porcentaje de cuntos estudiantes obtienen una determinada calificacin. Lo que luego le permitiria de acuerdo al nmero total de estudiantes en ese curso determinar cual sera su probabilidad de obtener una determinada calificacin. Tambin puede obtener un porcentaje de las personas que aprueban o no el curso y as conocer su oprtunidad, de igual forma de acuerdo al total de lumnos del curso obtener su probabilidad de aprobar o no el curso. Pero este trabajo que necesita hacer con los datos de todas las calificaciones anteriores de ese curso, llevara muchisimo tiempo y trabajo. Es muy posible que cuando tenga los resultados ya no le sirvan, pues ha terminado el curso y ya conoce con certeza sus calificaciones. Es all donde tiene un papel importante la estadstica. De todas las calificaciones anteriores, que seria la poblacin, solo se toman algunas, esto seria una muestra. Para seleccionar la muestra existen varias maneras de hacerlo o mtodos. Como por ejemplo: tomar solo las del ultimo curso. Tomar cinco calificaciones de cada curso. Tomar cinco calificaciones de los ltimos diez cursos, dejando a la suerte cuales serian las cinco calificaciones a tomar. Esto sera seleccin aleatoria, tambin se podra tomar algunos cursos al azar o aleatoriamente y de ellos algunas calificaciones tambin aleatoriamente.

Un aspecto importante es el tamao de la muestra. Este est relacionado directamente con la precisin de los resultados que se obtendrn. Cuanto mayor sea el tamao de la muestra mayor presicin tendrn los resultados, pues el tamao de la muestra estar mas cerca del tamao de la poblacin y cuanto mas pequea sea el tamao de la muestra, estar mas lejos del tamao de la poblacin por lo que los resultados seran menos precisos. Por tal motivo existen mtodos para poder establecer o calcular de acuerdo a la situacin cul es el tamao de la muestra adecuado. Esto no quiere decir que no pueda selecionarse otro tamao de la muestra, solo es mas recomendable. Otro aspecto importante podra ser dividir el grupo de estudiantes en cuatro categoras: A, B, C y D. Pues supongamos se asignan tres tipos de becas a los estudiantes, de la siguiente forma. Al 25% que saque mayores notas (categora A) se le da una beca por 5 aos. Al 25% que le sigue en calificaciones (categora B) se le otorga una beca por 3 aos. Al 25% siguiente (categora C) una beca por 1 ao y al 25% restante (categora D) no se le otorga ninguna beca. Esto quiere decir por ejemplo que en una clase de 20 estudiantes que estn ordenados por calificaciones en orden descendente: del 1 al 5 se becan por 5 aos, del 6 al 10 se becan por 3 aos, del 11 al 15 se becan por 1 ao, y del 16 al 20 no reciben beca. Si quisieramos conocer que oportunidad tenemos de obtener una beca. Podramos tomar un grupo de notas o datos, de forma aleatoria entre todos las notas de los cursos dictados anteriormente o poblacin. Esto representara una muestra. Luego determinamos cuales son las calificaciones que establecen a que categora pertenece el estudiante. Esto es equivalente a calcular los cuartiles: primer cuartil, segundo cuartil y tercer cuartil. Que no son otra cosa que los valores correpondientes a la escala de calificaciones, en las cuales se producen los cambios para cada categora. Es decir el tercer cuartil representa la calificacin a partir de la cul estn ubicados el 25% de los estudiantes de categora A, el segundo cuartil (igual a la mediana) es igual a la calificacin en la cual hay 50 % de los estudiantes por encima y 50% por debajo, los que estn entre el segundo y el tercer cuartil son el 25% de estudiantes categora B. Y el primer cuartil es representa la calificacin por debajo de la cual hay 25% de estudiantes categora D, adems los que estn entre el primer cuartil y el segundo son el 25% categora C. Esto puede de una forma ms sencilla permitirle tambin tener una buena idea de que oportunidad tiene de obtener una determinada beca dentro de este curso. Pero adems de esto tambin es importante conocer la regularidad o normalidad de las calificaciones en los cursos anteriores, esto quiere decir saber si semantiene o no el mismo comportamiento en todos los cursos. Lo cual es importante para saber si los resultados obtenidos del anlisis tienen validez o no. Esto es posible hacerlo calculando la Correlacin entre las notas de los cursos.

El proceso de obtencin de informacin La estadstica El tema de hoy es: Qu es la estadstica y la probabilidad? Teniendo ya una idea de para qu dicen que pueden servir en los negocios, es conveniente darnos una idea mas detallada de qu son. Cuando uno pregunta qu cosa son, obtiene respuestas en estas lneas: Datos. Las estadsticas son datos. Presentacin de datos. Las estadsticas son nmeros presentados en tablas o en grficas. Modelos. Modelos matemticos que representan ms o menos fielmente la realidad. Mentiras. Las estadsticas mienten. Promedios. Calcular estadsticas es calcular valores promedio. Encuestas. Las estadsticas son preguntas y porcentajes de personas que opinan de una forma u otra. Todas estas respuestas tienen algo de verdad y algo de falso. Los textos de estadstica sealan 4 divisiones de la estadstica: Estadstica para organizar, resumir y presentar datos. Estadstica descriptiva. Estadstica para realizar investigaciones efectivas y para construir modelos. Estadstica para hacer inferencia. Estadstica para la toma de decisiones. La separacin de la estadstica en esas cuatro divisiones es artificial. Las cuatro estan ligadas. Organizar los datos nos lleva, desde el proceso mismo de organizacin a crear un esquema mental para explicrnoslos, es decir un modelo. Nos lleva tambin a empezar a tratar de ver hasta donde se puede extender lo que estamos viendo en estos datos organizados y qu accin tomar en base a lo que empezamos a ver oragnizndose. Esto gua la forma en que los resumimos y la forma en que los presentamos. La divisin tiene que ver con los tipos de tcnicas o trucos que usamos en cada una de estas actividades. Una presentacin efectiva de los datos es una presentacin que sugiere: qu conclusiones debemos obtener. hasta dnde se pueden extender las conclusiones a que nos lleven los datos. qu debemos hacer respecto a lo que los datos nos indican. Cada vez que se contempla un conjunto de datos, la primera cosa que nos debe preocupar es qu podemos hacer para mejorar el conocimiento que nos aportan? La particin de la estadstica en esas cuatro divisiones es ms lgica que temporal; son cuatro etapas lgicas de un mismo proceso. El proceso de la informacin Cul es este proceso? Es el proceso de obtencin de informacin. Por ah anda rondando desde hace muchos aos la idea de que los datos no son informacin. Cada quien usa esta idea como mejor le conviene a su circunstancia. Aqu no seremos menos:

La estadstica se encarga de conseguir datos y convertirlos en informacin. En el proceso de obtencin de informacin se pueden distinguir varias etapas: A) Identificacin del problema a tratar. B) Elaboracin del marco terico. C) Captacin de la informacin. D) Tratamiento y procesamiento de la informacin. E) Diseminacin de la informacin. Todas las etapas anteriores son interdependientes. Y se comunican unas a otras a pesar de los esfuerzos que por meterlas al orden hagamos. A) Identificacin del problema a tratar. Es preciso, antes de poder resolver un problema, definirlo. En una investigacin estadstica, para poder dar un resultado til, es necesario dedicar un gran esfuerzo a determinar (con lujo de detalle): el fin especfico que se persigue, hay que detallar geogrfica y temporalmente la poblacin que queremos estudiar, los conceptos y variables que queremos estudiar y las escalas y mediciones que vamos a hacer. Si no podemos evitar que nos culpen por resolver el problema que no es, al menos, que no nos culpen de no saber qu problema fue el que resolvimos! B) Elaboracin del marco terico. Qu es un marco terico? En esta etapa definimos operacionalmente las variables y conceptos a usar. Se disea la investigacin sealando cmo pensamos obtener los datos y cmo los vamos a analizar y resumir. Si se va a hacer una muestra, aqu se decide el tamao y caractersticas de ella. Los tabulados y grficas a obtener etc. C) Captacin de la informacin. En la etapa de captacin de informacin estamos en un proceso de hacer cosas y no de pensarlas. Debemos vigilar que la obtencin de los datos se haga coherentemente a los objetivos y marco conceptual del estudio. Esta etapa es crtica, la informacin se genera aqu, si en esta etapa hay errores, no hay manera de corregirlos, slo de detectarlos (a veces!). D) Tratamiento y procesamiento de la informacin. La etapa de tratamiento de los datos es donde juegan los mtodos estadsticos que comunmente se conocen como tales. Esta es la etapa de las computadoras y los clculos, los anlisis estadsticos, las regresiones, varianzas, componentes principales y otro montn de nombres raros. E) Diseminacin de la informacin. La etapa de diseminacin de la informacin es la de presentacin de resultados. Mediante grficas, tablas, etc. se hacen llegar las conclusiones de las etapas anteriores a los odos que desde el principio habamos determinado que deban orlas. En todo el proceso anterior juega un papel destacadsimo el concepto de variabilidad. Cualquier investigacin sigue, a grandes rasgos las etapas anteriores. Lo que distingue a las investigaciones

estadsticas es que se realizan sobre datos variables. Hay una variabilidad inherente a los datos que la estadstica debe tomar y toma en cuenta: la llamada variabilidad aleatoria. La probabilidad. De esta variabilidad aleatoria de los datos viene la relacin de la estadstica con la probabilidad. La probabilidad es una parte de las matemticas que se dedica a ver cmo debe cuantificarse la incertidumbre. sta no es ignorancia llana sino una ignorancia cuantificable. El ejemplo ms antiguo y conocido de la probabilidad es el de una seleccin ``a ciegas''. Un juego de azar, o una seleccin mas romntica como la del prncipe que va a desposar a la primera mujer que vea en llegando al poblado, o la reina encantada del ``Sueo de una noche de verano'' que se enamorar del primero que vea (aunque tenga cabeza de burro), son todos ejemplos de una seleccin a ciegas. Pensemos en un juego con una moneda. La probabilidad clsica dice: la probabilidad de guila es un medio porque la moneda tiene dos caras similares y una de ellas muestra un guila. Un enfoque mas emprico dice: la experiencia (amarga o dulce) me indica que despus de muchos lanzamientos, cae guila tan frecuentemente como n, la probabilidad de un guila es un medio. Un enfoque subjetivista dice: si apuesto por guila o en contra estimo que las consecuencias son iguales y por eso digo la probabilidad de guila es un medio. Independientemente de los los que la interpretacin de la probabilidad pueda traer (que son muchos y ocasionan agrias discusiones entre los enterados) hay caractersticas comunes de la probabilidad que son admitidas por todo mundo: La probabilidad es un nmero. La probabilidad est entre cero y uno. La probabilidad de uno la tiene algo que es seguro que ocurra, la probabilidad cero la tiene algo que es (prcticamente) imposible que ocurra. Las dems posibilidades tienen probabilidad intermedia. Algo que tiene mayor probabilidad es algo que es ms factible que ocurra. La probabilidad es un nmero aditivo similar, en sus propiedades matemticas al rea o al volumen. La parte de la estadstica que se dedica a la construccin de modelos trabaja fuertemente con la probabilidad y sus propiedades matemticas sofisticadas. La estadstica aplicada utiliza la probabilidad principalmente en dos instancias: La verosimilitud y La significacin. Verosimilitud La idea de la verosimilitud es la siguiente. Para fijar ideas piense en la pobre reina del ``Sueo de una noche de verano''; est bajo el efecto de un hechizo que la har enamorarse del primero que vea. La cuestin es si ese primero ser guapo o n. Tratemos de modelar el dilema de la reina. Que sea guapo o n depende entre otras cosas de la densidad de hombres guapos que haya en la vecindad de donde se encuentra dormida la reina. Este es un dato que desconocemos, a este tipo de datos lo llamamos parmetro del modelo y har que el modelo cambie al cambiar el valor del parmetro. Un primer modelo para esta situacin hace que la probabilidad de que el sujeto sea guapo sea el nmero de guapos que esten en posibilidad de pasar cuando la reina despierte dividido por el nmero total de hombres que puedan pasar por ah. Si hay pocos guapos la probabilidad ser pequea, si hay muchos guapos la probabilidad ser grande. Al valor de la

probabilidad cambiando conforme cambia el parmetro le llamamos verosimilitud. A partir de la idea de verosimilitud se construyen muchas de las herramientas estadsticas de uso diario. Significacin La otra idea que usa a la probabilidad es la de significacin y est muy emparentada con la verosimilitud. Para ejemplificarla pensemos en algo mas repetible que el predicamento de la reina de las hadas. Piense en una situacin de seleccin a ciegas al inspeccionar la materia prima que se recibe para un proceso. En este caso podemos aceptar o rechazar el envo del proveedor. Para aceptar todo el lote o rechazarlo, vamos a escoger unas cuantas muestras y decidir en base a ellas. Si ya tenemos evidencia en la muestra que el embarque o lote no est del todo bien tendremos que decidir entre dos opciones: el embarque satisface la tolerancia y por pura mala suerte al seleccionar a ciegas escogimos los mas malos o el embarque es defectuoso y si lo admitimos nos va a causar problemas a la hora de procesarlo. En este dilema, por cualquier lado que nos inclinemos, existe la posibilidad de equivocarse. Sin embargo una posible gua sale de meditar en la probabilidad de que estando bien el lote, la seleccin al azar nos lleve a una muestra muy desfavorable al lote; a esta probabilidad la llamamos significacin. Si la calidad de todo el lote se va a juzgar por las pocas muestras que tomamos la significacin de nuestro procedimiento debe ser pequea. Qu tan pequea es otro problema. Otro concepto que debemos tener claro es que la probabilidad cambia conforme adquirimos informacin, es ms, podemos definir la informacin en trminos de cmo cambia la probabilidad al tener ms datos. Regresando con nuestra reina de las hadas, la probabilidad de que le toque enamorarse de un sujeto guapo se va a poder calcular mejor si se tiene mas informacin respecto a las personas que es factible que pasen a la hora en que ella despierte. Este concepto es el de condicionalidad de la probabilidad. La probabilidad es condicional al estado de informacin en que est inmerso el problema.

También podría gustarte