Está en la página 1de 6

1

Conceptos estadsticos bsicos


Estadsticas o datos y unidades de estudio Las estadsticas o datos estadsticos son el conjunto de datos numricos que han sido organizados, resumidos y presentados para mostrar las caractersticas o evolucin de un cierto fenmeno de inters. Son la informacin numrica o cuantitativa sobre un tema, para un cierto periodo y organizada de tal forma que muestre los aspectos ms significativos y de mayor inters (Gmez, 2004). Se denomina unidad de estudio o unidad estadstica elemental a la persona, animal, empresa, organizacin, objeto entre otros que es la referencia para realizar un estudio o investigacin. Con el estudio se pretende conocer las caractersticas del conjunto y generalizar a l los resultados o conclusiones que se obtengan (Gmez, 2004). Estadstica La Estadstica es una disciplina cientfica dedicada al desarrollo y aplicacin de la teora y las tcnicas apropiadas para la recoleccin, clasificacin, presentacin, anlisis e interpretacin de la informacin cuantitativa obtenida por observacin o experimentacin (Gmez, 2004). Para Johnson y Kuby (2001) el empleo cuidadoso de mtodos estadsticos permite obtener informacin precisa de los datos. Estos mtodos incluyen: 1) definir cuidadosamente la situacin, 2) recolectar los datos, 3) resumir con precisin los datos, y 4) obtener y comunicar las conclusiones significativas. Poblacin y muestra La Estadstica realiza sus anlisis, no con las unidades propiamente dichas, sino con los valores observados para una cierta caracterstica de esas unidades de estudio. Al conjunto de tales unidades se le conoce como poblacin. Una poblacin puede ser finita o infinita. Una poblacin finita tiene un nmero limitado de elementos, mientras que una infinita est conformada por un nmero ilimitado de unidades (Gmez, 2004). En trminos generales, si se va a estudiar una situacin existente en un momento dado, la poblacin quizs puede ser muy grande, pero es necesariamente finita. En cambio, si se va a analizar un proceso, el cual tericamente puede repetirse indefinidamente bajo las mismas condiciones, la poblacin es infinita (Gmez, 2004). Se conoce como muestra a un subconjunto de la poblacin. La tcnica para seleccionar una muestra se conoce como muestreo y es un procedimiento inductivo, por

lo que se debe cuidar que la generalizacin sea precisa y, para ello, minimizar el margen de error asociado. Gmez (2004) plantea cuatro ocasiones para la utilizacin de muestras: cuando la poblacin es infinita o muy grande y es imposible fsicamente cubrir a todos los elementos que la componen la poblacin es finita pero lo suficientemente grande para que el estudio de todos los elementos no sea aconsejable, porque resultara demasiado costoso y tomara tanto tiempo que hara que los datos resultaran obsoletos o intiles en el momento en que estn disponibles la unidad de estudio se transforma o se destruye al ser examinada los resultados que arrojara una muestra bien seleccionada, de tamao razonable, seran suficientemente precisos para los fines prcticos que se persiguen con los datos.

En cuanto al tipo de muestra, bsicamente se categorizan en: probabilsticas y no probabilsticas. En las muestras probabilsticas, cada unidad estadstica elemental de la poblacin debe tener una probabilidad conocida, no nula, de ser incluida en la muestra. La ventaja principal del muestreo probabilstico es que permite medir el error de muestreo, el cual es la diferencia entre el valor poblacional de la caracterstica y su estimacin a partir de las observaciones de la muestra. El error de muestreo ocurre porque solamente se utiliza parte de las unidades de la poblacin (Hernndez, 2004). El marco de referencia que permite identificar fsicamente los elementos de la poblacin, la posibilidad de enumerarlos y proceder a la seleccin de los elementos se llama marco muestral. Normalmente se trata de un listado existente o una lista que es necesario conformar (Hernndez, Fernndez & Baptista, 2006). De manera ideal, un marco muestral debe ser idntico a la poblacin, donde todo elemento de esta debe aparecer enumerado solamente una vez; a partir de l se obtiene la muestra (Johnson & Kuby, 2001). El muestreo simple al azar es el ms simple de los mtodos de muestreo probabilstico y es la base de los mtodos ms complejos. Cada unidad estadstica tiene la misma probabilidad que cualquier otro elemento de ser escogido para formar parte de la muestra. Se puede obtener por medio de rifas, tablas de nmeros al azar, uso de paquetes estadsticos (Hernndez, 2004). El muestreo sistemtico es un procedimiento de seleccin muy utilizado por su sencillez y facilidad de aplicacin. Si en una poblacin hay N unidades y el tamao de la muestra es n, entonces se efecta N n. Si el resultado es un entero digamos k, entonces el muestreo sistemtico consiste en seleccionar al azar con igual probabilidad una unidad entre las primeras k unidades de la lista y luego, inmediatamente despus de esa unidad seleccionada, tomar de la lista cada k-sima unidad hasta completar las restantes unidades y completar los n elementos de la muestra. Si el nmero k no es entero, el mtodo tiene una ligera variante basada en el redondeo (vase Hernndez, 2004). El muestreo estratificado consiste en dividir la poblacin en subpoblaciones llamadas estratos y en seleccionar muestras probabilsticas separadas una de cada estrato. La estratificacin se utiliza por varias razones: 1) permite obtener estimaciones

ms precisas de los valores poblacionales si las unidades que conforman cada estrato se parecen mucho entre s respecto de la caracterstica que se quiere medir, 2) la informacin recolectada de cada estrato es til para describir las caractersticas de inters en cada estrato y permite tambin hacer comparaciones con los dems, 3) es una opcin muy conveniente cuando una organizacin est presente en varias regiones del pas (Hernndez, 2004). En el muestreo de conglomerados, la muestra de unidades de una poblacin se selecciona no extrayendo las unidades individualmente, sino en grupos de unidades llamados conglomerados. Dicho procedimiento de muestreo es preferible cuando no es posible obtener una lista de todas las unidades de la poblacin, pero s de los conglomerados y porque permite reducir el costo y el tiempo incurridos en localizar las unidades. No obstante, tiene la desventaja de que la precisin de las estimaciones de las caractersticas de inters es menor que la de un muestreo simple al azar (Hernndez, 2004). Por otra parte, las muestras no probabilsticas utilizan grupos de personas, eventos, sucesos, comunidades, etc. sobre los cuales se recolectan los datos, sin que necesariamente sean representativos de la poblacin que se estudia. Este tipo de muestreo no permiten la posibilidad de generalizar los resultados a la poblacin, sino que permiten obtener los casos que interesan al investigador y que llegan a ofrecer una gran riqueza para la recoleccin y el anlisis de los datos (vase Hernndez, Fernndez & Baptista, 2006). Estadsticos y parmetros Un parmetro es un valor numrico que resume todos los datos de una poblacin completa, es decir, es un valor que describe a toda la poblacin. Para todo parmetro existe un estadstico muestral correspondiente, esto es, el estadstico describe a la muestra de la misma manera en que el parmetro describe a la poblacin (Johnson & Kuby, 2001). Variables y su clasificacin Cuando se mide una caracterstica se obtiene un nmero para cada unidad de estudio observada; por lo general, estos nmeros varan de una unidad a otra y por ello se les llama variables. Una variable difiere de una constante en que, en esta ltima, valor no cambia (Runyon & Haber, 1984). Una variable es cuantitativa si los valores que toma son nmeros, obtenidos como resultado de: 1) un proceso de conteo, 2) utilizar una unidad monetaria, y 3) emplear instrumentos como balanzas, velocmetros, barmetros o relojes. Las variables se llaman cualitativas o categricas si los valores que toman pertenecen a un conjunto de categoras, las cuales reflejan los atributos o cualidades de las unidades estadsticas (Hernndez, 2004). Las variables cuantitativas se pueden clasificar en continuas o discretas. Se dice que una variable es continua en un intervalo si tericamente puede tomar cualquier valor

en ese intervalo. Si una variable solo puede tomar un nmero determinado de valores dentro de un intervalo y no todos los posibles, se dice que es discreta. En ciertas situaciones, por razones de conveniencia, una variable discreta se puede tratar como si fuera continua (Gmez, 2004). Cuando se tienen variables cualitativas que solo asumen dos valores, se les llama dicotmicas y se pueden manejar como si fueran variables discretas (Gmez, 2004). Niveles de medicin Un paso muy importante, a la hora de analizar datos estadsticos, es determinar cul es el nivel de medicin de las variables, de manera que sea posible seleccionar la tcnica ms adecuada al tipo de informacin que se tiene. Cuando se tiene una caracterstica para la cual se pueden definir categoras diferentes, pero no es posible ordenar esas categoras, ni decir cunto difiere una de otra, se dice que la caracterstica est medida a un nivel nominal. Solo es posible decir si dos elementos son iguales o diferentes, pero no se pueden ordenar las categoras. Constituye el nivel de medicin ms simple (Gmez, 2004). Si a cada categora se le asigna una etiqueta o smbolo, esto identificar exclusivamente a la categora. Los nmeros utilizados en este nivel de medicin tienen una funcin puramente de clasificacin y no se pueden manipular de manera aritmtica (Hernndez, Fernndez & Baptista, 2006). Cuando hay varias categoras, pero adems estas mantienen un orden (de mayor a menor o viceversa) se dice que el nivel de medicin es ordinal. Las etiquetas o smbolos de las categoras indican jerarqua, es decir, definen posiciones (Hernndez, Fernndez & Baptista, 2006). Si adems del orden o jerarqua entre categoras se establecen intervalos iguales en la medicin, se habla de un nivel por intervalos. Las distancias entre categoras son las mismas a lo largo de toda la escala, por lo que hay un intervalo constante. El cero es un valor arbitrario (no real) ya que se asigna arbitrariamente a una categora dicho valor y a partir de ah se construye la escala. Diversas mediciones en el estudio del comportamiento humano no son verdaderamente de intervalo (por ejemplo, escalas de actitudes, pruebas de inteligencia) pero se suele tratarlas como si fueran mediciones de intervalo, pues este nivel permite utilizar operaciones aritmticas bsicas y algunas tcnicas estadsticas modernas (Hernndez, Fernndez & Baptista, 2006). En el nivel de medicin de razn, adems de tenerse todas las caractersticas del nivel de intervalos (periodos iguales entre las categoras y aplicacin de operaciones aritmticas), el cero es real y absoluto (no es arbitrario), lo cual implica que hay un punto en la escala donde est ausente o no existe la propiedad medida (Hernndez, Fernndez & Baptista, 2006).

Estadstica Descriptiva y Estadstica Inferencial La Estadstica Descriptiva incluye la elaboracin de cuadros y grficos y el clculo de medidas sintticas (tasas, ndices, porcentajes, promedios, varianzas, correlaciones, etc.) para resumir y describir conjuntos de datos. Por su parte, la Estadstica Inferencial utiliza la teora matemtica de las probabilidades para medir la validez con que se pueden generalizar los resultados obtenidos en una muestra a toda la poblacin de la que forman parte, contrastar hiptesis y confirmar si los resultados descriptivos obtenidos se deben probablemente al azar o reflejan la existencia de una relacin real (Hernndez, 2004).

Ejercicios 1
1. En cada caso, indique si se trata de una variable o de una constante: a) b) c) d) Nmero de das del mes de agosto Edad de los estudiantes de primer ao de una universidad Tiempo requerido para completar un ejercicio Edad en que una persona adquiere el derecho a votar en elecciones presidenciales en Costa Rica e) Calificaciones obtenidas en un examen que contiene 100 preguntas f) Mxima calificacin posible en un examen g) Cantidad de dinero gastada anualmente en libros por estudiantes universitarios 2. Clasifique cada poblacin en finita o infinita: a) b) c) d) e) f) g) salarios de los trabajadores de una fbrica durante el ao anterior personas a las que se les puede aplicar una vacuna estudiantes que se matricularn en una carrera universitaria en los prximos aos poblacin costarricense por sectores de produccin en el ao 2000 resultados obtenidos al lanzar sin lmite un dado produccin de energa elctrica en los ltimos diez aos salarios de los obreros

3. Suponga que debe explicar ante un grupo la diferencia entre poblacin infinita y poblacin finita. a) Qu informacin debe incluir en su respuesta? b) D dos ejemplos (propios del sector educativo) de cada tipo de poblacin. 4. D tres ejemplos de variables cuantitativas discretas, cuantitativas continuas y de variables cualitativas (atributos) que sean propios del mbito educativo. A la par de cada una, escriba un dato.

5. Clasifique las siguientes variables como cualitativas o cuantitativas. Para las que son cuantitativas, indique si son discretas o continuas. D un ejemplo de observacin para cada una: a) b) c) d) e) f) g) h) ocupacin cantn de residencia nmero de automviles que tiene una familia escogida al azar temperatura mxima diaria nmero de la camiseta de un jugador de un equipo de ftbol nota en un examen estado civil marca de cervezas producidas en Costa Rica

6. Para las siguientes variables indique la escala de medicin apropiada: a) b) c) d) e) f) g) h) i) color de ojos rango militar nmero de cdula gnero nivel de escolaridad tiempo utilizado en contestar un examen calificacin obtenida en un examen grado acadmico distancia desde la casa hasta el hospital ms cercano

7. El tiempo promedio estimado para resolver un examen escrito para todos los estudiantes de un colegio se estima utilizando el tiempo promedio que utilizan 900 estudiantes elegidos aleatoriamente para resolver el examen. Identifique cul trmino se relaciona adecuadamente con cada expresin: a) b) c) d) e) f) g) los 900 estudiantes el tiempo promedio para todos los estudiantes 72 min es el tiempo utilizado por un estudiante el tiempo promedio para los 900 estudiantes todos los estudiantes del colegio el tiempo utilizado por un estudiante los 900 tiempos registrados

8. Suponga que se tienen las siguientes respuestas cuando se ha preguntado sobre ciertas situaciones de inters. Cul cree usted que es el nivel de medicin de las variables correspondientes a las preguntas formuladas para obtener esas respuestas? a) b) c) d) e) Soy estudiante de la Escuela XYZ. No tengo hijos ni hijas. Estoy totalmente en desacuerdo. Sucedi en el ao 40 a.C. Las lecciones duran 2 horas.

También podría gustarte