Kendall y Buckland (citados por Gini V. Glas / Julian C.
Stanley, 1980) definen la estadstica como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra. "La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini, 1953). Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954). Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica, debido al gran campo de aplicacin que posee. En la estadstica tiene un papel destacado la nocin de muestra aleatoria. Una muestra aleatoria de tamao n es:
Una coleccin de n variables
aleatorias. Todas con la misma distribucin. Todas independientes. La coleccin de donde extraemos la muestra aleatoria, se denomina POBLACIN INFERENCIA
Este trmino lo usamos en estadstica
para denotar al procedimiento con el que hacemos afirmaciones acerca de valores generales de la poblacin mediante los nmeros que observamos en la muestra. Ejemplo
Suponga que observamos el proceso de fabricacin de
las ``bolitas'' que se le ponen al envase de los desodorantes ``roll on''. No todas las bolitas van a tener el mismo dimetro, si escogemos, al azar una bolita, tendremos un valor para el dimetro que es una variable aleatoria. Podemos suponer que los dimetros tienen la distribucin normal, debido a nuestra experiencia con el proceso, conocemos que la desviacin estndar de la poblacin es de 4 mm (aproximadamente). Pero, tambin por experiencia, sabemos que el dimetro promedio puede variar por desajuste de la maquinaria productora Una POBLACIN, que son todas las bolitas que se producen.
Un PARMETRO de la poblacin conocido (o casi) que
es la desviacin estndar.
Otro PARMETRO cuyo valor es desconocido: la media .
Para tratar de conocer el valor del parmetro que desconocemos, tomamos una MUESTRA de las bolitas Supongamos que son 100 bolitas en la muestra. Con un instrumento de precisin, y con mucho cuidado, medimos los dimetros de las 100 bolitas de la muestra y calculamos su promedio. Qu nos dice el valor de la media de la muestra respecto a la media de la poblacin? Por un lado, definitivamente la media de la muestra NO va a ser igual a la de la poblacin. Por otra parte, no tenemos mejor informacin respecto a la media de la poblacin que la que extraigamos de la muestra. Cualquier otra informacin no pasa de chisme. Por ltimo, sera muy extrao que si la poblacin de bolitas tiene, por decir algo, un dimetro promedio de 45 mm, nos tocaran 100 bolitas en la muestra con un promedio de, digamos, 32 mm. Fjese que no decimos imposible sino raro o extrao. Adems, si alguien nos preguntara como cunto es el dimetro promedio de la poblacin de bolitas? Le contestaramos diciendo el valor que hayamos visto en la muestra. A nuestra contestacin debamos agregarle alguna advertencia como: "ms o menos'', o ``aproximadamente''. A un valor calculado con los datos de una muestra lo llamamos ESTADSTICA. Cuando usamos una estadstica para estimar, el valor de un parmetro de la poblacin, le llamamos ESTIMADOR. Cuando andamos un poco pedantes le llamamos ESTIMADOR PUNTUAL (al decir puntual'' queremos decir que para estimar el parmetro estamos usando un valor nico). Regresando a las bolitas del ``Roll on''. Si la muestra de 100 bolitas arroja un valor del promedio de 43.5 mm, diramos que estimamos el promedio de la poblacin en 43.5 mm. Poblacin
El concepto de poblacin en estadstica va
ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser: finita o infinita Poblacin infinita
Cuando el nmero de elementos que integra
la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Poblacin finita
Una poblacin finita es aquella que est
formada por un limitado nmero de elementos, por ejemplo: el nmero de estudiantes de la Facultad de Ingeniera Industrial de la UNMSM Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra Muestra
"Se llama muestra a una parte de la
poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991) "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin (1996). "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Ejemplo
El estudio realizado a 50 miembros del
Colegio de Ingenieros del Per. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo Se a probado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo. Muestreo
El muestreo es una tcnica que sirve para
obtener una o ms muestras de poblacin. Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variarn de una muestra a otra. Tipos de muestreo
Existen dos mtodos para seleccionar muestras
de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad Muestreo aleatorio o de probabilidad
En este muestreo todos los elementos de la
poblacin tienen la misma oportunidad de ser escogidos en la muestra Muestreo no aleatorio o de juicio Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesarios para hacer muestras de probabilidad. Variables
Las variables, tambin suelen ser
llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Z, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable Constante
Si la variable puede tomar solamente un
valor, se llama constante." Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable Atributo Los atributos tambin llamados caracteres cualitativos, son aquellos que no son susceptibles de medicin, es decir que no se pueden expresar mediante un nmero. IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas caractersticas que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo: profesin, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Las distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo
El estado civil de cada uno de los docentes
en la Facultad de Ingeniera industrial, no se presenta en la misma modalidad en todos. Encuesta
Se entiende por encuesta las observaciones
realizadas por muestreo, es decir son observaciones parciales. El diseo de encuestas parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms directo y simple es preguntrselo directamente a ellas. (Cadenas, 1974). Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un gran nmero de personas". Estadstica Descriptiva
Tiene por objeto fundamental describir y
analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas Estadstica Inductiva o Inferencial
Est fundamentada en los resultados
obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. Ejemplo de estadstica descriptiva
Supngase que un profesor calcula la calificacin
promedio de un grupo de alumnos del curso de Dibujo Industrial. Como la estadstica describe el desempeo del grupo pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Grficas, tablas y diagramas que muestran los datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva. Ejemplo de Estadstica Inferencia
Supngase ahora que el profesor de Dibujo
Industrial decide utilizar el promedio de calificaciones obtenido por uno de sus grupos para estimar la calificacin promedio de los diez grupos del mismo curso de Dibujo Industrial. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Medicin de Caracteres
Existen diversas definiciones del trmino
"medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso mismo de la construccin de una escala o instrumento de medicin. Medicin Se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad Por medio de la medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "nmeros" Es evidente que el mundo resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que le servira al fsico saber que el hierro tiene una alta temperatura de fusin. Niveles o Escalas de mediciones
Escala Nominal
La escala de medida nominal, puede considerarse la
escala de nivel ms bajo, y consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNMSM de acuerdo a la carrera que cursan
Carrera Nmero asignada
a la categora Educacin 25 Administracin 27 Se ha de tener presente que los nmeros asignados a cada categora sirven nica y exclusivamente para identificar la categora y no poseen propiedades cuantitativas Escala Ordinal
En caso de que puedan detectarse diversos
grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. La asignacin de nmeros a las distintas categoras no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre stas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin, como por ejemplo la mediana. Ejemplo Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada, estamos llevando una escala ordinal, es decir que al primeo en llegar le asignamos el N 1, al siguiente el N 2 y as sucesivamente, de esta forma, cada nmero representar una categora. Escalas de intervalos iguales La escala de intervalos iguales, est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin Ejemplo El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001. Escala de Razn
El nivel de medida ms elevado es el de
cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo Siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. Ejemplo En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos. Las variables y su medicin
Una variable es un smbolo, tal como
X, Y, H, B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta". Por intuicin y por experiencia sabemos que pueden distinguirse dos tipos de variables: las continuas y las discretas. Variables continuas
Se caracterizan por el hecho de que para todo
par de valores siempre se puede encontrar un valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Variables discretas Son aquellas que pueden tomar slo un nmero limitado de valores separados y no continuos. Son aquellas que slo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro Ejemplo El nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... ntese que no encontramos valor como 1,5 estudiantes Fuentes de datos Estadsticos Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a travs de fuentes primarias y fuentes secundarias. Fuentes de datos primarias Es la persona o institucin que ha recolectado directamente los datos. Fuentes secundarias
Son las publicaciones y trabajos hechos por
personas o entidades que no han recolectado directamente la informacin. En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima instancia cuando estas no existan, usar estadsticas de fuentes secundarias La calidad de las conclusiones estadsticas depende en grado sumo de la exactitud de los datos que se recaben. De nada servira usar tcnicas estadsticas precisas y refinadas para llegar a conclusiones valederas, si estas tcnicas no son aplicadas a datos adecuados o confiables.