Está en la página 1de 9

TECSUP

Estadstica

UNIDAD

ESTADSTICA

1.

INTRODUCCIN
El uso de los mtodos estadsticos para analizar datos se ha
convertido en una prctica comn en todas las disciplinas cientficas.
Este material de ayuda pretende introducir mtodos que utilizan los
estudiantes en sus carreras de formacin tecnolgica.
La exposicin matemtica es relativamente modesta. El uso sustancial
del clculo se hace slo en el captulo de probabilidades. No se utiliza
lgebra matricial en absoluto. Por lo tanto, casi toda la exposicin
deber ser accesible para aquellos estudiantes cuyo conocimiento en
matemtica es bsico.
La unidad 1 se inicia con algunos conceptos y terminologa bsicos
(poblacin, muestra, estadstica descriptiva e inferencial, variables y
tipos) y contina con la elaboracin de tablas de frecuencia para
variables cualitativas y cuantitativas y grficos importantes. La unidad
2 corres
ponde a las medidas resumen de posicin y de dispersin. La unidad 3
se estudia el anlisis de dos variables: cualitativas vs cualitativas,
cualitativas vs cuantitativas y cuantitativas vs cuantitativas, adems
de grficos importantes. En el captulo 4 se ofrece el desarrollo un
tanto tradicional de la probabilidad, la probabilidad condicional, la
probabilidad total y el teorema de Bayes.
I.

CONCEPTOS BSICOS

1.1

POBLACIN Y MUESTRA

A fin de entender cmo se puede aplicar los mtodos


estadsticos, se debe distinguir entre poblacin y muestra. Una
poblacin o universo es cualquier coleccin finita o infinita de
individuos o elementos, para cada uno de los cuales se tiene que
contar o medir una o varias caractersticas. Los elementos son
los objetos que poseen la informacin que busca el investigador

55

Matemtica II

TECSUP - PFR

y acerca del cual deben hacerse las inferencias. Entre posibles


elementos se tiene: una sustancia, un compuesto, un mineral,
etc.
Aunque existe la libertad de llamar poblacin a un grupo
cualquiera de elementos definidos en el tiempo y el
espacio, en la prctica depende del contexto en el cual se
observarn los elementos. Suponga, por ejemplo, el nmero
de total de compuestos que pueden elaborarse con 5
sustancias, puede considerarse como una poblacin.
Una muestra es un subconjunto de elementos de la
poblacin que puede servir de base para generalizaciones
vlidas En trabajos qumicos, se toman muestras de un
material, se ensayan y se hacen deducciones para la
totalidad de dicho material, a partir de los resultados
obtenidos. La muestra no es exactamente la poblacin, sino
que se supone que la representa, y la validez de cualquier
conclusin obtenida de ella depende de la verdadera
representatividad que tenga.
La muestra debera ser seleccionada en forma aleatoria, es
decir, ca- da elemento tiene una probabilidad conocida y no
nula de seleccin. No siempre es posible obtener una
muestra aleatoria. Esto es especialmente cierto cuando el
estadstico puede confiar en su propio juicio o
conveniencia al seleccionar los elementos de la muestra.
Con la aleatoriedad se per- sigue que la muestra sea
representativa de la poblacin, para que concentre todas
las caractersticas y particularidades de inters. Sin
embargo, la aleatoriedad no garantiza necesariamente la
representatividad.
Los factores que determinan la seleccin de muestras son:
costo, tiempo y la imposibilidad prctica (o destruccin de
la unidad de estudio). En tanto, el tamao de la muestra
queda determinado por la variabilidad de la poblacin, el
nivel de confianza y el error mximo permisible. Cuando los
elementos de una poblacin tienen cierto grado de
heterogeneidad entre ellos, el tamao de la muestra tiende
a ser grande. Cabe destacar, que es completamente
errneo asegurar que la muestra depende del tamao de la
poblacin.

56

TECSUP

Estadstica

Cuando se hace una investigacin con todos los elementos de la


poblacin, se llama censo o enumeracin total. En tanto, cuando
se ela- bora con base en una muestra, se le denomina estudio por
muestreo. En la mayora de los casos los qumicos no estn
interesados en los datos de enumeracin total (o censo) sino en
datos muestrales.

1.2

ESTADSTICA
Disciplina que nos proporciona un conjunto de mtodos y
procedimientos que nos permitan recopilar, clasificar, presentar
y describir datos en forma adecuada para tomar decisiones
frente a la incertidumbre o predecir o afirmar algo acerca de la
poblacin a partir de los datos extrados de la misma.
Esta definicin nos permite distinguir la Estadstica Descriptiva
de la Inferencial.
La estadstica descriptiva se puede definir como los mtodos
estadsticos que pretenden describir las caractersticas ms
importantes de un conjunto de datos, sea que provenga de una
muestra o de una poblacin. Utiliza tcnicas estadsticas, como
la representacin grfica, cuadros estadsticos, medidas de
posicin y de variabilidad.
Uno de los propsitos fundamentales de los mtodos
estadsticos es utilizar estadsticos muestrales para estimar los
parmetros de la poblacin. A este proceso de utilizar los
estadsticos muestrales para llegar a conclusiones acerca de los
verdaderos parmetros de la poblacin, se le llama inferencia
estadstica.
La estadstica inferencial generaliza los resultados
observados en una muestra a toda la poblacin bajo estudio,
por medio del planteamiento y pruebas de hiptesis y clculo de
intervalos de confianza; se aplica a pro- blemas como estimar,
mediante pruebas, el rendimiento promedio de un proceso
qumico, verificar las especificaciones de produccin a partir de
mediciones efectuadas sobre muestras o predecir los residuos
de cloro en una piscina basndose en una muestra de datos
tomados en ciertos perio- dos de tiempo.

1.3

CICLO METODOLGICO DE UN TRABAJO ESTADSTICO


Cuando no sea posible obtener una informacin completa de la
poblacin, se extraen muestras representativas de dicha
poblacin mediante las tcnicas de muestreo, y en base al
estudio o informacin obtenidas de los datos muestrales se

57

Matemtica II

TECSUP - PFR

afirma algo acerca de la poblacin total o se toman decisiones


generales confiables con ayuda de la Estadstica Inferencial.
Este ciclo se cumple en la mayora de las veces del quehacer
estadstico

1.4

VARIABLES
Se dice que algo vara si puede tomar por lo menos dos
valores, grados o formas o, incluso, cuando una caracterstica
puede estar presente o ausente en una situacin especfica.
Dicho esto, podramos estar de acuerdo en que nociones como
sexo, nmero de hijos por familia, color de automvil, nmero
de huelgas anuales, nivel de estudios, etc., son variables, ya
58

TECSUP

Estadstica

que son caractersticas que admiten por lo menos dos valores,


grados o formas dentro de un universo determinado.
No obstante, la prctica docente ensea que, al empezar a
familiarizarse con este tema, los alumnos suelen confundir la
caracterstica que admite variaciones con el universo o con los
elementos del mismo. Comprese la lista del prrafo anterior
con esta otra: persona, vivienda, lmpara, automvil. Estos
trminos se refieren a objetos y no a caractersticas de objetos;
por lo tanto, no son variables. Variables seran las
caractersticas que quisiramos indagar de esos objetos. Por
ejemplo, de un universo formado por personas podramos
conocer su edad, lugar de nacimiento, nivel de escolaridad,
clase social a que pertenecen, etc. Estas peculiaridades son
variables. Tambin son variables, de un universo formado por
automviles, su marca, modelo, color, potencia, etc., ya que
son caractersticas que van cambiando de auto en auto.
Otra confusin frecuente se da con los datos estadsticos.
Consideremos estos ejemplos: "nmero de huelgas" y
"produccin de azcar". Si decimos que el nmero de huelgas
en una regin y en un periodo determinados es A, estamos
aportando informacin global del fenmeno, que es un dato
estadstico, no una variable. El nmero de huelgas se convierte
en variable si se estudia, digamos, en un periodo determinado
y en diferentes regiones, o en una sola regin y en diferentes
periodos (anualmente, sexenalmente, etc.). Lo mismo pasa si
afirmamos que la produccin de azcar en el ingenio X es B
toneladas: se trata de un dato estadstico, no de una variable.
La produccin de azcar se convertir en variable cuando se
indague en diferentes fbricas y en un mismo momento o en
una misma fbrica y en distintos momentos.
Ahora bien, toda variable tiene dos niveles: uno conceptual o
terico y otro operacional o de medicin. Si nos preguntaran
qu se entiende por alcoholismo, por ejemplo, podramos decir
que se trata de una enfermedad progresiva y mortal, exclusiva
de los seres humanos, que consiste en la ingestin de bebidas
alcohlicas. De ser ms o menos correcta esta definicin,
estaramos en el nivel estrictamente conceptual o terico, que
no permite efectuar ninguna medicin. Si, en cambio, a partir
de este concepto definimos al alcoholismo como el grado de
dependencia de los seres humanos respecto a la ingestin de
bebidas alcohlicas, habremos pasado del nivel conceptual a
otro donde es posible medir, pues en una poblacin dada
encontraramos desde el que no ha bebido jams una gota de
alcohol, el abstemio, hasta el que no puede dejar de beber.
La correspondencia entre el nivel terico y el operacional de
una variable se consigue mediante un procedimiento llamado
medicin, que no debe entenderse como un procedimiento
arbitrario de asignacin de nmeros u otros smbolos a las
observaciones: esta asignacin se efecta en concordancia con
un conjunto de procedimientos admisibles para la variable
conceptual que s est manejando.

59

Matemtica II

TECSUP - PFR

A nivel operacional o de medicin, variable es un conjunto de


nmeros u otros smbolo; asignados a las observaciones, que
sirven para clasificarlas con respecto a una variable conceptual
Sin embargo, no ahondaremos en esta cuestin; ser suficiente,
por ahora, que sepamos identifica] variables, ya que del tipo a
que pertenezcan depender el procedimiento estadstico con
que se le; trate, tema que estudiaremos ms adelante.

Tipos de variables
Segn su naturaleza las variables pueden clasificarse
en:
a) Variables cuantitativas, son aquellas que consisten de
nmeros que representan conteos o mediciones. Las variables
cuantitativas pueden ser: Discreta, corresponde al conteo o
numeracin de sucesos. Ejemplos: nmero de computadores en
un aula, nmero de artculos defectuosos en un embarque,
nmero de hijos por familia, etc.
Continua, corresponde a mediciones y por tanto sus valores
estn comprendidosen un intervalo ya que entre dos valores
existen infinitos valores intermedios.
Ejemplos: contenido neto en gramos en una lata de caf,
dimetro de un tornillo, ingreso familiar, etc.
b) Variables cualitativas se dividen en diferentes categoras
que se distinguen por alguna caracterstica no numrica.
Ejemplos: genero, nivel socio econmico, grado de instruccin,
etc.
Observacin:
Los
datos
pueden
estar
codificados
numricamente, sin que ello signifique que sea una variable
cuantitativa.
Ejemplo. Clasifica las siguientes variables:
Marca de detergente que una ama de casa usa.
El grado de instruccin.
Nmero de artculos defectuosos producidos por una
mquina en un periodo de dos horas.
La longitud de 1000 tornillos con arandela y tuerca.
Segn la funcin que cumplen en el estudio:
Una distincin de particular importancia es aquella entre
variables dependientes e independientes. Los trminos
dependiente e independiente se utilizan para representar
una relacin de causalidad entre dos variables.
60

TECSUP

Estadstica

El problema de la determinacin de causalidad (cules


variables son dependientes y cules independientes?) es uno
de los problemas ms serios que enfrenta la estadstica. El
anlisis emprico o estadstico slo puede decirnos si dos
variables parecen estar relacionadas, pero no puede decirnos:
(a) si de hecho existe una relacin de dependencia y (b) cul
es la direccin de dicha relacin (cul es la causa y cul el
efecto o la variable causada). Necesitamos una teora para
dar plausibilidad a una relacin emprica.
Independiente (X):
Una variable independiente es aquella cuyo valor no depende
del de otra variable. La variable independiente se representa en
el eje de abscisas. Son las que el investigador escoge para
establecer
agrupaciones
en
el
estudio,
clasificando
intrnsecamente a los casos del mismo.
Es aquella caracterstica o propiedad que se supone ser la
causa del fenmeno estudiado. En investigacin experimental
se llama as a la variable que el investigador manipula.
Dependiente (Y):
Una variable dependiente es aquella cuyos valores dependen
de los que tomen otra variable. La variable dependiente en una
funcin se suele representar por y. La variable dependiente se
representa en el eje ordenadas. Son las variables de respuesta
que se observan en el estudio y que podran estar influidas por
los valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o caracterstica
que se trata de cambiar mediante la manipulacin de la
variable independiente.
La variable dependiente es el factor que es observado y medido
para determinar el efecto de la variable independiente.
Considere la siguiente cuestin: Es el aumento del ingreso per
capita de un pas que causa mejoras en el nivel de educacin o
la mejora en el nivel de educacin que causa mejoras en el
ingreso per capita? O tal vez un tercer factor es la causa de
ambos? Cultura? Este complejo y viejo debate no se puede
resolver slo sobre la base del anlisis estadstico, aunque la
estadstica es un importante instrumento en nuestros continuos
esfuerzos por dilucidar estas cuestiones. El debate mencionado
ha persistido por dcadas, adems, porque muchas de las
teoras que han sido propuestas para explicar la relacin entre
educacin y desarrollo econmico no pueden ser refutadas slo
sobre la base del anlisis emprico.
1.5 ESCALAS DE MEDICIN
La medicin de una variable consiste en asignar un valor a la
caracterstica o propiedad observada. Por ejemplo, si la caracterstica
observada es el gnero de las personas, al clasificar a una persona
como de sexo femenino le estamos asignando un valor, estamos
haciendo una medicin de la caracterstica.
El proceso de medicin utiliza diversas escalas: Nominal, Ordinal,
Intervalo y Razn.

61

Matemtica II

TECSUP - PFR

Escala Nominal: Slo permite asignar un nombre, etiqueta o valor al


elemento sometido a medicin. Los nmeros que se puedan asignar a
las propiedades observadas en los elementos se utilizan slo como
etiquetas con la finalidad de clasificarlos. Con esta escala no tiene
sentido realizar operaciones aritmticas.
Por ejemplo:
Gnero (femenino, masculino), nacionalidad (peruano, colombiano,
etc.), marcas de gaseosa preferida (fanta, coca cola, pepsi etc).
Escala Ordinal: Adems de asignar un nombre, etiqueta o valor,
esta escala permite establecer un orden entre los elementos
sometidos a medicin. Con esta escala solo se puede establecer una
relacin de orden. Los nmeros que se asignen a las propiedades
deben respetar el orden de la caracterstica que se mide.
Cada categora puede ser comparada con otra en relacin de mayor
que o menor que.
Por ejemplo:
Grado de satisfaccin (alto, medio, bajo), estado de salud (bueno,
regular, malo), grado de instruccin (primaria, secundaria, superior).
Escala de Intervalo: Adems de asignar un nombre o etiqueta y
establecer un orden entre los elementos, esta escala permite calcular
diferencias entre los nmeros asignados a las mediciones (el intervalo
entre observaciones que se expresa en trminos de una unidad fija de
medida).
Los datos de intervalo siempre son numricos.
En esta escala el cero es relativo, es decir, no indica la ausencia de la
caracterstica medida
Por ejemplo:
Temperatura (se puede medir en grado Celsius grado Fahrenheit),
ao calendario (el ao puede referirse al calendario gregoriano
calendario chino), en el caso de la escala de intervalos podemos
asignar el cero a cualquier valor posible (el cero es arbitrario).
Escala de Razn: Una variable est medida en escala de razn si los
datos tienen todas las propiedades de los datos de intervalo y el
cociente de los dos valores es significativa. La escala de medicin de
razn tiene las propiedades de la escala de intervalo con la propiedad
adicional de tener un punto de partida natural o cero (cero absoluto),
que indica que ausencia de la variable (no existe nada para una
variable).
Para esta escala de medicin, es posible establecer una relacin de
proporcionalidad entre sus distintos valores, es decir el cociente de
los valores es significativo.
Por ejemplo:
Costo de un automvil, nmero de aprobados, nmero de
artculos defectuosos.
2.

ESTADSTICA DESCRIPTIVA
62

TECSUP

Estadstica

La estadstica descriptiva se ocupa de la recopilacin, clasificacin,


presentacin y descripcin de los datos.
RECOPILACIN
Los datos pueden recopilarse de dos maneras fundamentales:
a) Si se consideran todos los elementos de la poblacin y se
registran sus caractersticas se denomina censo.
b) Si se seleccionan algunos elementos de la poblacin, pero no
todos, se denomina muestra y la informacin obtenida por
este procedimiento se llama por muestreo; si la recopilacin
de los elementos muestrales se efecta al azar se dice que el
muestreo es aleatorio y la muestra se denomina muestra
aleatoria.
Un ejemplo de una recopilacin completa o censo es el Censo
Poblacional del Per realizado en el ao 1993.
CLASIFICACIN
Los datos obtenidos por observacin o medicin suelen ser
registrados en el orden en que se recopilan. Para facilitar su
interpretacin y el anlisis correspondiente deben ser clasificados y
esto equivale a que los datos deben ser organizados de alguna
manera sistemtica o particionado en clases bien definidas y una
manera sencilla de hacerlo es ordenar los datos segn su magnitud o
agruparlos de acuerdo a sus caractersticas.
PRESENTACIN DE DATOS
Una vez recolectados los datos y optado por su posible
clasificacin es necesario presentarlos en forma tal que se
facilite su comprensin y su posterior anlisis. Para ello se
ordenan en cuadros numricos llamados TABLAS (Tablas de
frecuencias) y luego se presentan mediante GRFICAS (de
barras, sectores circulares, histograma, polgono de frecuencias,
ojiva, pictograma, etc.)

63

También podría gustarte