Está en la página 1de 92

Conceptos Bsicos

Estadstica

Kendall y Buckland (citados por Gini V. Glas / Julian C.


Stanley, 1980) definen la estadstica como un valor
resumido, calculado, como base en una muestra de
observaciones que generalmente, aunque no por necesidad,
se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de
muestra.
"La estadstica es una tcnica especial apta para el estudio
cuantitativo de los fenmenos de masa o colectivo, cuya
mediacin requiere una masa de observaciones de otros
fenmenos ms simples llamados individuales o particulares".
(Gini, 1953).
Murria R. Spiegel, (1991) dice: "La estadstica estudia
los mtodos cientficos para recoger, organizar, resumir
y analizar datos, as como para sacar conclusiones
vlidas y tomar decisiones razonables basadas en tal
anlisis.
"La estadstica es la ciencia que trata de la recoleccin,
clasificacin y presentacin de los hechos sujetos a una
apreciacin numrica como base a la explicacin,
descripcin y comparacin de los fenmenos". (Yale y
Kendal, 1954).
Cualquiera sea el punto de vista, lo
fundamental es la importancia cientfica que
tiene la estadstica, debido al gran campo de
aplicacin que posee.
En la estadstica tiene un papel
destacado la nocin de muestra
aleatoria.
Una muestra aleatoria de tamao n es:

Una coleccin de n variables


aleatorias.
Todas con la misma distribucin.
Todas independientes.
La coleccin de donde extraemos la muestra
aleatoria, se denomina POBLACIN
INFERENCIA

Este trmino lo usamos en estadstica


para denotar al procedimiento con el
que hacemos afirmaciones acerca de
valores generales de la poblacin
mediante los nmeros que
observamos en la muestra.
Ejemplo

Suponga que observamos el proceso de fabricacin de


las ``bolitas'' que se le ponen al envase de los
desodorantes ``roll on''. No todas las bolitas van a
tener el mismo dimetro, si escogemos, al azar una
bolita, tendremos un valor para el dimetro que es una
variable aleatoria.
Podemos suponer que los dimetros tienen la
distribucin normal, debido a nuestra
experiencia con el proceso, conocemos que la
desviacin estndar de la poblacin es de 4
mm (aproximadamente). Pero, tambin por
experiencia, sabemos que el dimetro
promedio puede variar por desajuste de la
maquinaria productora
Una POBLACIN, que son todas las bolitas que se
producen.

Un PARMETRO de la poblacin conocido (o casi) que


es la desviacin estndar.

Otro PARMETRO cuyo valor es desconocido: la media .


Para tratar de conocer el valor del
parmetro que desconocemos, tomamos
una MUESTRA de las bolitas
Supongamos que son 100 bolitas en la
muestra. Con un instrumento de
precisin, y con mucho cuidado,
medimos los dimetros de las 100 bolitas
de la muestra y calculamos su promedio.
Qu nos dice el valor de la media de
la muestra respecto a la media de la
poblacin?
Por un lado, definitivamente la media de
la muestra NO va a ser igual a la de la
poblacin.
Por otra parte, no tenemos mejor
informacin respecto a la media de la
poblacin que la que extraigamos de la
muestra. Cualquier otra informacin no
pasa de chisme.
Por ltimo, sera muy extrao que si la
poblacin de bolitas tiene, por decir algo, un
dimetro promedio de 45 mm, nos tocaran
100 bolitas en la muestra con un promedio
de, digamos, 32 mm. Fjese que no decimos
imposible sino raro o extrao.
Adems, si alguien nos preguntara
como cunto es el dimetro promedio
de la poblacin de bolitas? Le
contestaramos diciendo el valor que
hayamos visto en la muestra.
A nuestra contestacin debamos
agregarle alguna advertencia como: "ms
o menos'', o ``aproximadamente''.
A un valor calculado con los datos de una
muestra lo llamamos ESTADSTICA.
Cuando usamos una estadstica para estimar,
el valor de un parmetro de la poblacin, le
llamamos ESTIMADOR. Cuando andamos
un poco pedantes le llamamos
ESTIMADOR PUNTUAL (al decir
puntual'' queremos decir que para estimar el
parmetro estamos usando un valor nico).
Regresando a las bolitas del ``Roll on''.
Si la muestra de 100 bolitas arroja un
valor del promedio de 43.5 mm,
diramos que estimamos el promedio de
la poblacin en 43.5 mm.
Poblacin

El concepto de poblacin en estadstica va


ms all de lo que comnmente se conoce
como tal. Una poblacin se precisa como un
conjunto finito o infinito de personas u
objetos que presentan caractersticas
comunes.
"Una poblacin es un conjunto de
todos los elementos que estamos
estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin
& Rubin (1996).
"Una poblacin es un conjunto de
elementos que presentan una caracterstica
comn". Cadenas (1974).
El tamao que tiene una poblacin es
un factor de suma importancia en el
proceso de investigacin estadstica, y
este tamao vienen dado por el nmero
de elementos que constituyen la
poblacin, segn el nmero de
elementos la poblacin puede ser:
finita o infinita
Poblacin infinita

Cuando el nmero de elementos que integra


la poblacin es muy grande, se puede
considerar a esta como una poblacin
infinita, por ejemplo; el conjunto de todos
los nmeros positivos.
Poblacin finita

Una poblacin finita es aquella que est


formada por un limitado nmero de
elementos, por ejemplo: el nmero de
estudiantes de la Facultad de Ingeniera
Industrial de la UNMSM
Es a menudo imposible o poco prctico
observar la totalidad de los individuos, sobre
todos si estos son muchos. En lugar de
examinar el grupo entero llamado poblacin
o universo, se examina una pequea parte del
grupo llamada muestra
Muestra

"Se llama muestra a una parte de la


poblacin a estudiar que sirve para
representarla". Murria R. Spiegel
(1991)
"Una muestra es una coleccin de
algunos elementos de la poblacin,
pero no de todos". Levin & Rubin
(1996).
"Una muestra debe ser definida en base
de la poblacin determinada, y las
conclusiones que se obtengan de dicha
muestra solo podrn referirse a la
poblacin en referencia", Cadenas
(1974).
Ejemplo

El estudio realizado a 50 miembros del


Colegio de Ingenieros del Per.
El estudio de muestras es ms sencillo
que el estudio de la poblacin
completa; cuesta menos y lleva menos
tiempo
Se a probado que el examen de una
poblacin entera todava permite la
aceptacin de elementos defectuosos, por
tanto, en algunos casos, el muestreo puede
elevar el nivel de calidad.
Una muestra representativa contiene
las caractersticas relevantes de la
poblacin en las mismas
proporciones que estn incluidas en
tal poblacin.
Muestra y poblacin son conceptos
relativos. Una poblacin es un todo y
una muestra es una fraccin o segmento
de ese todo.
Muestreo

El muestreo es una tcnica que sirve para


obtener una o ms muestras de poblacin.
Al tomar varias muestras de una
poblacin, las estadsticas que
calculamos para cada muestra no
necesariamente seran iguales, y lo ms
probable es que variarn de una muestra
a otra.
Tipos de muestreo

Existen dos mtodos para seleccionar muestras


de poblaciones: el muestreo no aleatorio o de
juicio y el muestreo aleatorio o de
probabilidad
Muestreo aleatorio o de probabilidad

En este muestreo todos los elementos de la


poblacin tienen la misma oportunidad de
ser escogidos en la muestra
Muestreo no aleatorio o de juicio
Una muestra seleccionada por muestreo de juicio se
basa en la experiencia de alguien con la poblacin.
Algunas veces una muestra de juicio se usa como
gua o muestra tentativa para decidir como tomar
una muestra aleatoria ms adelante.
Las muestras de juicio evitan el anlisis
estadstico necesarios para hacer
muestras de probabilidad.
Variables

Las variables, tambin suelen ser


llamados caracteres cuantitativos,
son aquellos que pueden ser
expresados mediante nmeros. Son
caracteres susceptibles de medicin.
Como por ejemplo, la estatura, el
peso, el salario, la edad, etc
Segn, Murray R. Spiegel, (1992) "una
variable es un smbolo, tal como X, Y, Z,
que puede tomar un valor cualquiera de un
conjunto determinado de ellos, llamado
dominio de la variable
Constante

Si la variable puede tomar solamente un


valor, se llama constante."
Todos los elementos de la poblacin poseen
los mismos tipos de caracteres, pero como
estos en general no suelen representarse
con la misma intensidad, es obvio que las
variables toman distintos valores. Por lo
tanto estos distintos nmeros o medidas que
toman los caracteres son los "valores de la
variable". Todos ellos juntos constituyen
una variable
Atributo
Los atributos tambin llamados caracteres
cualitativos, son aquellos que no son
susceptibles de medicin, es decir que no
se pueden expresar mediante un nmero.
IUTIN (1997). "Reciben el nombre de
variables cualitativas o atributos,
aquellas caractersticas que pueden
presentarse en individuos que
constituyen un conjunto.
La forma de expresar los atributos es
mediante palabras, por ejemplo: profesin,
estado civil, sexo, nacionalidad, etc. Puede
notar que los atributos no se presentan en la
misma forma en todos los elementos.
Las distintas formas en que se presentan
los atributos reciben el nombre de
"modalidades".
Ejemplo

El estado civil de cada uno de los docentes


en la Facultad de Ingeniera industrial, no se
presenta en la misma modalidad en todos.
Encuesta

Se entiende por encuesta las observaciones


realizadas por muestreo, es decir son
observaciones parciales.
El diseo de encuestas parte de la premisa
de que si queremos conocer algo sobre el
comportamiento de las personas, lo mejor,
ms directo y simple es preguntrselo
directamente a ellas. (Cadenas, 1974).
Segn Antonio Napolitano "La
encuesta, es un mtodo mediante el
cual se quiere averiguar. Se efecta a
travs de cuestionarios verbales o
escritos que son aplicados a un gran
nmero de personas".
Estadstica Descriptiva

Tiene por objeto fundamental describir y


analizar las caractersticas de un conjunto
de datos, obtenindose de esa manera
conclusiones sobre las caractersticas de
dicho conjunto y sobre las relaciones
existentes con otras poblaciones, a fin de
compararlas
Estadstica Inductiva o Inferencial

Est fundamentada en los resultados


obtenidos del anlisis de una muestra de
poblacin, con el fin de inducir o inferir
el comportamiento o caracterstica de la
poblacin, de donde procede, por lo que
recibe tambin el nombre de Inferencia
estadstica.
Segn Berenson y Levine; Estadstica
Inferencial son procedimientos
estadsticos que sirven para deducir o
inferir algo acerca de un conjunto de datos
numricos (poblacin), seleccionando un
grupo menor de ellos (muestra).
El objetivo de la inferencia en
investigacin cientfica y tecnolgica
radica en conocer clases numerosas de
objetos, personas o eventos a partir de
otras relativamente pequeas compuestas
por los mismos elementos.
Ejemplo de estadstica descriptiva

Supngase que un profesor calcula la calificacin


promedio de un grupo de alumnos del curso de Dibujo
Industrial. Como la estadstica describe el desempeo
del grupo pero no hace ninguna generalizacin acerca
de los diferentes grupos, podemos decir que el profesor
est utilizando estadstica descriptiva. Grficas, tablas y
diagramas que muestran los datos de manera que sea
ms fcil su entendimiento son ejemplos de estadstica
descriptiva.
Ejemplo de Estadstica Inferencia

Supngase ahora que el profesor de Dibujo


Industrial decide utilizar el promedio de
calificaciones obtenido por uno de sus grupos
para estimar la calificacin promedio de los
diez grupos del mismo curso de Dibujo
Industrial. El proceso de estimacin de tal
promedio sera un problema concerniente a la
estadstica inferencial.
Medicin de Caracteres

Existen diversas definiciones del trmino


"medicin", pero estas dependen de los
diferentes puntos de vista que se puedan
tener al abordar el problema de la
cuantificacin y el proceso mismo de la
construccin de una escala o instrumento de
medicin.
Medicin
Se entiende por medicin la asignacin
de nmeros a elementos u objetos para
representar o cuantificar una propiedad
Por medio de la medicin, los atributos
de nuestras percepciones se transforman
en entidades conocidas y manejables
llamadas "nmeros"
Es evidente que el mundo resultara
catico si no pudiramos medir nada. En
este caso cabra preguntarse de que le
servira al fsico saber que el hierro tiene
una alta temperatura de fusin.
Niveles o Escalas de mediciones

Escala Nominal

La escala de medida nominal, puede considerarse la


escala de nivel ms bajo, y consiste en la asignacin,
puramente arbitraria de nmeros o smbolos a cada
una de las diferentes categoras en las cuales podemos
dividir el carcter que observamos, sin que puedan
establecerse relaciones entre dichas categoras, a no
ser el de que cada elemento pueda pertenecer a una y
solo una de estas categoras.
Se trata de agrupar objetos en clases, de
modo que todos los que pertenezcan a la
misma sean equivalentes respecto del
atributo o propiedad en estudio, despus de
lo cual se asignan nombres a tales clases, y
el hecho de que a veces, en lugar de
denominaciones, se le atribuyan nmeros,
puede ser una de las razones por las cuales
se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los
estudiantes de la UNMSM de acuerdo a la carrera que
cursan

Carrera Nmero asignada


a la categora
Educacin 25
Administracin 27
Se ha de tener presente que los
nmeros asignados a cada categora
sirven nica y exclusivamente para
identificar la categora y no poseen
propiedades cuantitativas
Escala Ordinal

En caso de que puedan detectarse diversos


grados de un atributo o propiedad de un
objeto, la medida ordinal es la indicada, puesto
que entonces puede recurrirse a la propiedad
de "orden" de los nmeros asignndolo a los
objetos en estudio de modo que, si la cifra
asignada al objeto A es mayor que la de B,
puede inferirse que A posee un mayor grado de
atributo que B.
La asignacin de nmeros a las distintas
categoras no puede ser completamente
arbitraria, debe hacerse atendiendo al
orden existente entre stas.
Los caracteres que posee una escala de
medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus
categoras, el clculo de las medidas
estadsticas de posicin, como por ejemplo
la mediana.
Ejemplo
Al asignar un nmero a los pacientes de una
consulta mdica, segn el orden de llegada,
estamos llevando una escala ordinal, es decir
que al primeo en llegar le asignamos el N 1,
al siguiente el N 2 y as sucesivamente, de
esta forma, cada nmero representar una
categora.
Escalas de intervalos iguales
La escala de intervalos iguales, est
caracterizada por una unidad de medida
comn y constante que asigna un nmero
igual al nmero de unidades equivalentes
a la de la magnitud que posea el elemento
observado.
Es importante destacar que el punto
cero en las escalas de intervalos iguales
es arbitrario, y no refleja en ningn
momento ausencia de la magnitud que
estamos midiendo
Esta escala, adems de poseer las
caractersticas de la escala ordinal,
encontramos que la asignacin de los
nmeros a los elemento es tan precisa
que podemos determinar la magnitud de
los intervalos (distancia) entre todos los
elementos de la escala.
Sin lugar a dudas, podemos decir que la
escala de intervalos es la primera escala
verdaderamente cuantitativa y a los caracteres
que posean esta escala de medida pueden
calculrsele todas las medidas estadsticas a
excepcin del coeficiente de variacin
Ejemplo
El lapso transcurrido entre 1998-1999 es
igual al que transcurri entre 2000-2001.
Escala de Razn

El nivel de medida ms elevado es el de


cocientes o razones, y se diferencia de las
escalas de intervalos iguales nicamente por
poseer un punto cero propio como origen; es
decir que el valor cero de esta escala
significa ausencia de la magnitud que
estamos midiendo
Siendo que cero ya no es arbitrario, sino
un valor absoluto, podemos decir que A
tiene dos, tres o cuatro veces la magnitud
de la propiedad presente en B.
Ejemplo
En una encuesta realizada en un barrio de
esta localidad se observ que hay
familias que no tienen hijos, otras tienen
6 hijos que es exactamente el doble de
hijos que aquellas que tienen 3 hijos.
Las variables y su medicin

Una variable es un smbolo, tal como


X, Y, H, B, que pueden tomar un
conjunto prefijado de valores, llamado
dominio de esa variable
Para Murray R. Spiegel (1991) "una
variable que puede tomar cualquier valor
entre dos valores dados se dice que es
una variable continua en caso contrario
diremos que la variable es discreta".
Por intuicin y por experiencia sabemos que
pueden distinguirse dos tipos de variables:
las continuas y las discretas.
Variables continuas

Se caracterizan por el hecho de que para todo


par de valores siempre se puede encontrar un
valor intermedio, (el peso, la estatura, el
tiempo empleado para realizar un trabajo, etc.)
Una variable es continua, cuando puede
tomar infinitos valores intermedios
dentro de dos valores consecutivos. Por
ejemplo, la estatura, el peso, la
temperatura.
Variables discretas
Son aquellas que pueden tomar slo un
nmero limitado de valores separados y
no continuos.
Son aquellas que slo toman un
determinado nmeros de valores, porque
entre dos valores consecutivos no
pueden tomar ningn otro
Ejemplo
El nmero de estudiantes de una clase
es una variable discreta ya que solo
tomar los valores 1, 2, 3, 4... ntese
que no encontramos valor como 1,5
estudiantes
Fuentes de datos Estadsticos
Los datos estadsticos necesarios para la
comprensin de los hechos pueden
obtenerse a travs de fuentes primarias y
fuentes secundarias.
Fuentes de datos primarias
Es la persona o institucin que ha
recolectado directamente los datos.
Fuentes secundarias

Son las publicaciones y trabajos hechos por


personas o entidades que no han recolectado
directamente la informacin.
En la prctica, es aconsejable utilizar
fuentes de datos primarias y en ltima
instancia cuando estas no existan, usar
estadsticas de fuentes secundarias
La calidad de las conclusiones estadsticas
depende en grado sumo de la exactitud de los
datos que se recaben. De nada servira usar
tcnicas estadsticas precisas y refinadas para
llegar a conclusiones valederas, si estas
tcnicas no son aplicadas a datos adecuados o
confiables.

También podría gustarte