Está en la página 1de 14

Estadsticas | 2017

ESTADISTICAS

UNIDAD I: INTRODUCCION A LA ESTADISTICA

ESTADISTICA

CONCEPTO

La Estadstica es una disciplina que utiliza recursos matemticos para


organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir
conclusiones respecto de ellos.

Por ejemplo, la estadstica interviene cuando se quiere conocer el estado


sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad
o mortalidad de la poblacin.

En este caso la estadstica describe la muestra en trminos de datos


organizados y resumidos, y luego infiere conclusiones respecto de la poblacin.

Aplicada a la investigacin cientfica, tambin infiere cuando provee los


medios matemticos para establecer si una hiptesis debe o no ser rechazada.

La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello


es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa,
sociologa, lingstica, demografa, etc.

POBLACION Y MUESTRA

Puesto que la estadstica se ocupa de una gran cantidad de datos, debe


primeramente definir de cules datos se va a ocupar. El conjunto de datos de los
cuales se ocupa un determinado estudio estadstico se llama poblacin.

No debe confundirse la poblacin en sentido demogrfico y la poblacin


en sentido estadstico.

La poblacin en sentido demogrfico es un conjunto de individuos (todos


los habitantes de un pas, todas las ratas de una ciudad), mientras que una
poblacin en sentido estadstico es un conjunto de datos referidos a determinada

1
Estadsticas | 2017

caracterstica o atributo de los individuos (las edades de todos los individuos de


un pas, el color de todas las ratas de una ciudad).

Incluso una poblacin en sentido estadstico no tiene porqu referirse a


muchos individuos. Una poblacin estadstica puede ser tambin el conjunto de
calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios.

Los datos de la totalidad de una poblacin pueden obtenerse a travs de


un censo. Sin embargo, en la mayora de los casos no es posible obtenerlos por
razones de esfuerzo, tiempo y dinero, razn por la cual se extrae, de la poblacin,
una muestra, mediante un procedimiento llamado muestreo.

Se llama muestra a un subconjunto de la poblacin, preferiblemente


representativo de la misma.

Por ejemplo, si la poblacin es el conjunto de todas las edades de los


estudiantes de la provincia de Buenos Aires, una muestra ser conjunto de
edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar.

DATOS INDIVIDUALES Y DATOS ESTADISTICOS

Un dato individual es un dato de un solo individuo, mientras que un dato


estadstico es un dato de una muestra o de una poblacin en su conjunto. Por
ejemplo, la edad de Juan es un dato individual, mientras que el promedio de
edades de una muestra o poblacin de personas es un dato estadstico.

Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede
ser 37 aos, y el promedio de edades de la muestra donde est includo Juan es
23 aos.

Por esta razn un dato estadstico nada dice respecto de los individuos,
porque solamente describe la muestra o poblacin.

Los datos estadsticos que describen una muestra suelen llamarse


estadsticos (por ejemplo, el promedio de ingresos mensuales de las personas
de una muestra), mientras que los datos estadsticos descriptores de una
poblacin suelen llamarse parmetros (por ejemplo, el promedio de ingresos
mensuales de las personas de una poblacin).

2
Estadsticas | 2017

ESTRUCTURA DEL DATO

Los datos son la materia prima con que trabaja la estadstica, del mismo
modo que la madera es la materia prima con que trabaja el carpintero. As como
este procesa o transforma la madera para obtener un producto til, as tambin
el estadstico procesa o transforma los datos para obtener informacin til. Tanto
los datos como la madera no se inventan: se extraen de la realidad; en todo caso
el secreto est en recoger la madera o los datos ms adecuados a los objetivos
del trabajo a realizar.

De una manera general, puede definirse tcnicamente dato como una


categora asignada a una variable de una unidad de anlisis.

Por ejemplo, "Luis tiene 1.70 metros de estatura" es un dato, donde Luis
es la unidad de anlisis, estatura es la variable, y 1.70 metros es la categora
asignada.

Como puede apreciarse, todos datos tienen al menos tres componentes:


una unidad de anlisis, una variable y una categora.

La unidad de anlisis es el elemento del cual se predica una propiedad y


caracterstica. Puede ser una persona, una familia, un animal, una sustancia
qumica, o un objeto como una dentadura o una mesa.

La variable es la caracterstica, propiedad o atributo que se predica de la


unidad de anlisis.

Por ejemplo puede ser la edad para una persona, el grado de cohesin
para una familia, el nivel de aprendizaje alcanzado para un animal, el peso
especfico para una sustancia qumica, el nivel de salud para una dentadura, y
el tamao para una mesa.

Pueden entonces tambin definirse poblacin estadstica (o simplemente


poblacin) como el conjunto de datos acerca de unidades de anlisis (individuos,
objetos) en relacin a una misma caracterstica, propiedad o atributo (variable).

3
Estadsticas | 2017

Sobre una misma poblacin demogrfica pueden definirse varias


poblaciones de datos, una para cada variable. Por ejemplo, en el conjunto de
habitantes de un pas (poblacin demogrfica), puede definirse una poblacin
referida a la variable edad (el conjunto de edades de los habitantes), a la variable
ocupacin (el conjunto de ocupaciones de los habitantes), a la variable sexo (el
conjunto de condiciones de sexo de los habitantes).

La categora es cada una de las posibles variaciones de una variable.


Categoras de la variable sexo son masculino y femenino, de la variable
ocupacin pueden ser arquitecto, mdico, etc, y de la variable edad pueden ser
10 aos, 11 aos, etc.

Cuando la variable se mide cuantitativamente, es decir cuando se expresa


numricamente, a la categora suele llamrsela valor. En estos casos, el dato
incluye tambin una unidad de medida, como por ejemplo aos, cantidad de
hijos, grados de temperatura, cantidad de piezas dentarias, centmetros, etc. El
valor es, entonces, cada una de las posibles variaciones de una variable
cuantitativa.

LA MEDICION

Los datos se obtienen a travs un proceso llamado medicin. Desde este


punto de vista, puede definirse medicin como el proceso por el cual asignamos
una categora (o un valor) a una variable, para determinada unidad de anlisis.

Ejemplo: cuando decimos que Martn es varn, estamos haciendo una


medicin, porque estamos asignando una categora (varn) a una variable (sexo)
para una unidad de anlisis (Martn).

Se pueden hacer mediciones con mayor o menor grado de precisin.

Cuanto ms precisa sea la medicin, ms informacin nos suministra


sobre la variable y, por tanto, sobre la unidad de anlisis. No es lo mismo decir
que una persona es alta, a decir que mide 1,83 metros.

Los diferentes grados de precisin o de contenido informativo de una


medicin se suelen caracterizar como niveles de medicin. Tpicamente se

4
Estadsticas | 2017

definen cuatro niveles de medicin, y en cada uno de ellos la obtencin del dato
o resultado de la medicin ser diferente:

Ejemplos de datos en diferentes niveles de medicin

En el nivel nominal, medir significa simplemente asignar un atributo a una


unidad de anlisis (Martn es electricista).

En el nivel ordinal, medir significa asignar un atributo a una unidad de


anlisis cuyas categoras pueden ser ordenadas en una serie creciente o
decreciente (la categora secundaria completa puede ordenarse en una serie,
pues est entre secundaria incompleta y universitaria incompleta).

En el nivel cuantitativo, medir significa adems asignar un atributo a una


unidad de anlisis de modo tal que la categora asignada permita saber cunto
mayor o menor es respecto de otra categora, es decir, especifica la distancia o
intervalo entre categoras (la categora 70 es el doble de la categora 35).

Las variables medibles en el nivel cuantitativo pueden ser discretas o


continuas.

Una variable discreta es aquella en la cual, dados dos valores


consecutivos, no puede adoptar ningn valor intermedio (por ejemplo entre 32 y
33 dientes, no puede hablarse de 32.5 dientes).

5
Estadsticas | 2017

En cambio, una variable es continua cuando, dados dos valores


consecutivos, la variable puede adoptar muchos valores intermedios (por
ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles).

CLASIFICACIONES DE LA ESTADISTICA

Existen varias formas de clasificar los estudios estadsticos.

1) Segn la etapa.- Hay una estadstica descriptiva y una estadstica


inferencial. La primera etapa se ocupa de describir la muestra, y la segunda
etapa infiere conclusiones a partir de los datos que describen la muestra (por
ejemplo con respecto a la poblacin).

2) Segn el tiempo considerado.- Dentro de la estadstica descriptiva se


distingue la estadstica esttica o estructural, que describe la poblacin en un
momento dado (por ejemplo la tasa de nacimientos en determinado censo), y la
estadstica dinmica o evolutiva, que describe como va cambiando la poblacin
en el tiempo (por ejemplo el aumento anual en la tasa de nacimientos).

3) Segn la cantidad de variables estudiada.- Desde este punto de vista


hay una estadstica univariada (estudia una sola variable, como por ejemplo la
inteligencia, en una muestra), una estadstica bivariada (estudia como estn
relacionadas dos variables, como por ejemplo inteligencia y alimentacin), y una
estadstica multivariada (que estudia tres o ms variables, como por ejemplo
como estn relacionados el sexo, la edad y la alimentacin con la inteligencia).

6
Estadsticas | 2017

UNIDAD II

VARIABLES ESTADISTICAS

Una variable estadstica es una caracterstica que puede fluctuar y cuya


variacin es susceptible de adoptar diferentes valores, los cuales pueden
medirse u observarse. Las variables adquieren valor cuando se relacionan con
otras variables, es decir, si forman parte de una hiptesis o de una teora. En
este caso se las denomina constructos o construcciones hipotticas.

Existen diferentes tipos de variables: -Cualitativa Nominal -Cualitativa


Ordinal -Cuantitativa Continua -Cuantitativa Discreta

TIPOS DE VARIABLES

Son el tipo de variables que como su nombre lo indica expresan distintas


cualidades, caractersticas o modalidad. Cada modalidad que se presenta se
denomina atributo o categora, y la medicin consiste en una clasificacin de
dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo
pueden tomar dos valores posibles, como s y no, hombre y mujer o ser
politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos
distinguir:

Variable cualitativa ordinal o variable casi cuantitativa: La variable puede


tomar distintos valores ordenados siguiendo una escala establecida, aunque no
es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve,
moderado, fuerte.

Variable cualitativa nominal: En esta variable los valores no pueden ser


sometidos a un criterio de orden, como por ejemplo los colores.

Variables cuantitativas

Son las variables que toman como argumento cantidades numricas, son
variables matemticas. Las variables cuantitativas adems pueden ser:

7
Estadsticas | 2017

Variable discreta: Es la variable que presenta separaciones o


interrupciones en la escala de valores que puede tomar. Estas separaciones o
interrupciones indican la ausencia de valores entre los distintos valores
especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3,
4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro


de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5
kg...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se est
limitado por la precisin del aparato medidor, en teora permiten que exista un
valor entre dos variables.

Variables independientes

Una variable independiente es aquella cuyo valor no depende de otra


variable. Es aquella caracterstica o propiedad que se supone es la causa del
fenmeno estudiado. En investigacin experimental se llama as a la variable
que el investigador manipula.

Las variables independientes son las que el investigador escoge para


establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos
del mismo. Un tipo especial son las variables de control, que modifican al resto
de las variables independientes y que de no tenerse en cuenta adecuadamente
pueden alterar los resultados por medio de un sesgo.

La variable independiente se suele representar en el eje de abscisas.

La variable independiente es la que se le asignan valores arbitrarios

Variables dependientes

Una variable dependiente es aquella cuyos valores dependen de los que


tomen otra variable. La variable dependiente en una funcin que suele
representar por y. La variable dependiente se representa en el eje ordenadas.
Son las variables de respuesta que se observan en el estudio, y que podran
estar influidas por los valores de las variables independientes.

8
Estadsticas | 2017

Hayman (1974 : 69) la define como propiedad o caracterstica que se trata


de cambiar mediante la manipulacin de la variable independiente.

La variable dependiente es el factor que es observado y medido para


determinar el efecto de la variable independiente.

MEDICION

El proceso de asignar un valor numrico a una variable se llama medicin.


Las escalas de medicin sirven para ofrecernos informacin sobre las
clasificaciones que podemos hacer con respecto a las variables (discretas o
continuas).

Cuando se mide una variable el resultado puede aparecer en uno de


cuatro diversos tipos de escalas de medicin; nominal, ordinal, intervalo y razn.

Conocer la escala a la que pertenece una medicin es importante para


determinar el mtodo adecuado para describir y analizar esos datos.

Escala nominal:

Utiliza los nmeros para identificar que un dato pertenece a un grupo o a


una categora. Es aquella escala que no presenta un orden o dimensin
particular, son observaciones que pueden clasificarse o contarse.

En el anlisis de datos resulta ms sencillo asignar a ciertos atributos


etiquetas numricas en lugar de utilizar datos complejos. Por ello podemos
utilizar un 1 para designar a las mujeres y un 2 para designar a los hombres,
sin que ninguno de los nmeros represente ms o menos, solamente con el
objetivo de distinguir y organizar datos.

En esta escala cada persona u objeto debe pertenecer a una y solamente


una de las categoras que tienen y el conjunto de estas categoras debe ser
exhaustivo; es decir, tiene que contener a todos los casos posibles.

Escala ordinal:

En esta escala los nmeros representan una clasificacin (mayor que o


menor que), sin que represente una unidad de medida, quedando implcito que

9
Estadsticas | 2017

un nmero de mayor cantidad tiene ms alto grado de atributo medido en


comparacin de un nmero menor. Se establece una gradacin u orden natural
para las categoras, cada uno de los datos puede localizarse dentro de alguna
de las categoras disponibles.

Escala de intervalo:

En esta escala adems del mayor que y el menor que tambin se


establece una unidad de medida que nos permite precisar cunto se es mayor o
menor. La unidad de medicin es arbitraria, el cero es convencional y pueden
existir cantidades negativas; la medicin de la temperatura y del coeficiente
intelectual son ejemplos de este tipo de escala.

En esta escala se pueden hacer comparaciones por medio de diferencias


o de sumas, sin embargo, no se admiten comparaciones por medio de
multiplicaciones, divisiones o porcentajes pues carecen de sentido.

Escala de razn:

Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los
mltiplos de los valores de la escala sern significativos; el nivel de votos en una
eleccin sera un buen ejemplo de una escala de medicin de razn.

TECNICAS DE MUESTREO

En estadstica un muestreo es la tcnica para la seleccin de una muestra


a partir de una poblacin. En el muestreo, si el tamao de la muestra es ms
pequeo que el tamao de la poblacin, se puede extraer dos o ms muestras
de la misma poblacin. Al conjunto de muestras que se pueden obtener de la
poblacin se denomina espacio muestral. La variable que asocia a cada muestra
su probabilidad de extraccin. Su funcin bsica es determinar que parte de una
realidad en estudio (poblacin o universo) debe examinarse con la finalidad de
hacer inferencias sobre dicha poblacin.

Este se realiza una vez que se ha establecido un marco o espacio


muestral representativo de la poblacin, se procede a la seleccin de los
elementos de la muestra aunque hay muchos diseos de la muestra. Al tomar

10
Estadsticas | 2017

varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de
una muestra a otra.

Existen dos mtodos para seleccionar muestras de poblaciones: el


muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar
como recurso en el proceso de seleccin). Cuando este ltimo cumple con la
condicin de que todos los elementos de la poblacin tienen alguna oportunidad
de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto
de la poblacin es conocida de antemano, recibe el nombre de muestreo
probabilstico. Una muestra seleccionada por muestreo de juicio puede basarse
en la experiencia de alguien con la poblacin. Algunas veces una muestra de
juicio se usa como gua o muestra tentativa para decidir cmo tomar una muestra
aleatoria ms adelante.

Tcnicas de Seleccin del Muestreo

Muestreo probabilstico: Forman parte de este tipo de muestreo todos


aquellos mtodos para los que puede calcularse la probabilidad de extraccin de
cualquiera de las muestras posibles. Este conjunto de tcnicas de muestreo es
el ms aconsejable, aunque en ocasiones no es posible optar por l. En este
caso se habla de muestras probabilsticas, pues no es en rigor correcto hablar
de muestras representativas dado que, al no conocer las caractersticas de la
poblacin, no es posible tener certeza de que tal caracterstica se haya
conseguido. Para realizar este tipo de muestreo, y en determinadas situaciones,
es muy til la extraccin de nmeros aleatorios mediante ordenadores,
calculadoras o tablas construidas al efecto.

- Muestreo estratificado: Consiste en la divisin previa de la poblacin


de estudio en grupos o clases que se suponen homogneos respecto
a caracterstica a estudiar. A cada uno de estos estratos se le
asignara una cuota que determinara el nmero de miembros del
mismo que compondrn la muestra.

11
Estadsticas | 2017

- Muestreo sistemtico: Es la eleccin de una muestra a partir de los


elementos de una lista segn un orden determinado, o recorriendo la
lista a partir de un nmero aleatorio determinado.
- Muestreo por conglomerados: Cuando la poblacin se encuentra
dividida, de manera natural, en grupos que se suponen que contienen
toda la variabilidad de la poblacin, es decir, la representan fielmente
respecto a la caracterstica a elegir, pueden seleccionarse slo
algunos de estos grupos o conglomerados para la realizacin del
estudio.
- Muestreo errtico: Tambin se llama sin norma. La muestra se
realiza de cualquier forma, valorando nicamente la comodidad o la
oportunidad en trminos de costes, tiempo u otro factor no estadstico.

Al realizar un muestreo en una poblacin podemos hablar de muestreos


probabilsticas y no probabilsticas, entre estas tcnicas o procedimientos estn:

- Muestreo simple: Este tipo de muestreo toma solamente una muestra


de una poblacin dada para el propsito de inferencia estadstica.
Puesto que solamente una muestra es tomada, el tamao de muestra
debe ser los suficientemente grandes para extraer una conclusin.
Una muestra grande muchas veces cuesta demasiado dinero y tiempo.
- Muestreo aleatorio simple: Es aquel en que cada elemento de la
poblacin tiene la misma probabilidad de ser seleccionado para
integrar la muestra. Una muestra simple aleatoria es aquella en que
sus elementos son seleccionados mediante el muestreo aleatorio
simple.
- Muestreo doble: cuando el resultado del estudio de la primera
muestra no es decisivo, una segunda muestra es extrada de la misma
poblacin. Las dos muestras son combinadas para analizar los
resultados. Este mtodo permite a una persona principiar con una
muestra relativamente pequea para ahorrar costos y tiempo. Si la
primera muestra arroja un resultado definitivo, la segunda muestra
puede no necesitarse.
- Muestreo mltiple: El procedimiento bajo este mtodo es similar al
expuesto en el muestreo doble, excepto que el nmero de muestras

12
Estadsticas | 2017

sucesivas requerido para llegar a una decisin es ms de dos


muestras. Mtodos de muestreo clasificados de acuerdo con las
maneras usadas en seleccionar los elementos de una muestra. Los
elementos de una muestra pueden ser seleccionados de dos maneras
diferentes:

Basados en el juicio de una persona Seleccin aleatoria (al azar).

- Muestreo con reemplazo: Es aquel en que un elemento puede ser


seleccionado ms de una vez en la muestra para ello se extrae un
elemento de la poblacin se observa y se devuelve a la poblacin, por
lo que de esta forma se pueden hacer infinitas extracciones de la
poblacin aun siendo esta finita.
- Muestreo sin reemplazo: No se devuelve los elementos extrados a la
poblacin hasta que no se hallan extrados todos los elementos de la
poblacin que conforman la muestra.

13
Estadsticas | 2017

14