Está en la página 1de 9

Ctedra Estadstica

UNIDAD I VARIABLES Y DISTRIBUCIONES DE FRECUENCIA


Ahora nos ocuparemos de la descripcin y la reduccin de los datos estadsticos. Para llegar a eso vamos a definir a la unidad estadstica y la variable. Las unidades estadsticas son los elementos que componen la poblacin objeto de estudio. A estos elementos se les estudia, mediante la medicin u observacin, una o ms caractersticas que reciben el nombre de variables estadsticas. Variable : Es la caracterstica que se le estudia u observa a los individuos (o elementos) que conforman la poblacin (o muestra) .Dicha variable puede tomar cualquier valor dentro de un conjunto determinado llamado dominio o campo de variacin de la variable. Ej.: peso, dimensiones, n de defectuosos, n de ausentes. Cada caracterstica puede presentar dos o ms modalidades, que son incompatibles y exhaustivas a la vez, es decir que cada individuo de la poblacin ( unidad estadstica) presenta una y slo una de estas modalidades y el campo de variacin contempla todos los casos susceptibles de presentacin. Debemos hacer una diferencia entre los valores posibles y los valores observados, que generan dos campos de variacin distintos: los primeros son los que puede asumir la variable y los segundos son los valores que realmente se observan o se obtuvieron en la recopilacin. De acuerdo a su naturaleza se las clasifica en cualitativas y cuantitativas. .Cualitativas : asumen modalidades o atributos . .Cuantitativas : asumen valores numricos . Las variables cuantitativas, segn como se originen, pueden clasificarse en discretas y continuas. En general las mediciones dan origen a datos continuos y las enumeraciones o conteos originan datos discretos. En realidad, la distincin entre discretas y continuas se refiere a la poblacin, ya que en la muestra toda medicin es discreta ya que se efecta con algn tipo de instrumento que tiene un grado de precisin limitado. Discretas: surgen de un conteo y asumen valores enteros no negativos (naturales) . Ej.: n de hijos, n de hoteles, n de autos. Continuas: surgen de una medicin y asumen valores reales.. Ej.: velocidad de un automvil, altura de las personas. Otras formas de clasificar a las variables cuantitativas es en temporales y atemporales. .Temporales o cronolgicas: cuando se toma en cuenta el orden de las observaciones. .Atemporales: cuando el orden de las observaciones no es de importancia. Segn la cantidad de caractersticas que simultneamente se observan (o miden) a los elementos de la poblacin, podemos clasificar a las variables en: unidimensionales, bidimensionales y multidimensionales.

Distribuciones de Frecuencia

Ctedra Estadstica VARIABLES CUANTITATIVAS Unidimensionales

Serie Simple de Datos ( o de observaciones)


xn

x1 , x2 , x3 , ........,

Donde x1 representa el valor de la variable que corresponde a la primera observacin, es decir, el primer valor observado (de la variable X ) . En general , xi es el i-simo valor observado y xn es el ltimo valor observado ( o el n-simo) simbolizamos con "n" a la cantidad de observaciones. Si se est estudiando una variable atemporal, entonces puede drsele a esta serie un orden distinto, en particular se puede ordenar a estos valores de menor a mayor, lo cual permite visualizar mejor cual es el mnimo valor observado , cual es el mximo , cual es la amplitud del recorrido de la variable y donde est ubicado el "valor medio de la variable". Si la cantidad de observaciones ( n ) es muy grande, se hace necesario organizar los datos construyendo tablas de frecuencia. La construccin de dichas tablas (es decir, la organizacin de los datos) depende del origen de la variable: Si la variable se origina mediante un conteo entonces es discreta y en la tabla se colocan, de menor a mayor, los valores que toma la variable. Si la variable se origina mediante una medicin, entonces es continua , y es necesario agrupar los valores observados en intervalos o clases .

Por lo tanto, distinguiremos las tablas de frecuencia para datos sin agrupar (que corresponden a variables discretas) y para datos agrupados ( que corresponden a variables continuas ).

DISTRIBUCIONES DE FRECUENCIA Datos no Agrupados - (Variable Discreta)


Se ordenan de menor a mayor los valores observados (sin repetir) en la primera columna . En la segunda columna se indica cuantas veces se observ dicho valor donde

xy x1 x2 x3 . xi . . . xm

fi f1 f2 f3 . . fi . . . fm

x1 xm

indica el menor valor que asume la variable indica el mayor valor que asume la variable

m indica la cantidad de valores distintos observados f1 indica la cantidad de veces que se observ el menor valor de la variable (x1) fm indica la cantidad de veces que se observ el mayor valor de la variable (xm)

Distribuciones de Frecuencia

Ctedra Estadstica En general fi indica la cantidad de veces que se observ el valor x i , es decir, representa la frecuencia absoluta simple del i-simo valor de la variable. n indica la cantidad total de observaciones. n = fi Por su gran utilidad, definiremos tambin las frecuencias absolutas acumuladas Fi , que indican la cantidad de veces que se observ un valor menor o igual al i-simo valor de la variable (xi). Por lo tanto Fi = f1 + f2 + ..... + fi =

f
j= 1

Por su propia definicin tenemos que

F1 = f1 Fm = n

y en general

0 Fi n

REPRESENTACIN GRFICA

Frecuencias Simples Absoluta Grfico de Bastones

Distribuciones de Frecuencia

Ctedra Estadstica

Frecuencias Acumuladas Grfico Escalonado

0 i Fi = f k k =1 n

si i <1 1 i m si i > m

En la mayora de los casos ( y principalmente cuando se trabaja con muestras ) es ms importante tener informacin sobre las frecuencias relativas (simples y acumuladas) que sobre las absolutas. Definimos entonces a la frecuencia relativa simple hi como el cociente entre la frecuencia absoluta simple fi y la cantidad de observaciones n , que indica la proporcin de veces que se observ el i-simo valor de la variable, xi . Y definimos a la frecuencia relativa acumulada H i como el cociente entre la frecuencia absoluta acumulada Fi y la cantidad de observaciones n, que indica la proporcin de veces que se observ un valor menor o igual que xi . En smbolos, tenemos que; y

hi = Hi =

i Fi = n j =1 n

fi n fj

i = 1 .. n i = 1 .. n

Por su propia definicin tenemos que H1 = h1 Hm = 1 y en general 0 Hi 1 La representacin grfica es similar a la de las frecuencias absolutas. Para una mejor interpretacin de las frecuencias relativas se definen a continuacin las frecuencias relativas porcentuales (simples y acumuladas), que se obtienen multiplicando por 100 las frecuencias relativas correspondientes. As: hi% = hi . 100 observ el valor xi y i = 1 .. n , indica el porcentaje de veces que se
i j =1

Hi% = Hi . 100 = h j % H1% = h1% Hm% = 100

i = 1 .. n

Por su propia definicin tenemos que

y en general

0 Hi% 100

Distribuciones de Frecuencia

Ctedra Estadstica

XI X1 X2 X3
.

fi=frec.absoluta

hi =

fi n

hi%=hi*100

Fi = f k
k =1

Hi =

Fi n
fk k =1 n
i

Hi % = Hi 100

Hi =

0 fi n

0 hi 1

0 hi% Fi = f1 +.. + fi 100

. . . . . Xm

0 Fi n Fm = n

0 Hi 1 0 Hi % 100 Hm = 1 Hm % = 100

f
i =1

= f1 +... + fm = n

i =1

hi = 1

i =1

hi % = 100

REPRESENTACIN GRFICA Frecuencias Simples Grfico de Bastones

Distribuciones de Frecuencia

Ctedra Estadstica

Frecuencias Acumuladas Grfico Escalonado

Datos Agrupados - (Variable Continua)


Se determina el recorrido de la variable o Rango ( R ) , tomando la diferencia entre el mximo valor observado (xM ) y el mnimo valor observado (xm ) . O sea, R = xM - xm Luego, se divide el rango en una cantidad de intervalos (o clases) que puede variar entre 5 y 20 . Estos intervalos deben ser excluyentes y exhaustivos, de manera que cualquier valor observado de la variable pertenezca a uno y slo un intervalo o clase. Por lo tanto, los intervalos deben ser semiabiertos, es decir, deben incluir uno solo de los extremos.

xi-1'- xi' xi x0'- x1' x1'- x2' x2'- x3' . . xi-1'- xi' . . . xm-1' xm' x1 x2 x3 . . xi . . . xm

fi f1 f2 f3 . . fi . . . fm

x0' indica el menor valor que puede asumir la variable.


xm' indica el mayor valor que puede asumir la variable m indica la cantidad de intervalos . x1 indica el punto medio del primer intervalo . xi indica el punto medio del i-simo intervalo . xm indica el punto medio del ltimo intervalo . f1 indica la cantidad de veces que se observ un valor de la variable que est entre x0' y x1' fm indica la cantidad de veces que se observ un valor de la variable que est entre xm-1' y xm' o.

Distribuciones de Frecuencia

Ctedra Estadstica En genera fi indica la cantidad de veces que se observ un valor que oscila entre xi-1' y xi' es decir , representa la frecuencia absoluta simple del i-simo intervalo o clase. Por su gran utilidad, definiremos tambin las frecuencias absolutas acumuladas F i , que indican la cantidad de veces que se observ un valor menor o igual al que el extremo superior del i-simo intervalo, es decir , un valor menor o igual que xi ' . Por lo tanto Fi = f1 + f2 + ..... + fi = fj
j =1 i

Por su propia definicin tenemos que

F1 = f1 Fm = n

y en general

0 Fi n

REPRESENTACIN GRFICA Frecuencias Absolutas Simples Histograma


Fi

Frecuencias Absolutas Acumuladas Ojiva


Fi=n

fi

Fi=0
X
X

0 i Fi = f k k =1 n

si i <1 1 i m si i > m

En la mayora de los casos (y principalmente cuando se trabaja con muestras) es ms importante tener informacin sobre las frecuencias relativas (simples y acumuladas) que sobre las absolutas. Definimos entonces a la frecuencia relativa simple h i como el cociente entre la frecuencia absoluta simple fi y la cantidad de observaciones n , que indica la proporcin de veces que se observ un valor dentro del i-simo intervalo de clase ( xi-1' - xi ' ) . Y definimos a la frecuencia relativa acumulada Hi como el cociente entre la frecuencia absoluta acumulada Fi y la cantidad de observaciones n , que indica la proporcin de veces que se observ un valor menor o igual que xi ' . En smbolos, tenemos que ; y

fi n i f Fi Hi = = j n j =1 n hi =

i = 1 .. n i = 1 .. n

Por su propia definicin tenemos que

H1 = h1 Hm = 1

Distribuciones de Frecuencia

Ctedra Estadstica y en general 0 Hi 1

La representacin grfica es similar a la de las frecuencias absolutas . Para una mejor interpretacin de las frecuencias relativas se definen a continuacin las frecuencias relativas porcentuales (simples y acumuladas), que se obtienen multiplicando por 100 las frecuencias relativas correspondientes. As : hi% = hi . 100 i = 1 .. n que indica el porcentaje de veces que se observ un valor dentro del i-simo intervalo (xi-1 - xi.)
i j =1

Hi% = Hi . 100 = h j % H1% = h1% Hm%= 100

i = 1 .. n

Por su propia definicin tenemos que

y en general

0 Hi% 100

xi-1'- xi'

XI

fi=frec . abs.

hi =

fi n

hi%=hi*100

Fi = f k
k =1

Hi =

Fi n fk k =1 n
i

Hi % = Hi 100

x0'- x1' X1 x1'- x2' X2 x2'- x3' X3


.

Hi =

' . . xi-1'- xi' . . . xm-1' xm'

. . Xi . . . -Xm fi = n
m

Fm = n

Hm = 1

Hm % = 100

i =1

i =1

hi = 1

i =1

hi % = 100

0 fi n 0 hi 1

0hi% 100 0 Fi n 0 Hi 1 0 Hi % 100

Distribuciones de Frecuencia

Ctedra Estadstica

Acumuladas

Histograma y Polgono de Frecuencias

Ojiva Frecuencias

Bidimensionales Serie Simple de Datos ( o de observaciones)


(x1 , y1) , (x2 , y2) , (x3 , y3) .,........, (xn ,yn) Donde ( x1 , y1 ) representa el valor de la variable que corresponde a la primera observacin, es decir, el primer valor observado de la variable bidimensional (X,Y). En general, (xi , yi) es el i-simo valor observado y (x n , yn) es el ltimo valor observado (o el n-simo). Simbolizamos con "n" a la cantidad de observaciones. Ejemplo: X 1 2 3 4 5 6

Y 1 2 3 5 5 6

Representacin grafica: Nube de Puntos o Diagrama de Dispersin

Distribuciones de Frecuencia

También podría gustarte