Está en la página 1de 16

CONCEPTOS DE ESTADSTICA

La Estadstica es un mtodo cientfico de investigacin que recoge


informacin o datos, los organiza, presenta, analiza y saca
conclusiones para tomar decisiones.

La Estadstica es una disciplina cientfica que se dedica a la


recoleccin, descripcin, anlisis e interpretacin de datos y, por ello,
constituye la metodologa cientfica que permite transformar datos sin
sentido en informacin. Esto la hace especialmente imprescindible, ya
que en cualquier sociedad desarrollada existe una inmensa variedad
de problemas cuya solucin slo es posible mediante la utilizacin de
tcnicas estadsticas. As, por ejemplo, la Estadstica es necesaria en
la planificacin de las actividades estatales y es imprescindible para
establecer la eficacia de una nueva formula, para modelizar y
predecir diversas variables ambientales o para detectar factores que
inciden en la decisin de compra.

La Estadstica permite resumir los datos ms destacados de los


elementos que componen un conjunto, logrando as captar ms
fcilmente su contenido. Es fundamental en la investigacin cientfica,
pues ella permite decir con nmeros cualquier tipo de anlisis de la
realidad. Difcilmente podramos encontrara un campo de la actividad
cognoscitiva en que el herramental estadstico no tenga su aplicacin.
La misma es aplicada tanto en la economa como en la
administracin, salud pblica, educacin, contabilidad, etc.

Recordando el concepto de Ciencia y mtodo cientfico


La ciencia es un conjunto de conocimientos racionales obtenidos
metdicamente, sistematizados y verificables, ciertos o probables,
que hacen referencia a objetos de una misma naturaleza.
La tarea o funcin principal de la ciencia es observar adecuadamente
los hechos o fenmenos de la naturaleza y la sociedad as como
determinar las leyes que los rigen, es decir, sus relaciones
constantes, necesarias e invariables. Es el mtodo propio de la
ciencia, es decir, el mtodo cientfico, el que nos permite realizar esa
Tarea.

La aplicacin del mtodo cientfico a un problema determinado sigue


cuatro etapas bsicas que son
. La observacin del hecho o fenmeno que nos mueve a
investigacin.
. La elaboracin de una hiptesis, o sea, una explicacin anticipada o
a priori de las causas del fenmeno
. La experimentacin o verificacin de la hiptesis, utilizando las
herramientas propias de nuestra rea de estudio y de la estadstica.
. La conclusin o resolucin sobre la hiptesis, es decir, su aceptacin,
rechazo o reformulacin
El estudio estadstico de un material numrico tiene una metdica
general que es la nica que permite obtener conclusiones valederas.
Este es el mtodo estadstico, en el cual se distinguen dos etapas
bsicas en su aplicacin que son:
1- La planificacin, en la cual se definen los objetivos del estudio y
se deciden todos los pasos prcticos para alcanzar dichos
objetivos.
2- La ejecucin, en la cual se lleva a cabo la investigacin, es
decir, se recogen los datos, se elaboran, analizan e interpretan
para enunciar al final las conclusiones,

LA RECOLECCIN DE LOS DATOS ESTADSTICOS

Es la parte ms importante de la investigacin porque los datos son


como la materia prima de la misma. De la precisin o cuidado con que
se obtengan los datos va depender la veracidad de los resultados
obtenidos al final del estudio.
Existen dos formas de obtener los datos que son:
- La forma directa, cuando el investigador produce sus datos
- La forma indirecta cuando se toman los datos de fuentes que ya
los han recogido previamente. Los mismos se encuentran
registrados en boletines, peridicos, revistas, etc.
Existen varios medios para obtener los datos necesarios para la
investigacin, entre ellos:
- El registro de datos
- La Encuesta
- El formulario o cuestionario

LA ORGANIZACIN DE LOS DATOS ESTADSTICOS

Esta comprende tres aspectos bsicos, que son:


- La Correccin de los datos
- La Clasificacin
- La Tabulacin

La Tabulacin de los datos o Distribucin de Frecuencias

Para un mejor anlisis de los datos es necesario reunirlos en grupos


de magnitudes denominados Clases o Categoras, las cuales estn
compuestas por un valor mnimo o lmite inferior y un valor mximo
limite superior. La diferencia que existe entre esos dos lmites se
llama intervalo o amplitud de clases, el cual se obtiene mediante la
diferencia de dos limites inferiores o superiores sucesivos.

Para determinar el nmero de clases que debe tener la distribucin,


se ha establecido convencionalmente que no deben ser menos de
cinco ni ms de quince. Basado en esto el seor H. A. Sturges ide la
siguiente frmula para determinar el nmero exacto de clases a
formar:
Nc = 1 + 3.3 log n El intervalo de clases ser: Ic = ( Xn
X1 ) / Nc

La Distribucin de frecuencia: es la agrupacin de datos en clases,


indicando en cada una de ellas su frecuencia, es decir, el nmero de
veces que se repite cada clase o dato.

La frecuencia absoluta simple de una clase ( f ): es el numero de


veces que se repite la clase. Es la cantidad de valores que hay en
dicha clase.

La frecuencia relativa simple de una clase( fr ): es el cociente de la


frecuencia absoluta simple de la clase y el total o suma de todas las
frecuencias. Es el porcentaje de datos que hay en dicha clase.

Ejemplo: Dados los siguientes datos relativos al ingreso mensual, en


miles de pesos,
1 - Construir una distribucin de frecuencia con un nmero de clase
igual 5.
2 -Calcular todas las dems frecuencias de las clases.
3 -Decir que significa todas las frecuencias de la 3ra. Clase.
4 Haga una nueva tabla utilizando la formula de sturges

39 40 69 45 41 47 59 61 53 52 51 55 57 42 33
60 58 56 61 47 50 49 53 52 50 63 68 30 37 64

Nc= 5
Ic= 69-30/5 = 7.8
Ic= 8

Clase Frecuen F fr. % Fa Fa Far % Far %


cia
30- III 3 10% 3 30 10% 100%
38
38- IIII 5 16.7 8 27 26.7% 90%
46
%
46- IIIII.IIIII 10 33.3 18 22 60% 70.3%
54 %
54- IIIII. III 8 26.6 26 12 80% 40.3%
62 7%
62- IIII 4 13.3 30 4 100% 13.3%
70 %
TOTA 30 100
L %

10 Personas tiene ingreso entre 46-54 pesos.


El 33.3% tiene un ingreso de 46 a 54 pesos
18 personas tienen un ingreso por debajo de 54.
22 persona por encima de 46 pesos, o sea un 70.3%.

LA PRESENTACION DE LOS DATOS ESTADISTICOS

Puede hacerse de tres formas distintas que son:


1 Escrita o textual
2 tabular o cuadro estadstico
3 Grafica o dibujo

Todo cuadro o tabla estadstica consta de las siguientes partes:


A) El Titulo B) Los encabezados C) La columna matriz D) El
cuerpo E) La fuente
Existen dos elementos secundarios en el cuadro que son: La nota
introductoria y la nota al pie del cuadro. Ellas se utilizan cuando es
necesario hacer algn llamado u observacin especial sobre el
contenido del mismo.

Cantidad de estudiantes matriculados en la Uasd,


segn regiones por sexo. Republica Dominanai. 2007
( En miles de estudiantes )

REGIONES * MASCULINO FEMENINO TOTAL


DISTRITO 40 35 75
NACIONAL 20 25 45
REGION NORTE 13 15 28
REGION SUR 11 10 21
REGION ESTE
TOTAL 74 85 159
Fuente : OPLAU

* NOTA: datos ficticios


LA PRESENTACIN GRFICA DE LOS DATOS

Consiste en un esquema o dibujo, donde en una sola unidad queda


expresado el contenido general de la variable. Es la forma ms rpida
de observar la variable, pero no la ms precisa. Los grficos ms
usuales son:
1- El Histograma y el polgono de frecuencia, para representar a
una variable continua
2- El grafico de barras simple y compuesto para variable discreta
3- El grafico circular y el de barras 100%, para variable cualitativa
o de pocas subdivisiones
4- El grafico de lneas, para representar series cronolgicas o de
tiempo.
EL HISTOGRAMA

Fuente:Banco Cent
tcCCCentral
vvCentralCentral

b) Poligono o Curva de Frecuencia Grafico de Barras Simples

Grafico de Barras Compuesto Barra 100% o de componentes


Grafico Circular o de Pastel Grafico de Linea

EL ANALISIS ESTADISTICO DE LOS DATOS

Consiste en obtener las cifras y los indicadores que nos permiten


conocer y caracterizar adecuadamente la variable o conjunto de
datos estudiados.
Las medidas de anlisis estadstico ms comunes o usuales son:
a- medidas de tendencia central o promedios
b- medidas de dispersin o variabilidad

LAS MEDIDAS DE TENDENCIA CENTRAL O PROMEDIOS

Son indicadores estadsticos que resumen con un solo valor el


conjunto de datos o variables estudiados. Ellas permiten expresar con
un solo nmero todo el contenido general de la variable. Su valor esta
ubicado cerca del centro del conjunto de datos o variable.

La principal caracterstica de toda medida de tendencia central es que


sea representativa de la variable a la cual trata de explicar o
representar. Las mas comunes o usadas son :
- La Media aritmtica o promedio ( X )
- La Mediana ( Me )
- La Moda, modo o valor modal ( Mo )
- La Media Geomtrica ( Mg )
- Los Cuartiles
- Los Percentiles ( Pk )
La Media Aritmtica o Promedio

Es una medida de tendencia central que se define como la suma de


todos los valores de la variable o conjunto de datos, dividida entre la
cantidad de dichos valores. Su valor est ubicado cerca del centro del
conjunto de datos. Esta medida presenta las siguientes restricciones:
- Es numrica y por lo tanto no se puede calcular para variable
cualitativa
- Esta afectada por la inclusin de valores extremos en la
variable
- En su clculo intervienen tres valores y por tanto conocicidos
dos cualesquiera de ellos, el otro queda automticamente
determinado.
- No se puede obtener en una distribucin de clases abiertas o
limites indefinidos, ya que en su clculo intervienen todos los
datos.
- La suma de las desviaciones de los valores de la variable,
con respecto a la media aritmtica es igual a cero.

Ejemplo de media aritmtica

Las tarifas aduanales pagadas ( en RD$ ) por seis empresas importadoras


fueron:
RD$ 900, 1, 150, 1, 200, 1,000, 980, 1,100. Determine la media
aritmtica de las tarifas.

900+1,150+1,200+1,000+980+1,100 6,330
__ X = ------------------------------------------ = --------- = 1,055
X = ----- 6 6
n
Los prstamos efectuados por una entidad crediticia durante una semana
fueron:
RD$ 75,000; 60,000, 100,000; 85,000; 90,000,
87,000; 82,000; 93,000; 68,000; 73,000,
78,000; 85,000; 98,000; 76,000; 94,000;

a) Determine la media aritmtica de los prestamos efectuados por la


entidad crediticia.

75,000+60,000+100,000+85,000+90,000+87,000+82,000+93,000
_ +68,000+73,000+78,000+85,000+98,000+76,000+94,000
X = -------------------------------------------------------------------------------
15

_ 1, 244,000
X= ----------------- = 82,933.33
15
El nmero de hijos por familia se presenta en la siguiente tabla:
Calcule la media aritmtica del nmero de hijos por familia

Nmero de hijos (x) Cantidad familia X.F


(f)
0 5 0
1 12 12
2 16 32
3 18 54
4 17 68
5 10 50
6 3 18
7 2 14
Total 83 248
__
X = Xf 248
n = ----- = 2.98 = 3
83

Sueldos mensuales (RD$) de 80 empleados del sector pblico

Sueldos Nmero de X X.f


(RD$) empleados
1800- 5 20 102
2300 50 50
2300- 12 25 306
2800 50 00
2800- 15 30 457
3300 50 50
3300- 18 35 639
3800 50 00
3800- 14 40 567
4300 50 00
4300- 10 45 455
4800 50 00
4800- 6 50 303
5300 50 00
Total 80 ---- 2830
00
__
X= 283000 = 3,537.5
80

La mediana

Es una medida de tendencia central que divide a un conjunto


ordenado de datos en dos partes iguales. Es aquel valor de la variable
por debajo del cual se encuentra el 50 por ciento de los datos y por
encima el otro cincuenta por ciento. Su valor esta ubicado
exactamente en el centro del conjunto o variable. Ella presenta las
siguientes caractersticas:
1- Es un indicador numrico y por lo tanto no se calcula en
variable cualitativa.
2- No esta afectada por la inclusin de valores extremos o
inusuales en la variable
3- Se puede calcular en una distribucin de clases abiertas o
limites indefinidos, ya que en su calculo no intervienen todos
los datos.

La Moda o valor modal

Es una medida de tendencia central que se define como el valor mas


tipico o recuente de una distribucin o conjunto de datos.. Es aquel
valor de la variable que mas se repite. Ella presenta las siguientes
caractersticas:
1- Es un indicador no numrico y por lo tanto se puede calcular en
una variable cualitativa.
2- No esta afectada por la inclusin de valores extremos o
inusuales en la variable
3- Se puede calcular en una distribucin de clases abiertas o
lmites indefinidos, ya que en su clculo no intervienen todos
los datos.

Durante una semana los obreros de una empresa energtica


trabajaron las siguientes horas extras. Determine la mediana
y la moda

20, 15, 17, 21, 25, 27, 23, 24, 19, 16, 20, 24, 22, 19, 14, 16,
18, 25, 24, 22, 19, 17,25, 19

14, 15, 16, 16, 17, 17, 18, 19, 19, 19, 19, 20, 21, 22, 22, 23, 24, 24,
24, 25, 25, 25, 27
Me= 20 Mo = 19

A cada persona de una muestra de 16 que participaron en un


estudio se le asign una serie de tareas y se anot el tiempo
de terminacin (minutos) de cada una de ellas. Calcule la
mediana y la moda.

18.5, 14.6, 20.3, 17.6, 15.4, 16.7, 22.4, 17.8, 14.2, 18.4, 15.7.
20.3, 23.1, 22.8, 21.5, 24.4
14.2, 14.6, 15.4, 15.7, 16.7, 17.6, 17.8, 18.4, 18.5, 20.3, 20.3, 21.5,
22.4, 22.8, 23.1, 24.4

Me= 18.4+18.5 = 18.45Mo= 20.3


2
El tiempo de espera (minutos) de los clientes de un restaurant
para recibir sus rdenes son. Calcule el tiempo mediano de
espera.

Tiempo Nmero de F
(minutos) clientes a
5-10 10 1
0
10-15 18 2
8
15-20 15 4
3
20-25 8 5
1
25-30 5 5
6
30 y 2 5
ms 8
Total 58 --
-

Me= Li + (n/2 fa-1) * I n/2= 58/2= 29


f
Me= 15 + (29-28) * 5 Me= 15+ 0.33 = 15.33
15

Los salarios semanales de 15 obreros de una empresa se zona


franca fueron:
RD$ 1400, 1500, 1200, 1400, 1450, 1475, 1300, 1550, 1400,
1350, 1400, 1525, 1400, 1600, 1250

Determine la moda
Mo= 1400

Las calificaciones en estadstica de 25 estudiantes se


muestran a continuacin. Calcule la moda.

80, 85, 72, 68, 65, 79, 81, 85, 79, 78, 81, 83, 79, 81, 80, 81,
76, 70, 60, 63, 81, 73, 79, 67

Mo= 79 y 81 es un grupo bimodal

5.39 Despus de revisar un libro, un especialista en gramtica


encontr la siguiente cantidad de errores por pgina.
Determine el nmero de errores modales por pgina.

Nmero de Cantidad de
errores pginas
0-2 8
3-5 14
6-8 16
9- 9
11
12- 4
14
Total 51

Mo= Li + ( Fm - Fm-1) *I
(Fm-Fm-1)+ (Fm-Fm+2)

Mo = 6 + ( 16-14 ) * 3
(16-14)+ (16-9)
Mo = 6+ ( 2 ) *3
2+7
b = 6+ 0.44
Mo =6.44

La media geomtrica:

Es una medida de tendencia central que se define como la raz n-


sima del producto de los valores de la variable. Ella se utiliza cuando
la variable en estudio experimenta un crecimiento geomtrico; como
por ejemplo, la poblacin de un pas, el dinero en el tiempo, etc.

Calcule la media geomtrica para las series de datos


.
a) X1: 5, 8, 10, 12, 3, 16, 17 = Mg = 7 5 x 8x 10 x 12 x 3 x 16 x 17 = 7
3, 916, 800 =
8.74

b) X1: 2, 5, 6, 4, 3 Mg = 4 2x 5x 6x 4 x 3 = 4
720 = 5.8

Las tasas de inters activa que aplicaron los bancos comerciales de la Repblica
Dominicana a sus clientes a un plazo de 90 das o menos durante el perodo 1993-
1997 fueron las siguientes. Calcule la media geomtrica

Aos Tasa de inters %


1993 28.55
1994 27.20
1995 29.60
1996 23.49
1997 20.08
5
Mg= 28.55*27.20*29.60*23.49*20.08 = 25.53

Aplicaciones de la media geomtrica


Si la poblacin de un pas en el ao 2000 fue de 8.7 millones de habitantes y en el 2007
es de 9.6.
a) Calcule la tasa de crecimiento promedio anual de dicha poblacin.
b) Estime o proyecte la cantidad de habitantes que tendr la poblacin en el 2015.
n
a) r = Pn / Po 1;

r(00-07) = n
P07 / P00 1 = 7
9.6 / 8.7 1 = 1.103 ) =
7
= 1.103 1 = 1.014 1 = 0.014 = 1.4 %

b) Pn = Po( 1 + r )n
P15 = P07( 1 + r )n = 9.6( 1 + 0.014 )8 = 9.6( 1. 014)8 =

9.6(1.118)= 10.73 millones

Los Cuartiles(Qk):

Son medidas de posicin que dividen a un conjunto ordenado de datos en cuatro


partes iguales. En ellos se obtienen tres valores cuartilicos (Q1, Q2 y Q3):
El cuartil 1 : es aquel valor por debajo del cual se encuentra el 25 por ciento de los
datos y por encima el 75%.
El cuartil 3 (Q3): es aquel valor de la variable por debajo del cual se encuentra el
75% de los datos y por encima el 25% de dichos datos

Los Deciles (Dk):

Son medidas de posicin que dividen a un conjunto ordenado de datos en diez partes
iguales. En ellos se obtienen nueve valores declicos (D1, D2, . D9):
El Decil 3(D3) : es aquel valor por debajo del cual se encuentra el 30 por ciento de
los datos y por encima el 70%.

Los Percentiles(Pk)

Son medidas de posicin que dividen a un conjunto ordenado de datos en cien partes
iguales. En ellos se obtienen noventa y nueve valores percentlicos (P1, P2, P99):
El percentil 62(P62) : es aquel valor de la variable por debajo del cual se encuentra
el 62 por ciento de los datos y por encima el 38%.

Con los datos siguientes, calcule:


X: 385, 440, 460, 575, 600, 610, 690, 710, 757, 760, 790, 800, 808, 845, 905

A) El tercer cuartil
LQk= K (n+1)
4
LQ3= 3 (15+1) = 12= lugar
4
Q3= 800+ (808-800) 0
Q3= 800

B) El tercer decil
LDk= K (n+1)
10

LD3= 3 (15+1)
10
LD3= 4.8= lugar
D3= 575 + (600-575) 0.8= 595

C) El percentil setenta
LPk= K (n+1)
100
LP70= 70 (15+1) = 11.2= lugar
100
Q70= 790+ (800-790) 0.2
Q70= 792

A) El 75% de los datos estn por debajo de 800 y el 25% por encima de 800.
B) El 30 % de los datos estn por debajo de 595 y el 70 % de los datos estn por encima
de 595.
C) El 70% de los datos estn por debajo de 792 y el 30% por encima.

Con los datos del ejercicio determine

Clases F Fa
1800-2300 5 5
2300-2800 12 17
2800-3300 15 32
3300-3800 18 50
3800-4300 14 64
4300-4800 10 74
4800-5300 6 80
Total 80 ---

A) El valor del primer cuartil


Qk= Li + nk/4- Fa-1 * I
f

Q1= Li+ n/4- Fa-1 * I


f
Q1= 2800+ 20-17 *500
15
Q1=2800+100

Q1=2900

B) El valor del sexto decil


Dk= Li + nk/10- Fa-1 * I
F

D6= Li+ n6/10- Fa-1 * I


f

n6 /10= 48

D6= 3300+ 48-32 *500


18
D6=3300+444.44
D6=3744.44

C) El valor del percentil setenta de los sueldos


Pk= Li + nk/100- Fa-1 * I
F

P70= Li + 70n/100- Fa-1 * I


f

n70/100 = 56

P70= 3800+ 56-50 *500


14
P70=3800+214.29= 4014.29

LAS MEDIDAS DE DISPERSION O VARIABILIDAD

Son indicadores estadsticos que meden la variacin o dispersin de


los datos con respecto a una medida de tendencia central o promedio.
Ellas nos dicen en cuantas unidades se alejan los datos de su
promedio. Sirven para complementar o suplementar al promedio. Las
ms usadas son:

1- La Varianza
2- La Desviacin tpica o estndar
3- El Coeficiente de Variacin o dispersin

X : 460, 385, 600, 610, 440, 800, 757, 760, 690, 710, 575, 905, 845, 808, 790
_
X= 676
_
2 2
S = (X-X ) /n

S2= (460-676)2+ (385-676)2+ (600-676)2+ (610-676)2+ (440-676)2+ (800-676)2+ (757-


676)2+ (760-676)2+ (690-676)2+ (710-676)2+ (575-676)2+ (905-676)2+ (845-676)2+
(808-676)2+ (790-676)2
15
S2= 46656+ 84681+ 5776+ 4356+ 55696+ 15376+ 6561+ 7056+ 196+ 1156+ 10201+
52441+ 28561+ 17424+ 12996
15
S2= 349133 = 23275.53 = Varianza
15

S = S2 =
S= 23275.53 = 152.56 = Desviacin tpica o estndar

C.V= S * 100= 152.56 * 100 = 22.57 % Coeficiente de variacin


X 676

LOS NUMEROS INDICES

Indican el cambio relativo en el precio, cantidad o valor experimentado en algun


momento determinado anterior y el periodo actual. Este mide cunto cambia una
variable economica en funcion del tiempo. El numero indice para el ao base siempre
sera igual al 100%.

Cuando el numero indice esta referido unica y exclusivamente a un solo producto o


mercancia, el indice llama: Indice Simple. Cuando la comparacin se refiere a un grupo
de productos, el indice se denominara : Indice compuesto..

En economia y administracin existen tres clasificaciones de numeros indices que son:


indices de precios, de cantidad y de valor.

Indice de precios: es el de mayor uso y sirve para comparar los cambios en el precio
entre dos periodos. Por ejemplo, el indice de precios al consumidor mide los cambios
globales de una gran cantidad de bienes de consumo y de servicios y se utiliza para
definir el costo de la vida.
Pn
Ip = ----- x 100
Po
El indice de cantidad mide cunto cambia en el tiempo el numero o cantidad de una
variable

qn
Iq = ----- x 100
qo
El indice de valor mide los cambios en el valor monetario de una variable. Este indice
combina los cambios de precio y cantidad.
Pnqn
Iv = ----- x 100
Poqo

Precios y cantidades de un producto en 2005 y 2009

Ao Precio/lb Cantidad/lb Valor


2005 RD$18.00 500 9000.00
2009 RD$23.00 600 13,800.00
23(600)
Ip = (23/18)100 = 138% Iq = (600/500)100 = 120% Iv = ----------- x 100 =
153%
18 x 500
CANTIDAD Y PRECIO DE UN PRODUCTO.2002 2007

AOS 2002 2003 2004 2005 2006 2007


PRECIO 180 195 225 280 325 450
CANTIDAD 70 78 86 88 95 99
VALOR 12600 15210 19350 24640 30675 44550

INDICE DE PRECIO DE BASE FIJA. 2002= 100%

P2003 195
Ip(2003) = ---------- X100. = -----x100 = 108%
P2002 180 P2006
Ip(2006) = ---------- X100. = 181%
P2002

También podría gustarte