Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TERMINOLOGIA BASICA
1.1. APLICACIN DE LA ESTADSTICA
En la vida diaria los diversos fenmenos de orden econmico, social, poltico,
educacional, e incluso biolgico, aparecen, se transforman y finalmente desaparecen.
Para tan abundante y complejo material, es preciso tener un registro ordenado y
continuo a fin de conseguir en un momento dado, los datos necesarios para el estudio
de lo que ha sucedido, sucede o puede suceder.
Para ello se requiere contar con un mtodo, o conjunto de reglas o principios, que nos
permita la observacin, el ordenamiento, la cuantificacin y el anlisis de dichos
fenmenos. Ese mtodo se denomina Estadstica.
La palabra estadstica se refiere a un sistema o mtodo usado en la recoleccin,
organizacin, anlisis y descripcin numrica de la informacin.
Hay dos fases en el campo de la Estadstica. En primer lugar est la fase que slo se
limita a la descripcin de una serie de datos sin llegar a conclusiones o a generalizar
con respecto a un grupo mayor. Esta (fase) se conoce como Estadstica deductiva o
descriptiva. En segundo lugar est la fase de anlisis que trata de llegar a
conclusiones acerca de un grupo mayor basado en la informacin de un grupo menor
o muestra: es esta la Estadstica inductiva o de inferencia.
En un principio se consideraba que la funcin de la estadstica era la descripcin de
las caractersticas de grupo, actividad que la hacia confundir con el papel que cumple
la historia de observar y describir el hecho. En su origen, las estadsticas eran
historias; hoy en da, la estadstica, adems de ser descriptiva, es analtica,
considerndose esta ltima como la funcin ms importante que realiza, ya que
permite obtener conclusiones para un grupo mayor, denominado poblacin,
partiendo de una investigacin realizada en un grupo menor, conocido como
muestra, cuyo elementos, en la mayora de casos, se seleccionan aleatoriamente o al
azar.
La estadstica descriptiva o deductiva tiene como finalidad colocar en evidencia
aspectos caractersticos (promedios, variabilidad de los datos, etc.), que sirven para
efectuar comparaciones sin pretender sacar conclusiones de tipo ms general.
Esta descripcin se realiza a travs de la elaboracin de cuadros, grficos, clculo de
promedios, varianzas, proporciones de una o ms variables, que deben estar
relacionadas.
La estadstica inferencial o inductiva busca dar explicaciones al conjunto de
observaciones, probar la significacin o validez de los resultados; intenta descubrir
las causas que lo originan, con gran aplicacin en el campo del muestreo, logrndose
de esta manera, conclusiones que se extienden ms all de las estadsticas mismas.
ACTIVIDAD
ESTADISTICA
PRODUCTO
Planeamiento y diseo.
Recopilacin.
Procesamiento
Anlisis e indicadores
INFORMACION
TOMA DECISIONES
CARACTERISTICA
Representativa
Suficiente
Confiable
Oportuna
bibliotecas,
centros
de
Media muestral ( X )
Varianza muestral (S 2 )
Proporcin muestral ( p )
De una poblacin se pueden obtener M nmero de muestras posibles y en cada una
de ellas se puede cuantificar la caracterstica, obtenindose por lo general, valores
diferentes para cada muestra, a pesar de ser utilizado el mismo estadgrafo o medida.
Tambin se le conoce como Estimador Puntual si se trata de un promedio, varianza,
proporcin, etc. Como por lo general, existe una diferencia entre el estimador y el
parmetro, denominado error, es aconsejable utilizar el estimador por intervalos,
dentro del cual deber estar contenido el parmetro con cierto margen de seguridad,
establecido por el investigador.
La diferencia entre el estimador y el parmetro, como ya se dijo, se le denomina
como error de muestreo, y lo fija el investigador para determinar el tamao de la
muestra, con base en la experiencia y el conocimiento que tenga sobre el
comportamiento y, la variacin que tenga la caracterstica o caractersticas
principales relacionadas con el objetivo mismo de la investigacin.
Muestreo: Esto no es ms que el procedimiento empleado para obtener una o ms
muestras de una poblacin. Este se realiza una vez que se ha establecido un marco
muestral representativo de la poblacin, se procede a la seleccin de los elementos de
la muestra aunque hay muchos diseos de la muestra.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de una
muestra a otra.
Muestras posibles
Prob. De Seleccin
Muestra
seleccionada
Estimador
(Frmula)
Estimacin
Nmero
Caracterstica
a estimar de
la poblacin.
Figura 1.2.
Por ejemplo, la variable "estatus socioeconmico" con sus modalidades: clase baja,
media y alta se mide, en escala ordinal. La variable "orden de mrito" cuyas
modalidades son 1, 2, 3, etc. mide las calificaciones de las unidades estadsticas
en escala ordinal. Al asignar un nmero a los pacientes de una consulta mdica,
segn el orden de llegada, estamos llevando una escala ordinal, es decir que al
primero en llegar le asignamos el N 1, al siguiente el N 2 y as sucesivamente.
El mtodo estadstico con datos obtenidos en escala ordinal consiste bsicamente en
obtener el nmero o porcentaje de casos en cada modalidad y obtener la moda, la
mediana, los percentiles y el coeficiente de correlacin por rangos.
Escala de intervalos
Definicin: Una escala de intervalos es una escala ordinal con cuyos "valores" no
slo se pueden verificar igualdad, no igualdad y orden, si no tambin, se puede elegir
una unidad de escala y comprobar cuntas veces la diferencia entre dos valores es
igual a la diferencia entre otros dos valores de la escala (es decir, podemos
comparar intervalos).
Esto es, si x 1 , x 2 y x 3 son tres valores en la escala de intervalo, se verifica, por
ejemplo, la relacin:
x 3 x1 c ( x 2 x1 )
x 3 x1
x 2 x1
x1 0
x2
x1
8
2
Solucin
Sea el valor que corresponde al 0.Entonces, si 0, 15, 20 y , 80, 100 son dos juegos
de valores en la misma escala de intervalos, entonces,
? 80
80 100
0 15
15 20
, de donde resulta
? 20 .
mensuales, tiempo de vida til, etc.. Con sus valores, que son nmeros, se pueden
realizar operaciones aritmticas.
Las variables cuantitativas, a su vez, se clasifican en: discretas, y continuas.
Variable cuantitativa discreta, es aquella variable cuantitativa que puede tomar
slo un determinado nmero de valores y no admite ningn valor entre dos valores
consecutivos fijos. Generalmente, es una variable cuyos valores se obtienen por
conteo (nmeros naturales). Por ejemplo, una familia puede tener 0, 1, 2,...hijos, pero
no algn valor intermedio.
Otro ejemplo, el nmero de estudiantes de una clase es una variable discreta ya que
solo tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1.5
estudiantes
Variable cuantitativa continua, es aquella variable cuantitativa que puede tomar
cualquier valor dentro de dos valores consecutivos. Por ejemplo, el salario, el peso, el
tiempo empleado para realizar un trabajo, la estatura, volumen, longitud, etc..
No obstante en muchos casos el tratamiento estadstico hace que las variables
discretas las trabajemos como si fuesen continuas y viceversa.
Una variable continua puede pues tomar infinitos valores intermedios en un intervalo
dado. Para fines prcticos los valores numricos de las variables continuas siempre
son valores aproximados.
Ejercicio. Clasifique las variables e indique el tipo de escala en que estn medidas
las siguientes caractersticas:
- Profesin
- Nacionalidad
- Grado de instruccin
- Nmero de hermanos
- Nmero de telfono
- Direccin
- Ao de nacimiento
- Edad
- Estado civil
- Ingreso mensual familiar
- Documento nico de identidad
Nacionalidad
Argentina (*)
Argentina
Argentina
Argentina
Argentina
Argentina
Boliviana
Boliviana
Boliviana
Chilena
Chilena
Sexo
Masculino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Masculino
Femenino
Masculino
Femenino
Elabore una tabla de resultados que consolide la informacin dispersa en esta base de
datos construida por la Oficina de Admisin del Hotel CONFORT.
Solucin.
NUMERO Tabla N 1
TITULO
Qu?
Nmero de turistas extranjeros que fueron atendidos.
Dnde? en el hotel CONFORT
Cmo?
segn nacionalidad por sexo (1)
Cundo? (Periodo: Febrero 2007)
Encabezado
Cuerpo
Nmero de Turistas
Extranjeros
Nacionalidad Nmero
%
(n i )
(h i )
Argentina (2)
6
54.5
Boliviana
3
27.3
Chilena
2
18.2
Total General
11
100.0
NOTAS DE PIE
Sexo
Masculino
Femenino
Nmero
%
Nmero
(n i )
(h i )
(n i )
3
50.0
3
2
33.3
1
1
16.7
1
6
100.0
5
%
(h i )
60.0
20.0
20.0
100.0
FUENTE
RESPONSABLE
FECHA
01/ 03 / 2007
Valores de la
variable X
x1
x2
.
.
Frecuencias
absolutas n i
n1
n2
.
.
xk
Frecuencias
relativas h i
h1
h2
.
.
nk
hk
Total
pk
Frecuencias
porcentajes p i
p1
p2
.
.
i 1
i 1
p i 100
i 1
Ejemplo. Supngase que ante la pregunta del nmero de hijos por familia (variable
X) una muestra de 20 hogares, marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1,
2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de
frecuencias de X se da en la tabla 2.6.
Tabla 2.6. Distribucin de frecuencias del nmero de hijos por familia.
Nmero de
hijos
Xi
0
1
2
3
4
Total
Frecuencias
Absolutas
ni
1
4
7
6
2
20
Frecuencias
Relativas
hi
0.05
0.20
0.35
0.30
0.10
1.00
Frecuencias
Porcentajes
hi (%)
5
20
35
30
10
100
161
176
168
185
172
181
178
166
179
169
159
175
178
161
168
182
171
164
177
175
156
169
154
174
167
181
172
170
163
177
168
187
170
173
166
180
170
160
169
176
168
184
171
165
168
179
169
158
175
167
165
182
171
163
177
168
161
152
174
167
181
170
161
162
176
168
186
172
166
166
180
169
159
175
168
168
183
171
165
178
169
169
155
174
167
181
170
170
163
177
168
188
173
donde:
K = nmero de clases
n = nmero de elementos en la muestra (tamao de la muestra).
Est formula es muy til porque orienta al principiante. Sin embargo, es un poco
conservador y tiende a dar un nmero de clases un poco menor del que se utiliza en
la practica.
En nuestro ejemplo:
K = ? , n = 100
R
K
38
4 . 75
Redondeamos a 5.
Luego c = 5 y por tanto, el nuevo recorrido ser:
R c K 5 8 40
155
160
165
170
175
180
185
190
Figura 2.4
Sin embargo una dificultad se presenta cuando algunos de los datos coincide con
cualquiera de los puntos de divisin: 150, 155, 160, 165, 170, 175, 180, 185 y 190.
5. Supongamos que un dato es 155 donde lo colocamos?- en el primer intervalo
cuyos extremos son 150 y 155?- (ver Fig. 2.1) en el segundo intervalo que tiene
por extremos 155 y 160?Para aclarar est ambigedad adoptamos, el intervalo abierto por la izquierda que no
incluye al valor 150 (lmite inferior del intervalo) y cerrado por la derecha que
incluye al valor 155 (lmite superior del intervalo). Este tipo de intervalo se
representa matemticamente por: ( Y i 1 Y i , donde Y i 1 representa el lmite inferior
del intervalo y Y i representa el lmite superior.
As, en nuestro ejemplo el primer intervalo lo escribiremos como
Por tanto los intervalos de clase quedan definidos como:
( 150 155
Intervalo
de clases
(150 - 155]
(180 - 185]
(155 - 160]
(160 - 165]
(165 - 170]
(170 - 175]
(170 - 180]
(185 - 190]
Nota.- Tambin existen otros dos tipos de intervalos de clases, definidas como:
( Y i 1 Y i )
Y i 1
6. Es conveniente que todos y cada uno de los datos que se hallen dentro de un
mismo intervalo, estn representados por un mismo valor. Este valor caracteriza a la
clase y por eso se llama marca de clase, se obtiene promediando los lmites de cada
intervalo. Una formula para calcular la marca de clase o punto medio de un intervalo
es:
Yi
Y i 1 Y i
2
150
155
160
165
170
175
180
185
155
160
165
170
175
180
185
190
Marca de clase
Yi
Conteo
Frecuencia
ni
152.5
157.5
162.5
167.5
172.5
177.5
182.5
182.5
Marca de clase
( Y i 1 Y i
Yi
150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total
152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5
4
5
12
33
17
16
9
4
100
0.04
0.05
0.12
0.33
0.17
0.16
0.09
0.04
1.00
4
9
21
54
71
87
96
100
Frecuencia
acumulada
0.04
0.09
0.21
0.54
0.71
0.87
0.96
1.00
Propiedad.
n1 n
i 1
n1 n
j1
Propiedad.
i 1
ni
, de donde
ni N1 N
i 1
ni
0 hi 1
i 1, 2, ..., k. .
n
k
Propiedad.
h1 h
i 1
Propiedad.
i 1
N
n
j1
j1
n
n
i
j
j1
hi
Interpretacin.
n2 = 5, significa que 5 alumnos tienen una estatura mayor de 155 cm. y menor o igual
a 160 cm.
N4 = 54, significa que 54 alumnos tienen una estatura mayor que 150 cm. y menor o
igual que 170 cm., o tambin significa que 54 alumnos tienen una estatura menor o
igual a que 170 cm.
h3 = 0.12, significa que el 12% de los alumnos tienen una estatura mayor de 160 cm.
y menor o igual a 165 cm.
H6 = 0.87, significa que el 87% de los alumnos tienen una estatura mayor que 150
cm. y menor o igual que 180 cm., o tambin significa que 87% de los alumnos tienen
una estatura menor o igual a que 180 cm.
N6 - N2 = 87 - 9 = 78 alumnos tienen una estatura mayor que 160 cm. Y menor o
igual que 180 cm.
Observacin 1.
1. Cuando el tamao de la muestra n < 25, el nmero de intervalos de clases a
considerar debe ser K=5; y K n , si n > 25.
2. Los limites reales de clase, se calculan dependiendo de si los lmites de los
intervalos son abiertos o cerrados.
3. Si los intervalos son cerrados o abiertos en ambos lmites, la marca de clase se
calcula como el promedio de los lmites superior e inferior de cada intervalo. Si los
lmites de clases son diferentes (inferior cerrado y superior abierto, o viceversa) la
marca de clase se obtiene promediando el lmite inferior (o superior) con el mismo
limite que lo precede.
1.14. Distribucin de frecuencias: Variable cualitativa
Supongamos que en una muestra de n unidades estadsticas se observan k categoras
o modalidades diferentes C1, C2,..., Ck, de alguna variable cualitativa X. Para
ilustrar la tabulacin de la distribucin de frecuencias por categoras, consideremos
el siguiente ejemplo.
Nmero de
Consumidores: ni
8
9
3
20
Frecuencias
relativas: hi
0.40
0.45
0.15
1.00
Frecuencias
Porcentajes: hi(%)
40
45
15
100
N m er o de fa m ilia s
0
0
Nmero de hijos
Nmero de alumnos
40
30
20
10
0
150 155 160 165 170 175 180 185 190
Estatura en cm.
Figura 2.6. Histograma de frecuencias del alumnos segn su estatura, ver tabla 2.8.
b) Polgono de frecuencias.
Cuando la variable est agrupada en intervalo de clase, el polgono de frecuencia
se obtiene uniendo los puntos medios de las bases superiores de cada rectngulo
en el histograma.
Nmero de alumnos
40
30
20
10
0
147.5 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 192.5
Estatura en cm.
Figura 2.7. Polgono de frecuencias de la estatura de los alumnos de la tabla 2.8.
Nmero de alumnos
100
80
60
40
20
0
150
155
160
165
170
175
180
185
190
Estatura en cm.
Figura 2.8. Polgono de frecuencias acumuladas Menor o igual que para la estatura
de los alumnos de la tabla 2.8.
N m e ro d e p e rso n a s
10
8
6
4
2
0
Blanco
Negro
Rojo
Nmero de
Consumidores: ni
8
9
3
20
Frecuencias Frecuencias
relativas: hi Porcentajes: hi(%)
0.40
40
0.45
45
0.15
15
1.00
100
Sector circular:
en grado
144.0
162.0
54.0
360.0
15.00%
Blanco
Negro
Rojo
40.00%
45.00%
Figura 3.10. Diagrama de sectores circulares para los datos de la tabla 2.9.