Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MAPA CONCEPTUAL
________________________
DEFINICIN DE
POBLACIN Y MUESTRA
VARIABLES ALEATORIAS
DESCRIPCIN DE LOS
PARMETROS ESTADSTICOS
REPRESENTACIN GRFICA
MEDIDAS DE CENTRALIZACION
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
INTRODUCCIN
___________________
Los pasos a seguir para realizar una investigacin estadstica seran los siguientes:
Problema Recogida y Organizacin de datos Anlisis e interpretacin Conclusiones y decisiones
OBJETIVOS
________________________
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
CONOCIMIENTOS PREVIOS
___________________________________
Variable cualitativa: los datos que forman la variable no son numricos. Por ejemplo,
religin a la que se pertenece, tipo de automvil, color de los ojos,...
Variable cuantitativa: los datos que forman la variable s son numricos. Por ejemplo,
saldo de una cuenta corriente, velocidad de los coches,...
Dentro de este grupo de variables podemos distinguir otras dos categoras. Por una
parte, tendramos las variables discretas que seran aquellas que slo pueden asumir
ciertos valores (por ejemplo, nmero de automviles/h. en una autopista, nmero de
estudiantes en la asignatura de estadstica,...) y por otra parte, las variables continuas
que pueden tomar cualquier valor dentro de un rango especfico (por ejemplo, alturas de
los alumnos de una clase, tiempo transcurrido en el vuelo de Barcelona a Madrid,...)
Por ltimo, una vez tenemos recogidos los datos, agrupamos stos de forma excluyente
dando a cada uno de ellos el nmero de observaciones, es decir, el nmero de veces que se
repite cada valor, este nmero tomar el nombre de frecuencia.
CONCEPTOS FUNDAMENTALES
______________________________
Las tcnicas utilizadas para la descripcin de datos se dividen, bsicamente, en dos bloques:
-
Medidas de centralizacin
Las medidas de centralizacin nos sirven para representar el valor medio de los datos, es
decir, el valor que refleja el tamao del dato ms esperado. Ello nos indica la posicin en la
que se encuentra en el centro de los datos. [2]
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
1
N
i=1
En cambio, si lo que estamos calculando es la media muestral, la notacin ser la que sigue:
n
X=
1
xi
n i=1
Ejemplo:
La biblioteca virtual de la UOC quiere conocer el tiempo medio que tardan los usuarios en
devolver los prstamos. Se ha tomado una muestra de 15 usuarios, obteniendo los
siguientes tiempos, en das, de devolucin:
U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 U12 U13 U14 U15
10 20 12 14 16 18 22 10 16 13 21 15 12 20 18
Para calcular la media aritmtica de esta distribucin,lo haremos de dos formas:
Manualmente:
X=
1
15
15
i=1
Con Minitab:
Introducimos los valores en el espacio de trabajo y seleccionamos, Calc > Column
Statistics y activamos la opcin Mean:
Column Mean
Mean of C1 = 15.800
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Mediana : Es un nmero tal que, si ordenamos los datos de forma creciente o decreciente,
cumple la condicin de ser mayor que una mitad y menor que la otra. Es decir, divide a la
distribucin en dos partes iguales.
Si el nmero de observaciones es impar la mediana es el valor central. En caso de que el
nmero de observaciones sea par la mediana ser la media de los dos valores centrales.
Ejemplo:
Siguiendo con el ejemplo anterior, ordenamos los datos en orden creciente:
10 10 12 12 13 14 15 16 16 16 18 20 20 21 22
Para calcular la mediana lo haremos tambin de dos formas:
Manualmente:
Como el nmero de observaciones es impar, la mediana ser el valor que ocupa el
lugar central, en este caso, la posicin octava. Por tanto, la mediana ser 16.
Con Minitab:
Seleccionamos, Calc > Column Statistics y activamos la opcin Median:
Column Median
Median of C1 = 16.000
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Medidas de dispersin
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, necesitamos conocer tambin la dispersin que presentan los datos en su
distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad a la
hora de describirlos e interpretarlos.
Recorrido o amplitud: Es la diferencia entre el valor mximo de la distribucin y el valor
mnimo.
Ejemplo:
Del ejemplo anterior, observamos que el valor mximo es 22 y el valor mnimo es 10, por
tanto el recorrido de la distribucin ser 12.
Cuartiles: As como la mediana divide a la distribucin en mitades, los cuartiles de una
distribucin son los valores que dividen la distribucin en cuartos.
El primer cuartil (Q1) deja un cuarto de las observaciones por debajo del mismo, y tres
cuartos por encima. El segundo cuartil (Q2) tiene dos cuartos por debajo y dos por encima (el
segundo cuartil coincide con la mediana). El tercer cuartil (Q3) tiene tres cuartos de las
observaciones por debajo y un cuarto por encima.
Ejemplo:
Utilizamos los datos ordenados del ejemplo para calcular los cuartiles:
10 10 12 12 13 14 15 16 16 16 18 20 20 21 22
Manualmente:
Partimos en dos la distribucin, la mitad superior:
10 10 12 12 13 14 15
Q1=12
Y la mitad inferior:
16 16 18 20 20 21 22
Q3=20
Para calcular los cuartiles calculamos las medianas de ambas mitades, la de la primera mitad
corresponder al primer cuartil y la de la segunda corresponder al tercer cuartil.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
M=16
Q1=12
Min=10
( X )
Varianza poblacional 2 =
i=1
( X X)
Varianza muestral s2 =
i=1
n 1
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
N
15
Mean
15.80
Median
16.00
TrMean
15.77
Variable
C1
Minimum
10.00
Maximum
22.00
Q1
12.00
Q3
20.00
StDev
3.95
SE Mean
1.02
En resumen,
x
n
(x
x)
n 1
CV =
s
100
X
Representacin grfica
Dos de las tcnicas estadsticas ms importantes para representar un conjunto de datos son
las siguientes:
Diagrama de tallo y hojas: Cada valor numrico se divide en dos partes. Los dgitos
principales forman el tallo y los dgitos secundarios las hojas. Los tallos estn colocados a lo
largo del eje vertical, y las hojas de cada observacin a lo largo del eje horizontal.
Ejemplo:
A continuacin, se muestran los salarios anuales (en ) de los 11 trabajadores del
departamento de marketing de una empresa de material informtico:
Sueldos H
38985
29548
41889
31528
38791
32782
Sueldos M
28938
32920
24749
39828
28985
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
2
3
3
3
3
3
4
= 6
9
1
2
88
1
2
2
3
3
= 5
4
88
2
9
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
10
para
comparar
Para ello, seleccionamos Graph > Histogram, completando los campos como sigue:
Frecuencia
0
25000 27500 30000 32500 35000 37500 40000 42500
Sueldos M
Frecuencia
0
25000 27500 30000 32500 35000 37500 40000 42500
Sueldos H
De ambos histogramas deducimos que, en este departamento, los sueldos de los hombres,
son ligeramente ms altos que los de las mujeres.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
11
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
12
Descriptive Statistics
Variable
Espaole
N
12
Mean
2677749
Median
2727407
TrMean
2658860
Variable
Espaole
Minimum
1738456
Maximum
3805934
Q1
2202983
Q3
3125765
StDev
572734
SE Mean
165334
Del anterior resultado, podemos observar cules son los parmetros estadsticos ms
importantes, por ejemplo, la media de espaoles que residieron en algn hotel fue de
2677749, el valor central (mediana) es 2727407, as como 2202983 y 3125765 los valores de
los cuartiles primero y tercero, respectivamente.
b) Construir un histograma del Grado de ocupacin hotelera.
Para realizar un histograma de una coleccin de datos, seleccionamos la opcin Graph >
Histogram:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
13
Nota.- Para introducir colores, texto, etc. en el grfico seleccionaremos la opcin de Edit
Attributes, o bien, una vez realizado el grfico clicando dos veces sobre la parte del grfico
que queremos modificar.
Del anterior grfico podemos deducir, bsicamente, que la ocupacin hotelera se encuentra
siempre por encima del 40% y ni siquiera en los meses de verano supera aproximadamente
el 80%. Cabe destacar que son datos generales de todo el pas, evidentemente, la ocupacin
hotelera en los meses de verano y vacaciones, los hoteles de la costa alcanzarn mayor cota
de ocupacin.
c)
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
14
Del anterior grfico cabe destacar que el valor de la mediana de turistas espaoles es
ligeramente superior a la de extranjeros, as como el resto de valores. Observamos que, por
ejemplo, el valor del tercer cuartil de Extranjeros se acerca al valor del tercer cuartil de
Espaoles.
Observemos tambin que en ninguna de las dos observaciones aparecen valores extremos
(outliers), si fuera as, apareceran con un asterisco en la posicin adecuada.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
15
Nota.- Observar que, tras seleccionar la columna de la cual queremos calcular el parmetro
estadstico, podemos guardar los resultados en una determinada columna o bien, dejar el
espacio en blanco, obteniendo el resultado en la pantalla de Session.
Column Mean
Mean of E.M. Esp = 2.5408
Column Median
Median of E.M. Esp = 2.4100
Por tanto, deducimos que el nmero medio de estancia en das anual de turistas espaoles
es de aproximadamente 2.54, valor que difiere ligeramente de la mediana cuyo valor es 2.41.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
16
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
17
Descriptive Statistics
Variable
Inv_vale
Inv_Esp
N
4
4
Mean
1018
15392
Median
664
13556
TrMean
1018
15392
Variable
Inv_vale
Inv_Esp
Minimum
105
616
Maximum
2638
33840
Q1
218
3445
Q3
2171
29174
StDev
1115
13792
SE Mean
558
6896
Seleccionamos Calc > Column Statistics y rellenamos de la siguiente manera, para calcular la
media de los Tcnicos I+D de Valencia:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
18
Column Mean
Mean of I+D_Val = 377,40
Por tanto, como la media aritmtica es superior a la mediana, podramos afirmar que en la
distribucin correspondiente a la variable Tcnicos en I+D de la Comunidad Valenciana es
positivamente sesgada.
Anlogamente, resolvemos para la variable Tcnicos en I+D de Espaa, obteniendo los
siguientes resultados:
Column Mean
Mean of I+D_Esp = 5898,4
Column Median
Median of I+D_Esp = 4134,6
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
19
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
20
En los anteriores diagramas, podemos observar que la mediana del ao 2000-01 es bastante
superior a la del 1997-98, as como el mximo de ambas distribuciones.
Adems, cabe destacar que ambas distribuciones estarn claramente sesgadas hacia la
derecha ya que la lnea superior es bastante ms larga que la inferior. En la segunda variable,
prcticamente coinciden el primer cuartil y el valor mnimo.
Finalmente, comentar que los valores mnimos tanto en una variable como otra se dan en la
Universitad Miguel Hernndez y los mximos en la Universidad de Valencia.
X
aproximadamente el 9%.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
21
BIBLIOGRAFA
___________________________________
[1]
D.A. Lind, R.D. Mason, W.G. Marchal (2001): Estadstica para Administracin y Economa.
Ed. Irwin McGraw-Hill.F.
[2]
F. Moya Anegn, J. Lpez Gijn, C. Garca Caro (1996): Tcnicas cuantitativas aplicadas a
la biblioteconoma y documentacin. Ed. Sntesis.
[3]
ENLACES
___________________________________
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
22