Está en la página 1de 15

Estadística aplicada al turismo

Grado en turismo - Curso 2º

TEMA 1: NÚMEROS ÍNDICES

1. INTRODUCCIÓN (Examen)
En el presente capítulo y el que le sigue vamos a tratar de la descripción de fenómenos socioeconómicos a lo largo del tiempo a través de la
construcción de lo que se denominan números índices y el análisis clásico o descriptivo de las series temporales.
Los números índices constituyen el instrumental analítico más adecuado para estudiar la evolución de una serie de magnitudes económicas a través
de las cuales podemos dar respuesta a cuestiones tales como si la coyuntura económica es positiva o negativa, si el nivel de inflación es adecuado o
no o si nuestro ritmo de crecimiento económico permite o no permite crear empleo.
Un número índice puede definirse como una medida estadística que nos permite valorar la variación relativa de una magnitud simple o compleja a lo
largo del tiempo o del espacio. Lo más habitual es que se estudie la evolución de la magnitud a lo largo del tiempo, con lo que hay que establecer un
período inicial o base sobre el que se va a comparando la evolución de la magnitud o variable estadística.
El procedimiento de comparación es muy sencillo. Supongamos por ejemplo que queremos estudiar la evolución de la producción de automóviles,
siendo X0 el valor de la misma en el período base (un año determinado) y X t los automóviles fabricados en otro período t distinto del base que se
denomina período de comparación.
El índice de evolución de 0 a t expresado en tantos por cien será: It0 = Xt / X0 · 100
La expresión toma el valor 100 en el período base.

2. CLASIFICACIÓN DE NÚMEROS ÍNDICE (Examen)


Los números índices se clasifican atendiendo a la naturaleza de las magnitudes que miden (simples o complejas) y a la importancia relativa de cada
componente dentro del conjunto en el caso de las complejas. Según estos criterios tenemos los siguientes tipos de números índices:
- Números simples índices: surgen cuando se estudia la evolución a lo largo del tiempo de una única magnitud (no admite desagregación).
- Números índice complejos sin ponderar: surgen cuando se estudia la evolución de una magnitud que tiene más de un componente y a
todos ellos se les asigna la misma importancia o peso relativo. Éstos índices tienen poco uso en el mundo de la economía.
- Números índices complejos ponderados: surgen cuando a los componentes de la magnitud compleja que se está estudiando se le asigna a
cada uno un determinado coeficiente de ponderación. Este tipo de números índices son los que realmente se emplean en el análisis de la
evolución de los fenómenos complejos de naturaleza económica.

3. PROPIEDADES DE LOS NÚMEROS ÍNDICES (Examen)


a) Existencia: el número índice debe concretarse en un valor real y finito distinto de cero.
b) Identidad: si se hacen coincidir los períodos base y de comparación el índice vale la unidad si se expresa en tantos por uno, o cien, si es en
tantos por 100.
c) Inversión: el producto de los índices en los que se han invertido los períodos base y de comparación es igual a la unidad.
d) Circular: es una generalización de la de inversión. Si generalizamos a tres períodos t’, t, 0, tendremos: I t1 · It · I0 = 1.
e) Proporcionalidad: si la magnitud varía en proporción 1 + K y fijado el período de comparación, el número índice también varía en la
misma proporción.
Estas propiedades no suelen cumplirse todas en el caso de los índices complejos o de varias componentes.
4. ÍNDICES DE PRECIOS
La magnitud que vamos a considerar en este caso concreto es el precio. Los números índices de precios se clasifican también en:
- Simples: se estudia el precio de un solo producto o servicio.
- Complejo: se refiere a un precio con varios componentes. Estos pueden ser:
o Sin ponderar: que incluye los índices de Sauerbeck y de Brastreet-Dutot.
o Transitorias: que incluye los índices de Laspeyres, Paasche, Edgeworth y Fisher.

4.1. Índices simples de precios


Se designan la magnitud precio del único componente del índice simple i por p. luego la expresión del índice simple de un precio para el período t
será:
Pit = Pit / Pi0 · 100

4.2. Índices complejos de precios sin ponderar


En este caso la magnitud cuya evolución medimos es compleja ya que intervienen en su definición varios componentes, es decir, los precios de varios
bienes. El índice complejo se puede definir empleando dos criterios: el de la media aritmética simple que nos lleva a la obtención del índice de
Sauerbercl o el de la media agregativa simple por el que construimos el índice de Bradstreet-Dutot.
4.2.1. Índices complejos de precios sin ponderar
Si tenemos N componentes del índice compuesto de precios, se deben obtener, en primer lugar los índices simples, para cada uno de los precios de
los artículos i. El índice de Sauerbeck será la media aritmética no ponderada de los mismos.
4.2.2. Índice de la media agregativa simple o de Bradstreet-Dutot
El concepto de media agregativa se emplea sólo en la elaboración de números índices. La media agregativa se define como el cociente entre la
media aritmética simple de los N precios en el momento t de comparación y la misma media en el período 0.

1
Estadística aplicada al turismo
Grado en turismo - Curso 2º

4.3. Índices complejos de precios ponderados


Este tipo de índices son los más representativos del fenómeno que se pretende estudiar y por tanto son los que se utilizan realmente. Los índices
complejos sin ponderar tienen el grave inconveniente que a todos los componentes se les da el mismo peso cuando en los casos reales de los
fenómenos económicos esto no ocurre.
4.3.1. Índice de precios de Laspeyres (Examen)
La distinta tipología de índices de precios complejos ponderados se genera a partir de los diferentes coeficientes de ponderación que se utilizan para
cada componente. Estos coeficientes asignan a cada elemento la importancia relativa que tiene dentro del conjunto.
Las ponderaciones que se utilicen estarán basadas en el valor de las transacciones en la fase comercial que se considere.
El índice de precios de Laspeyres utiliza como coeficientes de ponderación el valor de las transacciones en el período base. En economía entendemos
por valor el producto del precio por la cantidad: Vi0 = pi0 · qi0.
PL = ((Sumatorio) pit · qi0 / (Sumatorio) pi0 · qi0) · 100
El índice de precios de Laspeyres tiene la ventaja de que las ponderaciones del período base se mantienen fijas para todos los períodos considerados,
pero por el contrario aparece el inconveniente de que su representatividad disminuye a medida que nos alejamos de dicho período.
4.3.2. Índice de precios de Paasche
El índice de precios de Paasche utiliza como coeficientes de ponderación el producto de las cantidades consumidas en el período corriente valoradas
a los precios del período de base, es decir pi0 · qit.
Pp = ((Sumatorio) pit · qi0 / (Sumatorio) pi0 · qit) · 100
Las ponderaciones ya no son fijas sino variables. El índice de Paasche tiene la ventaja de que los pesos relativos de los distintos componentes se
actualizan en cada período.
4.3.3. Índice de precios de Edgeworth
En este índice se utiliza como coeficientes de ponderación la suma de los utilizados en los casos de Lespeyres y Pasche.
PE = ((Sumatorio) pit · (qi0 + qit) / (Sumatorio) pi0 · (qi0 · qit) · 100
4.3.4. Índice de precios de Fisher

Éste índice se define como la media geométrica de los índices de Laspeyres y Paasche: PF = PL · P P

5. ÍNDICES DE CANTIDADES O CUÁNTICOS


En economía existe una gran variedad de cantidades, pero las más relevantes so los volúmenes producidos por las empresas de una serie de artículos
que son denominados bien por las propias empresas (bienes intermedios o de producción) o por las familias (bienes de consumo final). Los índices
cuánticos complejos ponderados miden la evolución de estas magnitudes a lo largo del tiempo estableciéndose los adecuados coeficientes de
ponderación.
5.1. Índice cuántico de Laspeyres
Los coeficientes de ponderación el valor de las cantidades consumidas en el período base a precios de ese mismo período w i = qi0 · pi0, siendo qi0 las
unidades producidas o consumidas de artículo i en el período base y p i0 puede ser el precio final de venta si nos referimos a cantidades vendidas o
consumidas o puede ser el valor añadido por unidad producida si nos referimos a un índice de cantidades producidas. Hay que tener en cuenta que el
valor añadido por unidad es equivalente a un precio que nos da la verdadera importancia relativa del artículo.
5.2. Índice cuántico de Paasche
En este caso los coeficientes de ponderación serán w i = qi0 · pit. Se utilizan los precios de cada período al variar t.
5.3. Índice cuántico de Edgeworth
Los coeficientes de ponderación se obtienen sumando las utilizadas por el índice cuántico de Laspeyres y el índice cuántico de Paasche:
wi = qi0 · pi0 + qi0 · pit.

5.4. Índice cuántico de Fisher


Este índice se define como la media geométrica de los índices cuánticos de Laspeyres y Paasche.

6. PROPIEDADES QUE CUMPLEN LOS ÍNDICES COMPLEJOS PONDERADOS


Al estudiar de una forma genérica los números índices se comentó que deberían de cumplir una serie de propiedades ideales: existencia, identidad,
inversión, circular y de proporcionalidad. Así como los índices simples las cumplen su gran mayoría, los índices complejos ponderados no verifican
alguna de ellas.
Índices / Propiedades Existencia Identidad Inversión Circular Proporcionalidad
Sauerbeck Sí Sí No No Sí
Bradstreet-Dutot Sí Sí Sí Sí Sí
Laspeyres Sí Sí No No Sí
Paasche Sí Sí No No Sí*
Edgeworth Sí Sí Sí No Sí*
Fisher Sí Sí Sí No Sí*
La propiedad de proporcionalidad en los índices de Paasche, Edgeworth y Fisher se verifica pero con cierta limitación en el campo económico, pues
al variar los precios en una cierta proporción k, difícilmente las cantidades permanecerán constantes.

2
Estadística aplicada al turismo
Grado en turismo - Curso 2º

El índice más utilizado será el de Laspeyres, pues de los ponderados es el único que cumple la propiedad de proporcionalidad.
El índice de Laspeyres, tanto de precios como cuántico, es el más utilizado en los indicadores generales de precios y producción que elaboran todos
los países. Su diseño y posterior cálculo exige una rigurosa selección de sus componentes para que sea representativo del fenómeno que se pretende
estudiar a través de su estructura de coeficientes de ponderación.

7. ÍNDICES EN CADENA
Los índices estudiados anteriormente se utilizan frecuentemente para hacer un estudio a corto plazo, pero si el estudio es a largo plazo no son los más
adecuados.
Para evitar eso, se introducen los índices en cadena, que se obtienen a partir de una generalización de enlaces o empalmes de índices para los cuales
la base de cada índice es siempre el período de comparación del índice precedente, lo cual nos permite obtener una serie de índices referidos todos
ellos a la misma base.

8. CAMBIO DE BASE EN UNA SERIE DE NÚMEROS ÍNDICES


Si se tiene una serie de números índices cuyo período de base es el año cero, puede interesarnos cambiar la base 0 si está muy alejada en el tiempo
del período t de comparación.
Este cambio del período de base no implica efectuar un profundo estudio para determinar nuevos coeficientes de ponderación en el caso de los
índices complejos, sino simplemente apoyarse en las propiedades de inversión y circular que nos permite obtener el coeficiente técnico que
transforma la serie dada en la nueva con un período de base distinto.

9. RENOVACIÓN Y ENLACE DE SERIES DE NÚMEROS ÍNDICES CON DISTINTAS BASES


9.1. Renovación de componentes y de coeficientes de ponderación en los números índices complejos
El proceso de elaboración de un número índice complejo ponderado implica la adopción de una serie de decisiones: elección de los componentes que
entrarán a formar parte del índice para que este sea representativo en su conjunto, elección del período base y tipo de índice que se va a utilizar
teniendo en cuenta el coste asociado a la fórmula elegida.
Precisamente teniendo en cuenta dicho coste, es el índice de Laspeyres el más empleado, ya que como vimos, sus coeficientes de ponderación están
referidos al período base. Luego, a medida que nos alejamos de dicho período, como la actividad económica está sujeta a una constante evolución
por cambios en los hábitos de consumo y en los procesos tecnológicos, el conjunto de los componentes y sus coeficientes de ponderación dejan de
ser representativos del fenómeno objeto de estudio.
La solución es someter al índice a una profunda revisión de forma periódica, volviendo a elegir los componentes más representativos y sus nuevos
coeficientes de ponderación.
9.2. Enlace o empalme de series de números índices con distinta base
La necesidad de la renovación periódica nos lleva a contar con dos series de índices que tienen períodos base distintos y hay que enlazarlos o
empalmarlos para poder estudiar el fenómeno comparando su evolución con una única base.
El período base que se mantiene es el de la serie que lo tiene más cercano al momento actual de comparación aplicando el coeficiente de enlace o
empalme a la serie más antigua.
El concepto o definición de este coeficiente de enlace es el mismo que hemos dado en los cambios de base dentro de una misma serie, aplicándose
ahora sólo a los elementos de la serie que tenga la base más antigua.

10. ÍNDICES DE VALOR Y DEFLACIÓN DE SERIES ECONÓMICAS


10.1. Índices de valor
El proceso de multiplicar cantidades de bienes por sus respectivos precios nos transforma cantidades físicas heterogéneas en valores económicos que
son homogéneos al estar expresados en la misma unidad de cuenta y por tanto sumables o agregables.
Los índices de valor nos permiten estudiar la evolución a lo largo del tiempo de la cuantificación monetaria de un conjunto de bienes. Este valor se
llama nominal o en precios corrientes del año en curso.
La evolución del índice de valor a lo largo del tiempo está motivado por las variaciones conjuntas de los precios y las cantidades no pudiendo aislarse
la influencia de cada una.
En economía interesa analizar la evolución del valor del conjunto de mercancías bajo la óptica de lo que se denomina a precios constantes o unidad
monetaria constante, o sea, sin que se produzcan variaciones en los precios de los distintos componentes.
Para conseguirlo se realiza la operación conocida como deflación de series de valores expresados en precios o unidades monetarias corrientes de cada
año.
10.2. Deflación de series económicas (Examen)
Para poder efectuar análisis comparativos de una serie de valores entre distintos períodos, hay que convertir los euros corrientes, o de cada año, a
euros constantes, o del año que se considera como base.
Esto es lo que se denomina deflacionar la serie, es decir, dividir la serie en moneda corriente por el índice de precios que se considere más adecuado.
El índice elegido recibe el nombre de deflactor de la serie. El índice de precios de Laspeyres es el que se utiliza como deflactor.
Para deflacionar hay que hacer lo siguiente:
Serie de valores a precios corrientes / Índices de precios (en tantos por uno) = Serie de valores precios constantes

3
Estadística aplicada al turismo
Grado en turismo - Curso 2º

11. ÍNDICE DE PRECIOS DE CONSUMO (IPC)


El IPC es una medida estadística de la evolución de los precios de los bienes y servicios que consume la población residente en viviendas familiares
en España.
El conjunto de bienes y servicios, que conforman la cesta de la compra analizada por el índice, se obtiene básicamente del consumo de las familias y
de la importancia de cada uno de ellos en el cálculo del IPC está determinada por dicho consumo.
El IPC es un índice compuesto ponderado. Las ponderaciones del índice se obtienen a partir de la EPF (Encuesta Continua de Presupuestos
Familiares) realizada por el INE y a partir de la cual se determina la cesta de la compra de los hogares españoles.
A partir de enero de 2.002 la metodología del IPC se renovó completamente. Los cambios metodológicos introducidos en este Sistema han hecho del
IPC un indicador más dinámico, que se adapta mejor a la evolución del mercado, ya que se podrán actualizar las ponderaciones más frecuentemente.
Además, se podrán incluir nuevos productos en la cesta de la compra en el momento en que su consumo comience a ser significativo.
En la actualidad, para el cálculo del índice, se utiliza como período base el año 2.006.
El método de cálculo consiste en la utilización de un índice de Laspeyres encadenado.
a) Período base
El período base o período de referencia del índice es aquel en el que todos los índices se hacen igual a 100. Normalmente se trata de un
período anual. En el nuevo Sistema la media aritmética de los doce índices mensuales del año 2006 publicados, en baso 2001, se hacen
igual a 100, por tanto el período de referencia del índice es el año 2006.
b) Período de referencia de los precios
Es el período con cuyos precios se comparan los precios corrientes, es decir, el período elegido para el cálculo de los índices elementales.
El período de referencia de los precios varía cada año y es el del mes de diciembre del año inmediatamente anterior al considerado.
c) Período de referencia de las ponderaciones
El período de referencia de las ponderaciones es aquel al que están referidas las ponderaciones que sirven de estructura del Sistema.
d) Ámbito poblacional
La población del índice o estrato de referencia es el grupo de población cuya estructura de gasto de consumo sirve de base para la selección
de los artículos representativos y el cálculo de las ponderaciones de los mismos. En el IPC base 2006 incluye toda la población que reside
en viviendas familiares en España.
e) Ámbito geográfico
El ámbito geográfico de la investigación lo constituye todo el territorio nacional.
f) Campo de consumo
Es el conjunto de los bienes y servicios que los hogares del estrato de referencia destinan al consumo.
g) Cesta de la compra
Es el conjunto de los bienes y servicios seleccionados en el IPC cuya evolución de precios representa la de todos aquellos que componen la
parcela COICOP a la que pertenecen. El número total de artículos que componen la cesta del IPC base 2006 es 491.
h) Desagregación funcional de los índices
El IPC base 2006 se adapta completamente a la clasificación internacional de consumo COICOP.
La estructura funcional del IPC consta de 12 grupos, 37 subgrupos, 79 clases y 126 subclases.
Además, se mantienen las 57 rúbricas y los 28 grupos especiales existentes en el IPC base 2001.

12. ÍNDICES DE PRECIO DE CONSUMO ARMONIZADO


El Índice de Precios de Consumo Armonizado (IPCA) es un indicador estadístico cuyo objetivo es proporcionar una medida común de la inflación
que permita realizar comparaciones entre los países de la UE y entre éstos y otros países que no pertenecen a la UE.
El IPCA cubre el gasto de toda la población, tanto hogares ricos como pobres, urbanos como rurales, que vivan en hogares particulares o colectivos.
Además se incluye el gasto de los visitantes extranjeros y se excluye el realizado por los españoles fuera de nuestras fronteras, exceptuando el gasto
realizado por motivo de negocios.
A partir de enero de 2006, el año de referencia del IPCA es 2005.
Para calcular el índice correspondiente al período t se utiliza el índice de Laspeyres encadenado, que consiste en referir los precios de periodo
corriente a los precios de diciembre del año inmediatamente anterior; y perite que la actualización de las ponderaciones no cause una ruptura en la
series del IPC.

13. REPERCUSIÓN Y PARTICIPACIÓN EN LAS VARIACIONES DE UN ÍNDICE


Frecuentemente nos interesa conocer la repercusión que tiene la subida de precios de uno o varios artículos en el índice general, por ello vamos a
considerar el índice de Laspeyres y examinaremos la repercusión y l participación de un artículo en las variaciones del índice.
14. OTROS INDICADORES DE COYUNTURA EN ESPAÑA
a) Índices de producción industrial (IPI)
Es un índice de naturaleza cuántica cuyo objetivo es estudiar la evolución de los volúmenes de producción física de los distintos sectores
industriales excluida la construcción.

b) Índice de precios industriales


Completa con el anterior de producción la panorámica coyuntural de la industria en nuestro país. El precio que se mide es el de la salida de
fábrica y su cobertura de ramas de CNAE es la misma que en el caso del índice de producción. No cabe duda de que es el deflactor que
debe utilizarse para obtener la evolución del valor real de los bienes de producción intermedia.

4
Estadística aplicada al turismo
Grado en turismo - Curso 2º

c) Índices de ventas al por menor


Con el objetivo de conocer las características fundamentales de las empresas dedicadas al ejercicio del comercio al por menor en España,
que permitan medir, a corto plazo, la evolución de la actividad del sector, el INE construye un indicador de las ventas al por menor con
periodicidad mensual tomando datos en las grandes superficies de venta (Hiper y Grandes Almacenes) y el comercio minorista tradicional.

d) Indicadores turísticos
Entre ellos cabe destacar el Índice de Precios Hoteleros (IPH), el Índice de Ingresos Hoteleros (IIH) y otros.

e) Encuestas de coyuntura
• Encuesta de Coyuntura Industrial.
• Encuesta de Coyuntura de la Construcción.
• Encuesta de la Coyuntura Laboral.
• Encuesta de Ocupación Hotelera.

TEMA 2: ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES

1. INTRODUCCIÓN
Con el estudio descriptivo de las series temporales tratamos de hacer predicciones del fenómeno en estudio teniendo en cuenta sus características
históricas o del pasado. Lo denominamos estudio clásico o descriptivo de las series temporales ya que se ha venido empleando en exclusividad desde
la segunda mitad del siglo XIX. En el sector del turismo, el estudio de las series temporales es de una gran aplicación.

2. CONCEPTO DE SERIE TEMPORAL Y DE SUS COMPONENTES (Examen)


Se define como serie temporal (también denominada histórica, cronológica o de tiempo) a un conjunto de datos, correspondientes a un fenómeno
económico, ordenados en el tiempo.
Es fundamental que los datos estén ordenados en el tiempo de forma que cada observación deberá estar asociada a un determinado período. Luego en
esencia una serie de tiempo es una distribución de frecuencias bidimensionales (t, y t), donde la variable endógena yt es la magnitud en estudio y la
exógena o independiente es el tiempo t.
Se estudia el pasado histórico de y t (sus componentes) de forma descriptiva y bajo el supuesto de que su estructura va a permanecer constante se
hacen predicciones para el futuro.
En la representación gráfica de las series temporales se utilizan los ejes cartesianos. En el eje de abscisas se representa el tiempo t y los valores de la
magnitud observada yt en ordenadas, con lo que se obtiene una serie de puntos (t, y t) que, al unirlos, nos dan un impacto gráfico de la serie del que se
puede sacar unas primeras conclusiones de la evolución histórica de la magnitud.
En el estudio clásico de las series temporales se considera que el resultado de la observación de la magnitud estudiada en un determinado período es
consecuencia de la actuación de cuatro componentes o fuerzas:
- Tendencia (T): es una componente de la serie que refleja su evolución a largo plazo. Este largo plazo será distinto según sea la naturaleza
de la serie, pero cuantos más períodos se tengan, mejor será el análisis. Esta componente puede ser de naturaleza estacionaria o constante,
de naturaleza lineal, de naturaleza parabólica, de naturaleza exponencial u otras posibles.
- Las variaciones cíclicas (C): es una componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Estas
oscilaciones no son regulares y se presentan en los fenómenos económicos cuando se dan de forma alternativa etapas de prosperidad o de
depresión.
- Las variaciones estacionales (E): es una componente de la serie que recoge las oscilaciones que se producen en períodos de repetición
iguales o inferiores a un año. Si se considera el año el período marco o de repetición, pueden observarse las fluctuaciones de la magnitud a
lo largo de sus trimestres. El origen de las variaciones estacionales puede estar en factores físico-naturales como son las estaciones
climatológicas o en factores culturales o de tradición.
- Las variaciones accidentales (A): es una componente de la serie que recoge las fluctuaciones erráticas que se dan por la ocurrencia de
fenómenos imprevisibles. También reciben el nombre de variaciones irregulares, residuales o erráticas. Además también existen pequeñas
variaciones de origen aleatorio cuyas causas pueden ser múltiples.

3. DETERMINACIÓN DE LA TENDENCIA
Su determinación sólo debe efectuarse cuando se disponga de una larga serie de observaciones.
3.1. Método de las medias móviles
Es un método de naturaleza mecánica que consiste en sustituir la serie temporal observada por una amortiguada o suavizada obtenida por el cálculo
reiterado de valores medios y que representa la tendencia. Su aplicación consiste en lo siguiente:
- Partimos de la serie temporal observada yt.
- Se obtiene sucesivas medias aritméticas para cada y t con un número de observaciones anteriores y posteriores que se han
fijado de antemano. Si el número de observaciones utilizado es impar, la media obtenida coincide (está centrada) con el
período t. Si el número utilizado es par, la media no coincide con el período t (está descentrada) y hay que volver a calcular
una nueva media utilizando las medias calculadas anteriormente.
- La serie formada por los valores de las medias nos indica la línea amortiguada de la tendencia.

3.2. Método analítico de los mínimos cuadrados

5
Estadística aplicada al turismo
Grado en turismo - Curso 2º

Este método tiene la ventaja, en comparación con el de las medias móviles, de que se expresa la tendencia a través de una función matemática que
relaciona la magnitud que se está estudiando con el período t que actúa como variable independiente.
El ajuste lo realizamos por el método de los mínimos cuadrados que ya se estudió en la regresión entre dos variables estadísticas.
En primer lugar, conviene representar gráficamente la serie temporal observada con objeto de decidir qué tipo de función es la más adecuada: de tipo
lineal, parabólico…
Aquí solo vamos a tratar el ajuste lineal ya que representa a la mayoría de los fenómenos económicos. Como ya sabemos, el método de los mínimos
cuadrados consiste en minimizar la suma de los cuadrados de las diferencias entre los valores observados en los distintos períodos y los estimados
por la ecuación de la recta: yt = a + bt.

4. DETERMINACIÓN DE LAS VARIACIONES ESTACIONALES (Examen)


Esta componente se definió como oscilaciones de la magnitud en períodos de repetición de un año o inferiores. Cuando se pretende estudiar la
evolución real de los fenómenos económicos hay que eliminar la componente estacional, ay que sus fluctuaciones pueden distorsionarla. Este
proceso recibe el nombre de desestacionalización de la serie observada.
Antes de proceder a la determinación de las variables estacionales, hay que asegurarse de que existen haciendo una representación gráfica de los
valores observados y viendo la regularidad en las oscilaciones.
En ciertas ocasiones, la estacionalidad no tiene regularidad, variando de posición y amplitud en las oscilaciones de un período de repetición a otro.
Por otro lado, hay que determinar si la que actúa es la hipótesis aditiva, multiplicativa o mixta.
a) Método de la razón a la media móvil para determinar la componente estacional en una serie temporal:
Este método aísla la componente estacional mediante la eliminación sucesiva de las demás componentes.
En la aplicación del método se siguen los siguientes pasos:
- Se determina la tendencia por el método de medias móviles centradas en los períodos.
- Se divide (según la hipótesis multiplicativa de actuación de las componentes) la serie observada por su correspondiente media móvil
centrada, con lo que estamos eliminando de forma conjunta las componentes del largo plazo (tendencia y ciclo).
- Con objeto de eliminar la componente accidental, se calculan las medias aritméticas a nivel de cada estación.
- Una vez que se han calculado las medias estacionales se obtienen los denominados índices de variación estacional de la siguiente manera:
se calcula la media aritmética anual (MA) de las medias estacionales.
- Una vez obtenidos los índices de variación estacional puede desestacionalizarse la serie observada dividiendo cada valor de la
correspondiente estación por su índice correspondiente, expresados en tantos por uno.

b) Método de la tendencia por ajuste mínimo cuadrático para determinar la componente estacional en una serie temporal bajo la hipótesis
aditiva:
La diferencia con el método de la razón a la media móvil es que en este caso las componentes a largo plazo (tendencia y ciclo) las obtenemos
mediante un ajuste por mínimos cuadrados de las medias aritméticas anuales y se actúa bajo la hipótesis aditiva. Los pasos a seguir son:
- Se calculan las medias anuales de los datos observados.
- Se ajusta una recta por mínimos cuadrados yt = a + bt, empleando el proceso y formulación que ya se estudió en su momento que
representa la tendencia. Sabemos que el coeficiente angular b de la recta mide el incremento medio anual de la tendencia que influirá de
distinta forma al pasar una estación a otra, como se verá más adelante.
- Se calculan con los datos observados las medias estacionales con objeto de eliminar la componente accidental. Estas medias aritméticas son
brutas ya que se siguen incluyendo los componentes a largo plazo y tienen que someterse a una corrección de las mismas.
- Empleando el incremento medio anual dado por el coeficiente b, se obtienen las medias estacionales corregidas de las componentes a largo
plazo bajo el esquema aditivo.
- Los índices de variación estacional se obtienen con la misma sistemática utilizada en el método de la razón a la media móvil: con las
medias estacionales corregidas se obtiene la media aritmética anual que sirve de base para calcular los índices.
- Obteniendo estos índices de variación estacional estamos en condiciones de desestacionalizar la serie como se ha efectuado anteriormente.

5. DETERMINACIÓN DE LAS VARIACIONES CÍCLICAS (Examen)


Recoge las oscilaciones periódicas de larga duración. El problema es que estos movimientos no suelen ser regulares como los estacionales y su
determinación encierra dificultades.
Se suelen tratar conjuntamente con la tendencia llamando componente extraestacional al efecto de (T x C) si estamos en el marco multiplicativo o
(T + C) si estamos en el aditivo.
A pesar de las dificultades, se puede tratar de aislar el ciclo bajo la hipótesis multiplicativa dejándolo como residuo con la eliminación de la tendencia
y la variación estacional. Los pasos serían:
- Estimar la tendencia.
- Calcular los índices de variación estacional.
- Se desestacionaliza la serie observa.
- Se elimina la tendencia dividiendo cada valor desestacionalizado por la serie de tendencia.

Expresado el proceso en forma de cociente sería. yt / (T x E) = (T x E x C x A) / (T x E) = C x A


El proceso finalizaría intentando eliminar la componente accidental A y determinando el período de los ciclos que nos llevaría a un tratamiento de
análisis armónico que superaría el nivel descriptivo que estamos danto al tratamiento clásico de las series temporales.

6
Estadística aplicada al turismo
Grado en turismo - Curso 2º

TEMA 3: FENÓMENOS ALEATORIOS Y PROBABILIDAD


1. INTRODUCCIÓN
La inferencia estadística sería utilizada cuando la observación de la población no es exhaustiva, es decir, cuando se observa un conjunto o muestra de
la misma, de tal manera que los resultados o conclusiones obtenidas de la muestra se generalizan a la población.
La muestra se toma para obtener un conocimiento o información de población, pero nunca nos proporcionará una información exacta sino que
incluirá un cierto nivel de incertidumbre.

2. EXPERIMENTOS ALEATORIOS (Examen)


Un experimento es cualquier situación u operación en la cual se pueden presentar uno o varios resultados de un conjunto bien definido, y conocido
previamente, de posibles resultados.
Estos experimentos pueden ser de dos tipos:
- Determinístico: cuando al repetirlo bajo idénticas condiciones iniciales se obtienen siempre los mismos resultados. Ejemplo: medir una
barra.
- Aleatorio: cuando al repetirlo bajo idénticas condiciones iniciales, no se obtienen siempre los mismos resultados y previamente no
sabemos el resultado que se obtendrá. Ejemplo: lanzamiento de una moneda, lanzamiento de dados… Las características de un
experimento aleatorio son:
o Se puede repetir indefinidamente bajo idénticas condiciones.
o Cualquier modificación mínima de las condiciones iniciales de la repetición puede modificar completamente el resultado final del
experimento.
o Se puede determinar el conjunto de los posibles resultados del experimento, pero no se puede predecir previamente un resultado
particular.
o Si el experimento se repite un número grande de veces, entonces aparece algún modelo de regularidad estadística en los
resultados obtenidos.

3. ESPACIO MUESTRAL
Cada uno de los posibles resultados del experimento aleatorio se denomina resultado básico o elemental, comportamiento individual o punto muestral
y el registro sistemático de los resultados obtenidos en sucesiones de experimentos aleatorios da lugar a un conjunto de datos estadísticos.
Los resultados básicos elementales serán definidos de tal manera que no puedan ocurrir dos simultáneamente, pero sí ocurrirá uno necesariamente.
Al conjunto de todos los resultados elementales del experimento aleatorio lo llamaremos conjunto universal, espacio muestral o espacio de
comportamiento y lo designaremos por E.

4. SUCESOS (Examen)
En muchos casos cuando realizamos un experimento aleatorio no nos interesan, directamente, los resultados elementales del experimento aleatorio,
sino lo que nos puede interesar es algún subconjunto de esos resultados elementales, es decir, un conjunto contenido en el espacio muestral.
Un suceso S es un subconjunto del espacio muestral, es decir, un subconjunto de resultados elementales del experimento aleatorio. Diremos que
ocurre o se presenta el suceso cuando al realizarse el experimento se obtiene uno de los resultados elementales pertenecientes al subconjunto que
define el suceso.
Podemos considerar 4 tipos de sucesos:
- Suceso elemental, simple o punto muestral: es cada uno de los resultados posibles del experimento aleatorio. Un suceso elemental consta
de un solo elemento del espacio muestral E.
- Suceso compuesto: es el que consta de dos o más sucesos elementales.
- Suceso seguro, cierto o universal: es el que consta de todos los sucesos elementales del espacio muestral E, es decir, coincide con el
espacio muestral E. Lo denotaremos por E.
- Suceso imposible: es el que no tiene ningún elemento del espacio muestral E y por lo tanto nunca ocurrirá. Lo denotaremos por ø.

5. OPERACIONES CON SUCESOS


 Suceso contenido en otro: Dados dos sucesos A y B de un experimento aleatorio, diremos que el suceso A está contenido en B, y lo
indicaremos A ⸦ B, si cada suceso elemental perteneciente a A también pertenece a B, es decir si siempre que ocurre el suceso A, también
ocurre el suceso B.
 Igualdad de sucesos: Dados dos sucesos A y B, diremos que son iguales, si siempre que ocurre el suceso A también ocurre el suceso B, y
siempre que ocurre el suceso B ocurre el suceso , y lo indicaremos por A = B.
 Unión de sucesos: Dados los sucesos A y B, se define la unión de ambos como otro suceso, que indicaremos por A B, compuesto por los
resultados pertenecientes a A U B o a ambos a la vez.
 Intersección de sucesos: Dados los sucesos A y B, se define intersección de ambos sucesos como otro suceso, que indicaremos por A ∩ B,
compuesto por los resultados o sucesos elementales que pertenecen simultáneamente a A y a B.
 Sucesos disjuntos, incompatibles o excluyentes: Dados dos sucesos A y B diremos que son disjuntos, incompatibles o mutuamente
excluyentes si no tienen ningún suceso elemental en común.
 Suceso complementario o contrario: Dado un suceso A, se define como el suceso complementario o contrario de A, como otro suceso
que ocurre cuando no ocurre el suceso A. Lo representaremos por Ā.

7
Estadística aplicada al turismo
Grado en turismo - Curso 2º

6. CONCEPTO DE PROBABILIDAD
Nos va a interesar una medida numérica de la posibilidad de que ocurra un suceso a cuando se realiza el experimento aleatorio. A esta medida la
llamaremos probabilidad del suceso A y la representaremos por P(A).
La probabilidad es una medida sobre la escala 0 a 1; correspondiendo el valor 0 al suceso imposible y el valor 1 al suceso seguro.
Para los restantes sucesos daremos una probabilidad comprendida entre 0 y 1, de tal manera que será tanto más probable que ocurra un suceso
cuando mayor sea su probabilidad.
6.1. Definición clásica de probabilidad (Examen)
Consideremos un experimento aleatorio, cuyo correspondiente espacio muestral E está formado por n, finito, de posibles distintos y con la misma
probabilidad de ocurrir. Entonces diremos si n1 resultados constituyen el resultado A1, n2 resultados constituyen el resultado A2… y nk resultados
constituyen el resultado Ak, de tal manera que:
n1 + n2 + … + nk = n

y las probabilidades de los sucesos A1, A2, … , Ak serán:


P(A1) = n1 / n ; P (A2) = n2 / n ;…; P(Ak) = nk / n

La probabilidad de cualquier suceso A es igual al cociente entre el número de resultados favorables o resultados que integran el suceso A y el número
total de elementos o posibles resultados del espacio muestral E.
La fórmula para calcular la probabilidad de un suceso cuando todos los posibles resultados tienen la misma probabilidad de ocurrir será:

P(A) = Número de casos favorables de A / Número de casos posibles de E

Esto se conoce como la regla de Laplace para espacios muestrales finitos. También se le suele llamar probabilidad a priori pues para calcularla es
necesario conocer, antes de realizar el experimento aleatorio, el correspondiente espacio muestral y el número de resultados o sucesos elementales
que entran a formar parte del suceso cuya probabilidad pretendemos determinar, pudiendo calcular la probabilidad de cualquier suceso antes de
realizar el experimento aleatorio.

6.2. Definición frecuentista de probabilidad


Dados dos sucesos incompatibles, A 1 y A2, tales que A1 A2 = A E entonces cada vez que se presente el suceso A, se presentará necesariamente
uno y sólo uno de los sucesos A1 o A2, y si realizamos n repeticiones del experimento aparecerá n’ veces el suceso A de tal forma que:
n’ = n1 + n2 Siendo: n1 = número de veces que aparece A1 y n2 = número de veces que aparece A2.

La definición frecuentista de la probabilidad consiste en definir la probabilidad como el límite cuando n tiende a infinito de la proporción o
frecuencia relativa del suceso.
A esta definición de probabilidad se le llama también probabilidad a posteriori ya que sólo podemos dar la probabilidad de un suceso después de
repetir y observar, un número grande de veces, el experimento.
6.3. Interpretación subjetiva de la probabilidad
Hay muchos experimentos que no se pueden repetir bajo las mismas condiciones, y por tanto habrá muchas situaciones donde la interpretación de la
probabilidad no puede aplicada, teniendo que recurrir a un concepto subjetivo que expresa el grado de creencia o confianza individual sobre la
posibilidad de que el suceso ocurrió.
Es decir, la probabilidad subjetiva representa el juicio personal sobre el resultado de un experimento aleatorio.
6.4. Definición axiomática de la probabilidad
La definición axiomática de la probabilidad es quizás la más simple de todas. La ventaja fundamental es que nos permite llegar a un desarrollo
riguroso y matemático de la probabilidad.
Dado el espacio muestral E y A un suceso del espacio muestral E, entonces diremos que P asigna a los sucesos valores en el intervalo [0,1], y que es
una probabilidad si satisface los siguientes axiomas de Kolmogorov:
a) P(A) ≥ 0, para cualquier suceso A del espacio muestral E, es decir, la probabilidad de cualquier suceso es siempre mayor o igual que 0.
b) P(E) = 1, la probabilidad del suceso seguro o espacio muestral E es igual a 1.
c) Dada una sucesión de sucesos incompatibles A1, A2…An se verifica que la probabilidad de la unión de sucesos incompatibles es igual a la
suma de sus probabilidades.
Teoremas elementales o consecuencias de los axiomas
Teorema 1: La probabilidad del suceso imposible es nula. P(ø) = 0.
Teorema 2: Para cualquier suceso A, se verifica que la probabilidad de su complementario P(Ā) es P(Ā) = 1 – P(A).
Teorema 3: La probabilidad P es monótona no decreciente, es decir: si A ⸦ B => P(A) ≤ P(B)
Teorema 4: Para cualquier suceso A se verifica que P(A) ≤ 1.
Teorema 5: Para dos sucesos cualesquiera A y B, se verifica que: P(A U B) = P(A) + P(B) – P(A ∩ B).

8
Estadística aplicada al turismo
Grado en turismo - Curso 2º

7. PROBABILIDAD CONDICIONADA
Hay situaciones en las que se incorpora información suplementaria respecto de un suceso relacionado con el experimento aleatorio en cuestión
cambiando su probabilidad de ocurrencia.
Consideremos dos sucesos relacionados de tal manera que la probabilidad de que ocurra un suceso depende de si el otro suceso ha ocurrido o no.

TEMA 4: VARIABLES ALEATORIAS Y SUS DISTRIBUCIONES. LA DISTRIBUCIÓN NORMAL


1. VARIABLE ALEATORIA UNIDIMENSIONAL
Los experimentos aleatorios son tales que los resultados a que dan lugar pueden ser de naturaleza cualitativa o cuantitativa.
Serían resultados cualitativos:
- Lanzamiento de una moneda: cara o cruz.
- La calidad de las piezas fabricadas en una planta: buenas o defectuosas.
- La preferencia de una persona sobre tres tipos de coches…

Serían resultados cuantitativos:


- El número de accidentes de automóvil en una ciudad en un mes dado.
- El número de clientes que llegan a un comercio durante una hora.
- El número de errores detectados en la contabilidad de una empresa…

Trabajar con los resultados cualitativos de un experimento aleatorio introduce complicaciones, siendo de gran utilidad el cuantificar los resultados.
Esta relación entre los sucesos del espacio muestral y el valor numérico que se les asigna la establecemos mediante la variable aleatoria.
Definiciones:
- Variable aleatoria: es una función que asigna un valor numérico a cada suceso elemental del espacio muestral.
- Variable aleatoria discreta: se dice que una variable es discreta si puede tomar un número finito de posibles valores.
- Variable aleatoria continua: se dice que una variable es continua si puede tomar un número infinito de valores.

2. DISTRIBUCIÓN DE PROBABILIDAD NORMAL (Examen)


Es frecuente que nos encontremos con un conjunto de datos que ocurren en la naturaleza, la industria, la investigación… tales como:
- El gasto turístico por persona y día de los turistas que visitan un destino.
- Las calificaciones de las pruebas de selectividad de una Universidad.
- Los datos meteorológicos correspondientes a temperaturas…

Si consideramos el ejemplo del gasto turístico per cápita y resulta que para el caso de Canarias el gasto medio per cápita es de 88€/día, entonces es
lógico pensar que una gran proporción de turistas realizan un gasto que estará en torno de la media, es decir, de los 88€ y además se espera que la
proporción de turistas que gastan una cantidad inferior o superior a los 88€ irá descendiendo a medida que nos alejamos del gasto medio de los 88€,
de manera que esperamos encontrar, por ejemplo, más turistas que gastan en el rango 82-94 que en el rango 110-116 o en el rango 54-60. Lo cual nos
indica que si realizamos la correspondiente representación gráfica llegaremos a un gráfico con un pico en el entorno de la media y que va
descendiendo gradualmente hacia los dos extremos, de manera que tendríamos una gráfica en forma de campana, que sería la función de densidad
de una distribución normal.
Esto nos permite, decir que una variable aleatoria continua sigue una distribución de probabilidad normal si la probabilidad de que la variable
aleatoria tome valores en el entorno de su media es elevada en comparación con la probabilidad de que tome valores en los extremos.
La función de densidad de una variable aleatoria X con distribución normal de parámetros µ y σ es:
f(x) = 1 /

e- (x – µ)^2 / 2σ^2, - ∞ < x < +∞


En donde -∞ < µ < + y σ > 0, siendo П = 3.14159… y e = 2,71828…
Abreviadamente la indicaremos por: N(µ,σ) y diremos que tiene de media µ y de desviación típica σ.
Si analizamos con detalle la función de densidad de la distribución de probabilidad normal, N(µ,σ), se tiene:
- La curva tiene forma de campana, de aquí que frecuentemente se le llame curva o campana de Gauss.
- El parámetro µ corresponde con el máximo y el centro de la distribución y el parámetro σ nos da idea del grado de apertura o aplastamiento
de la curva f(x).
- La media, la mediana y la moda de la distribución coinciden con µ, de manera que el área bajo la curva y hasta el valor µ es igual al área
por encima de µ.
- La distribución de probabilidad normal es simétrica respecto de la medida µ.
- La curva de función de densidad de la distribución normal decrece a ambos lados del valor central µ, y ambas colas son asintóticas.

TEMA 5: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Y MUESTREO


1. INTRODUCCIÓN
Uno de los objetivos principales de la estadística es obtener conclusiones sobre características poblacionales que sean de nuestro interés. Para ello
podemos investigar u observar todos los elementos de la población, realizando lo que llamamos una observación exhaustiva o censo. Pero a veces
9
Estadística aplicada al turismo
Grado en turismo - Curso 2º

no es posible o no resulta conveniente proceder de esta manera y se recurre a la selección de una muestra, con el fin de extrapolar la información
que nos proporcionen los elementos de la muestra a toda la población mediante diferentes técnicas estadísticas. Este proceso recibe el nombre de
inferencia estadística.
Para poder asegurar la calidad de la inferencia, la muestra debe ser representativa de la población y sus elementos no deben reunir ninguna
característica esencial que los difiere del resto.
La representatividad de la muestra se trata de conseguir seleccionando unidades de manera aleatoria.

2. PARÁMETROS POBLACIONALES Y PARÁMETROS MUESTRALES


Los parámetros poblacionales son las características numéricas de la población. El conocimiento de los parámetros poblacionales permite describir
parcial o totalmente la función o distribución de probabilidad de la característica que se está investigando.
Los tres parámetros poblacionales a los que nos vamos a referir son:
- La media poblacional: µ.
- La proporción poblacional: P.
- La varianza poblacional: σ2.

Y que vienen definidos para una población de tamaño N, por las siguientes expresiones:

P = N1 / N = nº de elementos de la población con la característica / tamaño de la población

Para conocer el valor exacto de estos parámetros poblacionales tendríamos que investigar a todos los elementos de la población de manera
exhaustiva.
Para resolver esta situación se recurre a una muestra aleatoria de la población que se pretende investigar y se recoge la información relativa a los
elementos de la muestra, pudiendo obtener los parámetros muestrales:
- Media muestral: x
- Proporción muestral: p.
- Varianza muestral: s2.

3. ESTIMACIÓN DE PARÁMETROS MUESTRALES


La técnica de estimación consiste en utilizar la información que nos proporcionan las observaciones muestrales para obtener un valor aproximado de
los parámetros poblacionales que deseamos conocer. En la estimación estadística tenemos dos tipos: puntual y por intervalos.
3.1. Estimación puntual
La estimación puntual consiste en obtener un único valor, calculado a partir de las observaciones muestrales, y que es utilizado como estimación del
valor del parámetro poblacional.
Así por ejemplo, si pretendemos estimar la edad media de los turistas que visitan un cierto destino, bastaría con seleccionar una muestra aleatoria de
esos turistas y preguntarles la edad para calcular la edad media de la muestra, que sería la estimación puntual de la edad media de la población, es
decir, de todos los turistas que han visitado el destino en cuestión.
3.1.1. Estimación de la media poblacional
Si tenemos una población en donde la característica que estamos investigando viene representada por la variable X, cuya media es µ y varianza σ 2,
desconocidas, puesto que no conocemos el valor de la variable X para cada elemento de la población, entonces se puede utilizar como estimador de
la media poblacional y lo representamos por µ, la media x de las observaciones de una muestra aleatoria en donde estas observaciones corresponden
al valor de la característica X en la muestra.
Luego la estimación de la media poblacional será:

La media muestral sigue una distribución normal.


3.1.2. Estimación de la proporción poblacional
Supongamos ahora una población cuyos elementos pueden presentar o no un acierta característica, por ejemplo, sea la población formada por los
turistas que visitan la ciudad de Sevilla viajando en el AVE y la característica a investigar es si han quedado contentos o no de su visita a Sevilla, para
ello consideramos la variable X, que puede tomar el valor 1 si el turista manifiesta que ha quedado contento y tomará el valor 0 si se manifiesta que
no ha quedado contento.
El parámetro proporcional P será:
P = N1 / N = nº de visitas que se manifiestan contentos / nº total de turistas que visitan Sevilla
Pero si no podemos, o no queremos, investigar toda la población, podremos obtener un estimador puntual del parámetro proporción poblacional P
tomando para ello una muestra aleatoria de tamaño n de turistas que han viajado a Sevilla preguntándoles sobre su satisfacción, de manera que la
estimación puntual será la proporción muestral:
10
Estadística aplicada al turismo
Grado en turismo - Curso 2º

P = p = n1 / n = nº de turistas de la muestra que se manifiestan contentos / Tamaño de la muestra


3.1.3. Estimación de la varianza poblacional
Otro parámetro poblacional que difícilmente será conocido y que tendremos que estimar a partir de una muestra aleatoria de la población, es la
varianza poblacional σ2 y su estimación puntual será:

La varianza muestral es un estimador insesgado de la varianza poblacional.

3.2. Estimación por intervalos


La estimación por intervalos consiste en utilizando los datos de una muestra aleatoria de tamaño n de una población, obtener un intervalo de valores
dentro del cual se espera que se encuentre el valor del parámetro poblacional con un cierto nivel de confianza.
Además de obtener una estimación puntual del parámetro poblacional daremos también un intervalo y una medida que nos refleje la confianza que
tenemos acerca de que el verdadero valor del parámetro poblacional se encuentre dentro del intervalo.
Los extremos del intervalo como la longitud del mismo serán cantidades aleatorias.
El objetivo que se pretende con los intervalos de confianza es obtener un intervalo de poca amplitud con una elevada probabilidad de que el
parámetro poblacional se encuentre en su interior. Elegiremos probabilidades cercanas a la unidad, que se representa por 1-α y cuyos valores más
frecuentes suelen ser 0.9, 0.95 y 0.99
El nivel de confianza lo representaremos por 100 (1-α)% y lo interpretamos como la confianza que tenemos de que cuando tomamos una muestra
aleatoria y calculamos el intervalo, en su interior esté el valor del parámetro.
La precisión de la estimación por intervalos vendrá caracterizada por el coeficiente de confianza 1-α y por la amplitud del intervalo. Así pues, para un
coeficiente de confianza fijo, cuando más pequeño sea el intervalo de confianza más precisa será la estimación, o bien, para una misma amplitud del
intervalo, cuanto mayor sea el coeficiente de confianza mayor será la precisión.
3.2.1. Intervalo de confianza para la media de una población

a) Varianza conocida:
Si consideramos una población de partida N(µ,σ) en donde suponemos que σ es conocida, entonces si tomamos una muestra aleatoria de tamaño n, el
intervalo de confianza para un nivel de confianza del 1-α será:

- Cuando aumenta el tamaño de la muestra, disminuye la amplitud del intervalo, y por tanto, aumenta la precisión de la estimación por
intervalo de confianza.
- Cuando aumenta la desviación típica aumenta la amplitud del intervalo, y por tanto, disminuye la precisión.
- Cuando aumenta el nivel de confianza, aumenta la amplitud del intervalo y, por tanto, disminuye la precisión.

b) Varianza desconocida:
En la práctica la varianza de la población es desconocida casi siempre, y entonces tendremos que estimarla a partir de la varianza muestral, que viene
dada por la expresión:

Admitiendo que la población de partida es normal, y que el tamaño de la muestra n > 30, entonces el intervalo de confianza para la media de la
población será muy parecido al caso anterior:

3.2.2. Intervalo de confianza para la proporción poblacional


Sabemos que cuando el tamaño de muestra n es suficientemente grande, entonces la proporción muestral se distribuye según una normal y el
intervalo de confianza para el parámetro poblacional P será:

4. MUESTREO Y DISEÑO DE ENCUESTAS


4.1. Introducción
El conjunto de todos los métodos y técnicas de muestreo, constituyen el Muestro en Poblaciones Finitas, que es la base y fundamento de la toma de
decisiones y de la investigación científica en los diferentes campos. El muestreo es el procedimiento mediante el cual se determina y se selecciona la
muestra con sus correspondientes unidades de muestreo.

11
Estadística aplicada al turismo
Grado en turismo - Curso 2º

4.2. Población, muestra y marco (Examen)


Llamaremos población o universo a cualquier colección finita o infinita de individuos o elementos, de los cuales se pretende obtener información.
Las unidades que integran la población o unidades elementales, pueden ser de cualquier naturaleza: establecimientos hoteleros, agencias de viajes,
edificios, individuos…
A partir de las observaciones de los caracteres de las diferentes unidades poblacionales nos interesará llegar a conocer los valores verdaderos de los
parámetros o características poblacionales: media, proporciones, total poblacional…
La población que se pretende investigar recibe el nombre de población objetivo y que finalmente no tiene por qué coincidir con la población
investigada, pues pueden existir unidades en la población objetivo que se nieguen a colaborar, otras que no sean localizables, o bien que existan
unidades duplicadas.
En algunas ocasiones y por diferentes razones puede que no sea conveniente o posible obtener información de todas las unidades elementales que
integran la población, surgiendo así el problema de qué unidades observar en la población.
Esto nos lleva a considerar distintos métodos de observación.
Observación exhaustiva o censo:
Este tipo de observación es el que se realiza cuando podemos observar todos los elementos de la población. La ejecución es laboriosa y su coste
elevado.
Observación parcial:
Realizamos este tipo de observación cuando solo puede observarse una parte determinada de los elementos de la población. Este tipo de observación
se puede realizar de dos formas: observando una subpoblación u observando una muestra.
Observaremos una población cuando los elementos que la integran reúnan unas características especiales que no se presentan en los restantes
elementos. Por ejemplo: los establecimientos comerciales con más de 50 empleados.
Se dice que se ha observado una muestra cuando los elementos que la componen no reúnen ninguna característica esencial que los diferencie de los
restantes, representando por tanto toda la población.
Una muestra no es más que un subconjunto o parte de la población que se ha seleccionado para el análisis de la misma, de tal manera que las
conclusiones sacadas de la muestra son válidas para la población. Así, con los valores obtenidos a partir de la muestra, podemos inferir valores
aproximados de los parámetros o características poblacionales.
A estos valores así obtenidos se les llama estimaciones, que evidentemente vendrán afectadas, de unos errores que llamaremos errores de muestreo.
Observación mixta:
En este tipo de observación se combinan la observación exhaustiva y la observación parcial, de tal manera que los caracteres que se consideran
básicos para la investigación se observan exhaustivamente y los restantes mediante muestras.
El marco:
Antes de proceder a seleccionar la muestra, será necesario disponer de un listado real de unidades que se parezcan lo más posible a la población total
que se pretende investigar o población objetivo. A este listado de unidades a partir del cual se selecciona la muestra le llamaremos marco o población
marco.
Para construir un buen marco necesitaremos reglas que nos permitan decidir para cada unidad del marco, si pertenecen o no a la población que se
pretende investigar. Es decir, conocida la población a investigar, para obtener un buen marco tendríamos que proceder a depurar la población,
eliminando las duplicidades e incluyendo las omisiones.
Entre los problemas que afectan a la perfección del marco y que debemos tener en eventos para proceder a su eliminación, destacan los siguientes:
- El problema de las unidades omitidas o falta de cobertura: se refiere a las unidades que existen en la población y no están incluidas en el
marco.
- El problema de las unidades vacías: se refiere a Ley Unidades que aparecen en el marco pero no existen en la población.
- El problema de las unidades repetidas: se refiere a las unidades que existiendo en la población se encuentran incluidas en el marco más de
una vez.
Llamaremos unidad elemental a aquellas unidades de las cuáles se pretende obtener información.
En la muestra reciben el nombre de unidades de muestreo, que pueden coincidir con la unidad elemental o por el contrario pueden agrupar a varias
unidades elementales.
4.3. Decisión, ventajas e inconvenientes sobre la realización de una muestra o un censo (Examen)
Cuando la recogida de la información relevante para la investigación correspondiente no es elevada, no tendría mucho sentido seleccionar muestra
alguna y se procedería a la investigación exhaustiva o censo de toda la población, pero obviamente, situaciones tan sencillas no suelen darse.
La decisión sobre la realización de una muestra es evidente en los siguientes casos:
- Cuando el tamaño de la población a investigar sea tan grande que no sea posible realizarla por parte del investigador, ya que ocasionaría
unos costos excesivos en cuanto dinero, tiempo…
- Cuando el proceso de observación o medida sobre las unidades elementales sea destructivo.
- Cuando la población a investigar sea bastante uniforme con respecto a la característica que estamos investigando, ya que entonces
cualquier muestra sería representativa y proporcionaría buena información.
Además de estas razones existen otras que hacen muy ventajosa la obtención de muestras:

12
Estadística aplicada al turismo
Grado en turismo - Curso 2º

Costo reducido: es evidente que el costo de obtener información de un subconjunto de unidades de la población es menos que si se lleva a cabo
un censo completo.
Mayor rapidez: los datos pueden ser recogidos y resumidos más rápidamente en una muestra que en un censo.
Mayor calidad: al tratarse de un menor volumen de trabajo se puede utilizar personal de campo más capacitado y equipos más especializados,
sometidos a mayor supervisión, lo cual dará lugar a resultados de mayor calidad que los que se obtendrán en un censo.

4.4. Etapas principales de una encuesta por muestreo


1ª Etapa: Objetivos de la encuesta:
Previa a la iniciación de la encuesta tienen que estar claramente especificados los objetivos que se persiguen y la información necesaria para
cumplirlos.
2ª Etapa: Especificación de recursos y limitaciones:
Deben especificarse los recursos o medios, tanto materiales como humanos, de que se dispone para conseguir los objetivos finales.
También hay que tener presente las posibles limitaciones administraciones, la oportunidad de las fechas elegidas y otras circunstancias que puedan
tener incidencia en el plan general de trabajo que se haya planificado.
3ª Etapa: Establecimiento de un plan de actuaciones:
a) Determinación del marco muestral:
Tendríamos que realizar las actuaciones necesarias para obtener una lista de posibles unidades de muestreo. Esta lista deberá ser depurada para
que el marco contenga los menores errores posibles. b) Diseño de la muestra:
A partir del marco se puede realizar el diseño o selección de la muestra, el cual se puede hacer de diferentes maneras dependiendo del tipo de
muestreo utilizado.
c) Diseño del cuestionario:
El cuestionario es el documento de trabajo en el cual se recogen los objetivos de la investigación mediante preguntas que logren obtener la
información necesaria para cumplir los objetivos.
La información será proporcionada por el encuestado, y posteriormente depurada y codificada para su tratamiento informático.
El cuestionario debe reunir los siguientes requisitos:
- Las preguntas deben de ser fáciles de comprender.
- Las preguntas deben tener una sucesión y extensión lógica.
- Se deben evitar preguntas tendenciosas.
- Las preguntas pueden ser tales que las respuestas sean cerradas o estén precodificadas.
- Se debe realizar una encuesta piloto con el fin de descubrir las posibles deficiencias que se observan.

d) Trabajos de campo y recogida de la información:


Para la realización de los trabajos de campo hay que proceder previamente a la selección y adiestramiento de los entrevistadores los cuáles tendrán
que reunir una serie de cualidades, tanto físicas como culturales y sociales.
La recogida de la información se puede llevar a cabo por varios métodos:
- Entrevista personal.
- Observación directa.
- Utilizando correo postal, e-mail o internet.
- Utilizando el teléfono.

e) Depuración, codificación y tratamiento informático de la información proporcionada:


Mediante el proceso de depuración se pretende detectar y eliminar los errores que existan en la cumplimentación del cuestionario.
Mediante la codificación, lo que se hace es asignar un número a cada una de las posibles respuestas, de manera que se pueda proceder a su
tratamiento estadístico.
f) Análisis de resultados:
Después de obtenidas las correspondientes tablas se procede, utilizando diferentes técnicas estadísticas, al análisis de los resultados, a la
interpretación de los mismos y a la redacción de las conclusiones o informes.

4.5. Procedimiento de muestreo


Entendemos por muestreo el procedimiento mediante el cual se selecciona una muestra de una población dada.
4.5.1. Muestreo no probabilístico (Examen)
En este tipo de muestreo la selección de la muestra se hace de forma no aleatoria, sin norma y dejándose influir por la intención u opinión del
investigador, procurando, la persona que selecciona la muestra, que sea representativa.
Se utiliza con cierta frecuencia en la investigación de mercados y algunos casos es el único posible que se puede utilizar.

13
Estadística aplicada al turismo
Grado en turismo - Curso 2º

La representatividad de la muestra es buena cuando la población es bastante homogénea en relación con la característica que se investiga, no
pudiendo concluir, en general, que el muestreo no probabilístico de peores resultados que el probabilístico. Sin embargo, no se pueden calcular los
errores de muestreo.
Entre los procedimientos de muestreo no probabilístico tenemos:
Muestreo opinático o intencional:
Es la propia persona que realiza la investigación la que selecciona la muestra, fijando ella los mecanismos de selección y procurando que sea
representativa.
Muestreo sin norma o de conveniencia:
La muestra se selecciona a capricho o por conveniencia y sin norma alguna obteniéndose simplemente una parte de la población para hacerle la
encuesta de manera fácil, rápida y con poco costo.
Muestreo por cuotas:
Es el más utilizado de los muestreos no probabilísticos y se utiliza muy frecuentemente en investigación de mercados, en encuestas de opinión… Se
realiza de la siguiente forma:
- Se diseña la muestra siguiendo las normas generales de muestreo probabilístico, dando el tamaño de la muestra.
- Cuando llega el momento de seleccionar las unidades de muestreo o personas a entrevistar se le asignan a los entrevistadores unos cupos o
número de entrevistas o unidades muestrales que cumplan ciertas características, por ejemplo: un cierto % sean hombre, otro % mujeres,
otro % hombres y titulados superiores…

En este procedimiento no se conocen las probabilidades de selección de las diferentes unidades, no pudiendo calcularse los errores de muestreo.
Este tipo de muestreo no se suele aplicar cuando los resultados obtenidos se tengan que tomar decisiones de bastante importancia.
4.5.2. Muestreo probabilístico (Examen)
En el muestreo probabilístico la selección de la muestra se hace de forma aleatoria, no permitiendo la selección a juicio del investigador o del
entrevistador.
Este método de muestreo permite conocer la probabilidad que tiene un elemento de ser seleccionado, así como la probabilidad de cada una de las
muestras que pueden extraerse de la población, ya que la selección de las unidades de muestreo se hace por un mecanismo aleatorio, permitiendo
conocer la precisión de los resultados y posibles errores de muestreo.
Los principales tipos de muestreo son:
Muestreo aleatorio simple o muestreo sin reemplazamiento:
La selección de la muestra se realiza mediante mecanismos aleatorios, de tal manera que cada elemento de la población tiene la misma probabilidad
de ser seleccionado y por tanto pertenecer a la muestra, siendo por tanto la muestra autoponderada o autorepresentada.
Para poder aplicar este método es necesario disponer del marco o listado de las unidades que integran la población.
Muestreo estratificado:
Consiste en dividir la población en estratos o subpoblaciones de tal manera que los estratos sean muy heterogéneos entre sí y las unidades dentro de
cada estrato lo más homogéneas posibles. Seleccionando la muestra dentro de cada estrato de forma aleatoria.
Muestreo por conglomerados o áreas:
Se sustituyen las unidades elementales, por grupos o conglomerados de unidades elementales, de tal forma que estos conglomerados estén
constituidos por unidades heterogéneas, representando así cada conglomerado a la posible población. La muestra se obtendrá seleccionando
conglomerados, pues cada conglomerado representa todas las características de la población.
Este muestreo se utiliza cuando no se disponde de un listado o marco de las unidades que integran la población.
Muestreo sistemático:
Asigna a todos los elementos de la población la misma probabilidad de ser seleccionadas en la muestra, y por tanto la muestra es autoponderada o
autorepresentada.
4.6. Tipos de errores
El hecho de utilizar una muestra o parte de la población para investigar características poblacionales originará algunos tipos de errores, siendo
debidos a diferentes causas o razones.
Los diferentes errores se pueden clasificar en dos grupos:
- Error de muestreo: se comete como consecuencia del diseño de la muestra y son originados por la variabilidad de los valores obtenidos en
el muestreo. Se suele identificar con el término fiabilidad de tal manera que el nivel de fiabilidad será tanto mayor cuanto menor sea el
error de muestreo y por tanto cuanto mayor sea el tamaño de la muestra.
- Error sistemático o sesgo: se comete como consecuencia de las imperfecciones o limitaciones en la recogida de la información.

Las diferencias fundamentales entre ambos tipos de errores son:


- Los errores de muestreo disminuyen al aumentar el tamaño de la muestra, mientras que los errores ajenos al muestreo aumentan con el
tamaño de la muestra.
- Los errores de muestreo se pueden estimar a partir de los datos muestrales, mientras que para estimar los errores ajenos al muestreo se
necesita información ajena a la muestra.

14
Estadística aplicada al turismo
Grado en turismo - Curso 2º

TEMA 6: FUENTES ESTADÍSTICAS OFICIALES DEL SECTOR TURÍSTICO


1. ESTADÍSTICAS DEL PROGRAMA ANUAL 2.011 INCLUIDAS EN EL PLAN ESTADÍSTICO NACIONAL 2009-2012
El sistema global de estadísticas de turismo en España está formada por las estadísticas que elabora el INE, el Instituto Nacional de Estudios
Turísticos así como otros organismos de carácter nacional y regional.
Las operaciones estadísticas incluidas en el Plan Nacional 2009-2012 y que integran el Programa Anual 21011 son:
Inventario de establecimientos hoteleros:
Proporciona los datos estructurales sobre el número de establecimientos hoteleros y las plazas ofertadas, así como la categoría de los
establecimientos.
Investigación del alojamiento privado de uso turístico:
Proporciona las características de los alojamientos privados de potencial uso turístico y analiza el uso que se hace de ellos, con descripción sobre la
capacidad, ubicación y utilización.
Encuesta de ocupación en alojamientos turísticos:
Proporciona indicadores coyunturales sobre la ocupación de los establecimientos del sector.
Movimientos turísticos de los españoles (FAMILITUR) (Examen):
Proporciona información de las personas físicas residentes en hogares, sobre la cuantía y características de los viajes realizados por la población
residente en España.
Movimientos turísticos en fronteras (FRONTUR) (Examen):
Proporciona información sobre el colectivo de viajeros extranjeros que entran en España, estimando el número de visitantes extranjeros que entran en
España por las diferentes vías de acceso.
Encuesta de Gastos Turístico (EGATUR) (Examen):
Proporciona información sobre el gasto turístico de los visitantes extranjeros a su salida de España, así como otras variables del comportamiento
turístico.
Índice de Precios Hoteleros:
Proporciona un indicador mensual que mide la evolución de los precios de los alojamientos hoteleros.
Dichos precios se refieren a las habitaciones dobles con baño, sin incluir el desayuno ni el IVA.
Índice de Ingresos Hoteleros:
Proporciona un indicador mensual que mide la evolución de los precios del alojamiento en apartamentos turísticos.
Índice de Precios de Acampamentos Turísticos:
Proporciona un indicador mensual que mide la evolución de los precios de alojamientos en acampamentos turísticos.
Índice de Precios de Turismo Rural:
Proporciona un indicador mensual sobre la evolución de los precios de alojamiento en establecimientos de turismo rural.
Cuenta Satélite del Turismo (CST) (Examen):
Con esta estadística se pretende obtener una medición macroeconómica del turismo siguiendo las recomendaciones de los organismos internacionales
y dentro del marco de la Contabilidad Nacional de España.
Proporciona una representación sistemática, comparable y completa de la actividad turística adaptada, en la medida de lo posible, a los conceptos,
definiciones y clasificaciones que figuran en el manual de la CST elaborado por la OMT.

15