Está en la página 1de 19

Presentación

¡Bienvenido al módulo "Estadística aplicada a la Auditoría", de la


Diplomatura en Auditoría y Contabilidad!

Esta asignatura no tiene pretensiones de ser un curso de Auditoría ni


tampoco de Estadística y Muestreo. Para ello se debería recurrir a la
amplia como excelente bibliografía en ambos temas. Y no solamente
en ambos temas, sino la correspondiente a Muestreo aplicado a la
Auditoria, que la hay y muy buena. Por supuesto que la
mencionaremos en su momento.

El desarrollo teórico que presento, pretende entonces cubrir las necesidades bibliográficas mínimas relativas a la
ESTADÍSTICA APLICADA A LA AUDITORÍA en el contexto de la diplomatura.

La cobertura de los temas –por el tiempo asignado por la currícula al tema- es mínima, de todos modos se sugiere a
quien desee profundizar el estudio de los mismos, recurrir a la excelente bibliografía citada, sirviendo el contenido de
este programa, como una introducción, un acicate y un estímulo al estudio de los métodos más utilizados en esta
metodología.

Durante mucho tiempo hemos creído conveniente y necesario, que el egresado de Ciencias Económicas se vincule
formalmente con las técnicas de muestreo aplicadas a la Auditoría. Se ha decidido presentar los con-ceptos y técnicas
que permitan al profesional en Ciencias Económicas, vincular dos formidables materias -la Auditoría y el Muestreo-
para lograr una síntesis que les permita desarrollar en forma moderna, técnica, eficien-te, económica y objetiva, sus
tareas de auditoría. Será en las unidades 2 y 3 donde encontrará este desarrollo. Así, en la unidad 2 usted verá una
introducción al muestreo aplicado a la auditoría, mientras que en la 3 se presentará con mayor detalle las técnicas de
muestreo más comúnmente utilizadas en este campo (las técnicas son muchas es así que si usted desea ahondar en
ellas, podrá consultarlas en la bibliografía complementaria).

"El empleo de técnicas de muestreo estadístico, constituye una herramienta de innegable utilidad para el auditor en
cuanto le permite aumentar su objetividad, cuantificar los riesgos del muestreo, desarrollar su criterio profesional,
supervisar con mayor facilidad las tareas encomendadas a sus colaboradores y, si fuese necesario, defender
fundadamente ante terceros, la extensión brindada a las pruebas realizadas y el tiempo empleado en las mismas" (E.
Fowler Newton, "El Muestreo Estadístico aplicado a la Auditoría”, Editorial Machi, 1972).

Para poder estudiar y utilizar con provecho el tema que presentaremos en el módulo 3 se supone que usted conoce
conceptos básicos e imprescindibles de estadística descriptiva, inferencia estadística, las distribuciones normal,
binomial, hipergeométrica, Poisson, y todo lo referido al muestreo y modelos de muestreo. De cualquier forma, en la
Unidad 1 se presentará un repaso de dichos conceptos, para poder abordar esta masa de conocimientos, que han sido
estudiados en la Facultad de Ciencias Económicas.

Para cerrar esta presentación, deseamos mencionar nuevamente al profesor Fowler Newton cuando en la obra ya citada
expresa: "el muestreo estadístico es una herramienta cuyo uso no sustituye al criterio del auditor ni lo limita, sino que,
por el contrario, se pone a su servicio. Siempre será necesario determinar primero la tarea de auditoría a ser realizada
y luego recién establecer si es posible utilizar técnicas de muestreo estadístico."
Recuerde que, ante cualquier duda que se le presente, usted se podrá comunicar a través del espacio que brinda la
tutoría. ¡Éxito con el cursado del módulo!
Objetivos

● Calcular los estadísticos ó estadígrafos (muestrales) de la distribución de medias o proporciones muestrales de


tamaño n, extraídas de una población N, de media y varianza conocidas, a efectos de poder hacer estimaciones
de los parámetros poblacionales (en los cuales estamos realmente interesados).

● Estimar los parámetros del modelo supuesto, a partir de las observaciones muestrales -utilizando una muestra
que realmente sea representativa de la población y de un tamaño suficiente- utilizando los métodos de la
Inferencia Estadística lo que permitirá comprobar si la información que proporciona una muestra observada
concuerda (o no) con la hipótesis estadística formulada sobre el modelo de probabilidad en estudio y, por tanto,
se puede aceptar o rechazar la hipótesis formulada.

● Utilizar distintos tamaños muestrales para controlar el nivel de confianza y el error admitido y contrastar los
resultados obtenidos a partir de muestras, con los que se espera de la población (N).
Programa

Unidad 1: Estadística

Principales conceptos de Estadística. Estadística descriptiva. Medidas de posición y dispersión.


Estadística inferencial. Estimación puntual. Estimación por Intervalos.
Población y Muestra. Selección de muestras.
Métodos de muestro estadístico más comúnmente aplicados.
Muestreo sistemático.

Unidad 2: Introducción al muestreo aplicado a la auditoría

Lawrence Sawyer: a modo de introducción. Muestreo con medidas estadísticas.


Tamaño muestral n.
Muestreo estadístico aplicado a la auditoría. Tipos.
¿Por qué usar muestreo? Aplicación del muestreo estadístico a las pruebas de controles. Las ideas de FELABAN, un
planteo actualizado.

Unidad 3: Planes de Muestreo más comúnmente aplicados a la Auditoría

Muestreo de atributos.
Muestreo de “parar o seguir” (stop or go sampling).
Muestreo de variables.
Determinación de los tamaños de muestra adecuados a cada circunstancia.
Cálculo de la desviación estándar.
Muestreo exploratorio o de descubrimiento (discovery sampling).
Muestreo de criterio, ó Muestreo dirigido o sin medidas estadísticas.
Conclusiones.
Material de Estudio

Material básico:

● El material de estudio del módulo se encuentra desarrollado en el apartado contenidos de cada unidad.

● A continuación puede acceder a las siguientes tablas que le son de utilidad consultar para complementar la
lectura del material teórico. Se enuncian por su título:

● Cuadro A. 6:Tamaños de muestra para el muestreo de atributos. Tasa de error esperada no mayor al 5%.
Nivel de confianza de 95%.

● Cuadro A. 6 continuación: Tamaños de muestra para el muestreo de atributos. Tasa de error esperada no
mayor al 5%. Nivel de confianza de 95%.

● Cuadro B. 5: Tamaño de muestra para el muestreo de suspensión o continuación. Probabilidad de que la


tasa de error en un tamaño de universo de 1000 sea menor de.

● Cuadro B. 6: Tamaño de muestra para el muestreo de suspensión o continuación. Probabilidad de que la


tasa de error en un tamaño de universo de 2000 sea menor de.

● Cuadro D. 1: Tamaños de muestra para el muestreo de descubrimiento. Porcentaje de probabilidades de


hallar un error si el número total de errores en el universo es el que se indica

● Cuadro D. 2:Tamaños de muestra para el muestreo de descubrimiento. Porcentaje de probabilidades de


hallar un error si el número total de errores en el universo es el que se indica.

● Cuadro F. 1:Límites de precisión revisados con base en la tasa de error hallada en la muestra. TASA DE
ERROR DE LA MUESTRA: 2%

● Cuadro F. 2:Límites de precisión revisados con base en la tasa de error hallada en la muestra. TASA DE
ERROR DE LA MUESTRA: 3 %

● Cuadro F. 3:Límites de precisión revisados con base en la tasa de error hallada en la muestra. TASA DE
ERROR DE LA MUESTRA: 5 %

● Cuadro F. 4:Límites de precisión revisados con base en la tasa de error hallada en la muestra. TASA DE
ERROR DE LA MUESTRA: 10 %

● Tablas estadisticas de uso frecuentes: números aleatorios, distribución normal, distribución “t” de
Student.

Material complementario:

● El muestreo estadístico aplicado a la auditoría. Enrique Fowler Newton, Ediciones Macchi.


● Manual de Muestreo para auditores. Instituto de Auditores Internos.

● Suplemento al Manual de Muestreo para auditores. Instituto de Auditores Internos.

● Separata del Manual de Muestreo para auditores. Instituto de Auditores Internos. Lawrence Sawyer. Muestreo
simple. Publicación nº 33

● Sampling in auditing. Hill, Roth y Arkinn. The Ronald Press Co., N. York

● Muestro estadístico para auditoria y control. T. W. Rae. Editorial Limusa.

● El muestreo estadístico aplicado a la censura de cuentas. Cyert y Davidson. Editorial Sagitario.

● Practical statistical sampling for auditors. Arthur J. Wilburn. Marcel Dekker., N. York and Basel.

● El muestreo estadístico aplicado a la auditoría. Schuster, Cacliati y Dzigciot. Ediciones Macchi.

● Elementos de Muestreo. Scheaffer & Mendenhall. Grupo Editorial Iberoamérica.

● Muestreo: diseño y análisis. Sharon L. Lohr. Editorial Thomson Learning.

● Sampling Techniques in accounting. R. Trueblood & R. Cyert. Prentice Hall Inc.

● Temas introductorios para el estudio del Muestreo. Un enfoque intuitivo. H. Goldenhersch. UNC, Facultad de
de Ciencias Económicas.

● Federación Latinoamericana de Bancos, FELABAN.


http://www.felaban.com/boletin_clain/
revista_5_aplicacion_del_muestreo_estadistico_a_las_pruebas_de_controles.doc

● Muestreo Estadístico Aplicado a la Auditoría Financiera. Dr. Marco Deschamps.


http://www.ofsnayarit.gob.mx/capacitacion/2007/1206_1m01.pdf

● Guía de Muestreo Estadístico en Auditoría Gubernamental. Poder legislativo de Guanajuato.


http://www.ofsgto.gob.mx/doctos/pdf/501/50100220070101.pdf

● Muestreo en Auditoría. Contraloría General de la República de Bolivia.


http://www.cge.gob.bo/PortalCGR/uploads/NorAuG.pdf

● El Uso de Tecnicas De Muestreo en el ámbito del Control Público. El Caso del Tribunal de Cuentas de la
Provincia de Buenos Aires.
www.tribunalesdecuentas.org.ar
GLOSARIO

A
Ajuste
Medida que expresa hasta qué punto la solución explica los datos originales. Ajuste + Pérdida= p (número de
dimensiones de la solución).

Algoritmo
Conjunto de reglas o procedimientos; similar a una ecuación - Amplitud Altura de una serie periódica.

Análisis
Cada análisis factorial independiente es identificado mediante un número de análisis.

Análisis de Correspondencias
Enfoque composicional para crear mapas perceptuales que relaciona las categorías de una tabla de contingencia. La
mayoría de las aplicaciones incluyen un conjunto de objetos y atributos, los resultados describen tanto los objetos como
los atributos en un mapa perceptual común.

Análisis de regresión
Estimación de la relación lineal entre una variable dependiente y una o más independientes.

Análisis de varianza
Procedimiento que divide la variación total de la(s) variables en sus componentes (efectos) y realiza un contraste de
significación estadística para cada componente

ARIMA
Modelo Autorregresivo Integrado de Media Móvil (AutoRegressive Integrated Moving Average). Modelo general utilizado
ampliamente en el análisis de series temporales. Basado en la inspección previa del comportamiento de las series,
requiere tres números que representan el orden de autorregresión, el grado de diferenciación y el orden de media
móvil. Estos tres procesos se representan, por convenio, mediante los parámetros p, d, y q respectivamente y el modelo
general se designa como ARIMA (p,d,q). El modelo puede ampliarse para incorporar de forma análoga el carácter cíclico
de la serie (seasonality). ARIMA es un procedimiento perteneciente a las Series Temporales (TRENDS).

Autorregresión
Regresión de una serie basada en valores previos a ella misma. Autorregresión puede calcularse en REGRESIÓN, AREG y
ARIMA.

B
Base unifactorial
La matriz base de un factor se utiliza para calcular la matriz de contraste para cada factor. Estos coeficientes no son los
mismos que los del contraste correspondiente. Las estimaciones de los parámetros se basarán en el contraste
especificado, en lugar de hacerlo a partir de combinaciones lineales de elementos de esta matriz.)

Bondad del ajuste


Medida de lo bien que se ajusta el modelo a los datos. Se basa en los cuadrados de las diferencias entre las
probabilidades observadas y las pronosticadas. Un valor pequeño del nivel crítico del estadístico de bondad de ajuste
indica que dicho ajuste no es bueno.

C
glosario

Campana de Gauss
Cuando se calcula la media aritmética de un valor correspondiente a una característica de un universo (Ej. estatura,
edad, etc.), en muchas ocasiones, según la característica de que se trate, los elementos que quedan por encima de la
media compensan exactamente aquellos que quedan por debajo. Representados estos valores en un eje de coordenadas
cartesianas la curva tiene forma de campana.

Características de medida
Características básicas de la medida de los datos. Especifican los tipos de operaciones matemáticas y transformaciones
que puede ser apropiado aplicarles. Las características de medida son: Nivel de Medida, Condicionalidad de la Medida y
Forma de los Datos.

Caso
Unidad básica de análisis a la que se refieren las medidas que se han tomado.

Centroides
Promedios de las puntuaciones de objeto para los objetos (casos) incluidos en cada conjunto de aquéllos que
pertenecen a la misma categoría de la variable.

Chebychev
Medida de disimilaridad o distancia para datos continuos. La distancia entre dos elementos es la máxima diferencia
absoluta entre los valores para los elementos.

Chi cuadrado
Estadístico utilizado para contrastar la H0 de que las variables de filas y columnas son independientes. No debe
utilizarse si cualquiera de las celdas tiene un valor esperado menor que 1 o si más de un 20% de las celdas tienen
valores esperados inferiores a 5.

Coeficiente
Estadístico que resume o representa una relación.

Conglomerado
Grupo de casos relativamente homogéneo.

Constante
En los procedimientos de la regresión, la constante es el valor de la VD cuando todas las VI toman el valor cero.

Contraste
Combinación lineal de las medias de las casillas. Cada estimación de parámetro corresponde a un contraste.

Correlación
Medida de similaridad de patrones para datos continuos. Es el coeficiente ordinario de la correlación momento-producto
de Pearson.

Correlación canónica
La correlación canónica de una función discriminante es la raíz cuadrada del cociente entre la SS inter-grupo y la SS
total. Si se eleva al cuadrado, representa la parte de la variabilidad total que puede atribuirse a diferencias entre los
grupos.

Covariable
Variable predictora o independiente.

Covarianza
Medida no tipificada del grado de asociación existente entre dos variables.

D
Denominador
Grados de libertad asociados al denominador del cociente en una F.
Dependiente
Variable cuyos valores se desea predecir o resumir

Deriva
Tendencia de los valores de las series a desplazarse hacia arriba (o hacia abajo) en un intervalo de tiempo
relativamente largo.

Desviación típica o estándar


La desviación típica es la raíz cuadrada del cociente que tiene como dividendo la suma de los cuadrados de las
diferencias de los elementos de una serie de observaciones con respecto a su media aritmética, y, como divisor, el
número de elementos de la serie.

Dimensión
Solución de variables cuantificadas. Debe escogerse el menor número de dimensiones que representen de forma óptima
a los datos originales.

Distancia de Chebychev
Medida de distancia que define la distancia entre dos casos como la máxima diferencia absoluta entre los valores en
todas las variables.

E
Elementos
Variables que constituyen una escala en el análisis de fiabilidad.

Eliminación regresiva
Introduce en el análisis todos los efectos elegibles y después se van eliminando de acuerdo con el estadístico chi
cuadrado de bondad de ajuste y el criterio de máximo orden.

Empírico
Método de estimación de percentiles que utiliza la función de distribución empírica.

Error absoluto medio


Media aritmética de los valores absolutos de una variable de error.

Error de muestreo
Es el error que se comete en la medida de las variables estudiadas al tomar una muestra en lugar de la totalidad de la
población. Puede ser cuantificado cuando el muestreo es probabilístico

Error de la predicción
Discrepancia entre un valor observado y su predicción, según el modelo especificado.

Error medio
Media aritmética de una variable de error.

Error típico
Medida de la variación del valor de un estadístico de contraste de una muestra a otra. Es la desviación típica de la
distribución muestral de un estadístico. Por ejemplo, el error típico de la media es la desviación típica de las medias
muestrales.

Error típico de estimación


Estimación de la desviación típica de los términos de error de la regresión. Es una estimación de la desviación típica de
la VD para aquellos casos que tienen los mismos valores para las VI.

Estacionalidad
Variación repetitiva a lo largo de un intervalo de tiempo. Puede considerarse como ejemplos las pautas entre los días de
cada semana, los meses de cada año o los trimestres de cada año.

Estacionariedad
Condición que deben satisfacer las series cronológicas a las que se trata de ajustar un modelo ARIMA. Las series MA
puras serán estacionarias; sin embargo, las series AR y ARMA pueden no serlo. Intuitivamente, una serie estacionaria
tiene una media y una varianza constantes a lo largo del tiempo. Visualmente, la gráfica de la serie debería mantenerse
dentro de una banda nivelada con anchura constante. Una serie estacionaria se describe de forma comprensible
mediante la función de autocorrelación, que establece la correlación entre dos puntos temporales cualesquiera de la
serie en función de la distancia que los separa, y no es función de los instantes reales en que los dos puntos tienen
lugar. Visualmente, el gráfico ACF de una serie estacionaria decrece con bastante rapidez (exponencialmente) de
manera que a partir de cierto retardo todas las autocorrelaciones son despreciables.

Estadístico
Medidas resumen que se usan para describir la muestra

Estimación
Procedimiento estadístico que, a partir de los datos y la especificación de un formato de modelo, proporciona
estimaciones para los parámetros

Estratos
Subgrupos de caso que se analizan por separado

Expresión lógica
Expresión compuesta por operadores lógicos y relaciones que establecen una comparación entre dos o más variables o
una expresión compuesta. Su resultado es verdadero o falso (o perdido).

Expresión numérica
Expresión que consta de variables y constantes numéricas y operadores aritméticos.

Extracción
Cálculo de las estimaciones de los factores que se realiza en el análisis factorial.

F
Factor
Variable que maneja el investigador para medir cualquier efecto sobre otra variable. En el análisis conjunto, las
variables predictoras (factores) son no métricas. Los factores deben representarse por dos o más valores (también
conocidos como niveles).

Factores estacionales
Promedios estacionales corregidos que indican el efecto neto de cada período sobre el nivel de la serie.

Frecuencia
Contador o número de casos que tienen cada valor (o rango de valores) de una variable.

Función de verosimilitud
Representación algebraica de la distribución de la probabilidad conjunta de la muestra de datos en la que los valores de
éstos se tratan como fijos y los valores de los parámetros varían.

Función numérica
Función que opera sobre una expresión numérica y devuelve un número o un valor perdido del sistema. La expresión
que va a ser transformada mediante una función recibe el nombre de argumento y usualmente consta de un nombre de
variable o de una lista de nombres de variables.

G
Gamma
Parámetro de suavizado de tendencias. Cuando el valor de gamma es alto, la previsión se basa en una tendencia
estimada a partir de los puntos más recientes de la serie. Por el contrario, cuando el valor de gamma es bajo, se utiliza
una tendencia estimada a partir de la serie completa dando igual peso a todos los puntos.

Grados de libertad
Nº asociado al estadístico de contraste que se utiliza para determinar el nivel crítico.

Gráfico de casos
Gráfico vertical de datos pertenecientes a una serie temporal.

H
Histograma
Diagrama de frecuencias que representan el número observado de residuos en cada intervalo (designado por N) y el
número esperado en una distribución normal con la misma media y varianza que los residuos (etiquetado como Exp N).
Los intervalos primero y último (Out) contienen residuos a más de 3,16 veces el valor de la desviación típica respecto a
la media. Se imprime un histograma de los residuos observados con el número esperado marcado con un punto. En el
histograma aparecen dos puntos cuando las frecuencias observadas y las esperadas se solapan.

Homogeneidad de dispersión
Prueba de igualdad de las matrices de varianza-covarianza.

I
IC
Intervalo que contiene el 95 % de las veces el valor verdadero (de la población) de lambda.

Impactos
Serie de entradas (inputs) aleatorias, independientes e idénticamente distribuidas (con frecuencia no observados) que
dan lugar a, o influyen en, algún fenómeno observado.

Índice estacional
Número que cuantifica el efecto neto de un período dado, dentro de una estación, sobre el nivel de la serie.

Inercia
Varianza generalizada. Medida de la dispersión de las puntuaciones teniendo en cuenta sus frecuencias marginales.
Proporción explicada: inercia de cada dimensión dividida por la inercia total.

Interacción
Medida de hasta qué punto la variación de la VD no puede ser considerada como el resultado de una combinación simple
de los efectos principales de los factores del análisis. En otras palabras, puede concluirse de que el efecto de una
variable varía a lo largo de las categorías o combinaciones de categorías de las otras variables

Intervalo
Rango de valores adyacentes para los que se calcula la frecuencia.

Intervalo confidencial para la media


Rango de valores que el 95% de las veces incluye el valor poblacional (verdadero) de media.

Iteración
Uno de los pasos de un algoritmo que requiere volver a ser calculado repetidamente. Ejecución repetitiva del algoritmo
de estimación.

J
Jaccard
Medida de similaridad para datos binarios. También se conoce con el nombre de ratio de similaridad. Se calcula a partir
de una tabla 2x2 como: a/(a+b+c).

K
K
Orden de interacción en un modelo loglineal
Kolmogorov-Smirnov
Prueba de normalidad que se basa en el valor absoluto de la máxima diferencia entre la distribución acumulativa
observada y la esperada, basándose en el supuesto de normalidad. Se aplica la corrección de Lilliefors. Se utiliza para
verificar la hipótesis de que una muestra procede de una distribución particular (uniforme, normal o de Poisson). El
valor de la Z de Kolmogorov-Smirnov se basa en la diferencia absoluta máxima entre las distribuciones acumuladas
observada y la teórica.

L
Lambda
Medida de similaridad para datos binarios debida a Goodman y Kruskal. Establece la predictibilidad del estado de una
característica en un elemento (presencia o ausencia) conocido el estado en el otro elemento. Específicamente, mide la
reducción proporcional en el error utilizando un elemento para predecir el otro, cuando las direcciones de predicción
tienen la misma importancia. Tiene un rango de 0 a 1.

Linealmente dependientes
Mensaje de aviso que aparece cuando dos o más efectos son linealmente dependientes. Aparecerá siempre que un
análisis de medidas repetidas se utilice una covariable constante, en cuyo caso puede ser ignorada.

Logaritmo de la función de verosimilitud


Logaritmo de la función de verosimilitud. En la práctica, resulta más sencillo operar con la estimación de máxima
verosimilitud cuando se trabaja con el logaritmo de la función de verosimilitud.

M
M de Box
Prueba sobre la igualdad de las matrices de las covarianzas de grupo. Para tamaños de muestra suficientemente
grandes, un valor de P no significativo quiere decir que la evidencia de que las matrices difieran es insuficiente. Esta
prueba es sensible a las desviaciones de la normalidad multivariada. Esto es, tiende a considerar desiguales a las
matrices si no se cumple el supuesto de normalidad.

Mapa Perceptual
Representación visual de las percepciones de objetos de un encuestado en dos o más dimensiones. Normalmente este
mapa tiene niveles contrarios de dimensiones en los finales de los ejes X e Y, tales como de "dulce" a "agrio" al final del
eje X y de "muy caro" a "barato" al final del eje Y. Así, cada objeto tiene una posición espacial en el mapa perceptual
que refleja la similaridad relativa o preferencia sobre otros objetos atendiendo a las dimensiones del mapa perceptual

Marginal
Número de casos que hay en cada categoría de una variable. Frecuencia marginal.

Matriz de coeficientes de contraste


Coeficientes utilizados en las combinaciones lineales de las medias de los grupos. Por ejemplo, los coeficientes del
contraste:1 * (Media 1) + 1 * (Media 2) - 2 * (Media 3), son 1, 1 y -2.

Máxima verosimilitud
Método de estimación de parámetros. Basado en la maximización de la función de verosimilitud.

Media aritmética
La media aritmética o promedio aritmético de una serie de elementos que tienen valores distintos, es igual a la suma de
estos valores dividida por el número de elementos. En el caso de que se deba conceder una importancia distinta a los
diferentes valores de la serie, es preciso darles una ponderación, resultando una media aritmética ponderada.

Media estimada
Media de cada celda pronosticada por el modelo. En MANOVA, la media estimada no está corregida teniendo en cuenta
las covariables.

Media móvil
Es el promedio de un valor de la serie y los que le rodean. Las medias móviles se utilizan para suavizar las series
cronológicas, es decir, para reducir el ruido o las fluctuaciones en las series
Mediana
En una serie o grupo de observaciones, es el valor que divide el número de valores de la serie (“n”) en dos mitades
exactas. Para calcular la mediana, el primer paso consiste en ordenar los elementos individuales en una secuencia
determinada(ascendente o descendente). Si “n” es impar, la mediana será un valor real de la serie,; si “n” es par, la
mediana se determina hallando el promedio de los dos valores centrales.

Mínimos cuadrados generalizados


Método de extracción de factores que minimiza la suma de los cuadrados de las diferencias entre las matrices de
correlación observada y reproducida. Las correlaciones se ponderan mediante la inversa de su unicidad, de manera que
las variables que tengan un valor alto de unicidad tengan menor peso que aquéllas que tengan un valor bajo de
unicidad.

Modelo de Box-Jenkins
Box y Jenkins son dos estadísticos fundamentales en la labor de codificación y unificación del AST para construir el
marco general de los modelos ARIMA.

Modelo de regresión
Modelo matemático que relaciona una VD con uno o más predictores o VI .

Muestra
Conjunto de elementos de una población o universo del que se quiere obtener información.
El muestreo se basa en dos principios estadísticos elementales:

● Principio de la "regularidad estadística": este principio indica que si en un grupo grande de elementos se extrae
aleatoriamente otro grupo más pequeño, éste tiene tendencia a presentar las mismas características del grupo
original.

● Principio de la "inercia de los grandes números": cuando más grande sea un grupo de individuos seleccionados
del universo, más estable será, lo que facilita el hecho de que un cambio o error producido en un sentido en una
muestra de cierto tamaño, suele compensarse con errores o cambios en sentido contrario.

Para que ésta sea válida, la muestra debe de ser representativa de la población.

Muestreo no probabilístico
Procedimiento en el que la muestra no es seleccionada de modo aleatorio, sino de acuerdo con otros criterios fijados
por el investigador y que no garantizan que todos los elementos de la población tengan igual oportunidad de ser
elegidos. Puede ser de conveniencia, discrecional o por cuotas.

Muestreo probabilístico
Procedimiento de selección aleatoria de la muestra, lo que supone que todos los elementos de la población tienen igual
oportunidad de ser elegidos. Puede ser simple, sistemático, estratificado y por conglomeración o áreas. (Ver “Tipos de
muestreo probabilístico”)

Muestreo semiprobabilístico
Este muestreo es una combinación del muestreo probabilístico y del muestreo no probabilístico, con el que se quiere
conseguir las ventajas que ambos ofrecen y reducir sus inconvenientes. El principal método de este tipo de muestreo es
el denominado método de rutas aleatorias.

Moda
Se llama moda o valor modal a aquella que, en un grupo de observaciones, aparece más frecuentemente. Corresponde
al dominante de una variable aleatoria, es decir, aquel valor para el que la concentración de probabilidad es máxima.
Su determinación no requiere cálculos específicos, ya que basta con ordenar los valores individuales, agrupar los que
sean iguales y ver cuál es el grupo más numeroso.

N
Nivel de medida
Indica el tipo de cada una de las variables que se utilizan en el análisis. En el análisis de correspondencia pueden
especificarse cuatro niveles de medida: numérico (simple), ordinal (simple), nominal simple y nominal múltiple.

Nivel de significación
Expresa con qué probabilidad puede esperarse que el valor determinado en una muestra sea representativo del
colectivo.

Números aleatorios
Serie de números, situados unos a continuación de otros de una forma puramente aleatoria, que se han tomado de los
naturales. Las tablas de números aleatorios se elaboran con medios electrónicos, el “método de las congruencias” es el
más utilizado a tal efecto.

O
Operador lógico ]
Símbolo que asocia lógicamente 2 o más relaciones en una transformación condicional

Operador relacional
Símbolo que representa las comparaciones de dos valores de una expresión lógica en una transformación condicional,
como EQ (igual a), LT (menor que),LE (menor o igual que), etc.

Orden de medias móviles


Número de parámetros de media móvil de un modelo. En modelos ARIMA se representa mediante el parámetro q.

Ortogonalidad
Restricción matemática que exige que las estimaciones de los valores parciales sean independientes unas de otras. En el
análisis conjunto la ortogonalidad se refiere a la capacidad para medir el efecto del cambio de los niveles de cada
atributo y separarlo de los efectos del cambio de niveles de otros atributos y del error experimental.

P
Parcial
Se utiliza para determinar la relación lineal entre dos variables, controlando los efectos de otras variables. En ARL, es la
correlación entre una VI y la VD cuando se han eliminado de ambas los efectos lineales de las otras VI.

Paseo aleatorio
Serie cronológica que, cuando se diferencia, produce una serie aleatoria con una media de 0.

Percentil
Los valores por encima y por debajo en donde se encuentran ciertos porcentajes de casos.

Pérdida
Medida de la falta de bondad del ajuste de la solución o en qué medida esta no se ajusta a los datos originales. Pérdida
= p - Ajuste (p = nº de dimensiones de la solución)

Periodicidad
Variación cíclica repetitiva

Phi cuadrado
Medida de similaridad para datos de frecuencia. Es la medida CHISQ normalizada mediante la raíz cuadrada de
frecuencia combinada. En consecuencia, su valor no depende de las frecuencias totales de los dos elementos cuya
proximidad se calcula.

Población
Conjunto de elementos (individuos, organizaciones u objetos) del que se toma una muestra para su estudio. Se
denomina también universo.

Poisson
Distribución muy asimétrica que se utiliza para describir la aparición de sucesos raros.
Ponderaciones
Los coeficientes de regresión en cada dimensión para cada variable cuantificada de un conjunto, donde las
puntuaciones de objetos se regresan sobre variables cuantificadas. Proporciona una indicación de la contribución que
cada variable aporta a la dimensión dentro de cada conjunto.

Ponderación normalizada
Pesos utilizados en una ventana espectral transformados para que sumen 1. Cada peso inicial se divide por la suma de
todos ellos.

Porcentaje de varianza
Porcentaje de la variación total que puede atribuirse a cada factor o función discriminante.

Precisión de la derivada
Comparación entre las derivadas obtenidas mediante fórmula y las obtenidas numéricamente.

Predecir
Rango de observaciones utilizado para la predicción.

Proceso de media móvil


Modelo de ST en la que la observación en curso es una combinación lineal de errores aleatorios pasados y actuales.

Prueba binomial
Prueba para contrastar si una muestra procede de una distribución binomial con la probabilidad especificada de éxito
(p).

Prueba de bondad de ajuste de chi cuadrado


Contraste de la bondad de ajuste del modelo a los datos observados. Niveles críticos pequeños son indicativos de que el
modelo no se ajusta bien.

Prueba de probabilidad
La probabilidad de éxito (p) para la distribución binomial especificada.

Q
Q de Yules
Medida de similaridad para datos binarios debida a Yule. Es una función del cociente de los productos cruzados, y un
caso especial de la medida gamma de Goodman y Kruskal para datos ordinales. Tiene un rango de -1 a +1. Se calcula a
partir de una tabla 2x2 como: (ad-bc)/(ad+bc).

R
R cuadrado
Medida de la bondad de ajuste de un modelo lineal. En ocasiones recibe el nombre de coeficiente de determinación. Es
la proporción de la variación de la VD explicada por el modelo de regresión. Es también el cuadrado de la R múltiple, la
correlación entre los valores observados y los pronosticados de la VD . Su rango de valores puede ir desde 0 a 1. Los
valores pequeños indican que el modelo no se ajusta bien a los datos.

R de Pearson
Medida de asociación lineal entre dos variables. El valor de R tiene un rango comprendido entre: -1 (relación negativa
perfecta en la que todos los puntos se encuentran sobre una línea con pendiente negativa) +1 (relación positiva
perfecta: todos los puntos se encuentran sobre una línea con pendiente positiva). Un valor de 0 indica que no existe
ninguna relación lineal.

Rango
Posición de un caso cuando los valores de todos ellos se ordenan de menor a mayor.

Rango medio
Suma de los rangos dividida por el número de casos.
Raíz del error cuadrático medio
Raíz cuadrada del error cuadrático medio. El cálculo de la raíz cuadrada produce un estadístico de ajuste con la misma
métrica que la serie de los errores y la serie observada.

Regresión
Porción de la variabilidad observada total en la VD que es explicada por la regresión.

Residuo
Un residuo es la diferencia entre el valor real de la VD y el valor pronosticado por el modelo.

Rotación
Método general para facilitar la interpretación de una solución de factores. Los ejes de los pesos de los factores se
rotan para lograr una estructura sencilla. Existen varios métodos diferentes para la rotación. La rotación no afecta a la
bondad de ajuste de la solución.

Ruido blanco
Una ST aleatoria se describe como un proceso de ruido blanco, puesto que un análisis de frecuencia de una ST (a través
de SPECTRA) muestra que, por analogía con la luz blanca, todas las frecuencias están igualmente representadas. Por
otro lado, las series no aleatorias pueden caracterizarse por un predominio de frecuencias bajas, frecuencias altas o
una o más frecuencias determinadas que corresponden a periodicidades en la serie.

S
Serie temporal
Variable cuyos valores representan observaciones de un fenómeno uniformemente espaciadas a lo largo del tiempo.
También recibe el nombre de serie cronológica o serie en el tiempo.

Sesgo
Coeficientes que miden el grado de confusión entre los efectos. Un elemento cero en el triángulo superior de esta
matriz indica ausencia de confusión.

Simulación
Predicción de una puntuación de preferencia para un producto o servicio que no ha sido evaluada realmente por los
sujetos.

Suavizado exponencial
Técnica que permite predecir cada valor de una serie a partir de una combinación ponderada de valores precedentes de
la misma serie.

T
T cuadrado de Hotelling
Prueba multivariada de la H0 de que todos los elementos de la escala tienen la misma media.

Tabla de correspondencias
Tabla que contiene los nombres de los efectos que se van a contrastar y las columnas correspondientes en la matriz del
diseño. El número de columnas asignadas a un efecto es igual a sus grados de libertad.

Tamaño efectivo de la muestra


Nº de casos incluidos en el cálculo de los estadísticos, tras la eliminación de los casos con valores perdidos por pares o
mediante lista.

Tendencia estacional
La tendencia que se manifiesta en los puntos de una serie separados entre si por la amplitud correspondiente a una
estación. P. ej., si los datos son mensuales, la tendencia que exhiben todos los puntos de Enero.

Tipos de muestreos probabilísticos

Muestreo aleatorio simple


Este método de muestreo es el más elemental de los diferentes métodos de muestreo probabilístico. Básicamente
consiste en elegir los diferentes elementos que componen una muestra, a través de la extracción de bolas o papeletas
de una urna, en la que las bolas o papeletas representan a todos los miembros de la población. Si una vez que se ha
extraído una bola y, por tanto, un elemento de muestra, ésta se vuelve a introducir en la urna para que el elemento
elegido pueda serlo nuevamente, el muestreo se denomina “muestreo aleatorio con reemplazamiento”, recibiendo el
nombre de “muestreo aleatorio sin reemplazamiento” cuando los diferentes miembros de la población no pueden ser
elegidos más que una sola vez. Este procedimiento de la urna es muy laborioso, por lo que solo puede utilizarse cuando
la población es muy pequeña.

Muestreo aleatorio sistemático


Cuando la población es bastante numerosa y se conocen todos los miembros de la misma, puede seleccionarse una
muestra determinada eligiendo cada uno de los componentes de la muestra mediante intervalos preestablecidos. Por
ejemplo, si se tiene una población de 10000 elementos y se desea obtener una muestra de esa población de 100, se
procede al azar para elegir el primer elemento y a partir de él, se seleccionan los restantes 99 mediante intervalos de
cien en cien. Si se dispone de censos nominales de la población, pueden también elegirse los componentes de la
muestra tomando aquellos cuyos apellidos empiecen por una determinada letra, siempre que no exista razón alguna
para pensar que determinadas letras iniciales de algunos apellidos puedan producir una distorsión en el fenómeno que
se está estudiando. Si, por ejemplo, se trata de seleccionar una serie de personas que viven en un municipio
determinado para estudiar el nivel de ingresos de todo el municipio, no se deberá seguir este procedimiento si las
personas cuyos apellidos empiezan por determinadas letras, tienen en general, un nivel de ingresos muy superior.

Muestreo aleatorio estratificado


Este es uno de los procedimientos más empleados en la formación de muestras. Consiste, básicamente, en dividir a la
población en diferentes segmentos denominados “estratos”, formados por elementos lo más homogéneamente posibles
entre sí. Los estratos se forman atendiendo a diferentes variables, como pueden ser: sexo, edad, nivel de renta, etc. De
cada uno de los estratos formados se procede a elegir una muestra mediante alguno de los procedimientos anteriores.
La precisión de la encuesta aumenta, generalmente, a medida que se incrementa el número de elementos a elegir de
cada estrato

1. Muestreo estratificado proporcional.


Mediante este procedimiento, el número de elementos a elegir de cada estrato es proporcional a la totalidad de los
elementos que componen cada uno de ellos.

2. Muestreo estratificado no proporcional


En este caso, el número de elementos a elegir de cada estrato no depende solamente del número de elementos que
componen cada uno de ellos, sino, más bien , del grado de homogeneidad de los diferentes estratos. En la medida de
que un determinado estrato sea muy homogéneo en relación con una determinada variable, no será necesario elegir
muchos elementos de ese estrato para tener una determinada exactitud en los resultados. Por el contrario en aquellos
estratos más heterogéneos, será conveniente elegir un mayor número de elementos de los que le correspondería si se
hiciera una elección proporcional para tener una determinada precisión.

Muestreo por conglomerados


Este método de muestreo se caracteriza por que utiliza como unidad muestral un grupo de unidades elementales de la
población. Estos conglomerados pueden ser de diversos tipos, como áreas geográficas, manzanas de edificios, etc. Una
vez que se ha realizado la división en conglomerados, se eligen, a través del muestreo aleatorio simple, los
conglomerados que componen la muestra. Con este método se resuelve el problema de falta de censos completos de
personas o de fincas, mediante la utilización de mapas que permitan efectuar una división adecuada en conglomerados.
Ello representa, en la práctica, una reducción de tiempo en la recogida de información y una disminución del coste de
la misma. Este procedimiento tiene, no obstante, un riesgo importante en la precisión de las estimaciones, ya que
pueden elegirse conglomerados que sean muy homogéneos sus elementos, lo que podría dar lugar a una falta de
representatividad de la muestra elegida. Para evitar este inconveniente es necesario que la división en conglomerados
se efectúe utilizando un tamaño tal que impida la aparición de este efecto indicado.

Muestreo por etapas sucesivas


Este método de muestreo se denomina también “sub-muestreo”. Consiste en dividir la población en una serie de
conglomerados, de los que en una primera etapa se eligen las denominadas “unidades primarias”, que son las que
comprenden la muestra correspondiente. En una segunda etapa, se selecciona una muestra de elementos a partir de
cada unidad primaria elegida. Así, por ejemplo, si una ciudad se divide en pequeñas áreas geográficas, éstas formarían
las unidades primarias. A partir de estas pequeñas áreas, se elegirían manzanas de casas, que constituirían las unidades
secundarias. En una tercera etapa, se elegirían edificios, constituyendo así, las unidades terciarias. El proceso continúa
en tantas etapas como se quiera, hasta llegar a los elementos finales de la población. El muestreo que se realiza en dos
etapas recibe el nombre de “muestreo bietápico”, denominándose “muestreo polietápico” el que tiene lugar en más de
dos etapas.

U
Unicidad
Parte de la varianza de cada variable observada no atribuible a factores comunes. Puede recibir el nombre de factor
único.

Utilidad
Valor o importancia que tiene un producto o servicio para un consumidor.

V
Validez de criterios
La habilidad de los conglomerados de mostrar las diferencias esperadas para un variable no utilizada en la formación de
los conglomerados. Por ejemplo, si los conglomerados se forman en base a coeficientes de rendimiento, los
conglomerados con el coeficiente de rendimiento más grande tienen que tener también las puntuaciones de satisfacción
más grandes. Si es así, entonces la validez de criterios se sostiene.

Valor
Código numérico o alfabético que representa el estado de un caso para una variable.

Valor parcial
Estimación del análisis conjunto de la utilidad o preferencia global asociada con cada valor de cada atributo utilizado
para definir el producto/servicio.

Valor pronosticado
El valor de la VD predicho a partir del modelo.

Valor singular
Medida de la importancia de una solución. Hace referencia al valor propio

Valores de los patrones


Valores de las covariables

Valores residuales
Diferencias entre los valores observados de una serie y los predichos por un modelo. Los residuos no deben responder a
ningún patrón. Muchos procedimientos y utilidades de Trends proporcionan herramientas para establecer el
comportamiento de los residuos.

Variación Conjunta
Combinación de variables (conocidas como factores) especificadas por el analista que constituyen el valor total o
utilidad de los estímulos. El analista también especifica todos los valores posibles para cada variable. Estos valores se
conocen como niveles.

Variación residual
Porción de la variabilidad total de la VD que no puede atribuirse a, ni explicarse por, la regresión. Es la suma de los
cuadrados de los residuos.

Varianza error de la predicción


Estadístico que cuantifica la variabilidad alrededor de una predicción para un adelanto dado.

Varianza
La varianza es una medida de dispersión que refleja el reparto de los valores individuales alrededor del valor medio.
Para el caso de una distribución de frecuencias se calcula de la forma siguiente: las diferencias entre los valores
individuales y la media se elevan al cuadrado para eliminar la influencia de los signos, y todo este sumatorio se divide
entre el número total de observaciones.

Varianza-covarianza
Suma de las desviaciones de productos cruzados dividida por el nº de casos menos 1. La covarianza es una medida no
estandarizada de hasta qué punto la variación de una variable está asociada a la variación de otra. El coeficiente de
correlación se obtiene dividiendo la covarianza de dos variables por sus desviaciones típicas

Varimax
Método de rotación ortogonal que minimiza el número de variables que tienen saturaciones altas en cada factor.
Simplifica la interpretación de los factores.

Ventana
En el análisis espectral, un promedio móvil ponderado aplicado a ordenadas de periodograma adyacentes para obtener
una estimación del espectro.

W
Wilks Lambda
Prueba de significación multivariada. Lambda tiene un valor entre 0 y 1. Los valores grandes de Lambda indican que las
medias no parecen ser diferentes (su valor es 1 si son todas iguales). Los valores pequeños indican diferencias en las
medias de los grupos. En ocasiones reciben el nombre de estadístico U.

X
X'Beta
La suma, para cada caso, de los coeficientes de regresión multiplicados por los valores corregidos medios de las
covariables.

Y
Y de Yules
Coeficiente de similaridad para datos binarios debido a Yule. También conocido como coeficiente de coligación. Es una
función del cociente de los productos cruzados, con un rango de -1 a +1.

Z
Z
Estadístico de contraste que, para tamaños de muestras suficientemente grandes, tiene una distribución
aproximadamente normal. Con frecuencia es el cociente entre una estimación y su error típico.

También podría gustarte