Aplicación de Metodos Estadisticos en La Valuacion de Maquinaria y Equipo

PONENCIA
XLIX CONGRESO NACIONAL DEL VALUACION VERACRUZ 2013
PRESENTADA POR:
MTRO. EN VAL. ING. JAVIER FURLONG SALGADO
COLEGIO DE VALUADORES DEL ESTADO DE PUEBLA, A.C.
TEMA
APLICACIÓN DE METODOS ESTADISTICOS EN LA VALUACION DE

MAQUINARIA Y EQUIPO
INDICE
Resumen------------------------------------------------------------- 3
Introducción ----------------------------- ---------------------------- 5
1. Aspectos generales ------------------------------------------- 6
1.1 Definición de conceptos ------------------------------- 6
1.2 Enfoques de valuación inmobiliaria ------------------ 10
1.3 Enfoque de mercado ------------------------------------ 10
2. Principios de Estadística ------------------------------------- 13
2.1 Conceptos básicos ------------------------ -------------- 14
2.2 Recolección de datos ----------------------------------- 16
2.3 Organización de datos ----------------------------------- 20
2.4 Análisis de datos …..----------------------------------- 23
2.5 Tamaño de la muestra ----------------------------------- 29
2.6 Regresión y Correlación -------------------------------- 36
3. Aplicación del método ----------------------------------------- 49
CONC LUS IONES
BIBLIOGRAFIA
RESUMEN
La estadística está presente en casi todos los aspectos de la vida moderna, la
utilizan los políticos para conocer las preferencias del electorado, los ingenieros para llevar
el control de calidad en una línea de producción, los economistas para ver el rumbo de la
economía de un país, los científicos para estimar resultados de un experimento. En
cualquiera de los ejemplos anteriores, alguien quiere conocer una característica de algo. En
la mayoría de los casos éstas características que queremos conocer no se pueden
examinar en su totalidad porque su número es muy grande y verificarlas una por una, sería
muy tardado y costoso; lo que se hace es tomar una parte de ese total, examinarla, sacar
conclusiones de la parte examinada y extender esas conclusiones hacia el total no
examinado. Esto nos lleva a dos áreas distinta: una de recabar, clasificar y ordenar los
datos, y otra de hacer un análisis y establecer conclusiones a partir de los datos ordenados,
o sea, a la Estadística Descriptiva y la Estadística Inferencial.
En el campo de la valuación, se ha dado mucha importancia a la Estadística Inferencial
para determinar valores de bienes, a través de modelos de regresión, pero alimentar con
los datos adecuados estos modelos, para generar resultados confiables, se deja a un lado
en la mayoría de los casos y este es un tema en el que se puede encontrar ayuda en la
Estadística Descriptiva.
Uno de los temas más importantes en la recolección de datos para alimentar un
modelo estadístico es el tamaño de la muestra analizada. La determinación del tamaño de
la muestra no es algo sencillo, ya que en la mayoría de los casos se requiere información
poblacional con la que no se cuenta. La estadística nos proporciona algunas herramientas y
una estructura para auxiliarnos en este proceso.
Para determinar el tamaño de la muestra mencionado, se necesita determinar el
nivel de confianza, el error máximo y la desviación estándar de la población de acuerdo a la
siguiente fórmula:
2
z
n
E
Una vez obtenido este número de muestras que sustenta el análisis, se

procede a aplicar un modelo de Análisis Multivariante de acuerdo al siguiente
modelo de regresión lineal:
y = + x1 + 2x2 + ... + kxk + 
Cualquier tipo de bien podría ser valuado con esta metodología, pero
se necesita cumplir con el tamaño de muestra sustentado que, en la mayoría
de los casos no es reducido. En la práctica, se encuentran algunos bienes
que cumplen con la cantidad de comparables suficientes para aplicar el
modelo multivariante. Regularmente, dentro de la valuación de maquinaria y
equipo, el equipo de trasporte y la maquinaria de la construcción presentan
gran cantidad de información de merca do, por lo que se pueden plantear
ejemplos de la aplicación de la metodología mencianada con estos bienes.
Todos los métodos estadísticos multivariantes requieren del desarrollo
de modelos matemáticos complicados, pero en época reciente, la aparición
de programas computacionales especializados en estos temas, permiten la
aplicación de los modelos de manera rápida y eficiente, tales como el
software SPSS.
INTRODUCCION
El planteamiento del tema a desarrollar es una respuesta a una situación problemática

detectada en el campo de la valuación.
El determinar un valor de mercado de un bien depende en gran medida de la forma de

recopilar y analizar la información disponible para tal fin. En la práctica no es fácil esta
tarea, ya que es común que la información no esté disponible o sea poco confiable y en
muchos casos se trabajan técnicas de selección de comparables o de homologación de
información que están basadas en datos que no se pueden sustentar. Adicionalmente, en el
enfoque de mercado se aplican herramientas estadísticas para inferir resultados en base a
la información obtenida, pero estos modelos, que de inicio ofrecen resultados muy
confiables, no deberían de ser aplicados si no se cuenta con datos analizados de manera
correcta. Un problema recurrente es el que surge al aplicar un análisis multivariante a una
muestra sin calcular el tamaño óptimo.
OBJETIVO
La propuesta que se hace en este trabajo es la de calcular un valor de mercado

sustentado estadísticamente, utilizando un análisis multivariante y haciendo uso de una
base de datos obtenida con una investigación de mercado. Como el campo de la valuación
es muy amplio, donde podemos valuar desde una casa, hasta una obra de arte, el análisis
se centrará en el avalúo de maquinaria y equipo y dentro de este campo, se seleccionará
un ejemplo donde se aplique la metodología de manera adecuada.
Este trabajo se iniciará estableciendo lo que se entiende por las
palabras: “valor”, “prec io”, “valor de mercado”, “costo” y “valuación” ya que
son la base del estudio. Se sabe que estos conceptos tienen diversos
significados, como escenarios desde los cuales se pueden definir, pero
únicamente se tomará la acepción económica de cada uno de estos vocablos
ya que son los que realmente interesan a la s personas que se dedican a
estimar el valor, en términos monetarios, de los bienes tangibles e
intangibles de los cuales se les ha solicitado su inspección y correspondiente
dictamen ya sea referido a un tiempo actual, pasado o futuro.
DEFICNICION DE CONCEPTOS
Concepto de valor
El valor ha existido como un concepto desde que la humanidad ha
creado capital y riqueza; ha sido una medida consistentemente usada por
quienes tienen la libertad de poseer diversos bienes y preservar e
incrementar su patrimon io.
El dueño de un bien le asigna valor a su posesión; también lo otorga
quien presta o recibe un servicio. El valor en sí, se manifiesta a través de los
distintos conceptos que de él se tienen en los diferentes sistemas
económicos, sociales o religiosos. Se puede decir que es el grado de
deseabilidad que se tiene de algo.
Desde el punto de vista económico, valor es el grado de satisfacción
que los bienes y servicios de naturaleza tangible o intangible proporcionan a
los grupos o individuos. Pero existen dos factores que afectan este concepto:
el tiempo y el riesgo. El paso del tiempo afecta al valor porque las
condiciones cambian y esto puede afectar la posición de un bien en la escala
de valor económico y la deseabilidad que se tiene de él. También el ri esgo lo
afecta, ya que las esperanzas sobre las condiciones futuras determinan la
confianza de que estará disponible o de que tendrá mayor o menor valor; el
riesgo será distinto para bienes o servicios de distinta naturaleza.
A continuación se recordarán a lgunas definiciones de valores:
VALOR DE USO: Es el valor que tiene un bien de acuerdo con su función, implica un
sentido de mérito o de posesión; por ejemplo valor sentimental, valor histórico, valor
potencial, valor de inversión, etc.
VALOR DE CAMBIO: Es el que representa el valor comercial de un bien.
VALOR COMERCIAL: La máxima suma de dinero a cambio de la cual podría

razonablemente esperarse que se celebraría una operación de compraventa entre un
vendedor interesado en vender, pero sin ninguna necesidad imperiosa o urgente de llevar a
cabo dicha operación, ni obligado a vender, y un comprador prudente y deseoso de
comprar pero sin ninguna necesidad urgente o imperiosa de hacerlo. Ambos con pleno
conocimiento de todos los usos, ventajas y desventajas que tiene el bien valuado.
VALOR DE REPRODUCCIÓN NUEVO: Es el valor a precios actuales de la reproducción

de una nueva réplica de un bien, utilizando materiales idénticos.
VALOR DE REPOSICIÓN NUEVO: Es el valor a precios actuales de un bien nuevo similar

o igual, con la utilidad casi equivalente más próxima al bien que se está valuando.
VALOR JUSTO DE MERCADO O VALOR COMERCIAL: Es la suma de dinero a cambio de
la cual podría esperarse, de manera razonable, que un comprador y un vendedor bien
informados estuvieran dispuestos a efectuar la transacción de un bien, bajo condiciones
equitativas y sin que ninguno tuviera la compulsión de comprar o vender, y que ambos
conocen toda la información pertinente al bien.
VALOR JUSTO DE MERCADO EN USO CONTINUO: Es la suma de dinero estimada a

cambio de la cual podría esperarse, de manera razonable, que un comprador y un
vendedor bien informados estarían dispuestos a efectuar la transacción de un bien, bajo
condiciones equitativas y sin que ninguno tuviera la necesidad imperiosa de comprar o
vender, donde ambos conocen toda la información pertinente al bien, considerando que
éste está instalado, por lo que se contemplan los gastos de instalación y se presupone que
el bien está generando ingresos y/o utilidades que corroboran el valor considerado en el
informe valuatorio.
VALOR JUSTO DE MERCADO INSTALADO: La suma de dinero estimada a cambio de la

cual podría esperarse, razonablemente, que un comprador y un vendedor bien informados
estarían dispuestos a efectuar la transacción de un bien instalado, bajo condiciones
equitativas, sin que ninguno tuviera la necesidad imperiosa de comprar o vender, donde
ambos conocen de toda la información pertinente. El bien está instalado, más no está
operando y no generará ingresos y/o utilidades.
VALOR JUSTO DE MERCADO DESMONTADO: La suma de dinero estimado a cambio de

la cual podría esperarse, razonablemente, que un comprador y un vendedor informados
estarían dispuestos a efectuar la transacción de un bien, bajo condiciones equitativas y sin
que ninguno tuviera la necesidad imperiosa de comprar o vender, donde ambos conocen
toda la información pertinente y en el entendido de que el equipo se trasladará a otro sitio y
está desmontado.
VALOR DE LIQUIDACIÓN EN OBRA: El importe total de dinero que se espera obtener por
una planta o instalación industrial en quiebra, normalmente fuera de operación, suponiendo
que toda la planta se venderá completa, en cierto tiempo limitado para llevar a término la
transacción.
VALOR DE LIQUIDACIÓN ORDENADA: La suma bruta estimada en dinero que se espera

obtener por concepto de una venta, contando con un plazo razonable para encontrar un
comprador, donde el vendedor se ve en la necesidad de vender “tal como está y donde se
ubica” el bien, en parte o en forma completa. Que la planta puede o no estar en quiebra.
VALOR DE LIQUIDACIÓN FORZOSA: La suma bruta estimada en dinero que podría

percibirse, razonablemente, por concepto de una venta pública debidamente anunciada y
llevada a cabo, en la que el vendedor se ve en la necesidad de vender de inmediato “tal
como está y donde se ubica el bien”.
VALOR DE RESCATE: La suma de dinero que se espera obtener por concepto de la venta
total de un bien, o de un componente del mismo, que se haya retirado de servicio para
utilizarse en otra parte.
VALOR DE CHATARRA: La suma de dinero que podría obtenerse por un bien si éste fuera
vendido sólo con base al tipo de material del que está compuesto y no para destinarse a un
uso productivo.
Concepto de precio
El precio se puede asociar a una operación de compraventa, ya que representa la

cantidad monetaria en que un comerciante o un vendedor oferta un producto o un servicio;
si un comprador está dispuesto a pagarla, el precio tiende a constituirse en valor.
Concepto de costo
Monto de la erogación realizada para reproducir o reemplazar un bien. El costo no
incluye la utilidad ni los impuestos derivados de la venta.
Concepto de bien o bienes
A medida que la vocación del valuador de bienes, con el paso del tiempo, ha
evolucionado de una ocupación mercantil a una profesión, han surgido y debido ser
aclarados ciertos conceptos.
Hoy el término “bienes” se aplica a las cosas físicas y también a los derechos reales
como la servidumbre y la habitación que recaen sobre bienes inmuebles (que son
considerados como bienes inmuebles por su objeto, según clasificación establecida en el
Código Civil del Estado Libre y Soberano de Puebla arts. 750 fracción XII y, 751).
Como ya se estableció en algún inciso anterior, el valor es el grado de satisfacción
que dan los bienes; para que un bien pueda tener ese grado de deseabilidad y satisfacción,
debe contar con tres características:
a) Utilidad.- Debe de servir para algo, inclusive para satisfacer necesidades
psicológicas.
b) Valor de intercambio.- Debe de existir alguien que desee tener el bien y alguien
que se quiera deshacer a cambio de otra cosa, que puede ser dinero.
c) Escasez.- Siguiendo los principios de economía, un bien que tuviera
disponibilidad ilimitada para cualquier persona, no se le podría asignar un valor
específico.
Definición de valuación
En la actualidad se entiende que “la valuación”: es la estimación del valor de un bien

a una fecha determinada, para un propósito y objeto específico
ENFOQUES DE VALUACION INMOBILIARIA
Se establecen tres enfoques o métodos para la elaboración de los avalúos de bienes

que son: el físico, el de ingresos y el de mercado, y comprende tres clases de operaciones,
a saber:
1. - La estimación del costo de producir y reponer un bien físico (valor físico)
2. - La predicción de la capacidad de compra de determinados tipo de bienes (valor
de capitalización)
3. - La valuación o determinación del valor de mercado de un bien.
En virtud de que el presente trabajo se centra exclusivamente en el estudio del valor

de mercado de los bienes inmuebles, no abordaremos el estudio de los métodos físico y de
capitalización, entrando únicamente al estudio y análisis de cómo se llega a integrar en la
actualidad el valor de mercado para el caso de maquinaria y equipo.
ENFOQUE DE MERCADO
Como ya vió, el valor se puede expresar como una medida en la escala de

deseabilidad de individuos, grupos y organizaciones; así, la escasez relativa de un bien o
servicio habrá de influir sobre su atractividad y, por lo tanto, sobre su precio. Tenderá a
descender el valor de un bien, tal como su precio lo expresa, cuando éste pueda obtenerse
con facilidad, o ascender cuando las fuentes de abastecimiento no alcancen a cubrir la
demanda, por lo tanto tenemos que reconocer la teoría económica básica de equilibrio
entre oferta y demanda como un factor fundamental a tomarse en cuenta en el
establecimiento de un valor de mercado.
La naturaleza de la oferta y la demanda existentes para cualquier bien influirá sobre el
valor y esta influencia persistirá aún ante la ausencia de un mercado bien desarrollado y
definido para los bienes analizados. Se facilitará la tarea para precisar el valor, cuando la
oferta y la demanda se manifiestan, a través de una historia de transacciones abundantes y
estables que delinee claramente la naturaleza de estas fuerzas. Cuando los bienes se
intercambian con frecuencia y bajo condiciones de libertad, la interacción de la oferta y la
demanda generará algo aproximado o quizá igual al valor de mercado.
Precio
demanda
oferta
(valor)
Precio de
equilibrio
mercado
Cantidad
En el caso de la valuación de bienes en general, no es común tener esta información
disponible, por lo que se hace uso de ofertas que se tienen en el mercado, pero tomando
en cuenta que existe una diferencia entre el precio ofertado y el precio en el que se cierra la
operación de compraventa; a esta diferencia se le llama factor de comercialización.
Adentrándose en el mercado de maquinaria y equipo, el enfoque de mercado lleva a
calcular el valor del bien estudiado, al cual un comprador estaría dispuesto a cerrar una
transacción con un vendedor, en condiciones de conocimiento del bien y del mercado, y sin
presiones de ningún tipo, o lo que es lo mismo, se estaría conociendo el valor que
determina la oferta y la demanda.
Para establecer dicho valor es necesario un conocimiento del mercado a través de
una investigación. Es común que se haga una recolección de datos, de maquinaria y equipo
que el valuador considere similares al que es objeto de estudio, ya sea por comunicación
directa con los participantes de una operación de compraventa, o por información publicada
en diarios, revistas especializadas, comunicación telefónica o por anuncios en internet. Si
no se encuentran máquinas o equipo con las mismas características, se hace uso de las
técnicas de homologación, que tratan de igualar las características de los comparables que
se investigaron con las de la máquina o equipo valuado, aplicando factores numéricos de
premio o castigo; posteriormente de hace una estimación del valor buscado aplicando la
estadística, ya sea por el cálculo de la media o por una regresión. El problema que se
puede encontrar en esta metodología es que las muestras analizadas por lo general son
muy pequeñas, como es común que se aplique de tres a seis en la práctica.
La propuesta que se hace en este estudio es tener un valor de mercado sustentado
estadísticamente, utilizando un análisis multivariante, haciendo uso de una base de datos
obtenida con una investigación de mercado.
CAPITULO 2
PRINCIPIOS DE ESTADÍSTICA
CONCEPTOS BASICOS
La estadística está presente en casi todos los aspectos de la vida moderna, la utilizan
los políticos para conocer las preferencias del electorado, los ingenieros para llevar el
control de calidad en una línea de producción, los economistas para ver el rumbo de la
economía de un país, los científicos para estimar resultados de un experimento, pero antes
de aplicarla en nuestro estudio, necesitamos definirla y conocer los conceptos básicos que
la fundamentan.
Definición de estadística
En cualquiera de los ejemplos anteriores, alguien quiere conocer una característica

de algo. En la mayoría de los casos éstas características que se quieren conocer no se
pueden examinar en su totalidad porque su número es muy grande y verificarlas una por
una, sería muy tardado y costoso; lo que se hace es tomar una parte de ese total,
examinarla, sacar conclusiones de la parte examinada y extender esas conclusiones hacia
el total no examinado. Esto lleva a dos áreas distinta: una de recabar, clasificar y ordenar
los datos, y otra de hacer un análisis y establecer conclusiones a partir de los datos
ordenados.
Lo anterior hace que existan dos ramas de la estadística: la estadística descriptiva y
la estadística inferencial.
La estadística descriptiva es aquella que se encarga de la recolección, presentación
y descripción de datos muestrales.
La estadística inferencial es la que se encarga de la interpretación de los valores
resultantes de la estadística descriptiva y de la toma de decisiones y la obtención de
conclusiones de una población.
De manera general y simple se puede decir que la estadística trata de la
recopilación, presentación, análisis y uso de la información para resolver
problemas, , tomar decisiones, y diseñar y desarrollar productos y
procedimientos 1 .
Términos fundamentales
Antes de abordar los temas de estadística, se necesita definir algunas términos

importantes.
POBLACION. Es un conjunto de elementos, individuos u objetos que poseen una
característica común y cuyas propiedades serán analizadas. Existen dos tipos de
poblaciones: finitas e infinitas. La población finita es aquella en la cual podemos enumerar
cada uno de sus elementos, como por ejemplo, el total de libros de una biblioteca o el total
de casas habitación unifamiliares que tiene un municipio; por otro lado la población infinita
es la que tiene un número indefinido de elementos, por ejemplo el número de piezas
defectuosas en una línea de producción.
MUESTRA. Es un subconjunto de la población que tiene las mismas características
de ésta. Debe ser representativa de la población en cantidad y calidad, es decir, debe de
tener los mismos elementos en las mismas proporciones.
VARIABLE. Característica de interés sobre cada ele mento individual
de una población o muestra 1 . Puede ser el estado de conservación de una casa

habitación o los metros cuadrados de construcción que tiene. Existen dos tipos de
variables: cualitativas y cuantitativas.
La variables cualitativas son aquellas que describen atributos de los elementos de la
población o muestra y no son numéricas. A su vez, se clasifican en nominales, las cuales
describen elementos que no tiene sentido ordenar, como el color de una casa, y por otro
lado las ordinales,
1
H i n e s W i l l i a m y o t r o s , P r o b a b i l i d a d y E s t a d í s t i c a p a r a In g e n i e r í a . T r a d . G a b r i e l N a g o r e . 4 t a . e d i c i ó n ,
México: Compañía Editorial Continental, 2005.
que describen una posición o clasificación ordenada, como por puede ser el estado de
conservación de una máquina: excelente, bueno, regular, malo y ruinoso.
DATO. Valor que puede tomar una variable dentro una población o muestra, por
ejemplo 3 años de edad de un vehículo.
EXPERIMENTO. Es una actividad realizada bajo un plan determinado, la cual
produce resultados que se consideran datos. El ejemplo más común es el de los
experimentos de laboratorio en los cuales se manipula una serie de elementos tendientes a
obtener resultados, los cuales son utilizados para sacar conclusiones de situaciones
específicas.
PARAMETRO. Medida que representa a todos los datos de una población. Puede
ser el promedio de metros cuadrados de construcción de las casas habitación de una
población.
Estadístico. Medida que representa a todos los datos de una muestra. Igual que
sucede en el parámetro, puede ser ejemplificada con el promedio de los metros cuadrados
de construcción de una muestra de casas habitación de la población analizada.
RECOLECCION DE DATOS
Aspectos generales
Uno de los aspectos más importantes de la estadística es la obtención de los datos

ya que los resultados finales de las inferencias que se realicen, dependen de la buena
recolección de estos.
La recolección de datos puede presentarse como el siguiente proceso:
1. Definir los objetivos de la investigación o del experimento.
2. Definir la variable y la población de interés.
3. Definir los esquemas para recolectar y medir los datos. Esto incluye el
procedimiento de muestreo, el tamaño de la muestra y el instrumento de
medición (cuestionario, por teléfono, etc.) de los datos.
4. Determinar las técnicas idóneas para realizar el análisis de datos: descriptivas o
inferenciales.2
2 Johnson Robert y Patricia Kuby, Estadística Elemental. Lo Esencial. Trad. Hugo Villagomez. México: Thomson Learning, 2004.
Existen dos métodos para la recolección de datos: el estudio experimental y el
estudio observacional.
En el primero, se manipula o controla el entorno y se observa los efectos que se
producen en la variable estudiada. Es importante mencionar que el experimento se
diseña para obtener los datos necesarios para conocer el efecto sobre la variable. Un
ejemplo de este proceso, es la medición que se hace de los efectos que producen los
medicamentos en ratas de laboratorio, cuando se les inyectan diferentes dosis.
En el estudio observacional sucede lo contrario, es decir, no se manipula o controla
el proceso de observación, simplemente se muestrea la población para obtener los datos,
observando sin intervenir. Además, dentro de éste método de recolección de datos,
tenemos cuatro formas principales de hacerlo: entrevista personal, entrevista por teléfono,
cuestionarios autoaplicados y observación directa.
Cuando se puede enlistar cada elemento de una población, estamos hablando de un
censo, pero las observaciones implican tiempo y dinero; con poca información el
investigador no puede obtener buenas estimaciones, mientras que mucha información,
como la que nos da el censo, implica un costo muy elevado, por eso es común efectuar una
encuesta muestral. Al elegir una muestra para realizar una encuesta, donde recolectaremos
los datos de la población estudiada, es necesario elaborar un marco muestral. Un marco es
una lista de unidades de muestreo 3 la cual debe ser igual a la población y sus elementos
solo pueden aparecer una vez.
Una vez que tenemos el marco muestral, debemos determinar el método de
muestreo que se utilizará. Existen muchos métodos para tal fin pero los podemos agrupar
en dos: muestreo de juicio y muestreo probabilístico. En el muestreo de juicio la persona
que lo elabora toma las muestras que considera representativas de la población según su
juicio. En el muestreo probabilístico se seleccionan los elementos en base a la probabilidad
de que tienen de ser elegidos como parte de la muestra, y puede ser con reemplazo o sin
reemplazo; en el primero se toma un elemento para que forme parte de la muestra y antes
de tomar el siguiente, se regresa a la población para que siga formando parte de ella y
pueda, incluso, volver a ser seleccionado. En el muestreo sin reemplazo los elementos se
van separando formando parte de la muestra sin ser devueltos en ningún momento,
haciendo que la probabilidad de que los elementos restantes sean escogidos se
incremente, ya que los elementos en la población van disminuyendo.
3 Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo
Editorial Iberoamérica, 1987.
Dentro de la clasificación de los muestreos probabilísticos, los mas comúnmente
utilizados se describen a continuación.
Muestreo irrestricto aleatorio
Los dos factores que más afectan la representatividad que tiene una muestra en una
población son el tamaño de la muestra y la magnitud de la variación de los datos; entre
más grande es la muestra, mayor será la información que se espera obtener de la
población, mientras que la variación de los datos puede ser controlada por medio del
método por el cual se obtienen las observaciones.
El método que se utiliza con mayor frecuencia para obtener una muestra de una
población es el muestreo aleatorio irrestricto y es aquel en el cual cada elemento de la
población tiene la misma probabilidad de ser seleccionado, así como todas las muestras de
tamaño n tienen la misma probabilidad de ser elegidas.
El que se trate de un muestreo aleatorio significa que al seleccionar un elemento, el
siguiente resultado o elemento seleccionado no sea predecible, y pueda ser cualquiera de
la población. La manera de extraer las muestras, para asegurarse que todos los elementos
tengan la misma probabilidad de ser elegidos, es numerarlos y utilizar un generador de
números aleatorios, o tablas igualmente de números aleatorios para elegir los que sean
necesarios.
Muestreo aleatorio estratificado
Una muestra aleatoria estratificada es la obtenida mediante la separación de los

elementos de la población en grupos que no presenten traslapes, llamados estratos, y la
selección posterior de una muestra irrestricta aleatoria simple de cada estrato.1
Para seleccionar este tipo de muestra, primero hay que especificar los estratos o
subdivisiones en los que se va a dividir el marco muestral, usualmente se puede usar una
subdivisión
1
Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo Editorial
Iberoamérica, 1987.
que ya ocurrió de manera natural, por ejemplo, si suponemos que la población a estudiar
es el total de casas habitación unifamiliares del municipio de Puebla, los estratos que
podrían existir de manera natural son las casas de lujo, de semi-lujo, las de nivel medio, las
de interés social y las populares; una vez seleccionados los estratos, se resumen por
separado y luego se combinan para obtener conclusiones acerca de toda la población.
Este tipo de muestreo presenta tres ventajas fundamentales: primero, que la
variación de los datos de la muestra proporcional es menor a la que obtenemos por el
muestreo irrestricto aleatorio, porque la variación de los datos dentro de cada estrato es
usualmente menor que la de toda la población. En segundo lugar, el costo de recolectar y
analizar datos se hace mas pequeño en muestras separadas que en una población grande,
y por último, se pueden hacer estimaciones separadas por estrato sin tener que hacer otra
muestra.
Muestreo sistemático
En el muestreo sistemático se ordenan en forma de lista los elementos de la
población a estudiar, después se elige un intervalo k entre dichos elementos,
posteriormente se elige aleatoriamente un elementos y a partir de éste se selecciona todo
k-ésimo elemento del marco muestral. Este método es fácil de describir y ejecutar, y en
general se extiende más uniformemente sobre toda la población y puede proporcionar más
información acerca de la población que una cantidad equivalente de datos contenida en
una muestra irrestricta aleatoria, pero tiene el inconveniente de no dar resultados aleatorios
cuando el marco muestral sea repetitivo o de naturaleza cíclica.
Muestreo por conglomerados

Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de
muestreo es una colección, o conglomerado, de elementos1. Para entender mejor, vamos a
suponer que necesitamos conocer el ingreso por hogar en una ciudad. Si usamos un
muestreo irrestricto aleatorio, sería muy costosa la investigación ya que el costo traslado y
el tiempo utilizado por los encuestadores sería elevado. Si usamos un muestreo
estratificado necesitaríamos un marco para cada estrato y resultaría igualmente costoso.
Por otro lado, si dividimos la ciudad en regiones tales como manzanas (o conglomerados),
y seleccionamos una muestra irrestricta aleatoria de
1
Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo Editorial
Iberoamérica, 1987.
ellas simplificaría el proceso; se establecería un marco que liste las manzanas de la unidad
y se podría medir el ingreso de las familias dentro de las manzanas.
Es conveniente utilizar el muestreo por conglomerados cuando no se encuentra
disponible o sea muy costoso obtener un marco muestral que liste todos los elementos de
una población. También lo podemos utilizar cuando el costo de las observaciones
realizadas es directamente proporcional a la distancia que separa los elementos. Otro
factor importante a tomarse en cuenta es que si los elementos del conglomerado son muy
diferentes entre sí, una muestra que contenga pocos conglomerados grandes pueden
producir una estimación muy buena de un parámetro poblacional. De aquí podemos sacar
la principal diferencia entre la construcción de estratos y la de conglomerados: Los estratos
pueden ser tan homogéneos entre ellos como sea posible, pero un estrato debe diferir tanto
como sea posible de otro respecto a la característica que está siendo medida. En cambio,
los conglomerados, deben ser tan heterogéneos entre ellos como sea posible y similar a
otro para poder aprovechar las ventajas de los costos de muestreo.
Una variante del muestreo por conglomerados es el muestro por conglomerados en
dos etapas, el cual se obtiene seleccionando una muestra aleatoria de conglomerados y
cuando se tiene ésta, se selecciona una muestra aleatoria de los elementos de cada
conglomerado muestreado.
ORGANIZACIÓN DE DATOS
Una vez que recolectamos datos de una población mediante una muestra,
necesitamos organizarlos para poder obtener conclusiones válidas de ellos. La manera
más común para hacerlo es mediante distribución de frecuencias y mediante gráficas.
Presentación gráfica de los datos

Una de las formas más conocidas para empezar a familiarizarse con los datos es
mediante un formato visual, o gráfico, que nos presente el patrón de comportamiento de la
variable estudiada. Existen varios tipos de gráficas las cuales es conveniente utilizar de
acuerdo al tipo de datos y al concepto a representar.
Gráficas de pastel
Las gráficas de pastel (diagramas de pay) son aquellas que muestran la cantidad de
datos que pertenecen a una categoría como una parte proporcional de un círculo y suelen
utilizarse para describir datos cualitativos. Por ejemplo:
Tipo de casas
2% 4%
7% Popular
22%
Interés social
Media
Semi-lujo
65% Lujo
Gráficas de barras
Las gráficas de barras son aquellas que muestran la cantidad de datos que
pertenecen a una categoría como áreas de rectángulos de tamaños proporcionales y, al
igual que las de pastel, suelen utilizarse para describir datos cualitativos. Por ejemplo:
Tipo de casas del fraccionamiento "x"
40
35
Número de casas
30
25
20
15
10
5
0
Popular Interés Media Semi-lujo Lujo
social
Tipo de casa
Gráficas de puntos
Presenta los datos de una muestra mediante la representación de cada porción de
datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u
horizontal. La frecuencia de los valores está representada a lo largo de la otra escala1.
Estas gráficas suelen utilizarse en datos cuantitativos. Por Ejemplo:
Superficie de Costrucción
350
300
Métros cuadrados
250
200
150
100
50
0
0 5 10 15 20 25
Núm ero de dato
Distribución de frecuencias
Acabamos de ver cómo los datos se pueden representar de una manera gráfica para
facilitarnos su interpretación, pero la manera más efectiva de manejarlos es a través de
tablas de distribución de frecuencias.
La frecuencia es el número de veces que un valor numérico aparece en la muestra.
La distribución de frecuencias es un listado que asocia cada valor de una variable
con su frecuencia.
Para obtener la distribución de frecuencias de una muestra primero es necesario
listar el total de los datos en orden ascendente; después determinamos el rango de los
datos, es decir, la diferencia entre el mayor y el menor de ellos. Luego hay que establecer
el número de intervalos de clase, que son los intervalos contenidos en el rango en los
cuales lo queremos dividir. Dicho número de intervalos nos da el ancho de clase, el cual lo
podemos definir como la diferencia entre el límite superior y el límite inferior de clase. Estos
límites no son mas que los valores numéricos máximo y mínimo en que deben estar
contenidos los datos para pertenecer a esa clase.
Si expresamos de manera gráfica una distribución de frecuencias, obtendremos un

histograma, el cual es una gráfica de barras que representa una distribución de frecuencias
de una variable cuantitativa. Un histograma está integrado por los siguientes componentes:
1. Un título, que identifica la población o la muestra de interés.
2. Una escala vertical, que identifica las frecuencias que hay en las diversas
clases.
3. Una escala horizontal, que identifica la variable x. Los valores de los límites
de clase o de las marcas de clase deben identificarse a lo largo del eje x.
Debe utilizarse el método de identificación con que se presente la variable.
ANALSIS DE DATOS
Como vimos anteriormente, la estadística estudia las características de una muestra
para hacer inferencias de las características de una población. Dichas características de las
poblaciones se estudian mediante indicadores de aspectos particulares. Estos indicadores
son llamados parámetros cuando se refieren a poblaciones y estadísticos cuando hacen
referencia a muestras. Una vez que tenemos ordenados nuestros datos en distribuciones
de frecuencias, existen dos tipos de indicadores para empezar a estudiar nuestros dados:
los de tendencia central y los de dispersión.
Medidas de tendencia central

La medidas de tendencia central son valores numéricos que localizan el centro de un
conjunto de datos. En este tipo de medidas, existen tres que son comúnmente usadas
como parámetros o como estadísticos:
Media
La medida de tendencia central más utilizada es la media aritmética. Debido a que,
por lo general consideramos datos que se obtienen de una muestra, nos referimos a la
media aritmética como la media muestral; es común escuchar que representa el promedio
de los valores numéricos de los datos y se calcula dividiendo la suma de todos los valores
entre el número de datos. Sin embargo, la media difiere del promedio al involucrar
conceptos de probabilidad. De una manera simple, diremos que la media puede ser
definida como la suma de todos los valores de una población o muestra, multiplicando cada
uno de éstos valores con su probabilidad de ocurrencia, pero para efectos prácticos la
manejaremos como un promedio. Cuando hablamos de la media de una población, la
representamos por la letra griega (miu minúscula) y cuando hablamos de la media de una
muestra la representamos con x . Si las observaciones en una muestra tamaño n son
x1,x2,...,xn, la media muestral es:
- x
_
_+
1
__x
2
_+
_
_._
.._
+
_x
_n
_
x
n
o lo que es lo mismo:
-

i =1
x
i
x
n
la media de estos datos sigue siendo una medida de tendencia central, pero no implica
necesariamente que la mayoría de las observaciones estarán alrededor de ella. Si
consideramos que las observaciones tienen una unidad de masa y peso, la media muestral
es solo el centro de masa de los datos y esto implica que el histograma se equilibrará, en
forma de balanza, si se apoya en la media muestral.
Cuando calculamos el valor promedio de las observaciones de una población finita,
lo llamamos media de la población y lo calculamos de la misma manera:
x

N
donde x es el total de la población finita:
N
x 
i=1
x i
La estadística inferencial utiliza métodos para hacer inferencias sobre la media de la

población tomando como base la media de la muestra, por lo que la media de la muestra se
usa como un estimador de .
Mediana
La mediana es el valor que ocupa la posición central de un conjunto de datos

ordenados según su tamaño. También se puede definir como el punto en el que la muestra
se divide en dos partes iguales. Cuando se trata de la mediana de una población se
representa con la letra griega M (miu mayúscula) y cuando se trata de una muestra usamos
(x tilde). Se calcula de la siguiente manera:
x((n+1)/2) n impar
~
x
x(n/2)+x((n/2)+1) n par
2
La mediana tiene la ventaja de no estar muy influenciada por los valores extremo.
Moda
La moda es el valor numérico que más se repite dentro de un conjunto de datos.

Cuando ningún valor se repite, o más de un valor se repite con mayor frecuencia, se dice
que no hay moda.
Medidas de dispersión
No siempre las medidas de tendencia central proporcionan suficiente información

para describir los datos de una población o de una muestra. Supongamos que tenemos dos
muestras con los siguientes datos:
1: 137 157 152 165 172 147
2: 97 135 212 147 172 167
La media de las dos muestras es 155, pero la dispersión de los datos de la segunda
muestra es mayor que la de la primera, es decir, en la primera muestra los datos están
concentrados alrededor de la media y en la segunda se encuentran mas alejados o
dispersos, como lo podemos apreciar en la siguiente gráfica:
media
90 100 110 120 130 140 150 160 170 180 190 200 210 220
muestra 1
muestra 2
Las medidas de dispersión son aquellas que miden cómo se agrupan los datos en
una población o en una muestra. Asimismo, podemos ver el agrupamiento de todo el
conjunto de datos calculando el rango, o el agrupamiento de los datos alrededor de la
media calculando la desviación estándar y la varianza.
Rango
Como lo vimos anteriormente, el rango es la diferencia entre el mayor y el menor

valor de los datos analizados. El rango nos da una idea de lo dispersos que pueden estar
los datos entre sí. En el ejemplo anterior el rango para la primera muestra es de 35,
mientras que la segunda muestra tiene un rango de 75, lo que nos hace ver que estos
últimos están distribuidos en un mayor rango.
Varianza
La medida de dispersión más importante es la varianza. La podemos definir como el

promedio del cuadrado de las diferencias de los valores con respecto a la media. Cuando
hablamos de la varianza de una población, la representamos con la letra griega  (sigma
minúsc
hacemos con la letra s (ese minúscula) también elevada al cuadrado (s2).
Matemáticamente la expresamos en la siguiente manera: Si x1,x2,...,xn es una muestra de n
observaciones, la varianza de la muestra es
n

i=1
(x --
x)
i
2
s2 ____________
n-1
Una desviación con respecto a la media es la diferencia entre un valor de x y la

media x . Cada valor de la muestra se desvía de la media en una cantidad igual a (x- x ), y
esta desviación se hace cero cuando el valor se encuentra en la media. Por otro lado, si la
media es mayor que x, el valor resultante de la desviación es negativo, y en el caso
contrario, es positivo. Si calculamos el promedio de las desviaciones mediante la fórmula
n

i =1
-
(x -x)
i
promedio de las desviaciones

n
Se puede caer en el problema de que los valores positivos de las desviaciones se
neutralicen con los valores negativos y pudiera haber un promedio de desviaciones igual a
cero, lo cual indicaría que todos los valores están en la media sin que esto sea real.
Volviendo al mismo ejemplo de las dos muestras de datos anteriores, calculamos sus
desviaciones:
muestra 1 137 157 152 165 172 147
desviaciones -18 2 -3 10 17 -8
muestra 2 97 135 212 147 172 167

desviaciones -58 -20 57 -8 17 12
si aplicamos la fórmula anterior, en ambos casos el promedio de las desviaciones es cero.

Una manera de eliminar este efecto es elevando al cuadrado cada una de las desviaciones,
para asegurar que todas sean positivas. De esta manera obtenemos la varianza:
desviaciones muestra 1 -18 2 -3 10 17 -8
desviaciones al cuadrado 324 4 9 100 289 64
muestra 1
n 6

i =1
-
(x -x)
i 
i =1
2
(x -155) i
2
s2 158
n -1 6-1
desviaciones muestra 2 -58 -20 57 -8 17 12

desviaciones al cuadrado 3364 400 3249 64 289 144
muestra 2
n 6

i =1
-
(x -x)i
i =1
2
(x -155) i
2
s2 1502
n -1 6-1
Cuando tenemos una población finita con N valores el cálculo de la varianza se

expresa de la siguiente manera:
N

i=1
(x -) i
2

N
Desviación estándar
Es la raíz cuadrada de la varianza de un grupo de datos:
 
s s2
La desviación estándar nos da una idea más clara de la dispersión de los valores
alrededor de la media, ya que está expresada en las mismas unidades de medida que los
datos, es decir, si tenemos una muestra que expresa los precios de venta de un grupo de
automóviles en pesos, la varianza estará dada en pesos cuadrados, lo cual no tiene mucho
sentido al hacer un análisis; por otro lado, la desviación estándar, estará dada un pesos y
nos será de más utilidad al visualizar los datos.
Una aplicación muy útil de la desviación estándar está dada en el Teorema de
Chebyshev:
La probabilidad de que cualquier variable aleatoria x caiga dentro de k desviaciones
estándar de la media es al menos (1-(1/k2)).1
Esto quiere decir que a menos de dos desviaciones estándar de la media (k=2)
siempre se encontrarán por lo menos el 75% de los datos. Si se considera el intervalo de
tres desviaciones estándar a cada lado de la media, se encontrarán al menos el 89% de los
datos.
TAMAÑO DE LA MUESTRA
La determinación del tamaño de la muestra no es algo sencillo, ya que en la mayoría

de los casos se requiere información poblacional con la que no se cuenta. La estadística
nos proporciona algunas herramientas y una estructura para auxiliarnos en este proceso.
1
Walpole E. Ronald y Raymond H. Myers, Probabilidad y Estadística para Ingenieros. Trad. Luis Fernando Romero Sánchez. 2ª. Edición,
México: nueva editorial interamericana, 1983.
Variabilidad de la muestra.
Para hacer inferencias sobre una población debemos analizar con detenimiento los
resultados muestrales. De una muestra se obtiene una media muestral x , pero no es de
ro debe ser próximo para
que el resultado sea aceptable. De la misma manera, si tomamos una segunda muestra de
la población, tampoco debemos esperar que su media muestral sea idéntica a la primera
media muestral tomada, pero también debe aproximarse al primer valor tomado y a la
media poblacional. De aquí nos surge la duda de cómo saber cuál es un valor próximo;
para esto necesitamos una distribución muestral: Una distribución muestral de un
estadístico muestral, es la distribución de valores de un estadístico muestral obtenido de muestras
repetidas, todas del mismo tamaño y extraídas de la misma población1. Esto quiere decir, que si
tenemos una población cualquiera, y obtenemos varias muestras iguales (de manera
aleatoria) podemos establecer una distribución muestral, ya sea representada por una
distribución de frecuencias o en forma de histograma, de algún estadístico muestral, por
ejemplo, podemos establecer la distribución muestral de las medias x de todas las
muestras tomadas.
Si de cualquier población con media  y desviación estándar , se toman todas las
posibles muestras aleatorias, cada una de tamaño n, la distribución muestral de las medias
muestrales tiene una media  x igual a  y una desviación estándar  x igual a /(n)1/2; esta
desviación estándar de la media muesteral se llama error estándar y representa la
desviación o dispersión que presentan todas las medias muestrales respecto a la media de
la distribución de éstas. Además, si la población muestreada tiene una distribución normal2,
entonces la distribución muestral de x también es normal para muestras de todos
tamaños. Por otro lado, el Teorema del Límite Central nos dice: La distribución muestral de
medias muestrales se vuelve normal a medida que aumenta el tamaño de la muestra3. No
existe una regla firme que defina a las muestras suficientemente grandes, pero en la
práctica hablamos de muestras de más de 30 elementos.
Podemos resumir lo anterior afirmando que para describir la distribución muestral
necesitamos lo siguiente:
1 Johnson Robert y Patricia Kuby, Estadística Elemental. Lo Esencial. Trad. Hugo Villagomez. México: Thomson Learning, 2004.
2 Distribución de probabilidad continua en forma de montículo o campana, simétrica, donde el área total bajo la curva es igual a 1.
3 Johnson Robert y ...
- La ubicación del centro (la media):  x = 
- La medida de dispersión que indica cuan esparcidos están los datos
(desviación estándar): /(n)1/2
- Una indicación de cómo está distribuida: Si la población es normal, la
distribución de las medias muestrales es normal; el teorema del límite
central establece que, aunque la población no sea normal, la distribución
de las medias muesteales será aproximadamente normal, cuando la
muestra es suficientemente grande.
Cuando la distribución de las medias muestrales está distribuida normalmente, o es
aproximadamente normal, es posible hacer estimaciones de probabilidad con la ayuda
de la distribución normal estándar.
Confiabilidad de la muestra
Todas las muestras que tomemos no generan el mismo valor de x ( ó s). El punto
importante es que x variará de muestra a muestra. Es razonable pensar que la variación
en x será más grande a medida que la varianza de la población,  sea más grande.
También, a medida que aumenta el tamaño de la muestra, la variación en x disminuirá.
Cuando la muestra es pequeña, se necesitan solo uno o dos valores extremos para afectar
sustancialmente la media muestral generando así una x relativamente grande o pequeña.
A medida que aumenta el tamaño de la muestra, estos valores extremos tendrán un menor
impacto cuando aparezcan, porque serán promediados con más valores. La variación en x
es medida por su error estándar  x .
Si tenemos una variable x, con una distribución de probabilidad desconocida; la
media de la muestra, x , también tiene una distribución de probabilidad, la cual diremos que
es normal, por el teorema del límite central. Esto indica que x , normalmente se acerca a  y
que tiene iguales probabilidades de ser más grande o más pequeña. El área bajo la curva
queda dividida así:
El área corresponde a la probabilidad, es decir, el área bajo la curva entre dos
x esté entre esos dos puntos. Por ejemplo, en la siguiente
puntos es la probabilidad de que
figura aparece el 95% del área; esto quiere decir que la probabilidad de que x se
encuentre dentro de 2 x de la media de la población , es 0.95.
Para visualizar el concepto de error estándar, vemos en la figura que existe un 95%
de probabilidad de que x caiga dentro de +/- dos errores estándar de la media de la
población. Esta figura se denomina distribución muestral, puesto que indica la probabilidad
de obtener una media muestral particular. El error estándar de x disminuye a medida que
el tamaño de la muestra aumenta; por consiguiente, con una muestra grande, x tenderá a
estar más cerca de , y la distribución de x cambiará con ello.
Estimación de intervalo
La media de la muestra, x , es usada para estimar la media de la población

desconocida (). Debido a que x varía de muestra a muestra, no es igual a la media de la
población. Existe un error de la muestra. Es útil proporcionar una estimación de intervalo en
torno a x el cual refleje nuestro juicio acerca del alcance de este error muestral:
x E error de la muestra = estimación del intervalo de 
El tamaño del intervalo dependerá de qué tan confiados queremos estar de que el
intervalo contenga a la media de la población verdadera, la estimación de este intervalo
sería:
x E 2 x = x E 2 /n1/2 = estimación de intervalo del 95.33% de 
El tamaño del intervalo se basa en 2 x porque la probabilidad de que x esté entre 2

x de la media poblacional es 0.9544. Aproximadamente el 95% de las muestras generarán
una estimación de intervalo que incluirá a la media de la población verdadera. Si se desea
tener una confianza del 90% de que la estimación de intervalo incluirá a la media
poblacional verdadera, entonces la estimación de intervalo sería:
x E 5/3( x )= x E 5/3 /n1/2 = estimación de intervalo del 90% de 
En este caso, el intervalo es más pequeño, pero tenemos menos confianza de que
incluya a la media poblacional verdadera.
Si la desviación estándar de la población ( x = ) no es conocida, es necesario
estimarla con la desviación estándar de la muestra, s. Por consiguiente, la estimación del
intervalo, por ejemplo, del 95.44% sería:
x 2s/n1/2 = estimación de intervalo del 95.44% con  desconocida
En resumen, la estimación del intervalo de la media de la población , , puede

escribirse así:
x E error nuestral, o x =E z(/2)/n1/2
donde
- z(/2) = Coeficiente de confianza. Es el número de múltiplos de error
necesarios para formular una estimación por intervalo del ancho correcto
para tener un nivel de confianza de 1-parte central de la curva normal).
El término /2 se refiere al área a cada lado de la curva normal fuera del
intervalo de confianza (el valor de z(/2) se obtiene de las tablas de la
distribución normal estándar).
desviación estándar de la población (se usa s si es desconocida).
n = tamaño de la muestra.
Por lo tanto, el tamaño de la estimación del intervalo dependerá de tres factores:

- Nivel de confianza. Si estamos dispuestos a tener menos nivel de
confianza de que la estimación de intervalo incluya a la media de la
población verdadera y desconocida, entonces el intervalo será más
pequeño.
- Desviación estándar de la población. Si hay poca variación de la
población, entonces la estimación del intervalo de la media poblacional
será más pequeña
- Tamaño de la muestra. Conforme el tamaño de la muestra aumenta, el
error de la muestra se ve reducido y el intervalo se volverá más pequeño.
El tamaño de la muestra
El intervalo de confianza tiene dos características básicas que determinan su

calidad: su nivel de confianza y su ancho. Es preferible que el intervalo tenga un alto nivel
de confianza y que sea preciso (estrecho) a la vez. Mientras más alto sea el nivel de
confianza, más probable es que el intervalo contenga al parámetro, y mientras más
estrecho es el intervalo, más precisa es la estimación. Estas dos propiedades parecen
contraponerse, ya que parecería que un intervalo más estrecho tiende a tener menos
probabilidad y que un intervalo más ancho es menos preciso. La parte del error máximo, de
la fórmula del intervalo de confianza especifica la relación implicada.
Si intervalo de confianza es
x E z(/2)/n1/2
se sabe que el error es

E = z(/2)/n1/2
El análisis de la formula indica que al aumentar el nivel de confianza, se hace más

grande el coeficiente de confianza y por lo tanto se requiere incrementar el error máximo o
el tamaño de la muestra; aminorar el error máximo requiere de la reducción del nivel de
confianza o bien, aumentar el tamaño de la muestra; disminuir el tamaño de la muestra
obliga a que el error se vuelva más grande o que el nivel de confianza disminuya. El trabajo
del experto en estadística, es encontrar el equilibrio entre el nivel de confianza, el tamaño
de la muestra y el error máximo, de modo que se obtenga un intervalo aceptable. También
podemos expresar la fórmula de la siguiente manera:
2
z
n
E
Si el error se expresa como múltiplo de la desviación estándar , para calcular el tamaño de

la muestra no es necesario el valor real de .
REGRESION Y CORRELACION
Datos de dos variables
Hasta ahora solo hemos visto problemas donde se involucra una variable, pero
existen muchas situaciones donde es necesario analizar de una manera combinada dos
variables, es decir un análisis de datos bivariados. Cada una de estas dos variables puede
ser cuantitativa o cualitativa, lo que resulta en tres posibles combinaciones:
Dos variables cualitativas. En esta categoría los datos se agrupan en tablas de
contingencia o cruzadas, donde se presenta la frecuencia para cada categoría cruzada de
las dos variables junto con los totales por renglón y por columna, denominados totales
marginales; el total de los totales marginales es igual al tamaño de la muestra.
Una variable cualitativa y una cuantitativa. En este caso los valores cuantitativos se
consideran muestras ajenas, cada una identificada por niveles de la variable cuantitativa y
los resultados se presentan uno junto al otro para efectos de comparación. Se pueden
aplicar histogramas para visualizar los datos.
Dos variables cuantitativas. Cuando esto sucede, los datos se expresan como pares
ordenados (x,y), donde x es la variables de entrada o variable independiente, y y es la
variable de salida o variable dependiente; a cada valor de x le corresponde un valor de y
que proviene de la misma fuente de datos. En este caso los datos se pueden representar
gráficamente mediante un diagrama de dispersión, en el cual la variable independiente x se
grafica en el eje coordenado horizontal, y la variable dependiente y en el eje vertical. Por
ejemplo:
Máquina 1 2 3 4 5 6 7
Característica 1 150 250 180 160 220 280 300
Característica 2 180 280 220 200 320 350 380
400
300
200
CONSTRUC
100
140 160 180 200 220 240 260 280 300 320
TERRENO
Correlación lineal
El objetivo de un análisis de correlación es el de medir la intensidad de una

relación lineal entre dos variables. Si a medida que crece la variable independiente, no hay
un cambio definido en los valores de la variable dependiente, se dice que no hay
correlación entre las dos variables. En el caso contrario, si a medida que crece la variable
independiente hay un cambio en la variable dependiente, hay una correlación. La
correlación es positiva cuando la variable dependiente crece y negativa cuando decrece. Si
los valores de x y y presentan un patrón de línea recta, se dice que tienen una correlación
lineal. Se pueden dar casos que los valores tengan patrones que tiendan a curvas y
representen correlaciones de funciones cuadráticas, cúbicas, exponenciales, logarítmicas,
etc. La correlación lineal perfecta se da cuando todos los puntos están sobre una línea
recta y puede ser positiva o negativa según su pendiente, pero si la línea es horizontal o
vertical, no hay correlación, porque una variable no afecta a la otra.
El coeficiente de correlación lineal r mide la intensidad de la relación lineal
entre dos variables y su valor está entre –1 y +1. Un valor de 1 significa correlación lineal
perfecta, ya sea positiva o negativa, y un valor de cero significa que no hay correlación. El
matemático Karl Pearson (1857- 1936) fue quien desarrolló la fórmula para el cálculo del
coeficiente de correlación, también llamado coeficiente de Pearson; se puede expresar
como rxy para indicar la correlación entre las variables x y y:
S
xy
rxy
(S
xxS
yy)1/2
donde Sxy representa la suma de los cuadrados de las diferencias entre (x- x ) y (y- y ); Sxx es la
suma de los cuadrados de las diferencias de (x- x ) y Syy es la suma de los cuadrados de las
diferencias de (x- x ).
n 2
n n  x
i
S
xy

i=
1
(x
i-
-)(yi-y)
x
-
Sxx 
i =1
xi 2 -
i =1
n
n 2
n  yi
Syy 
i =1
yi
2
- i =1
n
Calculando el coeficiente de correlación de Pearson para el ejemplo del apartado

anterior, tenemos r = 0.955, lo cual nos indica que hay una alta correlación lineal positiva
entre las dos variables, ya que su valor es cercano a 1, lo cual se puede apreciar en su
diagrama de dispersión, ya que los puntos se agrupan en torno a una línea recta.
Regresión con mínimos cuadrados
El análisis de regresión es una técnica estadística para modelar e investigar la relación

entre dos o más variables1.
Si tenemos una variable dependiente (o de respuesta), relacionada con k variables

independientes (o regresivas), las cuales normalmente son controlados por el investigador,
el análisis de regresión puede utilizarse en el caso de que los datos se recaban como
mediciones diferentes en una unidad experimental común. La relación de estas variables se
establece como un modelo matemático llamado ecuación de regresión, el cual se ajusta a
un conjunto de datos. Una aplicación de esta ecuación es la de hacer predicciones.
El análisis de regresión encuentra la ecuación de la curva que mejor describe la
relación de dos variables. Cuando tenemos más de dos variables estaremos hablando de
una análisis multivariante, o regresión múltiple.
La relación una variable dependiente y y una variable independiente x describe una
relación matemática que puede ajustarse a distintos modelos establecidos, que entre otros,
pueden estar definidos por las siguientes ecuaciones:
Lineal: yest. = a + bx
Cuadrática: yest. = a + bx + cx2
Cúbica: yest. = a + bx + cx2 + dx3
Exponencial: yest. = a ( bx )
Logarítmica: yest. = a logbx
donde yest. reprensenta el valor estimado de la variable dependiente y.
1
Hines Willian W. y otros, Probabilidad y Estadística para Ingeniería. Trad. Gabriel Nagore. 4ta. edición, México: Compañía Edtorial
Continenta, 2005.
El ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de
una línea recta a un conjunto de pares de datos observados: (x1,y1), (x2,y2),...,(xn,yn). La
ecuación de la línea recta está dada por
yest. = a + bx
El criterio de mínimos cuadrados busca encontrar los valores de a y b, para poder
estimar el valor de y, dado un valor de x. En la siguiente gráfica, representamos los valores
del mismo ejemplo utilizado anteriormente, junto con la recta a la cual se aproximan estos
valores
400
300
(y-yest.)
200
CONSTRUC
100
140 160 180 200 220 240 260 280 300 320
TERRENO
También se muestra la distancia de un valor observado y y un valor estimado yest. La

longitud de esta distancia se representa por (y – yest.). La recta que mejor se ajusta a todo el
conjunto de datos es aquella que minimice estas distancias, pero al igual que cuando
estudiamos la varianza, el hecho de que algunos puntos estén por encima de la recta y
otros por abajo, hace que las diferencias puedan ser positivas y negativas, por lo que la
suma de todas ellas podría neutralizarse e indicarnos una diferencia mínima o cero, lo cual
no sería verdadero. La manera de obtener valores absolutos de estas desviaciones es
elevándolas al cuadrado, por lo que el objetivo es encontrar la recta en la que el menor
valor de:
n

i=1
(yi - yest. )2
sabiendo que yest=a+bx, sustituimos en el término anterior y llamamos Q a la suma del

cuadrado de los residuos (diferencias entre el valor observado y el estimado), para
obtener la siguiente expresión:
n
Q
i=
1
(y
i-a-b
x 
2
i.)
Para minimizar este valor obtenemos su derivada y la igualamos a cero, pero como
Q está en función de a y de b, calculamos la derivada parcial con respecto a cada una de
las variables:

n n

cQ 2
(y - a - bx )
i i.
2 (y - a - bx )(-1) = 0
i i.
ca i =1 i =1
n
 
cQ n
2
(y - a - bx )
i i. 2 (y - a - bx )(-x ) = 0
i i. i
cb i =1 i =1
sustituyendo y simplificando, obtenemos un sistema de dos ecuaciones con dos variables,

que al resolverlo por cualquier método apropiado, como la regla de Cramer o el método de
matrices de Gauss-Jordan o algebraicamente, obtenemos el valor de a y b:
n n
n+b x
a
i=
1
i 
i=
1
y i
n n n
a

i =1
x + b
i

i =1
x
 (x y)
i
2
i i
i =1
Volviendo al ejemplo de la muestra de valores de metros cuadrados de terreno y

construcción de un grupo de casas, calculamos los valores para sustituir en las ecuaciones
anteriores:
Máquina (n=7) 1 2 3 4 5 6 7 
Característica 1 (x) 150 250 180 160 220 280 300 1540
Característica 2 (y ) 180 280 220 200 320 350 380 1930

2
(x ) 22500 62500 32400 25600 48400 78400 90000 359800
(xy) 27000 70000 39600 32000 70400 98000 114000 451000
sustituyendo,
7a + 1540b = 1930
1540a + 359800b = 451000
resolviendo tenemos:
a = -0.857 b = 1.257
por lo tanto
yest. = -0.857 + 1.257x
esto quiere decir que la recta a la cual se ajustan los datos corta al eje de las ordenadas en
el valor –0.857 y tiene una pendiente positiva de 1.257.
Uno de los objetivos más importantes por los que se obtiene una ecuación de regresión es
para hacer predicciones. Volviendo a nuestro ejemplo, supongamos que deseamos
conocer el valor de la característica 2 una máquina que tiene valor de característica 1 de
175. Sustituyendo este valor en x, obtenemos:
yest. = -0.857 + 1.257(175) = 219.12
Es importante tener en cuenta que existen restricciones para la aplicación de este

método. En primer lugar, la ecuación de ajuste debe de usarse para hacer predicciones
solo de la población de la cual se extrajo la muestra. En segundo lugar, la ecuación se
debe usar dentro del dominio muestral de la variable de entrada ya que los datos
analizados presentaron tendencia lineal, pero no sabemos qué puede pasar fuera de este
intervalo, y por último, debemos de tomar en cuenta que es esencial que la muestra haya
sido tomada de manera adecuada y los datos estén vigentes.
El método de mínimos cuadrados utiliza el criterio llamado mínimax en el ajuste de
una línea óptima, ya que ésta se escoge, de tal manera que minimice la distancia máxima a
la que se encuentra un punto de la línea recta.
El mismo procedimiento se puede aplicar para el cálculo de ajustes no lineales como son
los mencionados anteriormente: cuadrático, exponencial, etc. Supongamos que el
diagrama de dispersión muestra una tendencia parabólica, entonces la curva de ajuste
estaría dada por la siguiente ecuación:
yest=a+bx+cx2
por lo tanto
n
Q
i=
1
(
yi-a

-b
x.-
i c2
x2
i)
y para encontrar el mínimo derivamos parcialmente con respecto a las tres variables
resultantes a, b y c, resolviendo y simplificando obtendremos un sistema de tres
ecuaciones con tres variables cuya solución nos dará los valores de los coeficientes para
obtener yest. en la ecuación de ajuste inicial.
n n n
an + b  x + cx
i 
i =1
y i
2
i
i =1 i =1
n n n

n
x + bx 
 2 3
a i i + c x
i (x y) i i
i =1 i =1 i =1 i =1
n n n n
a 
i =1
x + b x
i
2
i =1
i
3
+ c
 x
i  4
i =1
(x y )i
2
i
i =1
Análisis Multivariante
Las investigaciones que se hacen de fenómenos reales necesitan considerar gran

cantidad de aspectos, lo cual nos lleva a un número elevado de variables. Dichos
fenómenos no pueden ser analizados con las técnicas univariantes o bivariantes vistas
anteriormente. Por ello es necesario utilizar técnicas multivariantes, las cuales realizan un
análisis conjunto de muchas variables haciendo un estudio multidemensional de los datos.
Podemos definir al análisis multivariante como la parte de la estadística que se ocupa
del análisis conjunto de más de dos variables, constituyendo así una extensión del análisis
univariante y bivariante1.
Las primeras técnicas de análisis multivariante aparecieron a principios del siglo XX,
pero no tuvieron mucha utilización debido a lo complejo de sus cálculos. Su difusión
empezó hace unos 25 años junto con el auge y desarrollo de la computación, ya que el
surgimiento de herramientas de software estadístico facilitó su aplicación.
Existen varias clasificaciones de las técnicas multivariantes que involucran diversos
criterios; una de las más utilizadas es la que toma en cuenta los aspectos técnicos y las
divide en dos típos.
Técnicas predictivas. Realizan una explicación de un fenómeno, determinando las
relaciones de dependencia entre variables dependientes e independientes. A esta
clasificación pertenecen la regresión múltiple, el path análisis, el análisis de la varianza, el
análisis de la covarianza y el análisis discriminante.
Técnicas reductivas. Tratan de describir un fenómeno real reduciendo su complejidad,
haciendo un estudio de la independencia de todas las variables para reducir su número y
contar con las necesarias para describir el fenómeno observado. A estas técnicas
pertenecen el análisis factorial, el análisis de correspondencias, la correlación canónica y el
análisis de conglomerados.
La técnica del análisis de regresión analiza la naturaleza de las relaciones entre un
conjunto de variables con el objetivo de hacer predicciones, tratando de conocer la
influencia que una serie de variables independientes ejercen sobre una variable
dependiente. De todas las técnicas de regresión múltiple, la más sencilla y utilizada es la
regresión lineal múltiple.
Supongamos que el precio de venta de una casa depende de la cantidad de metros
cuadrados de terreno que tiene, y de los metros cuadrados de construcción. Un modelo de
1
Díaz de Rada Vidal, Técnicas de Análisis Multivariante para Investigación Social y Comercial. España: RA-MA Editorial, 2002.
regresión lineal que podría describir esta relación sería:
y = + x1 + 2x2 + 
donde y representa el precio de venta de la casa, x1 la superficie de terreno, x2 la

superficie de construcción y  es el error de la estimación. Este es un modelo de
regresión lineal múltiple con dos regresores y es la función lineal de los parámetros
desconocidos y 2; es un modelo que describe un plano bidimensional x1, x2.
representa la ordenada al origen del plano y  mide el cambio esperado en y por
cada cambio unitario en x1, cuando x2 es constante. De igual manera, 2 mide el cambio
en y por cambio unitario en x2, cuando x1 permanece constante. A estos dos parámetros
se les llama coeficiente de regresión parciales.
Para generalizar el modelo, vemos que y se puede relacionar con k variables
independientes, por lo que el modelo de regresión lineal múltiple para k variables
independientes queda de la siguiente manera:
y = + x1 + 2x2 + ... + kxk + 
Este modelo describe un hiperplano en el espacio k-dimensional de las variables

independientes {xi}.
El método de mínimos cuadrados puede utilizarse para estimar los coeficientes de
regresión . Si se tienen n > k observaciones y xij representa la i-ésima observación y el nivel
de la variable xj, y el error  en el modelo tiene E()=0, V()=2 y que las {i} son variables
aleatorias no correlacionadas, entonces tenemos
yi = + xi1 + 2xi2 + ... + kxik + i
n

+
i=
1

jx

ij +
i
i = 1,2,...,n
La función de mínimos cuadrados es:
2
k

n
Q 
i =1
yi -   -
j= 1
x j ij
La función Q se minimizará respecto de ,...,  k

n

cQ ^
-2 yi - ^  -  j xij xij 0
cj ^ ^ ^
  k
i =1 j= 1
donde j=1,2,...,k.
Al resolver y simplificar obtenemos las ecuaciones normales de mínimos cuadrados, las
cuales anotaremos en forma matricial para visualizarlas más fácil:
n n n n
n  x i1  x i2 ... 
i =1
x ik
^


i =1
y i
i =1 i =1
n n n n
 
n
  
^
x i1 x2i 1 c x xi 1 i2 ... x x i 1 ik  x y i1 i
i =1 i =1 i =1 i =1 i =1
...
...
...
...
...
...
n n n n n

i =1
x ik 
i =1
x ik xi 1
 x ik xi 2 ...

i =1
x2ik ^k

i =1
x ik yi
i =1
Supongamos que tenemos los siguientes datos de un conjunto de casas:

Máquina Precio venta Característica 1 Característica 2
1 $1’037,000.00 150 180
2 $1’600,000.00 250 280
3 $1’280,000.00 180 220
4 $1’325,000.00 160 200
5 $1’850,000.00 220 320
6 $1’993,000.00 280 350
7 $2’250,000.00 300 380
La ecuaciones planteadas serían las siguientes:

7

7

7
^
7 x i1 x i2  y i
i =1 i =1 i =1

7
 
7

7 7
^
x i1 x2i 1 x x i 1 i2  x yi1 i
i =1 i =1 i =1 i =1
 
7 7
 
7 7
x i2 x x i 1 i2 x2i 2 ^ k
x yi2 i
i =1 i =1 i =1 i =1
Sustituyendo valores y resolviendo el sistema de ecuaciones, tenemos:

 = 112845.5
= -710.725
2 = 6030.88
 Por consiguiente, la ecuación de regresión para el valor de y estimada es:

yest. = 112845.5 – 710.725 x1 + 6039.88 x2
Ahora supongamos que queremos conocer el precio de una máquina que tiene un valor de
200 de la característica 1 y con 250 de la característica 2. Si sustituimos estos dos valores
en x1 y en x2 de la ecuación anterior tendremos un valor estimado del precio de venta:
yest. = 112845.5 – 710.725(200) + 6039.88 (250)
yest. = 112845.5 – 142145 + 1509970 = 1480670.5
Es posible utilizar algunas técnicas para medir la eficiencia del modelo. El coeficiente
de determinación múltiple r2 se expresa como:
2
S
CR S
CE
r 1-
S
y
y S
y
y
donde SCR es la suma de los cuadrados de la regresión, SCE es la suma de los cuadrados del
error y Syy está definido por:
n 2
n  y
i
Syy 
i =1
y i
2
- i =1
n
r2 es la medida del grado de reducción de la variabilidad de y obtenida mediante el

empleo de las variables independientes x1, x2, ..., xk. Igual que en la regresión lineal simple,
debemos tener 0r21. La raíz cuadrada de r2 es el coeficiente de correlación múltiple entre
y y las variables independientes, esto es, la medida de asociación lineal entre y y x1, x2, ..., xk.
Cuando k=1 estamos hablando de una correlación lineal simple entre y y x.
Es posible que r2 no de un valor bueno dado que al añadir una variable al modelo
siempre aumentará su valor, independientemente que la variable sea estadísticamente
significativa o no. Es por eso que algunos analistas prefieren el coeficiente ajustado de
regresión múltiple (donde p = número de términos de la ecuación):
2
S
CE/(
n-p
)
ra
ju 1-
S
yy/(
n-1
)
El valor de r2aju aumentará solo si la adición de un nuevo término reduce

significativamente la media cuadrática del error, es decir, penalizará la adición de términos
que no tengan significado en el modelado de la respuesta. Su interpretación es igual a la de
r2.
En casi todos los problemas de regresión múltiple, las variables independientes

están intercorrelacionadas. En situaciones en las que la intercorrelación es grande,
decimos que hay multicolinealidad. Los valores característicos de la matriz de correlación
brindan una medida de la multicolinealidad. Uno o más valores característicos iguales a
cero implica que hay multicolinealidad.
CAPITULO 3
APLICACI ON DEL METODO
Se tomará como ejemplo el la estimación del valor de un vehículo ya que en este tipo
de bienes se puede encontrar suficiente información de mercado.
Como se vio en las secciones anteriores, para determinar el tamaño de la muestra,
para obtener el valor de mercado de bien, se necesita determinar el nivel de confianza, el
error máximo y la desviación estándar de la población.
El punto más importante que debemos analizar es el referente a la desviación
estándar de la población, puesto que la desconocemos. Ya mencionamos que podemos
utilizar la desviación muestral, pero tampoco tenemos una muestra previa para poderla
utilizar, ya que podríamos ocupar algún estudio anterior o un muestro piloto para
determinar la desviación deseada. En este caso la única alternativa con la que contamos es
con un muestreo piloto que nos diga el comportamiento del precio de los inmuebles
estudiados. Para esto hay que tomar en cuenta que, si queremos que la distribución
muestral sea normal, necesitamos una muestra de al menos 30 datos. Por otro lado, al
ocupar s (de la muestra) en lugar de  (de la población) en nuestros cálculos, tendríamos
que sustituir la variable z de la distribución normal, por la variable t de la distribución t student1,
la cual toma en cuenta un error estándar estimado.
Una de las características de la distribución t stundet, es que tiende a la distribución
normal estándar a medida que aumenta el número de grados de libertad; si analizamos sus
valores, nos daremos cuenta que con más de 100 grados de libertad, la distribución t student
se comporta como la normal. Esto quiere decir que si nuestras muestras no bajan de 100
datos seguiremos teniendo el comportamiento de la distribución normal estándar.
Se tomará para este muestreo piloto los datos recabados en sitios web nacionales,
recordando que esto solo es para estimar la desviación estándar que se utilizará en el
calculo del tamaño de la muestra final que servirá como base de datos el estudio. Se
analizaron 30 muestras de vehículos tipo Pick Up, marca Chevrolet tomando como variable
dependiente el precio de venta y como variables independientes el kilometraje recorrido y el
año de fabricación, convirtiendo este a edad en años.
Para determinar el tamaño definitivo de la muestra, se tomará un nivel de confianza
del 95%, la desviación obtenida de la variable precio de $ 65,954.44 y un error máximo
permitido de 25,248.33 esto quiere decir, que en el promedio de las camionetas (la media),
su error permitido no va a ser más del 10% de su precio, lo cual podría ser un número
aceptable. Aplicando la fórmula, se tiene:
2
z
n
E
lo que da como resultado una muestra a analizar de 26.24 comparables. Se tomarán para
la regresión los 30 que se tenían porque cumplen con la muestra mínima y se realizará un
análisis multuvariante con la variable precio con variable dependiente y las variables edad (
a partir de año) y kilómetros como variables independientes:
PRECIO AÑO KILOMETROS

$ 119,900.00 2009 52954
$ 205,000.00 2008 60000
$ 249,000.00 2011 48000
$ 180,000.00 2007 87000
$ 139,900.00 1991 48900
$ 269,000.00 2009 57000
$ 276,000.00 2009 78000
$ 360,000.00 2003 68000
$ 195,000.00 2010 63000
$ 119,000.00 2006 88000
$ 280,000.00 2009 58000
$ 295,000.00 2011 65000
$ 290,000.00 2009 56000
$ 252,400.00 2010 27101
$ 269,000.00 2010 28000
$ 309,000.00 2012 15000
$ 287,500.00 2009 59000
$ 168,000.00 2008 65000
$ 220,000.00 2009 128000
$ 289,000.00 2011 19000
$ 295,000.00 2010 45000
$ 242,000.00 2008 68000
$ 300,000.00 2009 52000
$ 239,000.00 2010 67884
$ 200,000.00 2009 100040
$ 330,000.00 2011 44000
$ 375,000.00 2012 30000
$ 205,800.00 2009 85000
$ 320,000.00 2010 90000
$ 295,000.00 2011 55000
El resultado del análisis es el siguiente:
a
Coeficientes
Modelo Coeficientes no estandarizados Coeficientes t Sig.

tipificados
B Error típ. Beta
(Constante) 311871.167 30672.735 10.168 .000

1
kilómetros -.985 .473 -.367 -2.086 .046
a. Variable dependiente: precio
Los resultado indican que la variable edad no tuvo influencia sobre el precio por lo que
se retiró del modelo y la variable kilometraje muestra una relación inversa con precio, por lo
que el modelo queda de la siguiente manera:
Precio = 311,871.167 - (.985) ( kilometraje)
Si se quisiera calcular el precio de una camioneta con 105,000 km, se tendría lo

siguiente:
Precio = 311,871.167 - (.985) ( 105,000) = 208,446.17

CONCLUSIONES
Observando los resultados del modelo de regresión lineal múltiple,

planteado para calcular el valor de mercado de una un vehículo , se ve que
estadísticamente se llegó a un buen modelo, ya que se utilizan las
herramientas adecuadas para que la información que se maneja tenga
rangos de confianza adecuados.
Los modelos estadísticos presentan la ventaja de ser confiables y no

tener el inconveniente de estar sujetos al criterio del analista, ya que al
procesar los datos de manera adecuada, el mismo modelo informa si los
resultados sin confiables.
La desventaja de estos métodos radica en que se necesita una gran

cantidad de información para que pueda ser analizada y en la mayoría de
los casos dentro del campo de la v aluación no se cuenta con ella, pero hay
ciertos bienes que si dan la oportunidad de aplicarlos como es el caso de
los vehículos, la maquinaria de la construcción, algunas máquinas de
confección entre otras.
BIBLIOGRAFIA
Camacho, Juan. Estadística con SPSS para W indows . México: Alfa y

Omega, 2003Aaker, David y George Day. Investigación de Mercados .
Trad. Jaime Gómez Mont. 3ra. Edición, México: 1989
Aaker, David y George Day. Investigación de mercados . Trad. Jaime Gomez

Mont. 3ra. Edición, México: McGraw Hills, 1989.
Capra, Steven y Raymons P. Canale. Métodos Numéricos para Ingenieros .

México: McGrawHill, 1988.
Díaz de Rada, Vidal. Técnicas de análisis multivariante para inv estigación

social y comercial. España: Ra -Ma Editorial, 2002.
Herfert Erich, Valuación: Conceptos y Aplicaciones Prácticas . Trad. Alfredo

Pérez Grovas. 1ra. Edición. México: Ed iciones Contables y
Administrativas, 1973.
Hines Willian W. y otros. Probabilidad y Estadística para Ingeniería. Trad. Gabriel Nagore.
4ta. edición, México: Compañía Edtorial Continenta, 2005.
Johson, Robert y Patricia Kuby. Etadística Elemental. Lo Esencial. Trad. Hugo Villagomez.
México: Thomson Learning, 2004.
Mercado, Salvador. Investigación de mercados . México: Editorial Pa c, 2000.
Scheaffer Richard y otros.Elementos de Muestreo. Gilberto Rendón Sánchez y José

Roberto Gómez Aguilar. México: Grupo Editorial Iberoamérica, 1987.
Trápaga Maza Tirso Miguel, Taller de Valuación de Maquinaria y Equipo . Apuntes

del curso impartido en la Universidad Autónoma de Zacatecas, 2011.
Visauta, Bienvenido y Joan C. Martori. Análisis estadístico con SPSS para

W indows, Volumen II: Estadística multivariante . España: McGraw-
Hill, 2003.
Visauta, Bienvenido. Análisis estadístico con SPSS para W indows, Volumen

I: Estadística básica . España: McGraw-Hill, 2002.
Walpole, Ronald E. Y Raymond H. Myers. Probabilidad y estadística para ingenieros. Trad.
Luis Fernando Romero Sánchez. México: Interamericana, 1983.
Zanotto, Hector. Aplicaciones de Valuació n en SPSS . Apuntes del curso

impartido en la Benemérita Universidad Autónoma de Puebla, 2005.

Aplicación de Metodos Estadisticos en La Valuacion de Maquinaria y Equipo

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Aplicación de Metodos Estadisticos en La Valuacion de Maquinaria y Equipo

Cargado por

Copyright:

Formatos disponibles

PONENCIA

XLIX CONGRESO NACIONAL DEL VALUACION VERACRUZ 2013

MTRO. EN VAL. ING. JAVIER FURLONG SALGADO

COLEGIO DE VALUADORES DEL ESTADO DE PUEBLA, A.C.

APLICACIÓN DE METODOS ESTADISTICOS EN LA VALUACION DE

Una vez obtenido este número de muestras que sustenta el análisis, se

El planteamiento del tema a desarrollar es una respuesta a una situación problemática

El determinar un valor de mercado de un bien depende en gran medida de la forma de

La propuesta que se hace en este trabajo es la de calcular un valor de mercado

VALOR DE CAMBIO: Es el que representa el valor comercial de un bien.

VALOR COMERCIAL: La máxima suma de dinero a cambio de la cual podría

VALOR DE REPRODUCCIÓN NUEVO: Es el valor a precios actuales de la reproducción

VALOR DE REPOSICIÓN NUEVO: Es el valor a precios actuales de un bien nuevo similar

VALOR JUSTO DE MERCADO EN USO CONTINUO: Es la suma de dinero estimada a

VALOR JUSTO DE MERCADO INSTALADO: La suma de dinero estimada a cambio de la

VALOR JUSTO DE MERCADO DESMONTADO: La suma de dinero estimado a cambio de

VALOR DE LIQUIDACIÓN ORDENADA: La suma bruta estimada en dinero que se espera

VALOR DE LIQUIDACIÓN FORZOSA: La suma bruta estimada en dinero que podría

El precio se puede asociar a una operación de compraventa, ya que representa la

Concepto de bien o bienes

En la actualidad se entiende que “la valuación”: es la estimación del valor de un bien

ENFOQUES DE VALUACION INMOBILIARIA

Se establecen tres enfoques o métodos para la elaboración de los avalúos de bienes

En virtud de que el presente trabajo se centra exclusivamente en el estudio del valor

Como ya vió, el valor se puede expresar como una medida en la escala de

En cualquiera de los ejemplos anteriores, alguien quiere conocer una característica

Antes de abordar los temas de estadística, se necesita definir algunas términos

VARIABLE. Característica de interés sobre cada ele mento individual

de una población o muestra 1 . Puede ser el estado de conservación de una casa

Uno de los aspectos más importantes de la estadística es la obtención de los datos

Muestreo irrestricto aleatorio

Muestreo aleatorio estratificado

Una muestra aleatoria estratificada es la obtenida mediante la separación de los

Muestreo por conglomerados

Presentación gráfica de los datos

Tipo de casas del fraccionamiento "x"

Si expresamos de manera gráfica una distribución de frecuencias, obtendremos un

Medidas de tendencia central

donde x es el total de la población finita:

La estadística inferencial utiliza métodos para hacer inferencias sobre la media de la

La mediana es el valor que ocupa la posición central de un conjunto de datos

La moda es el valor numérico que más se repite dentro de un conjunto de datos.

No siempre las medidas de tendencia central proporcionan suficiente información

Como lo vimos anteriormente, el rango es la diferencia entre el mayor y el menor

La medida de dispersión más importante es la varianza. La podemos definir como el

Una desviación con respecto a la media es la diferencia entre un valor de x y la

promedio de las desviaciones

muestra 2 97 135 212 147 172 167

si aplicamos la fórmula anterior, en ambos casos el promedio de las desviaciones es cero.

desviaciones muestra 2 -58 -20 57 -8 17 12

Cuando tenemos una población finita con N valores el cálculo de la varianza se

La determinación del tamaño de la muestra no es algo sencillo, ya que en la mayoría

La media de la muestra, x , es usada para estimar la media de la población

x E error de la muestra = estimación del intervalo de 

x E 2 x = x E 2 /n1/2 = estimación de intervalo del 95.33% de 

El tamaño del intervalo se basa en 2 x porque la probabilidad de que x esté entre 2

x E 5/3( x )= x E 5/3 /n1/2 = estimación de intervalo del 90% de 

x 2s/n1/2 = estimación de intervalo del 95.44% con  desconocida

En resumen, la estimación del intervalo de la media de la población , , puede

x E error nuestral, o x =E z(/2)/n1/2

Por lo tanto, el tamaño de la estimación del intervalo dependerá de tres factores:

El intervalo de confianza tiene dos características básicas que determinan su

se sabe que el error es