Procesamiento e Interpretación de Datos

Procesamiento e interpretación de datos
Apuntes del curso de la Maestría en Arquitectura del Programa de Posgrado en Arquitectura a

cargo del Mtro. Arturo Valeriano Flores.
Alejandro Díaz-Infante Rendón
Para comprender mejor la naturaleza del pensamiento científico es necesario recordar que
éste surge en el momento que nos planteamos preguntas respecto a las causas de los
999fenómenos que nos rodean y cuya respuesta se busca mediante la aplicación racional y
sistemática de técnicas e instrumentos, válidos y confiables, encaminados a hallar una
explicación la cual, posteriormente, es posible demostrar. La investigación científica, por
tanto, se basa en este proceso para buscar la producción y comprobación de un
conocimiento nuevo.
Normalmente, la primera fase de investigación de un fenómeno nunca antes estudiado
consiste en la búsqueda de variables que parecieran estar relacionadas. Es decir, la
identificación de las características y condiciones que describen al fenómeno y que son
susceptibles de ser cuantificables y medibles. Las variables adquieren valor cuando se
relacionan con otras variables y permiten la construcción de una hipótesis. A este punto, es
importante distinguir a las variables respecto a los atributos, los cuales no son susceptibles
de cuantificarse mediante una escala numérica y son la base de una investigación con un
enfoque cualitativo, y no cuantitativo.
Al observar las diferentes variables o atributos se obtiene un conjunto de resultados,
numérico o no, denominado conjunto de datos. Los obtenidos al observar un atributo se
denominan modalidades, mientras que los correspondientes a una variable se denominan
valores.
Así pues, podemos establecer que el propósito de la investigación científica es la de validar
o comprobar una hipótesis, para lo cual se vale de la experimentación, la cual consiste en
someter un objeto en estudio a la influencia de ciertas variables, en condiciones controladas
y conocidas por el investigador, para observar los resultados que la variable produce en el
objeto. Para D.C. Baird, la experimentación se refiere al proceso completo de identificar una
porción del mundo que nos rodea, obtener información de ella e interpretarla.
Una vez analizado el fenómeno y habiendo una consciencia respecto a las variables
significativas es posible, según indica Baird, pasar a un siguiente nivel de complejidad que
consiste en la construcción de un modelo que permita establecer un marco de referencia
para el pensamiento y la descripción esquemática del mundo real.
Sin embargo, un modelo será útil en la medida que sus propiedades correspondan con las
del mundo real. Solo si se demuestra experimentalmente que las propiedades del modelo
Alejandro Díaz-Infante R. Procesamiento, análisis e interpretación de datos.
guardan una correspondencia adecuada con las de la realidad es que se podrá decir que se
tiene razón respecto al fenómeno estudiado.
Para este fin, el análisis estadístico representa una herramienta fundamental para el
procesamiento de datos, la descripción de la relación de variables y la construcción de un
modelo. La estadística representa el conjunto de técnicas e instrumentos que permiten
recoger, organizar, resumir, analizar e interpretar datos para con ello buscar las relaciones,
conclusiones, consecuencias y resultados para comprender y explicar el fenómeno
estudiado.
La estadística descriptiva o deductiva estudia los métodos para organizar, interpretar y
describir un conjunto de datos para que sus características se vuelvan evidentes, para lo
cual se apoya de técnicas gráficas y numéricas.
La estadística inferencial o inductiva usa la teoría de las probabilidades para generalizar las
características de una población a partir de las características de una muestra
representativa.
Datos estadísticos
Los datos son los valores que toman las variables de un estudio estadístico, y de las cuales
es posible distinguir dos tipos:
Datos cuantitativos que producen respuestas numéricas pues son sujetas de medición y
cuantificación, y pueden ser de dos tipos:
• variables continuas, si admiten tomar cualquier valor dentro de un rango numérico

determinado (edad, peso, talla) y generalmente resultan de un proceso de medición,
o
• variables discretas, si no admiten todos los valores intermedios en un rango. Suelen
tomar solamente valores enteros (número de hijos, número de partos, número de
hermanos, etc.) y generalmente resultan de un proceso de conteo.
Datos cualitativos, los cuales arrojan respuestas categóricas que representan una cualidad
o atributo de los datos de estudio.
En el proceso de medición de estas variables, se pueden utilizar dos escalas:
• Escalas nominales: ésta es una forma de observar o medir en la que los datos se
ajustan por categorías que no mantienen una relación de orden entre sí (color de
los ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad,
etcétera).
• Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre
las categorías (grado de miopía, altura)
Cuando se realiza un estudio de investigación el objetivo final es inferir estadísticamente

un resultado sobre la población por medio del estudio de una muestra seleccionada, en
donde una población representa la colección completa de elementos o resultados de la
información buscada y una muestra constituye un subconjunto de una población, y que
generalmente se selecciona aleatoriamente.
Es posible establecer que las razones para estudiar muestras en lugar de poblaciones son:
a. Ahorrar tiempo, pues se estudia un menor número de datos.
b. Ahorro en costos, como consecuencia de lo anterior
c. Estudiar la totalidad de la población suele ser inaccesible o imposible de realizar.
d. Aumentar la calidad del estudio debido a que las observaciones y mediciones
realizadas a una muestra de datos puede ser más exacto y plural que si se realiza a
una población.
e. La selección de muestras específicas permite reducir la heterogeneidad de una
población al indicar criterios de inclusión o exclusión.
Una vez que se han seleccionado los valores que toman las variables del muestreo (datos)
es posible proceder al análisis descriptivo de los mismos. El resumen estadístico es el
procedimiento con el cual se pueden obtener las características más evidentes de una
muestra, las cuales están representadas por la información dada por la media, la mediana,
la moda, el rango, la varianza y la desviación estándar.
La determinación de estas unidades permite obtener una visión condensada y completa del
fenómeno que se está analizando, pues hacen referencia a la posición que los valores
guardan respecto a un valor central y la dispersión o disparidad de los datos que se están
valorando.
a. La media aritmética, promedio o, simplemente, la media, es la medida de posición
de tendencia central más utilizada y es calculada por el cociente entre la suma de
los valores de la variable y el número total de datos, y es representada como 𝑥̅ . Así
pues, para un grupo de N observaciones x, la media se define como:
∑𝑥𝑖
𝑥̅ = …. (1)
𝑁
b. La mediana, que se identifica como Me, es el valor de la variable que sitúa el mismo
número de datos por encima que por debajo de él, siempre y cuando los valores de
la variable estén ordenados de forma creciente o decreciente.
Si N es impar, la mediana muestral es el valor de las variables que ocupa el lugar
𝑁+1
central de la serie, es decir el número en la posición
2
Si N es par, la mediana muestral representa el promedio de los números en las

𝑁 𝑁+1
posiciones centrales y
2 2
c. La moda se refiere al valor que tiene más frecuencia en una muestra, es decir, la
unidad que más veces se repite. Se representa por Mo y, por lo general, no suele
utilizarse como única medida de posición, sino que se presenta acompañando a la
media o a la mediana.
d. El rango es la diferencia entre los valores más grandes y más pequeños en una
muestra.
e. La varianza s2 es un indicador de la dispersión de los datos con respecto al valor
medio de la variable y se define como el promedio de los cuadrados de las
desviaciones de los valores de la variable respecto a su media aritmética,
ponderados por sus respectivas frecuencias.
1 𝑁
𝑠2 = ∑𝑖=1(𝑥𝑖 − 𝑥̅ )2 … (2)
𝑁−1
f. La desviación estándar es una unidad que refiere el grado de dispersión en una

muestra y constituye la raíz cuadrada de la varianza muestral.
A modo de ejemplo, tomemos de base los valores de una muestra correspondiente a las
iluminancias (nivel de iluminación reportado en luxes) registradas un día de primavera en
el interior de una oficina cuya ventana está orientada al oeste y para la cual se desea
desarrollar un resumen estadístico. La totalidad de los valores que conforman dicha
muestra se presentan en el anexo 1.
Se puede observar que la información así presentada resulta complicada de analizar, por lo
que será necesario desarrollar, como primer paso, un proceso de tabulación. Para ello será
necesario ordenar los datos de menor a mayor. Una vez ordenados los datos, es necesario
contar cuántas veces se repite cada uno de los valores de la variable para obtener los valores
de las frecuencias absolutas.
La tabla siguiente presenta la frecuencia absoluta y relativa de la muestra, en donde la
frecuencia absoluta se refiere al número total de valores observados de la variable, que
representamos por ni y la frecuencia relativa que se obtiene por el cociente entre la
frecuencia absoluta y el número total de datos N, en este ejemplo N=120.
Tabla 1. Frecuencia absoluta y relativa de la muestra del anexo 1.

xi ni fi xi ni fi
0.770 2 0.017 0.855 1 0.008
0.773 1 0.008 0.858 3 0.025
0.777 2 0.017 0.862 4 0.033
0.780 1 0.008 0.865 4 0.033
0.784 1 0.008 0.869 1 0.008
0.787 1 0.008 0.872 6 0.050
0.794 2 0.017 0.876 3 0.025
0.798 2 0.017 0.883 5 0.042
0.801 3 0.025 0.886 3 0.025
0.805 1 0.008 0.887 3 0.025
0.812 1 0.008 0.89 2 0.017
0.819 2 0.017 0.894 3 0.025
0.823 3 0.025 0.897 9 0.075
0.826 2 0.017 0.901 9 0.075
0.833 4 0.033 0.904 10 0.083
0.837 2 0.017 0.908 10 0.083
0.84 2 0.017 0.911 1 0.008
0.848 3 0.025 0.915 5 0.042
0.851 2 0.017 0.919 1 0.008
Total 1 37 0.308 Total 2 83 0.692
En la tabla siguiente presenta el resumen estadístico de la muestra de iluminancias. Otra

medida que se suele utilizar es el coeficiente de variación (CV), que es una medida de
dispersión relativa y se calcula dividiendo la desviación estándar por la media y
multiplicando el coeficiente por 100. En los cálculos del ejercicio previo CV=4.73%.
Tabla 2. Resumen estadístico de la muestra
Media = 0.8674
Mediana = 0.8830
Moda 1 = 0.9040
Moda 2 = 0.9080
Rango = 0.1490
s2 = 0.0017
s= 0.0411
Análisis de la relación de dos variables cuantitativas

Los resúmenes gráficos y estadísticos permiten analizar el comportamiento de una sola
variable. En el enfoque bivariante, se dispone de los procedimientos para determinar la
naturaleza de la relación entre dos cantidades.
Una relación entre dos variables (x, y) es de causalidad sólo cuando una de ellas es
dependiente de la otra, es decir, una es la causa y la otra es el efecto. De modo que al
graficar los pares ordenados que se generan en un experimento científico se podrá
encontrar el grado de relación y el nivel de influencia de la variable independiente en la
dependiente y con ello hacer inferencias respecto de la relación de ambas variables para
pronosticar su comportamiento. Por ejemplo, el nivel de iluminancia en un ambiente
interior es en gran parte causada por el nivel de irradiancia en el exterior.
Cabe señalara que existen otros tipos de relaciones, por ejemplo, aquella que supone que
las dos variables son a la vez causa y efecto, lo que supone una relación de
interdependencia, o bien una relación indirecta en donde la asociación que se observa
entre las variables se debe a que ambas dependen una tercera.
Una forma de sintetizar y de analizar simultáneamente dos variables es mediante las tablas
de correlación, cuando se trata de variables cuantitativas. Se trata de un cuadro de doble
entrada que se utiliza para presentar los datos correspondientes a las distribuciones
bidimensionales de variables.
En la tabla de correlación se sitúan ordenadamente los valores o intervalos de la variable Y,
en tanto que en la columna de la izquierda se ordenan los valores o intervalos de la variable
X. En cada casilla resultante de la intersección de la fila xi con la columna yj se sitúa la
frecuencia bidimensional (nij), que indica el número de veces que conjuntamente se
presenta el para (xi, yj)
Tabla No. 3 Tabla de correlación
y Y1 Y2 … yj … yk ni
x
X1 n11 n12 n1j n1k n1.
X2 N21 n22 n2j n2k n2.
…
Xi ni1 ni2 nij nik ni.
…
Xh nh1 nh2 nhj nhk nh.
n.j n.1 n.2 n.j n.k N
En la fila inferior se ponen las sumas de las frecuencias que corresponden a cada columna,
es decir, las frecuencias marginales de Y, siendo nij el número total de veces que se repite
el valor yj de la variable Y, con independencia de los valores que adopte X. Asimismo, en la

columna de la derecha se ponen las sumas de las frecuencias correspondientes a cada fila,
esto es, las frecuencias marginales de X, siendo nij el número total de veces que se repite el
valor xi de la variable X, con independencia de los valores que adopte Y.
Las sumas de la fila inferior y de la columna de la derecha son idénticas e iguales a la
frecuencia total bidimensional, o lo que es lo mismo, al número total N de elementos
observados.
A partir de una distribución bidimensional de frecuencias (xi, yj, nij) se puede analizar cada
una de las variables y deducirse la distribución marginal de la variable.
Resulta también interesante examinar el gráfico de los pares de valores observados de las
variables, el cual se construye sobre un par de ejes cartesianos. Generalmente se mide la
variable x sobre el eje horizontal y la variable y sobre el eje vertical. En el plano se dibuja
un punto por cada par de valores (x, y) y la representación gráfica del conjunto de puntos
resultante (nube de puntos) se denomina diagrama de dispersión.
Cuando la nube de puntos se concentra alrededor de una línea recta, se dice que la
asociación entre x e y es lineal.
Si los puntos tienden a inclinarse hacia arriba y la derecha, se dice que hay una asociación
positiva o directa. En cambio, si la asociación es indirecta, la nube de puntos se observará
decreciente.
Figura No. 1 Gráfica de correlación directa (Irradiancia e Iluminancia)

Figura No. 2 Gráfica de correlación indirecta (Temperatura y Humedad)
El diagrama de dispersión ofrece información útil para detectar la relación entre dos
variables, sin embargo, está basada en la impresión visual, lo cual puede ser engañosa, por
lo que es necesario acudir a otros instrumentos que ofrezcan una cuantificación numérica
de la intensidad y características de dicha asociación.
La covarianza se basa en las diferencias entre los valores de x e y a sus correspondientes
medias, y sirve de base para determinar el coeficiente de correlación (de Pearson), que es
una medida numérica que refiere el grado de asociación lineal entre dos variables.
Para obtener el valor de la covarianza se calcula para cada par (xi, yj) el producto de las
desviaciones respecto a sus medias (𝑥𝑖 − 𝑥̅ ) (𝑦𝑗 − 𝑦̅) de todos los valores de i y de j.
… (3)
La covarianza es el “promedio” de los productos de las desviaciones de las variables
respecto de las correspondientes medias.
En consecuencia, el coeficiente de correlación muestral entre x e y se define como:
… (4)
Sean (xi, yj) …. (xn, yn) los n puntos del diagrama de dispersión de una muestra, el cálculo de
la correlación implica la deducción de las medias y las desviaciones estándar de las x e y.
Después se convierte cada x y cada y a las unidades estándar
Para finalmente obtener el promedio de los productos de los puntajes, excepto que se
divide entre (n-1) en lugar de n.
Ejemplo.
x y (𝒙𝒊 − 𝒙
̅) ̅)
(𝒚𝒋 − 𝒚 (𝒙𝒊 − 𝒙
̅)(𝒚𝒋 − 𝒚
̅)
3 10 -3.86 2.14 -8.27
6 7 -0.86 -0.86 0.73
5 9 -1.86 1.14 -2.12
8 6 1.14 -1.86 -2.12
9 8 2.14 0.14 0.31
10 7 3.14 -0.86 -2.69
7 8 0.14 0.14 0.02
Media 6.86 7.86 Suma = -14.14
DS 2.41 1.35
… (5)
Propiedades del coeficiente de correlación (de Pearson)
• El coeficiente de correlación se encuentra entre -1 y 1 (-1 ≤ r ≤ 1).

• Los valores positios de r indican que la recta tiene pendiente positiva (directamente
proporcional). Por el contrario, valores negativos de r indican una pendiente
negativa (inversamente proporcional).
• Mientras mayor el valor absoluto de r mayor la fuerza de la asociación.
• El valor de r no depende de las unidades de medición.
• El coeficiente de correlación igual a 1 o -1 significa una relación lineal perfecta.
• Siempre que r ≠ 0 se dice que x e y están correlacionados. Si r = 0 implica que no hay
relación lineal entre las variables.
En los ejemplos de las gráficas de dispersión presentados en las figuras [..] y […] el
coeficiente de correlación muestral r es de 0.967696731 y -0.992280342 respectivamente.
El cálculo y detalle de los valores de x e y se pueden revisar en los anexos 2 y 3.
Análisis de regresión
La regresión es otro instrumento estadístico de análisis de la relación entre variables y cuyo
objetivo es tratar de explicar la relación que existe entre una variable dependiente y, y un
conjunto de variables independientes (x1 … xn). Cuando se trata de explicar la relación que
existe entre una variable y y una única variable independiente x se conoce como modelo de
regresión lineal simple.
Este modelo presenta las siguientes consideraciones:
1. El análisis de regresión lineal simple se utiliza para analizar la relación entre dos variables
bajo la hipótesis de que es causal.
2. La relación entre las variables se supone unilateral, es decir, x es causa de y pero y y no
es causa de x. No existe interdependencia.
3. La relación entre las variables es inexacta o de tipo estadístico.
Para hacer una estimación del modelo de regresión lineal simple, se trata de buscar una
recta, denominada de los mínimos cuadrados, de la forma:
… (6)
de modo que se ajuste a la nube de puntos. De acuerdo con esta igualdad, son los cambios
en x los que explican los cambios en y.
El modelo de regresión lineal simple tiene la siguiente expresión:
En donde β0 es la ordenada en el origen (el valor que toma y cuando x vale 0), denominado
intercepto, y β1 es la pendiente de la recta (e indica cómo cambia y al incrementar x en
una unidad) y εi se denomina error.
En la figura […] se puede observar que la dispersión de puntos resultante de la relación de

las variables x (peso) e y (longitud) no presenta una relación lineal perfecta. Para cada punto
de datos (xi, yi ) se determina una distancia vertical al punto (xi, ŷi ) denominado residuo y
que representa la diferencia entre el valor observado yi en los datos y el valor ajustado ŷi
pronosticado por la recta de mínimos cuadrados.
ei = y i - ŷi
Figura No. 3 Determinación de residuos y principio de mínimos cuadrados
El principio de mínimos cuadrados permite establecer la recta que “mejor” se ajuste con
base en las desviaciones de los puntos en dirección vertical a partir de las líneas. La recta de
mínimos cuadrados se define como aquella para la que la suma de cuadrados de los residuos
𝑛
∑𝑖=1 𝑒𝑖2 se minimiza.
Es decir, la suma de los cuadrados de las diferencias entre los valores observados yi y los
valores ajustados ŷi estimados.
Para el cálculo es necesario referirse a las siguientes expresiones:
Continuando con el ejemplo anterior, teníamos que:
x y (𝒙𝒊 − 𝒙
̅) (𝒚𝒋 − 𝒚̅) (𝒙𝒊 − 𝒙
̅)(𝒚𝒋 − 𝒚
̅) (𝒙𝒊 − 𝒙
̅)²
3 10 -3.86 2.14 -8.27 14.88
6 7 -0.86 -0.86 0.73 0.73
5 9 -1.86 1.14 -2.12 3.45
8 6 1.14 -1.86 -2.12 1.31
9 8 2.14 0.14 0.31 4.59
10 7 3.14 -0.86 -2.69 9.88
7 8 0.14 0.14 0.02 0.02
Media 6.86 7.86 Suma = -14.14 34.86
y en donde:
𝑥̅ = 6.86 𝑦̅ = 7.86 ∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅ ) = −14.14 ∑(𝑥𝑖 − 𝑥̅ )2 = 34.86

por tanto,
𝛽̂ 1 = -14.14 / 34.86 = -0.406
𝛽̂ 0 = 7.86 – (-0.406 x 6.86) = 10.639
en consecuencia, si y=𝛽̂ 0 + 𝛽̂ 1x, entonces la ecuación del modelo es:

̂ = -0.406 x + 10.639
𝒚
y cuya gráfica de correlación se muestra a continuación.
Recordemos que el coeficiente 𝛽̂ 1 es la pendiente de la recta de regresión estimada; en el

ejemplo este valor es negativo, lo que indica una relación inversa (puesto que la covarianza
de las variables es negativa). Si 𝛽̂ 1 tiene signo positivo, la relación es directa.
Tomemos ahora de ejemplo los valores de las variables de irradiancia (kW/m²) e iluminancia
(kLux) de la figura […] y determinemos la ecuación del modelo de la recta de regresión que
exprese el comportamiento de las variables. El detalle de las variables y el cálculo se pueden
consultar en el archivo Excel adjunto.
En este caso,
𝛽̂ 1 = 7,421.80 / 7´532,531.30 = 0.001
𝛽̂ 0 = 0.73 – (0.001 x 404.52) = 0.3319

en consecuencia, la recta de regresión estimada que resulta es:
𝑦̂ = 0.001 x + 0.3319
El valor de irradiancia corresponde a las mediciones registradas en el exterior (25/03/17)

en un horario de 7:00 a 10:00, mientras que la iluminancia corresponde a las mediciones en
el interior en el plano vertical (sensor 7) para la misma fecha y periodo.
Si se sustituye los valores de iluminancia por los registrados en el plano horizontal, la
ecuación resultante es:
𝑦̂= 0.774 x + 273.38
Se puede apreciar que las gráficas presentan un comportamiento similar, a pesar de la

diferencia en los valores de las variables dependientes. También podría optarse por
emplear los valores de otro día u otra temporada del año, con lo que resultaría un modelo
distinto. Surge entonces la pregunta respecto a cuál modelo estima mejor el fenómeno
estudiado.
Para ello es importante recordar que los modelos son un marco de referencia y una
descripción aproximada de los fenómenos. Ningún modelo podrá ser una réplica exacta y
cuya utilidad resulta de la correspondencia que tenga con las propiedades del mundo real.
Para comparar los modelos es necesario determinar su grado de “precisión”, es decir,
identificar el modelo con el cual se cometen errores menores. Los errores son las
diferencias entre el valor observado y el estimado y cuya expresión matemática es:
e = yj - 𝑦̂j
La raíz del promedio de las diferencias cuadráticas entre los valores modelados y los valores
observados, divididos entre la media de los valores observados representa la raíz del error
medio cuadrático, la cual es expresada con la siguiente ecuación:
… (7)
En el ejemplo anterior, determinamos que 𝑦̂ = -0.406 x + 10.639, con lo que es posible
determinar el valor ajustado y el error o residuo para cada variable x. La tabla siguiente
resume los datos obtenidos.
x y ̂
𝒚 e e²
3 10 9.42 0.58 0.33
6 7 8.20 -1.20 1.45
5 9 8.61 0.39 0.15
8 6 7.39 -1.39 1.94
9 8 6.99 1.01 1.02
10 7 6.58 0.42 0.17
7 8 7.80 0.20 0.04
𝒚̅= 7.856 ∑= 5.12
La media de los cuadrados de los residuos, es decir ̅̅̅

𝑒 2 =0.73, y cuya raíz cuadrada es 0,855.
Por tanto, REMC% es igual a dividir 0.855 / 7.856 = 0.1088 que expresado en porcentaje
equivale a 10.88%
La REMC% es siempre no negativa, y un valor de 0 (casi nunca alcanzado en la práctica)
indicaría un ajuste perfecto a los datos. En general, una REMC más baja es mejor que una
más alta.
Fuentes de información:
• BAIRD, D.C. “Experimentación: Una introducción a la teoría de mediciones y al

diseño de experimentos” 2ª Edición. Editorial Prentice-Hall Hisponoamerica.
México, 1991.
• LANGRAND, Claude. “Análisis de datos: métodos y ejemplos”. Escuela Colombiana
de Ingeniería. Colombia, 2009
• REY G. Carla, RAMIL D., María “Introducción a la Estadística Descriptiva”. 2ª Edición.
Editorial Netbiblo. España, 2007
Anexo 1. Iluminancia en primavera de 7:00 a 10:00 ventana orientación oeste

n Ei = n Ei = n Ei =
1 0.77 41 0.858 81 0.897
2 0.77 42 0.862 82 0.897
3 0.777 43 0.862 83 0.897
4 0.773 44 0.862 84 0.901
5 0.777 45 0.862 85 0.897
6 0.78 46 0.865 86 0.897
7 0.784 47 0.865 87 0.901
8 0.787 48 0.865 88 0.901
9 0.794 49 0.865 89 0.904
10 0.801 50 0.869 90 0.901
11 0.801 51 0.872 91 0.901
12 0.798 52 0.872 92 0.904
13 0.794 53 0.872 93 0.908
14 0.798 54 0.872 94 0.908
15 0.801 55 0.876 95 0.908
16 0.805 56 0.872 96 0.904
17 0.812 57 0.872 97 0.904
18 0.819 58 0.876 98 0.908
19 0.819 59 0.876 99 0.908
20 0.823 60 0.883 100 0.908
21 0.823 61 0.883 101 0.904
22 0.823 62 0.883 102 0.901
23 0.826 63 0.883 103 0.908
24 0.826 64 0.883 104 0.904
25 0.833 65 0.886 105 0.904
26 0.833 66 0.89 106 0.901
27 0.833 67 0.886 107 0.897
28 0.833 68 0.886 108 0.904
29 0.837 69 0.887 109 0.908
30 0.837 70 0.887 110 0.915
31 0.84 71 0.887 111 0.915
32 0.84 72 0.89 112 0.915
33 0.848 73 0.894 113 0.911
34 0.848 74 0.894 114 0.908
35 0.848 75 0.894 115 0.904
36 0.851 76 0.897 116 0.904
37 0.851 77 0.897 117 0.908
38 0.855 78 0.901 118 0.919
39 0.858 79 0.901 119 0.919
40 0.858 80 0.897 120 0.915

Procesamiento e Interpretación de Datos

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Procesamiento e Interpretación de Datos

Cargado por

Copyright:

Formatos disponibles

Procesamiento e interpretación de datos

Apuntes del curso de la Maestría en Arquitectura del Programa de Posgrado en Arquitectura a

Alejandro Díaz-Infante Rendón

• variables continuas, si admiten tomar cualquier valor dentro de un rango numérico

Cuando se realiza un estudio de investigación el objetivo final es inferir estadísticamente

Si N es par, la mediana muestral representa el promedio de los números en las

f. La desviación estándar es una unidad que refiere el grado de dispersión en una

Tabla 1. Frecuencia absoluta y relativa de la muestra del anexo 1.

En la tabla siguiente presenta el resumen estadístico de la muestra de iluminancias. Otra

Tabla 2. Resumen estadístico de la muestra

Análisis de la relación de dos variables cuantitativas

Tabla No. 3 Tabla de correlación

el valor yj de la variable Y, con independencia de los valores que adopte X. Asimismo, en la

Figura No. 1 Gráfica de correlación directa (Irradiancia e Iluminancia)

Figura No. 2 Gráfica de correlación indirecta (Temperatura y Humedad)

Propiedades del coeficiente de correlación (de Pearson)

• El coeficiente de correlación se encuentra entre -1 y 1 (-1 ≤ r ≤ 1).

En la figura […] se puede observar que la dispersión de puntos resultante de la relación de

Figura No. 3 Determinación de residuos y principio de mínimos cuadrados

Continuando con el ejemplo anterior, teníamos que:

𝑥̅ = 6.86 𝑦̅ = 7.86 ∑(𝑥 − 𝑥̅ )(𝑦 − 𝑦̅ ) = −14.14 ∑(𝑥𝑖 − 𝑥̅ )2 = 34.86

𝛽̂ 1 = -14.14 / 34.86 = -0.406

𝛽̂ 0 = 7.86 – (-0.406 x 6.86) = 10.639

en consecuencia, si y=𝛽̂ 0 + 𝛽̂ 1x, entonces la ecuación del modelo es:

Recordemos que el coeficiente 𝛽̂ 1 es la pendiente de la recta de regresión estimada; en el

𝛽̂ 1 = 7,421.80 / 7´532,531.30 = 0.001

𝛽̂ 0 = 0.73 – (0.001 x 404.52) = 0.3319

El valor de irradiancia corresponde a las mediciones registradas en el exterior (25/03/17)

Se puede apreciar que las gráficas presentan un comportamiento similar, a pesar de la

La media de los cuadrados de los residuos, es decir ̅̅̅

• BAIRD, D.C. “Experimentación: Una introducción a la teoría de mediciones y al

Anexo 1. Iluminancia en primavera de 7:00 a 10:00 ventana orientación oeste

También podría gustarte