Monografia Caracterisacion

UNIVERSIDAD NACIONAL DE CAJAMARCA
FACULTAD DE CIENCIAS AGRARIAS
Escuela Académico Profesional de Ingeniería Ambiental
Monografía
CARACTERIZACION DEL CLIMA APARTIR DE UN
CONJUNTO DE DATOS
Presentado por:
Valdivia Longa Kevin Arnold
DOCENTE:
Edgar Darwin Diaz Mori
CURSO:
Climatología
Celendín - Cajamarca
2022
1
I. Contenido
I. Contenido ........................................................................................................................ 2
I. Introducción .................................................................................................................... 6
II. Contenido Temático .................................................................................................... 7
1) Climatología ............................................................................................................ 7
2) Historia .................................................................................................................... 8
3) Base de Datos .......................................................................................................... 9
4) Evaluación de los conjuntos de datos .................................................................... 10
5) Visualización cualitativa de los datos .................................................................... 11
6) Descriptores cuantitativos sumarios de datos ........................................................ 12
➢ Modelación de datos de la distribución de frecuencias ................................ 13
➢ Medidas de tendencia central ......................................................................... 19
➢ Medidas de variabilidad .................................................................................. 22
➢ Medida del apuntamiento................................................................................ 24
➢ Índices ............................................................................................................... 25
7) Correlación ............................................................................................................ 26
➢ Correlación de Pearson y Correlación de Spearman ................................... 28
➢ Tablas de contingencia .................................................................................... 28
29
8) Series temporales ................................................................................................... 29
➢ Componentes de una serie temporal .............................................................. 31
➢ Clasificación descriptiva de las series temporales......................................... 33
2
Se clasifican en 2: ...................................................................................................... 33
9) Interpretación de las características sumarias del clima ........................................ 34
10) Normales ................................................................................................................ 36
➢ Periodo de calculo ............................................................................................ 37
➢ Estaciones para las que se calculan normales y promedios ......................... 38
➢ Homogeneidad de datos................................................................................... 38
➢ Datos faltantes .................................................................................................. 39
➢ Temperatura media diaria .............................................................................. 40
➢ Quintiles de precipitación................................................................................ 41
III. Conclusiones ............................................................................................................. 43
IV. Referencias bibliográficas ......................................................................................... 44
3
Ilustración 1 Distribución de frecuencias (histograma) y Distribución de frecuencias
acumulativas ............................................................................................................................ 12
Ilustración 2Ojivas .............................................................................................................. 12
Ilustración 3Diagrama de cajas ........................................................................................... 12
Ilustración 4. Ejemplo de una presentación de datos mediante un diagrama de tallo y hojas.
El dígito inicial del valor de una observación es el tallo y el dígito final es la hoja. En la tabla
hay, por ejemplo, dos observaciones de 25.............................................................................. 13
Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la
propiedad.................................................................................................................................. 16
Ilustración 6 Distribución exponencial: describe los tiempos transcurridos entre fenómenos
a lo largo de un proceso en el que estos se producen continua e independientemente a un
ritmo medio constante. Se ha utilizado en el análisis de la cantidad de precipitación diaria .. 16
Ilustración 7. . Distribución de Weibull: describe los tiempos transcurridos entre
fenómenos a lo largo de un proceso en el que estos se producen continua e
independientemente a un ritmo variable. Se ha utilizado en el análisis de la velocidad del
viento........................................................................................................................................ 16
Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer
modelos de valores extremos en una distribución ................................................................... 17
Ilustración 9. . Distribución lognormal: se utiliza cuando el logaritmo de una distribución
sigue la distribución normal, tal como la de las concentraciones de partículas de
contaminación atmosférica ...................................................................................................... 17
Ilustración 10 Distribución gamma: indica las distribuciones que están delimitadas en un
extremo y son asimétricas, como los datos sobre la precipitación .......................................... 17
Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en ambos
extremos, tales como la nubosidad .......................................................................................... 18
4
Ilustración 12 Relaciones entre la media, la mediana y la moda ........................................ 21
Ilustración 13Medidas de variabilidad ................................................................................ 23
Ilustración 14Medida de simetría ........................................................................................ 24
Ilustración 15Medidas del apuntamiento ............................................................................ 25
Ilustración 16Correlación .................................................................................................... 27
Ilustración 17Correlación positiva ...................................................................................... 27
Ilustración 18Correlación negativa ..................................................................................... 28
Ilustración 19CORRELACIÓN DE SPEARMAN ............................................................. 28
Ilustración 20CORRELACIÓN DE PEARSON ................................................................. 28
Ilustración 21Tabla de contingencia de accidentes en carreteras ........................................ 29
Ilustración 22Diagrama de dispersión con una correlación positiva fuerte ........................ 31
Ilustración 23Tendencia ...................................................................................................... 32
Ilustración 24Variación estacional ...................................................................................... 32
Ilustración 25Componente aleatoria ................................................................................... 33
Ilustración 26Serie temporal estacionaria ........................................................................... 33
Ilustración 27Serie temporal no estacionaria ...................................................................... 34
Ilustración 28 Serie temporal de la temperatura media de marzo ....................................... 36
Ilustración 29 Anomalías de la temperatura media mundial, con respecto al período de
referencia de 1850 a 1900 para los cinco conjuntos de datos mundiales (por cortesía del
Centro Hadley de la Oficina Meteorológica del Reino Unido) ............................................... 39
5
I. Introducción
Todos los años se van agregando más datos a los archivos climatológicos de los Servicios
Meteorológicos e Hidrológicos Nacionales (SMHN). Los climatólogos tienen que ser capaces
de manifestar toda la información pertinente contenida en los datos usando un número
subjetivamente diminuto de valores conseguidos por medio de una secuencia de
procedimientos estadísticos. Una vez que se eligen y se utilizan cuidadosamente, los procesos
estadísticos tienen la posibilidad de diferenciar y poner de relieve información pertinente
contenida en los datos.
La presente monografía se va basar en la estadística detallada, herramienta usada para
abreviar las características de un enorme volumen de datos de forma comprensible. Varios de
los procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con pcs
para procesar y exponer datos. No obstante, se necesita advertir de los riesgos de una aplicación
bastante mecánica de los procedimientos de estudio automáticos, ya que es bastante simple
usar inadecuadamente los métodos e interpretar de manera errónea los resultados. Si bien la
utilización de pcs comporta ventajas incuestionables, existe el peligro de que las suposiciones
implícitas de la mayor parte de los programas informáticos de estudio no se consideren o no se
expresen evidentemente, lo cual puede conllevar a resultados erróneos.
Aquí nos vamos a centrar en procedimientos estadísticos y debe consultarse conjuntamente
con el presente capítulo. Los dos poseen por objeto explicar conceptos básicos en vez de
especificar detalles de temas complicados. Las referencias que figuran finalmente del capítulo
y los libros de escrito sobre teoría y procedimientos estadísticos ofrecen información más
detallada.
6
II. Contenido Temático
1) Climatología
La climatología consiste en el estudio del clima, el funcionamiento del sistema

climático, sus variaciones y extremos y su influencia en diversas actividades, entre ellas
los recursos hídricos y la salud, la seguridad y el bienestar humanos. En sentido estricto,
se entiende por clima las condiciones meteorológicas normales correspondientes a un
lugar y período de tiempo determinados. El clima puede explicarse mediante
descripciones estadísticas de las tendencias centrales y la variabilidad de elementos
pertinentes como la temperatura, la precipitación, la presión atmosférica, la humedad y
los vientos, o mediante combinaciones de elementos, tales como tipos y fenómenos
meteorológicos, que son característicos de un lugar o región, o la Tierra en su conjunto,
durante cualquier período de tiempo. Además de tratar el clima como una entidad
estadística, también se puede estudiar como un factor determinante de las actividades
humanas, o como un recurso o un riesgo para estas últimas.
La climatología estudia tanto la variabilidad del clima como el calentamiento global.

La variabilidad del clima tiene relación con las variaciones de las condiciones
climáticas entre períodos. En general, la variabilidad del clima está relacionada con las
variaciones que están afectando al estado de la circulación atmosférica y oceánica En
oposición, el calentamiento global tiene relación con un cambio sistemático en las
características estadísticas del clima (por ejemplo, la media y la varianza) mayoría de
la historia climática de la Tierra, los cambios sistemáticos del clima se produjeron por
razones naturales, como variaciones en relación con la naturaleza de la órbita de la
Tierra (ORGANIZACION METEREOLOGICA MUNDIAL, 2018, pág. 1).
El clima es algo que nos ha preocupado desde la antigüedad. Del clima dependían
las migraciones de los animales, el crecimiento de los frutos y más tarde, la buena
marcha de las cosechas. Por ello, desde la época de las cavernas el hombre se ha
preocupado por el medio que le rodeaba y los cambios que éste sufría. Sin embargo, en
aquellos primeros tiempos, el conocimiento del medio era más práctico e instintivo que
sistemático. No es hasta la época de Aristóteles (384 – 322 AC) en que encontramos
referencias explícitas a algún estudio sobre la atmósfera y sus fenómenos, un primer
paso para comenzar a sistematizar el estudio del clima del planeta. A partir de entonces,
7
los estudios sobre el clima y sus fenómenos comienzan a hacerse más regulares: en el
año 230 AC ya se conocía la existencia de los tres estados del agua -hielo, líquido y
vapor- y se había comenzado a establecer una relación entre ellos (Inzunza , 2008, pág.
1 y 2).
2) Historia
En los poemas de la vieja Grecia y en el Antiguo Testamento de la Biblia
judeocristiana ya podían hallarse referencias al tiempo. Aparecen referencias todavía
más viejas en los Vedas, las escrituras hindúes más viejas, que fueron escritas alrededor
de en 1800 a. C. Asimismo, tienen la posibilidad de hallarse escritos específicos sobre
el asunto de la meteorología y la climatología en la obra Sobre los aires, aguas y sitios
de Hipócrates, que data de alrededor del año 400 a. C., seguida por Acerca del cielo:
Meteorológicos, de Aristóteles, redactada hacia el año 350 a. C. Para los primeros
filósofos griegos, el clima significaba "pendiente" y se refería a la curvatura del área de
la Tierra, la cual da sitio a la alteración del clima de acuerdo con la latitud gracias a la
incidencia cambiante de los relámpagos del Sol. En la obra de los filósofos Aristarco y
Eratóstenes, de Alejandría, se indican deducciones lógicas y fiables relativas al clima.
En 1735, George Hadley es el primero en interpretar el sistema de circulación vista
que vincula a las regiones tropicales y subtropicales, en especial, los vientos alisios, la
convección tropical y los desiertos subtropicales, que, desde entonces, inició a
conocerse como la celda de Hadley. Julius von Hann, quien divulgó el primero de los 3
volúmenes de su Manual de Climatología en 1883, redactó la obra típica sobre
climatología general y regional, que comprendía datos y descripciones de testigos
presenciales referentes al tiempo y el clima. En 1918, Wladimir Kóppen elaboró la
primera categorización descriptiva de los climas de todo el mundo de consenso con la
cubierta vegetal del suelo. A esta tarea le siguieron estudios más detallados en el entorno
8
de la climatología detallada. Ejemplificando, el geógrafo E. E. Federov (1927) intentó
explicar los climas locales atendiendo a visualizaciones meteorológicas cotidianas.
Entre otras obras relevantes sobre climatología cabe resaltar la de Tor Bergeron
(sobre climatología dinámica, publicada en 1930) y la de Wladimir Kóppen y Rudolf
Geiger, quienes publicaron un manual de climatología en 1936. Geiger describió hasta
cierto punto el término de micro climatología por primera ocasión en 1927, empero los
progresos en este campo no se produjeron hasta la Segunda Guerra Mundial. Por
motivos de idealización, a lo largo de la guerra nació la necesidad de hallar un
procedimiento para decidir la posibilidad de peligros basándose en datos
meteorológicos relativos a meses e inclusive años futuros y dicho procedimiento se
puso en práctica. En 1948, C.W. Thornthwaite estableció una categorización del clima
basada en un inventario hídrico y la evapotranspiración. En los decenios posteriores, se
observaron relevantes progresos en el desarrollo de las teorías sobre la climatología.
3) Base de Datos
Acá veremos sobre la descripción de las características de la Base de Datos
climáticos elaborada. La Base de Datos forma un soporte informático que puede
almacenar y colocar a disposición abierta publica, información climática relevante para
los estudios sobre el cambio climático la cual se realizara en un futuro en el marco de
la 3ra Comunicación Nacional sobre el Cambio Climático.
Nos centraremos en la estadística descriptiva, herramienta usada para abreviar las
características de un enorme volumen de datos de forma comprensible. Varios de los
procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con
computadoras para procesar y exponer datos. No obstante, se necesita advertir de los
riesgos de una aplicación bastante mecánica de los procedimientos de estudio
9
automáticos, ya que es bastante simple usar inadecuadamente los métodos e interpretar
de manera errónea los resultados. Si bien la utilización de computadoras comporta
ventajas incuestionables, existe el peligro de que las suposiciones implícitas de la mayor
parte de los programas informáticos de estudio no se consideren o no se expresen
precisamente, lo cual puede conllevar a resultados equivocados.
4) Evaluación de los conjuntos de datos
Un grupo de datos se basa en una recopilación de visualizaciones de recursos. Una
observación es una sola estimación de determinada porción. Las visualizaciones básicas
consisten en, ejemplificando, la lectura de un termómetro o del grado de agua en un
pluviómetro. Otras visualizaciones son más complicadas. Ejemplificando, la obtención
de la presión barométrica de un barómetro de mercurio involucra hacer visualizaciones
tanto de la longitud de la columna de mercurio como de la temperatura del barómetro.
La presión se estima como una sola observación.
Ciertos recursos son consecutivos, o sea, no hay discontinuidades en el estado del
fenómeno visto, de la misma forma que la temperatura del viento. Otros recursos, como
la precipitación, no son seguidos, y además hay otros que no tienen valores
cuantitativos, sino solo una categoría detallada, de la misma forma que un tipo de nube
o las condiciones meteorológicas reinantes. La población constituye todos los valores
probables de un componente. Si un componente es constante, la población va a ser en
teoría infinita. Si el factor no es constante, la población se apoya en todos los valores
específicos que puede tener el componente en los parámetros establecidos por el
analista.
Una muestra es un grupo de visualizaciones poblacional, que se toma para
representar a toda la población. Los conjuntos de datos son muestras. Cuanto más
10
grande sea la muestra, más precisa va a ser la estimación de las propiedades descriptivas
poblacional. Buena parte de la climatología se ocupa del análisis de muestras, empero
el analista debería reconocer que un grupo de datos podría ser representativo de solo
una sección poblacional. La predominación, por ejemplo, de la carencia de
homogeneidad, la dependencia del tiempo y las variaciones en el espacio complican la
interpretación de lo cual representa el grupo de datos (ORGANIZACION
METEREOLOGICA MUNDIAL, 2018).
5) Visualización cualitativa de los datos
Varias de las propiedades primordiales que se acostumbran buscar en un grupo de
datos son el costo medio o típico, la expansión o gama de las visualizaciones, la realidad
de visualizaciones inesperadas, la forma en la que las visualizaciones se desvían de cada
lado del costo medio y la aglutinación de las visualizaciones. Sin una organización
sistemática, no es viable interpretar monumentales volúmenes de datos para descubrir
estas y propiedades semejantes. El primer paso es entender los datos de forma general
por medio de la visualización del reparto de los valores vigilados.
Hay muchas formas de exponer los datos para obtener una apreciación cualitativa
de lo que los datos revelan al climatólogo. Una forma de acomodar un grupo de datos
radica en ordenar las visualizaciones por intensidad ascendente y descendente. Las
visualizaciones ordenadas tienen la posibilidad de entonces manifestarse gráficamente
o como un cuadro, debido a lo que se realizan evidentes varias propiedades, como por
ejemplo los valores extremos y la gama. Una segunda forma de ordenar un grupo de
datos es agrupar los datos en intervalos. Se efectúa un conteo del número de
visualizaciones en cada intervalo. Una visualización del número de casos o el
porcentaje del número total de visualizaciones en cada intervalo da una indicación
instantánea de la manera de el reparto de los valores poblacional y obtiene el nombre
11
de repartición de frecuencias o histograma. El número de intervalos es arbitrario y la
visualización del reparto en un gráfico se ve afectada por el número de intervalos.
Parte de la información contenida en el grupo de datos originales se pierde una vez
que las visualizaciones son agrupadas y, generalmente, cuantos menos intervalos se
hagan, más grande va a ser la pérdida.
Ilustración 1 Distribución de frecuencias (histograma) y Distribución de frecuencias acumulativas
Ilustración 3Ojivas Ilustración 2Diagrama de cajas
6) Descriptores cuantitativos sumarios de datos
En vez de exponer el grupo de datos completo para ilustrar una característica
concreta, comúnmente, es eficaz sustraer numerosas medidas de resumen
cuantitativas. Las medidas de resumen ayudan a explicar pautas de alteración de las
visualizaciones. Si se entienden dichas pautas, va a ser viable agrandar los
12
conocimientos sobre los procesos físicos que subyacen a las visualizaciones e inferir
mejor las condiciones climáticas pasadas y presentes. Debería tenerse buen cuidado
de que los contenidos de un grupo de datos que se hayan resumido por medio de
medidas cuantitativas sean en realidad equiparables. Ejemplificando, una serie de
visualizaciones de la temperatura tienen la posibilidad de ser equiparables si cada
una de se miden con los mismos artefactos, paralelamente todos los días, en el mismo
sitio y con los mismos métodos. Si cambian los métodos, tienen la posibilidad de
introducirse variaciones artificiales en el grupo de datos. Algunas veces, los
descriptores sumarios de un grupo de datos detectan variaciones imprevistas; cada
una de las pautas imprevistas deberán examinarse para establecer si son provocadas
artificialmente o son efectos reales del sistema climático.
Ilustración 4. Ejemplo de una presentación de datos mediante un diagrama de tallo

y hojas. El dígito inicial del valor de una observación es el tallo y el dígito final es la
hoja. En la tabla hay, por ejemplo, dos observaciones de 25
➢ Modelación de datos de la distribución de frecuencias
Aquí tenemos la posibilidad de recopilar los datos de una forma estructurada y
estructural, en cual se usan tablas para recolectar estos datos y con ellos poder
hacer un estudio más descriptivo. Este procedimiento se utiliza usualmente con un
sistema de administración de base de datos, en las cuales tenemos la posibilidad de
agrupar los datos en una repartición de frecuencia y dichos datos tienen la
posibilidad de detectar de numerosas modalidades dependiendo de cómo se
13
relacionen con otros datos (AquijeRodríguez, Puma Reyes Bernardo, & Bazalar
Guiazada, 2010, pág. 8).
Tipos de modelados de datos:
- Modelo de datos conceptuales
- Modelo de datos logísticos
- Modelos de datos físicos
Las observaciones de datos, dan una perspectiva cualitativa de la composición
de una secuencia de visualizaciones. Las maneras y las pautas resultan evidentes.
Las distribuciones de frecuencias tienen la posibilidad de clasificarse según su
forma en:
• curvas simétricas unimodales: estas curvas se aplican comúnmente para los
promedios de los recursos, como la temperatura media anual y a más extenso plazo.
En la mayor parte de los casos, cuanto más extenso sea el lapso de premediación,
más simétrica va a ser el reparto;
• curvas moderadamente asimétricas unimodales: muchas curvas de datos
promediados son principalmente (pero no del todo) simétricas.
• curvas bastante asimétricas unimodales: estas maneras no son nada simétricas y
presentan un alto nivel de desviación; son usuales para las porciones de precipitación
y velocidades del aire.
• curvas a modo de U: estas curvas son usuales para recursos que poseen
parámetros bilaterales, como por ejemplo la parte de nubosidad (hay más grande
tendencia de que los cielos estén mayormente despejados o mayormente cubiertos).
14
• curvas multimodales o complicadas: estas curvas son usuales para los recursos
vigilados diariamente en regiones con marcados contrastes estacionales. En tal
caso, la curva de repartición de frecuencias desarrollada usando el grupo de datos
enteros puede tener una forma bimodal bastante característica. Posiblemente es
más simple entender los conjuntos de datos con distribuciones de frecuencias
bastante complicadas por medio de una estratificación de datos a priori para reflejar
los diferentes procesos subyacentes.
Un método para resumir la distribución de un conjunto de observaciones
consiste en ajustar una distribución de probabilidad a las observaciones. Estas
distribuciones son funciones con propiedades matemáticas conocidas que se
caracterizan por un reducido número de parámetros (normalmente no más de tres).
Las funciones siempre se construyen de modo que las magnitudes relativas de los
diferentes valores reflejen diferencias en las probabilidades relativas de observar
dichos valores. Varias distribuciones de probabilidad comunes, como la
distribución normal (o gausiana) y la distribución de valores extremos
generalizada, permiten describir situaciones que ocurren a menudo en la naturaleza.
Si es posible describir una frecuencia observada o una distribución de frecuencias
condicional mediante estas funciones conocidas de densidad de probabilidad, las
propiedades y las relaciones pueden utilizarse para analizar los datos y hacer
deducciones probabilísticas y estadísticas. En las figuras 5 a 11 se muestran algunos
ejemplos de funciones de densidad de probabilidad que pueden aproximarse a
distribuciones de frecuencias observadas de datos continuos (en las que puede
observarse cualquier valor en una serie continua) (ORGANIZACION
METEREOLOGICA MUNDIAL, 2018, pág. 70).
15
Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la
propiedad
Ilustración 6 Distribución exponencial: describe los tiempos transcurridos entre

fenómenos a lo largo de un proceso en el que estos se producen continua e
independientemente a un ritmo medio constante. Se ha utilizado en el análisis de la
cantidad de precipitación diaria
Ilustración 7. . Distribución de Weibull: describe los tiempos transcurridos

entre fenómenos a lo largo de un proceso en el que estos se producen continua e
independientemente a un ritmo variable. Se ha utilizado en el análisis de la
velocidad del viento
16
Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer
modelos de valores extremos en una distribución
Ilustración 9. . Distribución lognormal: se utiliza cuando el logaritmo de una

distribución sigue la distribución normal, tal como la de las concentraciones de
partículas de contaminación atmosférica
Ilustración 10 Distribución gamma: indica las distribuciones que están

delimitadas en un extremo y son asimétricas, como los datos sobre la
precipitación
17
Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en
ambos extremos, tales como la nubosidad
La precisión con la que una funcionalidad sumaria explica las visualizaciones
puede determinarse analizado las diferencias existentes en medio de las
visualizaciones y los valores conseguidos de la funcionalidad. Deberían efectuarse
pruebas objetivas de la calidad del ajuste. En la mayoría de los casos, los conjuntos
de datos tienen la posibilidad de modelizar con bastante más de una funcionalidad,
y las medidas logradas en las pruebas tienen la posibilidad de compararse para
buscar el ajuste más correcto o más eficaz. Comúnmente, se usan las pruebas de
chi-cuadrado y Kolmogorov-Smirnov. La calidad de ajuste definida por la primera
implica que los valores de los datos son discretos e independientes (ninguna
observación se ve afectada por otra observación). Si la suma de los cuadrados de
las diferencias existentes en medio de las frecuencias observadas y las ajustadas
excede un umbral que es dependiente del tamaño de la muestra, el ajuste debe
considerarse inadecuado. Esta prueba es sensible al número de intervalos. La
prueba Kolmogorov-Smirnov parte de la conjetura de que si la máxima diferencia
absoluta entre 2 frecuencias acumulativas sucesivas de visualizaciones
independientes es más grande que un costo crítico, posiblemente las distribuciones
sean diferentes. Esta prueba es eficaz si el grupo de datos tiene un alto número de
18
visualizaciones (ORGANIZACION METEREOLOGICA MUNDIAL, 2018, pág.
75).
➢ Medidas de tendencia central
Son parámetros estadísticos que lo que busca es poder resumir en un solo valor
a todo un conjunto de valores e informar sobre el centro de distribución de la
muestra o la población estadística (AquijeRodríguez, Puma Reyes Bernardo, &
Bazalar Guiazada, 2010, pág. 9). Algunas de las medias de tendencia central más
utilizadas son:
- La moda
-La media
-La mediana
Las visualizaciones tienden a aglutinarse alrededor de un costo especial. Las
medidas de tendencia central poseen por objeto indicar un costo central alrededor
del que tienden a agruparse los datos. Las medidas de tendencia central no
sustituyen toda la información descriptiva contenida en el grupo de visualizaciones
completo. Comúnmente, el cálculo de una sola medida resulta inadecuado para
explicar la forma en la que tienden a concentrarse los datos pues no toma en
importancia la alteración de las visualizaciones. Cualquier medida de tendencia
central debe efectuarse junto con una medida del nivel de alteración de los valores
de las observaciones de las que se deriva la tendencia central.
La media aritmética, llamada usualmente “promedio”, es una de las estadísticas
más muchas veces usadas en climatología. Se calcula dividendo sencillamente la
suma de los valores entre el número de valores. En la situación de las
visualizaciones que tiendan a aglutinarse en torno al costo central, la media
19
representa un número hacia el que convergería el promedio de una serie temporal
de visualizaciones bastante extensa u otros conjuntos de datos de enorme volumen
a medida que el número de valores de datos vaya incrementando. La media no es
representativa de la tendencia central de distribuciones demasiado asimétricas.
Una media ponderada se calcula asignando distinto grado de trascendencia a las
diversas visualizaciones de forma que, ejemplificando, las visualizaciones más
fiables o más representativas tengan una más grande predominación en el cálculo
de la media. Hay varios procedimientos para establecer las ponderaciones. Un caso
muestra común es la ponderación de las distancias, en la que las ponderaciones
permanecen inversamente en relación con una medida de distancia.
Ejemplificando, la ponderación de la distancia se utiliza comunmente al estimar un
costo medio representativo de un espacio concreto desde visualizaciones
efectuadas en una zona circundante a aquel sitio. Generalmente, las ponderaciones
son colaboraciones matemáticas que tienen la posibilidad de carecer de interacción
inherente con los procesos físicos que se miden, empero, constantemente que sea
viable, en la votación de los procedimientos de ponderación se debe intentar de
tener en cuenta los principios físicos. Por lo general, los procedimientos de
ponderación otorgan buen resultado una vez que tanto las características físicas
como las estadísticas varían siempre y bastante muy lento en el espacio y la era
examinados.
La mediana es el punto medio de una repartición de frecuencias acumulativas;
la mitad de los datos permanecen por arriba de la mediana y la otra mitad por abajo.
Se calcula ordenando los datos y seleccionando el costo del medio. Si el número
de valores es impar, la mediana es el costo del medio. Si el número de valores es
par, la mediana se encuentra entre ambos valores del medio, principalmente, como
20
la media (o la media ponderada) de ambos. Si ambos valores del medio son
idénticos, se elige este costo como mediana.
Las variaciones extremas influyen menos en la mediana que en la media ya que
la mediana es una medida de postura. Pues la mediana se fundamenta en el número
de visualizaciones, la intensidad de las visualizaciones extremas no influye en la
mediana. La mediana es en especial eficaz una vez que las visualizaciones tienden
a agruparse en torno al centro, empero varias de las visualizaciones además son
muy elevadas o bastante bajas. Como en la situación de la media, la mediana no
representa bien datos que no se agrupan alrededor del costo central.
La moda es el costo que surge con más frecuencia en el grupo de datos. Al igual
que la mediana, la moda es una medida posicional. No se ve afectada ni por el costo
(como le pasa a la media) ni por la postura de otras visualizaciones (como le pasa
a la mediana). Las modas de muestras pequeñas o de muestras que poseen bastante
más de una agrupación de visualizaciones son estimaciones no fiables de la
tendencia central. Si muchas de las concentraciones de las visualizaciones son
realmente típicas (distribución multimodal), es factible que el grupo de datos se
encuentre formado por componentes diferentes, todos los cuales tiene un costo
central distinto alrededor del que tienden a agruparse las visualizaciones. En la
situación de los recursos de carácter circular, como la dirección del aire, el término
de
Ilustración 12 Relaciones entre la media, la mediana y la moda
21
media puede ser ambiguo. Comúnmente, el costo modal, de la misma forma que la
dirección del aire dominante, es una medida más eficaz de la tendencia central para
recursos que se miden con la dirección.
➢ Medidas de variabilidad
Cuando se elija una estimación idónea de la tendencia central, es viable medir
la variabilidad de las visualizaciones particulares alrededor de aquel costo. El valor
de la medición de la alteración y su descripción es importante. No obstante, un
registro de tan solo unas escasas observaciones es insuficiente para estimar la
variabilidad.
La variabilidad puede medirse en términos absolutos o relativos. Es viable
minimizar la desviación de cada observación respecto de la tendencia central a un
costo que representa y posibilita explicar el grupo de datos en su integridad. Aquel
exclusivo número es la variabilidad absoluta.
El tamaño más sencillo de la variabilidad absoluta es el rango de
visualizaciones. El rango es la diferencia que existe entre los valores más elevados
y los valores más bajos. Aunque sea simple de calcular, el rango muestra muchas
restricciones. Si los valores extremos resultan muy escasos o no son parte del
grueso de las visualizaciones, el rango puede ser engañoso. El rango no da
información acerca del carácter del reparto de frecuencias en los parámetros
extremos. Además, prescinde casi enteramente del nivel de concentración de los
valores, y no caracteriza íntegramente el grupo de datos de una forma eficaz.
Tampoco es suficiente para estimar la confiabilidad de la tendencia central.
La desviación media es la media del costo absoluto de cada una de las
desviaciones de las diferentes visualizaciones respecto del tamaño de tendencia
22
central seleccionada. Si bien es viable calcular las desviaciones desde la media, la
mediana o la moda, en inicio, deberían calcularse a partir de la mediana, pues la
suma de las desviaciones absolutas respecto de la mediana es menor o igual que la
suma de la media o de la moda.
La desviación típica es la raíz cuadrada de la media del cuadrado de cada una
de las diversas desviaciones respecto de la media. Las desviaciones se toman desde
la media en lugar de la mediana o de la moda ya que la suma de los cuadrados de
la media es un mínimo. Si las desviaciones se elevan al cuadrado, existe una más
grande ponderación de las variaciones extremas. La desviación clásica se usa para
deducir muchas medidas estadísticas. Además, se utiliza extensamente como
porción normativa para normalizar diferentes distribuciones con el objeto de
establecer comparaciones.
Ilustración 13Medidas de variabilidad
➢ Medida de la simetría
La asimetría es una medida de la desviación respecto de la simetría. Es una
medida relativa y adimensional, por lo cual posibilita entablar comparaciones entre
conjuntos de datos. Una medida fácil de la asimetría se basa en la diferencia entre
la media y la moda, divida entre la desviación clásica. La asimetría es positiva una
vez que la media es más grande que la moda y negativa una vez que la moda es
23
más grande que la media. Además, se han definido otras medidas, como una basada
en el alcance intercuartil y la mediana.
La asimetría positiva es característica de ciertos conjuntos de datos acerca de la
precipitación que poseen un límite inferior de cero, empero un límite preeminente
ilimitado. Los conjuntos de datos relativos a la temperatura máxima diaria además
acostumbran exponer una tendencia hacia la asimetría positiva, sin embargo, las
temperaturas mínimas cotidianas constantemente muestran una tendencia hacia la
asimetría negativa
Ilustración 14Medida de simetría
➢ Medida del apuntamiento
Es viable que las distribuciones de frecuencias simétricas tengan diferentes
grados de aplastamiento en su parte central. La curtosis es un coeficiente
adimensional que da una medida relativa para hacer comparaciones del
aplanamiento o apuntamiento. La curtosis positiva sugiere un mayor reducido en
el interior del reparto de frecuencias y las frecuencias caen pronunciadamente hasta
valores bajos lejos de la media. Los valores negativos indican una zona central
plana y vasta y son particulares de muchas distribuciones meteorológicas, como la
humedad en altitud.
24
Con este parámetro se pretende medir el como se reparten las frecuencias
relativas de datos entre el centro y los extremos, toma como comparación la
campana de Gauss.
Tipos :
Leptocurtica
Mesocurtica
Platicurtica
Ilustración 15Medidas del apuntamiento
➢ Índices
Un índice tiene por objeto minimizar condiciones complicadas a un solo número
que mantiene cierto sentido físico y puede utilizarse para el seguimiento de un
definido proceso. Expresa la interacción en medio de las condiciones observadas y
las de alusión por medio de un solo costo. La alusión suele ser comúnmente, sin
embargo, no constantemente, el estado medio del clima. Ejemplo de eso es el índice
de gravedad de la sequía de Palmer, que es una comparación sumaria de un
complejo sistema de balance hídrico de precipitación, evaporación, escorrentía,
recarga y características del suelo con condiciones medias del clima. El desarrollo
de un índice consta de 4 elementos: la elección de los recursos que tienen que
incluirse en el índice; la votación y el cálculo de la alusión; Constantemente,
analizar y escoger los datos que se tienen que integrar en la índice resulta más difícil
que el cálculo del índice en sí. Una de las preocupaciones que implica la votación
de la alusión es que las propiedades de las visualizaciones usadas para definirla
tienen la posibilidad de modificar a lo extenso del tiempo; es importante que las
visualizaciones usadas sean homogéneas. Otra inquietud es que la alusión debe
25
representar condiciones habituales, usuales o esperadas, debido a que la mayor
parte de los usuarios de un índice suponen que la alusión representa dichas
condiciones. Al escoger la alusión, se debe tener buen cuidado de conceptualizar
explícitamente lo cual se va a equiparar y con qué finalidad. el procedimiento de
preparación del índice, y las ponderaciones o el valor de todos los elementos
incluidos
7) Correlación
La correlación es una medida de la relación (covariación) lineal entre dos
variables cuantitativas continuas (x, y). La manera más sencilla de saber si dos
variables están correlacionadas es determinar si co-varían (varían conjuntamente).
Es importante hacer notar que esta covariación no implica necesariamente
causalidad, la correlación puede ser fortuita, como en el caso clásico de la
correlación entre el número de venta de helados e incendios, debido al efecto de
una tercera variable, la temperatura ambiental (Vinuesa, 2016, pág. 2)
• Estas medidas se aplican a los valores al tomar dos variables distintas en cada uno
de los elementos de una respectiva muestra.
• En el caso de que ambas variables varían a la vez, es decir que si los valores de
una son más altos o bajos cuanto más altos o bajos son los de la otra.
• Si los valores de ambas variables aumentan o disminuyen a la vez, se le denomina
correlación es positiva.
• Pero cuando los valores de una variable aumentan siempre y cuando la otra
disminuyen, o viceversa, su correlación es negativa.
26
• Si las variables cambian de manera independiente una de la otra, no hay
correlación entre ellas.
Ilustración 16Correlación
❖ Correlación positiva
Cuando una relación entre una variable y otra es lineal y directa, de manera que
un cambio en una variable predice el cambio en la otra variable
Hay correlación positiva cuando las dos variables se correlacionan en sentido
directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e
igualmente con los valores bajos.
Ilustración 17Correlación positiva
❖ Correlación negativa
La relación entre una variable y otra es opuesta o inversa.
Entonces, hay correlación negativa cuando las dos variables se correlacionan en
sentido inverso.
27
Cuando una variable cambia, la otra se modifica hacia lo contrario. Al momento
que esta posee variables de valores altos, la otra posee valores bajos y mientras
este valor esté más cerca de -1, más evidente será esta covariación.
Ilustración 18Correlación negativa
➢ Correlación de Pearson y Correlación de Spearman
El coeficiente de correlación de Spearman es exactamente el mismo que el
coeficiente de correlación de Pearson, calculado sobre el rango de observaciones.
La correlación estimada entre X e Y se halla calculando el coeficiente de
correlación de Pearson para el conjunto de rangos apareados. La correlación de
Ilustración 19CORRELACIÓN DE Ilustración 20CORRELACIÓN DE PEARSON

SPEARMAN
Spearman puede ser calculada con la fórmula de Pearson (Martinez Ortega, Tuya
Pendás, Martínez Ortega, & Pérez Abreu, 2009)
➢ Tablas de contingencia
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos.
28
En general, el interés se centra en estudiar si existe alguna asociación entre una
variable denominada fila y otra variable denominada columna y se calcula la
intensidad de dicha asociación.
De manera formal, se consideran X e Y dos variables categóricas con I y J
categorías respectivamente. Una observación puede venir clasificada en una de las
posibles I × J categorías que existen.
Cuando las casillas de la tabla contienen las frecuencias observadas, la tabla se
denomina tabla de contingencia, término que fue introducido por Pearson en 1904.
Una tabla de contingencia (o tabla de clasificación cruzada), con I filas y J
columnas se denomina una tabla I × J (Anonimo, 2012).
Ilustración 21Tabla de contingencia de accidentes en carreteras
8) Series temporales
Una serie temporal es una colección de observaciones de una variable realizadas
de forma secuencial en el tiempo, en las que el orden de observación es importante.
Los valores de una serie temporal van ligados a instantes de tiempo, de manera que
el análisis de una serie implica el manejo conjunto de dos variables; la variable en
estudio propiamente dicha y la variable tiempo ( Esparza Catalán , 2006, pág. 2)
Un gráfico de valores de datos trazado en funcionalidad del tiempo es una
fundamental herramienta cualitativa para decidir variaciones en relación con la era.
En la climatología, una tendencia es una característica interesante pues constituye
29
un resumen del comportamiento histórico de las visualizaciones de un componente.
En la mayor parte de los casos, se inspeccionan las tendencias lineales de una serie
temporal definida, sin embargo, algunas veces, podría ser mejor explicar una
tendencia en términos no lineales, como una curva, o inclusive un movimiento
abrupto hacia arriba o hacia debajo. Generalmente, las tendencias, ya sean lineales
o no, se mantienen en las series climáticas a lo extenso de un lapso limitado, que
podría ser bastante extenso. En todo el tiempo, en el sistema climático se han visto
muchas veces tendencias con una orientación, que, al final, termina por invertirse.
Lo cual podría parecer una tendencia sostenida a lo largo de el lapso más existente
de un registro climático podría conformar parte de una oscilación lenta relacionada
con variaciones multidecenales que no tienen la posibilidad de apreciarse
evidentemente ya que el intervalo de tiempo de esa tendencia sostenida es solo una
sección de la oscilación total, o pues se desconoce la naturaleza de la serie
proyectada para el futuro. El calentamiento global antropogénico expone un reto
especialmente difícil a este respecto ya que posiblemente las elecciones humanas
influyan en el momento de establecer, ejemplificando, cuánto tiempo se mantendrá
la tendencia al calentamiento mundial vista en el siglo pasado. Para hacer un
análisis completo de las series temporales, se necesita decidir no solo las
tendencias, sino además las oscilaciones periódicas o cuasiperiódicas, así como las
variaciones irregulares o aparentemente fortuitas que se observan en los datos. El
objetivo de los estudios de las series temporales es entender la forma en la que la
variabilidad de una serie temporal se distribuye como funcionalidad de la escala
temporal.
Comúnmente en el marco de la meteorología y la climatología, las
visualizaciones continuas tienden más a asemejarse que a marcar la diferencia. El
30
tamaño usado para abreviar la interacción entre cada observación y la que le
precede constituye el coeficiente de autocorrelación. Esta medida se calcula de la
misma forma que el coeficiente de correlación, con la exclusión de que la segunda
serie es la misma que la primera, sin embargo, con un movimiento de uno o más
saltos de tiempo.
Las medidas que resumen las tendencias dependen del tipo de tendencia que se
está determinando. Las tendencias lineales permanecen representadas por la
pendiente de una línea recta, mientras tanto que las no lineales permanecen
representadas por los coeficientes de las cambiantes matemáticas que definen la
ecuación relativa al ajuste de curvas, como los coeficientes de una funcionalidad
polinómica. Igualmente, las propiedades periódicas además permanecen
representadas por los coeficientes de las cambiantes matemáticas que definen las
oscilaciones, como por ejemplo la frecuencia, la fase y la amplitud de las
funcionalidades trigonométricas.
Ilustración 22Diagrama de dispersión con una correlación positiva

fuerte
➢ Componentes de una serie temporal
El estudio descriptivo de series temporales se basa en la idea de descomponer la
variación de una serie en varias componentes básicas. Este enfoque no siempre
31
resulta ser el más adecuado, pero es interesante cuando en la serie se observa cierta
tendencia o cierta periodicidad. Hay que resaltar que esta descomposición no es en
general única. Este enfoque descriptivo consiste en encontrar componentes que
correspondan a una tendencia a largo plazo, un comportamiento estacional y una
parte aleatoria. Las componentes o fuentes de variación que se consideran
habitualmente son las siguientes:
Tendencia: Se puede definir como un cambio a largo plazo que se produce en
relación al nivel medio, o el cambio a largo plazo de la media. La tendencia se
identifica con un movimiento suave de la serie a largo plazo.
Ilustración 23Tendencia
Efecto Estacional: El movimiento periódico de corto plazo. Se trata de una
componente causal debida a la influencia de ciertos fenómenos que se repiten de
manera periódica en un año (las estaciones), una semana (los fines de semana) o
un día (las horas puntas) o cualquier otro periodo. Recoge las oscilaciones que se
producen en esos períodos de repetición.
Ilustración 24Variación estacional
32
Componente Aleatoria: Accidental, de carácter errático, también denominada
residuo, no muestran ninguna regularidad (salvo las regularidades estadísticas),
debidos a fenómenos de carácter ocasional como pueden ser tormentas, terremotos,
inundaciones, huelgas, guerras, avances tecnológicos, etcétera.
Ilustración 25Componente aleatoria
➢ Clasificación descriptiva de las series temporales
Se clasifican en 2:
Estacionarias: Una serie es estacionaria cuando es estable, es decir, cuando la
media y la variabilidad son constantes a lo largo del tiempo. Esto se refleja
gráficamente en que los valores de la serie tienden a oscilar alrededor de una media
constante y la variabilidad con respecto a esa media también permanece constante
en el tiempo. Es una serie básicamente estable a lo largo del tiempo, sin que se
aprecien aumentos o 5 disminuciones sistemáticos de sus valores. Para este tipo de
series tiene sentido conceptos como la media y la varianza.
Ilustración 26Serie temporal estacionaria
33
No estacionaria
Son series en las cuales la media y/o variabilidad cambian en el tiempo. Los
cambios en la media determinan una tendencia a crecer o decrecer a largo plazo,
por lo que la serie no oscila alrededor de un valor constante.
Ilustración 27Serie temporal no estacionaria
9) Interpretación de las características sumarias del clima
Si bien es viable calcular muchas medidas de resumen, quizás no sea correcto
aprovecharlas para explicar la base de datos. Cada una de las medidas que
disminuyen visualizaciones con el objeto de identificar e indicar una señal o
interacción climática se fundamentan en supuestos y, si dichos no son válidos, las
medidas de resumen tienen la posibilidad de ser engañosas. Hay 4 puntos que
tienen que examinarse detalladamente antecedente de utilizar medidas de resumen,
a saber: los errores del grupo de datos, la falta de homogeneidad, la libertad de las
visualizaciones y la desatención de los componentes importantes.
Comúnmente, los datos son equivocados gracias a errores de registro (tales
como la transposición de números), las comunicaciones ininteligibles, los
malentendidos de un observador respecto de las prácticas de codificación, errores
de proceso (por ejemplo, la conversión errónea de grados Fahrenheit a grados
Celsius), errores de codificación y lógica de los programas informáticos, e
información errónea del identificador (ubicación u hora) de un costo. Dichos tipos
de error no tienen interacción con las condiciones físicas que son objeto de
34
observación y tienen la posibilidad de contaminar los datos, de tal forma que los
estudios de dichos tienen la posibilidad de llevar a conclusiones incorrectas.
A menudo, se incurre en deducciones incorrectas una vez que se emplean
medidas cuantitativas para equiparar datos que en verdad no son equiparables,
como una vez que se comparan visualizaciones no homogéneas.
De ser viable, cualquier grupo de datos que se encuentre analizando debería
homogeneizarse. Varios conjuntos de datos meteorológicos no cumplen el supuesto
de libertad. Previo a abreviar un grupo de datos, si es viable, debe velarse por borrar
la dependencia que existe en medio de las visualizaciones. Ejemplificando, el
impacto de los ciclos anuales conocidos puede eliminarse de forma notable si se
resumen las desviaciones respecto del periodo conocido. Además, en forma de
ejemplo, si se conoce que la persistencia (autocorrelación) perjudica a una
secuencia de visualizaciones, como en ocasiones pasa con las temperaturas
cotidianas observadas a lo largo de un fenómeno sinóptico de alta presión en área,
el modelo analítico debe tenerlo presente. Si los modelos no otorgan cuenta de la
dependencia, la persistencia que perjudica a cada una de las visualizaciones
efectuadas a lo largo del fenómeno persistente podría eliminarse por medio de un
submuestreo en el cual se elija solo una observación entre algunas de las accesibles
a lo largo del fenómeno. No obstante, en este proceso debe tenerse cuidado de no
esconder ni una oscilación subyacente, lo cual puede conducir a un estudio
incorrecto.
35
Ilustración 28 Serie temporal de la temperatura media de marzo
10) Normales
El uso de las normales climáticas tiene dos finalidades principales. Sirven de
referencia para poder comparar las observaciones recientes o presentes y, en
particular, para fundamentar muchos conjuntos de datos climáticos basados en
anomalías. También tienen un uso generalizado, implícito o explícito, para predecir
las condiciones que muy probablemente se experimentarán en un lugar dado. En
un principio, el objetivo de las normales consistía en permitir comparar las
observaciones de todo el mundo.
El uso de las normales para la predicción fue cobrando impulso lentamente en
el transcurso del siglo XX. Tradicionalmente, las normales climatológicas se han
centrado en el valor medio de un elemento climático durante un período de tiempo.
Los valores extremos de un elemento observado durante un período dado, así como
otros descriptores estadísticos de la distribución de frecuencias de un elemento, son
descriptores útiles del clima de un lugar y deberían incorporarse a los conjuntos de
datos de las normales.
Muchos SMHN calculan normales diarias junto con normales mensuales y
anuales. Aunque no sean un requisito de la OMM, las normales diarias ilustran la
evolución no aleatoria de las variaciones diarias de un elemento que no puede ser
36
captada mediante normales mensuales (AquijeRodríguez, Puma Reyes Bernardo,
& Bazalar Guiazada, 2010, pág. 39).
➢ Periodo de calculo
Para la evaluación de la variabilidad del clima a extenso plazo y el seguimiento
del calentamiento global es necesario un lapso de alusión subjetivamente estable.
Históricamente, las normales climatológicas estándares se calculaban cada 30 años
por períodos de 30 años (1901 a 1930, 1931 a 1960, 1961 a 1990, etc.). Para el
propósito concreto de examinar el clima a extenso plazo, las normales calculadas
para el lapso comprendido entre el 1 de enero de 1961 y el 31 de diciembre de 1990
se piensan un lapso de alusión estable de la OMM, que debe seguir estando
indefinidamente o hasta que exista un fundamento científico de peso para
cambiarlo, Sin embargo, en el entorno de un clima cambiante se requieren además
cálculos más comunes de las normales climatológicas. Ejemplificando, se han
calculado conjuntos de datos de temperatura internacionales como anomalías a
partir del lapso de alusión de 1961 a 1990. La utilización de un lapso de
premediación más existente, como el de 1981 a 2010, optimización la “exactitud
predictiva” respecto de recursos que presentan una tendencia secular (es
mencionar, una vez que los valores de la serie temporal presentan un crecimiento
y bajón sistemático en sus mediciones a extenso plazo). Además, varios usuarios
podrían tener en cuenta las tradicionales de 1981 a 2010 más "recientes" que las de
1961 a 1990. Las normales climatológicas estándares se calculan cada 10 años por
períodos de 30 años inicialmente de cada década, desde el año que finaliza en el
dígito 1 (1981 a 2010, 1991 a 2020, etcétera.). La ejecución de un nuevo cálculo
de los clásicos cada 10 años necesita además volver a calcular varios conjuntos de
datos que usan las típicos como alusión (grados-día, desviaciones de los valores
37
tradicionales, etcétera.). La informática actualizada y los sistemas de bases de datos
cada vez más perfeccionados deberían ayudar a que estos cálculos resulten
subjetivamente sencillos.
➢ Estaciones para las que se calculan normales y promedios
Las normales y los promedios del clima deberían calcularse para una gama de
estaciones tan amplia como sea posible, a condición de que las estaciones cumplan
las normas relativas al volumen y completitud de los datos disponibles. De ser
posible, deberían calcularse, como mínimo, para todas las estaciones cuyos datos
se distribuyen por el Sistema Mundial de Telecomunicación.
➢ Homogeneidad de datos
En el tamaño de lo viable, los datos usados para calcular las tradicionales y los
promedios climáticos deberían ser homogéneos. El asunto de la homogeneidad se
aborda más detalladamente en el siguiente capitulo. En el entorno de las habituales
y los promedios del clima, los puntos sobre la homogeneidad que necesitan
particular atención son los cambios de emplazamiento; los cambios en el método
de observación, en especial, en la hora de observación; los cambios en los tipos de
artefactos; los cambios en la exposición de las herramientas a lo extenso del tiempo,
y los cambios en el proceso de datos. En la práctica, son bastantes los sitios en los
cuales no va a ser viable entablar un grupo de datos con la homogeneidad correcta.
En vez de ello, va a ser primordial llevar a cabo típicos a partir de una conjunción
de 2 o más piezas de un registro no homogéneo. Una alternativa viable se apoya en
38
meter ajustes en la parte más vieja de un registro para realizarlo lo más homogéneo
viable con los datos más recientes.
Ilustración 29 Anomalías de la temperatura media mundial, con respecto al

período de referencia de 1850 a 1900 para los cinco conjuntos de datos mundiales
(por cortesía del Centro Hadley de la Oficina Meteorológica del Reino Unido)
➢ Datos faltantes
Las normales que se calculan sobre la base de conjuntos de datos incompletos
pueden estar distorsionadas. Ejemplificando, si a lo largo de un definido lapso, un
año ha sido especialmente gélido, una habitual calculada sin datos de dicho año
podría ser mayor a una habitual en la que sí se tomó en cuenta dicho año. Como
suele haber bastante autocorrelación en los datos climatológicos, la ausencia
consecutiva de visualizaciones puede tener una más grande consecuencia en las
tradicionales que la ausencia del mismo número de visualizaciones repartidas
aleatoriamente a lo largo del lapso en cuestión.
En forma de orientación, las habituales o medias de un lapso deberían calcularse
solo una vez que se encuentren accesibles los valores de por lo menos un 80 % de
los años registrados y no falten los valores de bastante más de 3 años continuos. Si
tras un lapso prolongado sin datos se dispone de un grupo de datos bastante
39
completo, puede optarse por calcular una media de lapso usando solo datos que
corresponden a los años posteriores a la interrupción del registro.
Las normales o promedios anuales deberían calcularse como la media o la suma
(según proceda) de las 12 tradicionales o promedios mensuales, sin considerar la
distinto duración de los meses. En el cálculo de las tradicionales anuales no tienen
la posibilidad de faltar las tradicionales de ningún mes. Se propone no calcular un
costo mensual si faltan bastante más de 10 valores cotidianos o 5 o más valores
cotidianos continuos. En la situación de recursos en los cuales el costo mensual es
la suma de los valores cotidianos en vez de un costo medio (por ejemplo, la lluvia
o la insolación), un costo mensual solo debe calcularse si se dispone de cada una
de las visualizaciones cotidianas o si se integran.
➢ Temperatura media diaria
Hay varios procedimientos para calcular la temperatura media diaria. Entre
ellos, cabe citar los que emplean una máxima y una mínima cotidianas,
visualizaciones efectuadas 24 horas al día, visualizaciones sinópticas y
visualizaciones a determinadas horas en todo el día. La mejor aproximación
estadística de una media se consigue por medio de la adhesión de visualizaciones
sucesivas llevadas a cabo a lo extenso de un lapso de tiempo; cuanto más comunes
sean las visualizaciones, más precisa va a ser la media obtenida. Generalmente, las
consideraciones prácticas imposibilitan el cálculo de una media diaria desde varias
visualizaciones distribuidas uniformemente a lo largo de un lapso de 24 horas ya
que varios emplazamientos de observación no miden un componente
constantemente. Para hacer las comparaciones conviene usar un procedimiento de
proceso normalizado para cada una de las estaciones de todo el mundo y en el
mayor número de estaciones.
40
Cada una de las estaciones climatológicas ordinarias observan una temperatura
máxima y mínima diaria. Por consiguiente, el procedimiento que se sugiere para
calcular la temperatura media diaria es usar la media de las temperaturas máxima
y mínima cotidianas. Si bien este procedimiento no constituye la mejor
aproximación estadística, su uso sistemático posibilita conseguir el objetivo
comparativo de los clásicos. Un SMHN debe además calcular las medias cotidianas
usando otros procedimientos si ello posibilita entender mejor el clima de la nación.
➢ Quintiles de precipitación
Los quintiles de precipitación se utilizan para establecer una relación entre un
total de precipitación mensual observada y la distribución de frecuencias de valores
observada durante el período considerado para calcular las normales. No existe un
método aceptado universalmente para calcular los límites de los quintiles, y la
elección del método puede influir notablemente en los valores obtenidos. Sin
embrago, el procedimiento que se recomienda para calcular los límites es el que se
especifica a continuación.
a) Para cada mes, los 30 valores mensuales de la precipitación registrados
a lo largo del lapso normal de 30 años se indican en una lista en orden
ascendente. Luego, la lista se divide en 5 conjuntos de quintiles de 6
valores cada uno. El primer quintil tiene los 6 valores menores del mes
en cuestión que se han visto a lo largo del lapso de 30 años, el segundo
quintil los 6 valores menores siguientes, y de esta forma sucesivamente
hasta el quinto quintil, que tiene los 6 valores más altos.
b) El límite entre dos quintiles adyacentes se calcula como el promedio
entre el valor máximo de un quintil y el primer valor del siguiente. El
índice de quintiles es el número del quintil más bajo que contiene la
41
precipitación mensual en el mes considerado en el informe que se
prepara, con las siguientes reglas especiales:
✓ Si la precipitación es 0: utilícese el índice 0 si tal caso no ha
ocurrido durante el período de referencia; utilícese 1 si ha
ocurrido menos de 6 veces; utilícese 2 si ha ocurrido entre 7 y 12
veces; utilícese 3 si ha ocurrido entre 13 y 18 veces, y así
sucesivamente.
✓ Si la precipitación es menor que cualquier valor registrado
durante el período de referencia: utilícese el índice 0
(independientemente de si la precipitación es 0).
✓ Si la precipitación es mayor que cualquier valor registrado
durante el período de referencia: utilícese el índice 6.
42
III. Conclusiones
✓ Antes de describir o utilizar un conjunto de datos, debería comprobarse la exactitud

y validez de los mismos. La exactitud consiste en el carácter correcto de los datos,
mientras que la validez se refiere a la aplicabilidad de los datos a la finalidad para la
que se utilizarán los valores. El usuario de conjuntos de datos nunca debería suponer
sin confirmación que un conjunto de datos es exacto y válido, especialmente sin
disponer de la información pertinente del proceso de control de calidad aplicado
durante el montaje del conjunto de datos.
✓ En una repartición de frecuencias perfectamente simétrica con una moda, de la
misma forma que la repartición gausiana, los valores de la media, la mediana y la
moda van a ser exactamente los mismos. Si el reparto de frecuencias muestra un
sesgo hacia los valores altos (sesgo a la derecha), el costo mayor va a ser el de la
media, seguido por el de la mediana y después el de la moda. Esta sucesión se
invierte si el reparto de la frecuencia muestra un sesgo hacia los valores bajos (sesgo
a la izquierda). Estas interrelaciones y las propiedades de las medidas (tabla 4.1)
deberían tenerse presente continuamente que se elija una medida de tendencia
central para representar un grupo de datos.
✓ Cualquier serie de visualizaciones puede modelizarse por medio de funcionalidades
matemáticas que reproducen las visualizaciones. Se necesita actuar con cautela al
utilizar dichas técnicas debido a diversos motivos.El objetivo primordial de ajustar
una funcionalidad es juntar el reparto de las visualizaciones. Si el ajuste es aceptable,
con solo unos pocos límites, la funcionalidad sumaria de las visualizaciones debe
dar una explicación realista de los datos que sea compatible con los principios físicos
subyacentes en una forma suavizada que hace caso omiso de los errores en los datos.
Una finalidad secundaria del ajuste es explicar los datos en un entorno teórico que
sea lo suficientemente sencilla como para que logren hacerse deducciones
estadísticas. El sobreajuste de un modelo matemático puede ofrecer sitio a una
explicación no realista de los datos pues se ponderan bastante los errores en los datos
o los componentes aleatorios que son ajenos a los procesos sometidos a análisis. El
nivel de suavizamiento suele depender de la finalidad del uso de los datos y de las
cuestiones que está procurando de contestar el climatólogo.
43
IV. Referencias bibliográficas
Esparza Catalán , C. (2006). SERIES TEMPORALES . Guadalajara : Laboratorio de
estadistica.
Anonimo. (4 de Junio de 2012). Obtenido de
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/Tema2Cate.pdf
AquijeRodríguez, S., Puma Reyes Bernardo, D., & Bazalar Guiazada, K. (2010).
Caracterización del clima a partir de un conjunto de datos . Huacho :
UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN.
Atmósfera, C. d. (2008). Cambio climático en Argentina; tendencias y proyecciones. Buenos
Aires : Centro de Investigaciones del Mar y la Atmósfera.
Centro de Investigaciones del Mar y la Atmósfera. (2008). Cambio climático en Argentina;
tendencias y proyecciones. Buenos Aires : Centro de Investigaciones del Mar y la
Atmósfera.
Inzunza , J. (2008). METEOROLOGIA DESCRIPTIVA. UNIVERSIDAD DE
CONCEPCIÓN, 23.
Martinez Ortega, R., Tuya Pendás, L., Martínez Ortega, M., & Pérez Abreu, A. (2009). EL
COEFICIENTE DE CORRELACION DE LOS RANGOS DE SPEARMAN
CARACTERIZACION. Habanera de Ciencias Médicas, 6.
ORGANIZACION METEREOLOGICA MUNDIAL. (2018). Guía de prácticas
climatológicas. Ginebra: OMM.
Vinuesa, P. (2016). Tema 8 - Correlación: teoría y práctica. Ciudad de Mexico : Unam.
44
45

Monografia Caracterisacion

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Monografia Caracterisacion

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE CIENCIAS AGRARIAS

Escuela Académico Profesional de Ingeniería Ambiental

CARACTERIZACION DEL CLIMA APARTIR DE UN

Valdivia Longa Kevin Arnold

Edgar Darwin Diaz Mori

II. Contenido Temático .................................................................................................... 7

3) Base de Datos .......................................................................................................... 9

4) Evaluación de los conjuntos de datos .................................................................... 10

5) Visualización cualitativa de los datos .................................................................... 11

6) Descriptores cuantitativos sumarios de datos ........................................................ 12

➢ Modelación de datos de la distribución de frecuencias ................................ 13

➢ Medidas de tendencia central ......................................................................... 19

➢ Medidas de variabilidad .................................................................................. 22

➢ Medida del apuntamiento................................................................................ 24

➢ Correlación de Pearson y Correlación de Spearman ................................... 28

➢ Tablas de contingencia .................................................................................... 28

8) Series temporales ................................................................................................... 29

➢ Componentes de una serie temporal .............................................................. 31

➢ Clasificación descriptiva de las series temporales......................................... 33

9) Interpretación de las características sumarias del clima ........................................ 34

10) Normales ................................................................................................................ 36

➢ Periodo de calculo ............................................................................................ 37

➢ Estaciones para las que se calculan normales y promedios ......................... 38

➢ Datos faltantes .................................................................................................. 39

➢ Temperatura media diaria .............................................................................. 40

III. Conclusiones ............................................................................................................. 43

IV. Referencias bibliográficas ......................................................................................... 44

Ilustración 2Ojivas .............................................................................................................. 12

Ilustración 3Diagrama de cajas ........................................................................................... 12

Ilustración 4. Ejemplo de una presentación de datos mediante un diagrama de tallo y hojas.

hay, por ejemplo, dos observaciones de 25.............................................................................. 13

Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la

Ilustración 6 Distribución exponencial: describe los tiempos transcurridos entre fenómenos

a lo largo de un proceso en el que estos se producen continua e independientemente a un

ritmo medio constante. Se ha utilizado en el análisis de la cantidad de precipitación diaria .. 16

Ilustración 7. . Distribución de Weibull: describe los tiempos transcurridos entre

fenómenos a lo largo de un proceso en el que estos se producen continua e

independientemente a un ritmo variable. Se ha utilizado en el análisis de la velocidad del

Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer

modelos de valores extremos en una distribución ................................................................... 17

Ilustración 9. . Distribución lognormal: se utiliza cuando el logaritmo de una distribución

sigue la distribución normal, tal como la de las concentraciones de partículas de

contaminación atmosférica ...................................................................................................... 17

Ilustración 10 Distribución gamma: indica las distribuciones que están delimitadas en un

extremo y son asimétricas, como los datos sobre la precipitación .......................................... 17

extremos, tales como la nubosidad .......................................................................................... 18

Ilustración 13Medidas de variabilidad ................................................................................ 23

Ilustración 14Medida de simetría ........................................................................................ 24

Ilustración 15Medidas del apuntamiento ............................................................................ 25

Ilustración 16Correlación .................................................................................................... 27

Ilustración 17Correlación positiva ...................................................................................... 27

Ilustración 18Correlación negativa ..................................................................................... 28

Ilustración 19CORRELACIÓN DE SPEARMAN ............................................................. 28

Ilustración 20CORRELACIÓN DE PEARSON ................................................................. 28

Ilustración 21Tabla de contingencia de accidentes en carreteras ........................................ 29

Ilustración 22Diagrama de dispersión con una correlación positiva fuerte ........................ 31

Ilustración 23Tendencia ...................................................................................................... 32

Ilustración 24Variación estacional ...................................................................................... 32

Ilustración 25Componente aleatoria ................................................................................... 33

Ilustración 26Serie temporal estacionaria ........................................................................... 33

Ilustración 27Serie temporal no estacionaria ...................................................................... 34