Está en la página 1de 45

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE CIENCIAS AGRARIAS

Escuela Académico Profesional de Ingeniería Ambiental

Monografía

CARACTERIZACION DEL CLIMA APARTIR DE UN

CONJUNTO DE DATOS

Presentado por:

Valdivia Longa Kevin Arnold

DOCENTE:

Edgar Darwin Diaz Mori

CURSO:

Climatología

Celendín - Cajamarca

2022

1
I. Contenido

I. Contenido ........................................................................................................................ 2

I. Introducción .................................................................................................................... 6

II. Contenido Temático .................................................................................................... 7

1) Climatología ............................................................................................................ 7

2) Historia .................................................................................................................... 8

3) Base de Datos .......................................................................................................... 9

4) Evaluación de los conjuntos de datos .................................................................... 10

5) Visualización cualitativa de los datos .................................................................... 11

6) Descriptores cuantitativos sumarios de datos ........................................................ 12

➢ Modelación de datos de la distribución de frecuencias ................................ 13

➢ Medidas de tendencia central ......................................................................... 19

➢ Medidas de variabilidad .................................................................................. 22

➢ Medida del apuntamiento................................................................................ 24

➢ Índices ............................................................................................................... 25

7) Correlación ............................................................................................................ 26

➢ Correlación de Pearson y Correlación de Spearman ................................... 28

➢ Tablas de contingencia .................................................................................... 28

29

8) Series temporales ................................................................................................... 29

➢ Componentes de una serie temporal .............................................................. 31

➢ Clasificación descriptiva de las series temporales......................................... 33

2
Se clasifican en 2: ...................................................................................................... 33

9) Interpretación de las características sumarias del clima ........................................ 34

10) Normales ................................................................................................................ 36

➢ Periodo de calculo ............................................................................................ 37

➢ Estaciones para las que se calculan normales y promedios ......................... 38

➢ Homogeneidad de datos................................................................................... 38

➢ Datos faltantes .................................................................................................. 39

➢ Temperatura media diaria .............................................................................. 40

➢ Quintiles de precipitación................................................................................ 41

III. Conclusiones ............................................................................................................. 43

IV. Referencias bibliográficas ......................................................................................... 44

3
Ilustración 1 Distribución de frecuencias (histograma) y Distribución de frecuencias

acumulativas ............................................................................................................................ 12

Ilustración 2Ojivas .............................................................................................................. 12

Ilustración 3Diagrama de cajas ........................................................................................... 12

Ilustración 4. Ejemplo de una presentación de datos mediante un diagrama de tallo y hojas.

El dígito inicial del valor de una observación es el tallo y el dígito final es la hoja. En la tabla

hay, por ejemplo, dos observaciones de 25.............................................................................. 13

Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la

propiedad.................................................................................................................................. 16

Ilustración 6 Distribución exponencial: describe los tiempos transcurridos entre fenómenos

a lo largo de un proceso en el que estos se producen continua e independientemente a un

ritmo medio constante. Se ha utilizado en el análisis de la cantidad de precipitación diaria .. 16

Ilustración 7. . Distribución de Weibull: describe los tiempos transcurridos entre

fenómenos a lo largo de un proceso en el que estos se producen continua e

independientemente a un ritmo variable. Se ha utilizado en el análisis de la velocidad del

viento........................................................................................................................................ 16

Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer

modelos de valores extremos en una distribución ................................................................... 17

Ilustración 9. . Distribución lognormal: se utiliza cuando el logaritmo de una distribución

sigue la distribución normal, tal como la de las concentraciones de partículas de

contaminación atmosférica ...................................................................................................... 17

Ilustración 10 Distribución gamma: indica las distribuciones que están delimitadas en un

extremo y son asimétricas, como los datos sobre la precipitación .......................................... 17

Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en ambos

extremos, tales como la nubosidad .......................................................................................... 18

4
Ilustración 12 Relaciones entre la media, la mediana y la moda ........................................ 21

Ilustración 13Medidas de variabilidad ................................................................................ 23

Ilustración 14Medida de simetría ........................................................................................ 24

Ilustración 15Medidas del apuntamiento ............................................................................ 25

Ilustración 16Correlación .................................................................................................... 27

Ilustración 17Correlación positiva ...................................................................................... 27

Ilustración 18Correlación negativa ..................................................................................... 28

Ilustración 19CORRELACIÓN DE SPEARMAN ............................................................. 28

Ilustración 20CORRELACIÓN DE PEARSON ................................................................. 28

Ilustración 21Tabla de contingencia de accidentes en carreteras ........................................ 29

Ilustración 22Diagrama de dispersión con una correlación positiva fuerte ........................ 31

Ilustración 23Tendencia ...................................................................................................... 32

Ilustración 24Variación estacional ...................................................................................... 32

Ilustración 25Componente aleatoria ................................................................................... 33

Ilustración 26Serie temporal estacionaria ........................................................................... 33

Ilustración 27Serie temporal no estacionaria ...................................................................... 34

Ilustración 28 Serie temporal de la temperatura media de marzo ....................................... 36

Ilustración 29 Anomalías de la temperatura media mundial, con respecto al período de

referencia de 1850 a 1900 para los cinco conjuntos de datos mundiales (por cortesía del

Centro Hadley de la Oficina Meteorológica del Reino Unido) ............................................... 39

5
I. Introducción

Todos los años se van agregando más datos a los archivos climatológicos de los Servicios

Meteorológicos e Hidrológicos Nacionales (SMHN). Los climatólogos tienen que ser capaces

de manifestar toda la información pertinente contenida en los datos usando un número

subjetivamente diminuto de valores conseguidos por medio de una secuencia de

procedimientos estadísticos. Una vez que se eligen y se utilizan cuidadosamente, los procesos

estadísticos tienen la posibilidad de diferenciar y poner de relieve información pertinente

contenida en los datos.

La presente monografía se va basar en la estadística detallada, herramienta usada para

abreviar las características de un enorme volumen de datos de forma comprensible. Varios de

los procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con pcs

para procesar y exponer datos. No obstante, se necesita advertir de los riesgos de una aplicación

bastante mecánica de los procedimientos de estudio automáticos, ya que es bastante simple

usar inadecuadamente los métodos e interpretar de manera errónea los resultados. Si bien la

utilización de pcs comporta ventajas incuestionables, existe el peligro de que las suposiciones

implícitas de la mayor parte de los programas informáticos de estudio no se consideren o no se

expresen evidentemente, lo cual puede conllevar a resultados erróneos.

Aquí nos vamos a centrar en procedimientos estadísticos y debe consultarse conjuntamente

con el presente capítulo. Los dos poseen por objeto explicar conceptos básicos en vez de

especificar detalles de temas complicados. Las referencias que figuran finalmente del capítulo

y los libros de escrito sobre teoría y procedimientos estadísticos ofrecen información más

detallada.

6
II. Contenido Temático

1) Climatología

La climatología consiste en el estudio del clima, el funcionamiento del sistema


climático, sus variaciones y extremos y su influencia en diversas actividades, entre ellas
los recursos hídricos y la salud, la seguridad y el bienestar humanos. En sentido estricto,
se entiende por clima las condiciones meteorológicas normales correspondientes a un
lugar y período de tiempo determinados. El clima puede explicarse mediante
descripciones estadísticas de las tendencias centrales y la variabilidad de elementos
pertinentes como la temperatura, la precipitación, la presión atmosférica, la humedad y
los vientos, o mediante combinaciones de elementos, tales como tipos y fenómenos
meteorológicos, que son característicos de un lugar o región, o la Tierra en su conjunto,
durante cualquier período de tiempo. Además de tratar el clima como una entidad
estadística, también se puede estudiar como un factor determinante de las actividades
humanas, o como un recurso o un riesgo para estas últimas.

La climatología estudia tanto la variabilidad del clima como el calentamiento global.


La variabilidad del clima tiene relación con las variaciones de las condiciones
climáticas entre períodos. En general, la variabilidad del clima está relacionada con las
variaciones que están afectando al estado de la circulación atmosférica y oceánica En
oposición, el calentamiento global tiene relación con un cambio sistemático en las
características estadísticas del clima (por ejemplo, la media y la varianza) mayoría de
la historia climática de la Tierra, los cambios sistemáticos del clima se produjeron por
razones naturales, como variaciones en relación con la naturaleza de la órbita de la
Tierra (ORGANIZACION METEREOLOGICA MUNDIAL, 2018, pág. 1).

El clima es algo que nos ha preocupado desde la antigüedad. Del clima dependían
las migraciones de los animales, el crecimiento de los frutos y más tarde, la buena
marcha de las cosechas. Por ello, desde la época de las cavernas el hombre se ha
preocupado por el medio que le rodeaba y los cambios que éste sufría. Sin embargo, en
aquellos primeros tiempos, el conocimiento del medio era más práctico e instintivo que
sistemático. No es hasta la época de Aristóteles (384 – 322 AC) en que encontramos
referencias explícitas a algún estudio sobre la atmósfera y sus fenómenos, un primer
paso para comenzar a sistematizar el estudio del clima del planeta. A partir de entonces,

7
los estudios sobre el clima y sus fenómenos comienzan a hacerse más regulares: en el
año 230 AC ya se conocía la existencia de los tres estados del agua -hielo, líquido y
vapor- y se había comenzado a establecer una relación entre ellos (Inzunza , 2008, pág.
1 y 2).

2) Historia

En los poemas de la vieja Grecia y en el Antiguo Testamento de la Biblia

judeocristiana ya podían hallarse referencias al tiempo. Aparecen referencias todavía

más viejas en los Vedas, las escrituras hindúes más viejas, que fueron escritas alrededor

de en 1800 a. C. Asimismo, tienen la posibilidad de hallarse escritos específicos sobre

el asunto de la meteorología y la climatología en la obra Sobre los aires, aguas y sitios

de Hipócrates, que data de alrededor del año 400 a. C., seguida por Acerca del cielo:

Meteorológicos, de Aristóteles, redactada hacia el año 350 a. C. Para los primeros

filósofos griegos, el clima significaba "pendiente" y se refería a la curvatura del área de

la Tierra, la cual da sitio a la alteración del clima de acuerdo con la latitud gracias a la

incidencia cambiante de los relámpagos del Sol. En la obra de los filósofos Aristarco y

Eratóstenes, de Alejandría, se indican deducciones lógicas y fiables relativas al clima.

En 1735, George Hadley es el primero en interpretar el sistema de circulación vista

que vincula a las regiones tropicales y subtropicales, en especial, los vientos alisios, la

convección tropical y los desiertos subtropicales, que, desde entonces, inició a

conocerse como la celda de Hadley. Julius von Hann, quien divulgó el primero de los 3

volúmenes de su Manual de Climatología en 1883, redactó la obra típica sobre

climatología general y regional, que comprendía datos y descripciones de testigos

presenciales referentes al tiempo y el clima. En 1918, Wladimir Kóppen elaboró la

primera categorización descriptiva de los climas de todo el mundo de consenso con la

cubierta vegetal del suelo. A esta tarea le siguieron estudios más detallados en el entorno

8
de la climatología detallada. Ejemplificando, el geógrafo E. E. Federov (1927) intentó

explicar los climas locales atendiendo a visualizaciones meteorológicas cotidianas.

Entre otras obras relevantes sobre climatología cabe resaltar la de Tor Bergeron

(sobre climatología dinámica, publicada en 1930) y la de Wladimir Kóppen y Rudolf

Geiger, quienes publicaron un manual de climatología en 1936. Geiger describió hasta

cierto punto el término de micro climatología por primera ocasión en 1927, empero los

progresos en este campo no se produjeron hasta la Segunda Guerra Mundial. Por

motivos de idealización, a lo largo de la guerra nació la necesidad de hallar un

procedimiento para decidir la posibilidad de peligros basándose en datos

meteorológicos relativos a meses e inclusive años futuros y dicho procedimiento se

puso en práctica. En 1948, C.W. Thornthwaite estableció una categorización del clima

basada en un inventario hídrico y la evapotranspiración. En los decenios posteriores, se

observaron relevantes progresos en el desarrollo de las teorías sobre la climatología.

3) Base de Datos

Acá veremos sobre la descripción de las características de la Base de Datos

climáticos elaborada. La Base de Datos forma un soporte informático que puede

almacenar y colocar a disposición abierta publica, información climática relevante para

los estudios sobre el cambio climático la cual se realizara en un futuro en el marco de

la 3ra Comunicación Nacional sobre el Cambio Climático.

Nos centraremos en la estadística descriptiva, herramienta usada para abreviar las

características de un enorme volumen de datos de forma comprensible. Varios de los

procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con

computadoras para procesar y exponer datos. No obstante, se necesita advertir de los

riesgos de una aplicación bastante mecánica de los procedimientos de estudio

9
automáticos, ya que es bastante simple usar inadecuadamente los métodos e interpretar

de manera errónea los resultados. Si bien la utilización de computadoras comporta

ventajas incuestionables, existe el peligro de que las suposiciones implícitas de la mayor

parte de los programas informáticos de estudio no se consideren o no se expresen

precisamente, lo cual puede conllevar a resultados equivocados.

4) Evaluación de los conjuntos de datos

Un grupo de datos se basa en una recopilación de visualizaciones de recursos. Una

observación es una sola estimación de determinada porción. Las visualizaciones básicas

consisten en, ejemplificando, la lectura de un termómetro o del grado de agua en un

pluviómetro. Otras visualizaciones son más complicadas. Ejemplificando, la obtención

de la presión barométrica de un barómetro de mercurio involucra hacer visualizaciones

tanto de la longitud de la columna de mercurio como de la temperatura del barómetro.

La presión se estima como una sola observación.

Ciertos recursos son consecutivos, o sea, no hay discontinuidades en el estado del

fenómeno visto, de la misma forma que la temperatura del viento. Otros recursos, como

la precipitación, no son seguidos, y además hay otros que no tienen valores

cuantitativos, sino solo una categoría detallada, de la misma forma que un tipo de nube

o las condiciones meteorológicas reinantes. La población constituye todos los valores

probables de un componente. Si un componente es constante, la población va a ser en

teoría infinita. Si el factor no es constante, la población se apoya en todos los valores

específicos que puede tener el componente en los parámetros establecidos por el

analista.

Una muestra es un grupo de visualizaciones poblacional, que se toma para

representar a toda la población. Los conjuntos de datos son muestras. Cuanto más

10
grande sea la muestra, más precisa va a ser la estimación de las propiedades descriptivas

poblacional. Buena parte de la climatología se ocupa del análisis de muestras, empero

el analista debería reconocer que un grupo de datos podría ser representativo de solo

una sección poblacional. La predominación, por ejemplo, de la carencia de

homogeneidad, la dependencia del tiempo y las variaciones en el espacio complican la

interpretación de lo cual representa el grupo de datos (ORGANIZACION

METEREOLOGICA MUNDIAL, 2018).

5) Visualización cualitativa de los datos

Varias de las propiedades primordiales que se acostumbran buscar en un grupo de

datos son el costo medio o típico, la expansión o gama de las visualizaciones, la realidad

de visualizaciones inesperadas, la forma en la que las visualizaciones se desvían de cada

lado del costo medio y la aglutinación de las visualizaciones. Sin una organización

sistemática, no es viable interpretar monumentales volúmenes de datos para descubrir

estas y propiedades semejantes. El primer paso es entender los datos de forma general

por medio de la visualización del reparto de los valores vigilados.

Hay muchas formas de exponer los datos para obtener una apreciación cualitativa

de lo que los datos revelan al climatólogo. Una forma de acomodar un grupo de datos

radica en ordenar las visualizaciones por intensidad ascendente y descendente. Las

visualizaciones ordenadas tienen la posibilidad de entonces manifestarse gráficamente

o como un cuadro, debido a lo que se realizan evidentes varias propiedades, como por

ejemplo los valores extremos y la gama. Una segunda forma de ordenar un grupo de

datos es agrupar los datos en intervalos. Se efectúa un conteo del número de

visualizaciones en cada intervalo. Una visualización del número de casos o el

porcentaje del número total de visualizaciones en cada intervalo da una indicación

instantánea de la manera de el reparto de los valores poblacional y obtiene el nombre

11
de repartición de frecuencias o histograma. El número de intervalos es arbitrario y la

visualización del reparto en un gráfico se ve afectada por el número de intervalos.

Parte de la información contenida en el grupo de datos originales se pierde una vez

que las visualizaciones son agrupadas y, generalmente, cuantos menos intervalos se

hagan, más grande va a ser la pérdida.

Ilustración 1 Distribución de frecuencias (histograma) y Distribución de frecuencias acumulativas

Ilustración 3Ojivas Ilustración 2Diagrama de cajas

6) Descriptores cuantitativos sumarios de datos

En vez de exponer el grupo de datos completo para ilustrar una característica

concreta, comúnmente, es eficaz sustraer numerosas medidas de resumen

cuantitativas. Las medidas de resumen ayudan a explicar pautas de alteración de las

visualizaciones. Si se entienden dichas pautas, va a ser viable agrandar los

12
conocimientos sobre los procesos físicos que subyacen a las visualizaciones e inferir

mejor las condiciones climáticas pasadas y presentes. Debería tenerse buen cuidado

de que los contenidos de un grupo de datos que se hayan resumido por medio de

medidas cuantitativas sean en realidad equiparables. Ejemplificando, una serie de

visualizaciones de la temperatura tienen la posibilidad de ser equiparables si cada

una de se miden con los mismos artefactos, paralelamente todos los días, en el mismo

sitio y con los mismos métodos. Si cambian los métodos, tienen la posibilidad de

introducirse variaciones artificiales en el grupo de datos. Algunas veces, los

descriptores sumarios de un grupo de datos detectan variaciones imprevistas; cada

una de las pautas imprevistas deberán examinarse para establecer si son provocadas

artificialmente o son efectos reales del sistema climático.

Ilustración 4. Ejemplo de una presentación de datos mediante un diagrama de tallo


y hojas. El dígito inicial del valor de una observación es el tallo y el dígito final es la
hoja. En la tabla hay, por ejemplo, dos observaciones de 25

➢ Modelación de datos de la distribución de frecuencias

Aquí tenemos la posibilidad de recopilar los datos de una forma estructurada y

estructural, en cual se usan tablas para recolectar estos datos y con ellos poder

hacer un estudio más descriptivo. Este procedimiento se utiliza usualmente con un

sistema de administración de base de datos, en las cuales tenemos la posibilidad de

agrupar los datos en una repartición de frecuencia y dichos datos tienen la

posibilidad de detectar de numerosas modalidades dependiendo de cómo se

13
relacionen con otros datos (AquijeRodríguez, Puma Reyes Bernardo, & Bazalar

Guiazada, 2010, pág. 8).

Tipos de modelados de datos:

- Modelo de datos conceptuales

- Modelo de datos logísticos

- Modelos de datos físicos

Las observaciones de datos, dan una perspectiva cualitativa de la composición

de una secuencia de visualizaciones. Las maneras y las pautas resultan evidentes.

Las distribuciones de frecuencias tienen la posibilidad de clasificarse según su

forma en:

• curvas simétricas unimodales: estas curvas se aplican comúnmente para los

promedios de los recursos, como la temperatura media anual y a más extenso plazo.

En la mayor parte de los casos, cuanto más extenso sea el lapso de premediación,

más simétrica va a ser el reparto;

• curvas moderadamente asimétricas unimodales: muchas curvas de datos

promediados son principalmente (pero no del todo) simétricas.

• curvas bastante asimétricas unimodales: estas maneras no son nada simétricas y

presentan un alto nivel de desviación; son usuales para las porciones de precipitación

y velocidades del aire.

• curvas a modo de U: estas curvas son usuales para recursos que poseen

parámetros bilaterales, como por ejemplo la parte de nubosidad (hay más grande

tendencia de que los cielos estén mayormente despejados o mayormente cubiertos).

14
• curvas multimodales o complicadas: estas curvas son usuales para los recursos

vigilados diariamente en regiones con marcados contrastes estacionales. En tal

caso, la curva de repartición de frecuencias desarrollada usando el grupo de datos

enteros puede tener una forma bimodal bastante característica. Posiblemente es

más simple entender los conjuntos de datos con distribuciones de frecuencias

bastante complicadas por medio de una estratificación de datos a priori para reflejar

los diferentes procesos subyacentes.

Un método para resumir la distribución de un conjunto de observaciones

consiste en ajustar una distribución de probabilidad a las observaciones. Estas

distribuciones son funciones con propiedades matemáticas conocidas que se

caracterizan por un reducido número de parámetros (normalmente no más de tres).

Las funciones siempre se construyen de modo que las magnitudes relativas de los

diferentes valores reflejen diferencias en las probabilidades relativas de observar

dichos valores. Varias distribuciones de probabilidad comunes, como la

distribución normal (o gausiana) y la distribución de valores extremos

generalizada, permiten describir situaciones que ocurren a menudo en la naturaleza.

Si es posible describir una frecuencia observada o una distribución de frecuencias

condicional mediante estas funciones conocidas de densidad de probabilidad, las

propiedades y las relaciones pueden utilizarse para analizar los datos y hacer

deducciones probabilísticas y estadísticas. En las figuras 5 a 11 se muestran algunos

ejemplos de funciones de densidad de probabilidad que pueden aproximarse a

distribuciones de frecuencias observadas de datos continuos (en las que puede

observarse cualquier valor en una serie continua) (ORGANIZACION

METEREOLOGICA MUNDIAL, 2018, pág. 70).

15
Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la
propiedad

Ilustración 6 Distribución exponencial: describe los tiempos transcurridos entre


fenómenos a lo largo de un proceso en el que estos se producen continua e
independientemente a un ritmo medio constante. Se ha utilizado en el análisis de la
cantidad de precipitación diaria

Ilustración 7. . Distribución de Weibull: describe los tiempos transcurridos


entre fenómenos a lo largo de un proceso en el que estos se producen continua e
independientemente a un ritmo variable. Se ha utilizado en el análisis de la
velocidad del viento

16
Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer
modelos de valores extremos en una distribución

Ilustración 9. . Distribución lognormal: se utiliza cuando el logaritmo de una


distribución sigue la distribución normal, tal como la de las concentraciones de
partículas de contaminación atmosférica

Ilustración 10 Distribución gamma: indica las distribuciones que están


delimitadas en un extremo y son asimétricas, como los datos sobre la
precipitación

17
Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en
ambos extremos, tales como la nubosidad

La precisión con la que una funcionalidad sumaria explica las visualizaciones

puede determinarse analizado las diferencias existentes en medio de las

visualizaciones y los valores conseguidos de la funcionalidad. Deberían efectuarse

pruebas objetivas de la calidad del ajuste. En la mayoría de los casos, los conjuntos

de datos tienen la posibilidad de modelizar con bastante más de una funcionalidad,

y las medidas logradas en las pruebas tienen la posibilidad de compararse para

buscar el ajuste más correcto o más eficaz. Comúnmente, se usan las pruebas de

chi-cuadrado y Kolmogorov-Smirnov. La calidad de ajuste definida por la primera

implica que los valores de los datos son discretos e independientes (ninguna

observación se ve afectada por otra observación). Si la suma de los cuadrados de

las diferencias existentes en medio de las frecuencias observadas y las ajustadas

excede un umbral que es dependiente del tamaño de la muestra, el ajuste debe

considerarse inadecuado. Esta prueba es sensible al número de intervalos. La

prueba Kolmogorov-Smirnov parte de la conjetura de que si la máxima diferencia

absoluta entre 2 frecuencias acumulativas sucesivas de visualizaciones

independientes es más grande que un costo crítico, posiblemente las distribuciones

sean diferentes. Esta prueba es eficaz si el grupo de datos tiene un alto número de

18
visualizaciones (ORGANIZACION METEREOLOGICA MUNDIAL, 2018, pág.

75).

➢ Medidas de tendencia central

Son parámetros estadísticos que lo que busca es poder resumir en un solo valor

a todo un conjunto de valores e informar sobre el centro de distribución de la

muestra o la población estadística (AquijeRodríguez, Puma Reyes Bernardo, &

Bazalar Guiazada, 2010, pág. 9). Algunas de las medias de tendencia central más

utilizadas son:

- La moda

-La media

-La mediana

Las visualizaciones tienden a aglutinarse alrededor de un costo especial. Las

medidas de tendencia central poseen por objeto indicar un costo central alrededor

del que tienden a agruparse los datos. Las medidas de tendencia central no

sustituyen toda la información descriptiva contenida en el grupo de visualizaciones

completo. Comúnmente, el cálculo de una sola medida resulta inadecuado para

explicar la forma en la que tienden a concentrarse los datos pues no toma en

importancia la alteración de las visualizaciones. Cualquier medida de tendencia

central debe efectuarse junto con una medida del nivel de alteración de los valores

de las observaciones de las que se deriva la tendencia central.

La media aritmética, llamada usualmente “promedio”, es una de las estadísticas

más muchas veces usadas en climatología. Se calcula dividendo sencillamente la

suma de los valores entre el número de valores. En la situación de las

visualizaciones que tiendan a aglutinarse en torno al costo central, la media

19
representa un número hacia el que convergería el promedio de una serie temporal

de visualizaciones bastante extensa u otros conjuntos de datos de enorme volumen

a medida que el número de valores de datos vaya incrementando. La media no es

representativa de la tendencia central de distribuciones demasiado asimétricas.

Una media ponderada se calcula asignando distinto grado de trascendencia a las

diversas visualizaciones de forma que, ejemplificando, las visualizaciones más

fiables o más representativas tengan una más grande predominación en el cálculo

de la media. Hay varios procedimientos para establecer las ponderaciones. Un caso

muestra común es la ponderación de las distancias, en la que las ponderaciones

permanecen inversamente en relación con una medida de distancia.

Ejemplificando, la ponderación de la distancia se utiliza comunmente al estimar un

costo medio representativo de un espacio concreto desde visualizaciones

efectuadas en una zona circundante a aquel sitio. Generalmente, las ponderaciones

son colaboraciones matemáticas que tienen la posibilidad de carecer de interacción

inherente con los procesos físicos que se miden, empero, constantemente que sea

viable, en la votación de los procedimientos de ponderación se debe intentar de

tener en cuenta los principios físicos. Por lo general, los procedimientos de

ponderación otorgan buen resultado una vez que tanto las características físicas

como las estadísticas varían siempre y bastante muy lento en el espacio y la era

examinados.

La mediana es el punto medio de una repartición de frecuencias acumulativas;

la mitad de los datos permanecen por arriba de la mediana y la otra mitad por abajo.

Se calcula ordenando los datos y seleccionando el costo del medio. Si el número

de valores es impar, la mediana es el costo del medio. Si el número de valores es

par, la mediana se encuentra entre ambos valores del medio, principalmente, como

20
la media (o la media ponderada) de ambos. Si ambos valores del medio son

idénticos, se elige este costo como mediana.

Las variaciones extremas influyen menos en la mediana que en la media ya que

la mediana es una medida de postura. Pues la mediana se fundamenta en el número

de visualizaciones, la intensidad de las visualizaciones extremas no influye en la

mediana. La mediana es en especial eficaz una vez que las visualizaciones tienden

a agruparse en torno al centro, empero varias de las visualizaciones además son

muy elevadas o bastante bajas. Como en la situación de la media, la mediana no

representa bien datos que no se agrupan alrededor del costo central.

La moda es el costo que surge con más frecuencia en el grupo de datos. Al igual

que la mediana, la moda es una medida posicional. No se ve afectada ni por el costo

(como le pasa a la media) ni por la postura de otras visualizaciones (como le pasa

a la mediana). Las modas de muestras pequeñas o de muestras que poseen bastante

más de una agrupación de visualizaciones son estimaciones no fiables de la

tendencia central. Si muchas de las concentraciones de las visualizaciones son

realmente típicas (distribución multimodal), es factible que el grupo de datos se

encuentre formado por componentes diferentes, todos los cuales tiene un costo

central distinto alrededor del que tienden a agruparse las visualizaciones. En la

situación de los recursos de carácter circular, como la dirección del aire, el término

de

Ilustración 12 Relaciones entre la media, la mediana y la moda

21
media puede ser ambiguo. Comúnmente, el costo modal, de la misma forma que la

dirección del aire dominante, es una medida más eficaz de la tendencia central para

recursos que se miden con la dirección.

➢ Medidas de variabilidad

Cuando se elija una estimación idónea de la tendencia central, es viable medir

la variabilidad de las visualizaciones particulares alrededor de aquel costo. El valor

de la medición de la alteración y su descripción es importante. No obstante, un

registro de tan solo unas escasas observaciones es insuficiente para estimar la

variabilidad.

La variabilidad puede medirse en términos absolutos o relativos. Es viable

minimizar la desviación de cada observación respecto de la tendencia central a un

costo que representa y posibilita explicar el grupo de datos en su integridad. Aquel

exclusivo número es la variabilidad absoluta.

El tamaño más sencillo de la variabilidad absoluta es el rango de

visualizaciones. El rango es la diferencia que existe entre los valores más elevados

y los valores más bajos. Aunque sea simple de calcular, el rango muestra muchas

restricciones. Si los valores extremos resultan muy escasos o no son parte del

grueso de las visualizaciones, el rango puede ser engañoso. El rango no da

información acerca del carácter del reparto de frecuencias en los parámetros

extremos. Además, prescinde casi enteramente del nivel de concentración de los

valores, y no caracteriza íntegramente el grupo de datos de una forma eficaz.

Tampoco es suficiente para estimar la confiabilidad de la tendencia central.

La desviación media es la media del costo absoluto de cada una de las

desviaciones de las diferentes visualizaciones respecto del tamaño de tendencia

22
central seleccionada. Si bien es viable calcular las desviaciones desde la media, la

mediana o la moda, en inicio, deberían calcularse a partir de la mediana, pues la

suma de las desviaciones absolutas respecto de la mediana es menor o igual que la

suma de la media o de la moda.

La desviación típica es la raíz cuadrada de la media del cuadrado de cada una

de las diversas desviaciones respecto de la media. Las desviaciones se toman desde

la media en lugar de la mediana o de la moda ya que la suma de los cuadrados de

la media es un mínimo. Si las desviaciones se elevan al cuadrado, existe una más

grande ponderación de las variaciones extremas. La desviación clásica se usa para

deducir muchas medidas estadísticas. Además, se utiliza extensamente como

porción normativa para normalizar diferentes distribuciones con el objeto de

establecer comparaciones.

Ilustración 13Medidas de variabilidad

➢ Medida de la simetría

La asimetría es una medida de la desviación respecto de la simetría. Es una

medida relativa y adimensional, por lo cual posibilita entablar comparaciones entre

conjuntos de datos. Una medida fácil de la asimetría se basa en la diferencia entre

la media y la moda, divida entre la desviación clásica. La asimetría es positiva una

vez que la media es más grande que la moda y negativa una vez que la moda es

23
más grande que la media. Además, se han definido otras medidas, como una basada

en el alcance intercuartil y la mediana.

La asimetría positiva es característica de ciertos conjuntos de datos acerca de la

precipitación que poseen un límite inferior de cero, empero un límite preeminente

ilimitado. Los conjuntos de datos relativos a la temperatura máxima diaria además

acostumbran exponer una tendencia hacia la asimetría positiva, sin embargo, las

temperaturas mínimas cotidianas constantemente muestran una tendencia hacia la

asimetría negativa

Ilustración 14Medida de simetría

➢ Medida del apuntamiento

Es viable que las distribuciones de frecuencias simétricas tengan diferentes

grados de aplastamiento en su parte central. La curtosis es un coeficiente

adimensional que da una medida relativa para hacer comparaciones del

aplanamiento o apuntamiento. La curtosis positiva sugiere un mayor reducido en

el interior del reparto de frecuencias y las frecuencias caen pronunciadamente hasta

valores bajos lejos de la media. Los valores negativos indican una zona central

plana y vasta y son particulares de muchas distribuciones meteorológicas, como la

humedad en altitud.

24
Con este parámetro se pretende medir el como se reparten las frecuencias

relativas de datos entre el centro y los extremos, toma como comparación la

campana de Gauss.

Tipos :

Leptocurtica

Mesocurtica

Platicurtica

Ilustración 15Medidas del apuntamiento

➢ Índices

Un índice tiene por objeto minimizar condiciones complicadas a un solo número

que mantiene cierto sentido físico y puede utilizarse para el seguimiento de un

definido proceso. Expresa la interacción en medio de las condiciones observadas y

las de alusión por medio de un solo costo. La alusión suele ser comúnmente, sin

embargo, no constantemente, el estado medio del clima. Ejemplo de eso es el índice

de gravedad de la sequía de Palmer, que es una comparación sumaria de un

complejo sistema de balance hídrico de precipitación, evaporación, escorrentía,

recarga y características del suelo con condiciones medias del clima. El desarrollo

de un índice consta de 4 elementos: la elección de los recursos que tienen que

incluirse en el índice; la votación y el cálculo de la alusión; Constantemente,

analizar y escoger los datos que se tienen que integrar en la índice resulta más difícil

que el cálculo del índice en sí. Una de las preocupaciones que implica la votación

de la alusión es que las propiedades de las visualizaciones usadas para definirla

tienen la posibilidad de modificar a lo extenso del tiempo; es importante que las

visualizaciones usadas sean homogéneas. Otra inquietud es que la alusión debe

25
representar condiciones habituales, usuales o esperadas, debido a que la mayor

parte de los usuarios de un índice suponen que la alusión representa dichas

condiciones. Al escoger la alusión, se debe tener buen cuidado de conceptualizar

explícitamente lo cual se va a equiparar y con qué finalidad. el procedimiento de

preparación del índice, y las ponderaciones o el valor de todos los elementos

incluidos

7) Correlación

La correlación es una medida de la relación (covariación) lineal entre dos

variables cuantitativas continuas (x, y). La manera más sencilla de saber si dos

variables están correlacionadas es determinar si co-varían (varían conjuntamente).

Es importante hacer notar que esta covariación no implica necesariamente

causalidad, la correlación puede ser fortuita, como en el caso clásico de la

correlación entre el número de venta de helados e incendios, debido al efecto de

una tercera variable, la temperatura ambiental (Vinuesa, 2016, pág. 2)

• Estas medidas se aplican a los valores al tomar dos variables distintas en cada uno

de los elementos de una respectiva muestra.

• En el caso de que ambas variables varían a la vez, es decir que si los valores de

una son más altos o bajos cuanto más altos o bajos son los de la otra.

• Si los valores de ambas variables aumentan o disminuyen a la vez, se le denomina

correlación es positiva.

• Pero cuando los valores de una variable aumentan siempre y cuando la otra

disminuyen, o viceversa, su correlación es negativa.

26
• Si las variables cambian de manera independiente una de la otra, no hay

correlación entre ellas.

Ilustración 16Correlación

❖ Correlación positiva

Cuando una relación entre una variable y otra es lineal y directa, de manera que

un cambio en una variable predice el cambio en la otra variable

Hay correlación positiva cuando las dos variables se correlacionan en sentido

directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e

igualmente con los valores bajos.

Ilustración 17Correlación positiva

❖ Correlación negativa

La relación entre una variable y otra es opuesta o inversa.

Entonces, hay correlación negativa cuando las dos variables se correlacionan en

sentido inverso.

27
Cuando una variable cambia, la otra se modifica hacia lo contrario. Al momento

que esta posee variables de valores altos, la otra posee valores bajos y mientras

este valor esté más cerca de -1, más evidente será esta covariación.

Ilustración 18Correlación negativa

➢ Correlación de Pearson y Correlación de Spearman

El coeficiente de correlación de Spearman es exactamente el mismo que el

coeficiente de correlación de Pearson, calculado sobre el rango de observaciones.

La correlación estimada entre X e Y se halla calculando el coeficiente de

correlación de Pearson para el conjunto de rangos apareados. La correlación de

Ilustración 19CORRELACIÓN DE Ilustración 20CORRELACIÓN DE PEARSON


SPEARMAN

Spearman puede ser calculada con la fórmula de Pearson (Martinez Ortega, Tuya

Pendás, Martínez Ortega, & Pérez Abreu, 2009)

➢ Tablas de contingencia

Una tabla de contingencia es una de las formas más comunes de resumir datos

categóricos.

28
En general, el interés se centra en estudiar si existe alguna asociación entre una

variable denominada fila y otra variable denominada columna y se calcula la

intensidad de dicha asociación.

De manera formal, se consideran X e Y dos variables categóricas con I y J

categorías respectivamente. Una observación puede venir clasificada en una de las

posibles I × J categorías que existen.

Cuando las casillas de la tabla contienen las frecuencias observadas, la tabla se

denomina tabla de contingencia, término que fue introducido por Pearson en 1904.

Una tabla de contingencia (o tabla de clasificación cruzada), con I filas y J

columnas se denomina una tabla I × J (Anonimo, 2012).

Ilustración 21Tabla de contingencia de accidentes en carreteras

8) Series temporales

Una serie temporal es una colección de observaciones de una variable realizadas

de forma secuencial en el tiempo, en las que el orden de observación es importante.

Los valores de una serie temporal van ligados a instantes de tiempo, de manera que

el análisis de una serie implica el manejo conjunto de dos variables; la variable en

estudio propiamente dicha y la variable tiempo ( Esparza Catalán , 2006, pág. 2)

Un gráfico de valores de datos trazado en funcionalidad del tiempo es una

fundamental herramienta cualitativa para decidir variaciones en relación con la era.

En la climatología, una tendencia es una característica interesante pues constituye

29
un resumen del comportamiento histórico de las visualizaciones de un componente.

En la mayor parte de los casos, se inspeccionan las tendencias lineales de una serie

temporal definida, sin embargo, algunas veces, podría ser mejor explicar una

tendencia en términos no lineales, como una curva, o inclusive un movimiento

abrupto hacia arriba o hacia debajo. Generalmente, las tendencias, ya sean lineales

o no, se mantienen en las series climáticas a lo extenso de un lapso limitado, que

podría ser bastante extenso. En todo el tiempo, en el sistema climático se han visto

muchas veces tendencias con una orientación, que, al final, termina por invertirse.

Lo cual podría parecer una tendencia sostenida a lo largo de el lapso más existente

de un registro climático podría conformar parte de una oscilación lenta relacionada

con variaciones multidecenales que no tienen la posibilidad de apreciarse

evidentemente ya que el intervalo de tiempo de esa tendencia sostenida es solo una

sección de la oscilación total, o pues se desconoce la naturaleza de la serie

proyectada para el futuro. El calentamiento global antropogénico expone un reto

especialmente difícil a este respecto ya que posiblemente las elecciones humanas

influyan en el momento de establecer, ejemplificando, cuánto tiempo se mantendrá

la tendencia al calentamiento mundial vista en el siglo pasado. Para hacer un

análisis completo de las series temporales, se necesita decidir no solo las

tendencias, sino además las oscilaciones periódicas o cuasiperiódicas, así como las

variaciones irregulares o aparentemente fortuitas que se observan en los datos. El

objetivo de los estudios de las series temporales es entender la forma en la que la

variabilidad de una serie temporal se distribuye como funcionalidad de la escala

temporal.

Comúnmente en el marco de la meteorología y la climatología, las

visualizaciones continuas tienden más a asemejarse que a marcar la diferencia. El

30
tamaño usado para abreviar la interacción entre cada observación y la que le

precede constituye el coeficiente de autocorrelación. Esta medida se calcula de la

misma forma que el coeficiente de correlación, con la exclusión de que la segunda

serie es la misma que la primera, sin embargo, con un movimiento de uno o más

saltos de tiempo.

Las medidas que resumen las tendencias dependen del tipo de tendencia que se

está determinando. Las tendencias lineales permanecen representadas por la

pendiente de una línea recta, mientras tanto que las no lineales permanecen

representadas por los coeficientes de las cambiantes matemáticas que definen la

ecuación relativa al ajuste de curvas, como los coeficientes de una funcionalidad

polinómica. Igualmente, las propiedades periódicas además permanecen

representadas por los coeficientes de las cambiantes matemáticas que definen las

oscilaciones, como por ejemplo la frecuencia, la fase y la amplitud de las

funcionalidades trigonométricas.

Ilustración 22Diagrama de dispersión con una correlación positiva


fuerte

➢ Componentes de una serie temporal

El estudio descriptivo de series temporales se basa en la idea de descomponer la

variación de una serie en varias componentes básicas. Este enfoque no siempre

31
resulta ser el más adecuado, pero es interesante cuando en la serie se observa cierta

tendencia o cierta periodicidad. Hay que resaltar que esta descomposición no es en

general única. Este enfoque descriptivo consiste en encontrar componentes que

correspondan a una tendencia a largo plazo, un comportamiento estacional y una

parte aleatoria. Las componentes o fuentes de variación que se consideran

habitualmente son las siguientes:

Tendencia: Se puede definir como un cambio a largo plazo que se produce en

relación al nivel medio, o el cambio a largo plazo de la media. La tendencia se

identifica con un movimiento suave de la serie a largo plazo.

Ilustración 23Tendencia

Efecto Estacional: El movimiento periódico de corto plazo. Se trata de una

componente causal debida a la influencia de ciertos fenómenos que se repiten de

manera periódica en un año (las estaciones), una semana (los fines de semana) o

un día (las horas puntas) o cualquier otro periodo. Recoge las oscilaciones que se

producen en esos períodos de repetición.

Ilustración 24Variación estacional

32
Componente Aleatoria: Accidental, de carácter errático, también denominada

residuo, no muestran ninguna regularidad (salvo las regularidades estadísticas),

debidos a fenómenos de carácter ocasional como pueden ser tormentas, terremotos,

inundaciones, huelgas, guerras, avances tecnológicos, etcétera.

Ilustración 25Componente aleatoria

➢ Clasificación descriptiva de las series temporales

Se clasifican en 2:

Estacionarias: Una serie es estacionaria cuando es estable, es decir, cuando la

media y la variabilidad son constantes a lo largo del tiempo. Esto se refleja

gráficamente en que los valores de la serie tienden a oscilar alrededor de una media

constante y la variabilidad con respecto a esa media también permanece constante

en el tiempo. Es una serie básicamente estable a lo largo del tiempo, sin que se

aprecien aumentos o 5 disminuciones sistemáticos de sus valores. Para este tipo de

series tiene sentido conceptos como la media y la varianza.

Ilustración 26Serie temporal estacionaria

33
No estacionaria

Son series en las cuales la media y/o variabilidad cambian en el tiempo. Los

cambios en la media determinan una tendencia a crecer o decrecer a largo plazo,

por lo que la serie no oscila alrededor de un valor constante.

Ilustración 27Serie temporal no estacionaria

9) Interpretación de las características sumarias del clima

Si bien es viable calcular muchas medidas de resumen, quizás no sea correcto

aprovecharlas para explicar la base de datos. Cada una de las medidas que

disminuyen visualizaciones con el objeto de identificar e indicar una señal o

interacción climática se fundamentan en supuestos y, si dichos no son válidos, las

medidas de resumen tienen la posibilidad de ser engañosas. Hay 4 puntos que

tienen que examinarse detalladamente antecedente de utilizar medidas de resumen,

a saber: los errores del grupo de datos, la falta de homogeneidad, la libertad de las

visualizaciones y la desatención de los componentes importantes.

Comúnmente, los datos son equivocados gracias a errores de registro (tales

como la transposición de números), las comunicaciones ininteligibles, los

malentendidos de un observador respecto de las prácticas de codificación, errores

de proceso (por ejemplo, la conversión errónea de grados Fahrenheit a grados

Celsius), errores de codificación y lógica de los programas informáticos, e

información errónea del identificador (ubicación u hora) de un costo. Dichos tipos

de error no tienen interacción con las condiciones físicas que son objeto de

34
observación y tienen la posibilidad de contaminar los datos, de tal forma que los

estudios de dichos tienen la posibilidad de llevar a conclusiones incorrectas.

A menudo, se incurre en deducciones incorrectas una vez que se emplean

medidas cuantitativas para equiparar datos que en verdad no son equiparables,

como una vez que se comparan visualizaciones no homogéneas.

De ser viable, cualquier grupo de datos que se encuentre analizando debería

homogeneizarse. Varios conjuntos de datos meteorológicos no cumplen el supuesto

de libertad. Previo a abreviar un grupo de datos, si es viable, debe velarse por borrar

la dependencia que existe en medio de las visualizaciones. Ejemplificando, el

impacto de los ciclos anuales conocidos puede eliminarse de forma notable si se

resumen las desviaciones respecto del periodo conocido. Además, en forma de

ejemplo, si se conoce que la persistencia (autocorrelación) perjudica a una

secuencia de visualizaciones, como en ocasiones pasa con las temperaturas

cotidianas observadas a lo largo de un fenómeno sinóptico de alta presión en área,

el modelo analítico debe tenerlo presente. Si los modelos no otorgan cuenta de la

dependencia, la persistencia que perjudica a cada una de las visualizaciones

efectuadas a lo largo del fenómeno persistente podría eliminarse por medio de un

submuestreo en el cual se elija solo una observación entre algunas de las accesibles

a lo largo del fenómeno. No obstante, en este proceso debe tenerse cuidado de no

esconder ni una oscilación subyacente, lo cual puede conducir a un estudio

incorrecto.

35
Ilustración 28 Serie temporal de la temperatura media de marzo

10) Normales

El uso de las normales climáticas tiene dos finalidades principales. Sirven de

referencia para poder comparar las observaciones recientes o presentes y, en

particular, para fundamentar muchos conjuntos de datos climáticos basados en

anomalías. También tienen un uso generalizado, implícito o explícito, para predecir

las condiciones que muy probablemente se experimentarán en un lugar dado. En

un principio, el objetivo de las normales consistía en permitir comparar las

observaciones de todo el mundo.

El uso de las normales para la predicción fue cobrando impulso lentamente en

el transcurso del siglo XX. Tradicionalmente, las normales climatológicas se han

centrado en el valor medio de un elemento climático durante un período de tiempo.

Los valores extremos de un elemento observado durante un período dado, así como

otros descriptores estadísticos de la distribución de frecuencias de un elemento, son

descriptores útiles del clima de un lugar y deberían incorporarse a los conjuntos de

datos de las normales.

Muchos SMHN calculan normales diarias junto con normales mensuales y

anuales. Aunque no sean un requisito de la OMM, las normales diarias ilustran la

evolución no aleatoria de las variaciones diarias de un elemento que no puede ser

36
captada mediante normales mensuales (AquijeRodríguez, Puma Reyes Bernardo,

& Bazalar Guiazada, 2010, pág. 39).

➢ Periodo de calculo

Para la evaluación de la variabilidad del clima a extenso plazo y el seguimiento

del calentamiento global es necesario un lapso de alusión subjetivamente estable.

Históricamente, las normales climatológicas estándares se calculaban cada 30 años

por períodos de 30 años (1901 a 1930, 1931 a 1960, 1961 a 1990, etc.). Para el

propósito concreto de examinar el clima a extenso plazo, las normales calculadas

para el lapso comprendido entre el 1 de enero de 1961 y el 31 de diciembre de 1990

se piensan un lapso de alusión estable de la OMM, que debe seguir estando

indefinidamente o hasta que exista un fundamento científico de peso para

cambiarlo, Sin embargo, en el entorno de un clima cambiante se requieren además

cálculos más comunes de las normales climatológicas. Ejemplificando, se han

calculado conjuntos de datos de temperatura internacionales como anomalías a

partir del lapso de alusión de 1961 a 1990. La utilización de un lapso de

premediación más existente, como el de 1981 a 2010, optimización la “exactitud

predictiva” respecto de recursos que presentan una tendencia secular (es

mencionar, una vez que los valores de la serie temporal presentan un crecimiento

y bajón sistemático en sus mediciones a extenso plazo). Además, varios usuarios

podrían tener en cuenta las tradicionales de 1981 a 2010 más "recientes" que las de

1961 a 1990. Las normales climatológicas estándares se calculan cada 10 años por

períodos de 30 años inicialmente de cada década, desde el año que finaliza en el

dígito 1 (1981 a 2010, 1991 a 2020, etcétera.). La ejecución de un nuevo cálculo

de los clásicos cada 10 años necesita además volver a calcular varios conjuntos de

datos que usan las típicos como alusión (grados-día, desviaciones de los valores

37
tradicionales, etcétera.). La informática actualizada y los sistemas de bases de datos

cada vez más perfeccionados deberían ayudar a que estos cálculos resulten

subjetivamente sencillos.

➢ Estaciones para las que se calculan normales y promedios

Las normales y los promedios del clima deberían calcularse para una gama de

estaciones tan amplia como sea posible, a condición de que las estaciones cumplan

las normas relativas al volumen y completitud de los datos disponibles. De ser

posible, deberían calcularse, como mínimo, para todas las estaciones cuyos datos

se distribuyen por el Sistema Mundial de Telecomunicación.

➢ Homogeneidad de datos

En el tamaño de lo viable, los datos usados para calcular las tradicionales y los

promedios climáticos deberían ser homogéneos. El asunto de la homogeneidad se

aborda más detalladamente en el siguiente capitulo. En el entorno de las habituales

y los promedios del clima, los puntos sobre la homogeneidad que necesitan

particular atención son los cambios de emplazamiento; los cambios en el método

de observación, en especial, en la hora de observación; los cambios en los tipos de

artefactos; los cambios en la exposición de las herramientas a lo extenso del tiempo,

y los cambios en el proceso de datos. En la práctica, son bastantes los sitios en los

cuales no va a ser viable entablar un grupo de datos con la homogeneidad correcta.

En vez de ello, va a ser primordial llevar a cabo típicos a partir de una conjunción

de 2 o más piezas de un registro no homogéneo. Una alternativa viable se apoya en

38
meter ajustes en la parte más vieja de un registro para realizarlo lo más homogéneo

viable con los datos más recientes.

Ilustración 29 Anomalías de la temperatura media mundial, con respecto al


período de referencia de 1850 a 1900 para los cinco conjuntos de datos mundiales
(por cortesía del Centro Hadley de la Oficina Meteorológica del Reino Unido)

➢ Datos faltantes

Las normales que se calculan sobre la base de conjuntos de datos incompletos

pueden estar distorsionadas. Ejemplificando, si a lo largo de un definido lapso, un

año ha sido especialmente gélido, una habitual calculada sin datos de dicho año

podría ser mayor a una habitual en la que sí se tomó en cuenta dicho año. Como

suele haber bastante autocorrelación en los datos climatológicos, la ausencia

consecutiva de visualizaciones puede tener una más grande consecuencia en las

tradicionales que la ausencia del mismo número de visualizaciones repartidas

aleatoriamente a lo largo del lapso en cuestión.

En forma de orientación, las habituales o medias de un lapso deberían calcularse

solo una vez que se encuentren accesibles los valores de por lo menos un 80 % de

los años registrados y no falten los valores de bastante más de 3 años continuos. Si

tras un lapso prolongado sin datos se dispone de un grupo de datos bastante

39
completo, puede optarse por calcular una media de lapso usando solo datos que

corresponden a los años posteriores a la interrupción del registro.

Las normales o promedios anuales deberían calcularse como la media o la suma

(según proceda) de las 12 tradicionales o promedios mensuales, sin considerar la

distinto duración de los meses. En el cálculo de las tradicionales anuales no tienen

la posibilidad de faltar las tradicionales de ningún mes. Se propone no calcular un

costo mensual si faltan bastante más de 10 valores cotidianos o 5 o más valores

cotidianos continuos. En la situación de recursos en los cuales el costo mensual es

la suma de los valores cotidianos en vez de un costo medio (por ejemplo, la lluvia

o la insolación), un costo mensual solo debe calcularse si se dispone de cada una

de las visualizaciones cotidianas o si se integran.

➢ Temperatura media diaria

Hay varios procedimientos para calcular la temperatura media diaria. Entre

ellos, cabe citar los que emplean una máxima y una mínima cotidianas,

visualizaciones efectuadas 24 horas al día, visualizaciones sinópticas y

visualizaciones a determinadas horas en todo el día. La mejor aproximación

estadística de una media se consigue por medio de la adhesión de visualizaciones

sucesivas llevadas a cabo a lo extenso de un lapso de tiempo; cuanto más comunes

sean las visualizaciones, más precisa va a ser la media obtenida. Generalmente, las

consideraciones prácticas imposibilitan el cálculo de una media diaria desde varias

visualizaciones distribuidas uniformemente a lo largo de un lapso de 24 horas ya

que varios emplazamientos de observación no miden un componente

constantemente. Para hacer las comparaciones conviene usar un procedimiento de

proceso normalizado para cada una de las estaciones de todo el mundo y en el

mayor número de estaciones.

40
Cada una de las estaciones climatológicas ordinarias observan una temperatura

máxima y mínima diaria. Por consiguiente, el procedimiento que se sugiere para

calcular la temperatura media diaria es usar la media de las temperaturas máxima

y mínima cotidianas. Si bien este procedimiento no constituye la mejor

aproximación estadística, su uso sistemático posibilita conseguir el objetivo

comparativo de los clásicos. Un SMHN debe además calcular las medias cotidianas

usando otros procedimientos si ello posibilita entender mejor el clima de la nación.

➢ Quintiles de precipitación

Los quintiles de precipitación se utilizan para establecer una relación entre un

total de precipitación mensual observada y la distribución de frecuencias de valores

observada durante el período considerado para calcular las normales. No existe un

método aceptado universalmente para calcular los límites de los quintiles, y la

elección del método puede influir notablemente en los valores obtenidos. Sin

embrago, el procedimiento que se recomienda para calcular los límites es el que se

especifica a continuación.

a) Para cada mes, los 30 valores mensuales de la precipitación registrados

a lo largo del lapso normal de 30 años se indican en una lista en orden

ascendente. Luego, la lista se divide en 5 conjuntos de quintiles de 6

valores cada uno. El primer quintil tiene los 6 valores menores del mes

en cuestión que se han visto a lo largo del lapso de 30 años, el segundo

quintil los 6 valores menores siguientes, y de esta forma sucesivamente

hasta el quinto quintil, que tiene los 6 valores más altos.

b) El límite entre dos quintiles adyacentes se calcula como el promedio

entre el valor máximo de un quintil y el primer valor del siguiente. El

índice de quintiles es el número del quintil más bajo que contiene la

41
precipitación mensual en el mes considerado en el informe que se

prepara, con las siguientes reglas especiales:

✓ Si la precipitación es 0: utilícese el índice 0 si tal caso no ha

ocurrido durante el período de referencia; utilícese 1 si ha

ocurrido menos de 6 veces; utilícese 2 si ha ocurrido entre 7 y 12

veces; utilícese 3 si ha ocurrido entre 13 y 18 veces, y así

sucesivamente.

✓ Si la precipitación es menor que cualquier valor registrado

durante el período de referencia: utilícese el índice 0

(independientemente de si la precipitación es 0).

✓ Si la precipitación es mayor que cualquier valor registrado

durante el período de referencia: utilícese el índice 6.

42
III. Conclusiones

✓ Antes de describir o utilizar un conjunto de datos, debería comprobarse la exactitud


y validez de los mismos. La exactitud consiste en el carácter correcto de los datos,
mientras que la validez se refiere a la aplicabilidad de los datos a la finalidad para la
que se utilizarán los valores. El usuario de conjuntos de datos nunca debería suponer
sin confirmación que un conjunto de datos es exacto y válido, especialmente sin
disponer de la información pertinente del proceso de control de calidad aplicado
durante el montaje del conjunto de datos.
✓ En una repartición de frecuencias perfectamente simétrica con una moda, de la
misma forma que la repartición gausiana, los valores de la media, la mediana y la
moda van a ser exactamente los mismos. Si el reparto de frecuencias muestra un
sesgo hacia los valores altos (sesgo a la derecha), el costo mayor va a ser el de la
media, seguido por el de la mediana y después el de la moda. Esta sucesión se
invierte si el reparto de la frecuencia muestra un sesgo hacia los valores bajos (sesgo
a la izquierda). Estas interrelaciones y las propiedades de las medidas (tabla 4.1)
deberían tenerse presente continuamente que se elija una medida de tendencia
central para representar un grupo de datos.
✓ Cualquier serie de visualizaciones puede modelizarse por medio de funcionalidades
matemáticas que reproducen las visualizaciones. Se necesita actuar con cautela al
utilizar dichas técnicas debido a diversos motivos.El objetivo primordial de ajustar
una funcionalidad es juntar el reparto de las visualizaciones. Si el ajuste es aceptable,
con solo unos pocos límites, la funcionalidad sumaria de las visualizaciones debe
dar una explicación realista de los datos que sea compatible con los principios físicos
subyacentes en una forma suavizada que hace caso omiso de los errores en los datos.
Una finalidad secundaria del ajuste es explicar los datos en un entorno teórico que
sea lo suficientemente sencilla como para que logren hacerse deducciones
estadísticas. El sobreajuste de un modelo matemático puede ofrecer sitio a una
explicación no realista de los datos pues se ponderan bastante los errores en los datos
o los componentes aleatorios que son ajenos a los procesos sometidos a análisis. El
nivel de suavizamiento suele depender de la finalidad del uso de los datos y de las
cuestiones que está procurando de contestar el climatólogo.

43
IV. Referencias bibliográficas

Esparza Catalán , C. (2006). SERIES TEMPORALES . Guadalajara : Laboratorio de

estadistica.

Anonimo. (4 de Junio de 2012). Obtenido de

http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/Tema2Cate.pdf

AquijeRodríguez, S., Puma Reyes Bernardo, D., & Bazalar Guiazada, K. (2010).

Caracterización del clima a partir de un conjunto de datos . Huacho :

UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN.

Atmósfera, C. d. (2008). Cambio climático en Argentina; tendencias y proyecciones. Buenos

Aires : Centro de Investigaciones del Mar y la Atmósfera.

Centro de Investigaciones del Mar y la Atmósfera. (2008). Cambio climático en Argentina;

tendencias y proyecciones. Buenos Aires : Centro de Investigaciones del Mar y la

Atmósfera.

Inzunza , J. (2008). METEOROLOGIA DESCRIPTIVA. UNIVERSIDAD DE

CONCEPCIÓN, 23.

Martinez Ortega, R., Tuya Pendás, L., Martínez Ortega, M., & Pérez Abreu, A. (2009). EL

COEFICIENTE DE CORRELACION DE LOS RANGOS DE SPEARMAN

CARACTERIZACION. Habanera de Ciencias Médicas, 6.

ORGANIZACION METEREOLOGICA MUNDIAL. (2018). Guía de prácticas

climatológicas. Ginebra: OMM.

Vinuesa, P. (2016). Tema 8 - Correlación: teoría y práctica. Ciudad de Mexico : Unam.

44
45

También podría gustarte