Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Monografía
CONJUNTO DE DATOS
Presentado por:
DOCENTE:
CURSO:
Climatología
Celendín - Cajamarca
2022
1
I. Contenido
I. Contenido ........................................................................................................................ 2
I. Introducción .................................................................................................................... 6
1) Climatología ............................................................................................................ 7
2) Historia .................................................................................................................... 8
➢ Índices ............................................................................................................... 25
7) Correlación ............................................................................................................ 26
29
2
Se clasifican en 2: ...................................................................................................... 33
➢ Homogeneidad de datos................................................................................... 38
➢ Quintiles de precipitación................................................................................ 41
3
Ilustración 1 Distribución de frecuencias (histograma) y Distribución de frecuencias
acumulativas ............................................................................................................................ 12
El dígito inicial del valor de una observación es el tallo y el dígito final es la hoja. En la tabla
propiedad.................................................................................................................................. 16
viento........................................................................................................................................ 16
Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en ambos
4
Ilustración 12 Relaciones entre la media, la mediana y la moda ........................................ 21
referencia de 1850 a 1900 para los cinco conjuntos de datos mundiales (por cortesía del
5
I. Introducción
Todos los años se van agregando más datos a los archivos climatológicos de los Servicios
Meteorológicos e Hidrológicos Nacionales (SMHN). Los climatólogos tienen que ser capaces
procedimientos estadísticos. Una vez que se eligen y se utilizan cuidadosamente, los procesos
los procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con pcs
para procesar y exponer datos. No obstante, se necesita advertir de los riesgos de una aplicación
usar inadecuadamente los métodos e interpretar de manera errónea los resultados. Si bien la
utilización de pcs comporta ventajas incuestionables, existe el peligro de que las suposiciones
con el presente capítulo. Los dos poseen por objeto explicar conceptos básicos en vez de
especificar detalles de temas complicados. Las referencias que figuran finalmente del capítulo
y los libros de escrito sobre teoría y procedimientos estadísticos ofrecen información más
detallada.
6
II. Contenido Temático
1) Climatología
El clima es algo que nos ha preocupado desde la antigüedad. Del clima dependían
las migraciones de los animales, el crecimiento de los frutos y más tarde, la buena
marcha de las cosechas. Por ello, desde la época de las cavernas el hombre se ha
preocupado por el medio que le rodeaba y los cambios que éste sufría. Sin embargo, en
aquellos primeros tiempos, el conocimiento del medio era más práctico e instintivo que
sistemático. No es hasta la época de Aristóteles (384 – 322 AC) en que encontramos
referencias explícitas a algún estudio sobre la atmósfera y sus fenómenos, un primer
paso para comenzar a sistematizar el estudio del clima del planeta. A partir de entonces,
7
los estudios sobre el clima y sus fenómenos comienzan a hacerse más regulares: en el
año 230 AC ya se conocía la existencia de los tres estados del agua -hielo, líquido y
vapor- y se había comenzado a establecer una relación entre ellos (Inzunza , 2008, pág.
1 y 2).
2) Historia
más viejas en los Vedas, las escrituras hindúes más viejas, que fueron escritas alrededor
de Hipócrates, que data de alrededor del año 400 a. C., seguida por Acerca del cielo:
la Tierra, la cual da sitio a la alteración del clima de acuerdo con la latitud gracias a la
incidencia cambiante de los relámpagos del Sol. En la obra de los filósofos Aristarco y
que vincula a las regiones tropicales y subtropicales, en especial, los vientos alisios, la
conocerse como la celda de Hadley. Julius von Hann, quien divulgó el primero de los 3
cubierta vegetal del suelo. A esta tarea le siguieron estudios más detallados en el entorno
8
de la climatología detallada. Ejemplificando, el geógrafo E. E. Federov (1927) intentó
Entre otras obras relevantes sobre climatología cabe resaltar la de Tor Bergeron
cierto punto el término de micro climatología por primera ocasión en 1927, empero los
puso en práctica. En 1948, C.W. Thornthwaite estableció una categorización del clima
3) Base de Datos
procedimientos expuestos en este capítulo son más eficaces una vez que se aplican con
9
automáticos, ya que es bastante simple usar inadecuadamente los métodos e interpretar
fenómeno visto, de la misma forma que la temperatura del viento. Otros recursos, como
cuantitativos, sino solo una categoría detallada, de la misma forma que un tipo de nube
analista.
representar a toda la población. Los conjuntos de datos son muestras. Cuanto más
10
grande sea la muestra, más precisa va a ser la estimación de las propiedades descriptivas
el analista debería reconocer que un grupo de datos podría ser representativo de solo
datos son el costo medio o típico, la expansión o gama de las visualizaciones, la realidad
lado del costo medio y la aglutinación de las visualizaciones. Sin una organización
estas y propiedades semejantes. El primer paso es entender los datos de forma general
Hay muchas formas de exponer los datos para obtener una apreciación cualitativa
de lo que los datos revelan al climatólogo. Una forma de acomodar un grupo de datos
o como un cuadro, debido a lo que se realizan evidentes varias propiedades, como por
ejemplo los valores extremos y la gama. Una segunda forma de ordenar un grupo de
11
de repartición de frecuencias o histograma. El número de intervalos es arbitrario y la
12
conocimientos sobre los procesos físicos que subyacen a las visualizaciones e inferir
mejor las condiciones climáticas pasadas y presentes. Debería tenerse buen cuidado
de que los contenidos de un grupo de datos que se hayan resumido por medio de
una de se miden con los mismos artefactos, paralelamente todos los días, en el mismo
sitio y con los mismos métodos. Si cambian los métodos, tienen la posibilidad de
una de las pautas imprevistas deberán examinarse para establecer si son provocadas
estructural, en cual se usan tablas para recolectar estos datos y con ellos poder
13
relacionen con otros datos (AquijeRodríguez, Puma Reyes Bernardo, & Bazalar
forma en:
promedios de los recursos, como la temperatura media anual y a más extenso plazo.
En la mayor parte de los casos, cuanto más extenso sea el lapso de premediación,
presentan un alto nivel de desviación; son usuales para las porciones de precipitación
• curvas a modo de U: estas curvas son usuales para recursos que poseen
parámetros bilaterales, como por ejemplo la parte de nubosidad (hay más grande
14
• curvas multimodales o complicadas: estas curvas son usuales para los recursos
bastante complicadas por medio de una estratificación de datos a priori para reflejar
Las funciones siempre se construyen de modo que las magnitudes relativas de los
propiedades y las relaciones pueden utilizarse para analizar los datos y hacer
15
Ilustración 5Distribución normal o gausiana: los valores de la gama relativos a la
propiedad
16
Ilustración 8Distribución de valores extremos generalizada: se utiliza para establecer
modelos de valores extremos en una distribución
17
Ilustración 11 Distribución beta: indica las distribuciones que están delimitadas en
ambos extremos, tales como la nubosidad
pruebas objetivas de la calidad del ajuste. En la mayoría de los casos, los conjuntos
buscar el ajuste más correcto o más eficaz. Comúnmente, se usan las pruebas de
implica que los valores de los datos son discretos e independientes (ninguna
sean diferentes. Esta prueba es eficaz si el grupo de datos tiene un alto número de
18
visualizaciones (ORGANIZACION METEREOLOGICA MUNDIAL, 2018, pág.
75).
Son parámetros estadísticos que lo que busca es poder resumir en un solo valor
Bazalar Guiazada, 2010, pág. 9). Algunas de las medias de tendencia central más
utilizadas son:
- La moda
-La media
-La mediana
medidas de tendencia central poseen por objeto indicar un costo central alrededor
del que tienden a agruparse los datos. Las medidas de tendencia central no
central debe efectuarse junto con una medida del nivel de alteración de los valores
19
representa un número hacia el que convergería el promedio de una serie temporal
inherente con los procesos físicos que se miden, empero, constantemente que sea
ponderación otorgan buen resultado una vez que tanto las características físicas
como las estadísticas varían siempre y bastante muy lento en el espacio y la era
examinados.
la mitad de los datos permanecen por arriba de la mediana y la otra mitad por abajo.
par, la mediana se encuentra entre ambos valores del medio, principalmente, como
20
la media (o la media ponderada) de ambos. Si ambos valores del medio son
mediana. La mediana es en especial eficaz una vez que las visualizaciones tienden
La moda es el costo que surge con más frecuencia en el grupo de datos. Al igual
encuentre formado por componentes diferentes, todos los cuales tiene un costo
situación de los recursos de carácter circular, como la dirección del aire, el término
de
21
media puede ser ambiguo. Comúnmente, el costo modal, de la misma forma que la
dirección del aire dominante, es una medida más eficaz de la tendencia central para
➢ Medidas de variabilidad
variabilidad.
visualizaciones. El rango es la diferencia que existe entre los valores más elevados
y los valores más bajos. Aunque sea simple de calcular, el rango muestra muchas
restricciones. Si los valores extremos resultan muy escasos o no son parte del
22
central seleccionada. Si bien es viable calcular las desviaciones desde la media, la
establecer comparaciones.
➢ Medida de la simetría
vez que la media es más grande que la moda y negativa una vez que la moda es
23
más grande que la media. Además, se han definido otras medidas, como una basada
acostumbran exponer una tendencia hacia la asimetría positiva, sin embargo, las
asimetría negativa
valores bajos lejos de la media. Los valores negativos indican una zona central
humedad en altitud.
24
Con este parámetro se pretende medir el como se reparten las frecuencias
campana de Gauss.
Tipos :
Leptocurtica
Mesocurtica
Platicurtica
➢ Índices
las de alusión por medio de un solo costo. La alusión suele ser comúnmente, sin
recarga y características del suelo con condiciones medias del clima. El desarrollo
analizar y escoger los datos que se tienen que integrar en la índice resulta más difícil
que el cálculo del índice en sí. Una de las preocupaciones que implica la votación
25
representar condiciones habituales, usuales o esperadas, debido a que la mayor
incluidos
7) Correlación
variables cuantitativas continuas (x, y). La manera más sencilla de saber si dos
• Estas medidas se aplican a los valores al tomar dos variables distintas en cada uno
• En el caso de que ambas variables varían a la vez, es decir que si los valores de
una son más altos o bajos cuanto más altos o bajos son los de la otra.
correlación es positiva.
• Pero cuando los valores de una variable aumentan siempre y cuando la otra
26
• Si las variables cambian de manera independiente una de la otra, no hay
Ilustración 16Correlación
❖ Correlación positiva
Cuando una relación entre una variable y otra es lineal y directa, de manera que
directo. Por lo que, a valores altos de una le corresponden valores altos de la otra e
❖ Correlación negativa
sentido inverso.
27
Cuando una variable cambia, la otra se modifica hacia lo contrario. Al momento
que esta posee variables de valores altos, la otra posee valores bajos y mientras
este valor esté más cerca de -1, más evidente será esta covariación.
Spearman puede ser calculada con la fórmula de Pearson (Martinez Ortega, Tuya
➢ Tablas de contingencia
Una tabla de contingencia es una de las formas más comunes de resumir datos
categóricos.
28
En general, el interés se centra en estudiar si existe alguna asociación entre una
denomina tabla de contingencia, término que fue introducido por Pearson en 1904.
8) Series temporales
Los valores de una serie temporal van ligados a instantes de tiempo, de manera que
29
un resumen del comportamiento histórico de las visualizaciones de un componente.
En la mayor parte de los casos, se inspeccionan las tendencias lineales de una serie
temporal definida, sin embargo, algunas veces, podría ser mejor explicar una
abrupto hacia arriba o hacia debajo. Generalmente, las tendencias, ya sean lineales
podría ser bastante extenso. En todo el tiempo, en el sistema climático se han visto
muchas veces tendencias con una orientación, que, al final, termina por invertirse.
Lo cual podría parecer una tendencia sostenida a lo largo de el lapso más existente
tendencias, sino además las oscilaciones periódicas o cuasiperiódicas, así como las
temporal.
30
tamaño usado para abreviar la interacción entre cada observación y la que le
serie es la misma que la primera, sin embargo, con un movimiento de uno o más
saltos de tiempo.
Las medidas que resumen las tendencias dependen del tipo de tendencia que se
pendiente de una línea recta, mientras tanto que las no lineales permanecen
representadas por los coeficientes de las cambiantes matemáticas que definen las
funcionalidades trigonométricas.
31
resulta ser el más adecuado, pero es interesante cuando en la serie se observa cierta
Ilustración 23Tendencia
manera periódica en un año (las estaciones), una semana (los fines de semana) o
un día (las horas puntas) o cualquier otro periodo. Recoge las oscilaciones que se
32
Componente Aleatoria: Accidental, de carácter errático, también denominada
Se clasifican en 2:
gráficamente en que los valores de la serie tienden a oscilar alrededor de una media
en el tiempo. Es una serie básicamente estable a lo largo del tiempo, sin que se
33
No estacionaria
Son series en las cuales la media y/o variabilidad cambian en el tiempo. Los
aprovecharlas para explicar la base de datos. Cada una de las medidas que
a saber: los errores del grupo de datos, la falta de homogeneidad, la libertad de las
de error no tienen interacción con las condiciones físicas que son objeto de
34
observación y tienen la posibilidad de contaminar los datos, de tal forma que los
de libertad. Previo a abreviar un grupo de datos, si es viable, debe velarse por borrar
submuestreo en el cual se elija solo una observación entre algunas de las accesibles
incorrecto.
35
Ilustración 28 Serie temporal de la temperatura media de marzo
10) Normales
Los valores extremos de un elemento observado durante un período dado, así como
36
captada mediante normales mensuales (AquijeRodríguez, Puma Reyes Bernardo,
➢ Periodo de calculo
por períodos de 30 años (1901 a 1930, 1931 a 1960, 1961 a 1990, etc.). Para el
mencionar, una vez que los valores de la serie temporal presentan un crecimiento
podrían tener en cuenta las tradicionales de 1981 a 2010 más "recientes" que las de
1961 a 1990. Las normales climatológicas estándares se calculan cada 10 años por
de los clásicos cada 10 años necesita además volver a calcular varios conjuntos de
datos que usan las típicos como alusión (grados-día, desviaciones de los valores
37
tradicionales, etcétera.). La informática actualizada y los sistemas de bases de datos
cada vez más perfeccionados deberían ayudar a que estos cálculos resulten
subjetivamente sencillos.
Las normales y los promedios del clima deberían calcularse para una gama de
estaciones tan amplia como sea posible, a condición de que las estaciones cumplan
posible, deberían calcularse, como mínimo, para todas las estaciones cuyos datos
➢ Homogeneidad de datos
En el tamaño de lo viable, los datos usados para calcular las tradicionales y los
y los promedios del clima, los puntos sobre la homogeneidad que necesitan
y los cambios en el proceso de datos. En la práctica, son bastantes los sitios en los
En vez de ello, va a ser primordial llevar a cabo típicos a partir de una conjunción
38
meter ajustes en la parte más vieja de un registro para realizarlo lo más homogéneo
➢ Datos faltantes
año ha sido especialmente gélido, una habitual calculada sin datos de dicho año
podría ser mayor a una habitual en la que sí se tomó en cuenta dicho año. Como
solo una vez que se encuentren accesibles los valores de por lo menos un 80 % de
los años registrados y no falten los valores de bastante más de 3 años continuos. Si
39
completo, puede optarse por calcular una media de lapso usando solo datos que
la suma de los valores cotidianos en vez de un costo medio (por ejemplo, la lluvia
ellos, cabe citar los que emplean una máxima y una mínima cotidianas,
sean las visualizaciones, más precisa va a ser la media obtenida. Generalmente, las
40
Cada una de las estaciones climatológicas ordinarias observan una temperatura
comparativo de los clásicos. Un SMHN debe además calcular las medias cotidianas
➢ Quintiles de precipitación
elección del método puede influir notablemente en los valores obtenidos. Sin
especifica a continuación.
valores cada uno. El primer quintil tiene los 6 valores menores del mes
41
precipitación mensual en el mes considerado en el informe que se
sucesivamente.
42
III. Conclusiones
43
IV. Referencias bibliográficas
estadistica.
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Categor/Tema2Cate.pdf
AquijeRodríguez, S., Puma Reyes Bernardo, D., & Bazalar Guiazada, K. (2010).
Atmósfera.
CONCEPCIÓN, 23.
Martinez Ortega, R., Tuya Pendás, L., Martínez Ortega, M., & Pérez Abreu, A. (2009). EL
44
45