Está en la página 1de 14

Universidade Federal de São Carlos – UFSCar

APA1 - Estatística Descritiva: Um


Exemplo Prático

Estatística Aplicada à Engenharia Ambiental


Prof. Luis Milan

Aluno: Simei Diniz Vieira – RA: 368091

Pólo: São José dos Campos I

25 Out 2010
1. OBJETIVOS

O objetivo do presente trabalho foi o de calcular o comportamento do conjunto de


dados relativos às alturas de um grupo de pinheiros (Pinus sp.) localizados à beira de um lago
no DCTA (Departamento de Ciência e Tecnologia da Aeronáutica), em São José dos
Campos, São Paulo.
Foi utilizada como base a teoria constante nos textos da unidade 2, de Estatística
Aplicada à Engenharia Ambiental, do curso de Engenharia Ambiental da Universidade de
São Carlos (UFSCar), EAD.
Pretendeu-se gerar, após a disposição e cálculo dos dados, os resultados textuais e em
forma de gráficos estatísticos, utilizando-se no processo o software 'R'.

2. COLETA DE DADOS

Para o propósito do presente trabalho, julgou-se ser suficiente, com relação à precisão
e exatidão dos dados, os métodos adotados para a tomada de medidas de altura das árvores.
Para isso, foi construído um dispositivo de visada, com medida angular vertical e
controle de nível por prumo, conforme foto em anexo.
O dispositivo foi posicionado a uma distância fixa do grupo de árvores, longe o
suficiente (cerca de 350 m), considerando-se desprezíveis as diferenças de distância entre
árvores, para a medida da distância horizontal.
Novamente, para o propósito do presente trabalho, julgou-se suficiente obter a
distância horizontal por meio do recurso de medida horizontal do software Google Earth, do
agrupamento de pinheiros (vide foto em anexo) até a posição de visada.
Vale ressaltar ainda que as medidas tomadas referem-se à amostragem de 20
indivíduos, escolhidos aleatoriamente (amostragem aleatória simples), a intervalos regulares
e facilmente distinguíveis dentre os demais no conjunto.

1
3. CÁLCULOS EFETUADOS

Após a coleta de dados, foi chegou-se à altura de cada árvore, pelo cálculo do produto
da tangente de cada angulo obtido pela distância horizontal (cateto adjacente) medido:

  . tan

Fig. 1: Esquema da medida do ângulo vertical, distância e altura.

2
4. DADOS OBTIDOS

Os dados iniciais obtidos (ângulos horizontais) estão dispostos na tabela 1 abaixo:

MEDIDA ÂNGULO VERTICAL


1 5˚
2 5,5˚
3 6˚
4 6,5˚
5 7˚
6 6,5˚
7 6˚
8 5,5˚
9 5˚
10 6˚
11 7˚
12 7˚
13 7˚
14 6˚
15 5,5˚
16 4,5˚
17 5˚
18 4,5˚
19 6˚
20 5˚
21 5,5˚
22 4,5˚
23 4˚
24 5˚
25 4,5˚
Tabela 1: Lista dos pontos e ângulos verticais medidos.
Além disso, a medida horizontal, tomada pelo software Google Earth, do ponto de
medida até o centro aproximado do agrupamento de árvores, foi de 385 m.

5. TRATAMENTO DOS DADOS E RESULTADOS


5.1. Cálculos Efetuados no Programa R

Inicialmente, efetuou-se o cálculo das alturas referentes a cada ângulo vertical


medido, para o qual foi utilizado o software ‘R’. Digitou-se as seguintes linha de comando:

- Para agrupar os dados dos ângulos verticais medidos na variável Ang.Vert.Arvores:

3
>

Ang.Vert.Arvores=c(5,5.5,6,6.5,7,6.5,6,5.5,5,6,7,7,7,6,5.5,4.5,5,4.5,6,5,5.5,4

.5,4,5,4.5)

- Para armazenar os ângulos (decimais) obtidos em uma nova variável


(Ang.Vert.Rad.Arvores), calculados para ângulos em radianos – pois as funções
trigonométricas no ‘R’ necessitam que o ângulo esteja na unidade radianos – e utilizando a
fórmula abaixo:

2 Â  
 
360

> Ang.Vert.Rad.Arvores=((2*pi*Ang.Vert.Arvores)/360)

- Para calcular as alturas (H) referentes a cada medida de ângulo vertical tomada,
utilizando a fórmula já dada:

> Alt.Arvores=385*tan(Ang.Vert.Rad.Arvores)

4
5.2. Tabela de Frequências

A última linha de comando acima produziu a seguinte tabela de valores, com três
algarismos significativos:

MEDIDA ALTURA DA ÁRVORE


1 33,7
2 37,1
3 40,5
4 43,9
5 47,3
6 43,9
7 40,5
8 37,1
9 33,7
10 40,5
11 47,3
12 47,3
13 47,3
14 40,5
15 37,1
16 30,3
17 33,7
18 30,3
19 40,5
20 33,7
21 37,1
22 30,3
23 26,9
24 33,7
25 30,3
Tabela 2: Lista de alturas calculadas.

A partir da nova variável acima, pode ser realizado o Ramo-e-folhas no ‘R’:


> stem(Alt.Arvores)

The decimal point is 1 digit(s) to the right of the |

2 | 7

3 | 000044444

3 | 7777

4 | 0000044

5
4 | 7777

Entendeu-se, a partir do Ramo-e-folhas, que a melhor divisão de classes para os


dados da tabela seria em intervalos de 5 unidades, e criou-se então a nova variável
(Classes.Alt.Arvores), contendo as divisões em classes:

> Classes.Alt.Arvores=cut(Alt.Arvores,c(25,30,35,40,45,50))

A partir dos dados, foi possível elaborar a tabela de freqüências (Tabela 3), utilizando
as seguintes linhas de comando no ‘R’:

- Frequência absoluta:

> Fr_ab.Alt.Arvores=table(Classes.Alt.Arvores)

- Frequência relativa:

> Fr_rel_Alt.Arvores=Fr_ab.Alt.Arvores/sum(Fr_ab.Alt.Arvores)

- Frequência acumulada absoluta:

> Fr_ac.Alt.Arvores=cumsum(Fr_ab.Alt.Arvores)

- Frequência acumulada relativa:

>

Fr_ac_rel.Alt.Arvores=Fr_ac.Alt.Arvores/sum(Fr_ab.Alt.Arvores)

- Concatenação das variáveis:

>

Tabela.Alt.Arvores=cbind(Fr_ab.Alt.Arvores,Fr_rel_Alt.Arvores,Fr_ac.Al

t.Arvores,Fr_ac_rel.Alt.Arvores)

A seguir, a tabela 3 mostra os dados gerados:


FREQUÊNCIA FREQUÊNCIA
ALTURA DAS FREQUÊNCIA FREQUÊNCIA
ABSOLUTA RELATIVA
ÁRVORES ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
(25,30] 1 0,04 1 0,04
(30,35] 9 0,36 10 0,40
(35,40] 4 0,16 14 0,56
(40,45] 7 0,28 21 0,84
(45,50] 4 0,16 25 1,00
Tabela 3: Tabela de freqüências.

6
5.3. Medidas de Posição

5.3.1. Média

Linha de comando no ‘R’:

> Md.Alt.Arvores=mean(Alt.Arvores)

> Md.Alt.Arvores

> 37.7587

Resultado: 37,8 m.

5.3.2. Mediana

Linha de comando no ‘R’:

> Medn.Alt.Arvores=median(Alt.Arvores)

> Medn.Alt.Arvores

> 37.07128

Resultado: 37,1 m.

5.3.3. Quartis

Linha de comando no ‘R’:

>quantile(Alt.Arvores,prob=c(0.05,.25,.5,.75),type=5)

Resultado:
• 5% - 29,5 m
• 25% - 33,7 m
• 50% - 37,1 m
• 75% - 41,3 m

7
5.4. Medidas de Dispersão

5.4.1. Amplitude

Linha de comando no ‘R’:

> Amplitude=max(Alt.Arvores)-min(Alt.Arvores)

Resultado: 20,35 m.

5.4.2. Desvio Médio

Linha de comando no ‘R’:

>

D_Medio=sum(abs(Alt.Arvores-Md.Alt.Arvores)/length(Alt.Arvores))

Resultado: 5,10 m.

5.4.3. Variância

Linha de comando no ‘R’:

> Var=sum(((Alt.Arvores-Md.Alt.Arvores)^2)/length(Alt.Arvores))

Resultado: 35,92.

5.4.4. Desvio Padrão

Linha de comando no ‘R’:

> DPadrao=sqrt(Var)

8
Resultado: 5,99.

6. GRÁFICOS

6.1. Histograma

Linha de comando no ‘R’:

> hist(Alt.Arvores,main='Histograma Altura dos

Pinheiros',xlab='Altura (m)',ylab='Frequência')

O resultado consta no gráfico abaixo:

Histograma Altura dos Pinheiros


8
6
Frequência

4
2
0

25 30 35 40 45 50

Altura (m)

Gráfico 1: Histograma.

9
6.2. Box-plot

Linha de comando no ‘R’:

> boxplot(Alt.Arvores,main='Gráfico Box-plot',ylab='Altura (m)')

Gráfico:

Gráfico Box-plot
45
40
Altura (m)

35
30

Gráfico 2: Box-plot.

6.3. Composição em Setores

Linha de comando no ‘R’:

> names(Fr_ab.Alt.Arvores)=c('Faixa de Altura: 25m-30m

(4%)','Faixa de Altura: 30m-35m (36%)','Faixa de Altura: 35m-40m

(16%)','Faixa de Altura: 40m-45m (28%)','Faixa de Altura: 45m-50m

(16%)')

>

pie(Fr_ab.Alt.Arvores,col=c("purple","violetred1","green3","cornsilk","cy

an"))

Resultados obtidos no gráfico abaixo:

10
Faixa de Altura: 30m-35m (36%)

Faixa de Altura: 35m-40m (16%) Faixa de Altura: 25m-30m (4%)

Faixa de Altura: 45m-50m (16%)

Faixa de Altura: 40m-45m (28%)

Gráfico 2: Composição em setores.

7. CONSIDERAÇÕES GERAIS

Nota-se que, embora a média e a mediana estejam próximas (37,8 e 37,1,


respectivamente), a classe que apresenta maior número de ocorrências é a classe 30-35
(correspondendo à moda), e não 35-40, onde estão localizadas a média e a mediana.
Uma hipótese para o ocorrido acima é que a amostragem não foi representativa o
bastante, em relação ao número e localização das árvores do local. No entanto, distribuições
bimodais podem ocorrer nos processos naturais (WIKIPEDIA, 2010).
Ainda quanto à distribuição irregular, poder-se-ia investigar quanto à época em que o
bosque foi plantado, ou se diferentes partes do bosque foram plantadas em períodos distintos.
A variabilidade das condições ambientais locais também pode representar um fator de
influência sobre o nível de desenvolvimento das espécies.
Quanto às medidas de dispersão, a relativa variabilidade dos dados (desvio padrão:
5,99m), em princípio, não vem a representar problema, pelo fato de ocorrerem naturalmente
diferenças de desenvolvimento das espécies dentro dessa faixa.

8. BIBLIOGRAFIA

WIKIPEDIA. Bimodal Distribution. Disponível em:


http://en.wikipedia.org/wiki/Bimodal_distribution. Acesso em: 25 Out 2010.

11
ANEXO

Foto 1: Detalhe do dispositivo de medição de ângulos verticais.

Foto 2: Foto do local da coleta de dados. Ao fundo da primeira linha de árvores, há um bosque de pinheiros
(Pinus sp.)

12
Foto 3: Mapa da área estudada e ponto de visada.

13

También podría gustarte