Está en la página 1de 142

2

STANLEY LOH








31 TIPOS DE SISTEMAS DE INFORMAO - 31 MANEIRAS DE A
TECNOLOGIA DA INFORMAO AJUDAR AS ORGANIZAES




1a edio










Porto Alegre
Stanley Loh
2014




3


Prefixo Editorial: 916683
Nmero ISBN: 978-85-916683-0-4

Copyright by Stanley Loh
Todos os direitos reservados.

Formas de citao:
LOH, Stanley. 31 tipos de sistemas de informao - 31 maneiras de a tecnologia da
informao ajudar as organizaes. Porto Alegre, 2014.

Loh, S. (2014). 31 tipos de sistemas de informao - 31 maneiras de a tecnologia da
informao ajudar as organizaes. Porto Alegre, 142 p.


Ilustrao de capa: Maria Eduarda Loh


4

NDICE


O que um Sistema de Informao (SI) .................................................................................... 7
Evoluo dos Sistemas de Informao nas Organizaes .......................................................... 9
1 Fase: .................................................................................................................................... 9
2 Fase: .................................................................................................................................. 10
3 Fase: .................................................................................................................................. 10
4 Fase: .................................................................................................................................. 10
Objetivo deste livro e a quem se destina .................................................................................. 10
Os 31 Tipos de Sistemas de Informao .................................................................................. 11
1 Sistemas de Informao Rotineiros ou Transacionais (SIRs, SITs, SPTs) ................... 12
2 Sistemas de Gesto de Suprimentos .................................................................................. 12
Supply Chain ......................................................................................................................... 15
3 Sistemas de Gesto Empresarial ou Gesto Integrada - ERP ............................................ 15
4 Sistemas de Informaes Gerenciais (SIGs) .................................................................... 16
O problema do estoque ......................................................................................................... 17
5 Sistemas de Apoio Deciso (SADs) .............................................................................. 17
6 Sistemas Especialistas ....................................................................................................... 21
Solues procedurais ou algortmicas ................................................................................... 21
Uso de regras determinsticas (sistemas baseados em conhecimento determinstico) ......... 21
Tabelas de deciso e rvores de deciso ............................................................................... 22
Uso de regras probabilsticas ................................................................................................ 23
Uso de regras heursticas ...................................................................................................... 23
Redes neurais (artificiais) ..................................................................................................... 24
Raciocnio baseado em casos (case-based reasoning - CBR) ............................................... 25
7 Sistemas de Simulao ...................................................................................................... 25
8 Sistemas de Informaes Distribudas ............................................................................... 26
9 Sistemas de Automao (Industrial, Comercial e Residencial) ......................................... 27
10 Sistemas de Informaes Geogrficas (GIS) ................................................................. 29
Localizao de entidades em mapas ou imagens (georreferenciamento) ............................. 31
Reconhecimento de entidades geogrficas a partir do mapa ................................................ 33
Clculo de distncia (em linha reta) ...................................................................................... 33
Clculo de rea ...................................................................................................................... 34
Anlise de cruzamentos e interseces ................................................................................. 35
Distncia levando em conta caminhos possveis (ruas ou estradas) ..................................... 35
Clculo de rota ...................................................................................................................... 36
Exemplos de Aplicaes de GIS ........................................................................................... 37
Geomarketing ........................................................................................................................ 39
11 Sistemas de Hipertextos, Hipermdia e Multimdia ....................................................... 41
12 Sistemas de Gesto Eletrnica de Documentos (GED) ................................................. 43
13 Sistemas de Informaes Textuais (Indexao e Recuperao de Informaes) ........... 44
Recuperao de contedos multimdia ................................................................................. 46
14 Sistemas de Workflow ................................................................................................... 50
15 Sistemas de Data Warehouse (Armazm de Dados) ...................................................... 52
Dados Multidimensionais / Cbicos ..................................................................................... 55
16 Sistemas de Database Marketing .................................................................................... 57
Formas de coleta de dados: explcita, implcita e por inferncia .......................................... 58
17 Sistemas de CRM (Customer Relationship Management) ............................................. 62
5

Tipos de CRM ....................................................................................................................... 64
Viso 360 ............................................................................................................................. 64
Identificar clientes ................................................................................................................. 65
Diferenciar clientes ............................................................................................................... 65
Interagir com clientes ............................................................................................................ 67
Personalizar ........................................................................................................................... 67
CRM Social ........................................................................................................................... 68
18 Sistemas de Data Mining (Minerao de Dados ou Descoberta de Conhecimento) ...... 68
Associao ............................................................................................................................ 69
Correlao ............................................................................................................................. 71
Modelos de Predio (usar modelo para prever valores) ...................................................... 72
Mdia .................................................................................................................................... 72
Deteco de desvios (outliers) .............................................................................................. 73
Sequncia de tempo .............................................................................................................. 74
Sries Temporais ................................................................................................................... 74
Classificao (categorizao) ................................................................................................ 77
Induo .................................................................................................................................. 77
Clusterizao ou Agrupamento (clustering) ......................................................................... 77
19 Sistemas de Text Mining ................................................................................................ 78
Preparao de textos ............................................................................................................. 80
Classificao ......................................................................................................................... 80
Anlise de distribuio .......................................................................................................... 81
Anlise de Diferenas ........................................................................................................... 81
Associaes ........................................................................................................................... 81
Anlise de Similaridade ........................................................................................................ 81
Resumos - Sumarizao ........................................................................................................ 81
Anlise de palavras X contextos/conceitos ........................................................................... 82
Exemplos de Aplicaes ....................................................................................................... 83
Instituio de Ensino ......................................................................................................... 83
TV por Assinatura ............................................................................................................. 84
Concessionria de Rodovia ............................................................................................... 86
Anlise de Currculos ........................................................................................................ 86
Outras tcnicas e abordagens ................................................................................................ 87
20 Sistemas de Web Mining (ou Web Usage Mining) ........................................................ 90
Dados sobre Pginas Web ..................................................................................................... 90
Dados sobre Usurios da Web .............................................................................................. 90
Como coletar dados ............................................................................................................... 91
Mtricas ................................................................................................................................. 91
Anlise de Tempo ................................................................................................................. 92
Estatsticas simples ............................................................................................................... 93
Anlise de clickstreams ......................................................................................................... 96
Anlise de buscas internas ao site ......................................................................................... 96
21 Sistemas de Personalizao e Recomendao ................................................................ 97
Top N .................................................................................................................................... 98
Vendas Cruzadas - Cross Sell ............................................................................................... 98
Regras Determinsticas - Editors Choice ............................................................................. 98
Baseada em Casos ................................................................................................................. 98
Baseada em Contedo ........................................................................................................... 98
Filtragem Colaborativa ......................................................................................................... 99
6

Cuidados e Desafios para Recomendao .......................................................................... 100
22 Sistemas de Groupware ................................................................................................ 103
23 Sistemas de Intranet ..................................................................................................... 103
24 Sistemas de Extranet .................................................................................................... 108
25 Sistemas de Portais Corporativos ................................................................................. 108
26 Sistemas de E-business ................................................................................................. 109
27 Sistemas de Comrcio Eletrnico ................................................................................ 109
Cuidados com Comrcio Eletrnico (CE) .......................................................................... 110
28 Sistemas de Informaes Pervasivos e Ubquos .......................................................... 111
29 Sistemas de Business Intelligence ................................................................................ 114
Big Data - BI preciso ........................................................................................................ 115
BI X Sistemas Gerenciais ................................................................................................... 116
Ferramentas para BI - Anlise OLAP ................................................................................. 117
30 Sistemas de Inteligncia Competitiva .......................................................................... 120
Tcnicas e Ferramentas para Inteligncia Competitiva ...................................................... 122
Anlise SWOT (ou FOFA) .............................................................................................. 122
Otimizao de Mecanismos de Busca ............................................................................. 123
Google Trends ................................................................................................................. 124
Website Grader ................................................................................................................ 126
Sites de concorrentes ....................................................................................................... 126
Tag Clouds (nuvens de palavras) ..................................................................................... 126
Sites de notcias ............................................................................................................... 127
Clipping ou Pushing ........................................................................................................ 127
Alertas ou Filtragem ........................................................................................................ 127
Web Monitor.................................................................................................................... 127
Bases de Patentes ............................................................................................................. 127
Anlise de Reclamaes .................................................................................................. 128
Busca por processos......................................................................................................... 128
Anlise de redes sociais e sentimentos (opinion mining) ................................................ 128
31 Sistemas de Gesto do Conhecimento ......................................................................... 129
Tipos de Conhecimento ...................................................................................................... 131
Etapas da Gesto do Conhecimento .................................................................................... 131
Comunidades de Prticas .................................................................................................... 133
32 Bibliografia Citada ....................................................................................................... 134
33 Bibliografia Complementar .......................................................................................... 137
33.1 Livros sobre Fundamentos de Sistemas de Informao ........................................ 137
33.2 Livros sobre Sistemas de Informao e Apoio a Decises .................................... 137
33.3 Livros sobre Data Warehouse, Data Mining e Recomendaes ........................... 138
33.4 Livros sobre Apoio ao Marketing .......................................................................... 139
33.5 Livros sobre Gesto do Conhecimento, BI e Inteligncia competitiva ................. 140


7



O que um Sistema de Informao (SI)

Um Sistema de Informao (SI) um sistema cujo elemento principal a informao.
J um Sistema, segundo a Teoria Geral de Sistemas, um conjunto de elementos inter-
relacionados com um objetivo comum. O objetivo principal de um SI gerenciar
informaes, ou seja, coletar, armazenar, organizar, tratar, cruzar, disseminar, gerar e fornecer
informaes de tal modo a apoiar decises e processos de uma organizao.
Como sugerem vrios autores, uma Organizao pode ser vista como uma rede
informao deciso ao. Ou seja, para se tomar qualquer atitude preciso antes tomar
decises, e as decises s podem ser tomadas quando dispomos de informao. Portanto, na
era atual da informatizao, a tecnologia est preocupada em apoiar as decises, e no s
fornecer ou processar informaes.
A diferena entre apoiar decises e fornecer informaes para decises bastante
sutil. Vejamos um exemplo. Se um administrador quiser tomar decises sobre aumento no
salrio de seus funcionrios, ele pode recorrer a sistemas que fornecem informaes tais
como:
relatrios sobre percentual de comprometimento do oramento da empresa com a folha de
pagamento, relatrio sobre a situao financeira da empresa (quanto a empresa pode dispor de
aumento), etc. Com base nestas informaes, o administrador pode pensar em percentuais de
aumentos, em aumentos escalonados (por etapas ou por nveis hierrquicos), etc. Tais
sistemas apenas fornecem informaes, pois o administrador ter que fazer ele mesmo os
clculos e verificar os resultados de suas ideias (a partir das alternativas de soluo que foram
pensadas).
Se por outro lado, este administrador dispuser de sistemas que apoiem decises, ele
poder somente entrar com suas ideias (alternativas de soluo) e o sistema calcula as
consequncias. Exemplos: se for dado 5% de aumento, quanto ainda terei de lucro (projeo);
quanto posso dar de aumento para manter um lucro acima de 100 mil reais por ano
(regresso); supondo que a cada ms seja dado 1% de aumento e que os lucros s aumentem
0,5% por ms, quanto terei de lucro ao final de 2 anos (simulao).
Um SI composto de um sub-sistema social e de um sub-sistema automatizado. O
primeiro inclui as pessoas, processos, informaes, documentos, materiais fsicos tais como
mveis, imveis, ferramentas, etc. O segundo consiste dos meios automatizados ou da
chamada Tecnologia da Informao (mquinas, computadores, redes de comunicao,
software). Os elementos deste 2 sub-sistemas esto interligados para que o SI alcance seu
objetivo.
Ao contrrio do que muitos pensam, as pessoas tambm fazem parte do SI. O SI algo
maior que um software, pois alm de incluir o hardware e o software, tambm inclui os
processos (e seus agentes) que so executados fora das mquinas. Isto implica em que pessoas
que no usam computadores tambm faam parte do sistema e, consequentemente, necessitem
ser observadas e guiadas pelos processos de planejamento e anlise de sistemas.
O perigo de no se dar ateno ao aspecto social que os sistemas automatizados
(incluindo o software) no sejam eficazes ou no possam ser utilizados, apesar de estarem
funcionando perfeitamente (pelo menos, em ambientes de teste).
No ambiente real, os aspectos sociais interferem e muito no funcionamento do SI. Por
esta razo, que existem muitos sistemas que, aps implantados, acabam no sendo utilizados
8

ou at mesmo trazendo prejuzos ou dificultando o trabalho nas organizaes. Um exemplo de
tal descuido aconteceu com um supermercado que gastou em torno de 200 mil dlares para
informatizar seus caixas (check-out), com o intuito de eliminar as filas. Entretanto, aps a
implantao do sistema, o que se viu foi que as filas aumentaram. Apesar da estrutura de
automao, alguns problemas de ordem social acabaram por prejudicar o servio. Entre tais
problemas, observou-se: a difcil identificao do local onde est o cdigo de barras
(funcionrio mal-treinado ou etiquetas mal-colocadas), problemas com a leitora tica
(exigindo passar vrias vezes o produto para que o cdigo fosse identificado ou mesmo digit-
lo), problemas na passagem do produto pela leitora do cdigo (etiqueta com o cdigo mal
colocado, molhado, dobrado ou em lugar inacessvel), demora no preenchimento de cheques,
falta de empacotadores ou mesmo sacolas, etc. Note-se que mesmo a caneta necessria para o
cliente assinar o cheque importante neste sistema de informao; se ela faltar, todo o
investimento feito em hardware, software e treinamento de funcionrios ter sido em vo.

O papel dos sistemas de informao conectar dois mundos (figura 1): a Tecnologia da
Informao (TI) e a Organizao.


Figura 1: TI X Organizao comeam distantes

Estes 2 mundos no podem simplesmente ser colados, ou seja, conectados diretamente
(figura 2), porque as organizaes no querem tecnologia (computadores, software, etc). Um
computador colocado dentro de uma organizao no ajuda em nada. preciso algo mais que
isto (mais do que hardware e software).


Figura 2: TI simplesmente alocada na Organizao

O que as organizaes querem da tecnologia so as informaes (figura 3). Isto que
importante para a organizao.


Figura 3: O que a TI tem a oferecer para as Organizaes

Por outro lado, a informao no pode vir do nada. Ela no nasce da tecnologia de
forma espontnea. Quando algum compra um computador, ele at pode vir com software,
mas no vem com informaes. As informaes vm da tecnologia, porque antes a tecnologia
9

coletou e armazenou informaes ou algum colocou informaes para dentro da tecnologia
(figura 4).



Figura 4: Fluxo de Informaes entre TI e a Organizao

Mas esta troca de informaes entre a tecnologia e a organizao mediada e
controlada por algo: a que entram os sistemas de informao (figura 5). A ponte ou canal
por onde passam as informaes o sistema de informao. So estes sistemas que
determinam o que tem que ser coletado da organizao, armazenado na tecnologia (e como
ser armazenado) e o que dever ser devolvido para a organizao. Sem os sistemas de
informao, a tecnologia de nada serve, pois no sabe o que coletar nem o que devolver.


Figura 5: Papel dos Sistemas de Informao, conectando TI e Organizaes

Evoluo dos Sistemas de Informao nas Organizaes

A histria da Informtica nas empresas pode ser entendida por fases.

1 Fase:
No incio do uso da Informtica nas Organizaes, as tecnologias tinham como finalidade
apenas o processamento de dados (incluindo clculos, armazenamento e recuperao rpida
de dados). Seus benefcios principais eram a agilidade e reduo de custos atravs da
mecanizao de tarefas simples.
A 1 fase caracterizada por aplicaes que armazenam grandes quantidades de dados
realizam clculos, tendo por objetivo automatizar tarefas rotineiras.
So caractersticos desta fase sistemas como Controle de Estoque, Folha de Pagamento e
Contabilidade.
At hoje em dia no muito diferente. As organizaes costumam comear a informatizao
por estes tipos de aplicaes.
O objetivo da TI simplesmente processar dados e os sistemas desta poca so denominados
sistemas transacionais ou rotineiros.

10

2 Fase:
Na 2 fase, surgem os relatrios. Os usurios descobrem que possvel extrair novas
informaes a partir dos sistemas existentes. Por exemplo, a partir do sistema de Controle de
Estoque, possvel gerar relatrios dos produtos que mais saem, grficos demonstrando o
nvel de sada de produtos por tempo (ms), permitindo assim ao usurio identificar pocas
em que cada produto sai mais ou menos (sazonabilidade).
nesta fase que proliferam os Sistemas de Informaes Gerenciais.
Aqui o objetivo da TI fornecer informaes para tomada de deciso.

3 Fase:
Esta fase caracterizada por sistemas que procuram descrever o que est acontecendo e por
qu. So sistemas que utilizam ou inferem modelos descritivos. As aplicaes comuns
incluem sistemas de BI, cujo objetivo encontrar causas para problemas ou boas prticas. Por
exemplo, os SIGs apontam quais os produtos que mais vendem ou que menos vendem; j o BI
procura descobrir por que isto (por que um produto vende mais numa poca e menos em
outra).
O objetivo da TI fornecer informaes mais detalhadas para tomada de deciso.

4 Fase:
A 4 fase baseada em modelos preditivos, que buscam descrever o que ir acontecer no
futuro com determinadas variveis, com base em certos valores de entrada. Por exemplo, o
que acontecer com o lucro da empresa ao final do ano, caso as vendas aumentem 1% a cada
ms e os custos sejam reduzidos em 7% a cada bimestre.
nesta fase que surgem os Sistemas de Apoio Deciso (SAD) cuja descrio e diferena
para SIGs ser explicada mais adiante.
E o objetivo da TI apoiar decises (termo que no sinnimo de fornecer informaes para
tomada de deciso, como ser discutido mais adiante tambm).
Hoje, autores esto utilizando termos como Business Analytics e Predictive Analytics para
caracterizar aplicaes desta fase.

Podemos dizer que a maioria das empresas est saindo da 2 fase. Algumas j se encontram
desenvolvendo ou mesmo utilizando aplicaes de 4 fase.

Bom e uma 5 fase ? Esta seria a fase em que a TI passa a tomar decises ou pelo menos
sugerir alternativas. Apesar de existirem sistemas que fazem isto, ainda estamos longe deste
cenrio imaginado por Isaac Asimov.


Objetivo deste livro e a quem se destina

Este livro apresenta 31 tipos de Sistemas de Informao. Para todos tipos, h um
objetivo especfico, que o diferencia dos demais. O texto tambm procurar explicar o
funcionamento e as aplicaes de cada tipo.
Quando possvel, o livro ir aprofundar tcnicas de implementao de alguns tipos, ou
seja, como torn-los concreto, sem necessariamente falar de programao de computadores. A
11

ideia poder falar de tecnicalidades, que ajudem o leitor a entender o funcionamento dos
sistemas mas que principalmente ajude a desmistificar a TI, mostrando que tais sistemas no
so fico cientfica.
O livro ajuda profissionais de todas as reas a entenderem como a TI pode ser
empregada nos diferentes tipos de organizaes, seja empresas com ou sem fins lucrativos,
rgos e empresas pblicas, e mesmo instituies, associaes e entidades. As diferentes
aplicaes discutidas no livro servem como benchmarking para futuras implantaes. H
exemplos de aplicaes no s para empresas mas tambm para as reas de sade, educao,
engenharias, gesto de trfego e mobilidade e outras.
O livro tambm serve de introduo a estudantes de cursos de TI (Computao,
Sistemas de Informao, Anlise e Desenvolvimento de Sistemas, Sistemas para Internet),
dando uma viso geral das diferentes maneiras de aplicar tecnologias da informao nas
organizaes e os ganhos que podemos obter. E serve para interessados em implementar e
implantar tais sistemas, discutindo tcnicas de como faz-los acontecer na sua organizao.




Os 31 Tipos de Sistemas de Informao


A seguir, sero detalhados vrios tipos de SIs possveis de serem utilizados em
organizaes. Os sistemas foram classificados de acordo com seus objetivos e tipos de
informaes que manipulam, mas nada impede que um mesmo SI, encontrado em alguma
organizao, esteja classificado em mais de um tipo.
Os objetivos so diferentes, porque h especializaes. No fundo, todos SIs tm por
objetivo gerenciar informaes para apoiar decises. Mas a forma como as informaes so
manipuladas ou mesmo as diferentes formas de representao da informao, bem como os
diferentes modos de apoiar decises e gerenciar as informaes que do origem a diferentes
tipos e, portanto, da vem esta nossa classificao.
Alguns autores podem no concordar com esta classificao. Ela uma das formas de
organizar os tipos de SIs, principalmente para que as pessoas entendam como a TI pode
ajudar pessoas e organizaes. A ordem dada tenta seguir uma evoluo histrica dos SIs e
uma ordem crescente de complexidade e modernidade. Entretanto, apenas uma viso do
autor e no segue nenhum rigor cientfico. Os tipos so o reflexo das experincias do autor
como professor, consultor e analista de sistemas durante mais de 20 anos.
Note, caro leitor, que a alguns tipos foram dedicadas mais pginas, ou por serem mais
modernos ou mais utilizados no contexto atual. Por exemplo, segundo pesquisas recentes, os 3
tipos em que as empresas mais investem atualmente so ERP, CRM e BI. Por isto, deveria
haver mais contedo sobre estes tipos. Entretanto, como ERP um tema bastante dependente
de fornecedores, o seu espao foi diminudo.
O leitor tambm poder notar que os tipos mais para o final parecem ser de maior
complexidade e por isto fazem uso de tipos mais bsicos ou precisam destes tipos para ter
suas informaes de entrada. Isto reflete a evoluo dos SIs de aplicaes operacionais para
tticas e estratgicas (da parte de baixo da pirmide organizacional Estratgico-Ttico-
Operacional para os nveis mais acima). Este fluxo representa o ideal de uma organizao,
12

onde o nvel operacional suporta as decises tticas que por sua vez servem para atingir os
objetivos estratgicos.



1 Sistemas de Informao Rotineiros ou Transacionais (SIRs,
SITs, SPTs)
Objetivo: processar dados, isto , armazenar e recuperar dados e realizar clculos sobre os
dados.

Os sistemas Rotineiros so os mais simples e os mais comuns nas organizaes. Eles
apoiam as funes operacionais da organizao, aquelas realizadas no dia-a-dia. Por isto, so
facilmente identificados no nvel operacional da organizao.
Geralmente, so os primeiros a serem implantados, apesar de esta no ser
necessariamente uma regra. A razo que so os mais fceis e baratos de serem
implementados (ou adquiridos). Alm disto, formam a plataforma bsica de TI numa
organizao, permitindo coletar, armazenar e disseminar as informaes bsicos, de onde
surgem ento os sistemas mais avanados (gerenciais e de apoio deciso).
Os Rotineiros tm por objetivo processar dados, isto , fazer clculos, armazenar e
recuperar dados (consultas simples), ordenar e apresentar de forma simples dados para os
usurios. Seu benefcio principal a agilizao nas rotinas e tarefas, incluindo documentao
rpida e eficiente, busca acelerada de informaes e clculos rpidos e precisos.
Entre os Rotineiros, incluem-se: sistemas de cadastro em geral (incluso, excluso,
alterao e consulta), como de clientes, produtos e fornecedores; os sistemas de contabilidade
e financeiros (contas a pagar e a receber, balanos, fluxo de caixa, etc); sistemas de vendas e
distribuio (pedidos, entregas), folha de pagamento, controle de estoque e sistemas de
compras simples.
No mercado hoje existem inmeros produtos de software prontos (pacotes de software
ou software de prateleira) para serem adquiridos, a preos bem acessveis, o que pode ser mais
vantajoso do que desenvolver o software por conta prpria ou com terceiros. Entretanto, o
grande problema a integrao entre estes produtos. Muitas empresas compram um sistema
rotineiro de um fornecedor (por exemplo, financeiro) e outro rotineiro de outro fornecedor
(estoque e vendas, por exemplo). Quando for necessrio transitar dados de um sistema para
outro, ser necessrio desenvolver mdulos especficos ou mesmo fazer manualmente tais
tarefas (problema que resolvido com o software do tipo ERP, que ser visto mais adiante).

2 Sistemas de Gesto de Suprimentos
Objetivo: controlar bens materiais da Organizao (produtos, peas, matrias primas e
materiais diversos), incluindo gerenciamento da composio, aquisio e fluxo de materiais
por toda a cadeia produtiva. Este tipo de sistema uma evoluo dos antigos sistemas
chamados MRP I e II (Manufacturing Resource Planning).

Os problemas comuns quando se administra materiais esto listados abaixo. E junto com cada
explicao, tambm j so sugeridas solues, as quais fazem parte das funcionalidades de um
sistema de Gesto de Suprimentos.

Comprar o que j existe em estoque
Isto acontece geralmente quando no h controle do que existe no estoque. Entretanto, mesmo
em ambientes informatizados o problema pode continuar ocorrendo. Isto porque muitas vezes
as pessoas no atualizam as informaes no sistema (seja sada de material ou chegada).
Uma das maneiras de resolver tal problema utilizando cdigos de barra ou chips de RFID
nos materiais.
O cdigo de barra utilizado atualmente no Brasil o padro EAN13, com 13 dgitos. O
problema que no possvel colocar este cdigo em todos os prod
banana ou cordo de calados com cdigos de barra. Alm disto, 13 dgitos s servem para
identificar o produto e s. Informaes sobre validade, formas de armazenamento, localizao
e preo ficam fora (no sistema).
Um substituto possvel para o cdigo de barras o QR Code, que permite armazenar
caracteres (Figura 6). Ele necessita de um software especial (disponvel para todos os
aparelhos, inclusive celulares mais antigos), que interpreta a imagem gerando o texto
correspondente (o qual pode incluir um link para uma pgina web).


Figura 6: Exemplo de QR Code

Cdigos de barra e outros tipos de cdigos como QR no resolvem totalmente o problema,
visto que ainda preciso pessoas para passar os produtos pelo leitor. Uma forma de tornar o
processo menos dependente de pessoas utilizar RFID.
por rdio-frequncia) funciona conectando chips e antenas. Chips (ou etiquetas inteligentes)
instalados em produtos emitem uma frequncia nica, que funciona como um cdigo de
identificao. As antenas reconhecem o produto pela frequncia rec
RFID sobre cdigos de barra que no so necessrias pessoas para posicionar o cdigo na
direo da leitora; basta passar o produto pela zona de alcance da antena (a distncia no
muito grande). Isto tende a diminuir erros humanos;
fisicamente por certos caminhos. Desta forma, um produto identificado quando entra num
caminho (por uma antena ali presente), quando entra num prdio ou sala, quando passar por
um corredor e assim por diante.
13
omprar o que j existe em estoque
nte quando no h controle do que existe no estoque. Entretanto, mesmo
em ambientes informatizados o problema pode continuar ocorrendo. Isto porque muitas vezes
as pessoas no atualizam as informaes no sistema (seja sada de material ou chegada).
Uma das maneiras de resolver tal problema utilizando cdigos de barra ou chips de RFID
O cdigo de barra utilizado atualmente no Brasil o padro EAN13, com 13 dgitos. O
problema que no possvel colocar este cdigo em todos os produtos. Imagine alface,
banana ou cordo de calados com cdigos de barra. Alm disto, 13 dgitos s servem para
identificar o produto e s. Informaes sobre validade, formas de armazenamento, localizao

vel para o cdigo de barras o QR Code, que permite armazenar
. Ele necessita de um software especial (disponvel para todos os
inclusive celulares mais antigos), que interpreta a imagem gerando o texto
correspondente (o qual pode incluir um link para uma pgina web).

: Exemplo de QR Code (gerado com http://qrcode.kaywa.com/
Cdigos de barra e outros tipos de cdigos como QR no resolvem totalmente o problema,
visto que ainda preciso pessoas para passar os produtos pelo leitor. Uma forma de tornar o
processo menos dependente de pessoas utilizar RFID. A tecnologia de RFID (
frequncia) funciona conectando chips e antenas. Chips (ou etiquetas inteligentes)
instalados em produtos emitem uma frequncia nica, que funciona como um cdigo de
identificao. As antenas reconhecem o produto pela frequncia recebida. A vantagem do
RFID sobre cdigos de barra que no so necessrias pessoas para posicionar o cdigo na
direo da leitora; basta passar o produto pela zona de alcance da antena (a distncia no
muito grande). Isto tende a diminuir erros humanos; basta obrigar o produto a passar
fisicamente por certos caminhos. Desta forma, um produto identificado quando entra num
caminho (por uma antena ali presente), quando entra num prdio ou sala, quando passar por

nte quando no h controle do que existe no estoque. Entretanto, mesmo
em ambientes informatizados o problema pode continuar ocorrendo. Isto porque muitas vezes
as pessoas no atualizam as informaes no sistema (seja sada de material ou chegada).
Uma das maneiras de resolver tal problema utilizando cdigos de barra ou chips de RFID
O cdigo de barra utilizado atualmente no Brasil o padro EAN13, com 13 dgitos. O
utos. Imagine alface,
banana ou cordo de calados com cdigos de barra. Alm disto, 13 dgitos s servem para
identificar o produto e s. Informaes sobre validade, formas de armazenamento, localizao
vel para o cdigo de barras o QR Code, que permite armazenar 4296
. Ele necessita de um software especial (disponvel para todos os
inclusive celulares mais antigos), que interpreta a imagem gerando o texto
http://qrcode.kaywa.com/)
Cdigos de barra e outros tipos de cdigos como QR no resolvem totalmente o problema,
visto que ainda preciso pessoas para passar os produtos pelo leitor. Uma forma de tornar o
A tecnologia de RFID (identificao
frequncia) funciona conectando chips e antenas. Chips (ou etiquetas inteligentes)
instalados em produtos emitem uma frequncia nica, que funciona como um cdigo de
A vantagem do
RFID sobre cdigos de barra que no so necessrias pessoas para posicionar o cdigo na
direo da leitora; basta passar o produto pela zona de alcance da antena (a distncia no
basta obrigar o produto a passar
fisicamente por certos caminhos. Desta forma, um produto identificado quando entra num
caminho (por uma antena ali presente), quando entra num prdio ou sala, quando passar por
14

Estes chips j so utilizados na Frmula 1 e corridas de Rally h muitos anos, para identificar
cada carro que passa por um ponto de controle. Hoje tambm esto sendo utilizados em carros
para liberar cancelas de pedgios.
Os chips so finos e baratos; as antenas que so caras. Em breve, a maioria dos
supermercados e lojas esto usando estes chips em seus produtos. Desta forma, o cliente nem
precisar tirar os produtos do carrinho ao passar pelo caixa (check-out). Mas de novo, fica
difcil colocar chips no alface e em produtos muito pequenos (ou muito baratos; o chip ser
mais caro que o produto).
Estes chips so diferentes dos chips magnticos de algumas lojas, que apenas possuem 2
estados: magnetizado ou no; e quando passam por entre barras, fazem soar apitos. A
tecnologia de RFID tambm facilita o processo de inventrio.
Mesmo com estas solues, problemas ainda podem ocorrer porque as pessoas utilizam
termos diferentes para designar os mesmos produtos. Ento uma pessoa cadastra o produto
com um nome (por exemplo, celular Samsung Y) e outra pessoa procura no sistema o mesmo
produto mas usando outro nome tambm associado ao produto (celular Samsung Young) ou
seu cdigo de mercado (GT-S5360). Ao no encontrar o produto, faz o pedido de compra.
Uma tentativa para resolver tal problema criar uma classificao universal para todo tipo de
produto (iniciativa chamada de Global Product Classification - GPC). Isto tambm facilitar o
comrcio exterior, permitindo que empresas de lnguas diferentes faam acordos de compra e
venda sem confuses. Entretanto, cada novo produto dever ser includo nesta classificao. E
o problema pode aumentar quando for necessrio refazer a classificao, por exemplo,
incluindo ou combinando categorias.
Outra soluo possvel utilizar funes de avaliao de similaridade entre descries
textuais (por exemplo, funes tipo "edit distance").

Comprar itens que esto faltando quando h similares ou compatveis em estoque
Em muitos casos, quando um funcionrio precisa de um item e no unidades disponveis no
estoque, h a possibilidade de serem utilizados produtos similares ou compatveis. Da mesma
forma, ao produzir algo formado por diversos componentes, este tipo de problema tambm
pode ocorrer. Neste caso, uma soluo possvel armazenar informaes sobre a estrutura de
produtos (bill of material), indicando quais os componentes, como devem ser integrados e
quais podem substituir outros.


No saber de que fornecedor veio determinada pea, nem para onde foi (cliente ou
armazm)
A soluo o rastreamento de origem e de uso (destino). Cdigos de barra e chips RFID
podem ajudar neste caso. Uma das vantagens poder identificar fontes de problemas quando
so encontrados defeitos na qualidade do produto final. Especialmente, quando certos itens
so adquiridos de diferentes fornecedores, o rastreamento permite saber de qual fornecedor
veio cada item. claro que, em alguns casos, isto no ser possvel (como colocar algum tipo
de identificador em cadaros de sapatos ?).


15

Supply Chain
Neste tipo de sistema, tambm se incluem solues para gerenciamento da cadeia de
suprimentos (supply chain). Tais sistemas permitem controlar rotas de transporte e status de
produtos (onde esto, quanto tempo demorar para chegar).
Como empresas que vendem pela Internet, como sites de comrcio eletrnico ou livrarias,
conseguem entregar to rapidamente seus produtos ? Primeiro, tais empresas procuram
diminuir seus estoques. A Amazon cohecida como uma livraria sem livros. Seu catlogo
extenso, mas no nem todos esto em estoque. Quando algum finaliza uma compra, a rede de
contatos iniciada. Comea por avisar o fornecedor que determinado item foi vendido.
Depois, preciso planejar a logstica da entrega. Isto requer empresas parceiras (terceiros) que
possam ajudar no transporte, uma vez que a empresa que vendeu nem sempre tem todos os
recursos em seu patrimnio (armazns, caminhes, avies, etc). Tudo deve estar sincronizado,
para evitar que um produto "durma" (passe uma noite) em determinado local. Armazenagem
custo, porque preciso um local e pessoas para administrar tal local. Ento, produtos no
devem ficar parados, devem estar sempre em trnsito.
A rota pode ser simulada por sistemas de simulao que sero discutidos adiante. Isto ajudar
a determinar a melhor utilizao dos recursos como armazns e transporte. Assim, como no
bom que um produto "durma" em um local, tambm no vale a pena utilizar um meio de
transporte para levar somente um produto. Mas talvez esperar um caminho lotar pode atrasar
a entrega.
Mais adiante falaremos dos sistemas geogrficos que tambm ajudam neste tipo de soluo.



3 Sistemas de Gesto Empresarial ou Gesto Integrada - ERP
Objetivo: unir e integrar os diversos sistemas rotineiros ou transacionais de uma organizao.
Permitem integrar os departamentos, de forma a agilizar processos e troca de informaes
entre setores. Por exemplo, quando uma venda feita, a entrada dada no sistema rotineiro de
Vendas, mas o sistema de produo e o sistema de compras j ficam sabendo o quanto tero
que produzir. ainda gerar o Just-in-time (produo por demanda, sem estoques).

Os pacotes de software para ERP (Enterprise Resource Planning) oferecem mdulos
para os diferentes setores de uma empresa, tais como compras, estoque, vendas, RH,
financeiro, produo, etc.

Uma das vantagens do sistema de ERP diminuir estoques atravs da metodologia de
Just-in-time (produo por demanda). Somente ser iniciada a produo de um item quando
uma venda for efetivada. Montadoras de automveis e at mesmo a Dell Computadores
utilizam processos de produo segundo esta filosofia. Isto tambm garante a produo
personalizada, ou seja, o produto final sai como o cliente deseja (pois produzido a partir das
escolhas do cliente e somente aps sua deciso final).

Agora imagine um pacote de software que possa ser utilizado por diferentes tipos de
empresas (financeiras, indstrias, servios, vendas no varejo, escolas, etc). Qual a mgica ?
Estes pacotes possuem mdulos para a maioria dos processos que possam ser pensados.
Entretanto, nem sempre os processos definidos no software de pacote so adequados aos
processos da organizao cliente. Cada organizao pode ter pequenas diferenas no seu
16

modo de trabalhar, mesmo sendo de um ramo que pouco se modifica. Para solucionar tal
problema, os pacotes de ERP podem ser parametrizados, isto , adaptados ao ambiente local.
A contrapartida disto, que muitas vezes os pacotes so to difceis de serem ajustados, que
se faz necessria uma equipe tcnica experiente no pacote (uma espcie de consultoria) para
realizar o trabalho extra. E tal custo maior que as licenas do software.
Outra dificuldade que todo processo de automatizao acaba por alterar os processos
atuais da organizao. Isto exige uma equipe multidisciplinar para planejamento dos novos
processos automatizados, envolvendo pessoas da organizao cliente (de vrios setores e
nveis hierrquicos) e tambm uma equipe de analistas de negcios, que conheam bem o
software e que consigam entender o ambiente do cliente (e isto pode demandar muito tempo).
Alm disto tudo, a etapa de implantao demorada e exige refinamentos (na
parametrizao e na definio dos processos). Em grandes empresas, a implantao de um
ERP pode levar mais de 2 anos.
Outra possibilidade de adaptao destes pacotes a customizao, ou seja, gerar
mdulos especficos para exigncias do cliente. Normalmente, isto exige programao de
novos cdigos de computadores.


4 Sistemas de Informaes Gerenciais (SIGs)
Objetivo: fornecer informaes para a tomada de deciso.
Como o prprio nome diz, os SIGs (ou MIS Management Information Systems)
surgiram com o intuito de auxiliar gerentes em suas funes. Com o passar do tempo, este
tipo de sistema acabou sendo usado por qualquer funcionrio que tome decises.
SIGs so sistemas que fornecem relatrios. Inicialmente, os relatrios eram textuais.
Hoje temos uma variedade de recursos grficos para apresentar informaes, tais como
grficos em barras, linhas, pizza, coordenadas paralelas, redes e hierarquias, 3D, mapas, etc.
Esta rea de pesquisa chamada de "visualizao de informaes".
Neste tipo de sistema, o usurio deve solicitar de alguma forma (escolha por menus,
uso de comandos, seleo de atributos, uso de filtros) a informao que necessita, e o SIG
procura em seus registros tal informao e a apresenta da melhor maneira possvel ao usurio.
importante que o relatrio tenha o nvel de detalhe adequado ao usurio: no pode
ser muito detalhado ou extenso (seno o administrador ter que procurar a informao
desejada), nem pode ser resumido demais (seno o relatrio poder omitir detalhes
importantes para a tomada de deciso).
Os SIGs aparecem nos 3 nveis da pirmide administrativa (estratgico, ttico e
operacional), sempre que houver alguma deciso sendo tomada.
Um caso especial de SIG so os EIS (Executive Information Systems), que
possibilitam diferentes vises dos dados de uma organizao, atravs de operaes tipo zoom.
Por exemplo, numa empresa que fabrica produtos de beleza, pode-se ver a produo por filial
ou por regio ou ento analisar em detalhe o desempenho de cada gerente de produo (zoom
in). Por outro lado, pode-se verificar a produo por produto especfico ou por categorias de
produto.
Quem tiver maior interesse por como construir grficos pode ler a seguinte referncia:
BERTIN, Jacques. Semiology of Graphics: Diagrams, Networks, Maps. University of
Wisconsin Press, 1983.

17

Os relatrios so as ferramentas mais bsicas para a tomada de deciso. Nem por isto
diminuram sua importncia. Por exemplo, vejamos o problema do estoque.

O problema do estoque
Nenhuma empresa quer perder uma venda. Por isto, quando o cliente demandar, ela
deve ter produtos para vender, especialmente se a venda for por pronta entrega.
Entretanto, produtos demais em estoque geram desperdcio e custos para a empresa,
encarecendo o valor final para o cliente. Isto porque, primeiro, a empresa precisar de espao
para armazenar os produtos e mais funcionrios para lidar com quantidades maiores. Alm
disto, h a possibilidade de produtos estragarem por mau uso, mau armazenamento ou
simplesmente por perderem a validade por demorarem a serem vendidos (produtos
perecveis). Outro problema com estoques que a empresa precisa de capital de giro (dinheiro
para comprar; enquanto o lucro s vem no momento da venda). E isto tudo capital
imobilizado, ou seja, sem produzir (e se a empresa precisar do dinheiro, ter que fazer
promoes rpidas diminuindo o lucro).
Por estas razes, todas as empresas querem diminuir seus estoques a nveis mnimos,
garantindo que no faltar item quando o cliente demandar, mas que tambm no haver
quantidades em excesso.
Assim, os SIGs mostram seu valor. Eles permitem empresa saber exatamente quanto
de cada item vendido por ms ou semana (por anlise estatstica) e comparar com o tempo
que demoram para chegar aps o pedido de compra ser efetivado. Tais informaes (preciso
nas estimativas de venda e tempo de compra) auxiliam o gerente a determinar o momento
exato para disparar um pedido de compra.
Relatrios temporais tambm podem demonstrar sazonabilidades, isto , pocas em
que os produtos mais saem, melhores vendedores, comparaes entre lojas, nveis de
produtividade por funcionrio, etc.
importante salientar que os SIGs so construdos em cima de sistemas rotineiros ou
transacionais. Isto , os rotineiros que devem coletar e armazenar os dados, enquanto que o
SIG gera novas informaes a partir das que esto armazenadas. Ento, antes de construir um
SIG, a empresa j deve ter os rotineiros em produo.


5 Sistemas de Apoio Deciso (SADs)
Objetivo: apoiar decises.

SADs (ou DSS Decision Support Systems) devem fazer mais que fornecer
informaes para tomada de deciso. Eles devem interagir com seus usurios como se fossem
auxiliares humanos, lembrando coisas ou criticando possibilidades levantadas pelo usurio.
A diferena entre SIGs (que fornecem informaes para decises) e SADs (que
apoiam decises) que os primeiros apenas retornam dados conforme solicitaes (por
exemplo, qual o custo total para produzir 100 unidades de tal produto), enquanto que os SADs
auxiliam os tomadores de deciso avaliando as consequncias de certa decises, antes que
sejam tomadas.
Um SAD recebe como entrada alternativas para soluo de um problema e devolve as
consequncias para cada alternativa. Por exemplo, um gerente querendo definir o preo final
de um produto, pode utilizar um SAD para saber se ter lucro vendendo o produto a um preo
18

X, sabendo que a previso de vendas Y durante Z meses, e que o custo por unidade de W
valores monetrios.
O SAD interativo (usurio pode entrar com vrias alternativas e receber vrios
resultados), enquanto que o SIG recebe uma entrada (por exemplo, pedido de relatrio de
vendas por produto) e gera uma sada para esta entrada (um relatrio somente).
O SAD avalia as alternativas atravs de tcnicas tipo what-if (e-se), simulando uma
tomada de deciso (e se eu fizer isto, o que acontecer?). Assim o administrador pode
avaliar qual a melhor alternativa, comparando as sadas de cada alternativa. Deve ficar bem
claro que o SAD no indica qual a melhor deciso, nem aponta alternativas. Isto trabalho
humano, criativo (por exemplo, como baixar custos sem demitir pessoas).


O modelo de representao da deciso dever utilizar frmulas matemticas e tcnicas
como projeo e regresso. Para tanto, a deciso deve ser estruturada, ou seja, deve ter seus
passos bem conhecidos. Exemplos de decises no-estruturadas so: escolher uma namorada
(que critrios so utilizados ? ou apenas o corao ?) e como comer um prato tipo a la minuta
(por onde comear ? e depois do 1o passo, o que comer em seguida ?).
Alm disto, o modelo deve utilizar somente informaes estruturadas (por exemplo,
valores numricos). Como embutir num SAD dados subjetivos como qualidade de um filme
para poder prever a bilheteria que vai gerar ? Tal tipo de informao dever antes ser
quantificada (por exemplo, categorizar filmes em faixas de bilheteria, de acordo com nmero
de prmios recebidos).
Depois de criado o SAD, ele s servir para pessoas que tomam decises com o
modelo que foi embutido. Se outra pessoa utilizar dados diferentes, o SAD no lhe ser til.
H casos em que SADs so impostos pela alta administrao, como por exemplo SADs para
auxiliar gerentes de financeiras a decidir investimentos. Neste caso, quem toma a deciso
dever adaptar seu processo estrutura do SAD.

Vejam o exemplo a seguir, um SAD que auxilia pessoas a investirem em previdncia privada.
Seu modelo s utiliza 3 variveis: a mensalidade (o quanto a pessoa dever investir todo ms),
o tempo do investimento (por quanto tempo ela dever pagar a previdncia, em anos) e o
valor mensal que ir receber quando se aposentar. O usurio deste SAD deve fornecer como
entrada dois destes valores (qualquer combinao) e o SAD ir calcular o valor da 3a varivel.
Ento digamos que o investidor queira desembolsar 500 reais por ms durante 15 anos. Dando
entrada com estes valores no referido SAD, a sada dada pelo SAD ser "R$ 832,63",
indicando que o investidor receber mensalmente este valor, aps os 15 anos de contribuio
(situao "a" da Figura 7).
Olhando de outra forma, digamos que a pessoa pensa que s pode contribuir com 500
reais por ms, mas tem ideia de uma meta, de quanto deseja receber futuramente (digamos
que seja 2 mil reais). Com estes valores como entrada (situao "b" da Figura 7), o SAD
retornar como resultado o valor correspondente a 21 anos (de contribuio). H ainda a
possibilidade de a pessoa pensar numa renda futura como meta e determinar que s deseja
contribuir durante 12 meses, ento o SAD dar como resultado a contribuio mensal que a
pessoa deve pagar hoje, que neste caso seria de R$ 314,70 (situao "c" da Figura 7).


(a)
Contribuio mensal R$ 500,00
(b)
Contribuio mensal R$ 500,00
(c)
Anos de contribuio 12
19

Anos de contribuio 15
Renda mensal futura R$ 832,63
Renda mensal futura R$ 2.000,00
Anos de contribuio 21
Renda mensal futura R$ 300,00
Contribuio mensal R$ 314,70
Figura 7: Exemplo de SAD para investimentos em prividncia privada


No h nenhum milagre nisto. O SAD um software e deve ser programado por
pessoas. Para que ele possa gerar as sadas, necessrio embutir nele um modelo de deciso.
O modelo mais simples o que usa frmulas matemticas. Assim, quando so fornecidos
certos valores, o SAD simplesmente usa as frmulas para calcular os valores em aberto. Para
evitar que seja necessrio fornecer quase todos os valores a cada rodada de avaliao, pode-se
fixar algumas variveis, isto , determinar que alguns valores sero fixos durante o processo
de tomada de deciso. Vejamos um exemplo.
Digamos que o gerente de uma indstria precise determinar o preo final de um
produto. Para esta deciso, ele dever usar como parmetros o custo unitrio de produo do
produto, a estimativa de vendas (quanto maior o valor, menor a expectativa de vendas e vice-
versa), as despesas gerais (custos fixos) e sempre ter como meta o resultado final, ou seja,
que sua deciso gere lucro para a empresa.
A Figura 8 apresenta as frmulas que compem o modelo de deciso para este SAD.
Vale lembrar que outros gerentes podem usar modelos diferentes, com informaes diferentes
(ento este SAD s funciona para o modelo proposto).


(1) lucro = receitas total-de-despesas
(2) receitas = quantidade vendida X preo-final
(3) preo-final = custo-unitrio X margem-de-lucro
(4) total-de-despesas = custos-de-produo + despesas-gerais
(5) custos-de-produo = quantidade produzida X custo-unitrio
Figura 8: Frmulas para o SAD do preo final do produto


Como o normal que a empresa produza a quantidade que espera vender para reduzir
estoques, as variveis "quantidade vendida" e "quantidade produzida" so equiparadas ou
unidas, formando uma nica varivel.

As variveis grifadas em vermelho indicam valores fixos, ou seja, no sero
modificados durante o processo de tomada de deciso. Estes valores normalmente vm de
SIGs, ou seja, o usurio ou SAD deve receber tais valores de relatrios vindos de SIGs e
inseri-los no SAD. Aps feito isto, estes valores no sero mais alterados.
Sendo assim, o gerente comea o processo de tomada de deciso. Digamos que os
valores fixados sejam de 20 reais para o custo unitrio e 1000 reais para as despesas gerais. O
gerente ento observa atravs de SIGs o histrico de vendas para este tipo de produto. E
verifica que o normal vender 60 unidades nesta poca; ento coloca este valor como entrada
no SAD. Depois, ele fornece como entrada a margem de lucro normalmente utilizada pela
empresa (digamos que 10%). Aps estes passos, o SAD j tem informaes suficientes para
calcular as demais variveis.
Utilizando a frmula (5), o SAD obtm os custos de produo, uma vez que o valor do
custo unitrio foi fixado e a quantidade foi fornecida pelo usurio como entrada. Com o valor
calculado dos custos de produo, o SAD calcula o total de despesas utilizando a frmula (4).
20

Com a frmula (3) e o valor da margem de lucro fornecido como entrada pelo usurio, o SAD
calcula o valor do preo final. Com este valor aplicado frmula (2), o SAD calcula as
receitas. Como as receitas e o total de despesas j foram calculados antes, o SAD pode utilizar
a frmula (1) para gerar o resultado "lucro", podendo informar ao usurio se ele ter lucro
(valor positivo) ou prejuzo (valor negativo), dentro deste contexto.

Esta foi uma interao feita pelo usurio com o SAD. Outras interaes devem ser
feitas para avaliar diversas possibilidades. Isto quer dizer que o usurio do SAD (gerente que
toma a deciso) poder fornecer valores de entrada diferentes, por exemplo, alternativas para
a margem de lucro ou para o quantidade a ser produzida (e vendida).
Alm disto, as frmulas so desdobrveis e podem ser combinadas. Ento, o usurio
pode entrar com combinaes diferentes de variveis. Por exemplo, o gerente analisa o preo
de venda do principal concorrente e admite que deve vender no mesmo patamar (digamos que
seja de 20 reais). Isto faz com que o SAD j calcule direto a margem de lucro. E digamos que
ele utilize o mesmo valor para quantidade produzida/vendida. Da mesma forma, o SAD ir
calcular custos de produo, total de despesas, receitas e lucro.
Agora digamos que o gerente tenha uma meta de lucro, imposta pela alta
administrao. Se ele entrar com o preo final ou margem de lucro, o SAD ir calcular a
quantidade a ser produzida ou vendida. Seria o mesmo que o SAD dizer "se tu quer este lucro
a este preo de venda, ters que vender X unidades". Por outro lado, com a mesma meta de
lucro, se o gerente fornecer valores para a quantidade vendida, o SAD ir determinar o valor
do preo final e a margem de lucro ("se voc quiser ter este lucro com esta quantidade
vendida, ters que vender o produto neste preo final").
As 3 variveis principais nesta deciso so o preo final, quantidade e lucro. As
demais so variveis intermedirias, utilizadas para se chegar ao resultado. Sendo assim, a
Figura 9 apresenta exemplos de interaes possveis. Isto , se o usurio fornecer que
parmetros como entrada, que variveis sero retornadas como resultado pelo SAD.



Entradas (alternativas) Sadas (consequncias)
Margem de lucro Somente preo final
Preo final Somente margem de lucro
Preo final e quantidade Lucro
Preo final e lucro Quantidade
Lucro e quantidade Preo final e margem de lucro
Figura 9: Tabela com exemplos de interaes possveis

Agora imagine se o usurio gerente quiser fornecer como entrada valores para lucro,
quantidade e preo final. Poder haver um conflito. Ento note que o SAD pode ser flexvel o
suficiente para aceitar mudanas nos valores fixados ou mesmo aceitar desfixar tais valores.
Por exemplo, poderamos desfixar o valor do custo unitrio. Sendo assim, ao fornecer como
21

entrada valores para lucro, quantidade e preo final, o SAD ir dar como resultado o valor do
custo unitrio, como que dizendo "olha ... tu ters que produzir cada unidade com este custo
para poder chegar ao lucro pretendido".




6 Sistemas Especialistas
Objetivo: tomar decises.
Sistemas especialistas so caractersticos da etapa ainda no alcanada pela TI, onde
pessoas podero ser substitudas por sistemas automatizados no processo de deciso. No
precisamos pensar em fico cientfica para imaginar ou mesmo ter sistemas especialistas
atuando em nossas organizaes. H maneiras diferentes de embutir conhecimento em
sistemas de informao para que eles possam tomar decises sozinhos. E algumas destas
maneiras so bastante simples.
A seguir so discutidas algumas formas de implementao de sistemas especialistas.

Solues procedurais ou algortmicas
Um sistema especialista pode ser construdo com algoritmos, que so sequncias de passos
bem conhecidos. Por exemplo, sistemas que utilizam clculos complexos podem ser
implementados assim.

Uso de regras determinsticas (sistemas baseados em conhecimento
determinstico)
Estes sistemas utilizam regras do tipo Se-Ento, onde na parte "se" so determinadas
condies e, se estas forem verdadeiras ou quando estas forem verdadeiras, as aes
especificadas na parte "ento" sero disparadas.
Por exemplo, uma empresa pode construir um sistema especialista que fique observando os
nveis de estoque e quando um produto atingir o valor chamado de "estoque mnimo", uma
determinada ao ser disparada. A regra seria assim:
Se quantidade de produto = valor do estoque mnimo
Ento executar(pedido de compra)

A caracterstica principal das regras determinsticas que as condies determinam a ao,
no sendo necessrio fazer outros tipos de avaliaes como probabilidades e contexto, como
discutido a seguir em sistemas que utilizam regras probabilsticas.
Neste tipo de sistema, pode haver inmeras regras e elas no so avaliadas ou executadas em
sequncia. O sistema deve possuir um mecanismo de avaliao constante das condies
especificas na parte "se" de todas as regras. Isto pode ser implementado com tcnicas como
"triggers" ou "stored procedures" em sistemas gerenciadores de bancos de dados.
Qualquer ao pode ser disparada, desde que a condio correspondente seja verdadeira.


Tabelas de deciso e rvores de deciso
Quando o nmero de regras muito grande, pode
as regras. Este tipo de soluo chamada "tabela de deciso" mas exige que todas as regras
utilizem os mesmos parmetros de a
resultado.
A Figura 10 apresenta um exemplo de tabela para auxiliar na deciso de dar ou no
emprstimo para um cliente de banco, contendo regras onde so avaliadas condies que
combinam os seguintes parmetros: valor solicitado, idade e se o cliente tem conta ou no. O
resultado ser aprovar ou rejeitar o pedido de emprstimo.


Figura 10: exemplo de tabela de decis

Quando a tabela de deciso muito grande, fica difcil analisar manualmente as regras ou
mesmo para um software avaliar todas as condies de forma eficiente e chegar rapidamente
resposta. Ento, uma alternativa ut
pelas mesmas regras mas as organizam de forma grfica para uma melhor avaliao visual.


22
e rvores de deciso
Quando o nmero de regras muito grande, pode-se utilizar uma tabela para organizar melhor
soluo chamada "tabela de deciso" mas exige que todas as regras
utilizem os mesmos parmetros de avaliao na condio e tenham o mesmo tipo de sada ou
apresenta um exemplo de tabela para auxiliar na deciso de dar ou no
m cliente de banco, contendo regras onde so avaliadas condies que
combinam os seguintes parmetros: valor solicitado, idade e se o cliente tem conta ou no. O
resultado ser aprovar ou rejeitar o pedido de emprstimo.
: exemplo de tabela de deciso
Quando a tabela de deciso muito grande, fica difcil analisar manualmente as regras ou
mesmo para um software avaliar todas as condies de forma eficiente e chegar rapidamente
resposta. Ento, uma alternativa utilizar as rvores de deciso, que tambm so compostas
pelas mesmas regras mas as organizam de forma grfica para uma melhor avaliao visual.
se utilizar uma tabela para organizar melhor
soluo chamada "tabela de deciso" mas exige que todas as regras
valiao na condio e tenham o mesmo tipo de sada ou
apresenta um exemplo de tabela para auxiliar na deciso de dar ou no
m cliente de banco, contendo regras onde so avaliadas condies que
combinam os seguintes parmetros: valor solicitado, idade e se o cliente tem conta ou no. O

Quando a tabela de deciso muito grande, fica difcil analisar manualmente as regras ou
mesmo para um software avaliar todas as condies de forma eficiente e chegar rapidamente
ilizar as rvores de deciso, que tambm so compostas
pelas mesmas regras mas as organizam de forma grfica para uma melhor avaliao visual.
23

Valor
Solicitado
baixo mdio alto
Tem conta
aprovar
rejeitar
Idade
Tem
conta
>= 30
< 30
no sim
aprovar rejeitar
no sim
aprovar rejeitar

Figura 11: exemplo de rvore de deciso


Uso de regras probabilsticas
O problema das regras determinsticas que, em alguns casos, o processo de deciso possui
incertezas que no podem ser tratadas de forma automtica. Por exemplo, o processo de
diagnstico mdico, investido de incertezas e mesmo o resultado da anlise de um
especialista mdico pode no garantir a doena ou causa do problema.
Para estes casos, pode-se utilizar regras probabilsticas. Elas se assemelham s determinsticas
porque usam regras do tipo Se-Ento, mas incorporam valores probabilsticos ao processo.
Por exemplo, podemos ter uma regra assim:
Se paciente tem febre alta, sente dores de cabea e tem dor de garganta
Ento h 80% de chances de ser gripe.
O que torna o processo mais complexo que pode haver vrias condies verdadeiras, e ento
teremos mais de um resultado possvel. A soluo tomar como resultado verdadeiro aquele
que tiver maior probabilidade.
As probabilidades tambm podem ser utilizadas nas condies, para acomodar as incertezas
reais do processo. Por exemplo, febre de 39 graus alta ou mdia ? Uma dica utilizar a
lgica difusa (fuzzy).

Uso de regras heursticas
Este tipo de regras semelhante s anteriores, pois incorporam incerteza. Mesmo seguindo as
regras, no se tem certeza de que alcanaremos um resultado final.
Por exemplo, o problema de programar um rob para sair de um labirinto. No h como criar
solues procedurais ou algortmicas pois no se sabe como ser o labirinto. Neste caso, algo
semelhante a tentativa-e-erro pode ser usado. Por exemplo, podemos ter 3 regras simples:
24

1. Siga em frente ou pelo caminho que houver, se s houver um caminho a
seguir;
2. Se encontrar uma deciso (2 ou mais caminhos alternativos), siga pelo
caminho mais esquerda ainda no visitado;
3. Se encontrar uma parede ou situao em que no tem para onde ir; volte
deciso anterior.

Note que haver casos em que o rob ir voltar uma deciso anterior, tendo j visitado alguns
dos caminhos alternativos. Neste caso, pela regra (2), ele poder estar tomando o caminho
mais direita, por ser o nico disponvel.
Tal tipo de soluo no garante que o rob chegar at a sada, pois poder haver loopings ou
mesmo no haver uma sada.
O interessante da regras heursticas que elas incorporam conhecimento tido como senso
comum e intuies humanas. Por exemplo, algum poderia criar uma 4a regra indicando que a
escolha nas decises pode ser feita pelo caminho mais esquerda ou mais direita,
dependendo de algum parmetro extra (por exemplo, inclinao do terreno).

Redes neurais (artificiais)
As redes neurais ou neuronais so criadas a partir de hardware ou software para imitar o
funcionamento do crebro. Elas funcionam como caixas pretas, onde dentro h milhares ou
milhes de neurnios, conectados entre si. No incio, a rede burra, ou seja, no possui
nenhum tipo de conhecimento. Ento ela deve ser treinada, fornecendo exemplos de situaes,
contendo exemplos de parmetros de entrada e o tipo de sada que deve ser fornecida.
Imagine o problema da deciso de emprstimo para um cliente bancrio. Os parmetros de
entrada podem ser saldo mdio, renda, idade, se tem carro e seguro e tipo de profisso. Ento
algum dever buscar casos reais de pessoas que receberam emprstimos, e analisar se
pagaram ou no. Se a pessoa pagou, seu caso classificado como um exemplo positivo (sada
"aprovar"). Se a pessoa no pagou, seu caso classificado como um exemplo negativo (sada
"rejeitar").
A fase de treinamento consiste em ajustar os caminhos de conexes entre os neurnios. Os
caminhos sero reforados a partir dos dados de entrada para a sada correspondente. Por
exemplo, se todos clientes menores de 30 anos no pagaram o emprstimo, os caminhos que
levam deste parmetro de entrada at a sada "rejeitar" sero reforados (isto pode ser feito
utilizando contadores nas conexes).
Aps o treinamento, a rede neural ser capaz de indicar sadas a partir de dados de entrada
para um caso de teste. No preciso ter um caso exatamente igual aos utilizados no
treinamento, pois a rede faz combinaes entre os neurnios e, a partir dos dados do caso de
teste, ela indicar o caminho mais provvel observando a fora de cada conexo. como
observar caminhos feitos por pessoas ou bichos no mato. Onde a grama est mais baixa, o
caminho mais utilizado.
A desvantagem das redes neurais que no se pode explicar de onde veio o resultado, pois
no possvel analisar humanamente as conexes dentro desta caixa preta.


25

Raciocnio baseado em casos (case-based reasoning - CBR)
Neste caso, no h um conjunto de regras estabelecidas, mas somente exemplos. No h
tambm treinamento. O que se faz comparar o caso de teste com os casos anteriores j
armazenados. Por exemplo, quando um cliente novo chegar pedindo emprstimo, seus dados
sero comparados aos dados de clientes anteriores que j pediram emprstimo (e tendo-se
tambm a avaliao se pagaram ou no). E eles sero classificados conforme as classes de
sada possveis (neste caso, aprovar ou rejeitar).
Para este fim, sero utilizadas funes de similaridade. Ao encontrar o caso mais semelhante,
o sistema dever utilizar a mesma deciso (aprovar ou rejeitar) como utilizada no caso
semelhante. Exemplos de funes de similaridade incluem:

Incluso simples (set theoretic inclusion)
verifica a presena de atributos comuns a 2 vetores; elementos que s aparecem
em um dos vetores no influenciam o resultado;
Coeficiente de Dice = 2c/(a+b),
sendo c o nmero de caractersticas em comum nos dois vetores, a o nmero total
de caractersticas do primeiro vetor e b o nmero total de caractersticas do
segundo vetor;
Coeficiente de Jaccard = c/(a+b-c)
calcula a mdia entre atributos comuns e no comuns (dividir pelo total de
elementos existentes); o nmero de elementos que no so comuns diminuem a
similaridade;
Coeficiente de overlap = c/mnimo(a,b);
Distncia Euclidiana = raiz de (x1 x2)2 + (y1 y2)2
raiz quadrada da soma dos quadrados das diferenas de valores para cada varivel
(x e y); como o resultado a distncia entre 2 vetores, para se ter a similaridade
precisamos utilizar o valor inverso ou complementar a 1;
Coeficiente do Cosseno: similaridade o quadrado do cosseno do ngulo formado entre 2
vetores.

Para mais informaes sobre o assunto, consulte o livro de Fabiana Lorenzi e Sidnei Silveira.

7 Sistemas de Simulao
Objetivo: apoiar decises como no SAD, mas tendo o fator tempo associado. Um SAD pode
ser atemporal, mas os sistemas de simulao avaliam as consequncias das decises durante
um certo perodo de tempo.

No SAD, vimos um exemplo de como apoiar a deciso de determinar o preo de
venda de um produto. Naquele exemplo, no havia informaes temporais, ou seja, no se
sabia se o lucro era por ms, ano ou por um perodo determinado. Imaginem que fosse
possvel fornecer como entrada para o sistema expectativas de vendas por ms, e que a
empresa fizesse promoes dando descontos em alguns meses (baixando o preo final). Com
tais informaes temporais, poderamos ter sadas referentes ao lucro a cada ms e tambm
por ano.
Isto til porque as condies podem ser alteradas durante o tempo. Ento o gerente
deste exemplo pode desejar mudar o preo final ou ajustar as expectativas de venda (curva
crescente ou decrescente) e mesmo incorporar variaes nos custos ao longo do tempo. E
26

mesmo assim ele deseja saber se ter lucro. Pode acontecer de ter prejuzo nos 6 primeiros
meses, por exemplo, e lucro s aps um ano. Isto permite ao gerente tomar decises como por
exemplo aceitar tal situao, sabendo que tem provimentos para garantir os custos nos 6
primeiros meses.
A importncia dos sistemas de simulao que as pessoas podem avaliar resultados
futuros sem ainda tomar as decises no presente. Por exemplo, uma agncia bancria pode
definir de antemo quantos caixas deixar abertos a cada dia e horrio.
Neste caso, para que o sistema de simulao possa funcionar apropriadamente,
devero ser fornecidos parmetros temporais como o nmero de clientes que entra na agncia
a cada hora (pode-se usar uma curva normal), o tempo de atendimento nos caixas (mdio,
mnimo e mximo) e o nmero de caixas abertos. Ento o usurio pode "rodar" uma
simulao de 6 horas, onde o sistema ir gerar "clientes" na entrada e conforme os parmetros
ir "retirar" os clientes do sistema aps o atendimento. Ao final da simulao, o sistema
apresenta relatrios tais como: tamanho mximo e mdio das filas, tempo mdio de
atendimento real, tempo de espera na fila (mximo e mdio), nmero de clientes atendidos no
perodo. Ento, aps anlise dos relatrios, o usurio pode alterar parmetros (por exemplo, o
nmero de caixas abertos) e "rodar" novamente a simulao. E isto tudo sem precisar esperar
6 horas pela simulao (pois ela feita com o relgio interno do computador), nem precisar
ficar testando as alternativas na agncia real.
Outro exemplo foi uma montadora de automveis que precisava decidir como seria
sua linha de montagem. Ela no poderia ser feita em linha reta pois iria ter o comprimento de
centenas de metros. Ento foram definidas algumas alternativas (sublinhas paralelas,
sublinhas em "U", etc). Para o processo "passar" por cada sublinha h um tempo estimado,
alm do tempo de transferir o carro sendo produzido de uma sublinha para outra. Ento, com
sistemas de simulao, a montadora poderia saber previamente qual o processo (alternativa)
de menor tempo. Some-se a isto parmetros como custo de produo, nmero de pessoas e
mquinas necessrias, espao necessrio, os diretores puderam tomar a melhor deciso.



8 Sistemas de Informaes Distribudas
Objetivo: gerenciar dados armazenados remotamente ou em pontos diferentes.
Muitas empresa possuem bancos de dados distribudos por locais distantes. Por
exemplo, empresas multinacionais que produzem ou vendem seus produtos em diferentes
pases.
Estas informaes podem estar divididas horizontalmente (por exemplo, uma base de
clientes separada por cidade de residncia do cliente) ou verticalmente (uma base contendo
apenas dados cadastrais do cliente e outra contendo informaes financeiras).
Pode-se tambm utilizar de replicao de dados (cpias de dados para segurana e
para aumentar disponibilidade e agilizar acessos) e espelhamento (quando parte do processo
feito de forma duplicada, por exemplo, um movimento bancrio sendo registrado ao mesmo
tempo em dois bancos de dados diferentes, utilizando redes de comunicao diferentes).
A distribuio de informaes ajuda a aumentar a tolerncia a falhas, pois se um dos
repositrios no estiver disponvel, apenas os dados deste repositrio no estaro disponveis
para consulta ou alterao, permanecendo os demais repositrios acessveis para uso. Alm
disto, a distribuio garante autonomia s organizaes locais. Por exemplo, uma filial que
possa definir que tipo de infraestrutura de TI utilizar (hardware e software) ou mesmo tomar
27

decises referentes ao negcio (por exemplo, preo final de um produto), sem precisar fazer
solicitaes de alterao ou acesso a quem controla um banco de dados centralizado.
Os bancos de dados centralizados exigem infraestrutura pesada para suportar todos os
acessos ao mesmo local. J quando temos repositrios distribudos, cada parte pode utilizar
uma estrutura diferente e de menor custo. claro que h dificuldades extras para
compatibilizar e normalizar a troca de informaes.
Os cuidados a serem tomados ainda incluem garantir a atomicidade das transaes.
Suponhamos que um cliente quer transferir um valor de sua conta corrente para outra, mas os
seus dados esto localizados na cidade X enquanto que a conta destina fica na cidade Y. O
sistema deve tratar os passos de diminuir o valor da conta do cliente e somar o mesmo valor
na conta destino como um processo nico e indivisvel (princpio da atomicidade); ele no
pode realizar um dos passos e no realizar outro, pois violar a integridade do banco de dados.
Por sorte, a maioria dos sistemas gerenciadores de bancos de dados (SGBDs) j
possuem mecanismos para garantir este tipo de integridade.
Esta no a soluo adotada pela maioria das grandes instituies bancrias no Brasil,
que preferem utilizar solues centralizadas para garantir maior segurana e diminuir custos.
Mas isto discusso para outro livro.


9 Sistemas de Automao (Industrial, Comercial e Residencial)
Objetivo: conectar computadores e mquinas.
Este tipo de sistema inclui automao comercial, automao industrial e automao
residencial (Domtica). A caracterstica principal a troca de informaes entre mquinas e
computadores. As mquinas hoje em dia j esto vindo de fbrica com dispositivos tipo CLP
(controladores lgicos programveis). Algumas at j aceitam programas Java.
Alm disto, h diversos tipos de sensores que permitem receber dados do meio ambiente e
envi-los para computadores, onde estes dados sero interpretados e consolidados. Por
exemplo, h sensores para:
luminosidade (ex.: em carros, para acender faris automaticamente),
umidade (ex.: em carros, para ligar limpador automaticamente e regular sua frequncia de
acordo com a intensidade da chuva),
movimento (ex.: cmeras que s gravam se algo se move),
bssola e geolocalizao (GPS),
de nvel,
fogo e calor, etc.

Isto significa que uma pessoa pode estar distante de uma fbrica ou de sua casa, e poder ser
avisada se algum evento ocorrer. Esta uma das razes para o crescimento do chamado Big
Data.
Outras tecnologias como cdigos de barra, QRcodes e chips de RFID tambm esto ajudando
a acelerar processos e eliminar o trabalho humano. Isto faz com que as pessoas possam focar
mais esforos em atividades intelectuais, como por exemplo criatividade, resoluo de
problemas e tomada de decises.

Somem-se a isto os dispositivos de biometria, para reconhecimento e identificao nica de
pessoas (por voz, rosto, impresses digitais, ris, palma da mo, etc), e os dispositivos
multimdia para capturar imagens e sons, gravando ou transmitindo dados pela Internet.
28

Na automao comercial, j temos h bastante tempo os terminais PDVs (pontos de venda),
que renem computador, leitora de cdigo de barras e impressora fiscal. Agora, esto
chegando mquinas para pesagem automtica (com identificao automtica de produtos) e
pagamentos via celular (mobile payment).

As funes dos sistemas de automao so basicamente duas: coletar dados do ambiente e
enviar dados para outras mquinas.

Ento, numa indstria, o setor de produo poder fazer seu PCP (Planejamento e Controle de
Produo) de forma quase que totalmente automatizada. E alm disto, trocando dados com
outros setores. Por exemplo, quando um vendedor fizer uma venda (por exemplo, usando um
dispositivo mvel), neste exato momento haver uma entrada de trabalho no setor de
produo. Atravs de conexes com o sistema de estoque e o de gesto de suprimentos, um
sistema automtico poder calcular o tempo de produo e entrega do produto final. E isto
tudo levando em conta se h materiais disponveis para uso ou se a produo dever esperar o
setor de compra ser avisado, realizar a compra e depois receber o material que falta.
Ao mesmo tempo, se a linha de produo parar, sensores j avisaro os gerentes, que
imediatamente podero tomar decises ou sistemas automticos podero recalcular aquele
tempo de entrega final, calcular as perdas e prejuzos ou mesmo refazer o cronograma de
produo (schedule ou ordem de produo).

Nas residncias inteligentes, o dono poder programar num computador central, como quer
seu esquema de luzes internas e externas, indicando horrios para acender e apagar. Cmeras
e sensores daro alertas quando a pessoa estiver fora. E com um simples celular, o dono
poder abrir portes de garagem ou ligar o ar-condicionado antes de chegar em casa.


29

Mquina 1
Mquina 2
Mquina 3
Mquina 4
Planejamento e Controle

Figura 12: Exemplo de um sistema de automao industrial


A Figura 1Figura 12 apresenta um exemplo de sistema de automao para uma fbrica de
refrigerantes. Pode-se ver que h 4 mquinas: a mquina 1 enche a garrafa de ar quente para
que ela tome o formato, a mquina 2 injeta o lquido do refrigerante dentro da garrafa, a 3
coloca a tampa e a 4 passa o rtulo pela garrafa. Aps, as garrafas caem em outra esteira, onde
so agrupadas para formar os fardos e j ir direto para o caminho.
Pode-se ver tambm que h computadores conectados a estas 4 mquinas trocando
informaes em ambos os sentidos, seja recebendo dados de sensores, seja enviando
comandos para os CLPs das mquinas. H tambm um sensor que monitora a velocidade da
2a esteira, e neste caso s envia dados para o computador monitor.
Todos os dados recebidos pelos computadores so centralizados num servidor de
Planejamento e Controle. Deste partem as ordens para as mquinas. Este servidor pode gerar
grficos e alertas para gerentes ou operadores.


10 Sistemas de Informaes Geogrficas (GIS)
Objetivo: integrar mapas e bancos de dados, fazer geolocalizao ou georreferenciamento e
realizar geoprocessamento de imagens (clculo de distncias, localizar entidades no mapa,
identificar que entidade corresponde a certos objetos no mapa).

A principal caracterstica dos
geogrficas (qualquer coisa que possa ser localizada num mapa ou imagem) e a integrao de
informaes descritivas (atributos das entidades geogrficas)
espaciais (mapas e outras imagens).

A representao de entidades geogrficas
No modo Matricial ou Raster, os
pontos. Cada ponto possui coordenadas (exemplo: linha
ou caractersticas (ex: cor, nome)
as linhas 5 e 8 e as colunas de 10 a 14.
J na representao Vetorial
polgonos. Pode-se ter a formao de objetos complexos em nveis (
entidade formada por um polgono, que formado por linhas, que por sua vez so
por pontos). Tambm so permitidas representaes em nveis
representada por um ponto numa escala e
H basicamente duas vantagens da representao vetorial sobre a matricial:
a) o armazenamento de dados na representao vetorial mais conciso, pois pode ser feito
por equaes matemticas; por exemplo, uma estrada pode ser representada por diversos
segmentos de retas e cada um destes representado por uma equao de reta; se fssemos
usar a representao matricial, precisaramos armazenar inmeras coordenadas de pontos;
b) em caso de serem utilizadas escalas (para visualizao com
armazenamento da representao de uma entidade apenas numa escala, para esta entidade
ser visualizada em outras escalas necessrio realizar certas operaes matemticas; por
exemplo, um estdio de futebol, perfeitamente circular, representado no modo matricial
como um conjunto de pontos: se precisarmos aumentar o tamanho do estdio (como na
Figura 13), ser que o sistema saber que dever manter a figura de um crculo ? no caso
da representao vetorial, o estdio representado pela equao de um crculo, en
dito problema no ocorre em operaes de zoom (in ou out).

Figura 13: Um estdio na escala normal e depois de uma opera


As funes que um GIS deve proporcionar so descritas a seguir.
conhecidas como operao de geoprocessamento, isto , que analisam contedo de imagens e
podem realizar operaes matemticas como clculo de distncias e rea, como descrito a
seguir.

30
A principal caracterstica dos sistemas geogrficos o armazenamento de entidades
geogrficas (qualquer coisa que possa ser localizada num mapa ou imagem) e a integrao de
(atributos das entidades geogrficas) com informaes grficas
espaciais (mapas e outras imagens).
de entidades geogrficas pode ser feita de modo matricial ou vetorial.
, os objetos so representados por um ponto ou por
coordenadas (exemplo: linha-coluna, latitude-longitude
). Por exemplo, um prdio seria representado por pontos entre
as linhas 5 e 8 e as colunas de 10 a 14.
Vetorial, os objetos pode mser representados por ponto
formao de objetos complexos em nveis (por exemplo, uma
um polgono, que formado por linhas, que por sua vez so
por pontos). Tambm so permitidas representaes em nveis ou escala: uma cidade
ponto numa escala e por um polgono noutra.
H basicamente duas vantagens da representao vetorial sobre a matricial:
de dados na representao vetorial mais conciso, pois pode ser feito
por equaes matemticas; por exemplo, uma estrada pode ser representada por diversos
segmentos de retas e cada um destes representado por uma equao de reta; se fssemos
esentao matricial, precisaramos armazenar inmeras coordenadas de pontos;
em caso de serem utilizadas escalas (para visualizao com zoom in/ou), quando h o
armazenamento da representao de uma entidade apenas numa escala, para esta entidade
lizada em outras escalas necessrio realizar certas operaes matemticas; por
exemplo, um estdio de futebol, perfeitamente circular, representado no modo matricial
como um conjunto de pontos: se precisarmos aumentar o tamanho do estdio (como na
), ser que o sistema saber que dever manter a figura de um crculo ? no caso
da representao vetorial, o estdio representado pela equao de um crculo, en
dito problema no ocorre em operaes de zoom (in ou out).

: Um estdio na escala normal e depois de uma operao de zoom
es que um GIS deve proporcionar so descritas a seguir. Algumas destas funes so
conhecidas como operao de geoprocessamento, isto , que analisam contedo de imagens e
podem realizar operaes matemticas como clculo de distncias e rea, como descrito a
amento de entidades
geogrficas (qualquer coisa que possa ser localizada num mapa ou imagem) e a integrao de
com informaes grficas ou
matricial ou vetorial.
por conjunto de
longitude) e atributos
. Por exemplo, um prdio seria representado por pontos entre
pontos, retas ou
por exemplo, uma
um polgono, que formado por linhas, que por sua vez so formadas
cidade pode ser
H basicamente duas vantagens da representao vetorial sobre a matricial:
de dados na representao vetorial mais conciso, pois pode ser feito
por equaes matemticas; por exemplo, uma estrada pode ser representada por diversos
segmentos de retas e cada um destes representado por uma equao de reta; se fssemos
esentao matricial, precisaramos armazenar inmeras coordenadas de pontos;
, quando h o
armazenamento da representao de uma entidade apenas numa escala, para esta entidade
lizada em outras escalas necessrio realizar certas operaes matemticas; por
exemplo, um estdio de futebol, perfeitamente circular, representado no modo matricial
como um conjunto de pontos: se precisarmos aumentar o tamanho do estdio (como na
), ser que o sistema saber que dever manter a figura de um crculo ? no caso
da representao vetorial, o estdio representado pela equao de um crculo, ento o

Algumas destas funes so
conhecidas como operao de geoprocessamento, isto , que analisam contedo de imagens e
podem realizar operaes matemticas como clculo de distncias e rea, como descrito a
31

Localizao de entidades em mapas ou imagens (georreferenciamento)

Uma maneira simples de localizar uma entidade num mapa ou imagem possuir um banco de
dados com as entidades geogrficas e sua localizao fixa na imagem. Neste caso, podemos
utilizar as representaes matriciais ou vetoriais discutidas acima.

Entretanto, o interessante dos sistemas geogrficos poder encontrar dinamicamente e em
tempo real a localizao de uma entidade no globo terrestre. Para isto, precisamos de um
sistema de referncia espacial e de pontos de referncia num mapa. A chamada
geolocalizao pode ser feita de diversas formas. As pessoas leigas normalmente acreditam
que somente a tecnologia de GPS pode ser utilizada, mas isto est errado.

Os aparelhos de GPS se comunicam com satlites (normalmente 3 no mnimo) para gerar
coordenadas de latitude e longitude. Com estas coordenadas, possvel ir para mapas e
encontrar o ponto que representa tais coordenadas. O Google Maps, por exemplo, permite que
o usurio fornea estas coordenadas para apontar um resultado no mapa. Os mapas devem
possuir pontos de referncia.

Outra forma de fazer geolocalizao atravs de antenas de celulares. O celular capta o sinal
da antena com uma determinada intensidade. Isto permite saber em que raio de distncia
encontra-se o aparelho em relao antena (ver Figura 14). Feito isto, por um esquema de
triangulao de antenas e sinais, possvel determinar onde encontra-se o aparelho com
margens de erro de poucos metros. De novo, ser necessrio ter pontos de referncias em
mapas (podem ser as prprias antenas), para apontar a localizao num mapa.

o

Figura 14: Crculos representando a intensidade de sinal de um celular em relao a
uma antena


32


Figura 15: Triangulao de antenas


Outra alternativa para geolocalizao mas tambm semelhante ao sistema de antenas de
celulares utilizar a comunicao de dispositivos mveis com antenas Wireless (por exemplo,
pela tecnologia de Wifi). Se no houver antenas prximas, pelo menos pode-se saber em que
regio (rea de um crculo) encontra-se o aparelho.

E a mais recente tecnologias de RFID tambm est sendo utilizada para geolocalizao. Da
mesma forma que as antenas Wifi, os chips de RFID podem ser geolocalizados. Isto permite
encontrar produtos em armazns e bois numa fazenda.

Note que o alcance das antenas diminui do primeiro caso para este ltimo (nesta escala: GPS,
celular, wifi e RFID).

A geolocalizao de entidades tambm pode ser feita tendo como entrada um endereo
(logradouro + localizao vertical), por exemplo: Rua X, n. 41. este o modo de operao
mais comum no Google Maps.

Para poder realizar tal operao, preciso ter (ou comprar) mapas de cidades que associam
posies de latitude e longitude a nmeros em ruas (localizao horizontal), como vemos na
Figura 16). Neste exemplo, se quisermos localizar o nmero 200 da rua ABC, podemos
utilizar simplesmente uma regra de 3; ento o nmero procurado encontra-se no meio da
quadra.
Notem que importante que haja estes pontos de referncia. Para isto, existem empresas que
fazem tais mapas. Entretanto, elas no possuem tantos pontos assim registrados, ainda mais
em cidades pequenas. esta a razo de muitas vezes o Google Maps apontar um endereo
uma ou mais quadras distante da localizao real.

Outro cuidado que nem todas as cidades respeitam a regra de separar nmeros pares e
mpares do mesmo lado da rua (esquerda ou direita). E isto tambm gera confuses como as
que podemos notar no Google Maps.


Rua ABC
n.100

Figura 16: Geolocalizao a partir de um endereo


Outro cuidado que a regra de 3 funciona bem para ruas retas, sem muitas curvas. Por esta
razo, j foram localizadas pessoas morando no mar

Figura 17: Causa comum para erros de
curva)



Reconhecimento de entidades geogrficas
Outra funo necessria a um GIS a possibilidade de o usurio
polgono no mapa e o sistema informar do que se trata (uma empresa, uma escola, etc)
Google Maps possui um recurso que indica o endereo de um ponto no mapa (rua e n
Entretanto, nem sempre ele consegue indicar qual a entidade geogrfica correspondente. Para
isto, o GIS precisa de um banco de dados sobre entidades geogrficas, alm do mecanismo de
reconhecer coordenadas no mapa.
atravs de colaborao (prprias empresas e pessoas indicando) ou descobrindo por endereos
associados a entidades (empresas, associaes, etc).

Clculo de distncia (em linha reta)
uma das operao bsicas de geoprocessamento. A par
indica a distncia entre os pontos, mas analisando o menor caminho (distncia em linha reta).
Isto no leva em considerao se existem vias de deslocamento como ruas, avenidas, estradas,
etc. (como ser discutido adiante).
33
100
n.300

Geolocalizao a partir de um endereo
que a regra de 3 funciona bem para ruas retas, sem muitas curvas. Por esta
razo, j foram localizadas pessoas morando no mar na enseada de Botafogo (ver

para erros de localizao de endereos em mapas (uma rua
econhecimento de entidades geogrficas a partir do mapa
Outra funo necessria a um GIS a possibilidade de o usurio selecionar um ponto ou
polgono no mapa e o sistema informar do que se trata (uma empresa, uma escola, etc)
Google Maps possui um recurso que indica o endereo de um ponto no mapa (rua e n
Entretanto, nem sempre ele consegue indicar qual a entidade geogrfica correspondente. Para
isto, o GIS precisa de um banco de dados sobre entidades geogrficas, alm do mecanismo de
reconhecer coordenadas no mapa. O Google est tentando criar um banco de dados assim
atravs de colaborao (prprias empresas e pessoas indicando) ou descobrindo por endereos
associados a entidades (empresas, associaes, etc).
(em linha reta)
uma das operao bsicas de geoprocessamento. A partir de 2 pontos selecionados, o GIS
indica a distncia entre os pontos, mas analisando o menor caminho (distncia em linha reta).
Isto no leva em considerao se existem vias de deslocamento como ruas, avenidas, estradas,
).
que a regra de 3 funciona bem para ruas retas, sem muitas curvas. Por esta
enseada de Botafogo (ver Figura 17
localizao de endereos em mapas (uma rua
selecionar um ponto ou
polgono no mapa e o sistema informar do que se trata (uma empresa, uma escola, etc), O
Google Maps possui um recurso que indica o endereo de um ponto no mapa (rua e nmero).
Entretanto, nem sempre ele consegue indicar qual a entidade geogrfica correspondente. Para
isto, o GIS precisa de um banco de dados sobre entidades geogrficas, alm do mecanismo de
nco de dados assim
atravs de colaborao (prprias empresas e pessoas indicando) ou descobrindo por endereos
tir de 2 pontos selecionados, o GIS
indica a distncia entre os pontos, mas analisando o menor caminho (distncia em linha reta).
Isto no leva em considerao se existem vias de deslocamento como ruas, avenidas, estradas,
34

A operao fica mais complexa quando necessrio calcular a distncia entre um ponto e uma
reta, um ponto e um polgono, entre duas retas, entre uma reta e um polgono ou entre 2
polgonos. Mas nada que a geometria no possa resolver.
Exemplos de aplicaes incluem saber qual a distncia entre uma propriedade e um riacho,
qual o comprimento de uma avenida (neste caso, um conjunto de segmento de retas), que
prdios ficam prximos da rua Y.
O cuidado que se deve ter com escalas em mapas, para poder indicar a distncia na unidade
correta.


Clculo de rea
Outra operao comum em geoprocessamento o clculo de reas de polgonos. Atravs de
frmulas matemticas simples, o GIS pode dar tal resultado.

Uma das aplicaes deste tipo de operao na agricultura, para calcular produo de gros.
Dada uma rea plantada e um padro de gros por hectare (ou outra medida), pode-se fazer a
estimativa de quantos gros sero colhidos.
Este tipo de operao associada a sistemas inteligentes, permitem a pesquisadores verificarem
aumento de desmatamento de florestas, diminuio de geleiras e lagoas, deslocamento de
margens de rios e lagoas e estimativas de reas frteis.
Para realizar tal tipo de operao necessrio que haja a identificao de padres nas
imagens. Seja pela cor, textura ou outro atributo, possvel com ajuda de sistemas
especialistas saber qual o tipo de terreno nas imagens (qual tipo de plantao, qual tipo de
terra, se rio ou rea urbana, etc). A Figura 18 apresenta uma imagem com diferentes tipos de
padres, que podem ser notados pelas diferentes cores.




Figura 18: Imagem de satlite com cores indicando tipos de terrenos

Outra aplicao semelhante para clculo de IPTU em prefeituras. Com imagens de satlite e
sistemas inteligentes, os terrenos so identificados e a rea construda calculada, sendo ento
um dos parmetros utilizados para o clculo do IPTU.


35

Anlise de cruzamentos e interseces
Esta operao de geoprocessamento mais complexa que as anteriores. Ela permite verificar:

se um ponto est inserido numa reta ou polgono
por exemplo, para saber se uma cidade faz parte de um pas ou estado ou est na linha de
passagem de uma estrada ou ferrovia.

se duas retas se cruzam
por exemplo, para saber se um rio cruza uma estrada, ou uma ferrovia passa por uma estrada
ou se duas ruas em uma cidade possuem um cruzamento comum.

se uma reta passa por um polgono
por exemplo, para saber se um rio corta uma propriedade, se uma ferrovia passa por dentro de
uma cidade, se uma rua passa por um bairro ou se uma estrada passa por um estado.

se 2 polgonos possuem uma rea em comum
por exemplo, para saber se duas propriedades foram demarcadas corretamente.

Distncia levando em conta caminhos possveis (ruas ou estradas)
Para este tipo de operao, necessrio ter registrado tambm como entidades geogrficas as
vias de deslocamento (ruas, estradas, rios, etc.).
As empresas que vendem mapas, geralmente j fazem os mapas com o registro de tais vias. O
cuidado que se deve ter que, dependendo da escala, uma curva numa estrada pode virar uma
reta.
Neste caso, o clculo de distncia no feito em linha reta, mas utilizando as vias possveis.
Note-se que este tipo de clculo leva tambm em considerao as alternativas de caminhos
possveis. Por exemplo, na Figura 19, h diversas formas de se ir do ponto X ao ponto Y.
Ento, para calcular a distncia entre X e Y, temos que levar em conta a menor distncia.



Figura 19: Caminhos alternativos para clculo de distncia


36

Clculo de rota
O interessante do clculo de distncia considerando vias que se pode traar rotas entre 2
pontos. Este o velho problema do Caixeiro Viajante, onde se deve descobrir a melhor rota
sendo necessrio passar por pontos pr-determinados.
Um cuidado analisar o caso particular de ruas com um canteiro ou divisria no meio. Em
geral, os mapas j fazem esta separao, inclusive distinguindo a via com 2 nomes (os 2
sentidos possveis).
O problema do clculo de rota fica mais complexo quando necessrio considerar o sentido
das ruas. Em geral, quando pensamos em rotas, estamos pensando em fazer um caminho com
algum veculo motorizado e da precisamos respeitar as leis de trnsito. Neste caso, o menor
caminho tem que levar em considerao os caminhos alternativos possveis, levando em conta
os sentidos das vias, como mostra a Figura 20.
A dificuldade que os mapas nem sempre possuem o sentido atualizado, at porque as
prefeituras costumam mudar frequentemente sentidos de ruas. Uma possibilidade descobrir
o sentido automaticamente, utilizando por exemplo geolocalizao por GPS, celular ou RFID.



Figura 20: Esquema de sentidos nas vias para clculo de rotas




37


Figura 21: Clculo de rotas considerando sentidos de vias e sinaleiras


A rota mais rpida nem sempre a menor, pois muitas vezes demora-se mais para passar
certos cruzamentos ou vias com maior movimento. A Figura 21 exemplifica este caso.
Pode-se acrescentar um sistema de simulao (visto anteriormente) para verificar melhores
rotas com base no tempo. Neste caso, cada quadra e cruzamento seria como um processo, com
tempo para passar.

Determinar o melhor caminho passa a ser uma tarefa mais complicada. Pode-ser desejar o
menor caminho, o caminho mais rpido ou ento o caminho de menor custo (levando em
conta pedgios a serem pagos, manuteno do veculo pelas condies das vias) ou ento
pode-se querer um caminho que passe por certos pontos de apoio (postos, restaurantes) ou que
seja mais seguro.

O problema do Caixeiro Viajante ainda mais complexo pois exige que o caminho escolhido
passe por certos pontos intermedirios.

Exemplos de Aplicaes de GIS

Uma das mais incrveis aplicaes de GIS na chamada agricultura de preciso. Hoje as
mquinas agrcolas (tratores, colheitadeiras, semeadeiras, etc) vm equipadas de fbrica com
dispositivos GPS. Com isto, pode-se programar a mquina para fazer um caminho pr-
determinado. Por exemplo, se um ser humano for dirigir um trator para semear um campo,
provavelmente far os caminhos apresentados na parte (a) da Figura 22. J uma mquina
equipada com GPS conseguir traar um caminho mais preciso e com isto colocar mais
sementes, como se v na parte (b) da mesma figura.


38


Figura 22: Comparao de semeadura com pessoas X mquinas equipadas com GPS


GPS tambm est sendo utilizado para identificar mudas de rvores. Ao plantar uma
semente, esta ser identificada pelas coordenadas dadas pelo GPS. Ao crescer, a muda
continuar sendo identificada desta forma at que se torne uma rvore grande e d frutos.
Desta forma, tudo o que acontece com cada rvore registrado num banco de dados. Aps a
colheita de frutos, saberemos que mudas deram mais frutos e por qu. Por exemplo, pode-se
comparar a quantidade de frutos com umidade, insolao, nvel pluviomtrico e at com os
agrotxicos que foram aplicados (marca, lote, data, quantidade, etc).
No s rvores esto sendo geoidentificadas no campo. Os animais tambm esto
recebendo chips de identificao (geralmente, chips com a tecnologia de RFID). Assim, alm
de poder localizar animais no campo, pode-se contar mais rapidamente e saber por onde cada
indivduo especfico andou (por que terras e o quanto andou). Some-se a isto registros de
dados histricos do animal, como vacinas, doenas, peso, formas de alimentao, etc. Ao final
teremos um Big Data sobre cada animal e sistemas de BI podero apontar falhas e acertos no
controle dos animais.
Chips de geolocalizao, seja por RFID, celular ou satlite, tambm so usados para
rastrear veculos e at mesmo, hoje em dia, pessoas, para segurana contra sequestros.
Para empresa que trabalham com logstica, a geolocalizao foi uma das grandes
revolues. Chips instalados em produtos permitem localiz-los rapidamente. Um dos grandes
problemas com armazenamento de produtos em armazns, que os produtos que chegam so
sempre alocados nos lugares mais fceis (mais perto e em cima de outras paletes). Entretanto,
quando a loja precisa repor seus estoques nas prateleiras, as pessoas tendem a pegar os
produtos que esto ao alcance mais fcil (mais perto e em cima). Com isto, os produtos mais
antigos vo ficando e acabam por perder a validade. Com um sistema de GIS auxiliando nos
armazns, quando for necessrio repor produtos nas prateleiras, o sistema indica o lote que
est por perder a validade (no importando onde ele estiver).
No deslocamento entre fbricas, fornecedores, centros de distribuio e lojas, os
sistemas de GIS tambm tornam mais eficiente processos de logstica. Primeiro, possvel
traar melhores rotas (mais rpidas, menos custosas). Depois, pode-se saber onde cada
produto est exatamente. At mesmo, se um lote de produtos entrar num caminho onde no
deve estar, a antena que capta os sinais dos chips poder avisar o sistema. Por fim, pode-se ter
previses mais confiveis do tempo que os produtos iro demorar para chegar at um cliente
ou loja, e mesmo se houver atraso, o sistema saber disto, poder recalcular o tempo e avisar
as pessoas a tempo.
39

Nos supermercados, as prateleiras sero inteligentes, equipadas com antenas de RFID.
Isto permitir ao sistema saber exatamente quantas unidades de cada produto ainda restam em
cada prateleira e mesmo avisar os responsveis se algum produto est numa prateleira errada.
Estes mesmos chips colocados em produtos permitiro aos administradores avaliar o
caminho percorrido pelo produto. Por exemplo, se estamos falando de roupas, importante
saber se um produto saiu da prateleira ou arara, vai at o provador, volta para seu lugar ou vai
direto para o caixa. Carrinhos de supermercado equipados com estes chips tambm indicaro
os caminhos mais percorridos e ajudaro a descobrir se alguma prateleira nunca alcanada.


Em termos de gesto urbana, a geolocalizao est crescendo como ferramenta para
auxiliar a mobilidade urbana. Veculos equipados com chips de geolocalizao ajudam
engenheiros de trfego a saberem a velocidade de cada trecho, que rotas esto engarrafadas,
quantos carros esto passando em cada cruzamento, etc. Isto diminui o trabalho humano de
observao em cmeras e aumenta o poder de deciso para sugerir caminhos alternativos,
principalmente adequando o tempo de sinaleiras.
Recentemente, foi noticiado que a Google comprou a empresa que faz o aplicativo
mvel Waze. Este aplicativo, instalado em dispositivos mveis de milhares de usurios, coleta
dados de rotas por onde os usurios passam e a velocidade com que percorrem cada trecho.
Pela chamada Sabedoria das Massas (simplesmente, a mdia ou olhar para a maioria), pode-se
saber dinamicamente e automaticamente quais os trechos problemticos e quais esto mais
livres. E com isto, recomendar vias alternativas.

Empresas de servios pblicos tambm utilizam sistemas de GIS para saber a
localizao exata de seus recursos (postes, telefones pblicos, linhas, antenas, etc). Os
sistemas de GIS ajudam a planejar a colocao dos recursos, gerando melhor distribuio e
consequentemente melhores servios. Tambm ajuda na hora da manuteno. Quando clientes
de uma empresa de energia ligam reclamando que esto sem luz, o sistema j pode ajudar a
identificar a fonte do problema (por exemplo, uma linha cortada ou antena com problema). E
mais, se os funcionrios estiverem equipados com geolocalizao, a empresa j pode saber qul
o funcionrio adequado que est mais prximo do problema.





Geomarketing
Por fim, vale lembrar que a geolocalizao tambm ser utilizada para marketing. A
tecnologia de sistemas de GIS ajudam empresas a saber caminhos percorridos por clientes,
analisando localizao dada por seus celulares ou outros tipos de chips (por exemplo, cartes
de crdito). Isto permitir s empresas recomendarem lojas mais prximas do cliente, em
horrios determinados, e at mesmo avisar um cliente que est dentro de um prdio (shopping
mall), que uma determinada loja est com promoo naquele momento.


40


Figura 23: Exemplo de aplicao de geomarketing


Outra aplicao de sistemas de GIS para marketing auxiliar empresas a encontrarem
o melhor local para suas lojas. Por exemplo, a Figura 23 apresenta um mapa onde foram
marcados os locais onde esto os clientes potenciais da empresa (pontos verdes). E tambm
foi marcada a localizao dos concorrentes (pontos vermelhos). Um sistema de GIS com um
pouco mais de inteligncia poderia indicar ento a melhor regio para esta empresa abrir uma
filial (longe dos pontos vermelhos e prximo aos pontos verdes). claro que seria necessrio
ter um banco com informaes de clientes potenciais.
Este tipo de problema, saber onde esto os clientes potenciais, pode ser resolvido pelo
enriquecimento de dados. Uma empresa pode comprar uma lista telefnica com nome,
endereo e telefone de clientes. Mas no sabe classificar os clientes por dados scio-
demogrficos. Ento, a empresa pode consultar bases pblicas sobre setores censitrios. Um
setor censitrio diferente de um bairro ou quadra; uma regio, geralmente menor que um
bairro mas podendo abranger partes de 2 bairros, que foi pesquisada pelo censo do IBGE
(exemplos na Figura 24). Ento, h informaes estatsticas sobre cada setor especfico.
Imagine que a empresa ento possui os seguintes dados sobre uma pessoa: o nome Jos da
Silva e mora na Rua X, n.41. Bom, usando um sistema de GIS simples, pode-se saber o setor
censitrio onde ela mora. Depois, procuram-se dados estatsticos sobre este setor e, digamos,
temos que neste setor:
100% das residncias possuem 3 TVs;
98% possuem 2 banheiros;
90% possuem aparelhos de DVD;
90% possuem TVs LCD;
etc.

Agora, de posse destas informaes estatsticas, podemos estimar alguns dados sobre Jos da
Silva. Que ele tem 3 TVs, com 100% de chances, que h 98% de chances de ele ter 2
banheiros em casa, e assim por diante.
Ento, desta forma, uma empresa combina a lista telefnica com dados censitrios e poder
obter um banco de dados de clientes potenciais.
41

Isto se chama "enriquecimento de dados", pelo cruzamento de bancos de dados. Empresas
parceiras tambm costumam compartilhar dados sobre clientes, por exemplo, administradoras
de cartes de crdito, instituies financeiras, redes de varejo, escolas, postos de gasolina, etc.

A questo de privacidade no ser discutida neste livro.



Figura 24: Exemplo de setores censitrios



11 Sistemas de Hipertextos, Hipermdia e Multimdia
Objetivo: apresentaes de informaes.

Hipertexto um texto que no precisa ser lido sequencialmente. Isto quer dizer que, se uma
palavra ou tema nos chamou ateno no meio do texto, podemos seguir para outro texto para
saber mais sobre este assunto (como na Figura 25). O que facilita a vida do leitor que o
hipertexto j criado com estruturas de ligaes entre os textos (hiperlinks), para ajudar nas
conexes e associaes. Ou seja, o leitor no precisa procurar o texto auxiliar, basta seguir os
links j sugeridos. O leitor sabe quais so os links sugeridos porque as palavras ou expresses
que levam a outros textos (chamados ncoras), normalmente esto sublinhados ou em cor
diferente. o que podemos experimentar na Wikipedia.
J sistemas de Hipermedia ou Multimdia utilizam as estruturas de hiperlinks mas tambm
permitem associar outros tipos de mdias como sons e imagens (figuras, grficos, diagramas,
fotos, vdeos), conforme sugere a Figura 26. o que podemos experimentar na Web.

42


Figura 25: Estrutura caracterstica de Hipertexto



Figura 26: Estrutura caracterstica de Hipermdia

A principal aplicao deste tipo de sistema para apresentar informaes de forma mais rica e
dinmica. Ento podem ser teis para apresentar produtos (textos com caractersticas, fotos de
componentes e design, vdeos de como usar, gravaes de depoimentos de clientes).
43

Tambm so teis para treinamento de pessoas. A maioria dos chamados sistemas de
Computer-based Training (CBT) ou e-learning utilizam sistemas multimdia.


12 Sistemas de Gesto Eletrnica de Documentos (GED)
Objetivo: armazenar e recuperar documentos, utilizando bancos de dados. A recuperao
feita por atributos do documento. Exemplo: encontre o contrato feito com a empresa XYZ no
ano de 2002.

Hoje em dia as empresas esto procurando diminuir o volume de papis. O papel um
problema porque:
ocupa espao: os documentos que hoje ocupam uma sala inteira podem caber em alguns
poucos DVDs; claro que se deve respeitar a legislao especfica para alguns casos,
onde necessrio manter os documentos em papel por muitos anos;
maior perigo de incndio;
pode ser perdido ou se deteriora;
demandam tempo para busca: h estatsticas que dizem que as pessoas passam em mdia 6
horas/semana buscando informaes em papis; multiplique isto por todos os funcionrios
de uma empresa e por seu salrio-hora e teremos um grande prejuzo no final do ano.

O sistema de GED permite colocar em bancos de dados e servidores corporativos os
documentos de uma empresa, sejam eles gerados eletronicamente (pdf, doc, xls, ppt, etc) ou
sejam imagens de documentos fsicos em papel.
A Figura 27 apresenta o esquema de uso de um GED. Documentos em papel devem passar
por uma etapa de digitalizao com uso de scanners. As imagens resultantes sero
consideradas os documentos eletrnicos correspondentes aos documentos em papel.
Somando-se a estas imagens os documentos criados eletronicamente com editores de texto,
planilhas, softwares de apresentao, diagramas, etc, d-se incio ao processo de catalogao.
A catalogao consiste em incluir os documentos eletrnicos no sistema de GED, ou seja, no
seu banco de dados interno. Associados a cada documento eletrnico sero tambm inseridos
atributos de cada documento. Isto significa que antes de colocar o GED em funcionamento
necessrio definir que atributos sero armazenados. Isto pode incluir data do documento,
nmero de processo, nmero de cliente ou dono do documento, valor, tipo do documento,
origem, autor, setor, etc.
H algumas solues que conseguem capturar tais atributos automaticamente de dentro das
imagens (logo aps a etapa de escaneamento) ou internamente do contedo dos documentos
eletrnicos. Se isto no for possvel, pessoas tero que manualmente dar entrada destes
atributos junto com a incluso de cada documento.
Uma vez que os documentos estejam no banco de dados interno do GED, s ser possvel
recuperar tais documentos pelos atributos definidos. Ento o usurio do GED fornece como
entrada um ou mais atributos e recebe como resultado um ou mais imagens referentes aos
documentos eletrnicos ou os prprios.
Um sistema de GED pode ainda ter funes adicionais tais como:
controle de revises/verses/alteraes: quando h uma modificao num documento ou
quando uma nova verso do documento inserida, o sistema mantm a verso anterior em
caso de necessidade de recuperao; as verses so identificadas por datas ou nmeros;
alguns softwares como o Word permitem comparar verses e apresentar as alteraes ou
44

diferenas entre elas; uma funo adicional de um GED seria avisar os responsveis por
um documento, toda vez que uma nova verso deste for criada;
controle de acesso: o GED pode ter um esquema de permisses, onde fica definido quem
pode ver que tipo de documento; somente usurios autorizados podero recuperar certos
documentos;
criptografia de documentos: normalmente, os documentos armazenados no GED so
transformados para formatos proprietrios, utilizando chaves criptogrficas; uma das
vantagens facilitar o controle de acesso visto acima; outra que os documentos no
ficam visveis em diretrios, e isto evita excluso acidental ou mesmo cpia no
autorizada;
controle de autoria atravs de assinatura eletrnica: utilizando esquemas de certificao
digital com chaves pblica e privada, o GED pode confirmar a autoria de documentos, ou
seja, dizer quem o autor ou confirmar se o dito autor de um documento realmente o seu
criador.





Figura 27: Esquema de funcionamento de um GED



13 Sistemas de Informaes Textuais (Indexao e Recuperao de
Informaes)
Objetivo: armazenar documentos textuais e recuper-los por contedo (por palavras presentes
no texto).

$
MICROSOFT CORPORATION
Documento em papel
catalogao
digitaliza
(scanner)
contratos
recibos
guias de pag.
pdf
doc, rtf
tiff, jpg
ppt
xls

determinar atributos
atribuir a documentos
consulta por
atributos dos
documentos
data, autor, tipo
assunto, etc.
(definidos pelo
usurio)
45

Estes sistemas so parecidos com os de GED pois permitem organizar documentos e mesmo
diminuir papis. Entretanto a diferena est na forma de recuperao dos documentos.
Enquanto que no GED o usurio do sistema deve informar valores de atributos, nos Sistemas
Textuais a pessoa procura por contedo.

A forma mais simples de determinar o contedo de um documento analisando o texto
presente no documento. Assim, os sistemas textuais so baseados nas palavras presentes nos
documentos. Ou seja, para que um documento possa ser armazenado e recuperado por
sistemas textuais, preciso que ele tenha texto em seu contedo. No necessariamente
somente arquivos de editores de textos ou pdfs podem ser organizados. Mesmo uma planilha
eletrnica ou um arquivo de apresentao possuem textos que podem ser identificados em seu
contedo.
Outro tipo de documento que pode ser armazenado so imagens escaneadas. Neste caso,
necessrio utilizar um software de OCR (Optical Character Recognition), o qual identifica
letras, palavras e textos em imagens.
O esquema de funcionamento de um sistema textual apresentado na Figura 28. O passo
principal a indexao de documentos eletrnicos que contenham textos. A indexao
consiste em encontrar palavras nos documentos e criar o ndice. Aps a criao do ndice,
usurios podem recuperar documentos fornecendo como entrada palavras-chave. Sero
retornados os documentos que possuem estas palavras-chave. Este o funcionamento bsico
dos mecanismos de busca, incluindo o Google. O diferencial do Google que, como so
retornados milhares ou milhes de documentos em cada consulta, o algoritmo do Google
utiliza critrios prprios para montar um ranking, ou seja, para determinar que documentos
so mais relevantes e assim coloc-los no topo dos resultados.




Figura 28: Esquema de funcionamento de sistemas textuais - recuperao por contedo


$
MICROSOFT CORPORATION
Documento em papel
indexao
digitalizao + OCR
(identificao de texto)
contratos
recibos
guias de pag.
pdf
doc, rtf
tiff, jpg
ppt
xls

determinar palavras
presentes nos documentos
consulta por
contedo dos
documentos
ndice de
palavras
Documentos
que contenham
textos
Figura 29: Estrutura de um ndice de palavras

O ndice de palavras nada mais que um banco de dados contendo as palavras encontradas
nos documentos e apontadores para onde elas aparecem. A
de ndice. As palavras so ordenadas e associada a cada palavra existe uma lista de
documentos onde elas aparecem.

Os sistemas textuais podem ser utilizados para indexar documentos na web mas tambm em
redes privadas de empresas. A grande vantagem acelerar a recuperao de documentos.


Recuperao de contedos multimdia
Com o avano da tecnologia, h a tendncia
armazenar e recuperar contedos multimdia e no s textos.

Imagens
Atualmente, imagens podem ser armazenadas e recuperadas com sistemas tipo GED.
Entretanto, a recuperao no feita pelo contedo do documento m
associados ao documento. Uma forma de utilizar GED para recuperar imagens pelo contedo
associar assuntos (tags) como atributos do documento. Mas a tarefa de definir os assuntos
associados ao contedo e escolher as palavras a serem cadas
humanos.
H alguns sistemas de TVs que permitem recuperar vdeos ou trechos (novelas, filmes, etc.)
pelo contedo. Por exemplo, o programa VdeoShow da Globo consegue dizer quantos beijos
foram dados numa novela. Certamente
captulos e contando os eventos que ocorrem nas cenas. Provavelmente utilizada anlise de
roteiros (scritps) associados s cenas ou textos utilizados como
aparecem em baixo dos vdeos, para auxiliar pessoas com deficincia auditiva). A o processo
se resume a uma busca textual.
elaborados por humanos.
O Google Imagens tambm se vale de palavras associadas s imagens para fazer
(nome do arquivo, palavras prximas imagem ou que possuem link para uma imagem).
Tempos atrs o Google desenvolveu um jogo para que pessoas pudessem ajudar a classificar
contedo de imagens na Web. Aps entrar no site, cada par de usurios rec
cujo contedo deveriam descrever utilizando palavras simples (tags). A imagem era a mesma
para o par de jogadores, mas um no via o que o outro parceiro escrevia. Se ambos
utilizassem a mesma palavra, ambos ganham pontos. Veja na
46

: Estrutura de um ndice de palavras
O ndice de palavras nada mais que um banco de dados contendo as palavras encontradas
nos documentos e apontadores para onde elas aparecem. A Figura 29 apresenta um exemplo
de ndice. As palavras so ordenadas e associada a cada palavra existe uma lista de
documentos onde elas aparecem.
Os sistemas textuais podem ser utilizados para indexar documentos na web mas tambm em
redes privadas de empresas. A grande vantagem acelerar a recuperao de documentos.
Recuperao de contedos multimdia
Com o avano da tecnologia, h a tendncia de que este tipo de sistema possa tambm
armazenar e recuperar contedos multimdia e no s textos.
Atualmente, imagens podem ser armazenadas e recuperadas com sistemas tipo GED.
Entretanto, a recuperao no feita pelo contedo do documento mas por atributos
associados ao documento. Uma forma de utilizar GED para recuperar imagens pelo contedo
associar assuntos (tags) como atributos do documento. Mas a tarefa de definir os assuntos
associados ao contedo e escolher as palavras a serem cadastradas ainda deve ser feita por
H alguns sistemas de TVs que permitem recuperar vdeos ou trechos (novelas, filmes, etc.)
pelo contedo. Por exemplo, o programa VdeoShow da Globo consegue dizer quantos beijos
foram dados numa novela. Certamente no uma pessoa que fica assistindo a todos os
captulos e contando os eventos que ocorrem nas cenas. Provavelmente utilizada anlise de
) associados s cenas ou textos utilizados como closed caption
vdeos, para auxiliar pessoas com deficincia auditiva). A o processo
se resume a uma busca textual. Entretanto, os textos associados s cenas devem ser
O Google Imagens tambm se vale de palavras associadas s imagens para fazer
(nome do arquivo, palavras prximas imagem ou que possuem link para uma imagem).
Tempos atrs o Google desenvolveu um jogo para que pessoas pudessem ajudar a classificar
contedo de imagens na Web. Aps entrar no site, cada par de usurios recebia uma imagem
cujo contedo deveriam descrever utilizando palavras simples (tags). A imagem era a mesma
para o par de jogadores, mas um no via o que o outro parceiro escrevia. Se ambos
utilizassem a mesma palavra, ambos ganham pontos. Veja na Figura 30 um exemplo de
Palavras Documentos
palavra_1 doc_1, doc_2
palavra_2 doc_3, doc_4, doc_5
palavra_3 doc_1, doc_5
palavra_4 doc_6, doc_7
O ndice de palavras nada mais que um banco de dados contendo as palavras encontradas
apresenta um exemplo
de ndice. As palavras so ordenadas e associada a cada palavra existe uma lista de
Os sistemas textuais podem ser utilizados para indexar documentos na web mas tambm em
redes privadas de empresas. A grande vantagem acelerar a recuperao de documentos.
de que este tipo de sistema possa tambm
Atualmente, imagens podem ser armazenadas e recuperadas com sistemas tipo GED.
as por atributos
associados ao documento. Uma forma de utilizar GED para recuperar imagens pelo contedo
associar assuntos (tags) como atributos do documento. Mas a tarefa de definir os assuntos
tradas ainda deve ser feita por
H alguns sistemas de TVs que permitem recuperar vdeos ou trechos (novelas, filmes, etc.)
pelo contedo. Por exemplo, o programa VdeoShow da Globo consegue dizer quantos beijos
no uma pessoa que fica assistindo a todos os
captulos e contando os eventos que ocorrem nas cenas. Provavelmente utilizada anlise de
(letreiros que
vdeos, para auxiliar pessoas com deficincia auditiva). A o processo
Entretanto, os textos associados s cenas devem ser
O Google Imagens tambm se vale de palavras associadas s imagens para fazer sua busca
(nome do arquivo, palavras prximas imagem ou que possuem link para uma imagem).
Tempos atrs o Google desenvolveu um jogo para que pessoas pudessem ajudar a classificar
ebia uma imagem
cujo contedo deveriam descrever utilizando palavras simples (tags). A imagem era a mesma
para o par de jogadores, mas um no via o que o outro parceiro escrevia. Se ambos
um exemplo de
47

imagem e ao lado direito as palavras utilizadas (my labels). Neste exemplo, a imagem foi
associada palavra "Veneza". Com isto, quando algum fizesse uma pesquisa por imagens
sobre "Veneza", esta imagem poderia ser recuperada. Mesmo com colaborao de milhares de
pessoas, ainda um esforo muito grande poder classificar todas as imagens que aparecem na
Web.
H tentativas de criar algoritmos que possam identificar o contedo de uma imagem de forma
automtica. Este um dos desafios do Google para melhorar seu servio de Google Imagens.
Como j existem tecnologias para identificar rostos (Orkut e Facebook permitem marcar
rostos de pessoas nas fotos), identificar partes do corpo humano, animais, gestos, sorrisos,
etc., grandes avanos esto sendo feitos neste sentido. A Figura 31 demonstra que o Google j
utiliza uma tecnologia semelhante. Neste exemplo, note que ele recupera como imagens
semelhantes imagens invertidas e imagens com gestos semelhantes.



Figura 30: Experimento do Google para classificar contedo de imagens


48

Figura 31: Busca por imagens semelhantes no Google


Sons
Tecnologias para armazenamento e recuperao de sons tambm esto avanando mas, como
no caso de imagens, ainda geram muitas confuses.
O Youtube j possui uma tecnologia para reconhecimento de fala (entender o texto falado
numa gravao sonora).
Podemos ver tais tipos de sistemas tambm em celulares. No incio, era preciso gravar um
nome para poder fazer a recuperao de contatos por voz. Os sons so armazenados
digitalmente pelas suas caractersticas (intensidade, frequncia, etc.), como no exemplo da
Figura 32. Assim, quando um nome era falado, o sistema do celular transformava o sinal
analgico para sinais digitais e comparava com o que estava gravado na base de dados. O
sinal mais similar seria recuperado.

49


Figura 32: Sinal de voz armazenado

Atualmente, a tecnologia est evoluindo. No mais necessrio gravar nomes ou comandos.
H uma base de "falas" j previamente gravadas nos aparelhos (vm de fbrica). O problema
que variaes de timbre, lngua, sotaque e barulhos no ambiente podem reduzir a eficincia.
O software Via Voice da IBM permite reconhecer falas com bastante preciso. Entretanto,
como ele utiliza redes neurais, deve haver um processo de treinamento da rede anterior a seu
uso. E depois de treinado, o software s reconhece frases da pessoa que o treinou.
Alguns Centros de Atendimento por Telefone (Call Center) permitem que o cliente possa falar
o que deseja. Neste caso, no necessrio treinamento do cliente. Porm, a limitao que
apenas algumas palavras podem ser identificadas. Como o contexto geralmente limitado, o
reconhecimento funciona com uma boa eficincia e baixa margem de erro.
O problema de identificar qualquer palavra falada a partir de qualquer emissor humano est a
caminho de ser solucionado. Para que tais solues funcionem, preciso ter uma base de
fonemas (sons bsicos) para cada lngua. Depois, estes fonemas so representados
digitalmente, como na Figura 32. Ao se receber uma frase falada, esta representada tambm
digitalmente. Aps, ela deve ser quebrada em partes e cada parte deve ser comparada com os
fonemas bsicos.
Para melhorar o desempenho do reconhecimento, podem ser utilizadas Redes de Markov, que
so modelos estatsticos que avaliam qual a probabilidade de um evento (neste caso, um
fonema) aparecer aps outro. Por exemplo, pouco provvel que um som de "z" aparea aps
um som de "r" na lngua portuguesa. Isto elimina ambiguidades no reconhecimento, gerando
maior preciso.
Sistemas que possam armazenar e recuperar gravaes sonoras podero ser teis para
reprteres, emissoras de TV e rdio, mas tambm nas empresas podero ser utilizados. Para
documentar reunies, apresentaes e treinamentos, muitas vezes mais fcil gravar do que
anotar o que dito. Mas na hora de recuperar, as pessoas precisam procurar por gravaes que
contenham certas frases ou palavras.
O interessante dos sistemas de recuperao que podem combinar textos e sons. Por
exemplo, um texto pode ser recuperado de forma audvel, atravs de tecnologias de sntese de
voz. Por exemplo, j h muitos anos, existem sistemas de resposta audvel para consultar
saldo bancrio por telefone. Uma voz sintetizada l um texto. O resultado ainda um pouco
robtico, porque o sistema precisaria imitar a forma de seres humanos falarem,
principalmente incluindo entonao e juno de palavras.
Diversos aplicativos j fazem sntese de voz. A Odd Cast possui uma tecnologia muito
interessante que permite a escolha da lngua e do sotaque, incluindo o sexo da foz sintetizada.
O resultado muito bom, mesmo quando se pede para um francs falar um texto em
portugus.


50

14 Sistemas de Workflow
Objetivo: permitir o planejamento e controle do fluxo de trabalho (processos) e o roteamento
automtico de documentos.

Todas as empresas possuem processos ou fluxos de trabalho. Ou seja, h processos de
entrada, de transformao e de sada, seja entre a empresa e o meio (fornecedores e clientes)
ou internamente, entre departamentos ou mesmo dentro de um setor.

A Figura 33 apresenta o exemplo hipottico de um processo. Um funcionrio de uma empresa
faz um pedido de compra de material. Este pedido pode ser feito diretamente no
Departamento de Compras ou enviando por formulrios para este departamento. Este pedido
inclui um formulrio em papel e alguns documentos necessrios para avaliao do pedido. A
secretria deste departamento ento verifica qual o setor responsvel e pede que um
encarregado leve o pedido e os documentos (o que costumamos chamar de "processo") at o
setor responsvel. L, o gerente do setor avaliar o pedido. Se for um valor abaixo de um
limite pr-determinado, ela autoriza automaticamente o pedido. Seno, dever pedir um
parecer para um tcnico deste setor. Aps, avaliar os documentos, o tcnico devolve o pedido
e seu parecer. Com base no parecer, o gerente do setor toma uma deciso e a registra nos
documentos ("processo"). Ento o encarregado leva de volta toda a papelada para o
Departamento de Compras, que informar o funcionrio que fez o pedido sobre a deciso
final.

Os problemas que podem ocorrer durante este processo so os seguintes:
demora com atividades manuais que no agregam valor ao processo e deslocamentos:
como neste caso, o papel do encarregado levando documentos fsicos de um prdio ou sala
para outro(a);
demora com esquecimentos: imagine o tcnico colocar o processo na sua mesa, junto com
outros tantos papis, e depois no lembrar que possui uma tarefa;
extravio ou deteriorao de documentos: os papis sendo levados de um espao fsico para
outro ou sendo guardados em locais no apropriados podem ser perdidos (em montanhas
de papel, voar pelo cho) ou podem ser danificados (rasgados, molhados, etc);
no saber para onde encaminhar: o tcnico pode no saber o que fazer aps dar o parecer e
ento ficar esperando que algum lhe diga;
erros de encaminhamento: o tcnico pode confundir-se e entregar a papelada em outro
setor; e a, at todo mundo se dar conta do erro, j houve demora (sem falar na
possibilidade algum jogar fora os papis por no saber do que se trata);
no saber o que fazer: se o Gerente do Setor deixar os papis na mesa do tcnico enquanto
este no estiver presente, o que ele far quando voltar sua mesa ? ser que ele saber o
que tem que ser feito ? ser que ele saber quem deixou a papelada ali ?;
falta de informaes sobre status ou andamento: o funcionrio que fez o pedido volta ou
telefona ao Departamento de Compras e pergunta secretria em que ponto est o
andamento do seu pedido; s que a secretria no sabe com quem est o processo nem
quanto tempo vai demorar a resposta.



51


Figura 33: Funcionamento de um workflow


A soluo para tais problemas um sistema de Workflow. Ele permite programar o fluxo de
trabalho, incluindo sequncias de atividades ("a deciso s poder ser tomada aps o
parecer"), decises ("se o pedido inferior ao valor limite, aprovar, seno pedir um parecer",
"se o parecer do tcnico for negativo, rejeitar o pedido"), tempo de espera ("se o tcnico no
der um parecer em 2 dias, volte o processo ao gerente"). Este fluxo programado utilizando-
se diagramas (com smbolos grficos).
Depois de programado o fluxo, cada novo fluxo ou processo iniciado (instncia) dever seguir
o fluxo programado, e quem controla isto o sistema automatizado. Ento os problemas
citados anteriormente devero ser eliminados porque:

os documentos so incorporados ao processo como documentos eletrnicos (escaneados
ou gerados diretamente no computador, como por exemplo formulrios); ento no h
perda, extravio ou dano a documentos (somente os que precisarem ser armazenados
fisicamente podem sofrer, mas no entraro na rota fsica);
o processo automatizado, ento muitas tarefas podem ser automatizadas, eliminando
atividades manuais que no agregam valor ao processo ou referem-se a deslocamentos
fsicos; como neste exemplo, o encarregado levando documentos fsicos de um prdio
para outro; at mesmo a solicitao poder ser feita eletronicamente pela Web;
o sequenciamento das tarefas controlado pelo sistema, ento ningum precisa saber para
onde enviar documentos; isto programado no fluxo (por exemplo, para qual setor ser
enviado o pedido dependendo do assunto designado pelo solicitante, para quem enviar
caso uma deciso seja negativa ou positiva); e no haver erro de enviar documentos para
sequncias erradas;
os sistemas de Workflow so dotados de "alertas", programados no fluxo, que avisam os
participantes do processo dos deadlines, diminuindo assim os esquecimentos; por
exemplo, o tcnico poder ser lembrado a cada 2 dias da sua tarefa, quando fizer "login"
no sistema ou por e-mail;
pedido de
compra
pedido
pedido
pedido + parecer
pedido
pedido + deciso
deciso
deciso
52

os usurios do sistema podem receber instrues do que deve ser feito, evitando assim que
as pessoas fiquem sem saber o que fazer; o tcnico pode pedir ajuda para saber que tipo de
parecer deve dar;
o sistema poder dar informaes sobre status ou andamento do processo; a qualquer
momento, o funcionrio que fez o pedido entra no sistema de Workflow, identifica-se ou
procura por seu processo, e o sistema informar em que ponto est o andamento e poder
fazer uma estimativa de quanto tempo vai demorar a resposta.

Alm disto, sistemas de Workflow possuem outras funcionalidades tais como:

permitir a definio de papis e alocao de pessoas: por exemplo, no sistema podero ser
definidos os papis de gerente e tcnico, alguns usurios cadastrados em cada um dos
papis; isto permite que o sistema selecione uma pessoa apropriada para desempenhar
uma funo, assegurando qualidade e controle de acesso;
escala automtica: o prprio sistema seleciona um usurio associado a um papel (entre
tantos cadastrados), dependendo da carga de trabalho de cada um; como o sistema de
Workflow sabe quantos processos esto em andamento e o que est fazendo cada pessoas
participante do processo, ele sistema pode enviar um processo para uma pessoa menos
atarefada;
documentao das decises: quando h decises (caminhos alternativos), o sistema de
Workflow pode registrar o que foi decidido e por qu, para futuramente as pessoas
poderem recuperar o histrico.


A grande vantagem dos sistemas de Workflow agregar qualidade aos processos, pois h uma
documentao formal do que deve ser feito (programao do fluxo) e os processos so
realizados exatamente como definido (padro de qualidade: definir o que deve se feito e fazer
o que foi definido).

possvel associar sistemas de BPM (BPMS) aos sistemas de Workflow, para monitorar e
medir processos. Assim, ser possvel saber quantos processos so concludos a cada perodo
de tempo, quanto cada pessoa demora para realizar suas tarefas, onde esto os gargalos
(etapas do processo que demoram mais ou afunilam o processo).

No se deve confundir Workflow com GED, apesar de ambos utilizarem documentos
eletrnicos. No Workflow, obrigatoriamente h roteamento de documentos, ou seja, passando
entre pessoas ou tarefas. No caso do GED, os documentos so armazenados para depois serem
recuperados mais facilmente, sem necessariamente serem deslocados entre tarefas. claro
que ambos os sistemas podem funcionar de forma integrada, como muitos fabricantes destes
softwares j esto propondo.





15 Sistemas de Data Warehouse (Armazm de Dados)
Objetivo: agilizar tomada de decises sem onerar bases transacionais.
53


Data Warehouse (DWH) uma base de dados centralizada, criada a partir de dados copiados
de bases remotas e geralmente distribudas.

Imagine o seguinte problema: uma empresa possui diversas filiais espalhadas pelo mundo,
mas sua alta administrao est localizada nos EUA. Ento, num certo momento, um dos
diretores precisa de um relatrio consolidando dados de diversas filiais. Se a empresa utiliza
um banco de dados distribudo, para obter tal relatrio, os dados devero ser pesquisados nas
bases dispersas pelo mundo e depois consolidados em algum lugar. Isto pode demorar
bastante, dependendo do trfego de rede, da potncia dos servidores locais, do servidor que
faz a consolidao, da complexidade do relatrio e nmero de atributos e registros a serem
pesquisados. Alm disto, as bases podem ser heterogneas (cada base local est num formato
diferente ou utiliza um software de banco de dados diferente), dificultando ainda mais a
consolidao.
Uma alternativa possvel centralizar os dados num servidor nico, por exemplo nos EUA,
junto alta direo. Neste caso, o diretor ter seu relatrio de forma mais gil, mas poder
onerar os sistemas transacionais/rotineiros. Imagine que uma venda, para ser feita, dever
acessar a base centralizada. Ento nenhuma das alternativas tima, seja a centralizada ou a
distribuda.
A soluo encontrada mesclar estes 2 tipos de alternativas. Isto , manter as bases
distribudas para autonomia das filiais e agilidade dos sistemas transacionais, mas ao mesmo
tempo criar uma base centralizada para apoiar as decises, como mostra a Figura 34. As bases
distribudas so chamadas bases OLTP (online transactional processing) e a base centralizada
chamada de base OLAP (online analytical processing).
Normalmente, a base OLAP tambm chamada de Data Warehouse (ou armazm), mas ter
somente uma base centralizada no um DWH. DWH um conceito que caracteriza uma
soluo que utiliza bases distribudas e uma base centralizada.
A grande vantagem que as anlises para apoiar decises so feitas de maneira gil, sem
onerar os sistemas transacionais que continuam funcionando normalmente. Normalmente, um
sistema de DWH tem suas bases OLTP distribudas, mas no precisa ser sempre assim. O
conceito de DWH vem de uma soluo muito simples. Antigamente, os bancos de dados
ficavam em servidores com sistema operacional Unix-like, mas o uso mais comum dos dados
era em mquinas Windows. Para Unix, no havia softwares amigveis, para usurios finais, os
quais queriam customizar suas anlises (o conceito de "end user computing"). Assim, os
gestores precisavam pedir ao setor de TI (os antigos CPDs) que fizessem cpias de alguns
dados para poderem ser lidos e analisados em planilhas em Windows. Assim, nasceu o
conceito de DWH ( claro, que bem mais evoludo atualmente).






Figura 34: Esquema exemplo de um Data Warehouse


A base OLAP criada com dados vindos das bases OLTP. Esta base OLAP, porm, no
contm todos os dados, mas apenas dados consolidados ou resumidos (dados
Por exemplo, muito provavelmente a
nome de um cliente, mas gostaria de ter totais de clientes por bairro.
A base OLAP dinmica, ou seja, atualizada periodicamente. Esta periodicidade
determinada pela necessidade, e pode ser no fim d
ms, uma vez que as decises so tomadas com base em tendncias e os dados no precisam
ser atualizados em tempo real. Isto quer dizer que a base OLAP uma fotografia dos dados
(snapshot). Entretanto, os dados na base
ali, no sero alterados ou excludos, mantendo
perdurar por anos.
Geralmente, a base OLAP contm
principalmente porque rene todos os dados das bases distribudas. Para uma melhor
organizao, o DWH pode ser dividido em Data Marts, contendo
assunto. Por exemplo, o setor de Marketing deseja analisar dados demogrficos e vendas de
clientes, j o setor financeiro pode querer analisar somente formas de pagamento, preos e
parcelas referentes s vendas, alm da classe scio
geralmente so vises da base OLAP, no sendo necessariamente bases fsicas

Entre as bases OLAP e OLTP, h o que se chama de Middleware, que pode simplesmente ser
um esquema de comunicao entre as bases (
fim (three-tier). O Middleware responsvel pelas seguintes oper

cpia peridica dos dados das bases OLTP para a base OLAP;
filtragem: seleo dos dados que sero copiados;
limpeza dos dados: isto inclui o tratamento de valores nulos, controle de inconsistncias,
eliminao de duplicidades (registros duplicados,
evento);
54

: Esquema exemplo de um Data Warehouse
A base OLAP criada com dados vindos das bases OLTP. Esta base OLAP, porm, no
contm todos os dados, mas apenas dados consolidados ou resumidos (dados sumarizados
Por exemplo, muito provavelmente a alta administrao no precisa saber o endereo ou
nome de um cliente, mas gostaria de ter totais de clientes por bairro.
A base OLAP dinmica, ou seja, atualizada periodicamente. Esta periodicidade
determinada pela necessidade, e pode ser no fim do dia, da semana ou mesmo no final do
ms, uma vez que as decises so tomadas com base em tendncias e os dados no precisam
ser atualizados em tempo real. Isto quer dizer que a base OLAP uma fotografia dos dados
Entretanto, os dados na base OLAP no so volteis, ou seja, uma vez includos
ali, no sero alterados ou excludos, mantendo-se uma base com dados histricos que podem
a base OLAP contm grandes volumes de dados (terabytes ou mesmo exabyte
todos os dados das bases distribudas. Para uma melhor
organizao, o DWH pode ser dividido em Data Marts, contendo dados separados por
assunto. Por exemplo, o setor de Marketing deseja analisar dados demogrficos e vendas de
j o setor financeiro pode querer analisar somente formas de pagamento, preos e
parcelas referentes s vendas, alm da classe scio-econmica dos clientes. Os Data Marts
geralmente so vises da base OLAP, no sendo necessariamente bases fsicas distintas.
ntre as bases OLAP e OLTP, h o que se chama de Middleware, que pode simplesmente ser
um esquema de comunicao entre as bases (two-tier) ou ser um servidor especfico para este
). O Middleware responsvel pelas seguintes operaes:
cpia peridica dos dados das bases OLTP para a base OLAP;
filtragem: seleo dos dados que sero copiados;
limpeza dos dados: isto inclui o tratamento de valores nulos, controle de inconsistncias,
eliminao de duplicidades (registros duplicados, que se referem mesma entidade ou
A base OLAP criada com dados vindos das bases OLTP. Esta base OLAP, porm, no
sumarizados).
alta administrao no precisa saber o endereo ou
A base OLAP dinmica, ou seja, atualizada periodicamente. Esta periodicidade
o dia, da semana ou mesmo no final do
ms, uma vez que as decises so tomadas com base em tendncias e os dados no precisam
ser atualizados em tempo real. Isto quer dizer que a base OLAP uma fotografia dos dados
OLAP no so volteis, ou seja, uma vez includos
se uma base com dados histricos que podem
grandes volumes de dados (terabytes ou mesmo exabytes),
todos os dados das bases distribudas. Para uma melhor
separados por
assunto. Por exemplo, o setor de Marketing deseja analisar dados demogrficos e vendas de
j o setor financeiro pode querer analisar somente formas de pagamento, preos e
Os Data Marts
distintas.
ntre as bases OLAP e OLTP, h o que se chama de Middleware, que pode simplesmente ser
) ou ser um servidor especfico para este
limpeza dos dados: isto inclui o tratamento de valores nulos, controle de inconsistncias,
que se referem mesma entidade ou
55

integrao das bases distribudas ("merge"): exigindo integrar registros com dados
parciais (por exemplo, uma base de clientes com dados financeiros e outra base sobre os
mesmos clientes com dados de vendas);
padronizao dos dados: por exemplo, se o campo "nome do produto" tiver formatos
diferentes em cada base, na base OLAP s permitido um formato padro.

Estas operaes tambm constituem uma sub-rea chamada de ETL (extraction-
transformation-load) e h ferramentas de software especficas para ajudarem nestas tarefas.

Dados Multidimensionais / Cbicos

Geralmente, os dados que compem um DWH so organizados numa estrutura chamada
Multidimensional. Isto porque h uma estrutura principal de dados (fatos) e estruturas
auxiliares (dimenses). Por exemplo, um banco de dados sobre vendas de uma empresa teria
como fatos os dados sobre as vendas (nota fiscal, cdigos de produtos, cdigo de clientes,
data, valor pago, forma de pagamento, cdigo da loja, cdigo do vendedor), enquanto haveria
outros dados relacionados a vendas (dimenses). As dimenses normalmente possuem uma
estrutura particular e separada. Neste nosso exemplo, as dimenses e seus dados seriam:
produtos (descrio, preo, setor), clientes (nome, endereo, idade), lojas (endereo, tamanho,
gerente) e vendedores (nome, endereo, salrio, data de admisso). Ento o modelo deste
exemplo possui 4 dimenses e uma base de fatos.
Dados multidimensionais podem ser armazenados de diferentes formas, como a seguir
descrito.

Banco de dados relacional normalizado
No exemplo considerado acima, haveria uma tabela central (tabela de fatos) com os atributos
das vendas e depois uma tabela para cada dimenso (cada qual com seus campos).
Este modelo tambm chamado de modelo Estrela (Star). Quando as tabelas de dimenses
tambm so normalizadas (por exemplo, criar tabelas para cidades e pases), o modelo
chamado de Floco-de-neve (Snow flake).

Banco de dados relacional no-normalizado
Esta alternativa utiliza bancos de dados relacionais mas h somente uma tabela, juntando
dados referentes a fatos e dimenses. A tabela no normalizada e por isto gera redundncia
de dados e aumenta em muito o volume da base.
Entretanto, como a estrutura simples (apenas uma tabela), a anlise dos dados feito de
forma mais gil, pois no preciso passar por diversas tabelas (realizar operaes de join).
Por exemplo, se um gerente quiser cruzar a faixa etria de clientes com faixas de preos de
produtos, s precisar de uma tabela. No caso da tabela normalizada, o processamento dever
passar por 3 tabelas, no mnimo (clientes, vendas e produtos).


Banco de dados multidimensional
Existem SGBDs multidimensionais, que armazenam os dados em formato de matrizes e
vetores, e no como tabelas. A Figura 35 apresenta o mesmo conjunto de dados (vendas:
produto X loja X quantidade). No lado esquerdo, foi utilizado um modelo relacional no-
normalizado, enquanto que no lado direito temos uma representao multidimensional (com
56

matrizes). O formato multidimensional mais compacto e tambm ajuda nas operaes de
anlise, descritas a seguir. Neste exemplo, h somente duas dimenses: lojas e produtos.
Imagine agora que se queira acrescentar uma 3a dimenso (clientes). Assim, teramos o
esquema da Figura 36. As vendas de cada cliente formariam uma matriz e assim teramos
tantas matrizes quanto forem os clientes. Isto d a ideia de 3a dimenso como visto na
imagem. Se for necessrio acrescentar mais dimenses (por exemplo, vendedor), isto ser
feito nas estruturas internas de armazenamento, pois no ser possvel ao ser humano
imaginar visualmente tal estrutura (4 dimenses).
Se olharmos melhor, esta imagem lembra a de um cubo, por isto, muitas vezes os dados
multidimensionais so tambm conhecidos como dados cbicos.


Figura 35: Comparao de esquemas relacional X multidimensional para DWH


Figura 36: Dados multidimensionais - exemplo para 3 dimenses



A vantagem dos dados cbicos acelerar as anlises e dar respostas mais rapidamente para
usurios que tomam decises. Alm disto, a visualizao de dados em duas ou mais
dimenses ajuda a ver padres que so difceis de identificar em tabelas normalizadas (flat).

Loja Produto Quantidade
1 X 10
1 Y 15
2 X 25
2 Y 20
2 Z 30
3 X 10
3 Z 20
X Y Z
1 10 15 -
2 25 20 30
3 10 - 20
LOJAS
PRODUTOS
X Y Z
1 10 15 -
2 25 20 30
3 10 - 20
X Y Z
1 10 15 -
2 25 20 30
3 10 - 20
X Y Z
1 10 15 -
2 25 20 30
3 10 - 20
57



16 Sistemas de Database Marketing
Objetivo: armazenar informaes sobre clientes, com objetivo de apoiar o marketing direto
ou de preciso, alm de permitir identificar perfis de clientes (para segmentao).

Os sistemas de Database Marketing so basicamente um banco de dados sobre clientes
potenciais, para onde ser dirigida a comunicao das campanhas de marketing. Aqui o
objetivo fazer marketing direto e no marketing de massa, isto , direcionar as campanhas
para pblicos especficos (target, pblico alvo), ou seja, focar em Prospects e no Suspects.
Suspects so quaisquer pessoas que possam comprar com nossa empresa. Prospects so os
clientes potenciais, aqueles que mais provavelmente iro comprar com ns.
Por exemplo, se tivermos uma loja que vende acessrios de som para carros, no centro de
Porto Alegre. Suspects incluem qualquer pessoa que entrar em nossa loja e comprar algo com
a gente. Mas mais provavelemente, a maioria de nossos clientes sero homens jovens, que tm
carro e moram ou trabalham perto do centro de Porto Alegre. Isto significa que no vamos
fazer propaganda para mulheres, pessoas de outras cidades ou para quem no tem carro. Se
formos distribuir panfletos na rua, escolheremos homens jovens que estejam de carro no
centro de Porto Alegre.
A razo para este tipo de escolha matemtica ou financeira. A taxa de retorno com
marketing de massa de 0,1%. Isto significa que, se mandarmos 1 mil cartas para pessoas
indiscriminadamente, venderemos apenas para 1 cliente. Imagine que gastemos 1 real por
carta (total de mil reais) e os produtos que vendemos trazem 100 reais de lucro lquido. No
vale a pena.
Agora, se direcionarmos nossas campanhas para um pblico mais restrito, mais certo, a taxa
de retorno j aumenta para 8%. Ou seja, nem precisamos mandar as mil cartas, talvez 100 j
sejam suficientes (custo de 100 reais), pois trariam 8 clientes, num lucro total de 800 reais
lquidos.

Este banco de dados sobre clientes deve possuir dados demogrficos sobre pessoas (nome,
endereo, idade, classe scio-econmica), mas tambm pode ter preferncias (cores, estilos,
etc.) e hbitos (como paga, quando compra, onde).
Se a empresa est comeando agora, dever obter estes dados em outros lugares. Por exemplo,
atravs da compra de cadastros com parceiros ou empresas de marketing ou comunicao,
pesquisas de campo (na rua), listas telefnicas, malas diretas com clubes e associaes.

O objetivo encontrar perfis de clientes (quem nosso cliente). E isto pode levar a empresa a
descobrir que possui vrios segmentos de clientes.
Uma empresa de telefonia segmentou seu portflio de 70 aparelhos em quatro grupos,
correspondendo a quatro categorias de clientes. A anlise de perfis foi feita com base em
atitudes dos clientes e resultou em 4 grupos de clientes: o "descomplicado", "multifuncional",
"fashion" e "high tech".
O cliente "descomplicado" o que pretende apenas falar ao telefone, sensvel a preo e no
se importa com marcas, quer um aparelho de boa qualidade, durvel e fcil de usar. O
"multifuncional" faz questo de aproveitar todas as funcionalidades, como agenda, emails,
vdeo, foto e tudo o mais que o aparelho oferecer para facilitar seu trabalho. O "fashion"
aquele que busca personalizao, quer que o seu celular se identifique com ele, unindo as
58

funes do anterior ao aspecto de esttica. Por fim, o "hight tech" aquele que faz questo de
ter o aparelho mais sofisticado, com bluetooth, cmera com alta resoluo, e tudo o que a
tecnologia oferecer. Em geral no se importa com preos.
Esta segmentao atitudinal no tem nada a ver com o poder aquisitivo do cliente.


Formas de coleta de dados: explcita, implcita e por inferncia

Existem basicamente 3 formas de coletar dados sobre clientes.

A coleta de dados explcita acontece quando perguntamos algo a algum (num entrevista ou
questionrio) e a pessoa nos d os dados em forma de resposta. Ou ento quando algum
preenche um formulrio na Web ou nos diz algo, mesmo sem a gente pedir.

J a coleta implcita aquela que utiliza a observao. No conheo estabelecimento que faa
isto, mas um futuro provvel. Quando voc paga em dinheiro num supermercado, este s
registra o que voc comprou e como; no ficam registrados dados como seu sexo, idade, etc.
Mas imagine que o operador do caixa (check-out) possa observar o cliente e utilizar cdigos
para dar entrada no sistema de dados que ele est vendo (sexo, faixa etria, estilo de se vestir,
se est acompanhado ou no).
Num futuro um pouco mais distante isto j poder ser feito atravs da anlise de imagens
gravadas com cmeras. J foi feito um experimento que, pelo contorno da pessoa diante de
um banner, era possvel identificar o sexo e a faixa etria.

Com esta onda de Big Data por a, est todo mundo coletando dados sobre todos. A operadora
de celular sabe por onde a gente anda e quando. Qual o caminho que costumamos fazer, por
onde costumamos andar em cada dia da semana e horrio. E se instalarmos aplicativos tipo o
Waze no nosso celular, a Google (que comprou o Waze) vai saber at a que velocidade
estamos andando. E da inferir se estamos a p ou de carro, ou num engarrafamento. A
algum inventou a tecnologia de RFID, e ela est em cartes com chips, carros, produtos
novos e vai estar em sacolas, carrinhos de supermercados, etc. Ento no s por celular. Os
aplicativos e softwares que usamos em celulares, tablets, notebooks e etc tambm esto
avisando onde estamos, se estivermos conectados via Wifi, 3G ou 4G.
Este tipo de coleta tambm considerada implcita, apesar de no usar a observao humana.
Neste caso, a observao feita sobre dados eletrnicos, capturados por dispositivos
eletrnicos.

Paco Underhill e colegas do consultoria h mais de 20 anos analisando dados coletados
atravs de observao (e depois fazendo estatstica sobre os dados e encontrando padres). Os
dados so coletados por "falsos clientes", que andam pelas lojas observando clientes reais, ou
ento atravs de gravao de vdeos das lojas. So mais de 200 variveis analisadas, incluindo
o estilo do cliente, faixa etria, sexo, se tocou no produto, onde estava o produto (prateleira,
altura), o caminho percorrido pelo cliente na loja, como carrega o produto), alm de dados
sobre a prpria loja (produtos prximos, layout da loja, sinais e placas).
Uma das descobertas deles que as pessoas passam rpido por vitrines de bancos, mas
diminuem quando h espelhos. Veja a foto da Figura 37. H um espelho estreito entre lojas de
um shopping. O espelho chama a ateno das pessoas que passam, que tendem a olhar para o
59

espelho, como observou o grupo de Paco Underhill. Entretanto, como o espelho estreito,
quando a pessoa olha para o lado j passou o espelho e est vendo a vitrine.



Figura 37: Espelho entre vitrines


Algumas descobertas de Paco e seu grupo:
Cosmticos e produtos de beleza no devem ficar na frente da loja (por privacidade do
cliente);
Mulheres jovens compram cor para cabelo em lojas de beleza; senhoras, em farmcias;
60

Revistaria sem lugar para apoiar pasta ou compras; pagamento demora mais, bem na hora
do rush;
Capacidade das mos para carregar determina o quanto as pessoas iro gastar; por isto,
deixar as cestas para carregar produtos no meio da loja, e ter carrinhos maiores para mais
vendas;
Clientes compram mais de falam com algum funcionrio;
Senhora dando al na entrada inibe roubos;
Pessoas tendem a entrar na loja e ir para direita;
Lojas de produtos femininos precisam de cadeiras para maridos sentarem;
Blockbuster: clientes entravam e olhavam o carrinho com as devolues; colocaram
ttulos antigos no carrinho e os ttulos comearam a sair;
Homens compram como dirigem: no perguntam, no procuram, no avaliam, querem sair
logo da loja;
65% dos homens que experimentaram roupas as compraram; apenas 25% das mulheres;
60 a 70% das compras num supermercado no so planejadas (compras por impulso);
Homens gostam de ler e analisar detalhes tcnicos;
Homens compram coisas para fora da casa; mulheres para dentro;
Quanto mais tempo na loja, mais compras (marketing de experincia);
Mais tempo na loja exige mais espao (e confortvel);
Tempo que mulheres ficam na loja:
o Acompanhadas de mulheres: 8 minutos
o Com crianas: 7 minutos
o Sozinhas: 5 minutos
o Com Homens: 4 minutos


Inferir gerar uma informao a partir de outra. Se voc compra muito produto congelado no
supermercado, a anlise destes dados pode ajudar a inferir que:
a) voc tem um bom freezer em casa;
b) voc no sabe cozinhar ou no gosta;
c) voc uma pessoa muita atarefada e no tem tempo nem para cozinhar.

A coleta por inferncia ento quando o sistema gera informaes novas a partir de outras.
O nvel de inferncia subjetivo de cada organizao e certamente aumenta a incerteza sobre
a veracidade da informao. Mas muitas empresas assumem o risco desta incerteza, porque
mais incerto ainda no saber nada sobre o cliente.
Tempos atrs surgiram alguns artigos falando sobre Phenomenal Data Mining. Que significa
tentar inferir eventos ou atributos de entidades a partir de colees de dados. na prtica e
com seriedade fazer aquela brincadeira de analisar os restos no lixo de algum. A voc saber
que tipo de pessoa , pelo que compre e consome (marcas, tipos de produtos, faixas de preos,
etc). Assim, se voc compra Xampu feminimo e desodorante feminino juntos na mesma
compra, voc uma mulher. Se comprar Xampu para carro, esponja para lavar carro e creme
para polimento de carro, voc certamente tem um carro. claro que h margem para erros.
E utilizando a sabedoria das massas, se numa loja de supermercado a venda de gua mineral
foi muito acima do normal, porque faltou gua neste bairro. E se na mesma cidade, vrias
farmcias esto vendendo antigripal, porque h um surto de gripe. E provavelmente a
temperatura tambm esfriou ou a umidade aumentou.
61

E isto j chegou Internet. O Facebook j consegue inferir nossa orientao sexual e
tendncia poltica s analisando nossas "curtidas" (ler a reportagem "Estudo mostra que boto
Curtir do Facebook revela muito mais do que se imagina sobre o usurio
http://oglobo.globo.com/tecnologia/estudo-mostra-que-botao-curtir-do-facebook-revela-
muito-mais-do-que-se-imagina-sobre-usuario-7812419).

H uns tempos atrs, a Microsoft tinha um experimento para inferir sexo e faixa etria de uma
pessoa, pelo tipo de assunto que buscava na Internet (http://adlab.msn.com/DPUI/DPUI.aspx).
Veja a Figura 38. Ele sugere que algum pesquisando por "car tuning" seja homem (74% de
chances) com idade entre 25 e 34 anos. E se algum pesquisar por "brush baton eye", deve ser
uma mulher (59%) com mais de 50 anos.



Figura 38: Inferncia de informaes

Um exemplo caso aconteceu em algumas sinaleiras de grandes cidades. Um pessoa passava
pelos carros perguntando ao motorista se queria ganhar um brinde. A grande maioria das
pessoas dizia que sim, mesmo que desconfiadas. Ento o "entrevistador de sinaleiras" pedia o
nome e o telefone do motorista, alegando que depois entraria em contato.
A princpio, parece que s foi utilizada a coleta explcita (perguntas e respostas). Mas se
pararmos para pensar, a pessoa s se dirigia a certos tipos de carros. Alm disto, anotava mais
que o nome e o telefone. Ela anotava o tipo de carro e outros dados que conseguisse coletar
(adesivos informando que h bebs no carro, sobre estacionamentos hospitalares, associaes
e clubes, etc). Ento este um tipo de coleta implcita, por observao.
Alm disto, os dados iam para centrais onde eram ento analisados. A partir dos dados
coletados explcita ou implicitamente, algum iria fazer uma inferncia. Por exemplo, a partir
do selo de estacionamento de mdicos num hospital, pode-se inferir a profisso de mdico;
da tem-se o perfil de pessoas com boa renda e alto senso crtico. Se o carro tinha cadeira de
bebs, infere-se que h uma famlia por trs.



62

17 Sistemas de CRM (Customer Relationship Management)
Objetivo: armazenar informaes sobre clientes efeitos com o objetivo de aumentar ou
melhorar este relacionamento (marketing de relacionamento ou marketing 1-to-1).

Os sistemas de CRM armazenam todo tipo de informao sobre o cliente, incluindo dados
demogrficos como no Database Marketing, mas tambm todas as informaes sobre o
relacionamento de cada cliente individual (atual ou potencial) com a organizao (contatos
feitos, reclamaes, pedidos de informaes ou produtos, produtos no adquiridos, etc.).

A diferenar entre Database Marketing e CRM, que o primeiro apoia o Marketing Direto,
cujo objetivo aumentar o nmero de clientes (market share), enquanto que o segundo apoia
o Marketing de Relacionamentos (ou Marketing one-to-one), cujo objetivo aumentar as
necessidades satisfeitas dos clientes (wallet share, ou seja, participao nos gastos do cliente)
sem necessariamente aumentar o nmero de clientes, como demonstrado na Figura 39. Isto
quer dizer que veremos as empresas preocupadas em complementar seus produtos e servios,
oferecendo sempre algo a mais. Por exemplo, h supermercados oferecendo seguros. Isto
pode ser feito por meio de parcerias, para evitar que a empresa saia do seu foco, mas mesmo
assim estar deixando o cliente mais satisfeito e garantindo que volte.



Figura 39: Comparao entre sistemas de Database Marketing e CRM

O grande objetivo do CRM aumentar a fidelidade do cliente. A Figura 40 apresenta um
esquema de classificao de clientes. Suspects e prospects, como j discutido no sistema
anterior, ainda no so clientes. Quando uma pessoa compra algo, torna-se cliente de primeira
compra. Se voltar, um cliente eventual. Se houver uma certa frequncia ou regularidade,
ser considerado um cliente frequente, habitual ou regular. A regularidade no fixa; por
exemplo, um cliente que compre carro a cada 2 anos, ser um cliente frequente para uma
revenda de automveis. Melhor que isto, s se ele for fiel. Um cliente fiel tende a comprar s
com uma empresa e est menos suscetvel a problemas eventuais de atendimento. Se um dia
ele for mal atendido, acreditar que uma exceo. O melhor de todos o cliente Pregador ou
Advogado. Alm de ter as mesmas caractersticas do cliente fiel, ele ainda defende a empresa
perante outros consumidores e ajuda na divulgao. Esta a melhor propaganda, pois o
prprio cliente est recomendando produtos ou servios porque usou ou comprou e gostou;
no a empresa que est dizendo. E isto tudo praticamente sem custos para a empresa.


Figura 40: Tipos de clientes

Conforme pode ser visto na Figura
empresas "atacarem" os cliente. A primeira a "conquista" e a segunda, a "fidelizao" (ou
reteno ou manuteno). A fidelizao importa
satisfeito e com isto volte a comprar.
H estatsticas que afirma que mais fcil e barato manter clientes que conquistar novos
clientes. Vejamos alguns argumentos:

as empresas perdem em mdia
ano; ento se uma empresa que possui 500 mil clientes diz que conseguiu 100 mil clientes
novos num ano, ela deve contabilizar uma perda de 20 a 40 mil clientes, ou seja, no
resultado ela s teve um aumento de, no mximo, 8
so necessrios 7 contatos para converter um cliente potencial em algum que concretiza
primeira compra: isto muito trabalho e custo para a empresa; ela dever entregar um
panfleto, colocar propaganda na TV, no rdio, faz
sua loja e ainda assim no ter conseguido os 7 contatos;
clientes fiis compram o dobro ou mais no final de 24 ou 30 meses, em relao aos
primeiros 6 meses;
95% dos clientes insatisfeitos nunca reclamam e 90% dos
comprar; 14% mudam de marca porque suas reclamaes no foram atendidas
empresa mdia tem entre 60 e 70% de chances de voltar a vender para seus clientes ativos,
20 a 40% de chances de vender a cliente perdidos e 5 a 20% de
venda para clientes potenciais
apenas 48% das empresas identificam um problema antes do cliente
1 cliente que entra ou satisfeito, traz consigo de 3 a 5 outros (propagandeia sua satisfao
para 3 ou 5 outros clientes);
10 a 15 clientes (ir disseminar sua raiva bem mais que o cliente satisfeito); em tempos de
redes sociais, estes dados devem ter multiplicado; no final, depois da conta na ponta do
lpis, pode-se ver que muito caro conquistar clientes.

O maior pressuposto para que um sistema de CRM funcione, que a
63

Figura 40, h basicamente 2 estratgias principais para
empresas "atacarem" os cliente. A primeira a "conquista" e a segunda, a "fidelizao" (ou
reteno ou manuteno). A fidelizao importante porque garante que o cliente fique
satisfeito e com isto volte a comprar.
H estatsticas que afirma que mais fcil e barato manter clientes que conquistar novos
clientes. Vejamos alguns argumentos:
empresas perdem em mdia de 20 a 40% (taxa mdia de churn) de seus clientes por
ano; ento se uma empresa que possui 500 mil clientes diz que conseguiu 100 mil clientes
novos num ano, ela deve contabilizar uma perda de 20 a 40 mil clientes, ou seja, no
resultado ela s teve um aumento de, no mximo, 80 mil clientes devido s perdas;
so necessrios 7 contatos para converter um cliente potencial em algum que concretiza
: isto muito trabalho e custo para a empresa; ela dever entregar um
panfleto, colocar propaganda na TV, no rdio, fazer telemarketing, receber o cliente em
sua loja e ainda assim no ter conseguido os 7 contatos;
clientes fiis compram o dobro ou mais no final de 24 ou 30 meses, em relao aos
95% dos clientes insatisfeitos nunca reclamam e 90% dos que reclamam nunca voltam a
comprar; 14% mudam de marca porque suas reclamaes no foram atendidas
empresa mdia tem entre 60 e 70% de chances de voltar a vender para seus clientes ativos,
20 a 40% de chances de vender a cliente perdidos e 5 a 20% de concretizar a primeira
venda para clientes potenciais;
apenas 48% das empresas identificam um problema antes do cliente;
1 cliente que entra ou satisfeito, traz consigo de 3 a 5 outros (propagandeia sua satisfao
para 3 ou 5 outros clientes); j um cliente que sai (insatisfeito), tende a leva
a 15 clientes (ir disseminar sua raiva bem mais que o cliente satisfeito); em tempos de
redes sociais, estes dados devem ter multiplicado; no final, depois da conta na ponta do
muito caro conquistar clientes.
O maior pressuposto para que um sistema de CRM funcione, que a empresa esteja

, h basicamente 2 estratgias principais para as
empresas "atacarem" os cliente. A primeira a "conquista" e a segunda, a "fidelizao" (ou
nte porque garante que o cliente fique
H estatsticas que afirma que mais fcil e barato manter clientes que conquistar novos
) de seus clientes por
ano; ento se uma empresa que possui 500 mil clientes diz que conseguiu 100 mil clientes
novos num ano, ela deve contabilizar uma perda de 20 a 40 mil clientes, ou seja, no
0 mil clientes devido s perdas;
so necessrios 7 contatos para converter um cliente potencial em algum que concretiza
: isto muito trabalho e custo para a empresa; ela dever entregar um
er telemarketing, receber o cliente em
clientes fiis compram o dobro ou mais no final de 24 ou 30 meses, em relao aos
que reclamam nunca voltam a
comprar; 14% mudam de marca porque suas reclamaes no foram atendidas;
empresa mdia tem entre 60 e 70% de chances de voltar a vender para seus clientes ativos,
concretizar a primeira
1 cliente que entra ou satisfeito, traz consigo de 3 a 5 outros (propagandeia sua satisfao
levar consigo de
a 15 clientes (ir disseminar sua raiva bem mais que o cliente satisfeito); em tempos de
redes sociais, estes dados devem ter multiplicado; no final, depois da conta na ponta do
esteja focada no
64

cliente e no no produto. Jack Welch (ex-presidente da GM e GE) avisa: vantagem
competitiva se consegue assim:
a) aprender sobre clientes mais rpido que a concorrncia; e
b) transformar mais rpido este conhecimento sobre clientes em aes.

Tipos de CRM
Os sistemas de CRM podem ser classificados em 3 tipos, a saber:
a) CRM operacional: permite interagir com cliente e atender suas demandas bsicas;
geralmente, est associado s tarefas no nvel operacional da pirmide organizacional;
b) CRM analtico: seu objetivo analisar os clientes de clientes, para gerar diferenciao e
personalizao;
c) CRM colaborativo: serve para integrar os pontos de contato da empresa com o cliente
(touch points).

Na prtica, um sistema de CRM pode incluir um dos tipos ou uma combinao dos tipos.


Viso 360
O CRM deve procurar saber tudo sobre o cliente, para atend-lo melhor e poder satisfazer
melhor suas necessidades. Isto se chama a viso 360 do cliente. Ele funciona como o
quitandeiro (dono do armazm) da esquina que sabe nosso nome, onde moramos, o que
gostamos, como costumamos pagar e at mesmo pergunta por parentes que estejam doentes.
O objetivo no invadir privacidade, mas poder entender melhor o cliente e evitar produtos
ou servios que no sejam adequados ou mesmo evitar propaganda mal direcionada.
Para isto, alm de coletar dados demogrficos sobre clientes, preciso saber seus gostos,
preferncias e hbitos. Tudo isto se consegue mantendo um histrico dos relacionamentos.
No basta s registrar o que o cliente comprou, o que ele quis comprar e no comprou (porque
no tinha em estoque ou porque mudou de ideia), tambm so informaes importantes
(anlise de descartes).
claro que este coleta de informaes no pode ser feita de uma vez s, para no aborrecer o
cliente. Por isto, costuma-se usar o que se chama de "irrigao gota-a-gota", que coletar
poucas informaes a cada contato. Tambm podem ser utilizada as chamadas "golden
questions", que so perguntas que acabam trazendo informaes diversas. Por exemplo, a
profisso da pessoa pode dizer algo sobre seu status social, seu modo de vida e trabalho ou
seu nvel de exigncia e tolerncia. Pode-se tambm usar tcnicas de coleta implcita ou por
inferncia, como j discutido anteriormente.

Segundo Peppers & Rogers, um CRM construdo em 4 passos:
a) identificar o cliente;
b) diferenciar clientes;
c) interagir com clientes;
d) personalizar produtos e servios.

65

Identificar clientes
O CRM no trabalha com clientes potenciais. A ideia focar em clientes efetivos. Para tanto,
necessrio identificar cada cliente individualmente. Normalmente, pensa-se em utilizar
atributos numricos como CPF e RG. Entretanto, hoje em dia, e-mail, telefone celular e at
mesmo endereo podem ser utilizados para identificar clientes.
Deve-se ter cuidado com bases de clientes construdas com dados vindos de bases diferentes
(tipo Data Warehouse). necessrio fazer a integrao dos dados (merge) e a deduplicidade
(eliminao de registros duplicados).
Houve uma vez o caso de um Shopping que quis montar um banco de dados de seus clientes.
Para isto, coletou todos os cadastros das lojas que ficavam no seu espao. O problema que
cada loja usava um tipo de identificador diferente. Alm disto, algumas lojas usavam o nome
do cliente como identificador. O problema do nome que ele pode ser abreviado ou escrito de
forma errada e isto gera duplicatas. O mais fcil para o Shopping foi sortear um carro,
exigindo que, para concorrer, os clientes preenchessem um formulrio com seus dados
completos. claro que ningum ia querer ser sorteado e no ser encontrado por erro no
cadastro.


Diferenciar clientes
preciso fazer uma classificao de clientes. Pode-se utilizar a frequncia do cliente, o total
de gastos, a recncia (se o cliente veio h pouco ou faz tempo que no vem) e a lucratividade.
A lucratividade importante porque um cliente pode ter gastado 1 mil reais comprando
diversos produtos pequenos, enquanto que outro cliente gastou o mesmo comprando apenas
um produto. Isto quer dizer que o custo para atender o primeiro cliente foi maior e o lucro
com ele ser menor. Podemos tambm considerar a lucratividade de cada produto (razo entre
receita e custos com cada unidade do produto) e outros aspectos.
H uma tcnica chamada de "valor vitalcio do cliente" (life time value), que calcula quanto
vale um cliente para uma empresa, ao longo de toda a vida do cliente. Por exemplo, nos EUA
as revendas de automveis acreditam que podem vendar at 200 mil dlares para clientes,
desde os 18 at os 80 anos. Ento a empresa faz as contas de quanto desconto pode dar.
Imagine uma revenda dando o primeiro carro de graa para um jovem, sabendo que depois ele
vir comprar seus prximos carros na mesma revenda. No muito diferente do que j fazem
empresas de servios dando aparelhos ou no cobrando instalao.



66


Figura 41: Classificao de clientes quanto a sensibilidade a preo e marca

A Figura 41 apresenta um quadro que ajuda a classificar clientes. No eixo horizontal, temos a
sensibilidade marca. Clientes mais sensveis marca ficam direita; isto significa que
compram pensando na marca. esquerda, aqueles que no se preocupam muito com marcas.
No eixo vertical, h a sensibilidade ao preo. Na parte superior, clientes que se preocupam
com preo e na parte de baixo aqueles no vo considerar muito o preo na hora da compra.
O quadrante mais direita e abaixo, apresenta os clientes ditos fiis. O que normalmente as
empresas procuram. Eles compram pensando na marca, costumam comprar sempre do mesmo
fabricante ou fornecedor e no esto muito preocupados com preos de produtos ou servios,
porque admitem pagar mais caro por mais qualidade.
No quadrante de cima mais direita, esto os clientes racionais, os mais exigentes. Eles
pesquisam muito antes de comprar, comparam preos, condies, qualidade, caractersticas,
etc. Sua deciso lgica, muito racional. Gostam de marcas pela qualidade, mas esto atentos
a preos e a competies (por isto, tambm compram direcionados a promoes).
O quadrante mais esquerda e acima apresenta os chamados "cherry pickers", que vo
sempre atrs de promoes. O importante para eles o preo e marcas no so importantes.
No ltimo quadrante, mais abaixo e esquerda, esto os clientes que no se preocupam com
marcas e tambm no esto preocupados com preos. Esto so os compradores de
convenincia. Imagine um namorado saindo do trabalho, 7 horas da noite e indo encontrar-se
com a namorada. A ele lembra que no comprou nenhum presente e sai desesperado atrs de
algo. Ele vai comprar o que conseguir encontrar, no importando o que precise pagar. O
mesmo ocorre com algum chegando em uma cidade e precisando comprar um presente no
aeroporto. No tem como escolher muito, nem ficar pesquisando preo.

Geralmente, as empresas criam rankings de clientes, do mais importante para o menos. Isto
pode ser conseguido com um grfico tipo Pareto, como apresentado na Figura 42. Os
melhores clientes ficam esquerda. O grfico tambm chamada de curva ABC, porque os
clientes so divididos em 3 grupos, do mais importante (A) para o grupo dos menos
importantes (C) passando pelos mdios (B). Os clientes tipos C tambm so chamados de
Below Zero, ou seja, no acrescentam muito para a empresa e por isto no iro receber muita
ateno ou regalias. J entre os clientes do grupo A, esto os Clientes de Maior Valor, que
recebero descontos e tratamentos especiais, porque so muito importantes.
H tambm os chamados Clientes de Maior Potencial, que so aqueles que costumam aceitar
as promoes e ofertas e por isto tm maior potencial para concretizar uma compra.
Em muitos casos, o grupo de clientes do tipo A muito pequeno mas responsvel pela
maior parte da renda da empresa. Segundo a Regra de Pareto, possvel que apenas 20% dos
clientes traga 80% da receita total. Isto bom por um lado, porque a empresa s precisa se
preocupar com estes 20%, mas por outro lado ruim, caso a empresa perca um destes
clientes.

Figura 42: Grfico de Pareto -


Interagir com clientes
A empresa precisa interagir e comunicar
contato (touch points) e empresas parceiras
importante que todos os touch points
Colaborativo. Imagine um cliente de banco mandando mail para que resolvam um problema
para ele. Depois ele liga para a Central de Atendimento (0800) e ningum sabe do problema.
E depois ele vai at a agncia e nem mesmo o gerente de sua conta sabe sobre o tal mail ou
sobre a ligao.
O touch point ajuda no atendimento mas tambm serve para cole
360 do cliente. A diversidade de
isto facilita no atendimento e satisfaz mais o cliente.
Por exemplo, um banco pode ter como
servio de internet banking, o site e hoje em dia tambm o aplicativo para celular ou tablet.
O atendimento a clientes pode ser feito em
a) atendimento bsico: obrigatrio; no cumprir resulta em insatisfao, mas no
fidelidade;
b) atendimento esperado: lderes do mercado fornecem
c) atendimento inesperado: o que faz o
que passa a ser cliente pregador e advogado da empresa.

Personalizar
O objetivo final do CRM poder gerar
para cada cliente. Jeff Bezos da
ter 3 milhes de lojas diferentes. E por isto a Amazon pioneira em pe
parte ser discutida com mais detalhes no sistemas de Recomendao.

67
sos, o grupo de clientes do tipo A muito pequeno mas responsvel pela
maior parte da renda da empresa. Segundo a Regra de Pareto, possvel que apenas 20% dos
clientes traga 80% da receita total. Isto bom por um lado, porque a empresa s precisa se
preocupar com estes 20%, mas por outro lado ruim, caso a empresa perca um destes

Curva ABC
A empresa precisa interagir e comunicar-se com seus clientes. Para isto, ir utilizar pontos de
e empresas parceiras.
touch points estejam integrados e esta uma das funes do CRM
Colaborativo. Imagine um cliente de banco mandando mail para que resolvam um problema
le. Depois ele liga para a Central de Atendimento (0800) e ningum sabe do problema.
E depois ele vai at a agncia e nem mesmo o gerente de sua conta sabe sobre o tal mail ou
ajuda no atendimento mas tambm serve para coletar dados para formar a viso
360 do cliente. A diversidade de touch points ajuda o cliente a escolher seu canal preferido e
isto facilita no atendimento e satisfaz mais o cliente.
Por exemplo, um banco pode ter como touch points a sua agncia, o caixa e
servio de internet banking, o site e hoje em dia tambm o aplicativo para celular ou tablet.
pode ser feito em 3 nveis de desempenho:
bsico: obrigatrio; no cumprir resulta em insatisfao, mas no
esperado: lderes do mercado fornecem;
o que faz o diferencial, aumenta fidelidade e encanta o cliente,
que passa a ser cliente pregador e advogado da empresa.
O objetivo final do CRM poder gerar ofertas personalizadas, ou seja, uma oferta diferente
Amazon disse que, se ele tem 3 milhes de clientes, precisa
ter 3 milhes de lojas diferentes. E por isto a Amazon pioneira em personalizao. Esta
parte ser discutida com mais detalhes no sistemas de Recomendao.
sos, o grupo de clientes do tipo A muito pequeno mas responsvel pela
maior parte da renda da empresa. Segundo a Regra de Pareto, possvel que apenas 20% dos
clientes traga 80% da receita total. Isto bom por um lado, porque a empresa s precisa se
preocupar com estes 20%, mas por outro lado ruim, caso a empresa perca um destes
isto, ir utilizar pontos de
estejam integrados e esta uma das funes do CRM
Colaborativo. Imagine um cliente de banco mandando mail para que resolvam um problema
le. Depois ele liga para a Central de Atendimento (0800) e ningum sabe do problema.
E depois ele vai at a agncia e nem mesmo o gerente de sua conta sabe sobre o tal mail ou
tar dados para formar a viso
ajuda o cliente a escolher seu canal preferido e
a sua agncia, o caixa eletrnico, o
servio de internet banking, o site e hoje em dia tambm o aplicativo para celular ou tablet.
bsico: obrigatrio; no cumprir resulta em insatisfao, mas no aumenta
e encanta o cliente,
uma oferta diferente
disse que, se ele tem 3 milhes de clientes, precisa
rsonalizao. Esta
68


CRM Social

O uso de tecnologias associadas Internet, tais como blogs, twitter, redes sociais (ex.:
Facebook, Linkedin, ResearchGate) e mdias sociais (ex.: Youtube, Flickr, Picasa) permitem
aproximar a empresa de seus clientes. A empresa, ao utilizar tais tecnologias, rende-se ao
estilo do cliente e deixa de impor seus prprios pontos de contato. Alm disto, o cliente fica
mais livre para dizer o que pensa.
A ideia inicial era utilizar estes recursos apenas no 3o passo, para interagir com clientes, por
exemplo, gerando promoes ou divulgando a marca. Entretanto, com o avano das
tecnologias, a ideia evolui para complementar o cadastro dos clientes e ajudar a entender
melhor seus gostos e comportamentos. Isto ento passou a ser chamado de CRM Social.
A partir de uma identificao do cliente, as empresas podem visitar o perfil do cliente em
redes sociais e complementar os dados demogrficos. Nem sempre sistemas automticos tipo
robs e crawlers funcionam, porque muitos destes sites s permitem acessar perfis por senha e
por pessoas relacionadas ao cliente.
Existe muita informao estruturada, como nome, sexo, estado civil, cidade, idade, etc., mas
tambm h dados no estruturados como fotos, figuras, vdeos e mensagens de texto. Tambm
h comunidades e at mesmo as pginas "curtidas" podem ser utilizadas para traar o perfil da
pessoa.
Alm disto, as empresas esto tambm preocupadas em conhecer os amigos dos clientes,
quem so e do que gostam. Dizem que amigos possuem gostos semelhantes. Assim, se
algum comprou um produto X, muito possvel que ele divulgue isto para seus amigos e
uma boa parcela destes tambm acabe comprando o mesmo produto.
As empresas tambm querem saber quem so as pessoas que influenciam as redes sociais
(formadores de opinio). H mtricas como nmeros postagens, nmero de postagens que
foram repassadas ou curtidas, nmero de amigos, etc. As empresas querem conquistar tais
pessoas porque acreditam que elas podem influenciar outros.
Tais tecnologias tambm permitem antecipar problemas. Muitas pessoas divulgam suas
reclamaes e insatisfaes por meio de redes sociais ou blogs. A sugesto que as empresas
utilizem tcnicas de anlise de sentimentos em textos publicados na Internet.


18 Sistemas de Data Mining (Minerao de Dados ou Descoberta de
Conhecimento)
Objetivo: encontrar conhecimento implcito e til em bancos dados, geralmente usando
tcnicas estatsticas.

Data Mining (ou Minerao de Dados) a extrao no-trivial de informao implcita (nova
ou previamente desconhecida) e til a partir de bases de dados.
Normalmente, ela utilizada como sinnimo de Descoberta de Conhecimento em Bancos de
Dados (sigla KDD em ingls), mas h uma diferena.
O processo de KDD (Figura 43) recebe como entrada um banco de dados e deve retornar
como sada conhecimentos teis para a organizao ou usurio. J o Data Mining uma das
etapas deste processo, mas seu objetivo receber uma amostra de dados e gerar como sada
padres estatsticos. Para gerar amostras, necessrio realizar uma etapa de pr-
processamento ou preparao dos dados e normalm
com amostras diferentes para comparao dos resultados. Os padres estatsticos gerados pelo
Data Mining ainda no so conhecimento, e por isto devem ser interpretados para ganhar
significado. Por exemplo, descobrir
medicamento X no novidade, mas saber que h 5% que possuem esta doena e no esto
tomando o mesmo medicamento levanta hipteses importantes para descoberta de novo
conhecimento.
A seguir, sero explicadas as principais tcnicas de Data Mining.


Figura 43: Processo de Descoberta de C


Associao
Esta tcnica a mais famosa e ficou conhecida depois que uma rede de supermercados, ao
utilizar uma ferramenta de Data Mining com esta tcnica, descobriu que, nas 6as
comprava fraldas tambm comprava cerveja.
O objetivo da tcnica avaliar que valores aparecem muito juntos nas mesmas transaes ou
eventos (por exemplo, carrinhos de compras), mas tambm pode ser utilizada para identificar
relaes entre atributos dentro de uma mesma entidade (ex.: clientes do
costumam morar mais no bairro X).
Para isto, a tcnica baseada na probabilidade condicional. A
amostra exemplo de uma tabela num banco de dados. Nela podemos ver que h 2 campos, C1
e C2, e os valores que aparecem nas linhas (transaes). Pode
aparecem em comum em muitas linhas.
A probabilidade condicional resulta em implicaes do tipo X
condicionais e podem ser lidas como "se X aparecer, ento Y tem grandes chances de
aparecer tambm". A implicao tem um grau de probabilidade ou confiana (confidence),
que calculado pela razo entre o nmero de registros onde X e Y aparecem juntos, dividido
pelo nmero de registros em que X aparece (independente da presena de Y).
No exemplo da Figura 44, temos que a regra X
dizer que h 80% de chances de Y aparecer no campo C2 na mesma linha em que X estiver no
campo C1. Ou olhando para o passado, Y ap
69
processamento ou preparao dos dados e normalmente o Data Mining feito vrios vezes,
com amostras diferentes para comparao dos resultados. Os padres estatsticos gerados pelo
Data Mining ainda no so conhecimento, e por isto devem ser interpretados para ganhar
significado. Por exemplo, descobrir que 95% dos pacientes diabticos recebem o
medicamento X no novidade, mas saber que h 5% que possuem esta doena e no esto
tomando o mesmo medicamento levanta hipteses importantes para descoberta de novo
principais tcnicas de Data Mining.
: Processo de Descoberta de Conhecimento, incluindo a etapa de Data Mining
Esta tcnica a mais famosa e ficou conhecida depois que uma rede de supermercados, ao
utilizar uma ferramenta de Data Mining com esta tcnica, descobriu que, nas 6as
comprava fraldas tambm comprava cerveja.
O objetivo da tcnica avaliar que valores aparecem muito juntos nas mesmas transaes ou
s de compras), mas tambm pode ser utilizada para identificar
relaes entre atributos dentro de uma mesma entidade (ex.: clientes do sexo feminino
bairro X).
Para isto, a tcnica baseada na probabilidade condicional. A Figura 44 apresenta uma
amostra exemplo de uma tabela num banco de dados. Nela podemos ver que h 2 campos, C1
e C2, e os valores que aparecem nas linhas (transaes). Pode-se notar que os valores X e Y
aparecem em comum em muitas linhas.
A probabilidade condicional resulta em implicaes do tipo X Y, que so chamadas regras
condicionais e podem ser lidas como "se X aparecer, ento Y tem grandes chances de
implicao tem um grau de probabilidade ou confiana (confidence),
que calculado pela razo entre o nmero de registros onde X e Y aparecem juntos, dividido
pelo nmero de registros em que X aparece (independente da presena de Y).
, temos que a regra X Y possui confiana de 80%. Isto quer
dizer que h 80% de chances de Y aparecer no campo C2 na mesma linha em que X estiver no
campo C1. Ou olhando para o passado, Y aparece em 80% das linhas onde X aparece.
ente o Data Mining feito vrios vezes,
com amostras diferentes para comparao dos resultados. Os padres estatsticos gerados pelo
Data Mining ainda no so conhecimento, e por isto devem ser interpretados para ganhar
que 95% dos pacientes diabticos recebem o
medicamento X no novidade, mas saber que h 5% que possuem esta doena e no esto
tomando o mesmo medicamento levanta hipteses importantes para descoberta de novo

onhecimento, incluindo a etapa de Data Mining
Esta tcnica a mais famosa e ficou conhecida depois que uma rede de supermercados, ao
utilizar uma ferramenta de Data Mining com esta tcnica, descobriu que, nas 6as-feiras, quem
O objetivo da tcnica avaliar que valores aparecem muito juntos nas mesmas transaes ou
s de compras), mas tambm pode ser utilizada para identificar
sexo feminino
apresenta uma
amostra exemplo de uma tabela num banco de dados. Nela podemos ver que h 2 campos, C1
otar que os valores X e Y
, que so chamadas regras
condicionais e podem ser lidas como "se X aparecer, ento Y tem grandes chances de
implicao tem um grau de probabilidade ou confiana (confidence),
que calculado pela razo entre o nmero de registros onde X e Y aparecem juntos, dividido
Y possui confiana de 80%. Isto quer
dizer que h 80% de chances de Y aparecer no campo C2 na mesma linha em que X estiver no
arece em 80% das linhas onde X aparece.
Note que a relao inversa pode possuir outro grau de confiana. No exemplo, a regra Y
tem confiana de 100%, calculada pela diviso do nmero de registros onde Y e X aparecem
juntos pelo nmero de vezes em que Y aparece.
importante tambm observar o suporte da regra, ou seja, o nmero de casos. Imagine que
um supermercado descubra que
tambm compraram o Xampu de Abacate. Seria interessante fazer uma campanha de
marketing para isto ? Se o nmero de casos (suporte) for muito baixo, no vale a pena.




Figura 44: Associaes de valores entre 2 campos para Data Mining

Os algoritmos para este tipo de tcnica no so muito complicados. O que complica que
todas as combinaes devero ser avaliadas, ou seja, todos os tipos de regras. Isto quer dizer
que o campo C1 ser avaliado implicando em C2, C3, C4, etc. Depois C2 ser avaliado contra
C3, C4, etc, e assim por diante. Depois faz
Alm disto, regras complexas, com mais de um campo na parte anterior (no "se") tambm
sero avaliadas e a poderemos ter regras complexas tais como "Se cliente mulher, mora no
bairro X, tem idade entre 20 e 30 anos, solteira, tem curso superior, Ento compra o produto
X". A Figura 45 apresenta uma ideia de como ser feita a combinao de campos.
tcnica avalia um campo contra outro, 2 campos contra um 3o, 3 campos contra um 4o e
assim por diante, fazendo todas as combinaes possveis.


Figura 45: Comparao de valores entre campos para Data Mining
70
Note que a relao inversa pode possuir outro grau de confiana. No exemplo, a regra Y
tem confiana de 100%, calculada pela diviso do nmero de registros onde Y e X aparecem
juntos pelo nmero de vezes em que Y aparece.
importante tambm observar o suporte da regra, ou seja, o nmero de casos. Imagine que
100% dos clientes que compraram o sapato de nmero 48
tambm compraram o Xampu de Abacate. Seria interessante fazer uma campanha de
marketing para isto ? Se o nmero de casos (suporte) for muito baixo, no vale a pena.
: Associaes de valores entre 2 campos para Data Mining
Os algoritmos para este tipo de tcnica no so muito complicados. O que complica que
todas as combinaes devero ser avaliadas, ou seja, todos os tipos de regras. Isto quer dizer
C1 ser avaliado implicando em C2, C3, C4, etc. Depois C2 ser avaliado contra
C3, C4, etc, e assim por diante. Depois faz-se o caminho inverso.
Alm disto, regras complexas, com mais de um campo na parte anterior (no "se") tambm
eremos ter regras complexas tais como "Se cliente mulher, mora no
bairro X, tem idade entre 20 e 30 anos, solteira, tem curso superior, Ento compra o produto
apresenta uma ideia de como ser feita a combinao de campos.
tcnica avalia um campo contra outro, 2 campos contra um 3o, 3 campos contra um 4o e
assim por diante, fazendo todas as combinaes possveis.

: Comparao de valores entre campos para Data Mining
Note que a relao inversa pode possuir outro grau de confiana. No exemplo, a regra Y X
tem confiana de 100%, calculada pela diviso do nmero de registros onde Y e X aparecem
importante tambm observar o suporte da regra, ou seja, o nmero de casos. Imagine que
100% dos clientes que compraram o sapato de nmero 48
tambm compraram o Xampu de Abacate. Seria interessante fazer uma campanha de
marketing para isto ? Se o nmero de casos (suporte) for muito baixo, no vale a pena.
Os algoritmos para este tipo de tcnica no so muito complicados. O que complica que
todas as combinaes devero ser avaliadas, ou seja, todos os tipos de regras. Isto quer dizer
C1 ser avaliado implicando em C2, C3, C4, etc. Depois C2 ser avaliado contra
Alm disto, regras complexas, com mais de um campo na parte anterior (no "se") tambm
eremos ter regras complexas tais como "Se cliente mulher, mora no
bairro X, tem idade entre 20 e 30 anos, solteira, tem curso superior, Ento compra o produto
apresenta uma ideia de como ser feita a combinao de campos. Note que a
tcnica avalia um campo contra outro, 2 campos contra um 3o, 3 campos contra um 4o e
71



Correlao
A tcnica de correlao procura avaliar a similaridade entre duas variveis numricas. A
Figura 46 apresenta diversos vetores com valores numricos. Os vetores de V2 a V6 sero
comparados com o vetor base V1, tendo as seguintes caractersticas em relao ao vetor base:
V2: metade dos valores so iguais e outros bem diferentes;
V3: valores muito prximos (para mais ou a menos);
V4: valores exatamente iguais;
V5: valores bem diferentes;
V6: valores pela metade.

Pode-se notar que o vetor V4 tem um grau de correlao igual a 1 em relao ao vetor V1,
pois todos os valores so idnticos. J o vetor V3, com valores muito prximos, tem um a
correlao em mais de 99%. O vetor V2 tem correlao de 97,4% porque metade dos valores
so iguais ao vetor V1. O vetor V6 com valores pela metade tem correlao de 88,7% e por
fim o vetor V5 com valores bem diferentes tem s 14,2% de correlao com o vetor V1.


V1 V2 V3 V4 V5 V6
40 70 39 40 20 20
120 120 123 120 300 120
60 80 62 60 120 30
300 300 301 300 150 150
150 120 148 150 80 75
200 200 202 200 90 100
80 60 79 80 140 40
180 180 179 180 100 90
correlao= 0,974583 0,999773 1 0,142469 0,887595
Figura 46: Planilha de vetores e grau de correlao

Esta tcnica pode ser til para verificar se h uma relao entre variveis, por exemplo,
temperatura e vendas. Como os valores de temperatura oscilam entre 0 e 50 e as vendas
possuem valores bem diferentes, preciso fazer uma normalizao, ou seja, levando ambas as
faixas de valores para o mesmo intervalo (por exemplo, entre 0 e 1). Uma maneira de fazer
isto dividir o intervalo original por um valor base (por exemplo, temperatura dividida por
100) ou fazer a transposio proporcional de valores mnimos e valores mximos, mantendo a
proporcionalidade entre os valores.
Outras aplicaes incluem a anlise de correlao entre indicadores dentro da empresa. Eis
alguns exemplos:
nmero de horas de treinamento X nmero de falhas: note que na normalizao, ser
preciso inverter algum vetor, pois quanto mais horas, menos falhas so esperadas;
nmero de vendedores X tamanho da receita;
aumento nas vendas X aumento no salrio;
nmero de promoes X aumento de clientes.
Isto til para se saber quais aes esto realmente impactando em objetivos.


Modelos de Predio (usar modelo para prever valores)
Esta tcnica procura encontrar uma funo matemtica que relaciona ou correlacione atributos
entre si. Imagine que a Coca Cola tivesse uma funo assim, relacionando o dia do ano com a
quantidade vendida. A funo iria dizer o quanto a Coca Cola iria vende
dia futuro e assim ela poderia produzir somente o que espera vender (ver
Infelizmente a coisa no to simples assim, pois outros fator
vendas. Os servios de meteorologia utilizam modelos matemticos assim, juntando diversas
variveis para poder prever o tempo (temperatura, se vai chover ou no, o quanto vai chover,
qual ser a velocidade do vento, etc.).
A Teoria do Caos diz que temos funes para descrever tudo. O filme "Uma Mente Brilhante"
mostra a vida do matemtico John Nash, que descobria funes matemticas para tudo.
O problema no descobrir a funo, pois isto os softwares de Data Mining podem f
problema est em conseguir dados de todas as variveis envolvidas e numa quantidade
suficiente para tornar a previso significativa em termos estatsticos.


Figura 47: Tcnica de Modelo de Predi


Mdia
Na falta de uma funo, podemos utilizar valores mdios. Imagine, como na
termos histrico de vendas em 3 anos seguidos. Podemos fazer uma funo mdia com
valores mdios dos 3 anos ou mesmo utilizar intervalos, e isto ajudaria a prever o
comportamento para anos futuros.


72
Modelos de Predio (usar modelo para prever valores)
Esta tcnica procura encontrar uma funo matemtica que relaciona ou correlacione atributos
entre si. Imagine que a Coca Cola tivesse uma funo assim, relacionando o dia do ano com a
quantidade vendida. A funo iria dizer o quanto a Coca Cola iria vender num determinado
dia futuro e assim ela poderia produzir somente o que espera vender (ver Figura 47
Infelizmente a coisa no to simples assim, pois outros fatores influenciam a quantidade de
vendas. Os servios de meteorologia utilizam modelos matemticos assim, juntando diversas
variveis para poder prever o tempo (temperatura, se vai chover ou no, o quanto vai chover,
qual ser a velocidade do vento, etc.).
Teoria do Caos diz que temos funes para descrever tudo. O filme "Uma Mente Brilhante"
mostra a vida do matemtico John Nash, que descobria funes matemticas para tudo.
O problema no descobrir a funo, pois isto os softwares de Data Mining podem f
problema est em conseguir dados de todas as variveis envolvidas e numa quantidade
suficiente para tornar a previso significativa em termos estatsticos.

: Tcnica de Modelo de Predio
Na falta de uma funo, podemos utilizar valores mdios. Imagine, como na
termos histrico de vendas em 3 anos seguidos. Podemos fazer uma funo mdia com
valores mdios dos 3 anos ou mesmo utilizar intervalos, e isto ajudaria a prever o
comportamento para anos futuros.
Esta tcnica procura encontrar uma funo matemtica que relaciona ou correlacione atributos
entre si. Imagine que a Coca Cola tivesse uma funo assim, relacionando o dia do ano com a
r num determinado
47).
es influenciam a quantidade de
vendas. Os servios de meteorologia utilizam modelos matemticos assim, juntando diversas
variveis para poder prever o tempo (temperatura, se vai chover ou no, o quanto vai chover,
Teoria do Caos diz que temos funes para descrever tudo. O filme "Uma Mente Brilhante"
mostra a vida do matemtico John Nash, que descobria funes matemticas para tudo.
O problema no descobrir a funo, pois isto os softwares de Data Mining podem fazer. O
problema est em conseguir dados de todas as variveis envolvidas e numa quantidade
Na falta de uma funo, podemos utilizar valores mdios. Imagine, como na Figura 48,
termos histrico de vendas em 3 anos seguidos. Podemos fazer uma funo mdia com os
valores mdios dos 3 anos ou mesmo utilizar intervalos, e isto ajudaria a prever o
Figura 48: Tcnica da Mdia


Deteco de desvios (outliers)
Normalmente, o ser humano tem a tendncia de procurar por padres que se repetem, ou seja,
que sejam comuns ou mais frequentes. Por exemplo, quais os produtos mais vendidos, qual o
tipo de cliente mais comum, qual o comportamento tpico dos consumidores. M
vezes o incomum tambm interessante. Por exemplo, investigar por que somente uma
pessoa comprou o produto Y no ltimo ms, por que um vendedor no atingiu a meta (o
normal seria premiar o melhor vendedor e descobrir o que os melhores fizeram d
comum para que tais melhores prticas sejam repetidas).
Estas peas fora do padro so chamada
importantes que os casos normais.
material do almoxarifado de uma empresa, tem
mdia ou intervalo normal), como na
muito mais sadas que o normal. Isto deveria gerar um alerta na empresa. Isto pode estar
acontecendo por roubo ou pode estar indicando uma tendncia que a empresa no soube
prever.
A tcnica de deteco de desvios utiliza funes ou intervalos mdios
objetivo estar atento ao que se desvio dos valores mdios, os
so mais importantes que os casos normais.

Figura 49: Deteco de desvios (outliers)
73

(outliers)
Normalmente, o ser humano tem a tendncia de procurar por padres que se repetem, ou seja,
que sejam comuns ou mais frequentes. Por exemplo, quais os produtos mais vendidos, qual o
tipo de cliente mais comum, qual o comportamento tpico dos consumidores. M
vezes o incomum tambm interessante. Por exemplo, investigar por que somente uma
pessoa comprou o produto Y no ltimo ms, por que um vendedor no atingiu a meta (o
normal seria premiar o melhor vendedor e descobrir o que os melhores fizeram d
comum para que tais melhores prticas sejam repetidas).
peas fora do padro so chamadas de Outliers. Em alguns casos, eles so mais
importantes que os casos normais. Por exemplo, analisando sadas de um determinado
ado de uma empresa, tem-se uma padro de sada (uma quantidade
, como na Figura 49. Entretanto, num determinado ms, houve
que o normal. Isto deveria gerar um alerta na empresa. Isto pode estar
acontecendo por roubo ou pode estar indicando uma tendncia que a empresa no soube
A tcnica de deteco de desvios utiliza funes ou intervalos mdios (padres)
etivo estar atento ao que se desvio dos valores mdios, os outliers. Em alguns casos, eles
so mais importantes que os casos normais.
: Deteco de desvios (outliers)
Normalmente, o ser humano tem a tendncia de procurar por padres que se repetem, ou seja,
que sejam comuns ou mais frequentes. Por exemplo, quais os produtos mais vendidos, qual o
tipo de cliente mais comum, qual o comportamento tpico dos consumidores. Mas algumas
vezes o incomum tambm interessante. Por exemplo, investigar por que somente uma
pessoa comprou o produto Y no ltimo ms, por que um vendedor no atingiu a meta (o
normal seria premiar o melhor vendedor e descobrir o que os melhores fizeram de bom e em
s de Outliers. Em alguns casos, eles so mais
Por exemplo, analisando sadas de um determinado
se uma padro de sada (uma quantidade
. Entretanto, num determinado ms, houve
que o normal. Isto deveria gerar um alerta na empresa. Isto pode estar
acontecendo por roubo ou pode estar indicando uma tendncia que a empresa no soube
(padres), mas seu
Em alguns casos, eles



Esta tcnica tambm utilizada por instituies financeiras e administradoras de cartes de
crdito. Se voc tem um limite de mil reais num carto, mas nunca fez compras acima de 500
reais, quando fizer uma compra de 700 reais, a operao ser autorizada mas imediatamente
iro lhe telefonar para confirmar a operao, pois ela "fugiu" do seu padro.


Sequncia de tempo
Esta tcnica analisa sequncias de eventos. Por exemplo, a tcnica de associao pode
identificar que fraldas so compradas em conjunto com cerveja, mas na mes
Agora, se muitas pessoas compra um TV fina hoje e voltam depois de 3 meses para comprar
um home theater, isto funo da tcnica de sequncia de tempo.
A Figura 50 apresenta um exemplo. Imaginem que so pacientes com suas linhas de tempo, e
cada forma colorida indica um determinado evento importante na sade desta pessoa.
Podemos prever que h grande probabilidade de ocorre um evento do tipo "bolinha ver
na linha de tempo da paciente Ana, logo no incio do ano de 2006, j que todos os pacientes
que tiveram eventos do tipo "tringulo amarelo" no incio de um ano, tiveram "bolinha
vermelha" no incio do ano seguinte. claro que isto s um exemplo
ser levada em conta e no somente um nmero pequeno de casos.



Figura 50: Tcnica de anlise de sequ


Sries Temporais

Quando no possvel encontrar uma funo que descreve o comportamento de uma varivel
(por exemplo, valor das aes de uma empresa ao longo do tempo), pode
74
utilizada por instituies financeiras e administradoras de cartes de
crdito. Se voc tem um limite de mil reais num carto, mas nunca fez compras acima de 500
reais, quando fizer uma compra de 700 reais, a operao ser autorizada mas imediatamente
lhe telefonar para confirmar a operao, pois ela "fugiu" do seu padro.
Esta tcnica analisa sequncias de eventos. Por exemplo, a tcnica de associao pode
identificar que fraldas so compradas em conjunto com cerveja, mas na mesma transao.
Agora, se muitas pessoas compra um TV fina hoje e voltam depois de 3 meses para comprar
, isto funo da tcnica de sequncia de tempo.
apresenta um exemplo. Imaginem que so pacientes com suas linhas de tempo, e
cada forma colorida indica um determinado evento importante na sade desta pessoa.
Podemos prever que h grande probabilidade de ocorre um evento do tipo "bolinha ver
na linha de tempo da paciente Ana, logo no incio do ano de 2006, j que todos os pacientes
que tiveram eventos do tipo "tringulo amarelo" no incio de um ano, tiveram "bolinha
vermelha" no incio do ano seguinte. claro que isto s um exemplo e a probabilidade deve
ser levada em conta e no somente um nmero pequeno de casos.
: Tcnica de anlise de sequncia temporal
Quando no possvel encontrar uma funo que descreve o comportamento de uma varivel
(por exemplo, valor das aes de uma empresa ao longo do tempo), pode-se tentar prever pelo
utilizada por instituies financeiras e administradoras de cartes de
crdito. Se voc tem um limite de mil reais num carto, mas nunca fez compras acima de 500
reais, quando fizer uma compra de 700 reais, a operao ser autorizada mas imediatamente
Esta tcnica analisa sequncias de eventos. Por exemplo, a tcnica de associao pode
ma transao.
Agora, se muitas pessoas compra um TV fina hoje e voltam depois de 3 meses para comprar
apresenta um exemplo. Imaginem que so pacientes com suas linhas de tempo, e
cada forma colorida indica um determinado evento importante na sade desta pessoa.
Podemos prever que h grande probabilidade de ocorre um evento do tipo "bolinha vermelha"
na linha de tempo da paciente Ana, logo no incio do ano de 2006, j que todos os pacientes
que tiveram eventos do tipo "tringulo amarelo" no incio de um ano, tiveram "bolinha
e a probabilidade deve

Quando no possvel encontrar uma funo que descreve o comportamento de uma varivel
se tentar prever pelo
menos valores futuros num pequeno espao de tempo. No caso das aes, por ex
se querer saber se vo descer ou subir no dia seguinte.
Uma das formas de se fazer isto analisando repeties de sries ao longo do tempo. Para
isto, utilizam-se valores numricos registros em sequncia por vrios perodos de tempo (a
unidade de tempo no fixa).
A Figura 51 apresenta o comportamento de uma varivel ao longo do tempo, com seus altos e
baixos. Imagine que se deseje saber o que vai acont
Pode-se notar que um segmento deste grfico repete
se repete seja maior e com isto saberamos que a linha ir subir (como no trecho pontilhado).
claro que as sries temporais so baseadas na premissa de que os comportamentos se
repetem, pelo menos em parte (trechos ou momentos ao longo do tempo). Se isto no
acontecer, no h por que usar sries temporais. Entretanto no se sabe qual o tamanho de
cada repetio. Alm disto, h a premissa que outros fatores no iro influenciar o
comportamento. Por exemplo, no caso das aes, uma notcia ou evento relevante pode
influenciar o comportamento de compra e venda das aes, e o que era esperado (subir ou
descer) pode no acontecer devido a isto.



Figura 51: Exemplo de anlise de s



Outra possibilidade de utilizar sries temporais comparar comportamentos de entidades
diferentes. No caso anterior, usamos como exemplo a srie de uma mesma entidade e as
repeties eram procuradas dentro da mesma srie. Na
acima e 3 relacionadas abaixo. Podemos supor que so grficos referentes a totais de vendas
ou receitas na matriz (acima) e filiais (abaixo). Pode
semelhante srie da filial mais esquerda, se analisarmos subidas e descidas
em momentos prximos no tempo. No caso deste exemplo, pode significar que a matriz e esta
filial possuem prticas semelhantes. Se quisermos que as demais tenham comportamento
semelhante ao da matriz, as filiais devem utilizar prticas semelh
esquerda.
Nesta mesma figura, pode-se notar que a filial mais direita tem um grfico quase que
exatamente inverso ao da matriz. Isto pode significar comportamentos competidores: quando
um grfico est em cima, o outro est em ba
tambm pode ser feita para encontrar sries inversas ou contrrias.

75
menos valores futuros num pequeno espao de tempo. No caso das aes, por ex
se querer saber se vo descer ou subir no dia seguinte.
Uma das formas de se fazer isto analisando repeties de sries ao longo do tempo. Para
se valores numricos registros em sequncia por vrios perodos de tempo (a
apresenta o comportamento de uma varivel ao longo do tempo, com seus altos e
baixos. Imagine que se deseje saber o que vai acontecer aps a linha contnua (mais direita).
se notar que um segmento deste grfico repete-se. Ento, possvel que o segmente que
se repete seja maior e com isto saberamos que a linha ir subir (como no trecho pontilhado).
mporais so baseadas na premissa de que os comportamentos se
repetem, pelo menos em parte (trechos ou momentos ao longo do tempo). Se isto no
acontecer, no h por que usar sries temporais. Entretanto no se sabe qual o tamanho de
sto, h a premissa que outros fatores no iro influenciar o
comportamento. Por exemplo, no caso das aes, uma notcia ou evento relevante pode
influenciar o comportamento de compra e venda das aes, e o que era esperado (subir ou
cer devido a isto.
: Exemplo de anlise de sries temporais - dentro da mesma srie
Outra possibilidade de utilizar sries temporais comparar comportamentos de entidades
No caso anterior, usamos como exemplo a srie de uma mesma entidade e as
repeties eram procuradas dentro da mesma srie. Na Figura 52, temos uma srie principal
a e 3 relacionadas abaixo. Podemos supor que so grficos referentes a totais de vendas
ou receitas na matriz (acima) e filiais (abaixo). Pode-se notar que a srie da matriz
semelhante srie da filial mais esquerda, se analisarmos subidas e descidas em sequncia e
em momentos prximos no tempo. No caso deste exemplo, pode significar que a matriz e esta
filial possuem prticas semelhantes. Se quisermos que as demais tenham comportamento
semelhante ao da matriz, as filiais devem utilizar prticas semelhantes da filial mais
se notar que a filial mais direita tem um grfico quase que
exatamente inverso ao da matriz. Isto pode significar comportamentos competidores: quando
um grfico est em cima, o outro est em baixo e vice-versa. Ento, a comparao entre sries
tambm pode ser feita para encontrar sries inversas ou contrrias.
menos valores futuros num pequeno espao de tempo. No caso das aes, por exemplo, pode-
Uma das formas de se fazer isto analisando repeties de sries ao longo do tempo. Para
se valores numricos registros em sequncia por vrios perodos de tempo (a
apresenta o comportamento de uma varivel ao longo do tempo, com seus altos e
ecer aps a linha contnua (mais direita).
se. Ento, possvel que o segmente que
se repete seja maior e com isto saberamos que a linha ir subir (como no trecho pontilhado).
mporais so baseadas na premissa de que os comportamentos se
repetem, pelo menos em parte (trechos ou momentos ao longo do tempo). Se isto no
acontecer, no h por que usar sries temporais. Entretanto no se sabe qual o tamanho de
sto, h a premissa que outros fatores no iro influenciar o
comportamento. Por exemplo, no caso das aes, uma notcia ou evento relevante pode
influenciar o comportamento de compra e venda das aes, e o que era esperado (subir ou


Outra possibilidade de utilizar sries temporais comparar comportamentos de entidades
No caso anterior, usamos como exemplo a srie de uma mesma entidade e as
, temos uma srie principal
a e 3 relacionadas abaixo. Podemos supor que so grficos referentes a totais de vendas
se notar que a srie da matriz
em sequncia e
em momentos prximos no tempo. No caso deste exemplo, pode significar que a matriz e esta
filial possuem prticas semelhantes. Se quisermos que as demais tenham comportamento
antes da filial mais
se notar que a filial mais direita tem um grfico quase que
exatamente inverso ao da matriz. Isto pode significar comportamentos competidores: quando
versa. Ento, a comparao entre sries
Figura 52: Exemplo de anlise de s


A comparao de sries se d no por proximidade de valores no tempo mas por semelhana
no grfico (subidas e descidas). Isto quer dizer que duas sries so semelhantes no
importando o momento no tempo. Na
semelhantes e iniciam ao mesmo tempo. Por outro lado, a srie C tambm semelhante
srie A, mas se inicia um pouco depois. Isto pode ser til para avaliar retorno de
de marketing. Por exemplo, ao se colocar propaganda na TV, talvez as vendas no cresam
logo no dia seguinte. E se tirarmos a campanha do ar, talvez as vendas ainda sigam aquecidas
por um certo tempo.
Figura 53: Sries temporais com diferena no momento de incio da srie


76

: Exemplo de anlise de sries temporais - comparao entre sries
A comparao de sries se d no por proximidade de valores no tempo mas por semelhana
no grfico (subidas e descidas). Isto quer dizer que duas sries so semelhantes no
importando o momento no tempo. Na Figura 53, podemos ver que as sries A e B so
semelhantes e iniciam ao mesmo tempo. Por outro lado, a srie C tambm semelhante
srie A, mas se inicia um pouco depois. Isto pode ser til para avaliar retorno de
de marketing. Por exemplo, ao se colocar propaganda na TV, talvez as vendas no cresam
logo no dia seguinte. E se tirarmos a campanha do ar, talvez as vendas ainda sigam aquecidas

ies temporais com diferena no momento de incio da srie
comparao entre sries
A comparao de sries se d no por proximidade de valores no tempo mas por semelhana
no grfico (subidas e descidas). Isto quer dizer que duas sries so semelhantes no
, podemos ver que as sries A e B so
semelhantes e iniciam ao mesmo tempo. Por outro lado, a srie C tambm semelhante
srie A, mas se inicia um pouco depois. Isto pode ser til para avaliar retorno de campanhas
de marketing. Por exemplo, ao se colocar propaganda na TV, talvez as vendas no cresam
logo no dia seguinte. E se tirarmos a campanha do ar, talvez as vendas ainda sigam aquecidas
77

Classificao (categorizao)
A tcnica de classificao tem por objetivo encontrar a classe de um elemento. Note que por
"classe", pode-se at mesmo entender uma ao (por exemplo, aprovar ou rejeitar um pedido
de emprstimo). Para que a tcnica funcione, as classes devero j existir previamente.
O processo de avaliar a qual classe pertence um elemento novo pode fazer uso de regras
determinsticas, probabilsticas, heursticas, rvores de deciso, tabelas de deciso ou RBC
(baseado em exemplos), conforme discutido no captulo sobre Sistemas Especialistas.

Induo
O objetivo desta tcnica a identificao de um modelo para classificao, ou seja, a
descoberta das regras de classificao. Isto feito atravs do chamado "aprendizado
supervisionado", onde exemplos de treino so avaliados para identificar padres.

Os algoritmos clssicos para induo incluem ID3 e C4.5.
Tambm possvel identificar, ao invs de regras, apenas as caractersticas de cada classe.
Para isto, pode-se calcular o "centride" da classe, que um elemento hipottico que
representa a classe, tendo a mdia das caractersticas dos elementos da classe ou um elemento
hipottico que tenha todas as caractersticas de todos os elementos da classe.


Clusterizao ou Agrupamento (clustering)
A tcnica de Clustering recebe um grupo de elementos e da identifica as classes. Ou seja,
diferentemente da tcnica de classificao, as classes no existem ainda ou no so
conhecidas.
O princpio bsico da tcnica colocar no mesmo grupo os elementos mais similares e em
grupos diferentes os elementos pouco similares. Este agrupamento feito por algoritmos
automticos como o k-Means e algoritmos baseados em grafos como Stars, Single-link,
Strings e Cliques.
Mas para entender o processo, observe a Figura 54. Este grfico posiciona clientes num plano
que relaciona a idade da pessoa e o nmero de horas que passa na Internet por ms. Os
smbolos no meio do grfico representam o tipo de produto adquirido pelo cliente (quadrado,
crculo ou tringulo) e a forma de pagamento (vermelho = carto; azul = boleto; amarelo =
depsito bancrio).
Visualmente pode-se verificar que clientes de mais idade e que passam menos horas na
Internet (quadrante mais esquerda e em cima), dominado por clientes que pagam por
boleto bancrio (cor azul). Clientes que compram por depsito bancrio (cor amarela), s
compram produtos do tipo crculo. Os clientes de menos idade tendem a passar mais horas na
Internet e pagar com carto (cor vermelha).


Figura 54: Exemplo de clustering


19 Sistemas de Text Mining
Objetivo: encontrar padres implcitos em textos, geralmente usando tcnicas estatsticas

Segundo Tan (1999), 80% das informaes de uma companhia esto c
textuais. Isto gera demora para recuperar informaes (achar documento e depois encontrar a
informao dentro do documento). Tanto que tal fenmeno conhecido como "
informaes' (information overload
no conseguimos encontrar o que queremos (estamos perdidos em meio a tanto informao).
Alm disto, o volume muito grande de informaes textuais impossibilita o tratamento
exemplo, leitura) das informaes de forma manual
complexidade das informaes neste formato, o que exige trabalho intelectual para
interpretao dos textos.

Os tipos de textos que as empresas normalmente armaz
E-mails;
Textos livres resultantes de pesquisas
Arquivos eletrnicos (txt, doc, pdf)
Pginas Web;
Campos textuais (memos) em Bancos de Dados
Documentos eletrnicos, digitalizados a partir de papis

H empresas que recebem milhes de e
"no fale conosco pelo fale conosco", porque as empresas simplesmente no conseguem
responder a estes e-mails.
Outro problema que se perde a noo estatstica do co
empresa grande que tinha uma pessoa s para ler e
e repassava para os diretores. Mas os diretores no querem ler e
78

: Exemplo de clustering
Sistemas de Text Mining
Objetivo: encontrar padres implcitos em textos, geralmente usando tcnicas estatsticas
80% das informaes de uma companhia esto contidas em documentos
textuais. Isto gera demora para recuperar informaes (achar documento e depois encontrar a
informao dentro do documento). Tanto que tal fenmeno conhecido como "
information overload) e ocorre justamente porque temos tantas informaes que
no conseguimos encontrar o que queremos (estamos perdidos em meio a tanto informao).
Alm disto, o volume muito grande de informaes textuais impossibilita o tratamento
informaes de forma manual. Isto no s pela quantidade, mas pela
complexidade das informaes neste formato, o que exige trabalho intelectual para
que as empresas normalmente armazenam so:
Textos livres resultantes de pesquisas;
Arquivos eletrnicos (txt, doc, pdf);
Campos textuais (memos) em Bancos de Dados (ex.: descrio de um problema);
Documentos eletrnicos, digitalizados a partir de papis.
H empresas que recebem milhes de e-mails de contato. Tanto que j h um artigo dizendo
"no fale conosco pelo fale conosco", porque as empresas simplesmente no conseguem
Outro problema que se perde a noo estatstica do contedo destes textos. Havia uma
empresa grande que tinha uma pessoa s para ler e-mails. E o que ela fazia ? Separava alguns
e repassava para os diretores. Mas os diretores no querem ler e-mails, eles querem saber do
Objetivo: encontrar padres implcitos em textos, geralmente usando tcnicas estatsticas
ontidas em documentos
textuais. Isto gera demora para recuperar informaes (achar documento e depois encontrar a
informao dentro do documento). Tanto que tal fenmeno conhecido como "sobrecarga de
) e ocorre justamente porque temos tantas informaes que
no conseguimos encontrar o que queremos (estamos perdidos em meio a tanto informao).
Alm disto, o volume muito grande de informaes textuais impossibilita o tratamento (por
. Isto no s pela quantidade, mas pela
complexidade das informaes neste formato, o que exige trabalho intelectual para
(ex.: descrio de um problema);
mails de contato. Tanto que j h um artigo dizendo
"no fale conosco pelo fale conosco", porque as empresas simplesmente no conseguem
ntedo destes textos. Havia uma
mails. E o que ela fazia ? Separava alguns
mails, eles querem saber do
79

que tratam os e-mails e querem isto com anlise estatstica (por exemplo, quantos clientes
esto reclamando de um produto, quantos falam do atendimento, do preo, etc.).

Text Mining ou Minerao de Textos ou Descoberta de Conhecimento em Textos (KDT
Knowledge Discovery in Texts) uma evoluo das reas de Recuperao de Informaes
(Information Retrieval) e Extrao de Informaes (Information Extraction).

A recuperao de informaes tem por objetivo encontrar documentos onde a informao
desejada pode estar. So os sistemas textuais j discutidos anteriormente e bem representados
pelo mecanismo de busca do Google. J a extrao procura encontrar em textos a informao
desejada. Normalmente, isto feito atravs de tcnicas que permite encontrar valores para
atributos e assim formar um banco de dados estruturados.
Por exemplo, a partir do texto abaixo,
"Jos da Silva funcionrio da Empresa XYZ, mora na Rua X, nmero 31, tem 35 anos de
idade, e ...'
Podemos extrair as seguintes informaes:
Nome: Jos da Silva
Empresa: XYZ
Endereo: Rua X, 31
Idade: 35 anos

O problema da extrao que exige muito esforo para entender como a informao
codificada em textos (esforo de Engenharia do Conhecimento) e acaba por gerar solues
muito especficas. Por exemplo, para encontrar o preo de um produto num site de comrcio
eletrnico, o algoritmo gerado s servir para este site e, se este mudar, o algoritmo dever ser
alterado tambm.
Se for possvel utilizar tcnicas de extrao, o processo de Text Mining pode ser feito de uma
forma muito simples:
1. Primeiro, uma etapa de recuperao encontra os textos que podem conter a informao
desejada;
2. Segundo, tcnicas de extrao so utilizadas para identificar valores de atributos
nestes textos resultantes do passo anterior e assim criar um banco de dados;
3. Terceiro, tcnicas de Data Mining tradicional so aplicadas sobre o banco de dados.


Entretanto, em muitos casos isto no possvel ou no vivel. Ento, outra alternativa
aplicar tcnicas estatsticas diretamente sobre os textos.
No caso de Data Mining, que aplicado sobre dados estruturados, as tcnicas estatsticas so
aplicadas sobre campos e valores de tabelas ou planilhas. Entretanto, no caso de textos, no
temos campos, valores ou mesmo tabelas. E precisamos aplicar as tcnicas sobre o contedo
dos textos. Pois bem, o contedo dos textos formados por palavras (unidade de informao).
Ento, Text Mininig iniciou-se desta forma, aplicando tcnicas estatsticas sobre palavras de
textos, como ser discutido a seguir.



80

Preparao de textos
Uma vez que as palavras formam a unidade bsica de informao dos textos e sobre elas ser
feito o text mining, necessrio algum tratamento prvio antes de aplicar estatstica.
Por exemplo, corretores ortogrficos ajudam a eliminar variaes incorretas de palavras. Se
formos aplicar tcnicas estatsticas sobre palavras, no queremos ter como resultado coisas
assim: 60% dos textos tinham a palavra "reduo" e 30% dos textos tinham a palavra
"redusso" (com erro ortogrfico mesmo). O certo seria apontar que 90% dos textos tinham a
palavra "reduo", aps a correo ortogrfica.

A tcnica de stemming reduz palavras ao seu radical. Por exemplo: "cas" o radical de
"casamento, casar, casou, casado, casados, casada, casal, casar, etc.". Isto permite recuperar
as variaes lingusticas (gnero, nmero, conjugaes verbais, grau, etc) que tratam do
mesmo assunto.
Isto no impede problemas semnticos relativos a sinnimos (homicdio = assassinato) e
polisemia ("casa" do verbo casar, "casa" = moradia, "casa" do boto da roupa).

Tambm so utilizadas listas de stopwords, que so palavras muito comuns e sem significado
definido, tais como artigos, preposies e alguns pronomes. A eliminao das stopwords
reduz o processamento dos textos e elimina padres estatsticos sem significado (ex.: 99% dos
textos possuem a palavra "de").

A seguir, so descritas algumas tcnicas de text mining aplicadas a palavras de textos.

Classificao
Como em Data Mining, classificar consiste em encontrar a classe de um elemento. No caso de
text mining, o elemento um texto e as classes podem ser assuntos, empresas, etc.
Vejamos um exemplo: filtro anti-spam.
Muitos softwares de gerenciamento de e-mails possuem filtros anti-spam, ou seja, identificam
e separam e-mails considerados spam.
Pode-se utilizar regras sobre a origem, por exemplo, identificando certas palavras em nomes
de remetentes ou no domnio do endereo de e-mail. Outra tcnica comum procurar pela
presena de palavras no ttulo ou no contedo do e-mail (por exemplo, "viagra"). Entretanto,
alguns espertos j esto utilizando palavras com sinais trocados (ex: V.I.A.G.R.A., V1AGRA)
ou imagens com texto dentro, para que as tcnicas de anlise de texto no identifiquem o
spam. Outro problema com esta tcnica que o setor de desenvolvimento de software no
consegui trocar e-mails discutindo a estrutura do banco de dados porque toda vez que algum
usava o nome do campo "sexo", o e-mail era bloqueado.
Para e-mails novos, possvel utilizar tcnicas tipo RBC, por avaliao de similaridade. O
algoritmo k-NN (vizinhos mais prximos) pode comparar um novo e-mail com uma lista de e-
mails j cadastrados como spam. Por isto, importante a funo "reportar spam" na maioria
dos sistemas de webmail, pois a lista vai engrossando pela chamada "sabedoria das massas".

Outro exemplo de classificao de textos a identificao do tipo de crime em boletins de
ocorrncias policiais.
Aqui notam-se alguns desafios. Por exemplo, para saber se o crime "homicdio" basta que
esta palavra esteja presente no texto do boletim ? No, porque pode haver expresses como
"tentativa de homicdio", "homicdio tentado" e "tentou homicdio", as quais possuem a
81

palavra mas indicam outro tipo de crime. Da mesma forma, pode haver textos sem a tal
palavra, mas que se referem a homicdio, porque usam sinnimos ou variaes lingusticas.
Ento necessrio procurar nos textos se houve alguma morte. E tal conceito pode aparecer
atravs de expresses como "morreu", "matou", "veio a falecer", etc.
Alm disto, preciso tambm saber quem morreu, para distinguir homicdio de latrocnio. E
atentar para casos como este: "Fulano atirou em Ciclano, errou o tiro e matou um cavalo".
Houve uma morte, mas no era de uma pessoa.


Anlise de distribuio
Esta tcnica procura verificar a presena de cada palavra (todas ou algumas selecionadas) em
colees de textos. Por exemplo, uma anlise de discursos de um poltico concluiu que a
palavra "no" aparecia muito mais nos discursos de final de mandato que no incio. Tambm
podemos usar esta tcnica para verificar os nomes de pessoas que mais aparecem em textos
sobre corrupo, etc.

Anlise de Diferenas
Esta tcnica procura palavras que aparecem em um texto e no em outros. Por exemplo,
interessante para comparar planos de governo (marketing poltico), apresentando temas
comuns e diferenas em prioridades (enfoque).
Tambm pode ser til para Inteligncia Competitiva (tipo de sistema a ser apresentado mais
adiante), comparando estratgias de diferentes empresas competidoras. Podemos comparar os
sites das empresas, textos de folders, manuais e descries textuais de produtos e servios.
Podemos considerar textos isolados ou conjuntos de textos (por exemplo, concatenar todas as
pginas web de uma empresa, todas as postagens de uma pessoa no twitter, etc.).
O importante analisar diferenas nas distribuies (palavras que aparecem mais em um texto
do que outro) mas tambm as palavras exclusivas, ou seja, aquelas que aparecem somente em
um texto.

Associaes
A tcnica de associao procura por padres tipo "se a palavra X aparecer num texto,
provvel que a palavra Y tambm aparea".
Isto pode ser usado para avaliar que nomes de entidades aparecem junto a certos temas, ou
ento, que palavras aparecem associadas a certas entidades (por exemplo, tipos de
reclamaes contra uma empresa).

Anlise de Similaridade
A anlise de similaridade procura por textos parecidos (que usam muitas palavras em
comum). Pode ser usada para identificar plgio em textos acadmicos.


Resumos - Sumarizao

82

O resumos "guiados pelo usurio" so criados de forma semi-automtica. A ideia o usurio
definir palavras ou temas de seu interesse e uma ferramenta de software extrai da coleo de
textos (ou de um texto nico), as frases onde estas palavras ocorrem.

J a criao de resumos automticos um pouco mais complicada. Aqui a ideia extrair
trechos de textos de forma automtica, para que os leitores possam ter noo do assunto
tratado nos textos sem precisar ler tudo.
Uma tcnica simples para isto verificar quais so as palavras mais frequentes nos textos e
extrair as frases que contm estas palavras. Uma variao seria extrair frases com as palavras
mais importantes do texto. Para isto, seria necessrio dar pesos de importncia para as
palavras, usando critrios como frequncia na coleo, presena no ttulo, frequncia em
textos em geral sobre o assunto.
Os resumos gerados automaticamente geralmente dizem muito sobre o tema central do texto
ou da coleo, dando menos importncia para temas perifricos. A tcnica conhecida como
Maximal Marginal Relevance (MMR) procura balancear os temas, mostrando o tema central
mas tambm os temas perifricos. O princpio bsico no repetir informaes, evitando
assim focar num tpico.
Outro desafio para a sumarizao de textos criar resumos a partir de vrios textos
(multitextos). O problema manter a ordem das frases extradas e a coerncia entre elas. Isto
tambm requer tambm a resoluo de anforas (ex: Aquele fez ...)



Anlise de palavras X contextos/conceitos

A anlise de palavras isoladas traz problemas de interpretao, conhecidos como o "problema
do vocabulrio" (vocabulary problem).
O mesmo assunto ou evento pode ser abordado ou relatado com diferentes palavras
(sinnimos, variaes lingusticas, etc). Alm disto, h palavras polissmicas (com mais de
um significado). Por exemplo, se fizermos uma busca na Web pelo termo "madonna", teremos
nos resultados pginas sobre a cantora Madonna, sobre Nossa Senhora e tambm sobre uma
universidade com este nome.
Uma das solues utilizar um vocabulrio controlado, como fazem os mdicos atravs do
CID (Classificao Internacional de Doenas), para evitar mal entendidos. Mas quando se
trata de web e textos populares, no h como garantir uniformidade.
Da mesma forma, poderemos ter problemas analisando reclamaes de clientes se
encontramos a expresso "gostei" e no analisarmos as palavras ao seu redor. Pode ser que
exista um "no" antes e isto muda completamente o significado.
Um exemplo de distoro encontrar os seguintes padres numa coleo de textos policiais:
"20% dos textos com a palavra 'assassinato' tambm possuem a palavra 'revlver'"
"30% dos textos com a palavra 'homicdio' tambm possuem a palavra 'revlver'".
Se quisermos considerar os casos de homicdio no podemos simplesmente somar os
percentuais. Temos que fazer uma anlise mais profunda, identificando sinnimos e outros
problemas de vocabulrio.
Portanto, as tcnicas de text mining devem ser aplicadas sobre conceitos ou contextos e no
sobre palavras isoladas.

83

Y
-
A
x
i
s
Conceitos
Definio
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
Categorizao Minerao
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
Textos
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
Figura 55: Estratgia de text mining sobre conceitos e no sobre palavras isoladas


A
Y
-
A
x
i
s
Conceitos
Definio
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
Categorizao Minerao
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
lfsiaefja
alifjaslefj
asfiljasf
asfliasjfasef
ijlsfe
Textos
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
conceito X
conceito Y
conceito Z
conceito W
Figura 55 apresenta uma estratgia para resolver tal problema. A ideia identificar conceitos
(contextos ou temas ou assuntos) nos textos e aplicar as tcnicas estatsticas sobre os
conceitos. Para identificar os conceitos, deve-se usar uma base ou ontologia de conceitos, na
qual esto definidas as diferentes formas de um conceito aparecer num texto (sinnimos,
expresses, etc).

Por exemplo, a presena de sintomas de alcoolismo em pronturios mdicos pode ser
verificado pela presena de uma das seguintes expresses: lcool, hlito etlico, faz uso de
bebidas, bebe imoderadamente.
Ento o conceito "alcoolismo" ser definido de forma a serem analisadas estas expresses. Se
uma delas aparecer, o texto estar tratando deste conceito.

Exemplos de Aplicaes

A seguir, a estratgia de text mining sobre conceitos explicada atravs de exemplos.

Instituio de Ensino

Uma instituio de ensino fez uma pesquisa com seus alunos procurando saber qual o motivo
da escolha do aluno pela instituio. As respostas eram dadas livremente (texto livre, sem
restries), sem nenhum tipo de influncia como em perguntas com opes de
Aps a identificao dos motivos principais, fez
aparecem na Figura 56. Como cada aluno poderia indicar mais de um m
a soma maior que 100%.
Pode-se notar que todos os alunos do curso A citaram a questo da proximidade. J nos cursos
B e C, este foi o motivo mais citado mas no por todos os alunos destes cursos. No caso do
curso D, o motivo mais citado foi que ele era noturno. Vejam que nem mesmo a direo desta
instituio tinha se dado conta que ela era a nica na regio a oferecer tal curso no turno da
noite.



Figura 56: Text Mining sobre pesquisa com alunos de uma


TV por Assinatura

Uma empresa de TV por assinatura faz pesquisas regulares com seus clientes para avaliao
de seus servios. No final da pesquisa, o cliente convidado a dar sugestes ou externar suas
crticas e isto anotado como texto livre.
Aps a aplicao de ferramentas de text mining, a empresa descobriu que o tema mais citado
era relativo a filmes (50,7% das reclamaes), conforme mostra a


84
Uma instituio de ensino fez uma pesquisa com seus alunos procurando saber qual o motivo
da escolha do aluno pela instituio. As respostas eram dadas livremente (texto livre, sem
restries), sem nenhum tipo de influncia como em perguntas com opes de escolha.
Aps a identificao dos motivos principais, fez-se a anlise estatstica e os resultados
. Como cada aluno poderia indicar mais de um motivo na sua resposta,
se notar que todos os alunos do curso A citaram a questo da proximidade. J nos cursos
B e C, este foi o motivo mais citado mas no por todos os alunos destes cursos. No caso do
citado foi que ele era noturno. Vejam que nem mesmo a direo desta
instituio tinha se dado conta que ela era a nica na regio a oferecer tal curso no turno da
t Mining sobre pesquisa com alunos de uma instituio de ensino
Uma empresa de TV por assinatura faz pesquisas regulares com seus clientes para avaliao
de seus servios. No final da pesquisa, o cliente convidado a dar sugestes ou externar suas
omo texto livre.
Aps a aplicao de ferramentas de text mining, a empresa descobriu que o tema mais citado
reclamaes), conforme mostra a Figura 57.
Uma instituio de ensino fez uma pesquisa com seus alunos procurando saber qual o motivo
da escolha do aluno pela instituio. As respostas eram dadas livremente (texto livre, sem
escolha.
se a anlise estatstica e os resultados
otivo na sua resposta,
se notar que todos os alunos do curso A citaram a questo da proximidade. J nos cursos
B e C, este foi o motivo mais citado mas no por todos os alunos destes cursos. No caso do
citado foi que ele era noturno. Vejam que nem mesmo a direo desta
instituio tinha se dado conta que ela era a nica na regio a oferecer tal curso no turno da

instituio de ensino
Uma empresa de TV por assinatura faz pesquisas regulares com seus clientes para avaliao
de seus servios. No final da pesquisa, o cliente convidado a dar sugestes ou externar suas
Aps a aplicao de ferramentas de text mining, a empresa descobriu que o tema mais citado
Figura 57: Temais mais citados

Aps a aplicao da tcnica de associao entre conceitos, pode
estavam mais associados entre si. No caso do tema "filmes", pode
citado junto foi o de "repetio" (39,5%), indicando que os clientes reclamavam da repetio
dos filmes (Figura 58).
A tcnica de associao permite descobrir detalhes de um assunto; neste caso, quais eram as
reclamaes relativas a filmes.


Figura 58: Associaes entre temas

Um tipo especial de anlise feita foi separar as reclamaes pelo pacote do cliente. Na
59, apresentamos a comparao de temas mais
com o pacote mais barato (B). Note
so os que pagam menos. E estes so os nicos (nesta comparao) que reclamam da central
de atendimento (conceito "atendimento" s aparece nas reclamaes dos clientes do pacote
B).


85
Temais mais citados - text mining sobre reclamaes de clientes
Aps a aplicao da tcnica de associao entre conceitos, pode-se verificar que
estavam mais associados entre si. No caso do tema "filmes", pode-se notar que o tema mais
citado junto foi o de "repetio" (39,5%), indicando que os clientes reclamavam da repetio
A tcnica de associao permite descobrir detalhes de um assunto; neste caso, quais eram as
Associaes entre temas - text mining sobre reclamaes de clientes
Um tipo especial de anlise feita foi separar as reclamaes pelo pacote do cliente. Na
, apresentamos a comparao de temas mais citados entre clientes do pacote mais caro (A)
com o pacote mais barato (B). Note-se que os clientes que mais reclamam do custo do servio
so os que pagam menos. E estes so os nicos (nesta comparao) que reclamam da central
endimento" s aparece nas reclamaes dos clientes do pacote


se verificar que temas
se notar que o tema mais
citado junto foi o de "repetio" (39,5%), indicando que os clientes reclamavam da repetio
A tcnica de associao permite descobrir detalhes de um assunto; neste caso, quais eram as

reclamaes de clientes
Um tipo especial de anlise feita foi separar as reclamaes pelo pacote do cliente. Na Figura
citados entre clientes do pacote mais caro (A)
se que os clientes que mais reclamam do custo do servio
so os que pagam menos. E estes so os nicos (nesta comparao) que reclamam da central
endimento" s aparece nas reclamaes dos clientes do pacote

Figura 59: Comparao de temais mais citados por perfil de cliente


Figura 60: Comparao de temais mais citados por canal preferido

Outro tipo de anlise feita foi separar as reclamaes por canal preferido. Na pesquisa, o
cliente indicava qual seu canal preferido. As respostas ento foram classificadas por tipo de
canal (filmes, esportes, notcias, documentrios, infantil,
os clientes que mais reclamam de filmes no so os que preferem canais de filmes. Tambm
possvel observar que somente cliente
clientes que preferem notcias so os nicos que no citam a concorrncia em suas
reclamaes.


Concessionria de Rodovia

Outra aplicao de text mining foi a a
de rodovias.
Como nos textos das ocorrncias havia a indicao do quilmetro onde ocorreu o evento
relatado, pde-se separar os registros por trechos. O interessante que o trecho mais citado
era justamente o trecho em que a ouvidoria
problemtico. Este exemplo confirma que a anlise estatstica muito mais confivel que a
anlise intuitiva que os seres humanos esto acostumados a fazer.
Neste processo de text mining, tambm foi possvel
indenizao e ressarcimento que a empresa sofre, e assim identificar as principais causas.

Anlise de Currculos

86
Comparao de temais mais citados por perfil de cliente
Comparao de temais mais citados por canal preferido do cliente
Outro tipo de anlise feita foi separar as reclamaes por canal preferido. Na pesquisa, o
cliente indicava qual seu canal preferido. As respostas ento foram classificadas por tipo de
canal (filmes, esportes, notcias, documentrios, infantil, etc.). Na Figura 60, pode
os clientes que mais reclamam de filmes no so os que preferem canais de filmes. Tambm
possvel observar que somente clientes que preferem esportes falam sobre pontos extra. E os
clientes que preferem notcias so os nicos que no citam a concorrncia em suas
Concessionria de Rodovia
Outra aplicao de text mining foi a anlise de registros de ocorrncias de uma concessionria
Como nos textos das ocorrncias havia a indicao do quilmetro onde ocorreu o evento
se separar os registros por trechos. O interessante que o trecho mais citado
era justamente o trecho em que a ouvidoria da empresa acreditava ser o trecho menos
problemtico. Este exemplo confirma que a anlise estatstica muito mais confivel que a
anlise intuitiva que os seres humanos esto acostumados a fazer.
Neste processo de text mining, tambm foi possvel analisar separadamente os p
que a empresa sofre, e assim identificar as principais causas.


do cliente
Outro tipo de anlise feita foi separar as reclamaes por canal preferido. Na pesquisa, o
cliente indicava qual seu canal preferido. As respostas ento foram classificadas por tipo de
, pode-se ver que
os clientes que mais reclamam de filmes no so os que preferem canais de filmes. Tambm
s que preferem esportes falam sobre pontos extra. E os
clientes que preferem notcias so os nicos que no citam a concorrncia em suas
uma concessionria
Como nos textos das ocorrncias havia a indicao do quilmetro onde ocorreu o evento
se separar os registros por trechos. O interessante que o trecho mais citado
da empresa acreditava ser o trecho menos
problemtico. Este exemplo confirma que a anlise estatstica muito mais confivel que a
analisar separadamente os pedidos de
que a empresa sofre, e assim identificar as principais causas.
87

Muitas empresas oferecem vagas e recebem dezenas ou mesmo centenas de currculos de
interessados. Normalmente, estes currculos so documentos textuais e a empresa no tem
condies de ler todos os currculos de forma completa. Ento a anlise feita de forma
superficial, podendo deixar de lado bons currculos.
Ferramentas de text mining podem ser aplicadas neste tipo de problema para ajudar a separar
currculos com certas caractersticas. A Figura 61 apresenta o exemplo de uma ferramenta
(Text Mining Suite, da Intext Mining, www.intext.com.br) que permite que o usurio fornea
como entrada temas desejados (seta "perfil") inclusive com sua importncia relativa dada por
pesos numricos. A ferramenta ento procura na base de currculos aqueles que possuem tais
temas, avalia o quanto cada tema citado no currculo (peso na participao no texto) e monta
como resultado um ranking dos currculos, indicando o peso com que o currculo atende ao
perfil (seta "ranking").



Figura 61: Text mining sobre currculos de profissionais




Outras tcnicas e abordagens
A seguir, sero apresentadas rapidamente vrias abordagens ou tcnicas para descoberta de
conhecimento em textos (estas abordagens so discutidas com mais detalhes em LOH (1999).
Os nomes utilizados servem apenas para diferenciar as abordagens, portanto nem sempre
correspondem aos termos utilizados na literatura, nem seguem uma classificao previamente
estabelecida pela comunidade cientfica.
ranking
perfil
88

A abordagem de descoberta por Extrao de Passagens designa um tipo de descoberta situado
entre a recuperao de informaes por passagens e a extrao de informaes. Esta nova
abordagem visa encontrar informaes especficas, mas de forma um pouco mais
independente de domnio do que as ferramentas tradicionais de extrao. Esta abordagem
difere da Extrao de Informaes pois permite ao usurio levantar hipteses e formas de
procura de informaes em tempo de execuo, no sendo necessrio um grande esforo de
engenharia do conhecimento (para definir as formas de procura, por exemplo os "tags"), nem
um profundo conhecimento prvio do texto e de sua estrutura. A descoberta por extrao de
passagens auxilia usurios a encontrar detalhes de informao, sem que este precise ler todo
texto. Entretanto, ainda assim, necessrio que o usurio leia e interprete as partes do texto
que forem recuperadas para extrair a informao desejada.
A abordagem por Anlise Lingustica procura descobrir informaes e regras analisando
sentenas da linguagem a nvel lxico, morfolgico, sinttico e semntico. Ambroio et al.
(1997), por exemplo, descobrem generalizaes escondidas, analisando padres sintticos
(tags). Lascarides et al. (1992) e Hobbs (1979) relatam pesquisas sobre inferncias de relaes
de coerncia em textos (por exemplo, causa e efeito), tambm utilizando tags. J Lascarides et
al. (1992), Hwang et al. (1992), Kameyama et al. (1993) e Webber (1988) inferem relaes de
tempo analisando textos. Bowden et al. (1996) descobrem relaes conceituais (definies,
exemplos, parties e composio) atravs de tags no texto.
A descoberta por Anlise de Contedo semelhante aos dois tipos anteriores, pois investiga
linguisticamente os textos e apresenta ao usurio informaes sobre o seu contedo.
Entretanto, a diferena para a descoberta por anlise lingstica que, na anlise de contedo,
h maior esforo no tratamento semntico dos textos, passando em muito o limite lxico-
sinttico. Em relao extrao de passagens, a diferena que, aqui, o objetivo encontrar o
significado do texto pretendido pelo autor ao invs de partes ou informaes especficas. Por
exemplo, Saggion e Carvalho (1995) utilizam tcnicas que analisam a estrutura de resumos ou
sumrios, identificando informaes por palavras-chave, tais como hipteses, concluses,
experimentos, etc. Em Wieve (1994), h estudos sobre descoberta de crenas e intenes em
dilogos, por inferncias sobre palavras-chave ("tags").
J a descoberta por Associao entre Passagens busca encontrar automaticamente
conhecimento e informaes relacionadas no mesmo texto ou em textos diferentes. Esta
abordagem combina a recuperao de informaes por passagens com a recuperao
contextual. Sua aplicao imediata est na definio automtica de links nos sistemas de
hipertexto. Entretanto, a vantagem deste tipo de descoberta apresentar ao usurio partes de
textos que tratam do mesmo assunto especfico (detalhe de informao e no contedo geral).
Swanson e Smalheiser (1997) demonstram o sucesso desta tcnica. Eles conseguiram
encontrar uma possvel relao entre 2 textos de assuntos distintos. O texto 1 falava que ...o
leo de peixe bom para a circulao.... O texto 2 dizia que ... a sndrome de Raynaud est
associada com a vaso-constrio .... A partir da leitura destes 2 textos, eles chegaram
uiptese de que o leo de peixe poderia ajudar no tratamento da sndrome de Raynaud.
Ento partiram para experimentos prticos e os resultados comprovaram a hiptese.
A descoberta por Listas de Conceitos-Chave utiliza tcnicas semelhantes gerao de
centrides de classes. A idia apresentar uma lista com os conceitos principais de um nico
89

texto (geralmente, os conceitos so termos ou expresses extrados por anlises estatsticas).
Moscarola (1998), por exemplo, sugere uma lista de termos prximos (antes e depois), os
quais permitem a anlise do contedo por quase-frases. Outros exemplos so a tcnica de
afinidades lxicas de Maarek (1992) e a tcnica dos relacionamentos semnticos apresentada
em Sparck-Jones (1997).
A descoberta de Estruturas de Textos segue a premissa de Morris e Hirst (1991), segundo a
qual, determinar a estrutura de um texto ajuda a entender seu significado. Um texto no um
conjunto aleatrio de frases, mas deve haver uma unidade e tambm coeso, com as frases
funcionando juntas para a funo do todo. A coeso se consegue com referncias, conjunes
e relaes semnticas.
A abordagem de Descoberta Tradicional aps Extrao a mais simples, pois utiliza tcnicas
j testadas e consagradas. Nesta abordagem, os dados so extrados dos textos e formatados
em bases de dados estruturadas, com o auxlio de tcnicas de Extrao de Informaes (EI).
Depois, so aplicadas tcnicas e algoritmos de KDD (minerao de dados estruturados), para
descobrir conhecimento til para o usurio.
A descoberta por Clusterizao procura separar automaticamente elementos em classes que
sero identificadas durante o processo (no h classes pr-definidas). A clusterizao
diferente da classificao, pois a primeira visa criar as classes atravs da organizao dos
elementos, enquanto que a segunda procura alocar elementos em classes j pr-definidas
(conforme Willet, 1988). A clusterizao auxilia o processo de descoberta de conhecimento,
facilitando a identificao de padres (caractersticas comuns dos elementos) nas classes.
Geralmente, a tcnica de clusterizao vem associada com alguma tcnica de descrio de
conceitos, para identificar os atributos de cada classe. Esta posterior identificao das classes
atravs de suas caractersticas chamada de "anlise da classe" (cluster analysis), conforme
Willet (1988), e gera uma nova abordagem de descoberta: a descoberta por Descrio de
Classes de Textos. Dada uma classe de documentos textuais (j previamente agrupados) e
uma categoria associada a esta classe (por exemplo, tema ou assunto dos textos), a descoberta
por descrio procura encontrar as caractersticas principais desta classe, as quais possam
identific-la para os usurios e distingui-las das demais classes. Esta abordagem segue
geralmente as tcnicas para construo do centride de classes. Ela diferente da abordagem
por listas de conceitos-chave, porque descobre caractersticas comuns em vrios textos e no
em um nico texto.
A abordagem de descoberta por Associao entre Textos procura relacionar descobertas
presentes em vrios textos diferentes. As descobertas esto presentes no contedo ou
significado dos textos. Esta abordagem diferente do que acontece na descoberta por
associao entre passagens, cujo objetivo somente relacionar partes de textos sobre o
mesmo assunto. Na associao entre textos, a interpretao semntica fundamental.
Swanson (1997) comenta que o conhecimento novo pode emergir de inmeros fragmentos
individualmente no-importantes, sem relao no momento em que foram elaborados ou
adquiridos. Por exemplo, McKeown e Radev (1995) discutem uma ferramenta que analisa
diversos artigos sobre um mesmo evento e cria um resumo em linguagem natural. So
extradas informaes de partes dos textos e analisadas para encontrar similaridades e
diferenas de informaes. Davies (1989) acredita que existe muita informao publicada e
90

conhecida, mas que algumas concluses a partir destas informaes s podero ser
descobertas recuperando estes documentos e notando as conexes lgicas entre eles.
A descoberta por Associao entre Caractersticas procura relacionar tipos de informao
(atributos) presentes em textos, aplicando a tcnica de correlao ou associao tradicional em
KDD diretamente sobre partes do texto. Uma das diferenas que os valores para os atributos
so partes do texto e no necessariamente dados extrados por tcnicas de extrao de
informaes. Feldman e Dagan (1998), por exemplo, marcam documentos textuais com
palavras-chave tomadas de um vocabulrio controlado, organizado em estruturas hierrquicas
de tpicos. Ferramentas de descoberta procuram encontrar padres na coleo de documentos
por anlise de distribuies de palavras-chave. Feldman e Hirsh (1997) tambm discutem a
descoberta de associaes (padres de co-ocorrncia) entre termos que marcam textos.
Seguindo a mesma linha da abordagem anterior, h a descoberta por Comparao de Modelos
Mentais. Esta abordagem procura representar documentos textuais e o estado de
conhecimento do usurio (modelo mental das informaes) em um formalismo padro, para
aps compar-los. Se for possvel verificar o que h nos documentos que falta no estado
mental do usurio, ento um conhecimento novo foi descoberto.

20 Sistemas de Web Mining (ou Web Usage Mining)
Objetivo: encontrar padres no comportamento de usurios da web.

Os sistemas de Web Mining utilizam tcnicas estatsticas sobre dados de usurios web ou
sobre histricos de suas aes em sites especficos.
O conhecimento descoberto desta forma pode auxiliar no projeto de sites ou para auxiliar no
marketing.
Redesign de sites:
melhorar pginas muito visitadas mas que no levam a objetivos;
avaliao e experimentao de estratgias;
gerao de atalhos para pginas mais vistas;
evitar usurio perdido no site.

Apoio ao marketing
comparao entre tipos de clientes ou usurios (compradores X s visitantes);
influenciar clientes at um objetivo;
anlise de impacto de campanhas;
anlise de perfil de clientes (de onde vem, o que olham, como analisam as
informaes);
onde a empresa perde clientes durante a visita no site.



Os sistemas de Web Mining fazem uso de dados sobre as pginas web e tambm sobre os
usurios (visitantes do site), conforme descrio a seguir.

91

Dados sobre Pginas Web
Seguem os dados que os sistemas de Web Mining precisam ter sobre pginas web:
sobre contedo : significado de textos e imagens nas pginas;
sobre a estrutura intra-pgina: arranjo de tags (HTML, XML) dentro da pgina, como uma
rvore;
sobre estrutura inter-pginas: hiperlinks que relacionam as pginas;
sobre uso: endereos IP, data da visita, tempo gasto nas visitas, requisies de URLs,
operaes no browser (botes clicados como reload e back/forward, salvar, adicionar a
bookmarks).

Dados sobre Usurios da Web
Seguem os dados que os sistemas de Web Mining manipulam sobre os usurios:

atributos demogrficos do usurio: sexo, idade, localizao;
navegao explcita: pginas requisitadas ou visitadas, links seguidos, escolhas de atributos
pelo usurio ou parmetros fornecidos como entrada, tempo gasto, palavras-chave usadas em
buscas;
navegao implcita: itens escolhidos e o que est sendo visto pelo usurio;histrico de
relacionamento do usurio com o site: compras feitas, pginas visitadas, documentos ou
elementos baixados por download, revisitas;
feedback do usurio (ratings): preferncias, crticas, opinies e comentrios;
contedo visitado;
descartes do usurio: produtos colocados no cesto e tirados, pginas no carregadas
totalmente.

Como coletar dados
Alguns dados (como os dos usurios) podem ser conseguidos atravs de pesquisas,
questionrios ou cadastros (coleta explcita).
Pode-se tambm utilizar tcnicas de enriquecimento, por exemplo, cruzando com bancos de
dados fora da Internet.
Alguns dados tcnicos so coletados de forma implcita, por softwares especficos. Por
exemplo, cookies e plug-ins podem ser usados para identificar usurios e coletar suas aes.
Entretanto, a maneira mais usual coletar dados no arquivo de log do servidor web. Cada
requisio ou ao de um visitante num site fica registrada neste arquivo. Os registros
possuem campos como: nmero IP da mquina do usurio que est visitando, data, hora,
pgina ou arquivo ou imagem requisitada, tipo de protocolo, total de bytes carregados,
sistema operacional do usurio, etc.

O nmero IP, apesar de bastante usado para identificar usurios, pode gerar problemas quando
h vrios usurios usando a mesma mquina ou mesmo se uma pessoa utilizar mquinas
diferentes (no saberemos que a mesma pessoa e teremos perfis separados). Outro problema
com o uso de nmeros IP internos (vrios computadores identificados com o mesmo nmero
IP externo).
Por isto, o uso de login melhor. Mesmo assim, h casos de pessoas usando o mesmo login e
at mesmo comprando sob o mesmo carto de crdito.

92



Mtricas
Algumas mtricas utilizadas para analisar comportamento de usurios em sites Web:

hits: requisies feitas ao servidor;
page views: nmero de requisies da pgina (ou nmero de vezes que ela foi vista por
diferentes usurios);
sesso (visita nica): conjunto de aes ou requisies de um mesmo usurio num mesmo
contexto (mesmo dia);
converso de produto = quantidade vendida / nmero de vezes que o produto foi visto;
eficincia do contato: frao de usurios que gastaram pelo menos um certo tempo (limiar)
no site;
eficincia de converso: frao dos visitantes que compraram algo;
clickthrough rate: porcentagem de visitantes que clicaram num banner;
banner ad return on investment: lucros gerados por visitantes orientados pelo banner;
look-to-click rate: % de usurios que clicaram num banner ou produto em relao aos que
apenas olharam (receberam a pgina ou informao);
click-to-basket rate: % de usurios que colocaram um produto no cesto de compras em
relao aos que clicaram no produto;
basket-to-buy rate: % de usurios que compraram o produto em relao aos que colocaram
o produto no cesto de compras (alguns usurios retiram os produtos do cesto depois);
look-to-buy rate: % de usurios que compraram um produto em relao aos que apenas
olharam (receberam a pgina ou informao);
clickstream: sequncia de pginas requisitadas numa sesso.


Anlise de Tempo
O tempo um dos indicadores mais importantes em sistemas de Web Mining.
Primeiro, necessrio controlar as sesses e a calcular o tempo de cada sesso. O incio de
uma sesso acontece quando uma mquina, identificada por um nmero IP, faz uma primeira
requisio dentro de um site (de uma pgina deste site), num certo dia. O fim tido como o
momento da ltima requisio neste mesmo dia. Se houver um intervalo (normalmente
considerado em 30 minutos) sem ao (requisio), considerada uma nova sesso (a
primeira requisio aps este intervalo inicia uma nova sesso).
A sesso importante pois determina o contexto do usurio, permitindo entender seu objetivo
(comprar, ver preo, cadastrar, etc.) e a sua estratgia para alcanar o objetivo (aes e
requisies). Quanto mais tempo o usurio passa no site, maior interesse tem.
Tambm til avaliar quanto tempo um usurio passou vendo cada pgina. Este tempo
estimado pela diferena entre o horrio (timestamping) da requisio da pgina e o horrio da
prxima requisio de pgina. claro que pode haver enganos, pois um usurio pode abrir
vrias pginas ao mesmo tempo ou ento ter outro foco que no a pgina aberta.
Se houver identificao do usurio, pode-se extrair padres como tempo mdio de suas
sesses, intervalo entre revisitas, dias e horrios preferidos para entrar no site.
O tempo de ateno do usurio s pginas tambm ir revelar as pginas de maior sucesso ou
interesse. Por exemplo, se forem pginas de produtos, poderemos saber que produtos atraem
mais a ateno dos usurios.
A Figura 62 apresenta padres estatsticos de usurios visitantes, cadastrados e compradores
em sites nos EUA, segundo estudos de Ron Kohavi. As setas indicam a taxa de converso;
pode-se notar que, de cada 100
comprando algo. J a partir de usurios cadastrados, 33% destes acabam comprando. Por isto
que muitos sites sugerem que os usurios faam cadastro. Isto permite conhecer melhor o
usurio e recomendar algo mais propcio.
Quanto ao tempo, pode-se notar que um usurio visitante olha em mdia 10 pginas e suas
sesses duram 5 minutos em mdia. Isto significa ver uma pgina a cada 30 segundos. Para os
sites, isto quer dizer que preciso projetar uma p
de 30 segundos, seno ele vai passar para outra pgina.
Por outro lado, os usurios que compram passam em mdia 30 minutos no mesmo site e
acessam bem mais pginas (mdia de 50).


Figura 62: Comparao de usurios visitantes,


Estatsticas simples
As anlises bsicas de Web Mining incluem aplica
exemplo, nmero de visitantes por dia da semana ou por hora ou turno, dada uma amostra
(por exemplo, um ms de acessos).
A Figura 63 mostra o exemplo de um resultado estatstico para um site que revende
automveis. Pode-se notar que os dias da semana de maior visitao (com maior nmero de
usurios visitantes) so a 2a-feira e a 6a
ofertas no jornal no domingo e na 5a
avaliar o retorno de campanhas de marketing feitas fora da Web.

93
O tempo de ateno do usurio s pginas tambm ir revelar as pginas de maior sucesso ou
interesse. Por exemplo, se forem pginas de produtos, poderemos saber que produtos atraem
apresenta padres estatsticos de usurios visitantes, cadastrados e compradores
em sites nos EUA, segundo estudos de Ron Kohavi. As setas indicam a taxa de converso;
se notar que, de cada 100 usurios que entram no site sem identificao, 17 acabam
comprando algo. J a partir de usurios cadastrados, 33% destes acabam comprando. Por isto
que muitos sites sugerem que os usurios faam cadastro. Isto permite conhecer melhor o
ar algo mais propcio.
se notar que um usurio visitante olha em mdia 10 pginas e suas
sesses duram 5 minutos em mdia. Isto significa ver uma pgina a cada 30 segundos. Para os
sites, isto quer dizer que preciso projetar uma pgina para "conquistar" o usurio em menos
de 30 segundos, seno ele vai passar para outra pgina.
Por outro lado, os usurios que compram passam em mdia 30 minutos no mesmo site e
acessam bem mais pginas (mdia de 50).
: Comparao de usurios visitantes, cadastrados e compradores de um site
bsicas de Web Mining incluem aplicao de tcnicas estatsticas simples. Por
exemplo, nmero de visitantes por dia da semana ou por hora ou turno, dada uma amostra
(por exemplo, um ms de acessos).
a o exemplo de um resultado estatstico para um site que revende
se notar que os dias da semana de maior visitao (com maior nmero de
feira e a 6a-feira. O interessante que esta revenda coloca suas
no jornal no domingo e na 5a-feira. Isto significa que Web Mining pode ajudar a
avaliar o retorno de campanhas de marketing feitas fora da Web.
O tempo de ateno do usurio s pginas tambm ir revelar as pginas de maior sucesso ou
interesse. Por exemplo, se forem pginas de produtos, poderemos saber que produtos atraem
apresenta padres estatsticos de usurios visitantes, cadastrados e compradores
em sites nos EUA, segundo estudos de Ron Kohavi. As setas indicam a taxa de converso;
usurios que entram no site sem identificao, 17 acabam
comprando algo. J a partir de usurios cadastrados, 33% destes acabam comprando. Por isto
que muitos sites sugerem que os usurios faam cadastro. Isto permite conhecer melhor o
se notar que um usurio visitante olha em mdia 10 pginas e suas
sesses duram 5 minutos em mdia. Isto significa ver uma pgina a cada 30 segundos. Para os
gina para "conquistar" o usurio em menos
Por outro lado, os usurios que compram passam em mdia 30 minutos no mesmo site e

cadastrados e compradores de um site
estatsticas simples. Por
exemplo, nmero de visitantes por dia da semana ou por hora ou turno, dada uma amostra
a o exemplo de um resultado estatstico para um site que revende
se notar que os dias da semana de maior visitao (com maior nmero de
feira. O interessante que esta revenda coloca suas
feira. Isto significa que Web Mining pode ajudar a
94


Figura 63: Estatsticas por dia da semana

No mesmo sentido, a Figura 64 apresenta estatsticas de acessos a um site num mesmo dia.
Pode-se notar que os horrios de maior pico foram entre 3 e 5 horas da manh, ou seja, na
madrugada. Isto aconteceu neste dia porque a empresa fez um coquetel no dia anterior,
apresentando um produto, e chamando as pessoas para uma ao interativa na Web.
Aconteceu que vrias pessoas saram do coquetel e acessaram o site para ganhar os brindes.




Figura 64: Estatsticas por hora

O interessante que podemos comparar nmero de visitantes com quantidade de aes. A
Figura 65 mostra um grfico relativo ao nmero de visitantes num site, num certo perodo de
tempo. J a Figura 66 apresenta o mesmo perodo do mesmo site, mas contabiliza o nmero
0
20
40
60
80
100
120
2a 3a 4a 5a 6a sab dom
95

de hits, indicando a quantidade de aes dos usurios. Pode-se notar que entre a semana de
10/4 e 17/4 houve um pico de usurios, mas estes fizeram poucas aes no site, enquanto que
na semana entre 3/4 e 10/4 o nmero de usurios no foi to elevado mas eles tiveram mais
aes nas suas sesses.



Figura 65: Visitantes por dia



Figura 66: Hits por dia




Como as aes de usurios ficam registradas em arquivos de log, nos servidores Web onde os
sites ficam instalados, possvel ter diversos tipos de relatrios estatsticos. Por exemplo,
96

pode-se saber a origem dos visitantes, analisando o nmero IP de suas mquinas. Um nmero
IP tem o formato como XXX.YYY.ZZZ.WWW, onde XXX indica o pas onde a mquina
est alocada.
Tambm pode-se ter relatrios das pginas mais acessadas (mais vista). Isto importante para
saber o que est atraindo mais os usurios.
O log tambm permite saber quais as pginas de entrada no site (1a pgina vista na sesso) e
as pginas de sada (ltima pgina vista na sesso). Nem sempre a 1a pgina vista na sesso
a pgina principal do site, porque usurios podem chegar no site por indicao de mecanismos
de busca ou por banners ou porque simplesmente gravaram os chamados atalhos.
Tambm possvel fazer estatsticas dos erros mais comuns que acontecem no site (404, 503,
etc.), alm de relatrios sobre sistemas operacionais e tipos de navegadores mais usados pelos
usurios.
Outro relatrio interessante o relativo ltima pgina vista pelo usurio antes de entrar no
site. Isto permite saber que mecanismos de busca esto levando usurios para nosso site e
tambm quais as palavras-chave mais usadas pelos usurios nos mecanismos de busca,
quando "caem" no nosso site.


Anlise de clickstreams
Clickstream a sequncia de clicks ou pginas vistas por um usurio numa sesso em um site.
Esta sequncia indica o caminho percorrido pelo usurio desde que entrou no site at sua
sada (ltima pgina vista).
A anlise de clickstreams importante para conhecer a estratgia dos usurios at seu
objetivo, ou para saber se algum estava perdido no site sem saber como chegar ao objetivo,
ou para diferenciar as estratgias de usurios com perfis diferentes. Por exemplo, pode-se
comparar os clickstreams mais comuns entre usurios que compram e comparar com o padro
de usurios que no compra. Talvez o projeto do site no esteja ajudando estes ltimos a
chegarem a seus objetivos. Ou a empresa pode descobrir que o diferencial est na pgina que
apresenta o preo dos produtos.

Anlise de buscas internas ao site

Kohavi, numa palestra no International Symposium on Knowledge Management (ISKMDM,
Curitiba, 2000), apresentou um caso interessante de um site de esportes, onde 4 das 10
palavras mais usadas para buscas no trazia resultado nenhum. O seja, os termos mais usados
para buscas no estavam presentes em nenhuma pgina no site. Isto dificulta encontrar algo
dentro do site ou mesmo chegar ao site via mecanismos de busca. Segundo Kohavi ainda,
11% das buscas dentro dos sites falham.
Outro caso foi de um site de comrcio eletrnico onde, usando o termo "televisor" para fazer
buscas na categoria de produtos chamada "televisores", no trazia nenhum aparelho de TV
como resposta. Isto porque o site no estava usando sinnimos.
Algumas ferramentas na Web ajudam a entender o que as pessoas esto procurando. O
Google Trends mostra a quantidade de buscas com determinadas palavras-chave (fornecidas
como entrada deste servio). Os trend topics do Twitter tambm ajudam a entender os temas
de maior interesse. Alm disto, o mecanismo de busca do Google tambm sugere termos para
97

completar uma busca, baseado na sabedoria das massas. Isto ajuda a entender o que as pessoas
esto procurando mais e como (que tipo de palavras esto usando).



21 Sistemas de Personalizao e Recomendao
Objetivo: fazer ofertas personalizadas

O objetivo dos sistemas de recomendao auxiliar as pessoas na escolha entre alternativas.
Hoje em dia, h tantas opes para tudo, que fica impossvel analisar todas. Por isto, os
sistemas de recomendao ajudam no processo social de indicar ou receber indicao. Os
itens possveis de indicao incluem livros, produtos, discos, restaurantes, lugares tursticos,
meios de transporte, pginas web, servios de empresas ou simplesmente informaes.
Tais sistemas complementam os sistemas de CRM, porque permitem gerar ofertas
personalizadas, ou seja, uma oferta diferente para cada pessoa. Fica difcil pensar que algum
vai entrar num supermercado e ter um preo para algum produto. Mas os cartes de
fidelidade ajudam a distinguir clientes e podem gerar descontos.
Na Web, fica mais fcil identificar pessoas e assim gerar ofertas diferentes. Desta forma,
possvel ter um site diferente para cada pessoa.

Qual a diferena entre spam e recomendao (ofertas personalizadas) ? Se voc receber um
SMS s 3h da manh avisando de promoo (venda de um produto) e:
a) ficar irritado com a operadora: isto spam;
b) ficar contente e agradecer a operadora porque no dia seguinte ir comprar vrias unidades:
isto recomendao.
A recomendao direcionado a cada indivduo e no por grupos. parte do chamado
Marketing de Relacionamento ou Marketing 1-to-1 (Peppers & Rogers). Para isto, a empresa
precisa saber muito sobre o cliente; a forma que as empresas tm para diminuir a margem de
erro. E ningum vai deixar de fazer propaganda.
O Google ganha dinheiro assim. Dependendo do que voc est procurando na Internet, isto ,
das palavras que voc coloca no buscador, as propagandas sero diferentes. E elas sero
contextualizadas tambm no seu Gmail. E eles possuem tecnologias para identificar o assunto
em vdeos no Youtube, seja pelas palavras no ttulo do vdeo, pelas tags marcadas por quem
postou o vdeo ou, com mais tecnologia, pelas palavras que esto no udio do vdeo.

Para fazer recomendaes, h tcnicas baseadas no perfil do usurio, o qual montado a partir
da coleta explcita ou implcita de informaes sobre os clientes e tambm pode fazer uso de
inferncias. O perfil deve ser montado a partir do histrico de relacionamento do cliente com
a empresa. Algumas tcnicas ainda fazem uso da sabedoria das massas ou de informaes
vindas de pessoas similares. Assim, a origem da recomendao pode ser um indivduo, como
por exemplo, especialistas, profissionais certificados, autoridades, usurios que utilizam
bastante o servio (heavy users), pessoas prximas ou semelhantes (com mesma funo, de
mesma rea cientfica ou rea demogrfica, mesma experincia, caractersticas ou
comportamentos semelhantes). Mas as recomendaes tambm podem vir de grupos de
pessoas, tais como comunidades ou simplesmente por maioria (ex: livros mais vendidos).
98

A recomendao pode utilizar outros meios tambm tais como extratos impressos de contas
bancrias, propagandas em contedos de TV on demand ou de TV digital, malas diretas por
correio tradicional e at mesmo o jornal impresso.

A seguir, so discutidas as principais tcnicas para recomendao.

Top N
Esta tcnica simplesmente avalia os "mais mais" em cada setor. Por exemplo: livros mais
lidos, produtos mais vendidos, aplicativos mais baixados, pginas mais apontadas (Google usa
isto), artigos acadmicos mais citados, msicas mais ouvidas, etc. Basta ento fazer uma
estatstica simples olhando para um grupo de pessoas em geral, sem distines. Para esta
tcnica, no preciso conhecer a pessoa que ir receber a recomendao.

Vendas Cruzadas - Cross Sell
Este foi o primeiro tipo de recomendao usado na Web. o velho caso de "quem comprou o
produto X tambm comprou o produto Y". Normalmente, as pessoas tendem a seguir dicas da
maioria das pessoas. s olha um restaurante cheio e outro vazio; a maioria das pessoas vai
escolher o restaurante mais cheio por acreditar que melhor, j que a maioria est indo ali.
Para gerar as recomendaes, a tcnica observar os itens adquiridos numa mesma compra
(no mesmo carrinho) e a aplicar a probabilidade condicional (como visto na tcnica de
associao nos sistemas de Data Mining).

Regras Determinsticas - Editors Choice
Aqui um especialista no domnio deve gerar regras do tipo "Se condio Ento ao". Por
exemplo, ele pode determinar que seja oferecido um determinado produto a todos que
estiverem olhando uma seo, numa loja fsica ou num site.
O que vale aqui a sensibilidade, intuio ou experincia do profissional que vai definir as
regras.

Baseada em Casos
Esta tcnica procura recomendar itens semelhantes ao que est sendo visto ou que foi
adquirido por um cliente. Podem ser utilizadas funes de similaridade como discutido nos
sistemas especialistas.

Baseada em Contedo
Esta tcnica procura gerar um perfil para cada cliente e a recomendar itens que se encaixam
no perfil do cliente.
Para isto, necessrio ter uma ontologia ou taxonomia, para classificar os itens e as pessoas.
Por exemplo, se uma pessoa compra muitos livros de auto-ajuda, seu perfil ir conter este tipo
de assunto como interesse e ela ir receber mais livros deste tipo como recomendao.
Outra alternativa apenas registrar no perfil do cliente os itens relacionados a este (que ele
viu, comprou, perguntou sobre, etc.). E ento a recomendao ser de itens similares a estes
99

no perfil. Por exemplo, guardar os discos que uma pessoa gosta e recomendar outros discos
do mesmo gnero ou do mesmo artista.

O problema da tcnica baseada em contedo que as recomendaes no so muito variadas.
Se algum s compra discos de jazz, esta pessoa s ir receber recomendao de discos deste
gnero. A empresa no arriscar recomendar algo diferente para no cair em spam. Mas
tambm no abre novas possibilidades para o cliente. Por isto, foi criada a tcnica de filtragem
colaborativa, descrita a seguir.


Filtragem Colaborativa
Esta tcnica tambm mantm um perfil para cada cliente, mas no classifica o cliente, para
evitar esteretipos. A ideia avaliar a similaridade entre pessoas e fazer recomendaes de
forma cruzada. Por exemplo, se uma pessoa compra muitos discos de jazz, todos aqueles que
compraram discos deste gnero sero considerados semelhantes quele cliente. E assim, os
produtos adquiridos por estes sero recomendados para aquele cliente, independente do
gnero. A premissa que pessoas semelhantes possuem gostos semelhantes.
A similaridade entre pessoas pode ser avaliada de duas formas:
a) pelas caractersticas das pessoas: podemos usar dados demogrficos, hbitos,
comportamentos, preferncias ou at mesmo gerar a classificao de perfis;
b) pelas caractersticas dos itens associados s pessoas: desta forma, se a pessoa A comprou
os produtos X e Y e a pessoa B comprou X, Y e Z, o sistema recomenda Z para A porque A e
B so semelhantes pelos itens associados. A vantagem desta segunda alternativa no
precisar criar esteretipos ou usar classes para alocar pessoas.
Esta tcnica incrementa as recomendaes medida que passa a incorporar avaliaes e
feedback dos clientes (os chamados ratings). Por exemplo, na Figura 67, h um cliente
esquerda para o qual queremos gerar recomendaes. Temos os itens que ele adquiriu e suas
avaliaes (positivas ou negativas, indicando se gostou ou no do item). Ao lado direito, h 3
pessoas na base tambm com itens associados e suas crticas.
Pode-se notar que o cliente alvo no semelhante ao 1o cliente porque ambos compraram os
itens A e B, mas seus gostos foram inversos. Isto significa que, se o 1o cliente gostou do item
X, ento o cliente alvo no ir gostar.
J o 3o cliente semelhante ao cliente alvo, porque ambos compraram o item A e no
gostaram. Desta forma, pode-se recomendar o item D do 3o cliente para o cliente alvo.
Uma recomendao interessante para o cliente alvo o item Y. J que o cliente alvo e o 2o
cliente compraram os itens A e C mas tiverem avaliaes contrrias, pode-se supor que
possuem gostos contrrios. Assim, se o 2o cliente no gostou do item Y, possvel que o
cliente alvo goste.


Figura 67: Filtragem Colaborativa para recome



Cuidados e Desafios para Recomendao

Os sistemas de recomendao ainda so muito novos e precisam melhor ser avaliados. Por
esta razo, elencamos alguns desafios ou cuidados a serem tomados na hora de implantar tais
sistemas.

gerar recomendao somente
Talvez no seja bom ficar recomendando itens sem que o usurio solicite, pois pode aborrec
lo. Por outro lado, as empresas querem vender mais e precisam fazer propaganda. Neste caso,
pode-se utilizar o marketing de permisso, que aquele em que a pessoa pode optar por
receber ou no ofertas (a pessoa deveria poder indicar o tipo de oferta que quer receber,
quando e de que forma).

interromper ou no a pessoa ?
Alguns sistemas utilizam Assistentes Virtuais que ajudam pessoas no uso de certos softwares.
Muitas vezes, estes assistentes interrompem o trabalho da pessoa para dar uma dica. Tambm
deve-se dar a opo para o usurio escolher se quer ou no ser interrompido.

recomendar tudo o que possvel ou selecionar por limiar
Se as recomendaes forem muitas, podem gerar sobrecarga na pessoa, que justamente o
problema que os sistemas de recomendao querem solucionar. Assim, deve
nmero de ofertas. O Google por exemplo gera

dar explicaes da origem recomendao ?
Os sistemas deveriam explicar como geraram as recomendaes. Isto
cliente para aceitar a oferta. Por exemplo, pode
compraram tal item ou que ele foi o mais comprado ou melhor avaliado.

recomendar somente o que novo ?
100

: Filtragem Colaborativa para recomendao
Cuidados e Desafios para Recomendao
de recomendao ainda so muito novos e precisam melhor ser avaliados. Por
esta razo, elencamos alguns desafios ou cuidados a serem tomados na hora de implantar tais
somente quando solicitada ou espontnea (proativa) ?
alvez no seja bom ficar recomendando itens sem que o usurio solicite, pois pode aborrec
lo. Por outro lado, as empresas querem vender mais e precisam fazer propaganda. Neste caso,
e utilizar o marketing de permisso, que aquele em que a pessoa pode optar por
ofertas (a pessoa deveria poder indicar o tipo de oferta que quer receber,
a pessoa ?
istentes Virtuais que ajudam pessoas no uso de certos softwares.
Muitas vezes, estes assistentes interrompem o trabalho da pessoa para dar uma dica. Tambm
se dar a opo para o usurio escolher se quer ou no ser interrompido.
possvel ou selecionar por limiar ?
Se as recomendaes forem muitas, podem gerar sobrecarga na pessoa, que justamente o
problema que os sistemas de recomendao querem solucionar. Assim, deve
nmero de ofertas. O Google por exemplo gera recomendaes em torno de 3 itens.
origem recomendao ?
Os sistemas deveriam explicar como geraram as recomendaes. Isto ajuda a dar
a oferta. Por exemplo, pode-se dizer que pessoas semelhantes ao cl
compraram tal item ou que ele foi o mais comprado ou melhor avaliado.
comendar somente o que novo ?
de recomendao ainda so muito novos e precisam melhor ser avaliados. Por
esta razo, elencamos alguns desafios ou cuidados a serem tomados na hora de implantar tais
alvez no seja bom ficar recomendando itens sem que o usurio solicite, pois pode aborrec-
lo. Por outro lado, as empresas querem vender mais e precisam fazer propaganda. Neste caso,
e utilizar o marketing de permisso, que aquele em que a pessoa pode optar por
ofertas (a pessoa deveria poder indicar o tipo de oferta que quer receber,
istentes Virtuais que ajudam pessoas no uso de certos softwares.
Muitas vezes, estes assistentes interrompem o trabalho da pessoa para dar uma dica. Tambm
Se as recomendaes forem muitas, podem gerar sobrecarga na pessoa, que justamente o
problema que os sistemas de recomendao querem solucionar. Assim, deve-se limitar o
recomendaes em torno de 3 itens.
a dar confiana ao
se dizer que pessoas semelhantes ao cliente
101

Se uma vdeo-locadora s recomendar os lanamentos, ela ir quebrar. importante poder
recomendar itens antigos, at mesmo porque itens vintage esto na moda.

relevncia temporal
Deve-se levar em conta a sazonabilidade, estaes, regies geogrficas, clima, etc. para gerar
recomendaes. Alm disto, no se pode recomendar fraldas para uma famlia por toda a vida.
As recomendaes devem ter um perodo de validade.

perfil dinmico
O perfil criado para cada cliente no deve ser esttico. Ele precisa mudar com o tempo e
acompanhar as mudanas de interesse do cliente. Estas mudanas podem ser notadas pelas
aes do cliente, as quais indicam o tipo e o grau de interesse. Se algum entra todo o dia num
site e clica no mesmo produto, porque ele tem muito interesse naquele produto. Se ele
entrou s uma vez e clicou em vrios produtos de uma seo, ele tem algum interesse naquela
seo e no num produto especfico.
Uma das formas de gerar perfis dinmicos associar uma pontuao s classes de interesse do
cliente. A cada ao, a pontuao aumentada. Por exemplo, olhar um produto, aumenta a
pontuao da classe no perfil deste cliente, pois demonstra o interesse do cliente neste tipo de
produto. A Figura 68 apresenta um exemplo de perfil de cliente, com vrias classes e
pontuaes diferentes (as barras horizontais).





Figura 68: Perfil dinmico para recomendaes

Neste exemplo, as classes so tipos de produtos. Mas podemos tambm utilizar como classes
caractersticas dos produtos. Por exemplo, se um cliente s clica em eletrodomsticos com
102

voltagem de 220 volts e da cor branca, ento este tipo de caracterstica vai para seu perfil. Se
for necessrio recomendar um eletrodomstico para este cliente, que seja branco e de 220
volts. Outras classes possveis incluem marcas, tamanho e detalhes tcnicos (capacidade de
memria, resoluo, tipo de tecnologia, etc.). Tambm pode-se usar classes temporrias tais
como produtos em promoo ou com frete grtis.
Tambm possvel criar faixas de valores. Se um cliente s clica em TVs das mais baratas, na
hora de apresentar uma geladeira para ele, pode-se selecionar as mais baratas.
Como o perfil dinmico, pode-se tambm diminuir a pontuao referente ao interesse. Se
uma pessoa no demonstra mais interesse numa classe, a pontuao deve diminuir com o
tempo.

recomendar produtos j adquiridos ?
Imagine que um cliente compre um produto e na semana seguinte receba a recomendao do
mesmo produto mas com valor mais baixo. Certamente o cliente no ficar nada satisfeito. Da
mesma foram, se algum acabou de comprar uma geladeira, no tem por que ficar
recomendando geladeiras para ele. Assim, o perfil do cliente deve acomodar estas mudanas.
Isto pode se observado pelas aes do cliente (comprar um item) ou atravs de feedback
explcito, por exemplo, o cliente dizendo j comprei este produto, "no tenho interesse" ou
"no me recomende mais este produto ou produtos deste tipo".
Quando um cliente compra um produto, dizemos que o produto "morreu" para o cliente por
um tempo. Mas o produto pode ressuscitar. Por exemplo, pessoas trocam de geladeira a cada
10 ou 15 anos. Ento podemos voltar a recomendar geladeiras para quem comprou uma,
depois deste tempo. Na maioria dos casos no se deve recomendar o mesmo produto, mas
algum mais moderno, do mesmo tipo. E h casos, como os perfumes, que as pessoas
costumam comprar o mesmo produto mais seguido (com intervalo de poucos meses). E se
algum comprou cerveja num dia ? Pode-se recomendar o mesmo produto no dia seguinte,
que no haver problema, pois a pessoa vai voltar e comprar mais.


necessidades ou gostos ad hoc
Imagine que algum comprou o disco de um artista para dar de presente a um amigo. Mas
quem comprou no gosta deste tipo de msica. Entretanto, a maioria dos sistemas de
recomendao ir gravar este tipo de interesse no perfil da pessoa e ir gerar recomendaes
que vo desagradar o cliente. Alguns sistemas esto inovando permitindo que o cliente diga
que est comprando o item para dar de presente (e assim no gerar registro no perfil).

como elaborar o perfil de clientes novos ?
Se uma pessoa est entrando pela primeira vez num site, no temos ainda perfil dela e no
podemos fazer recomendaes baseadas no perfil (somente outros tipos de tcnicas). Este o
problema conhecido como "cold start". Uma das formas pedir para que o cliente faa
algumas avaliaes ou responde um questionrio bsico e rpido, para que seus interesses
possam ser conhecidos. Ou ento, espera-se observar algumas aes, e a ento criar um perfil
inicial.

shilling e reputao
Como o cliente pode saber se a recomendao confivel ou se foi criada manualmente para
empurrar itens (ex: produtos encalhados ou os mais caros). Muitas empresas usam a tcnica
de shilling, por exemplo, colocando pessoas famosas como usurios de um produto ou
103

servio. Os sistemas de recomendao podem utilizar tcnicas de reputao para que as
prprias pessoas avaliem umas s outras, para gerar recomendaes vindas de indivduos ou
grupos.

anlise de redes sociais
As redes sociais so uma febre e podem ajudar no conhecimento do interesse de pessoas.
Podemos analisar o que as pessoas colocam como caractersticas em seus perfis nas redes
sociais, o que elas postam (imagens, textos), o que dizem gostar ou no gostar, e tambm os
"amigos". Alguns sistemas de recomendao observam o que gostam os amigos de uma
pessoa X, para recomendar o mesmo para esta pessoa. O pressuposto que amigos possuem
gostos semelhantes.

mesmas recomendaes para todos ?
Se num engarrafamento, vrias pessoas pedirem recomendao de caminhos alternativos, o
mesmo sistema no pode indicar a mesma rota, pois ir engarrafar a via alternativa. Da
mesma forma, se um sistema s recomenda o mesmo produto, este ir faltar, clientes ficaro
insatisfeitos e outros produtos ficaro encalhados. As recomendaes devem, portanto, ser
balanceadas.

recomendao para grupos de pessoas
Se estamos querendo recomendar atraes tursticas para um grupo de pessoas heterogneas,
devemos levar em conta os diferentes gostos. Se houver interesse comum, os itens que se
encaixam neste tipo de interesse so a soluo, mas se no houver nada em comum, como
recomendar uma nica opo ?

recomendaes sensveis ao contexto
Atualmente, as recomendaes devem levar em conta o contexto do usurio, incluindo onde
ele est geograficamente, o que est fazendo, que tipo de tecnologia est usando, qual o
horrio no momento, qual o clima, etc. O contexto deve ser coletado automaticamente pelo
sistema ou inferido. Tais questes sero discutidas nos sistemas pervasivos e ubquos,
descritos mais adiante.



22 Sistemas de Groupware
Objetivo: apoiar trabalho em grupo

Pessoas no trabalham sozinhas. No funciona mais a frmula do cientista maluco
trabalhando sozinho em seu laboratrio. As pessoas precisam trocar informaes. Numa
empresa, ainda mais. Todos os setores horizontais e os 3 nveis verticais (estratgico, ttico e
operacional) precisam funcionar de forma integrada.
Os sistemas de Groupware proveem ferramentas para auxiliar o trabalho em grupo de pessoas.
Este tipo de trabalho pode ser feito de duas formas: cooperao, quando as pessoas possuem o
mesmo objetivo (um grupo coeso) ou colaborao, quando grupos diferentes trocam
informaes, cada qual com seu objetivo.

104

As ferramentas disponveis para Groupware so descritas no prximo tipo (Intranets) pois so
as mesmas, s que j disponveis na Web. Antigamente, tais ferramentas existiam nos
ambientes empresariais mas sem o padro Web, funcionando internamente nas redes
corporativas.


23 Sistemas de Intranet
Objetivo: apoiar trabalho em grupo utilizando tecnologias web

Uma Intranet uma rede interna com padres Web (servidor Web, pginas Web e
navegadores sobre uma rede fsica e lgica de computadores).
O objetivo das Intranets permitir a divulgao de informaes de forma rpida internamente
empresa e ser um meio para troca e compartilhamento de informaes entre pessoas.

As ferramentas possveis so descritas a seguir.

murais eletrnicos
Este tipo de ferramenta permite aos chefes divulgarem informaes de forma rpida e
amplamente dentro da empresa. Eles substituem as antigas CI (comunicaes internas), que
eram distribudas em papel. Se a pgina de entrada dos navegadores for a da Intranet da
empresa, todos os colaboradores vero as notcias e comunicados postados ali.
H tambm os murais para colaborao, tipo quadros brancos (ex.: mural.ly).


correio eletrnico (e-mail)
A troca de e-mails um recurso antigo, mas ainda a ferramenta mais utilizada pelas
empresas.

listas ou grupos de discusso
Tal recurso permite que pessoas possam fazer inscrio em listas ou grupos criados por
assunto, e cada mensagem enviada lista ou grupo replicada. As inscries devem ser
aprovadas e as postagens podem ser mediadas pelo criador da lista ou grupo. O Google
Groups um exemplo de ferramenta free disponvel na Web.

fruns
Os fruns funcionam como as listas ou grupos de discusso. Entretanto, o usurio deve ir at
o frum para ver as postagens. No caso anterior, as mensagens so enviadas por e-mail aos
participantes da lista ou grupo. H algumas ferramentas de fruns que permitem ao usurio
configurar a forma de envio e assim receber um e-mail a cada nova postagem ou um resumo
dirio ou semanal.

chat
Os chats permitem a troca sncrona de mensagens. Os participantes precisam estar conectados
ao mesmo tempo e na mesma sala. As salas podem ser mediadas, inclusive com seleo de
participantes.

conferncias distncia (conference call)
105

Esta ferramenta permite reunies distncia, ou seja, com participantes fisicamente
localizados em locais distantes ou remotos, mas participando de reunies sncronas (ao
mesmo tempo). Tais reunies normalmente so feitas somente com udio e sem imagens.

teleconferncia
Este tipo de ferramenta permite a troca de imagens e sons, facilita as reunies distncia e
sncronas, como no caso anterior, mas com a vantagem de as pessoas poderem ver umas s
outras. Dizem que o contato face-to-face importante em times globais, pois fortalece a
confiana entre as pessoas, faz cair barreiras e gera troca de informaes com mais
honestidade.
Alguns j chamam este tipo de contato de telepresena, pois simulam a participao de
pessoas em ambientes remoto. O uso de telas grandes com boa resoluo faz as pessoas
esquecerem que os colaboradores esto distantes; como se eles estivessem numa sala ao
lado, conectados por uma janela de vidro.

mensagens instantneas
Softwares como Skype e o falecido MSN (messenger) facilitam a troca sncrona de
informaes. Inclusive podem funcionar para atendimento de clientes. Para haver a troca, as
pessoas devem formar redes de contatos.

autoria colaborativa
Este tipo de ferramenta permite que diferentes pessoas possam criar documentos (textos,
diagramas, figuras, vdeos, apresentaes, etc.). A participao pode ser feita de forma
assncrona, ou seja, sem a necessidade que as pessoas estejam conectadas ao mesmo tempo.
Cada alterao no documento registrada (dia, hora, o que foi alterado e por quem),
facilitando o controle de revises, identificando cada alterao (quem fez o que) e permitindo
voltar atrs em caso de enganos.
As ferramentas tipo Wikis se encaixam neste tipo.

Bibliotecas Virtuais
As quais centralizam os documentos da empresa. Podem contar documentos de texto ou
outros tipos de mdias. O Youtube com um canal particular pode ser utilizado como uma
videoteca virtual.

criptografia e assinatura eletrnica
Tais recursos permitem controlar quem pode acessar, visualizar ou mesmo alterar documentos
num grupo de trabalho. Tambm permite identificar quem fez cada alterao.

formulrios eletrnicos
Esto substituindo os formulrios em papel. Agora, requisies internas ou mesmo as vindas
de clientes podem ser feitas pela Web, pela Intranet da empresa. Os formulrios podem ser
configurados para receber certos tipos de respostas (textos, escolhas mltiplas ou nicas,
seleo de opes, etc.) e para redirecionar as requisies para certas pessoas por e-mail.

compartilhamento de dados (ftp)
Tal recurso permite que as pessoas possam colocar documentos num mesmo repositrio, por
exemplo, nas nuvens, para que possam ser acessados de diferentes fontes (inclusive de fora da
106

rede interna da empresa) e por diferentes pessoas (com autorizao). Servios grtis como
Dropbox, Google Drive e Microsoft Skydrive so exemplos deste tipo de ferramenta.
Algumas ferramentas deste tipo ainda permitem o controle de verses, isto , quando uma
nova verso de um mesmo documento adicionado, o software cria uma nova verso
identificada por um novo nmero. O esquema de numerao permite ver verses anteriores e
acompanhar o histrico de mudanas dos documentos.

ferramentas para apoio a discusses e decises em grupo
H tambm ferramentas de software que permitem registrar discusses feitas em fruns ou
chats, como se fossem atas. Tambm h ferramentas para votao e realizaes de enquetes e
pesquisas (surveys), como por exemplo no Google Docs.

Comunidades Virtuais ou de Aprendizado
H sites como o Ning que permitem criar comunidades privativas, onde as pessoas podem
compartilhar documentos e vdeos e podem criar fruns para discusso. Este tipo de
ferramenta acaba reunindo todo os outros tipos de ferramentas.

Mais recentemente tambm se juntam a este rol de ferramentas os aplicativos para
dispositivos mveis (em Android ou iOS). Eles rodam em tablets, celulares e smartphones
mas so de uso exclusivo da empresa e seus colaboradores. Por isto, a empresa deve criar sua
prpria e particular application store (chamada de Enterprise App Store).

As Intranets comearam como um suporte para divulgar e atualizar a lista de ramais internos
da empresa e para localizao de pessoas, eliminando assim papis e agilizando a recuperao
deste tipo de informao (e evitando perda de tempo com informaes desatualizadas).
Entretanto, hoje a Intranet o principal meio de divulgao de informaes internas,
centralizando o que precisa ser centralizado mas tambm permitindo a cada setor autonomia
para criar e divulgar suas prprias informaes e servios.


Outras vantagens das Intranets incluem:
o custo inicial baixo: se a rede fsica j existir, o custo de instalar navegadores e um
servidor web e criar pginas web zero. O problema est no custo posterior, como discutido
a seguir;
facilidade de uso e aprendizagem: qualquer pessoa sabe utilizar um navegador Web e sabe
navegar por pginas Web; os softwares antigos de Groupware eram difceis de serem
usados, necessitavam um forte treinamento e ainda por cima funcionavam em modo
cliente-servidor, exigindo licenas para o servidor e para cada cliente instalado.

Outra grande vantagem das Intranets dar suporte s recomendaes de qualidade para
documentos. Em geral, os paradigmas de qualidade sugerem retirar de circulao documentos
obsoletos e que todos colaboradores devem ter a mesma verso e a mais atualizada de cada
documento. Quando isto feito com documentos em papel, h um grande esforo para
controlar se a ltima verso est fisicamente em cada setor e tambm para retirar os
documentos antigos e substitu-los com os novos.
Se a empresa utiliza uma Intranet, s h uma verso disponvel para cada documento, e ela
est na Intranet. Se for necessrio atualizar a verso para uma mais recente, basta trocar a
107

nica verso disponvel no servidor Web. Assim, todos colaboradores estaro consultando a
mesma verso e ela ser a mais atual com certeza.

Um problema que pode surgir o seguinte: antes, as empresas viviam no paradigma
"imprimir-distribuir", ou seja, imprimiam diversas cpias de documentos impressos e as
distribuam fisicamente entre os setores. Com a Intranet, o perigo agora o paradigma
"distribuir-imprimir": cada um imprime a sua verso a partir do documento que est
centralizado na Intranet. Isto pode at aumentar os gastos com papis e toner de impressora,
se no houver controle de impresses.

Apesar das vrias vantagens, h alguns cuidados a serem tomados com o uso de Intranets.

custo de manuteno de contedos
O custo inicial da Intranet baixo. Porm, manter e atualizar os contedos faz aumentar este
custo em termos de trabalho humano. Imagina que haja um mural com a "fala do dia do
presidente da empresa". No incio, o presidente se empolga e tem sempre algo a dizer. Depois
de algum tempo, a criatividade pode diminuir ou o tempo do presidente ficar mais escasso, e
as novas postagens acabam tendo intervalos maiores (j no so mais todo dia). Depois de
algum tempo, talvez o presidente s consiga fazer uma postagem por ms. Isto desestimula a
leitura. As pessoas vo entrar no mural e ver a mesma mensagem por dias. Depois de algum
tempo, elas acreditam que no haver mais atualizaes e desistem de olhar o mural.

custo para organizar a Intranet
A Web catica por natureza, ou seja, cada um pode fazer uma pgina e divulg-la, e no h
padro de como devem ser as pginas Web. Isto significa que o volume de pginas na Intranet
pode crescer absurdamente, sem controle de volume e de padro. Cada setor vai querer fazer
sua pgina. Cada colaborador vai querer criar seu prprio contedo. O problema disto a
sobrecarga de informaes. Para encontrar algo na Intranet fica difcil e toma tempo. A, ser
necessrio criar um comit para organizar, padronizar, avaliar e autorizar postagens e pginas.

mudana de cultura
A Web acelera a vida das pessoas. Isto tambm acontece dentro das organizaes. A Web
dissemina a cultura do imediatismo. Antes um cliente mandava uma carta com reclamao
para uma empresa e esperava alguns dias pela resposta. Hoje, ele manda um e-mail e quer
uma resposta no dia seguinte. Internamente a mesma coisa. A gente manda um e-mail e se
nosso colega no responder no mesmo dia, usamos o telefone. Algumas empresas tiveram que
implantar uma regra para responder e-mails de clientes em 24 horas. Ou seja, dar um retorno,
no necessariamente uma soluo. A o que acontece so os vrios e-mails como por exemplo
"recebemos sua mensagem e estamos tratando do assunto". O que no ajuda e ainda pode
provocar a ira do cliente. Ento algumas empresas decidiram retirar o tal "fale conosco" de
seus sites.

navegao fora do contexto
Se a Intranet estiver conectada Internet, os colaboradores podem passar boa parte do tempo
navegando em pginas que no contribuem para seu trabalho. Ou mesmo, podem utilizar
ferramentas de conversao para assuntos extraordinrios. Calcula-se que hoje em dia seja
grande o nmero de horas desperdiadas, gerando baixa produtividade. Muitas empresas
procuram criar regras ou mesmo bloquear o uso de certos servios. Bloqueiam pginas ou
108

limitam pginas que podem ser acessadas, restringem horrios para leitura de e-mails,
bloqueiam chats e servios de mensagens instantneas. Isto pode ser ruim quando realmente
certas pginas precisam ser acessadas ou quando se precisa utilizar alguns servios
bloqueados ou limitados. Outras empresas fazem controles de acessos e uso de servios
(nmero de horas, pginas acessadas, servios utilizados), desestimulando o uso indevido.
Mas isto exige mais pessoas s para controlar outras pessoas. Uma sugesto tentar engajar
as pessoas neste nova cultura, dando liberdade mas ao mesmo tempo gerando
responsabilidades, e cobrando por resultados e objetivos cumpridos e no por hora trabalhada.

segurana se conectado Internet ou acessos indevidos
A Intranet da empresa pode conter informaes estratgicas para a empresa, que no devem
ser acessadas pelos concorrentes. A Intranet corre riscos de invases por pessoas no
autorizadas. Alm disto, alguns sistemas internos podem ser acessados a partir da Intranet
(como discutiremos nos Portais Corporativos) e a partir da pode-se chegar ao banco de dados
da empresa. Isto oferece tambm o perigo de danos aos dados. Sistemas de segurana
incluindo autenticaes, firewalls e antivrus so necessrios.


24 Sistemas de Extranet
Objetivo: criar uma conexo via Web entre dois pontos distantes (filiais ou empresa-parceiro)

Se uma empresa precisa conectar as redes internas de duas filiais, ela possui 3 opes bsicas:
a) contratar um link permanente entre as redes;
b) contratar uma empresa de EDI (electronic data interchange) para fazer isto por ela;
c) criar uma rede virtual privada (VPN) utilizando a Internet como meio.

No primeiro caso, o custo pode ser alto se o trfego entre as partes no for grande ou se no
for utilizado com frequncia. J o segundo caso otimiza o uso mas exige a contratao de um
terceiro, e a o custo pode tambm ser alto. A vantagem que a empresa terceira far a
compatibilidade entre as partes, se forem heterogneas.
A opo mais utilizada hoje em dia a terceira. Esta soluo tambm chamada de Extranet.
Funciona como uma Intranet, mas conecta partes distantes ou redes diferentes, usando a
Internet como canal e de forma segura. O custo bem mais baixo, pois s necessrio
conectar as partes Internet e depois o trfego tem custo zero pela Internet.
O cuidado com a segurana, pois dados privados estaro trafegando por um canal pblico.
Esquemas de criptografia asseguram esta privacidade.
As Extranets tambm so muito teis quando colaboradores utilizam seus prprios
computadores pessoais ou dispositivos mveis para acessar a rede da empresa. A isto se
chama consumerizao ou mais BYOD (bring your own device). De novo, o controle da
segurana no trfego de dados deve ser reforado. Mas neste caso, h a ainda o controle extra
de softwares instalados no equipamento do colaborador, para evitar acessos indevidos
proporcionados por malware.


109

25 Sistemas de Portais Corporativos
Objetivo: integrar todos os sistemas da empresa (Intranet, ERP, CRM, E-business, etc) num
mesmo ponto de acesso. Este ponto a Web (todos os sistemas tm a mesma cara web e
podem ser acessados atravs de um login nico pelo mesmo endereo Web).

Imagine um executivo em viagem precisando montar uma apresentao de ltima hora. E para
isto precisa acessar documentos em seu computador desktop, na sua sala, extrair relatrios do
sistema de ERP, acessar dados de clientes no CRM, recolher apresentaes anteriores
disponveis na Intranet da empresa e ainda trocar mensagens ou conversar com alguns
colaboradores. Normalmente, ele ter que saber o endereo ou nmero IP da mquina
servidora de cada sistema e ter que acessar cada sistema com um login prprio de cada
sistema. Certamente, a perda de tempo ser grande, mas o pior a acontecer seria se ele
esquece alguns dados de acesso.
A soluo ento criar um nico meio de acesso a todos os sistemas da empresa, chamado de
Portal Corporativo. O endereo ser nico (www.empresa.com.br) e a aps entrar neste Portal
Corporativo usando uma nica senha, poder acessar todos os sistemas a partir desta pgina
de entrada.
O Portal Corporativo deve ter permisses de acesso distintas para setores diferentes e nveis
hierrquicos distintos e ainda pode ter sees exclusivas para fornecedores e clientes.


26 Sistemas de E-business
Objetivo: fazer ou divulgar negcios na Web.

Toda empresa precisa estar presente na Internet. O primeiro passo criar um site institucional
(brochureware). Depois, vem o catlogo de produtos e/ou servios. O passo seguinte ento
poder vender pela Internet (tipo especfico de sistema, chamado de Comrcio Eletrnico e que
ser discutido a seguir).

Sistemas de E-business podem ainda suportar servios via Internet, tais como consultoria,
suporte a uso, atendimento a reclamaes de clientes, etc.

Ainda podemos classificar aqui os sistemas conhecidos como e-procurement e market place.
E-procurement ajuda empresas a encontrarem fornecedores, a divulgarem suas demandas e
finalizarem a compra de materiais e servios de fornecedores. Em geral, tal tipo de sistema
consiste num site (ou uma pgina no Portal Corporativo da empresa) onde a empresa coloca o
que precisa, podendo definir datas limites para receber as ofertas de fornecedores e at mesmo
definir o valor que est disposta a pagar. Os fornecedores podem cadastrar-se neste site e
depois cadastrar suas ofertas. Eles sero avisados quando novas demandas foram includas no
site pela empresa que procura fornecimento. O interessante que uma empresa coloca suas
demandas e vrias (outras) podem fazer ofertas.
J os market places so sites que renem vrias empresas que demandam produtos ou
servios e permite que vrias empresas faam ofertas. Portanto, difere do e-procurement
porque aqui a relao N:N). Em geral, os market places so feitos por domnio, rea ou
ramo. Por exemplo, h market places para supermercados e seus fornecedores, para empresas
que possuam escritrios e empresas fornecedoras de materiais para escritrios,
empreendedoras da construo civil e fornecedores de materiais de construo.
110

A combinao entre demandas e ofertas pode funcionar como leiles, descritos a seguir.

27 Sistemas de Comrcio Eletrnico
Objetivo: suporte a compra e venda pela Internet.

Este tipo de sistema um caso especial de sistema de E-business, especificamente quando h
comrcio (venda de produtos ou servios).
Os tipos de comrcio eletrnico so:
B2B (business-to-business): quando acontece entre empresas;
B2C (business-to-consumer): quando uma empresa vende para pessoas fsicas;
B2G (business-to-government): quando empresas vendem para o Governo;
C2C (consumer-to-consumer): quando pessoas fsicas vendem umas para as outras (como
no site Mercado Livre).
Mobile Commerce (m-commerce): quando a compra feita usando dispositivos mveis,
como tablets, celulares ou smartphones;
m-payment: quando o pagamento feito via dispositivos mveis, sem necessidade de
entrega de produtos fsicos; em geral, so utilizados para pagamento de servios; os
sistemas de m-payment so criados pelos vendedores em associao com instituies
financeiras;
Social Commerce: este tipo de comrcio refere-se a vendas feitas dentro de redes sociais.
O Facebook j est incorporando este tipo de comrcio no seu sistema nos EUA; nas redes
sociais, os usurios recebem ofertas e, se desejarem, j podem diretamente adquirir itens
dentro do site ou aplicativo da rede social, sem sair da rede (site ou aplicativo); por esta
razo tambm o Facebook lanou um celular cujo sistema principal seu aplicativo; o
dono do aparelho pode at fazer ligaes e utilizar outros servios, mas a tela principal (de
entrada e pano de fundo) o site do Facebook.

Um caso especial de Comrcio Eletrnico so os leiles. Nele, empresas ou pessoas fsicas
colocam produtos ou servios para venda. Interessados (pessoas ou empresas) do lances. O
melhor lance vence. Em geral, determinado um tempo para o leilo se encerrar ou ento a
cada novo lance, o contador zerado e segue a disputa at que no haja novo lance dentro de
um limite de tempo pr-determinado.
Os leiles incluem os oficiais do Governo pela Internet, os chamados preges eletrnicos.
H softwares que permitem a quem est vendendo gerenciar as ofertas. Por exemplo, pode-se
definir o valor de entrada (venda inicial) e depois limites e regras para subir ou diminuir este
valor. Se muitas ofertas forem recebidas, o software pode automaticamente aumentar o valor.
Se no houver lances, o valor de venda ser reduzido automaticamente.

Cuidados com Comrcio Eletrnico (CE)

O meio eletrnico s aceita Contratos Consensuais. Contratos solenes no so permitidos (ex:
compra e venda de bem imvel). O contrato feito pela Internet como contrato entre
presentes mas considerado um contrato de adeso (segundo Cdigo de Defesa do
Consumidor): contm clusulas estabelecidas unilateralmente pelo fornecedor, sem que o
consumidor possa discutir ou modificar. O Contrato eletrnico pode ser:
111

a) Indireto: Internet meio de promoo e oferta, mas entrega por meio fsico; funciona
como na venda por catlogo ou correio;
b) Direto: entrega por meio eletrnico (ex: baixar software).

A assinatura no contrato eletrnico fica dispensada se houver:
a) Mtodo eficaz de identificar as partes;
b) Mtodo confivel.

Os mtodos possveis para identificao das partes so:
a) Cdigo secreto;
b) Criptografia;
c) Biometria;
d) Senhas e assinatura digital;
e) Certificao e autenticao;
f) Esteganografia (com marca dgua).


Deve haver uma proposta e uma aceitao. A simples publicidade ou oferta ao pblico
considerada uma proposta de contrato, no sendo necessrio ento fazer proposta formal para
o cliente. A oferta deve conter:
a) Informaes corretas, claras, precisas, ostensivas e em lngua portuguesa;
b) Caractersticas, qualidades, prazos de validade e origem, riscos sade ou segurana
do consumidor.

Considera-se formado o contrato, quando a aceitao enviada (deve acontecer no prazo
marcado). Os contratos CLICKWRAP consideram aceitao apenas pelo click do mouse. Ao
receber a aceitao do cliente, a empresa deve comunicar o recebimento. Se houver atraso
(ex: chegar fora do prazo), deve-se comunicar imediatamente ao aceitante.

O site de CE deve estabelecer um procedimento para provar que o produto foi entregue.
Deve-se entregar no prazo anunciado no site. Se isto no ocorrer, h 3 alternativas:
a) entrega de produto equivalente;
b) desfazer transao (devoluo de valores com correo);
c) indenizao por perdas e danos.

Os contratos relativos ao CE devem ser armazenados em meio eletrnico para verificao
futura. Quando houver dvidas na interpretao de alguma clusula no contrato, ser tomada a
interpretao mais favorvel ao aderente (cliente).

O CE regido pelo Cdigo de Defesa do Consumidor. E por tal, pode haver desistncia do
cliente em 7 dias, a partir da assinatura ou do recebimento da mercadoria. O site de CE deve
estabelecer um DISCLAIMER, contendo iseno de responsabilidades do fornecedor. E
tambm fica obrigado a estabelecer um setor para atendimento aos clientes (SAC).


28 Sistemas de Informaes Pervasivos e Ubquos
Objetivo: disponibilizar acesso a informaes em qualquer hora e lugar, de modo invisvel.
112


A pervasividade a caracterstica de a tecnologia estar presente em todo lugar, sem ser
notada. Ela invisvel no sentido de que o usurio no precisa se dar conta que a tecnologia
existe ou que est usando tecnologias. Ela pode estar embutida nos mais diversos dispositivos
incluindo o celular, a prpria roupa, qualquer acessrio como o relgio ou culos e at mesmo
o nosso corpo.
J a ubiquidade (computao ubqua) tem a ver com a possibilidade de termos acesso s
informaes, independente da nossa localizao (anytime anywhere).
A Figura 69 apresenta um exemplo de uso de sistemas deste tipo para a rea mdica ou
hospitalar. Na figura podemos ver uma pessoa (pode ser um mdico) num estdio recebendo
no seu celular informaes coletadas por sensores localizados junto a pacientes num hospital.
Ou ento, um mdico num trem, usando seu tablet para acessar imagens de exames de
pacientes. Estes dados podem estar armazenados nas nuvens e no no prprio prdio do
hospital. Do outro lado, uma TV recebe vdeos atravs de sinais wireless. O celular do
primeiro mdico se comunica com o tablet do segundo e trocam informaes via bluetooth.
Abaixo, uma cena j mais antiga, um administrador do hospital acessando relatrios a partir
de um computador na sua casa ou escritrio.



Figura 69: Esquema exemplo de sistemas pervasivos e ubquos

A seguir, so discutidas algumas caractersticas dos sistemas pervasivos e ubquos.

113

heterogeneidade
Este tipo de sistema deve integrar dispositivos de todas as naturezas, sistemas operacionais
dos mais variados tipos e tecnologias antigas e tambm as mais modernas.

mobilidade
Esta a caracterstica principal. Hoje em dia as pessoas usam dispositivos mveis para tudo,
em todo lugar e a qualquer hora. Com os diferentes tipos de conexes wireless (wifi, 3G/4G,
bluetooth), tais dispositivos esto conectados 24/7 (24 horas por dia, 7 dias da semana).

redes P2P (pier-to-pier)
Em contraposio s redes cliente-servidor, as redes P2P permitem que um mesmo
dispositivo possa pedir uma informao (ser cliente) e em outro momento fornecer
informaes (ser servidor). No exemplo da figura, o tablet do mdico no trem cliente ao
solicitar exames armazenados no hospital, mas tambm pode repassar tais dados ao celular do
mdico no estdio. Este ltima no precisa acessar o servidor do hospital ou talvez at no
tenho conexo para isto; ento por que no se pode pegar a informao do local mais fcil ?

Near Field Communication
Tecnologias deste tipo (como bluetooth, por exemplo), permitem a troca de dados entre
dispositivos que estejam prximos. Basta ligar a funo, e um dispositivo pode encontrar
outros. Aps o pareamento entre eles, com uso de senhas para permisses, a troca de dados
pode ser feito em ambos os sentidos.

disponibilidade de informaes
Os Administradores de Bancos de Dados (DBAs) devem preocupar-se com a tolerncia a
falhas. Os dados devem estar disponveis 24/7 para qualquer tipo de dispositivo ou sistema
operacional.

troca de informaes no padronizadas
Neste sentido, os dados podem estar armazenados em formatos e modelos diferentes, devido
heterogeneidade dos hardwares e softwares sendo utilizados. A troca de informaes pode ser
feita por arquivos XML, que so arquivos texto mas com marcas de significado. Estas marcas
so evolues das marcas HTML, que eram somente para definir a forma de apresentao das
informaes. As marcas XML definem do que se tratam os dados, para que possam ser
entendidos pelos sistemas automticos. Assim, se quisermos passar o nome de um paciente
usaremos uma marca tipo <nome_do_paciente> Jos da Silva </nome_do_paciente>. Os
dados tambm podem ser cambiados via Web Services. A troca aqui neste caso mais
complexa. Um Web Service, como o nome diz, permite que um sistema acesse servios de
outro sistema. Por exemplo, as APIs do Google Maps, para que outros sistemas podem
recuperar mapas do Google, so exemplos de Web Services. Neste caso, h parmetros de
entrada e informaes na forma de resultados. portanto necessrio conhecer tais parmetros,
alm do endereo do Web Service.

conscincia de contexto
Este tipo de caracterstica permite que os sistemas possam entender o contexto do usurio. Por
contexto, entende-se: o tipo de dispositivo (hardware e software) do usurio, a configurao
da conexo (tamanho da banda, tipo), o local (geogrfico e semntico) em que se encontra o
usurio, o horrio local, as condies climticas, etc. Por exemplo, o sistema descrito na
114

Figura 69 pode reconhecer o tipo de celular utilizado pelo primeiro mdico (incluindo
hardware e software), identificar que ele est num estdio de futebol e que naquele momento
j um jogo em andamento, reconhecer que h outros dispositivos prximos e os tipos de
conexes disponveis.

adaptao
A caracterstica de adaptao complementa a caracterstica anterior. importante reconhecer
o contexto do usurio para fornecer a informao na medida certa. Assim, as imagens devem
ser apresentadas no dispositivo destino conforme o tamanho de tela, resoluo e nmero de
cores. Se o ambiente local barulhento (identificado por inferncia ou por sensores), as
mensagens importantes e os alertas para o usurio devem ser comunicadas de uma forma que
ele oua. Por outro lado, se ele estiver numa Igreja, talvez a forma de comunicao deva ser
outra. Se um usurio pede para ser informado a cada incio de dia, das principais notcias
locais, o sistema deve reconhecer a posio geogrfica e o fuso horrio onde a pessoa est, e
tambm coletar as notcias dos sites de empresas jornalsticas deste local. E ainda deve saber
se o usurio sabe ler na lngua local, caso contrrio deve traduzir as notcias. A adaptao
ainda pode reconhecer o estado fsico e emocional do usurio, incluindo temperatura,
batimentos cardacos, etc.

sensores para coleta automtica de dados
Hoje em dia a tecnologia evoluiu para que possamos ter diferentes tipos de sensores para
coleta de dados de forma automtica (sem interveno humana). H sensores de
luminosidade, umidade, movimento e presena (se houve movimento num local ou se algum
est ali presente), GPS, sensor de nvel, bssola, etc.

agentes inteligentes
Quando um usurio solicita uma informao, ele no deve ter que dizer onde est a
informao. responsabilidade do sistema pervasivo e ubquo localizar a informao e faz-
la chegar onde est o solicitante e no seu dispositivo. Para isto, deve haver softwares
inteligentes que tenham capacidade para entender o que a pessoa quer e depois poder localizar
tal informao na rede de dispositivos conectados.

comunidades de agentes (sistemas multiagente)
Estes agentes inteligentes podem trocar informaes sem que as pessoas precisem intervir ou
mesmo ficar sabendo. Eles trocam informaes para localizar respostas a questionamentos
dos usurios que eles representam. Podem at mesmo repassar as solicitaes para outros
agentes, formando uma rede inteligente. Em casos mais evoludos, podem at mesmo
negociar entre si, dados parmetros fornecidos pelos usurios. Deste forma, num futuro breve,
quando uma pessoa quiser comprar algo, simplesmente dever informar seu agente
inteligente. Este ir comunicar-se com outros agentes procura de algum que tenha
informado seu agente que deseja vender algo. Com algumas regras bsicas, os agentes podem
negociar preos e fechar a venda, sem interveno humana. Para isto, sero necessrios
protocolos de cooperao e troca, e recursos inteligentes para negociao.

contedos nas nuvens (cloud computing)
O armazenamento de dados nas nuvens libera empresas de terem que ter uma grande
infraestrutura para armazenamento; basta computadores ou dispositivos mveis conectados
115

Internet. A questo de desempenho e segurana fica a cargo do fornecedor do servio. E
poderemos acessar os dados de qualquer lugar no planeta.

Internet das coisas (Internet of Things)
Fabricantes j esto incorporando tecnologias para que cada mquina tenha um nmero IP que
a identifique e recursos para conexes na Internet. Desta forma, um eletrodomstico qualquer
poder ser acessado via Internet e reprogramado. Itens como TVs, geladeiras, ar-
condicionados, rdios de automveis, relgios, cmeras sero todos dotados destas
caractersticas. E estaro tambm se conectando de forma inteligente, atravs de agentes
inteligentes. Esta a chamada Internet das Coisas.


29 Sistemas de Business Intelligence
Objetivo: encontrar melhores prticas (best practices) e problemas (causas ou ms prticas)
atravs da anlise profunda de dados.

O melhor exemplo para explicar o que Business Intelligence (BI) o caso da GM e o
sorvete de baunilha. Conta a lenda que um consumidor comprou um carro da GM e depois
mandou uma carta se queixando. A queixa era a seguinte: quando ele ia na sorveteira e pegava
o sorvete de baunilha, ele voltava para o carro e este demorava a dar partida; se ele pegasse
qualquer outro sabor de sorvete, ele voltava para o carro e este "pegava" de primeira.
Conta ainda a lenda que isto virou piada na GM, uma vez que ningum imaginava o
que o sabor de um sorvete teria a ver com o problema no carro. Acredita-se que um
engenheiro foi investigar o caso. Apresentou-se ao cliente e juntos foram testar a teoria que o
cliente alegava. Foram at a sorveteria e compraram o sorvete de baunilha. Voltaram para o
carro e realmente o carro no deu partida na primeira tentativa nem nas seguintes. Esperaram
um pouco, e tentaram de novo. A sim o carro ligou. Voltaram para a casa e depois de
comerem o sorvete fizeram o mesmo teste s que pegando um sorvete de sabor diferente.
Quando voltaram para o carro, a surpresa: o carro "pegou" de primeira. Bom, mas poderia ser
acaso ou coincidncia. Ento testaram diversas vezes, usando mtodos estatsticos e o
resultado ... sempre o mesmo.
O engenheiro sabia que o sabor do sorvete no poderia influenciar o problema, mas
certamente ali havia algum fator que estaria associado ao problema. E este fator tinha a ver
com o sabor. Ento ele descobriu que o sorvete de baunilha ficava na entrada da sorveteria,
enquanto que os demais ficavam nos fundos. Ao entrar e comprar o sorvete de baunilha, o
dono do carro demorava menos que se pegasse outro sabor. Havia uma pea no carro que
precisava resfriar para o carro poder ligar. Menos tempo na sorveteria, menos tempo para a
pea resfriar e o carro no ligava. Desta forma, o engenheiro descobriu a causa para o
problema.
Eu sempre cito isto como um exemplo de BI, mesmo tendo sido feito manualmente,
isto , sem ajuda de bancos de dados e software (tecnologias da informao). Mas este caso
ilustra bem o objetivo de um processo de BI e como ele pode ser feito, no s para leigos mas
tambm para analistas de BI experientes.
Em resumo, o processo de BI tem por objetivo encontrar causas ou explicaes para
eventos ou resultados. E estes resultados podem ser bons ou ruins, ou seja, o BI deve procurar
causas dos problemas e as melhores prticas do sucesso. No basta saber qual o problema
mais comum em mquinas de uma indstria; a empresa precisa saber o porqu disto, para
116

poder atacar as causas e diminuir os prejuzos. No basta saber qual o melhor vendedor, a
empresa precisa saber por que ele o melhor, para que as tais boas prticas deste vendedor
possam ser replicadas para todos os outros vendedores. No basta saber qual o produto mais
vendido e em que poca sai mais, queremos saber o porqu, para repetir as melhores prticas
em outros produtos ou aumentar as vendas em pocas de baixa.

Big Data - BI preciso

Estamos vivendo numa era de grandes volumes de informaes. O volume de informaes
medido em exabytes. A escala assim: bit, byte, kylobyte, megaybte, gigabyte, terabyte,
petabyte, exabyte, zettabyte, yottabyte.
Chamam isto de Big Data, mas anos atrs Korth e Silberschatz j falavam sobre isto e
chamavam esta nova revoluo de "exploso de informaes". Sim eles comparavam estes
novos acontecimentos a revolues como a inveno da imprensa por Gutenberg (distribuio
de informaes a todo canto do mundo) e inveno do telefone por Graham Bell (informao
distribuda imediatamente, em tempo real).
O volume aumenta a cada ano pelas seguintes razes:
o armazenamento de dados hoje barato (discos rgidos e DVDs) ou mesmo de graa
(servios de hospedagem free na Web);
as pessoas esto mais familiarizadas com a tecnologia e consequentemente geram e
armazenam mais informaes (crianas de 2 anos j sabem usar celulares e computadores
e a 3a idade est menos tecnofbica);
a tendncia atual de "no jogar nada fora", que comeou com o Gmail dizendo que
ningum precisava "deletar' seus e-mails;
mais possibilidades de servios para publicar e difundir informaes (blogs, twitter, e-
mail, redes globais, conexes sem fio, etc.).

A Revista Veja, edio de maio de 2013 (ed.2321, n.20, ano 46) tratou deste assunto na sua
reportagem de capa. Eles falam que o Big Data se deve a 3 Vs: volume, velocidade e
variedade. Alm do grande volume de dados gerados, coletados, armazenados, etc, a
velocidade de transmisso (banda larga por cabo ou 3G ou wifi etc.) e a diversidade de tipos
de informaes (planilhas, textos, imagens, sons) ajudam a sobrecarregar o ser humano e as
organizaes.

Empresas no podem mais viver sem BI. De nada adianta armazenar grandes quantidades de
dados e no saber utiliz-los ou no poder tirar vantagens deles. Em geral, estes dados so
teis para as tarefas do dia a dia (nvel operacional). Agora eles precisam servir aos nveis
ttico e estratgico, apoiando decises.


BI X Sistemas Gerenciais

Hoje em dia, BI confundido com as aplicaes que geram relatrios, chamadas h
muito tempo de Sistemas de Informaes Gerenciais - SIGs (em ingls, Management
Information Systems - MIS). SIGs e EIS (Executive Information Systems) geram relatrios,
geralmente grficos, sintetizando informaes ou permitindo compar-las. Eles geram
informaes novas, que no estavam explcitas na base de dados, ou permitem visualizar as
informaes de tal forma que o usurio do sistema descubra rpida
Como exemplos, temos relatrios que apontam os produtos mais vendidos ou mais lucrativos,
melhores vendedores ou lojas com melhores resultados, poca em que cada produto sai mais
ou menos (vendas ao longo do tempo) e etc.
Tais sistemas so h muito tempo importantes para as empresas. Entretanto, o BI deve
ir mais fundo que os SIGs, seu papel mais nobre. O processo de BI deve ajudar as pessoas a
descobrirem as causas para tais acontecimentos ou descobertas. Assim, o SIG aponta qu
produto mais vendido, mas o BI deve procurar descobrir porque este produto mais vendido
que os outros ou porque os outros no vendem to bem. O SIG aponta a poca em que um
produto vende mais, j o BI busca saber por que o produto vende mais nesta
nas outras.
Em resumo, SIGs ajudam a entender o que est acontecendo (ex.: totais de venda no
ms anterior, qual a taxa de crescimento de nossas vendas); BI procura por causas ou
explicaes (ex.: por que as vendas esto caindo).
BI e SIG muitas vezes se confundem porque os sistemas de BI tambm apresentam
relatrios, geralmente grficos. Pode
tipos de sistemas, menos evoludos. Por isto, um sistema completo de BI ter funcionalidades
de sistemas SIG, Data Mining, geogrficos (mapas) e poder extrair dados de outros sistemas
tais como ERP, CRM, Database marketing, Data warehouse, etc. A
imagens dos chamados "dashboards", que so painis que apresentam os relatrios em vrios
formatos. A rea de visualizao de informaes evoluiu muito e hoje temos diferentes tipos
de grficos para auxiliar administradores.


Figura


Ferramentas para BI - Anlise OLAP

BI um processo. Existem tcnicas, tecnologias e software para BI, mas BI um
processo que envolve mtodos, tcnicas, tecnologias, pessoas, informaes, fontes de
informaes, mtricas, ferramentas, etc.
117
informaes novas, que no estavam explcitas na base de dados, ou permitem visualizar as
informaes de tal forma que o usurio do sistema descubra rpida e facilmente algo novo.
Como exemplos, temos relatrios que apontam os produtos mais vendidos ou mais lucrativos,
melhores vendedores ou lojas com melhores resultados, poca em que cada produto sai mais
ou menos (vendas ao longo do tempo) e etc.
stemas so h muito tempo importantes para as empresas. Entretanto, o BI deve
ir mais fundo que os SIGs, seu papel mais nobre. O processo de BI deve ajudar as pessoas a
descobrirem as causas para tais acontecimentos ou descobertas. Assim, o SIG aponta qu
produto mais vendido, mas o BI deve procurar descobrir porque este produto mais vendido
que os outros ou porque os outros no vendem to bem. O SIG aponta a poca em que um
produto vende mais, j o BI busca saber por que o produto vende mais nesta
Em resumo, SIGs ajudam a entender o que est acontecendo (ex.: totais de venda no
ms anterior, qual a taxa de crescimento de nossas vendas); BI procura por causas ou
explicaes (ex.: por que as vendas esto caindo).
uitas vezes se confundem porque os sistemas de BI tambm apresentam
relatrios, geralmente grficos. Pode-se dizer que sistemas de BI fazem uso de diversos outros
tipos de sistemas, menos evoludos. Por isto, um sistema completo de BI ter funcionalidades
de sistemas SIG, Data Mining, geogrficos (mapas) e poder extrair dados de outros sistemas
tais como ERP, CRM, Database marketing, Data warehouse, etc. A Figura
imagens dos chamados "dashboards", que so painis que apresentam os relatrios em vrios
formatos. A rea de visualizao de informaes evoluiu muito e hoje temos diferentes tipos
de grficos para auxiliar administradores.
Figura 70: Exemplos de dashboards
Anlise OLAP
BI um processo. Existem tcnicas, tecnologias e software para BI, mas BI um
processo que envolve mtodos, tcnicas, tecnologias, pessoas, informaes, fontes de
informaes, mtricas, ferramentas, etc.
informaes novas, que no estavam explcitas na base de dados, ou permitem visualizar as
e facilmente algo novo.
Como exemplos, temos relatrios que apontam os produtos mais vendidos ou mais lucrativos,
melhores vendedores ou lojas com melhores resultados, poca em que cada produto sai mais
stemas so h muito tempo importantes para as empresas. Entretanto, o BI deve
ir mais fundo que os SIGs, seu papel mais nobre. O processo de BI deve ajudar as pessoas a
descobrirem as causas para tais acontecimentos ou descobertas. Assim, o SIG aponta qual o
produto mais vendido, mas o BI deve procurar descobrir porque este produto mais vendido
que os outros ou porque os outros no vendem to bem. O SIG aponta a poca em que um
produto vende mais, j o BI busca saber por que o produto vende mais nesta poca e menos
Em resumo, SIGs ajudam a entender o que est acontecendo (ex.: totais de venda no
ms anterior, qual a taxa de crescimento de nossas vendas); BI procura por causas ou
uitas vezes se confundem porque os sistemas de BI tambm apresentam
se dizer que sistemas de BI fazem uso de diversos outros
tipos de sistemas, menos evoludos. Por isto, um sistema completo de BI ter funcionalidades
de sistemas SIG, Data Mining, geogrficos (mapas) e poder extrair dados de outros sistemas
Figura 70 apresenta
imagens dos chamados "dashboards", que so painis que apresentam os relatrios em vrios
formatos. A rea de visualizao de informaes evoluiu muito e hoje temos diferentes tipos

BI um processo. Existem tcnicas, tecnologias e software para BI, mas BI um
processo que envolve mtodos, tcnicas, tecnologias, pessoas, informaes, fontes de
118

BI pode fazer uso de ferramentas de Data Mining (j discutidas no captulo 18).
Entretanto, a principal ferramenta de BI, a qual inclusive se confunde com BI so as de
anlise multidimensional ou OLAP ou cbica. A maioria dos vendedores quando dizem que
vendem software de BI, na verdade querem dizer que vendem este tipo de ferramenta.

Por exemplo, se tivermos uma base de dados sobre falhas que ocorreram em mquinas numa
empresa, provavelmente a estrutura ser similar que pode ser vista na Figura 71, onde todos
os atributos das falhas esto como colunas: identificao da mquina, setor onde ocorreu a
falha, quem era o operado no momento da falha, data e hora da ocorrncia, tipo de problema
que ocorreu, quantas horas a mquina ficou parada devido falha, custo por hora da mquina
parada e prejuzo total que a falha gerou, multiplicando-se as horas paradas pelo custo-hora.
Neste tipo de estrutura, fica difcil verificar quais os problemas que mais ocorrem com cada
mquina, qual o total de falhas por operador, etc., especialmente se so muitas falhas (muitas
linhas ou registros).



Figura 71: Estrutura de dados flat - todos atributos como colunas

Por isto, uma estrutura como a apresentada na Figura 72, permite mais rapidamente verificar
padres. Nesta estruturada os dados esto organizados em formato multidimensional
(matrizes); os atributos podem aparecer como linhas ou colunas. Isto permite relacionar
atributos entre si e encontrar padres que no podem ser verificados nas estruturas
unidimensionais (tipo "flat"). Tal estrutura tambm conhecida como "cubo", pois dados em
3 dimenses teriam uma aparncia semelhante a um cubo. Da tambm o termo "dados
cbicos".

A vantagem da anlise multidimensional acelerar as anlises e dar respostas mais
rapidamente para usurios que tomam decises. Alm disto, a visualizao de dados em duas
ou mais dimenses ajuda a ver padres que so difceis de identificar em tabelas normalizadas
(flat).

No exemplo da Figura 72, estamos relacionando duas dimenses: identificao da mquina
(nas linhas) X tipo de problema (nas colunas). Na figura, podemos ver o total de falhas para
119

cada mquina (ltima coluna direita), o total de falhas por tipo de problema (ltima linha) e
a quantidade de falhas para cada par mquina X tipo de problema. Por exemplo, pode-se notar
que ocorreram 51 registros no entroncamento da linha da "empilhadeira" com a coluna de
"falta peas", indicando que a mquina Empilhadeira teve 51 falhas por falta de peas.
Rapidamente tambm podemos notar qual o tipo de problema mais comum relacionado a cada
mquina.



Figura 72: Estrutura multidimensional - mquina X tipo de problema


Na Figura 73, estamos relacionando o operador com a hora em que a falha ocorreu. Aqui a
estrutura multidimensional permite visualizar que as falhas com o operador Beltro s
ocorrem s 9h da manh e que o operador Rudinei s teve falhas no incio do dia (entre 7 e 8h
da manh). Tambm pode-se notar que as falhas com o operador Joo Maria ocorrem mais
frequentemente de manh, enquanto que para Menezes e Otto as falhas so mais frequentes
tarde. A estrutura multidimensional tambm d uma viso diferenciada das falhas que
ocorreram com o operador Jos Carlos: elas ocorrem em ambos os turnos, mas acontecem
mais no incio dos turnos. Este tipo de anlise no poderia ser feita com dados na estrutura
flat.




Figura 73: Estrutura multidimensional - operador X hora em que ocorreu a falha


Para o caso de ser necessrio analisar mais de 2 dimenses, j que as telas de computadores
ainda no permitem visualizar dados em 3D, deve-se utilizar uma visualizao 2D adaptada,
como mostra a Figura 74, onde se pode ver que h 3 dimenses relacionadas: operador, tipo
de problema e hora. Note que as dimenses (ou atributos) operador e tipo de problema foram
colocados nas linhas, formando uma hierarquia.
A anlise OLAP tambm pode ser feita com uma dimenso somente, como no caso da Figura
75, onde h somente o atributo "tipo de problema" e a anlise feita pela soma de horas
paradas.


120


Figura 74: Estrutura multidimensional - mquina + tipo de problema X hora



Figura 75: Anlise OLAP com somente uma dimenso

As operaes OLAP podem ser classificadas como segue:
Slice (fatia): a extrao de informaes sumarizadas de um cubo de dados, a partir de
uma dimenso, como na Figura 75, ou por exemplo saber "qual o problema mais comum
com a empilhadeira";
Dice (dado): a extrao de um "subcubo" ou a interseo de vrios slices, como na
Figura 72;
Pivot (pivoteamento): o ngulo pelo qual os dados so vistos e corresponde a alteraes
de posio das dimenses numa tabela multidimensional, como a troca de linhas por
colunas;
Drill Down ou Roll Down: a possibilidade de se obter dados mais detalhados a partir de
dados de mais alto nvel, diminuindo o nvel de detalhe (aumentando a granularidade na
hierarquia de dados), como na Erro! Fonte de referncia no encontrada., onde as
falhas dos operadores foram divididas por tipo de problema; tambm seria o caso de
verificar uma base de vendas por loja ou vendedor, ao invs de totais por cidades ou
pases;
121

Drill up ou roll up: a operao inversa de drill down, ou seja, seria apresentar os dados
em um nvel mais elevado (menos granularidade); por exemplo, vindo de vendas por
vendedor ou loja e indo para totais por cidade, estado e pas.


30 Sistemas de Inteligncia Competitiva
Objetivo: monitorar concorrentes e o mercado, atravs de coleta e anlise de dados externos
Organizao.

Enquanto BI analisa dados internos, sistemas de Inteligncia Competitiva (IC) buscam dados
fora da empresa para apoiar decises. BI permite analisar dados de produo, vendas,
estoques, recursos humanos e financeiros. Mas tambm importante para uma empresa estar
ciente de seu papel perante a Sociedade e sua posio em relao aos concorrentes. E tambm
crucial tentar antecipar o que vai acontecer com o mercado, para que a empresa se prepare e
faa as mudanas necessrias em tempo hbil. Por isto, os sistemas de IC so to importantes.
A anlise de dados externos permitir empresa gerar vantagens competitivas que a
coloquem frente dos competidores ou mesmo frente do seu tempo (atravs de melhores
produtos ou servios, melhores preos ou formas de distribuio, melhor atendimento a
clientes e inovaes).


Os objetivos da IC podem ser resumidos nas seguintes aes:
monitorar o mercado e os concorrentes;
descobrir concorrentes novos ou potenciais;
analisar as estratgias dos concorrentes e compar-las com as da empresa;
antecipar as aes dos concorrentes e mudanas no mercado.

Quando falamos de mercado, temos que entender que mercado no s composto pelos
competidores ou concorrentes (players). O mercado ainda inclui: fornecedores, clientes, a
Sociedade (com usa cultura, religies, etc.), a economia (micro ou macro, local, nacional ou
global), a poltica, o governo (e suas leis, incentivos, etc.), a natureza (clima, geografia, etc.) e
as tendncias tecnolgicas.


As perguntas-chave a serem respondidas pelo processo de IC:
Quem so os players ?
Quais os produtos ou servios similares ?
Quais as estratgias dos concorrentes ? (servios adicionais, localizao, distribuio,
promoes, reas e montantes de investimentos, aquisies e fuses)
Quais as mudanas de estratgias ? (preos, produtos novos, produtos descontinuados,
posicionamento fsico)
O que est acontecendo ou pode acontecer com o mercado ? (diviso do market share,
entrada de novos players)
Quem est crescendo, quem est perdendo fora, e por qu ?
Que tecnologias ou inovaes esto surgindo ou podem surgir para afetar o mercado ?
O que o mercado acha de ns ? O que esto falando? Bem ou mal ?
122



As etapas do processo de IC:
1. Identificao das necessidades de informao;
2. Coleta das informaes;
3. Anlise das informaes;
4. Disseminao;
5. Avaliao do processo.


Para a Sociedade do Profissional de Inteligncia Competitiva - SCIP (2005), Inteligncia
Competitiva (IC) um programa tico e sistemtico de coleta, anlise e gerenciamento de
informaes externas que podem afetar os planos, decises e operaes da empresa. O
surgimento da inteligncia competitiva se deu com o fim da guerra fria, quando os espies
ficaram desempregados e perceberam que utilizar suas habilidades de coletar e tratar
informaes, agora de forma tica e legal, daria s organizaes uma forte vantagem
competitiva (GOMES & BRAGA, 2004).
Entretanto, IC no espionagem. Ela utiliza fontes pblicas de informaes e faz coleta tica
de dados.

Seguem algumas fontes de informaes que podem ser usadas para IC:
notcias;
publicidade em geral;
folders e manuais de produtos e servios concorrentes;
congressos e feiras;
eventos em pblico;
bases de patentes;
cadastros de associaes (Sebrae, associaes comerciais ou empresariais, CDL).

Os tipos de informaes usadas em IC podem ser classificadas conforme abaixo:
internas (coletadas dentro da empresa) X externas (coletadas no mercado);
estratgicas, tticas ou operacionais;
primrias (direto da fonte; ex.: ouvir um diretor concorrente dizer) X secundrias (ex.:
algum dizer que o diretor disse);
formais (em documentos, por exemplo) X informais (por via oral);
impressas X Web X rdio X TV.

Pequenas empresas tambm podem fazer IC. H ferramentas de baixo custo ou grtis, de fcil
acesso e que possuem uma certa confiabilidade. A Web, por exemplo, contm a maioria das
fontes citadas anteriormente. Segundo o IBGE, a Internet passou a ser usada por 46% das
empresas como fonte de informaes para decises sobre a inovao de produtos e processos
produtivos (em relao aos 33,1% de 2000).

A Web possui as seguintes fontes de Informaes:
Sites de Concorrentes;
Bases de Patentes;
Notcias;
Comunidades e redes sociais;
123

Sites de reclamaes;
Mecanismos de busca;
Blogs, fruns de discusso, comentrios;
Site especficos (portais verticais);
Congressos, feiras, divulgaes.

Tcnicas e Ferramentas para Inteligncia Competitiva

A seguir so descritas algumas tcnicas e ferramentas para auxiliar processos de IC.


Anlise SWOT (ou FOFA)
O objetivo avaliar os pontos fortes e fracos da empresa, tanto internamente quanto
externamente, conforme Figura 76. A parte externa relativa a IC.


Figura 76: Anlise SWOT


Otimizao de Mecanismos de Busca
Hoje em dia, importante para as empresas aparecerem nos resultados de mecanismos de
busca. Isto pode elevar as vendas em um percentual bem alto.
Para isto, h especialista em SEO (Search Engine Optimization), que entendem o
funcionamento dos algoritmos de busca e utilizam tcnicas para posicionar certas pginas no
topo de resultados para buscas com certas palavras-chave.
Para aparecer no topo, pode-se pagar (links patrocinados) ou utilizar tcnicas de SEO para
aparecer nos chamados resultados orgnicos.
Segundo pesquisas, as pginas que aparecem nas 3 primeiras posies do resultado, possuem
100% de visibilidade (ou seja, so vistas por todos os usurios). Nas demais posies, a
visibilidade vai caindo (4 = 85%, 5 = 60%, 6 e 7 = 50%, 8 e 9 = 30%, 10 = 20%). Mesmo os
links patrocinados no conseguem to boa visibilidade quanto os 3 primeiros nos resultados
orgnicos (links patrocinados: posio 1 = 50% de visibilidade, posio 2 = 40%, posio 3 =
30%).

INTERNO EXTERNO
PONTOS
FORTES
Foras
(Strenghts)
Oportunidades
(Opportunities)
PONTOS
FRACOS
Fraquezas
(Weaknesses)
Ameaas
(Threats)
124

Para aparecer no topo dos resultados para uma dada palavra, uma pgina (URL) deve:

conter esta palavra no nome do domnio ou URL;
conter esta palavra com alta frequncia;
conter esta palavra em negrito;
conter esta palavra no ttulo e subttulos (tags de html);
conter esta palavra em maisculas;
conter esta palavra nas metatags "subject", "keywords" e "description";
conter esta palavra nas primeiras linhas do texto da pgina;
ter uma data de atualizao recente.

Abaixo, seguem exemplos de metatags:

<meta name="keywords" content="livraria livros cd cds dvd dvds blu-ray
informatica computador notebook netbook mp3 player pen drive tv lcd led televisao
dvd player gps camera digital games ps2 ps3 playstation celular papelaria materiais
escolares moda bebes perfume beleza saude fitness geladeira grill ud instrumentos
musicais ferramentas automotivo harry potter camisas times filmadora ar-
condicionado submarino.com.br" />

<meta name="description" content="Loja online com os melhores livros, DVDs,
Blu-ray, eletrnicos, TVs LCD, notebooks, celulares, cmeras, eletrodomsticos,
perfumes e produtos de qualidade para voc. " />

Alm disto acima, o Google tambm verifica quem est apontando para quem, e coloca no
topo as autoridades (pginas mais apontadas) e os hubs (pginas que apontam para
autoridades). Isto funciona como uma votao, onde os links de uma pgina para outra
indicam uma recomendao ou confiana. Somente apontamentos (links) entre domnios
diferentes so considerados. Este o famoso algoritmo PageRank.

claro que muitos tentam usar trapaas, mas os algoritmos como o do Google j utilizam
punies. No adianta repetir palavras sem nexo, colocar tudo em maisculas ou negrito,
colocar nas metatags palavras que no aparecem no texto e no adiantar criar domnios s
para apontar se neles no houver textos coerentes.

H tambm a rea de SEM (Search Engine Marketing), que procura analisar os resultados dos
mecanismos de busca para entender o mercado. Para tanto, importante verificar a posio da
empresa e de seus concorrentes em mecanismos no Google, Bing e Yahoo, verificar quem o
1o no ranking, comparar os termos usados pela empresa e por seus concorrentes para estarem
no topo, analisar os termos presentes no site da empresa e nos sites dos concorrentes.

Esta rea busca definir quais as melhores palavras para posicionamento. Por exemplo, para
um hotel em Nova Petrpolis, a expresso "hotel em nova petrpolis" a mais adequada, mas
tambm a pgina pode contar palavras como "pousada" e "gramado", para atrair usurios que
utilizam outros tipos de termos.


125

Google Trends
Este servio do Google apresenta os temas mais procurados por dia, podendo-se filtrar por
pas ou lngua.
Mas o mais interessante poder comparar o grau de interesse em diversos temas. A Figura 77
apresenta o grfico de interesse das pessoas por "gripe A" e por "dengue" (pelo nmero de
buscas no Google com cada termo). Pode-se notar que h mais interesse em Dengue que em
Gripe A (isto para o Brasil todo). J na Figura 78, temos o grfico de interesse (buscas) para
pesquisas feitas a partir do Rio Grande do Sul, no mesmo perodo. Podemos notar que os
interesses se invertem em alguns casos, formando ondas de interesse, sendo que na poca de
inverno o interesse por gripe A maior.




Figura 77: Google Trends sobre Gripe A e Dengue no Brasil



Figura 78: Google Trends sobre Gripe A e Dengue no Rio Grande do Sul

Para IC, esta ferramenta pode ser til para comparar interesse da populao por produtos ou
servios. Na Figura 79, podemos ver os resultados para buscas com "ipad", "tablet samsung
galaxy" e "tablet samsung". Notem o maior interesse no produto da Apple (isto para Brasil). E
vejam que as duas expresses relativas ao produto da Samsung possuem quantidades de
buscas diferentes, evidenciando que h uma certa preferncia dos usurios pelo termo mais
genrico (sem a palavra "galaxy"), o que pode significar que as pessoas no sabem o nome do
tablet da Samsung.


126


Figura 79: Google Trends comparando Ipad com Tablet Samsung



Website Grader
Esta ferramenta (http://websitegrader.com) analisa um site fornecido como entrada, pelas
tcnicas de SEO. O mais interessante que ela avaliar o nvel de legibilidade do texto do site
(readability level), indicando o grau de formao necessrio ao usurio para poder entender o
texto ("advanced", "doctoral degree", etc.). Tambm indica o nmero de outras pginas que
apontam para o site e faz uma comparao com sites concorrentes.


Sites de concorrentes
Os sites das empresas concorrentes descrevem estratgias e tticas da empresa, produtos e
servios oferecidos, novidades, investimentos realizados, alm de releases e notcias
relacionadas esta empresa.


Tag Clouds (nuvens de palavras)
Podemos utilizar imagens de tag clouds para comparar textos de sites concorrentes. A
ferramenta Wordle (http://www.wordle.net) permite criar tag clouds de textos. A comparao
manual mas permite identificar os temais mais importantes de um texto, porque evidenciam
em tamanho maior as palavras que mais aparecem. A Figura 80 apresenta as tag clouds
relativas aos discursos de posse do ex-presidente Lula (2003 e 2007).


127



Figura 80: Tag clouds para comparao de textos


O software Text Mining Suite (www.intext.com.br) utiliza tcnicas de minerao de textos
(text mining) para comparar textos (2 ou mais) entre si. Os textos podem ser sites de empresa
ou folders descritivos de servios ou produtos ou quaisquer outros tipos de textos. A
ferramenta apresenta os termos comuns e os termos exclusivos (que aparecem s num texto).
Isto permite avaliar as diferenas de estratgias entre empresas.


Sites de notcias
H servios como o Google News que permite buscas de notcias com certas palavras-chave.
Isto pode ser utilizado para monitorar mercados.

Clipping ou Pushing
Este um servio semelhante ao anterior, s que feito automaticamente por robs de busca,
que ficam monitorando sites de notcias, filtram por presena de palavras, recuperam as
notcias relevantes e enviam para empresas e pessoas.
A nica crtica que tais servios no fazem um resumo automtico e muitas vezes enviam
notcias repetidas, coletadas em fontes diferentes. Tcnicas de text mining (como visto no
captulo 19) poderiam minimizar tais problemas.

Alertas ou Filtragem
So servios semelhantes ao anterior, mas neste caso o prprio site que oferece o servio de
filtragem e envio de informaes. O objetivo avisar o usurio quando chegar algo novo de
seu interesse (notcias, produtos, pginas web, postagens de um blog).

128

Web Monitor
Este servio grtis (http://www.intext.com.br/webmonitor) permite ao usurio cadastra uma
pgina web (URL) e o sistema avisa quando houve alguma alterao na pgina. um servio
bom para monitorar licitaes, editais, e at mesmo o site do concorrente. Ele evita que o
usurio tenha que entrar todo dia no site para ver as novidades. H ainda uma funo extra
que permite avisar somente se houver mudana no texto e alguma palavra-chave for
encontrada

Bases de Patentes
As requisies de patentes ficam disponveis publicamente. No Brasil, quem cuida disto o
INPI, Instituto Nacional de Propriedade Industrial e Intelectual (www.inpi.gov.br). H
tambm estas bases nos EUA ( www.uspto.gov) e na Europa (worldwide.espacenet.com).
As buscas podem ser feitas com palavras-chave sobre ttulos ou resumos de patentes, ou
mesmo buscar as patentes de uma determinada empresa.

Anlise de Reclamaes
H sites como o ReclameAqui (www.reclameaqui.com.br) que funcionam recebendo
reclamaes de clientes (ttulo e descrio) e repassando para que as empresas
correspondentes faam suas justificativas na forma de respostas. H tambm estatsticas de
nmero de reclamaes, quantas foram respondidas, quantas foram resolvidas, etc.

Busca por processos
Os sites dos rgos de justia permitem que usurios quaisquer faam buscas por processos de
empresas ou pessoas, permitindo entender onde as empresas concorrentes esto falhando.

Ministrio da Justia: http://www.mj.gov.br/SindecNacional/reclamacao.html
Consulta Processos na Justia: http://www.stj.jus.br/webstj/Processo/Justica/
Consulta Processos na Justia: http://www.trf4.jus.br/trf4/

Em especial, devemos citar o site Zabasearch, que faz buscas por pessoas nos EUA,
consultando listas telefnicas e outras fontes.


Anlise de redes sociais e sentimentos (opinion mining)
Empresas esto preocupadas com sua imagem e o que as pessoas esto falando dela e de seus
produtos e servios. Isto pode ser bom tambm para avaliar ideias, utilizando a chamada
Sabedoria das Massas (Wisdom of Crowds), ou para receber e refinar ideias de multides
(Crowdsourcing). Inclusive algumas empresas criaram o cargo de "analista de redes sociais",
cuja responsabilidade ficar monitorando manualmente estas postagens. Estas anlises
buscam postagens em blogs, fruns, comunidades e redes sociais. H algumas ferramentas
que podem fazer isto automaticamente.

Existem ferramentas que analisam os temas mais discutidos em redes sociais. Isto serve para
entender o foco das atenes e, somando a tcnicas de text mining, podem relatar
129

precisamente o que as pessoas esto dizendo sobre certos assuntos. Tambm importante
encontrar quem so os formadores de opinio e como as opinies e ideias se disseminam pela
Internet (quem posta mais, quem segue quem, origens de memes e repostagens). Quem
conseguir controlar o marketing viral (boca-a-boca) conseguir melhores resultados.

Seguem algumas ferramentas:
Social Mention: http://www.socialmention.com/
Software SWASI: www.intext.com.br
Trend Topics do Twitter
The Archivist: http://archivist.visitmix.com/

Alm disto, esto surgindo ferramentas para anlise de sentimentos ou minerao de opinies
(sentiment analysis, opinion mining). Um artigo de 2011 (Bollen et al.), conseguiu provar a
correlao entre o tipo de humor nas postagens do twitter e o ndice Dow Jones da bolsa de
valores americana. Outros artigos provaram ser possvel prever receitas de filmes, aumento
no nmero de turismo e mesmo prever eventos futuros analisando postagens (Asur et al.
2010; Mishne, 2006; Radinsky & Horvitz, 2013; Choi & Varian, 2012).

Alguns destes trabalhos analisam 6 estados de humor encontrados nas postagens, de acordo
com o modelo POMS (Profile of Mood States). Mas h tambm trabalhos e ferramentas cujo
objetivo dizer simplesmente se um texto est falando bem ou mal sobre um assunto, que
pode ser um produto, servio, uma empresa ou uma pessoa, ou simplesmente um tema
qualquer.

Est tambm sendo estudado o modelo OCC (Ortony, Clore & Colins, 1988), que analisa em
textos 22 tipos de emoes, atravs da anlise de adjetivos que exprimem emoes em textos.


Anlise de Publicaes Cientficas
A anlise de artigos cientficos permite descobrir reas de P&D dos concorrentes e parcerias
acadmicas com empresas. Exemplos de sites que divulgam artigos cientficos so: Google
Acadmico (scholar.google.com.br) e Citeseer (www.researchindex.org).

Web Archive
O site web.archive.org (WayBack Machine) mantm o histrico da Web desde 1995. Isto ,
ele armazena as pginas da Web, como eram, as verses posteriores e as mais recentes, de
cada pgina da Web. Isto permite analisar mudanas de estratgias dos concorrentes durante
os ltimos anos. claro que o site passa por problemas de direitos autorais, falta de
atualizaes e tambm porque algumas empresas j pediram para que seus sites fossem
retirados deste banco de dados (para no serem monitoradas).



31 Sistemas de Gesto do Conhecimento
Objetivo: coletar, armazenar, organizar, recuperar e disseminar conhecimento.

130

Pode-se notar que o objetivo dos sistemas de Gesto de Conhecimento (GC) bem parecido
com o objetivo geral de um sistema de informao. O que muda a palavra "informao"
trocada por "conhecimento". Precisamos lembrar que Conhecimento est acima de
informaes, gerado a partir das informaes e utilizado pelas pessoas em suas tarefas e
resoluo de problemas. Uma coisa guardar a idade e o sexo dos clientes, outra coisa
armazenar o conhecimento sobre que tipos de clientes (homens ou mulheres) possuem
determinadas faixas etrias.
H tambm a clssica definio de Plato: conhecimento so crenas verdadeiras e que
podemos justificar.

De onde vem o Conhecimento ?
Racionalismo: prope que a origem do conhecimento se encontra na razo, tido como o
nico e exclusivo instrumento capaz de conhecer verdades universais. Defensor: Ren
Descartes (1596-1650), autor da famosa frase: Penso, logo existo.;
Empirismo: origem do conhecimento vem da experincia dos sentidos (viso, audio,
tato, olfato, paladar). Defensor: Francis Bacon (1561-1926).

Gesto do Conhecimento, segundo a Sociedade Brasileira de Gesto do Conhecimento
(regional RS) " o processo sistemtico, integrado e transdisciplinar que promove atividades
para criao, identificao, organizao, compartilhamento, utilizao e proteo de
conhecimentos estratgicos, gerando valor para as partes interessadas.

A importncia da GC est em organizar o Conhecimento de uma empresa para que possa ser
reusado (evitando refazer "o caminho das pedras"), possa acelerar treinamentos, aumentar
produtividade e qualidade, resolver problemas e gerar inovao e empreendedorismo. Quando
vemos o valor de mercado de uma empresa, certamente s uma pequena parte deste valor vem
de seus ativos tangveis (bens e recursos materiais). A maior parte do valor vem dos ativos
intangveis, os quais incluem o Capital Intelectual da empresa. O valor do conhecimento
revela-se nos resultados econmicos. Alguns autores calculam que 2/3 dos resultados
financeiros de uma empresa so devidos ao Capital Intelectual (Stewart, 1998).
Segundo Stewart (1998), Capital Intelectual a soma de 3 capitais:
a) capital humano: inclui conhecimento e competncias individuais dos funcionrios
(refere-se ao valor que a empresa perde quando funcionrios vo embora); inclui
tambm atitudes (saber/poder/quere fazer); por exemplo, um time de esportes com
os menores salrios ganhar o campeonato;
b) capital estrutural: inclui conhecimento ou competncia coletiva, como processos,
know-how, marcas e patentes, documentos ( o valor que fica quando funcionrios
vo embora); por exemplo, a organizao de processos da Fedex para entregas
certas e rpidas;
c) capital do cliente: inclui conhecimento e vantagens advindas dos clientes ( o valor
que se ganha com relacionamentos com clientes); por exemplo, o valor do
Youtube quando da compra pelo Google dado pelo nmero de clientes ou
usurios.

A chegada do novo milnio trouxe tambm a realidade da Era do Conhecimento.
Pessoas e organizaes reconhecem que o conhecimento o recurso mais importante, mais
at que meios de produo, energia, recursos naturais, pessoas, processos e capital financeiro.
131

Pois s o Conhecimento permite integrar e organizar todos os outros recursos para gerar
negcios melhores (produtividade e eficcia).

Segundo Balceiro & Balceiro (2001), trs so os pilares da Inteligncia Empresarial
para se obter vantagem competitiva: o conhecimento, a inovao (soluo de problemas e
gerao de conhecimento novo) e o empreendedorismo (aes planejadas). A integrao
destes 3 pilares que gera o aprendizado constante e contnuo da organizao. Entretanto, o
conhecimento a base para a inovao e o empreendedorismo.
Para fazer uso adequado do capital intelectual, necessrio administrar o conhecimento,
permitindo capturar, armazenar, recuperar, consultar e analisar conhecimento relativos aos 3
tipos de capital. A Gesto do Conhecimento a rea preocupada com a administrao do
capital intelectual da organizao de modo que esta possa aprender e crescer.
A Gesto do Conhecimento to importante que as organizaes esto criando cargos
de CKO (Chief Knowledge Officer), ou seja, o diretor responsvel pelo conhecimento da
organizao (logo abaixo do presidente da empresa, que o CEO, e no mesmo nvel do
diretor de Informtica ou Tecnologia, que o CIO). O bem sob responsabilidade do CKO a
Memria Organizacional. Ela deve conter o conhecimento da organizao de forma explcita
e tambm manter um ndice para o conhecimento tcito, as chamadas Yellow Pages (quem
sabe o que, quem especialista no que).


Tipos de Conhecimento

Existem basicamente dois tipos de conhecimento: tcito e explcito (Nonaka & Takeuchi,
1997). O conhecimento tcito aquele disponvel com pessoas e que no se encontra
formalizado em meios concretos (est na cabea das pessoas). J o conhecimento explcito
est concretizado ou formalizado (armazenado e disponvel) em algum meio fsico.
Exemplos: bancos de dados, documentos em papis ou eletrnicos, imagens (eletrnicas ou
fotografias ou vdeos), gravaes telefnicas, etc.
Nonaka & Takeuchi (1997) identificaram 4 modos de converso entre conhecimento
tcito e explcito, apresentados na Figura 81. O processo de externalizao a transformao
do conhecimento tcito em explcito. A internalizao o processo inverso. J a
combinao o processo de interao entre conhecimentos explcitos para gerao de novos
conhecimentos. Por sua vez, a socializao a interao entre conhecimentos tcitos.


DESTINO


Tcito Explcito
O
R
I

Tcito

Socializao

Externalizao
G
E
M

Explcito

Internalizao

Combinao
132

Figura 81: Modos de converso do conhecimento (adaptado de Nonaka & Takeuchi,
1997)

O objetivo e importncia destes modos de converso so transformar o aprendizado
individual em coletivo. A diferena que o aprendizado coletivo permite efetuar tarefas que
no podem ser realizadas individualmente. Para atingir este aprendizado coletivo, necessrio
ter meios adequados para suporte aos 4 modos de converso. Para tanto, existem os Sistemas
de Informao. Os sistemas de GC utilizam todos os tipos anteriores, que tratam de
informaes. Por exemplo, o Portal Corporativo integra fontes heterogneas de conhecimento
e fornece um meio nico de acesso ao conhecimento (armazenagem, troca ou consulta).
Sistemas de CRM tratam do conhecimento sobre o cliente (customer intelligence). Data
Mining e BI ajudam a gerar conhecimento a partir da anlise de informaes. E assim por
diante.



Etapas da Gesto do Conhecimento

As etapas (ou tarefas) relativas a um Sistema de Gesto do Conhecimento so
descritas a seguir.

Como armazenar conhecimento
A chamada Memria Organizacional da empresa deve conter:
Lies Aprendidas: relatos de experincias em que se registra o que aconteceu, o que
se esperava que acontecesse, a anlise das causas das diferenas, o que se fez de bom e
de ruim e o que foi aprendido durante o processo;
Banco de Conhecimentos: incluindo conhecimento sobre processos, produtos, servios
e relacionamento com os clientes;
A gesto de contedo e documentos: informaes, ideias, e as melhores prticas
documentadas em meio fsico.

A maneira mais fcil de armazenar conhecimento atravs de textos (escritos por pessoas).
Entretanto, tambm podemos armazenar conhecimento na forma de vdeos (imagens) e sons
(gravaes). Diagramas e grficos tambm podem ser teis. Muitas pessoas utilizam mapas
mentais para representar o conhecimento de uma empresa.
Outra forma de armazenar conhecimento atravs de narrativas (storytelling). Elas servem
para descrever assuntos complicados, expor situaes e/ou comunicar lies aprendidas ou,
ainda, para interpretar mudanas culturais. So relatos retrospectivos de pessoal envolvido nos
eventos ocorridos e funcionam como contar uma histria.
O Portal Corporativo ou a Intranet so os locais mais utilizados para centralizar o
armazenamento do conhecimento de uma empresa.

Como coletar conhecimento:
Em geral, as pessoas resistem a externalizar seu conhecimento. A principal razo o medo de
perder o emprego (se eu registrar tudo o que sei, no precisaro mais de mim). Para tanto,
as organizaes esto incentivando seus colaboradores a registrarem conhecimento. Estes
133

incentivos so na forma de bnus anuais ou por ideia registrada (valores monetrios ou
acrscimos no salrio), viagens, folgas ou sorteios de brindes.
Os Portais Corporativos podem conter as ferramentas para pessoas registrarem a memria
organizacional, centralizando assim os esforos.


Como organizar o conhecimento:
Podemos utilizar ontologias, taxonomias ou thesauri. So estruturas hierrquicas que
englobam todos os assuntos possveis na organizao. So criados por especialistas. Uma
desvantagem que, s vezes, difcil encontrar um assunto apropriado (um texto sobre
informtica na medicina deve ser classificado em informtica ou em medicina ou se
deve criar uma nova rea ?). Isto ocorre pela rigidez da estrutura.
Uma alternativa que est surgindo na Internet, nos sites mais populares, o uso de tags (ou
palavras-chave), que so escolhidos pelos usurios (quem criou ou postou o contedo), sem
regras ou rigidez. O conjunto de tags utilizadas forma uma Tagsonomia ou Folksonomia.

Como recuperar conhecimento:
Em geral, utilizam-se mecanismos automatizados de busca por palavras-chave (em textos) ou
por assuntos (com classificaes). O desafio recuperar conhecimento armazenado como
vdeos ou gravaes de sons.
As Yellow Pages ajudam a organizar quem sabe o que, qual a expertise de cada um e dos
grupos dentro da empresa. Basicamente, uma matriz de pessoas X competncias
(habilidades). A relao das expertises pode vir por aprendizado formal (cursos, treinamentos)
ou informal (por experincias).


Como disseminar conhecimento:
Podemos utilizar sistemas tipo GED ou de informaes textuais. Os sistemas de
recomendao tambm podem ser teis, pois oferecem conhecimento a uma pessoa, inferindo
que ela precisa dele, sem mesmo ela solicitar.
Os Incas transmitiam conhecimento contando histrias (no tinham escrita). J os Maias
faziam desenhos na pedra (os estrangeiros interprestaram e registraram com a escrita). Os
Egpcios usavam hierglifos, que funcionavam como storytelling.
Hoje em dia dispomos de Tecnologias da Informao e Comunicao (TICs), as quais
incluem TV, rdio, jornal (difuso em massa), celular, SMS, Instant Messengers, e-mail,
twitter (difuso por pares ou grupos), wikis, redes sociais e outras ferramentas para
colaborao, como as discutidas no captulo 22.

Como validar o conhecimento
A memria organizacional pode conter todo tipo de informao, inclusive os chamados sinais
fracos, que so informaes ainda no validadas. Elas incluem ideias e boatos, e tambm so
importantes no processo de tomada de deciso, uma vez que decises no so tomadas
somente com base em fatos.
Entretanto, sempre que possvel, deve-se verificar a veracidade ou confiabilidade do
conhecimento armazenado e aps descartar conhecimento obsoleto, desatualizado, no
confirmado ou no confivel.


134

Comunidades de Prticas
So grupos de pessoas dentro de uma organizao reunindo-se por reas de interesse. A cada
encontro, uma pessoa ou um pequeno grupo fica responsvel por estudar um assunto e trazer
os resultados para o grupo discutir. Geralmente so grupos multidisciplinares, isto ,
permitem a participao de pessoas de todos os nveis hierrquicos e todos os setores
horizontais da empresa. Isto permite uma discusso mais rica e uma troca de conhecimentos e
experincias alm dos limites de cada expertise.
As reunies podem ser formais ou informais (sala do cafezinho ou happy hour) e os encontros
podem ser feitos de forma presencial ou atravs de tecnologias em rede (fruns, comunidades,
blogs).
O sucesso das Comunidades de Prticas se deve muito aos seguintes fatores: confiana,
ambiente descontrado, vontade de contribuir e aprendizado prprio.





32 Bibliografia Citada

AMBROSIO, Ana P. et alli. The linguistic level: contribution for conceptual design, view
integration, reuse and documentation. Data & Knowledge Engineering, v.21, n.2, Janeiro de
1997.

ASUR, Sitaram; HUBERMAN, Bernardo A. Predicting the Future with Social Media
Proceedings WI-IAT '10 IEEE/WIC/ACM International Conference on Web Intelligence and
Intelligent Agent Technology - v.1, 2010, p. 492-499.

BALCEIRO, Raquel B. & BALCEIRO, Letcia B. (2001). A aprendizagem organizacional e a
inovao: o caso Pfizer. In: Simpsio Internacional de Gesto do Conhecimento e Gesto de
Documentos, Curitiba, 2001. Anais... Curitiba: PUC-PR/CITS.

BOLLEN, Johan; MAO, Huina; ZENG, Xiao-Jun. Twitter mood predicts the stock market
Journal of Computational Science, 2(1), March 2011, 1-8.

BOWDEN, Paul R.; HALSTEAD, Peter; ROSE, Tony G. Extracting conceptual knowledge
from text using explicit relation markers. In: SHADBOLT, Nigel et alli (eds). IX European
Knowledge Acquisition Workshop. Proceedings... Lecture Notes in Artificial Intelligence,
1076. Maio de 1996.

CHOI, H.; VARIAN, H. Predicting the Present with Google Trends. Economic Record,
special issue selected Papers from the 40th Australian Conference of Economists, v. 88, n.1,
p.29, June 2012.

DAVIES, Roy. The creation of new knowledge by information retrieval and classification.
Journal of Documentation, v.45, n.4, Dezembro de 1989.

135

FELDMAN, Ronen; HIRSH, Haym. Exploiting background information in knowledge
discovery from text. Journal of Intelligent Information Systems, v.9, n.1, Julho/Agosto de
1997.

FELDMAN, Ronen; DAGAN, Ido. Mining text using keyword distributions. Journal of
Intelligent Information Systems, v.10, 1998. pp.281-300

FINKELSTEIN, Maria Eugenia Reis. Direito do comrcio eletrnico. Ed. Campus Jurdico,
2010.

GOMES, Elisabeth; BRAGA, Fabiane. Inteligncia Competitiva como transformar
informao em um negcio lucrativo . Rio de janeiro: Elsevier, 2 ed., 2004.

HOBBS, J. R. Coherence and coreference. Cognitive Science, v.3, n.1, Janeiro/Maro de
1979.

HWANG, C. H.; SCHUBERT, L. K. Tense trees as the "fine structure" of the discourse. In:
30th Meeting of the Association for Computational Linguistics. Proceedings... Newark, 1992.

KAMEYAMA, M.; PASSONNEAU, R.; POESIO, M. Temporal centering. In: 31st Meeting
of the Association for Computational Linguistics. Proceedings... Columbus - Ohio, 1993.

KOHAVI, Ron. (2001). Mining e-commerce data: the good, the bad and the ugly. Simpsio
Internacional de Gesto de Conhecimento e Gesto de Documentos. Curitiba, agosto de 2001.
(palestra convidada)

LANARI, Flavia de Vasconcellos. A Tributao do comrcio eletrnico. Ed. Del Rey. 2005.

LASCARIDES, A., ASHER, N.; OBERLANDER. J. Inferring discourse relations in context.
In: 30th Meeting of the Association for Computational Linguistics. Proceedings... Newark,
1992.

LOH, Stanley. Descoberta de conhecimento em textos. Exame de Qualificao EQ-29.
PPGC/UFRGS, Porto Alegre, Fevereiro de 1999.

LORENZI, Fabiana; SILVEIRA, Sidnei. Desenvolvimento de Sistemas de Informao
Inteligentes. Porto Alegre: UniRitter, 2011. 172p .

MAAREK, Yolle S. Automatically constructing simple help systems from natural language
documentation. In [JAC92]

McCARTHY, John. Phenomenal data mining: from data to phenomena. SIGKDD
Explorations, v.1, n.2, Janeiro de 2000.

McKEOWN, Kathleen; RADEV, Dragomir R. Generating summaries of multiple news
articles. In: International ACM-SIGIR Conference on Research and Development in
Information Retrieval. Proceedings... Seattle, 1995.

136

MISHNE, Gilad. Predicting movie sales from blogger sentiment. In AAAI Spring Symposium
on Computational Approaches to Analysing Weblogs (AAAI-CAAW) 2006.

MORRIS, Jane; HIRST, Graeme. Lexical cohesion computed by thesaural relations as an
indicator of the structure of text. Computational Linguistics, v.17, n.1, Maro de 1991.

MOSCAROLA, Jean; BAULAC, Yves; BOLDEN, Richard. Technology watch via textual
data analysis. Note de Recherche n 98-14, Universit de Savoie. Julho de 1998.

NONAKA, I. & TAKEUCHI, H. (1997). Criao de conhecimento na empresa: como as
empresas japonesas geram a dinmica da inovao. Rio de Janeiro: Campus.

ORTONY, A.; CLORE, G.L.; COLLINS, A. (1988). The Cognitive Structure of Emotions,
Cambridge University Press. 1988.

PEPPERS, Don; ROGERS, Martha. Enterprise One to One. Crown Publishing Group, 2000.

RADINSKY, Kira; HORVITZ, Eric. Mining the web to predict future events. Proceedings
WSDM '13 Proceedings of the sixth ACM international conference on Web search and data
mining, 2013, p. 255-264.

SAGGION, Horacio; CARVALHO, Ariadne. Anlise textual visando a traduo automtica.
In: CASTILHO, Jos M. V. (ed). XXI Conferncia Latino-Americana de Informtica -
PANEL95. Anais... Canela, UFRGS, 1995.

SPARCK-JONES, Karen; WILLET, Peter (eds). Readings in Information Retrieval. San
Francisco: Morgan Kaufmann, 1997.

SPILIOPOULOU, Myra et al. (2000). Improving the effectiveness of a Web site with Web
usage mining. Proceedings Workshop WEBKDD99. Lecture Notes on Artificial Intelligence
1836, Springer-Verlag. Julho de 2000.

SPILIOPOULOU, Myra; POHLE, Carsten. Data mining to measure and improve the success
of Web sites. Journal of Data Mining and Knowledge Discovery, v.5, n.1/2, Janeiro de 2001.

SRIVASTAVA, Jaideep et al (2000). Web usage mining: Discovery and applications of usage
patterns from Web data. ACM SIGKDD Explorations, v.1, n.2, Janeiro de 2000.

STEWART, Thomas A. (1998). Capital intelectual: a nova vantagem competitiva das
empresas. 2
a
ed. Rio de Janeiro: Campus.

SWANSON, Don R.; SMALHEISER, N. R. An interactive system for finding
complementary literatures: a stimulus to scientific discovery. Artificial Intelligence,
Amsterdam, v.91, n.2, p.183-203, Apr. 1997.

SWANSON, Don R. Historical note: information retrieval and the future of an illusion. In:
SPARCK-JONES, Karen; WILLET, Peter (eds). Readings in Information Retrieval. San
Francisco: Morgan Kaufmann, 1997.

137

TAN, Ah-Hwee. Text mining: the state of the art and the challenges. In: Pacific-Asia
Workshop on Knowledge Discovry from Advanecd Databases, 1999, Beijing. Proceedings...
1999. p.65-70.

VENTURA, Luis Henrique. Comrcio e contratos eletrnicos aspectos jurdicos. Ed.
EDIPRO, 2010.

WEBBER, B. L. Tense as discourse anaphor. Computational Linguistics, v.14, n.2, Jun 1988.

WIEBE, Janyce M. Tracking point of view in narrative. Computational Linguistics, v.20, n.2,
Junho de 1994.

WILLET, Peter. Recent trends in hierarchic document clustering: a critical review.
Information Processing & Management, v.24, n.5, 1988. pp.577-597.

UNDERHILL, Paco. Why we buy: the science of shopping. Simon & Schuster, 1999.


33 Bibliografia Complementar


33.1 Livros sobre Fundamentos de Sistemas de Informao

BERTALANFFY, Ludwig. Teoria Geral de Sistemas. Vozes. 1975.

BEUREN, Ilse Maria. Gerenciamento da Informao: um recurso estratgico no processo de
gesto empresarial. Editora: Atlas, 1998.

CIDRAL, A.; ANDRADE, G. K.; AUDY, J. L. N. Fundamentos de Sistemas de Informao.
Editora Bookman. 2005.

FELICIANO NETO, Accio. A Engenharia da Informao. Editora: McGraw Hill, 1998.

LAUDON, K. C.; LAUDON, J.P. Sistemas de Informao. LTC, 1999.

MCGEE, James V. e Prusak, L. Gerenciamento Estratgico da Informao. Editora: Campus,
1995.

MILLER, George A. (1956) The magical number seven, plus or minus two: some limits on
our capacity for processing information. Psychological Review, vol. 101, n. 2, p.343-352.

RESENDE, Denis Alcides, ABREO, Aline Frana de. Tecnologia da Informao: o papel
estratgico da informao e dos sistemas de informao nas empresas. So Paulo. Atlas,
2001.

138

STAIR, R. Princpios de Sistemas de Informao: Uma abordagem gerencial. Rio de Janeiro:
LTC. 2000.

TORRES, N. Competitividade Empresarial com a Tecnologia da Informao. Editora:
Makron Books, 1995.


33.2 Livros sobre Sistemas de Informao e Apoio a Decises

BIO, Srgio Rodrigues. Sistemas de Informao: Um Enfoque Gerencial. Editora: Atlas.

CRUZ, T. Sistemas de Informaes Gerenciais Tecnologias da Informao e a Empresa do
Sculo XXI. Editora: Atlas, 2000.

FREITAS, H. et al. Informao e deciso: sistemas de apoio e seu impacto. Porto Alegre:
Ortiz, 1997. 214p.

FURLAN, J. D. et al. Sistemas de informao executiva = EIS: como integrar os executivos
ao sistema informacional das empresas. So Paulo: Makron Books, 1994. 157p.
LAUDON, K. C. e LAUDON, J. P. Sistemas de informao. Rio de Janeiro: Livros Tcnicos
e Cientficos, 1999.
MANAS, Antonio Vico. Administrao de Sistemas de Informao. Editora: rica, 1999.
O'BRIEN, J. Sistemas de Informao e as Decises Gerenciais. 3a ed. Editora Saraiva, 2010.
OLIVEIRA, D. P. R. Sistemas de informaes gerenciais: estratgicas, tticas, operacionais.
5. ed. So Paulo: Atlas, 1998.
REZENDE, Denis Alcides. Engenharia de Software e Sistemas de Informao. Editora:
Brasport, 1999.
SPRAGUE, R. H. e WATSON, H. J. Sistemas de apoio deciso: colocando a teoria em
prtica. Rio de Janeiro: Campus, 1991.
TURBAN, E., McLEAN, E., WETHERBE, J. Tecnologia da informao para gesto. Porto
Alegre: Bookman, 2004.
TURBAN, Efraim; RAINER Jr., R. K.; POTTER, Richard E. Introduo a sistemas de
informao: uma abordagem gerencial. Rio de Janeiro: Elsevier, 2007.

33.3 Livros sobre Data Warehouse, Data Mining e Recomendaes

139

AGRAWAL, Rakesh. Data mining: the quest perspective. EDBT Summer School on
Advances in Database Technology. Proceedings... Gubbio-Itlia, Setembro de 1995.
ANAND, S. S. et alli. Tackling the cross-sales problem using data mining. IN: LU, Hongjun
et alli (eds). KDD: techniques and applications. Singapore: World Scientific, 1997.
CABENA, Peter et al. Discovering data mining: from concept to implementation. London:
Prentice-Hall, 1997.

CHAKRABARTI, Soumen. Mining the web: discovering knowledge from hypertext data.
Morgan Kaufmann Publishers, 2003.
FAYYAD, U.; PIATETSKY-SHAPIRO, G.; AMITH, Smyth P.; UTHURUSAMY, R. (eds).
Advances in knowledge discovery and data mining. Cambridge: MIT Press, 1996.
GAROFALAKIS, Minos N. et al. Data mining and the web: past, present and future. In:
ACM WORKSHOP ON WEB INFORMATION AND DATA MANAGEMENT, 1999,
Kansas City. Proceedings Washington: ACM Press, 1999. p.43-47.

HAN, J.; KAMBER, M. Data mining: concepts and techniques. Morgan Kaufmann, 2000.
HARRISON, T. H. Intranet, data warehouse: ferramentas e tcnicas para a utilizao do data
warehouse na intranet. So Paulo: Siciliano, 1998. 359p.
KIMBALL, Ralph; MERZ, Richard. The data webhouse toolkit: building the web-enabled
data warehouse. John Wiley & Sons, 2000.

KOHAVI, Ron & BECHER, Jon. (2001). E-commerce and clickstream mining tutorial. SIAM
International Conference on Data Mining. Abril de 2001.

LAWRENCE, R. D. et al. Personalization of supermarket product recommendations. Journal
of Data Mining and Knowledge Discovery, v.5, n.1/2, Janeiro de 2001.

LEE, J. & PODLASECK, Mark. Visualization and analysis of clickstream data of online
stores for understanding web merchandising. Journal of Data Mining and Knowledge
Discovery, v.5, n.1/2, Janeiro de 2001.
LU, Hongjun et alli (eds). KDD: techniques and applications. Singapore: World Scientific,
1997.
PARSAYE, Kamran et alli. Intelligent databases: object-oriented, deductive hypermedia
technologies. New York: John Wiley & Sons, 1989.
RIEDL, John; KONSTAN, Joseph; VROOMAN, Eric. Word of mouse: the marketing power
of collaborative filtering. Warner Books, 2002.
SCHAFER, J. Ben et al. E-commerce recommendation applications. Journal of Data Mining
and Knowledge Discovery, v.5, n.1/2, Janeiro de 2001.
140

TORRES, Roberto. Personalizao na Internet: como descobrir os hbitos de consumo de
seus clientes, fideliz-los e aumentar o lucro de seu negcio. Novatec, 2004.
UPCHURCH, Linda et al. (2001). Using card sorts to elicit web page quality attributes. IEEE
Software, v.18, n.4, Julho/Agosto de 2001.

YAO, Y.Y. et al. (2001). Web Intelligence (WI): research challenges and trends in the new
information age. In: Zhong, N., Yao, Y.Y., Liu, J., and Ohsuga, S. (eds.)
Web Intelligence: Research and Development. Lecture Notes on Artificial Intelligence 2198,
Springer-Verlag, 2001.

ZHONG, N. et al. (2000). Web Intelligence (WI). Proceedings 24th IEEE Computer Society
International Computer Software and Applications Conference (COMPSAC 2000).

33.4 Livros sobre Apoio ao Marketing


DAVENPORT, Thomas et al. Como elas conhecem to bem os clientes ? HSM Management,
n.27, julho/agosto de 2001.

DAVIS, Charles. (2001). Customer Intelligence Management: issues and challenges.
Simpsio Internacional de Gesto de Conhecimento e Gesto de Documentos. Curitiba,
agosto de 2001. (palestra convidada)

FISHMAN, Charles. Desmascarando o atendimento ineficiente. HSM Management, n.28,
setembro/outubro de 2001.

GABRIEL, Martha. Marketing na Era Digital. Ed Novatec, 2010.

GODRI, Daniel. Conquistar e manter clientes. Blumenau: Editora EKO, 1994.

KOTLER, Philip et al. Valor com valor se paga (mesa redonda). HSM Management, n.19,
maro/abril de 2000.

MALHOTRA, N. K. Pesquisa de marketing: foco na deciso. 4.ed. So Paulo: Pearson
Prentice Hall, 2006.

McKENNA, Regis. As cinco regras do novo marketing. HSM Management, n.22,
setembro/outubro de 2000.

PEPPERS, Don; ROGERS, Martha. Nos conhecemos de algum lugar ? HSM Management,
n.19, maro/abril de 2000.

REICHHELD, Frederick F. & SCHEFTER, Phil. A fidelidade na Internet. HSM
Management, n.28, setembro/outubro de 2001.

141

SCHEWE, C.D. e SMITH, R.M. Marketing: conceitos, casos e aplicaes. So Paulo:
MacGraw, 1980, 564 pg.

33.5 Livros sobre Gesto do Conhecimento, BI e Inteligncia competitiva

BARBIERI, Carlos. BI - Business Intelligence. Axcel Books, 2001.

BATTAGLIA, Maria da Glria Botelho. Inteligncia Competitiva modelando o sistema de
informao de cliente Finep. Ci. Inf , Braslia, v.29,n.2 p. 200-2014, mai./ago. 1999.
DAVENPORT, T.; PRUSAK, L. Conhecimento empresarial: como as organizaes
gerenciam o capital intelectual. Rio de Janeiro: Campus, 1998.
DRUCKER, Peter. Inovao e esprito empreendedor. So Paulo: Pioneira, 1987.

FULD, Leonard M. Inteligncia Competitiva: como se manter frente dos movimentos da
concorrncia e do mercado. Rio de Janeiro: Elsevier, 2007.

GABRIEL, Martha. SEM e SEO: Dominando o Marketing de Busca. 2a ed. Ed Novatec,
2012.

GARDNER, H. Estruturas da Mente: A Teoria das Inteligncias Mltiplas. Porto Alegre,
Artes Mdicas Sul, 1994.

KUDYBA, S.; HOPTROFF, Richard. Data Mining and Business Intelligence: A Guide to
Productivity, IDEA-GROUP Publishing, 2001.

LEME FILHO, Trajano. BI - Business Intelligence no Microsoft Excel. Axcel Books, 2004.

LVY, P. As Tecnologias da Inteligncia - O Futuro do Pensamento na Era da Informtica.
Editora 34. Rio de Janeiro, 1993.

PASSOS, Alfredo; Competitor Intelligence Committeee. Inteligncia Competitiva: como
fazer IC acontecer na sua empresa. So Paulo, LTC Ed., 2005.
PORTER, M. E. Vantagem Competitiva: Criando e Sustentando um Desempenho Superior.
Rio de Janeiro: Campus, 1992.
SENGE, Peter. A quinta disciplina - arte, teoria e prtica da organizao de aprendizagem.
So Paulo: Best Seller, 1998.

SVEIBY, Karl E. A nova riqueza das organizaes - gerenciando e avaliando patrimnios de
conhecimento. Rio de Janeiro: Campus, 1998.

TERRA, Jos Cludio C. Gesto do conhecimento - estudo exploratrio sobre as prticas de
empresas brasileiras. So Paulo: Universidade de So Paulo, 2000.

142

TERRA, Jos Cludio C. Gesto do conhecimento - o grande desafio empresarial - uma
abordagem baseada no aprendizado e na criatividade. So Paulo: Negcio, 2000.

TERRA, Jos C. Cludio (2001). A criao de portais corporativos de conhecimento. In:
Simpsio Internacional de Gesto do Conhecimento e Gesto de Documentos, Curitiba, 2001.
Anais... Curitiba: PUC-PR/CITS. (palestra convidada)

TURBAN, Efrain; KING, David; ARONSON, Jay E. Business Intelligence. Bookman, 2008.

ZANASI, Alessandro. Competitive Intelligence though datamining public sources.
Competitive Intelligence Review, Alexandria, Virginia: SCIP. v.9, n.1, 1998.