O
crescimento fenomenal da Internet tem colocado muitas dificuldades para o estudante ou profissional de saúde
que deseja localizar informações específicas sobre algum assunto. São literalmente
dezenas de milhões de documentos contendo informação médica na Internet, e a taxa de
crescimento é muito alta. Selecionar qual é a informação que melhor atende o tema procurado
e discriminar a sua qualidade tornam-se problemas cada vez mais freqüentes.
A solução, então, é utilizar serviços e publicações que nos permitam localizar a informação desejada, da maneira mais rápida e precisa possível. Eles podem existir na forma de CD-ROMs ou livros (como as Páginas Amarelas da Internet), suplementos de revistas, ou, mais inteligentemente, através do acesso direto via Internet aos vários serviços on-line que permitem a busca sistemática de informações de acordo com critérios definidos pelo próprio usuário.
A forma mais consagrada de procurar informações altamente específicas na Internet, dessa maneira, é utilizar os três tipos básicos de recursos de busca existentes:
Cada tipo tem sua forma própria de utilização, mas todos têm uma coisa em comum: a possibilidade de utilizar palavras significativas presentes no texto (também chamadas de palavras-chave) para delimitar o tema da busca mais rápida e específica. A isso denominamos de mecanismos de busca (em inglês, "search engine").
Nesta lição do curso você vai aprender a utilizar de forma competente esses vários recursos genéricos de localização de informação na Internet. Na próxima lição você vai conhecer os catálogos, índices e bases de dados específicos para a área de saúde.
Um catálogo contém coleções de "links" (como são chamados, em inglês, os endereços de determinados recursos na Internet, ou seja, seus nomes e onde eles podem ser encontrados), que são categorizados ou subdivididos em diversos tópicos e subtópicos. Esses links são sugeridos pelas próprias pessoas ou instituições que colocaram a informação na Internet, e nem todos são aceitos para inclusão pelo site que gerencia o catálogo. Desta forma, os catálogos são geralmente mais restritos do que as outras formas de busca de informação listadas acima. Uma vantagem é que existe para cada endereço uma descrição sumária sobre o que trata o site, permitindo uma seleção a grosso modo pelo usuário, antes mesmo de visitá-los.
Fazendo uma analogia com um livro, o catálogo equivale ao sumário, ou seja, a lista de capítulos que aparece no começo.
Existem três tipos de catálogos, dependendo do seu grau de especialização:
A informação que o usuário está interessado em buscar em um catálogo pode ser localizada de duas maneiras:
A maioria dos serviços de catalogação oferece um misto das duas abordagens, ou seja, ele permite a navegação, e dentro de cada página ou subpágina permite também a busca restrita à mesma.
Alguns dos catálogos gerais mais conhecidos são:
Yahoo! | http://www.yahoo.com |
InfoSeek | http://www.infoseek.com |
Open Directory | http://www.dmoz.org |
LookSmart | http://www.looksmart.com |
About | http://www.about.com |
Cadê? | http://www.cade.com.br |
Yahoo! Brasil | http://www.yahoo.com.br |
Achei! | http://www.achei.com.br |
Suponhamos que queremos localizar sites recomendados, com informações educacionais sobre AIDS para adolescentes, em inglês. Na primeira forma de utilização do catálogo, vamos tentar achar essa informação utilizando a navegação na árvore de classificação do Yahoo!. Para isso é preciso ter uma boa idéia a priori de como se classifica esse tipo de slide, e isso em geral é feito por meio de exploração, pois não conhecemos ainda como o Yahoo! a enquadraria:
Para localizar a mesma informação utilizando palavras-chave, volte ao topo da página. Digite na caixa de busca que ali aparece, as palavras:
AIDS kids education
Em seguida, clique no link Directory (catálogo), para fazer a busca interna no Yahoo!. Note que o sistema de busca localiza
vários dos sites que você tinha visto previamente através da navegação, quanto
outros sites classificados em outros pontos do catálogo.
Exercício 1.1Utilizando o serviço Cadê? (www.cade.com.br), localize sites brasileiros com informações sobre acne na infância. Utilize primeiro a forma de navegação pela árvore hierárquica de conhecimento, e depois usando o mecanismo de busca interno (palavras-chave). Envie para o professor: em que ponto(s) da árvore de classificação você achou os sites interessantes, quais foram eles (endereços de pelo menos 2), e as palavras-chave que utilizou. Resposta:Busca na árvore de classificação:
Palavras-chave: acne |
Como o seu nome indica, a chave do sucesso de uma busca depende muito das palavras-chave que você utiliza. Se você dominar esta "arte", será um pesquisador eficiente da Internet! Em seguida damos algumas dicas sobre como utilizar as palavras-chave:
Exercício 1.2Quais são as palavras-chave e seus possíveis sinônimos nas seguintes frases de busca?
Respostas:
|
Os índices enfatizam o oferecimento de um serviço mais abrangente de busca de informação do que os catálogos. Eles indexam, palavra por palavra, cada um dos documentos existentes na WWW (World Wide Web) e em alguns casos, existem outros serviços que indexam outras informações da Internet, como listas de discussão e grupos de notícias (newsgroups).
Em analogia com o mundo dos livros, eles seriam equivalentes ao índice remissivo, por ordem alfabética, que aparece no final.
Os índices funcionam exclusivamente com busca de palavras-chave fornecidas pelo usuário. O mecanismo de busca procura as palavras fornecidas pelo usuário em enormes arquivos, chamados de índices, que são construidos por softwares especializados chamados spiders ("aranhas") ou softbots (robôs de software), e que realizam o trabalho de indexação (construção dos arquivos-índices de forma automática. Eles percorrem continuamente a Internet, saltando de link em link, e reconhecendo automaticamente se uma determinada página já consta do índice ou não. Caso não conste, ela é adicionada automaticamente ao mesmo, e todas as palavras de texto encontradas também são colocadas no arquivo de palavras-chave. Portanto, ao contrário dos catálogos, os índices não precisam geralmente ser avisados da existência de uma página na Internet. Se esta página tiver um link para ela em algum lugar público, previamente indexado, ela será achada automaticamente num prazo que varia de uma a quatro semanas.
Devido a essa filosofia, os índices gerais acumulam um número gigantesco de páginas e de palavras indexadas. Por exemplo, o Google, um dos mais completos, indexa atualmente cerca de 1,5 bilhões de páginas na WWW, com um total de 100 bilhões de palavras, que podem ser encontrados em mais de 3 milhõesl servidores em todo o mundo. A desvantagem, obviamente, é que toda vez que se especifica uma busca usando uma combinação muito genérica de palavras, o sistema retorna milhares, dezenas de milhares, ou até centenas de milhares de links, o que torna praticamente impossível a localização da informação específica desejada, como se fosse achar uma agulha em um palheiro.
Alguns dos índices gerais mais conhecidos são:
Altavista | http://www.altavista.com |
http://www.google.com | |
HotBot | http://www.hotbot.com |
InfoSeek | http://www.infoseek.com |
Fast | http://www.alltheweb.com |
Lycos | http://www.lycos.com |
Excite | http://www.excite.com |
RadarUOL | www.radaruol.com.br |
Radix | www.radix.com.br |
Gubbi | busca.ubbi.com.br/ |
Alguns desses índices também oferecem catálogos,
como é o caso do Hotbot, Google, Excite, Infoseek e outros. Por outro lado, alguns catálogos, como
o Yahoo! dão acesso a mecanismos de busca do tipo indice, como o Google. Assim, se a busca por palavras-chave
realizada no catálogo não der resultado, automaticamente o mecanismo de busca é acionado,
usando as mesmas palavras-chave.
Exercício 1.3Utilizando o serviço Google (www.google.com), localize pelo menos cinco documentos relevantes sobre o seguinte tema: tratamento de endocardite bacteriana causada por uso de drogas injetáveis, em inglês. Envie para o professor sua estratégia de busca, ou seja, as palavras chave que utilizou, e o resultado da busca, com os endereços mais relevantes encontrados por você. Resposta: Palavras-chave: bacterial endocarditis drugs inject |
De modo a obter buscas eficientes, é muito importante entender como o mecanismo de busca apresenta os resultados para o usuário. De maneira geral, o mecanismo de busca gera uma lista de links, apontando para as páginas que contêm, de alguma forma, as palavras-chave utilizadas para realizar a busca. Mas que tipo de critério é usado pelo mecanismo de busca para listar estes resultados na ordem em que eles aparecem? O que faz um link ser colocado nos primeiros lugares desta lista, e outros em outros lugares? Quando obtemos muitos resultados, quanto tempo devo perder explorando as páginas sucessivas geradas pelo sistema de busca?
A esses critérios denominamos ordenação por relevância. Diferentes mecanismos de busca usam diferentes critérios de relevância: esse é o primeiro dado que devemos levar em conta. Em segundo lugar, é importante saber que a maneira como especificamos a busca também altera a ordem de relevância dos resultados, como por exemplo, em alguns casos, a ordem em que colocamos as palavras-chave, ou se usamos técnicas mais avançadas de busca, como uso de aspas, parênteses, e operadores lógicos, como AND, OR e NOT (essas técnicas serão explicadas na próxima lição deste capítulo).
Evidementente, os mecanismos de busca náo são "inteligentes", no mesmo sentido de um ser humano, para selecionar os resultados mais relevantes. Entretanto, determinadas técnicas automáticas usadas pelos mecanismos de busca funcionam razoavelmente.
Os critérios de relevância mais utilizados são, em ordem em
que sáo aplicados aos resultados:
As palavras chaves (argumentos de busca) sáo encontrados no TITLE da página
(aquela barra superior que aparece quando o navegador visualiza algum documento). Isso significa que o próprio
autor achou que esse título reflete o conteúdo do trabalho (infelizmente, muitos autores desconsideram
isso e não compõem um título adequado, como seria desejável).
Exercício 1.4Utilizando o serviço de busca Google, localize páginas sobre ginecomastia, em português. Anote o número de links resultantes, e os 10 primeiros links listados, notando em que ponto aparece a palavra-chave usada (título ou texto). Em seguida, acrescente a palavra chave "anabolizantes", e repita o que fez acima. Compare os resultados, e analize o efeito sobre a relevância dos trabalhos listados Resposta: 1. Palavra-chave inicial: ginecomastia. Resultado aproximado: 1350 links
Exemplo de link achado, com as palavras de busca em negrito: Perigos dos Esteróides
Anabolizantes |
Os catálogos e os índices são apropriados para pesquisar informações que estejam disponibilizadas em servidores acessíveis através da Web, ou seja, que têm um endereço que começa com http://
Entretanto, uma grande quantidade de informações úteis para a medicina está contida em servidores especiais, que só podem ser acessados através de softwares específicos, chamados de gerenciadores de bases de dados. Um exemplo muito conhecido é a MEDLINE, a maior base de dados bibliográficos de medicina do mundo, ou seja, as referências de trabalhos publicados em revistas. Essas referências estão armazenadas em uma base de dados, e para fazer uma pesquisa nessa base, é necessário um mecanismo de acesso especial. Felizmente, muitas bases de dados (mas não todas...) já oferecem um mecanismo de busca através da própria Web, facilitando muito o acesso de quem deseja fazer uma pesquisa. É o caso da MEDLINE, inclusive, que pode ser acessada pela Web por meio de vários serviços, como o PubMed (www.ncbi.nlm.nih.gov/PubMed), a BIREME (www.bireme.br), etc. (veremos em mais detalhes a pesquisa bibliográfica através da Internet em uma outra lição deste capítulo).
Por estarem contidas em bases de dados, os documentos bibliográficos não são alcançados pelos catálogos e mecanismos de busca comuns, portanto, eles não podem ser achados através de buscas externas. É necessário entrar na página ou páginas que permitem o acesso à base de dados, e fazer uma pesquisa separada. Outra característica é a qualidade e a seletividade. Como as bases de dados têm critérios de inclusão de ítens bibliográficos, elas não padecem dos mesmos problemas dos catálogos e, principalmente, dos índices, que são muito mais abrangentes, e portanto não apresentam mecanismos de seletividade e qualidade (estudaremos esse problema em outra lição deste capítulo).
Existem outras bases de dados que podem ser pesquisadas, além das bases bibliográficas. As bases estatísticas são um outro exemplo. No Brasil, estatísticas de saúde podem ser achadas no site do DATASUS (www.datasus.gov.br).
Uma dúvida freqüente dos usuários é quando usar um catálogo ou um índice para realizar pesquisas na Internet. Cada um tem suas vantagens, desvantagens e indicações, e é importante conhecê-las bem, no sentido de obter um bom resultado:
Em conclusão, os catálogos são melhor usados quando não
se conhece bem o assunto da busca, e se deseja fazer uma seleção inicial, com base na exploração.
Outra utilização interessante para os catálogos é quando é difícil delimitar
o tema através de palavras-chave, apenas, requerendo um pouco de investigação. Finalmente,
os catálogos são mais úteis que os índices quando se quer alguma indicação
de relevância feita por seres humanos (os classificadores).
Os índices, por outro lado, podem ser usados em qualquer ocasião
(muitas pessoas preferem apenas usar esse método de busca), porém eles são muito dependentes
da qualidade das palavras-chave usadas para a busca. O número geralmente grande de resultados costuma atrapalhar,
também. Portanto, recomenda-se usar os índices para buscas rápidas, que utilizem muitas palavras-chave
combinadas.
Exercício 1.5Assinale, para cada uma das especificações de busca abaixo, qual deve ser o melhor método para realizá-la (Catálogo, Índice ou Banco de dados). Justifique.
Resposta:1C, 2B, 3I, 4B, 5C, 6I Justificativa: nos problemas 1 e 5, o fato de se procurar sites específicos,
em nível de home page (no primeiro caso, clínicas particulares, e no segundo, revistas eletrônicas),
desaconselham o uso de busca por palavras-chave em índices, levando portanto ao uso de catálogo.
Nos problemas 2 e 4, a natureza científica, a necessidade de ser informação confiável
(trabalhos publicados em revistas), e a existência de palavras-chave razoavelmente específicas, recomendam
o uso de bancos de dados bibliográficos. Finalmente, os problemas 3 e 6 indicam o uso de índices,
pois são buscas globais, que não envolvem necessariamente trabalhos científicos publicados,
mas sim sites, e que podem ter a informação escondida em seu interior, desaconselhando o uso de catálogos.
|