A Internet tem cada vez mais informações disponiveis, por isso o uso de mecanismos de busca (search engines) e catálogos on-line (directories) é essencial para quem deseja localizar rapida e eficientemente o que deseja. No entanto, a maioria dos usuários não conhece bem os poderosos recursos disponíveis em muitos desses mecanismos, e simplesmente coloca as palavras-chave na busca sem maiores cuidados. Esse conhecimento é muito importante para conseguir realizar buscas bem feitas. No texto que se segue, damos algumas orientações introdutórias sobre esses recursos mais avançados e dicas importantes de uso, utilizando como exemplo o conhecido mecanismo Altavista (www.altavista.com), que é considerado um dos mais completos e eficientes (existe também a versão brasileira, www.altavista.com.br, como acontece com o Yahoo! e o Google).
Se você pretender utilizar outros mecanismos, como HotBot, Lycos, Excite , InfoSeek, WebCrawler, etc., recomendamos que leia primeiro a seção de Help sobre buscas avançadas (Advanced Search ou Search Tips) correspondente a cada serviço.
O objetivo primordial de uma busca na Internet é localizar com a maior precisão possível os documentos ou sites que contenham o tema que o usuário deseja. Esse objetivo pode ser muito fácil de se atingir, ou muito difícil, dependendo de dois fatores:
1. Se o assunto realmente está disponível na Internet e foi indexado pelo mecanismo de busca;
2. Se as palavras-chave utilizadas na busca são suficientemente específicas.
Supondo que o assunto procurado existe na Internet, o problema é escolher o que chamamos de um "marcador específico". Esta é uma palavra, frase ou conjunto de palavras que idealmente:
1. Somente existe nos documentos procurados que interessam;
2. Não existe nos documentos que não interessam.
Por exemplo: se queremos achar tudo sobre uma doença altamente específica,
como "Alzheimer", este é um excelente marcador específico
(não existe nenhuma outra doença com esse nome, e presumivelmente, nenhum outro tema). Já
se quisermos achar os nomes dos atores do filme "Titanic" feito em 1997, a palavra-chave "Titanic"
sozinha não é um marcador suficientemente específico ( "titanic" em inglês
significa "titânico" e evidentemente podem existir documentos com essa palavra. Além disso,
mesmo se se referirem ao navio, podem não referenciar o filme). Assim, neste caso poderíamos usar
as palavras "Titanic",
"Cameron" (o diretor do filme) e "movie".
As palavras "1997" e "actors"
não devem ser usadas, pois não vão acrescentar nada à exatidão da busca, e são
pouco específicas.Infelizmente, para a maioria das buscas é difícil achar um marcador específico.
Deste modo, o usuário deve recorrer a estratégias mais complexas e na base de tentativa e erro. Uma
primeira idéia para encontrar alguma coisa muito específica, é utilizar frases exatas. Nesse
caso, deve-se usar aspas entre as palavras. Exemplo: "João Francisco de Oliveira", "Núcleo
de Informática Biomédica".
Caso contrário, aparecerão todos os Joãos, todos os Franciscos, todos os núcleos, etc.
Neste caso, o mecanismo usa uma sintaxe: o que estiver entre aspas não deve ser quebrado em suas palavras
individuais.
Outro método eficiente e preciso consiste em utilizar de forma adequada os operadores lógicos AND, OR, NOT e NEAR. É o que alguns mecanismos de busca chamam de "busca booleana" (de George Boole, matemático inglês do século XIX que desenvolveu a lógica matemática).Um operador lógico permite combinar várias palavras-chave ou frases de maneiras específicas, de tal forma que a busca seja concentrada sobre o objetivo, não deixando escapar nada, e excluindo aqueles que não interessam.Para encontrar textos com uma palavra e outra, utilize o operador lógico AND. Exemplo: aids AND homosexuality . Neste caso, o mecanismo de busca seleciona todos os documentos que tenham simultaneamente as duas palavras, mas não aqueles que tenham somente uma das palavras ou nenhuma delas. No exemplo, as palavras aids e homosexuality tem que ocorrer no texto, em qualquer posição do mesmo, para que ele seja correlacionado.Podemos usar AND para combinar frases exatas e palavras-chave. Exemplo: você quer encontrar Leonardo da Vinci no museu do Louvre, então digite: "leonardo da vinci" AND "louvre museum"
Outro operador lógico importante é o OR (ou). Ele serve principalmente para encontrar documentos que tenham qualquer uma de várias palavras chave (sinônimos, assuntos alternativos, etc.) Exemplo: aids OR "sindrome de imunodeficiência adquirida" OR SIDA. .
Lembre-se que os mecanismos de busca não sabem a diferença entre palavras singulares e plurais, flexões de verbos, etc. Felizmente podemos utilizar o caractere * (asterisco) para especificar raízes. Exemplo: garden* vai pegar todas as variantes, como garden, gardens, gardening, gardener, gardenia, etc.Para encontrar textos com uma palavra, mas não com outra, utilize AND NOT Exemplo:
AIDS AND Homosexuality AND NOT AZT
Para encontrar textos que contenham duas palavras separadas entre si por no máximo 10 palavras, utilize NEAR. Exemplo: se você quiser encontrar imagens vistas na doença de AIDS em homosexuais e em adolescentes na cidade de Campinas, digite: imagens NEAR aids NEAR homossexual NEAR adolescentes NEAR Campinas. Nesse caso, todos os documentos que contenham essas palavras próximas entre si (geralmente no mesmo parágrafo), em qualquer ordem, serão selecionados. Assim se evita o problema de selecionar textos em que essas palavras não estão relacionadas entre si, pois ocorrem em pontos muito diferentes de um texto (como acontece com o AND).Os operadores lógicos podem ser combinados de várias maneiras, inclusive utilizando parênteses. Os parenteses, neste caso, forçam uma prioridade algébrica. Exemplo:
(aids OR sida OR "acquired immunodeficiency syndrome") NEAR (therapy OR treatment) AND NOT azt
Normalmente a ordem correta de avaliação algébrica é: NOT, AND/NEAR e OR. Por isso, foi necessário colocarmos os ORs entre parênteses, para forçar a sua avaliação antes dos ANDs. Tome cuidado ao usar expressões muito complexas. Se você errar alguma coisa quanto ao uso do AND, OR, NEAR e NOT, e os parênteses, o resultado poderá vir totalmente distorcido. Além disso, não use palavras em excesso.Isso, se bem usado, permite especificar combinações de busca altamente eficazes e precisas, e é um recurso muito poderoso, e o preferido dos pesquisadores profissionais.
No Altavista você pode também realizar buscas usando frases ou perguntas em linguagem natural, ou seja, como se você a fizesse para um outro ser humano. Embora o Altavista não "entenda" a frase como um ser humano o faria, ele tem algums mecanismos embutidos que desmontam a frase em seus constituintes, retirando as palavras menos importantes, e analisando-a de várias maneiras de modo a otimizar a busca. No entanto, os resultados podem não ser tão satisfatórios como uma busca booleana, pois o Altavista não "sabe" os sinônimos de uma palavra técnica, por exemplo. Exemplo: você quer saber por que as mulheres adoram chocolate, então digite: Exemplo:
Why women crave chocolate?
Existem outros mecanismos de busca mais inteligentes que o Altavista para fazer pesquisas em linguagem natural. Um dos melhores é o Ask Jeeves (http://www. askjeeves.com). Exemplo: Where can I buy classical music CDs on-line?
Se você achar que em sua pesquisa está vindo muitos resultados, você pode refiná-la na opção Refine. Este mecanismo ordena dinamicamente os resultados em diferentes tópicos permitindo que você inclua ou exclua conjuntos mais específicos de palavras chave de forma assistida pelo computador, aumentando a precisão da próxima busca
Outro recurso muito interessante para buscas sofisticadas e muito poderosas é usar o que chamamos de meta-palavras. Essas são palavras prefixadas que estipulam o local do documento-fonte em HTML onde a busca deve ser realizada. Podemos explicitar que uma ou mais palavras-chave sejam procuradas nos links (A HREF), nas imagens (IMG SRC), no título (TITLE), em URLs ou domínios específicos, etc.Por exemplo, para saber todos os sites da Internet onde foi feito um link para um determinado endereço, digite na caixa de busca do Altavista o comando link:URL. Exemplo:
link:mailto:sabbatin@nib.unicamp.br
Neste caso, o mecanismo de busca vai listar todos os documentos que tiverem o comando <A HREF="mailto:cardoso@nib. unicamp.br".Outro exemplo para encontrar um link:
link:http://www.nib.unicamp.br
Para encontrar uma imagem: Exemplo: image:vinci (dica: não colocar palavras combinadas, por exemplo Leonardo Da Vinci, pois aquele nome é nome de arquivo. Não precisa colocar a extensão como .jpg, .gif, etc.)· Para encontrar um texto: Exemplo:
text:terror noturno caso 2
· Para encontrar um título: Exemplo: title:Louvre Museum
· Para encontrar um domínio: Exemplo: domain:org
· Para encontrar um applet: Exemplo: applet:morph
Os operadores lógicos podem ser usados com as meta-palavras, também. Se você quiser saber se existe o seu endereço eletrônico ou o seu site em outros sites que não o de seu grupo, digite: Exemplo: link: mailto:sabbatin@nib.unicamp.br AND NOT url:www.nib.unicamp.br. Isto significa que você quer encontrar o endereço referido, mas não no site do seu grupo.
Gostaria de realizar uma esquisa em todos os principais mecanismos de busca da Internet, ao mesmo tempo ? Isso também já é possível com grande rapidez e facilidade, sem precisar entrar em cada um dos mecanismos. O Metacrawler faz isto. Ele acessa automaticamente o Lycos, Altavista, HotBot, Yahoo!, InfoSeek e WebCrawler.Exemplo: vá no endereço e digite
AIDS dementia brain images
Endereços na Internet
|
Exercício 2.1Utilizando o mecanismo de busca Altavista (www.altavista.com.br), use recursos de busca avançada booleana para localizar páginas no Brasil que tenham a seguinte informação:tratamento de endocardite bacteriana ou viral que foram publicados nos últimos 6 meses, em português. Descreva a sua estratégia de busca (palavras-chave usadas e equação de busca) e envie para o professor, juntamente com os quatro trabalhos mais relevantes que localizou. Explique porque os considerou como tendo a maior credibilidade. Resposta: Palavras-chave: (terapia OR tratamento) AND endocardites NEAR (viral OR bacteriana) Aproximadamente 140 páginas encontradas. Exercício 2.2Usando o Altavista, localize pelo menos uma página em português que tenha imagens do cérebro na doença de Alzheimer. Envie os endereços completos dos sites que achar, bem como a equação de busca que você utilizou. Resposta: Equação de busca: image:alzheimer AND cérebro Resultado: http://www.psiqweb.med.br/geriat/alzh3.html |