A Busca da Informação na Web

        Um dos grandes problemas para a preparação de aulas e a realização de pesquisas é a busca e identificação de informações relevantes e confiáveis nos assuntos a serem abordados. Este problema não é novo e já era percebido antes do advento da Web, que introduziu alguns novos elementos na questão.
        De modo geral, os principais aspectos na busca e identificação de informações são a credibilidade da fonte de informação e as características da informação desejada, que podem ser explicitadas através da relevância dentro do tema, da exatidão dos dados, da atualização e do nível de profundidade e abrangência.



        Em tempos não muito distantes, a pesquisa das informações necessárias era feita através da leitura de livros e periódicos em bibliotecas, especializadas ou não. Esta etapa era sempre trabalhosa e algumas vezes tediosa. Dado o estado precário da maioria das bibliotecas brasileiras, freqüentemente livros e periódicos citados em publicações não eram encontrados, deixando lacunas dificilmente preenchidas. Por vezes, à parte de pesquisa bibliográfica se alongava durante meses, dependente da obtenção de cópias de artigos em bibliotecas no exterior ou mesmo aguardando a importação de livros.
        Com o advento da Web, a busca e identificação de referências bibliográficas passaram a ser muito mais ágeis, permitindo a obtenção das mesmas em questão de dias ou mesmo horas. Certamente esta agilidade não é uma regra geral e, em algumas áreas científicas ou assuntos ela é bem mais lerda. Entretanto, se por um lado a Web trouxe agilidade na obtenção de artigos e encomendas de livros, por outro também trouxe o problema da informação em excesso, da informação sem credibilidade e da informação inútil e sem precisão (especialmente importante em áreas científicas e educacionais).
        Um livro ou artigo publicado em periódico reconhecido significa que os textos passaram por uma revisão feita por especialistas no assunto e, portanto, assume-se que as informações ai contidas têm credibilidade (existem algumas exceções). A Web, sendo um meio sem censura prévia e que apresenta enorme facilidade para a publicação de materiais por qualquer pessoa com um mínimo de conhecimento em informática, traz consigo o problema da credibilidade das informações apresentadas em "homepages". Além disso, dada à facilidade de publicação, existe muita duplicação de informações, sem o cuidado com a coerência e com a autenticidade do texto original, causando um excesso de informações errôneas e inúteis, que poluem o ambiente e dificultam a garimpagem das informações verdadeiramente relevantes.

Como encontrar Informação na Web

Existem várias maneiras para acessar a informação na internet:

  • Ir diretamente ao Site se você tem o Endereço
    Se você conhece o endereço de internet do site que quer visitar, use o browser para acessá-lo e, eventualmente explorar os links sugeridos pelo site para ampliar a informação. Por exemplo, a "homepage" do Observatório Nacional é http://www.on.br.

  • Explorar um Diretório de Assuntos
    Quando quer ver sites muitas vezes recomendados por especialistas ou para responder a questões mais gerais de exploração de um tópico, use um diretório de assuntos. Um diretório de assuntos é um serviço que oferece uma coleção de links de recursos da internet submetido pelos criadores/avaliadores do site e organizado em categorias de assuntos. Existem dois tipos básicos de diretórios: diretórios acadêmicos e profissionais. Use o diretório apropriado às suas necessidades. Por exemplo, um diretório de assuntos de Astronomia é a Biblioteca Virtual de Astronomia (http://www.prossiga.br/astronomia). Outro exemplo de diretório acadêmico é o INFOMINE (http://infomine.ucr.edu). Podemos citar o Yahoo ( http://www.yahoo.com) como portal comercial. Os diretórios de assuntos diferem muito na seletividade, indo desde os comerciais tipo Yahoo, que não avalia cuidadosamente o conteúdo submetido, até os tipo INFOMINE (da Universidade da Califórnia) que selecionam somente fontes consideradas de interesse para a comunidade acadêmica e de pesquisa.

  • Fazer uma pesquisa usando um Mecanismo de Buscas da Web
    O mecanismo de buscas na Internet permite ao usuário entrar com palavras-chave relacionadas a um tópico e recuperar informação sobre sites da internet que contém aquelas palavras-chave. Existem mecanismos de buscas disponíveis para diversos protocolos da internet. Muitos mecanismos de buscas compilam uma base de dados abrangendo múltiplos protocolos, incluindo HTTP, FTP e Usenet. Eles também podem buscar arquivos de multimídia na "Deep Web", que são acessáveis em pesquisas separadas.

  • Explorar a informação armazenada em bases de dados na Web, conhecida como "Deep Web"
    O conceito de "Deep Web" (Web Profunda ou Invisível) é relativamente recente e refere-se ao conteúdo que está armazenado em bases de dados acessáveis pela Web, mas não disponíveis via mecanismo de buscas, isto é, seu conteúdo é invisível aos mecanismos de buscas. Normalmente numerosas informações são armazenadas em bases de dados, tais como notícias, listas de empregos, vôos comerciais, informações científicas sobre objetos e fenômenos, etc. Este conteúdo é acessável somente através de perguntas (query) feitas no site que gerencia a base de dados. Outros conteúdos não vistos pelos programas Spider dos mecanismos de buscas são os arquivos não textuais, tipo arquivos de multimídia, arquivos gráficos e documentos em formatos não padronizados (Pdf, Word, xls). Mais recentemente os mecanismos de buscas tem indexado imagens, videos e arquivos em PDF e Word. A melhor maneira de acessar informação na Web Invisível é procurar nas próprias bases de dados.

  • Juntar-se a um Grupo de Discussão (e-mail) ou a Usenet (newsgroup)
    Existem milhares de grupos de discussão e newsgroups sobre uma variedade enorme de tópicos. Nestes grupos pode-se fazer perguntas a especialistas e/ou ler as respostas às perguntas que outros fizeram. Estes grupos fornecem uma boa maneira de se manter atualizado com o que está sendo discutido na internet sobre a área de seu assunto. Os grupos de discussão algumas vezes estão associados com instituições acadêmicas. Os grupos de discussão são controlados através de programas, cujos mais comuns são o Listserv, Majordomo e Listproc. Para acessar os newsgroups da Usenet precisamos de programas "newsreader". Geralmente os browsers oferecem programas newsreader.