quinta-feira, outubro 16, 2003

Se é Bayes, é bom?



A nova onda do antispam são os filtros bayesianos. Os spammers sorriem de orelha a orelha; os usuários estão mal servidos.

Depois de tentativas bem-intencionadas (mas associadas a serviços pagos, o que é anátema para 99% dos usuários domésticos), tendo à frente o SpamNet, é a vez dos concorrentes grátis, como o SpamBayes. Tanto um como outro analisam as mensagens que entram e as confrontam com uma série de critérios que definem o que é e o que não é spam.

O que for considerado definitivamente spam vai para a pasta "Junk E-Mail"; se o programa tiver dúvidas, a mensagem é filtrada para a pasta "Junk Suspects". Então o usuário humano pode passar o pente fino e identificar sozinho os falsos negativos e os falsos positivos. Nesse processo, o SpamBayes vai ficando cada vez mais sábio, o que aumenta a precisão ds filtragem.

Perfeito? Na prática, a teoria é outra. Antes de mais nada, o SpamBayes não tem como impedir que as mensagens indesejadas sejam downloadeadas. Aquele anexo gigante, totalmente não-solicitado, será inteiramente baixado antes que o filtro entre em ação. As companhias telefônicas devem sorrir de orelha a orelha. Segundo, a seguir a configuração padrão, mesmo as piores mensagens são efetivamente armazenadas em pastas acessíveis, e quaisquer vírus ou cavalos de Tróia contidos nessas mensagens poderão ser acionados por descuido. Terceiro, o SpamBayes não garante qualquer meio de evitar comportamento reincidente dos spammers -- quem envia o spam não recebe nenhum sinal de que sua mensagem foi barrada no meio do caminho.

No fim, a leitura da caixa de entrada pode até ficar mais limpa e objetiva; no segundo plano, o spam continuará entrando, consumindo largura de banda e expondo o usuário a certos tipos de "acidente". E o usuário jamais ficará totalmente livre da brincadeirinha de identificar os amigos que são inimigos e os inimigos que são amigos. Mas sem conseguir barrar nenhum indesejável.

Ainda sou mais o MailWasher, que não depende de nenhum programa de e-mail em particular faz a seleção devida com as mensagens ainda no servidor. Pena que, na versão atual, só os pagantes consigam filtrar mensagens de mais de uma conta.

Nenhum comentário:

Google