19 de maio de 2015 | Ano 2, Edição #14 | Texto: | Ilustração: Beatriz Leite
DEEP WEB: CHEGAMOS AO FUNDO DO POÇO e você já esteve lá também

A internet é maravilhosa, tem site, face, meme, ??, Tumblr e Capitolina. Tem também comentarista babaca de portal e 4chan tóxico. Pois saibam que essa internet que a gente conhece tem nome e sobrenome: surface web ou internet da superfície em bom português. Essa é a internet que os buscadores, tipo o Santo Google, enxergam.

Sabe aquela história que você já ouviu de que você só usa 10% do seu cérebro essa fatia da internet não é nem 10% daquilo que existe por trás da sua conexão? O resto dessa pizza é a deep web, é justamente o que está além do alcance dos buscadores.

darkweb1

Nos resta entender como funcionam os servidores do Google (e seus congêneres, o Bing, Yahoo! ou Baidu). O que eles fazem é uma leitura dinâmica constante de uma quantidade absurda de páginas e identificam palavras-chave em cada uma delas, como se destacassem com marca-texto só aquilo que é crucial no conteúdo. Em seguida esses dados são organizados em um catálogo de modo que fique fácil encontrá-los depois. Esses processos são chamados respectivamente de crawling e indexing. A quantidade de informação que o Google retém é realmente mínima, é por isso que quando você faz buscas complexas, com muitas palavras ou frases inteiras, ele falha na entrega de bons resultados.

Recapitulando (agora em termos mais técnicos), surface web é a internet que está no índex e deep web é a internet não indexada. Então não é como se jogando alguma coisa no Google você vá tropeçar e cair por engano na deep web… na verdade é ainda mais fácil.

Toda vez em que faz login no seu Gmail você cai na deep web. O Gmail é uma página dinâmica que requer identificação do usuário, ou seja, ela não tem conteúdo pré-estabelecido e só “acontece” quando você loga. Os buscadores não leem páginas dinâmicas com a mesma facilidade com a qual lidam com páginas estáticas (ou em alguns casos não enxergam nada mesmo, ainda que venha rolando um investimento pesado na área).

Outro exemplo perfeitamente mundano da deep web é aquele lance de “conteúdo indisponível” do Facebook. Qualquer conteúdo postado com configuração de privacidade que não seja pública se baseia na identificação para ser disponibilizado ou não, então, tipo, se eu posto uma selfie no grupo das Capitolinas (que não é público ou aberto) só tem acesso ao post quem é do grupo e está logada na sua conta — o que não inclui os servidores crawlers do Google, o que faz com que minha selfie não seja indexada e fique ali na deep web. Post agendados (no Facebook, Tumblr, WordPress etc) seguem mais ou menos o mesmo raciocínio, eles existem na surdina ou em alguns casos podem ser acessados só por quem tem a url exata do conteúdo.

A lista segue.

Decolar.com? Deep web. Os crawlers do Google só conseguem pular de link em link, não digitam nada na busca ou preenchem formulários com destino, datas e número de passageiros. E, de novo, o que os olhos não veem o Google não sente indexa.

Sites estranhos de venda de drogas? Deep web também, mas com ressalvas pra não perpetuar a confusão. Existe uma outra parcela, bem pequena e potencialmente ilícita, da deep web que não só não está sob o radar dos buscadores como foi intencionalmente escondida ali. A dark web não é bem secreta, o lance é que ela preserva o anonimato de quem hospeda e visita seus sites através de pacotes de segurança como o Tor. Apelidado carinhosamente de cebolinha, o Tor é o encriptador mais amplamente difundido e funciona jogando a comunicação por entre camadas internas (tipo uma cebola) antes de chegar em qualquer lugar, fazendo com que fique praticamente impossível rastrear de onde ela veio ou para onde vai.

Note que, além dos próprios sites, os usuários também precisam rodar o Tor para chegar nos recônditos da dark web, então essa ideia de que você, completo desavisado, pode cair sem querer num limbo de tráfico de órgãos, falsificação de documentos e pornografia infantil é um bicho-papão 2.0. Vale dizer também que a dark web não é necessariamente um lugar ruim: muitos dos seus usuários são pessoas comuns ou ativistas da internet livre que encontram ali um refúgio longe da vigilância em massa, em especial em países como a China ou Coreia do Norte onde a censura pega forte.

darkweb2

Carolina Stary
  • Ex-colaboradora de Tech & Games

  • Lorena Green

    Detonou! Muita gente confunde o termo deep web, e dou muita risada quando pessoas dizem que channers são deep web apenas pelo fato de existir um pseudo anonimato. Linda explicação.

  • Gabriela S. Padilha

    Adorei o post, explicou super bem. http://www.alemdolookdodia.com

  • Pingback: Prato do dia: VOCÊ - Capitolina()

Sobre

A Capitolina é uma revista online independente para garotas adolescentes. Nossa intenção é representar todas as jovens, especialmente as que se sentem excluídas pelos moldes tradicionais da adolescência, mostrando que elas têm espaço para crescerem da forma que são.

Arquivos