O Google aprendeu a falar, igualzinho ao Billy

Na Revista Veja da semana passada uma matéria muito interessante traz a realidade para o que, no livro “A Turma do CP-500”, apresentei como ficção.

Se na história juvenil, Billy, um antigo computador CP-500, dotado de processadores modernos e sistema de inteligência artificial, interage com uma turma de cinco adolescentes; na vida real, o Google busca essa interação com seus milhões de usuários por meio de perguntas que são interpretadas e respondidas por voz ou por uma lista de links.

De acordo com a matéria “Olha quem está falando” de Filipe Vilicic (leia parcialmente em http://veja.abril.com.br/noticia/vida-digital/o-google-aprendeu-a-falar), o site de busca agora permite que seus usuários façam pesquisas por meio de voz.

A funcionalidade usando a língua portuguesa estreou no último dia 10, mas o recurso já existia em inglês desde junho do ano passado. Após a pesquisa, o site dá a resposta, em português, com voz mecanizada, com sotaque brasileiro. Quando o Google não consegue montar a resposta com áudio, ele exibe uma lista de links.

Para testar o recurso, é preciso ter o navegador Google Chrome. Na caixa de pesquisas, você encontrará um ícone de microfone. Clique nele. O Google irá apresentar a mensagem “Fale agora”.

Por exemplo, tente a seguinte pergunta, falando de forma clara e bem articulada:

“Qual o dia de Corpus Christi em 2014?”

Google1

O Google irá exibir algo parecido com a tela acima, além de apresentar a resposta com o áudio.

Outra pesquisa que pode gerar um resultado em áudio é: “Qual a previsão do tempo para amanhã no Rio de Janeiro?”.

Mas se algumas pesquisas têm como resposta algo complexo demais para ser expresso em áudio, o Google nos apresenta uma lista de possíveis links.

Tentei a pesquisa: “Qual o site da escritora Ana Cristina Melo?” e obtive uma lista de links, sendo que o primeiro correspondia ao meu site.

Google2

 

De acordo com a matéria da Veja, “para cada questão enviada, ocorre um avançado processo de Big Data, que garimpa, na enorme quantidade de informações armazenadas nos servidores do Google, qual é a resposta correta. Tudo acontece em microssegundos”.

A reportagem explica num passo a passo que, num primeiro momento, a voz da pessoa é captada, separando-se a fala do barulho de fundo. Essa fala é transportada para o formato de texto, associando-se cada fonema falado a um banco com 500 milhões de combinações possíveis de letras e palavras. Os servidores do Google interpretam a frase e realizam a pesquisa em uma rede de mais de 3 milhões de computadores, utilizando como motor de busca um algoritmo com base em 2 bilhões de termos e 500 milhões de variáveis. A resposta é montada no formato texto para depois ser transformada em áudio e, enfim, ser reproduzida ao usuário. Tudo isso acontece num piscar de olhos.

É fascinante pensar que podemos interagir com o computador dessa forma. E é com base nessa fascinação que a história de Billy foi criada.

De forma muito similar, pude perceber que o Google tenta aprender com a sequência de pesquisas. Ao perguntar a mesma frase mais de uma vez, ele tenta “corrigir” o que captou da fala, entendendo que a primeira resposta não satisfez o usuário. Assim acontece com o Billy, que se realimenta a cada interação com a turma do CP-500.

Então se vocês quiserem sonhar um pouco com a ideia dessa evolução tecnológica, fica o convite para conhecer meu novo juvenil, com toques de romance policial.

No próximo dia 5 de junho, às 14h40, estarei na Biblioteca FNLIJ Jovem, no 16º Salão FNLIJ do Livro para Crianças e Jovens, para falar sobre “A Turma do CP-500: o mistério da casa de pedras”.

Espero vocês lá!