Se você ainda não notou, o futuro imediato da
internet é a voz. Assistentes virtuais que obedecem a comandos vocais como a
Siri, da Apple, Cortana, da Microsoft, ou Alexa, da Amazon, estão se tornando
uma nova forma de acessar a rede.
Fabricantes como a Samsung estão investindo em
aparelhos para serem inseridos no ouvido
-que também são acionados e respondem apenas por voz- que
podem substituir smartphones.
Isso indica que a próxima evolução da internet diz
respeito mais ao ouvido do que à visão. As vantagens dessa mudança são muitas.
Por exemplo, facilita o acesso por quem tem dificuldade de ler ou escrever,
como crianças e idosos, ou ainda, em razão de deficiência educacional ou
visual. A voz torna a
rede mais democrática que a visão.
No entanto, essa mudança traz preocupações. A
internet que conhecemos permite que qualquer pessoa participe dela como
consumidor ou como criador de informações, de sites e ou serviços. Em outras
palavras, é uma rede "permissionless", isto é, ninguém precisa pedir
autorização para criar ou construir algo sobre ela.
Com a voz tudo é diferente. As interfaces de voz
não são abertas. Elas são, por ora, propriedade de poucas empresas. Para
existirem, dependem de infraestrutura e recursos que são controlados de forma
privada e centralizada (servidores, software, tecnologia de inteligência
artificial etc.). Quem quiser desenvolver um serviço baseado em voz não estará
desenvolvendo esse serviço
para "a rede", mas sim para o ecossistema de uma grande empresa.
Mas tudo pode mudar. Conversando com David Li em
conferência da fundação Mozilla em Bellagio na semana passada, ouvi uma visão
bem diferente. Li é fundador do laboratório de inovação aberta de Shenzhen, a
cidade que é o epicentro da
fabricação de eletrônicos do planeta.
Ambos concordamos que um dos problemas das
interfaces de voz será cultural. É ingênuo achar que haverá apenas algumas
poucas vozes que irão falar com o mundo (Siri, Cortana, Alexa etc.). Vozes
essas que são amorfas e "neutras", femininas e com leve sotaque
britânico. O mundo é complexo demais para ser
uniformizado por um só tipo de voz.
Surgirão vozes cada vez mais customizadas,
refletindo os infinitos universos culturais. Vozes que podem ser politicamente
incorretas, interessadas em temas específicos (como esporte ou celebridades),
vozes de crianças para crianças e assim por diante.
A maior chance é que produtos como Siri e Alexa
sejam consumidos
pela elite global (a mesma que consome produtos da Apple - o iPhone tem hoje só
11% de penetração global) enquanto o restante do mundo irá consumir produtos
manufaturados em Shenzhen, mais baratos e infinitamente mais customizáveis. Em
outras palavras: há um espaço aberto para empreendedores, inclusive
brasileiros, que queiram criar aparelhos com "vozes" próprias.
Shenzhen está
pronta para produzi-los.
Ronaldo Lemos - advogado, diretor do
Instituto de Tecnologia e Sociedade do Rio de Janeiro (ITSrio.org). Mestre em
direito por Harvard. Pesquisador e representante do MIT Media Lab no Brasil.
Fonte: coluna jornal FSP