A Amazon está se preparando para relançar sua assistente digital Alexa como um agente de inteligência artificial capaz de realizar tarefas práticas, marcando um avanço significativo na tecnologia. A gigante avaliada em US$ 2,4 trilhões busca superar os desafios que têm dificultado a transformação de sua assistente de voz em uma ferramenta mais avançada.
Nos últimos dois anos, a Amazon tem trabalhado para incorporar inteligência artificial generativa ao “cérebro” da Alexa, presente em mais de 500 milhões de dispositivos em todo o mundo. Segundo Rohit Prasad, líder da equipe de inteligência geral artificial (AGI) da Amazon, ainda existem obstáculos técnicos importantes a serem superados antes do lançamento oficial.
Entre esses desafios, destacam-se as chamadas “alucinações” — respostas fabricadas pela IA —, a velocidade de resposta e a confiabilidade do sistema. “As alucinações precisam ser reduzidas a quase zero”, afirmou Prasad. Ele reconheceu que esse é um problema comum no setor, mas garantiu que a empresa está dedicando esforços significativos para resolvê-lo.
O objetivo dos líderes da Amazon é transformar a Alexa, que hoje desempenha funções simples, como tocar músicas e configurar alarmes, em um produto mais “agente”, capaz de agir como um concierge personalizado. Isso incluiria desde a recomendação de restaurantes até o ajuste da iluminação do quarto com base nos ciclos de sono do usuário.
Competição e desafios técnicos
Desde o lançamento do ChatGPT da OpenAI, apoiado pela Microsoft, no final de 2022, empresas como Microsoft, Google e Meta têm integrado rapidamente a IA generativa em suas plataformas e serviços. Entretanto, críticos questionam se a Amazon conseguirá superar suas dificuldades técnicas e organizacionais a tempo de competir de igual para igual com esses rivais.
Funcionários que trabalharam na equipe de desenvolvimento da Alexa nos últimos anos relataram complicações inesperadas no processo de integração. A principal dificuldade tem sido combinar os algoritmos mais simples e pré-definidos que formavam a base da Alexa com os modelos de linguagem avançados e imprevisíveis.
A Amazon reconheceu os desafios, destacando que a implementação técnica em larga escala em dispositivos e serviços ao vivo é sem precedentes. Segundo a empresa, a solução não é tão simples quanto adicionar um modelo de linguagem extenso à plataforma existente.
Prasad também explicou que o recente lançamento dos modelos internos Amazon Nova, liderado por sua equipe de AGI, foi projetado para otimizar velocidade, custo e confiabilidade, ajudando a Alexa a atingir a excelência necessária em seus serviços.
A complexidade de integrar IA em grande escala
Para operar como um agente de verdade, a Alexa precisará interagir com centenas de softwares e serviços de terceiros. Prasad enfatizou que a assistente lida com bilhões de solicitações por semana, o que exige ações rápidas e confiáveis de maneira econômica.
Além disso, usuários esperam respostas precisas e imediatas, o que contrasta com a natureza probabilística da IA generativa atual, que funciona prevendo palavras com base em padrões de fala e linguagem.
Ex-funcionários destacaram que um dos maiores desafios é preservar a consistência e funcionalidade originais da Alexa ao mesmo tempo que incorporam novas características, como maior criatividade e diálogo fluido.