Em junho de 2026 o Google Research publicou o ReasoningBank: uma memória que destila estratégias de raciocínio de sucessos E fracassos, e melhora o agente em tempo de execução. Ganhos: +8,3% no WebArena, +4,6% no SWE-Bench-Verified, e -3 passos por tarefa. Para nós não foi surpresa — é exatamente a tese do nosso Segundo Cérebro para Agentes. A diferença é que o ReasoningBank é um paper do Google, e a nossa é uma arquitetura que você possui, via MCP, por menos de R$5/mês. Agora temos o benchmark de referência para provar o ponto.
A maioria das stacks de agente confunde 'recuperar texto' com 'lembrar'. O agente busca trechos parecidos, mas não carrega a estratégia que funcionou — nem a armadilha em que já caiu.
Sem memória persistente, cada sessão é a primeira sessão. O agente reaprende o layout do seu sistema, refaz a mesma sequência de passos, esbarra na mesma exceção. O custo disso é duplo: tokens desperdiçados re-descobrindo o óbvio e erros repetidos que já tinham sido resolvidos ontem.
RAG episódico tradicional armazena trechos brutos: a resposta de ontem, o documento, a ação tomada. O que importa para um agente, porém, é o padrão abstrato — 'verifique o identificador da página antes de pedir mais resultados'. Estratégia generaliza; trecho não. Recuperar o texto certo não é o mesmo que aplicar a tática certa.
Quase toda memória de agente só registra sucesso. Mas o sinal mais barato e mais rico é a falha: o caminho que não funcionou, o sinal contrafactual, a armadilha. Jogar fora o erro é jogar fora metade do aprendizado — e condenar o agente a repeti-lo.
As poucas soluções com memória decente vêm presas a um SaaS: você não possui os dados, paga por assento, e some tudo se a ferramenta desaparecer (e, em 2026, ferramentas de IA somem). Memória de agente que você não controla não é um ativo — é mais um lock-in.
O ReasoningBank prova o princípio; nós entregamos a implementação que você possui. Usamos o paper como referência de design e como vara de medir resultado.
Cada item de memória guarda título, descrição e o raciocínio: passos, justificativa de decisão e insight operacional. É a mesma estrutura que o ReasoningBank usa para gerar estratégias generalizáveis em vez de ações detalhadas. O agente recupera táticas reaproveitáveis, não cópias do passado.
Extraímos lições tanto de sucessos quanto de fracassos: sinais contrafactuais viram guardrails preventivos ('não carregue mais resultados sem checar o id da página'). É exatamente o mecanismo que dá ao ReasoningBank o ganho de acurácia — e o que separa memória de verdade de um cache glorificado.
Onde o ReasoningBank é um framework de pesquisa, nossa memória é um banco que você controla, acessível por MCP a qualquer ferramenta de IA que você use — sem middleware, sem lock-in, por menos de R$5/mês. É o Segundo Cérebro para Agentes ligado ao seu control plane, não a um fornecedor.
Adotamos os mesmos eixos do estudo — taxa de sucesso e passos por tarefa — para medir a sua operação antes e depois. Quando recomendamos uma arquitetura de memória, mostramos o delta no seu benchmark, não no slide do fornecedor. ReasoningBank é o piso público; o alvo é superá-lo no seu domínio.
No estudo do Google com Gemini-2.5-Flash, a memória de estratégias entregou +8,3% de sucesso no WebArena (navegação/atuação) e +4,6% no SWE-Bench-Verified (engenharia de software). É o ganho que vem de não repetir o erro de ontem — e ele é mensurável no seu fluxo.
ReasoningBank reduziu ~3 passos por tarefa. Cada passo a menos é uma chamada a menos de modelo. Memória boa não é só qualidade — é corte direto de custo, que se soma ao routing e aos caps do seu control plane.
Com Memory-aware Test-Time Scaling (MaTTS), o estudo somou +3% adicionais de sucesso. Memória e mais 'tempo de pensar' se reforçam: quanto melhor a memória, mais barato é cada incremento de raciocínio.
Diferente de um framework de lab ou de um SaaS de memória, a arquitetura que entregamos é sua: dados no seu banco, acesso por MCP, custo de centavos. Quando a próxima ferramenta de IA da moda desaparecer, sua memória continua.
Mapeamos onde sua operação queima tokens re-descobrindo o óbvio, desenhamos a arquitetura de memória que você possui via MCP, e medimos o ganho contra o benchmark público do ReasoningBank — sucesso e passos por tarefa. Estratégia guardada, falha aprendida, custo cortado.