Análise Stickybit · Junho 2026

Seu agente repete o mesmo erro toda vez. Memória resolve isso. Guardar estratégia — e aprender com a falha — vale mais que guardar texto.

Em junho de 2026 o Google Research publicou o ReasoningBank: uma memória que destila estratégias de raciocínio de sucessos E fracassos, e melhora o agente em tempo de execução. Ganhos: +8,3% no WebArena, +4,6% no SWE-Bench-Verified, e -3 passos por tarefa. Para nós não foi surpresa — é exatamente a tese do nosso Segundo Cérebro para Agentes. A diferença é que o ReasoningBank é um paper do Google, e a nossa é uma arquitetura que você possui, via MCP, por menos de R$5/mês. Agora temos o benchmark de referência para provar o ponto.

O Problema

O Problema: RAG Episódico Não É Memória

A maioria das stacks de agente confunde 'recuperar texto' com 'lembrar'. O agente busca trechos parecidos, mas não carrega a estratégia que funcionou — nem a armadilha em que já caiu.

Começa do zero toda vez

Sem memória persistente, cada sessão é a primeira sessão. O agente reaprende o layout do seu sistema, refaz a mesma sequência de passos, esbarra na mesma exceção. O custo disso é duplo: tokens desperdiçados re-descobrindo o óbvio e erros repetidos que já tinham sido resolvidos ontem.

Guarda o 'o quê', não o 'como'

RAG episódico tradicional armazena trechos brutos: a resposta de ontem, o documento, a ação tomada. O que importa para um agente, porém, é o padrão abstrato — 'verifique o identificador da página antes de pedir mais resultados'. Estratégia generaliza; trecho não. Recuperar o texto certo não é o mesmo que aplicar a tática certa.

Nunca aprende com o fracasso

Quase toda memória de agente só registra sucesso. Mas o sinal mais barato e mais rico é a falha: o caminho que não funcionou, o sinal contrafactual, a armadilha. Jogar fora o erro é jogar fora metade do aprendizado — e condenar o agente a repeti-lo.

Quando existe, é refém de plataforma

As poucas soluções com memória decente vêm presas a um SaaS: você não possui os dados, paga por assento, e some tudo se a ferramenta desaparecer (e, em 2026, ferramentas de IA somem). Memória de agente que você não controla não é um ativo — é mais um lock-in.

Nossa Abordagem

Nossa Arquitetura, Validada pelo Benchmark do Google

O ReasoningBank prova o princípio; nós entregamos a implementação que você possui. Usamos o paper como referência de design e como vara de medir resultado.

1

Padrões abstratos, não trechos — igual ao ReasoningBank

Cada item de memória guarda título, descrição e o raciocínio: passos, justificativa de decisão e insight operacional. É a mesma estrutura que o ReasoningBank usa para gerar estratégias generalizáveis em vez de ações detalhadas. O agente recupera táticas reaproveitáveis, não cópias do passado.

2

Aprender com a falha — o diferencial que o Google confirmou

Extraímos lições tanto de sucessos quanto de fracassos: sinais contrafactuais viram guardrails preventivos ('não carregue mais resultados sem checar o id da página'). É exatamente o mecanismo que dá ao ReasoningBank o ganho de acurácia — e o que separa memória de verdade de um cache glorificado.

3

Você possui, via MCP, por centavos

Onde o ReasoningBank é um framework de pesquisa, nossa memória é um banco que você controla, acessível por MCP a qualquer ferramenta de IA que você use — sem middleware, sem lock-in, por menos de R$5/mês. É o Segundo Cérebro para Agentes ligado ao seu control plane, não a um fornecedor.

4

O paper vira sua régua de ROI

Adotamos os mesmos eixos do estudo — taxa de sucesso e passos por tarefa — para medir a sua operação antes e depois. Quando recomendamos uma arquitetura de memória, mostramos o delta no seu benchmark, não no slide do fornecedor. ReasoningBank é o piso público; o alvo é superá-lo no seu domínio.

Resultados

O que entregamos

+8,3% sucesso

Mais acerto, medido

No estudo do Google com Gemini-2.5-Flash, a memória de estratégias entregou +8,3% de sucesso no WebArena (navegação/atuação) e +4,6% no SWE-Bench-Verified (engenharia de software). É o ganho que vem de não repetir o erro de ontem — e ele é mensurável no seu fluxo.

-3 passos/tarefa

Menos passos = menos tokens

ReasoningBank reduziu ~3 passos por tarefa. Cada passo a menos é uma chamada a menos de modelo. Memória boa não é só qualidade — é corte direto de custo, que se soma ao routing e aos caps do seu control plane.

+3% com MaTTS

Escala com test-time scaling

Com Memory-aware Test-Time Scaling (MaTTS), o estudo somou +3% adicionais de sucesso. Memória e mais 'tempo de pensar' se reforçam: quanto melhor a memória, mais barato é cada incremento de raciocínio.

< R$5/mês

Ativo seu, não assinatura

Diferente de um framework de lab ou de um SaaS de memória, a arquitetura que entregamos é sua: dados no seu banco, acesso por MCP, custo de centavos. Quando a próxima ferramenta de IA da moda desaparecer, sua memória continua.

Quer que seus agentes parem de começar do zero?

Mapeamos onde sua operação queima tokens re-descobrindo o óbvio, desenhamos a arquitetura de memória que você possui via MCP, e medimos o ganho contra o benchmark público do ReasoningBank — sucesso e passos por tarefa. Estratégia guardada, falha aprendida, custo cortado.