A OpenAI está trabalhando em um 'funcionário de IA' de US$20.000/mês. Mas essa nem é a parte mais interessante. A verdadeira história é que a nova unidade de trabalho está se tornando o token — e isso está mudando a engenharia de software de forma irreconhecível.
De um jeito que não víamos há 50 ou 60 anos.
A unidade de trabalho era a instrução. Um humano escrevia código, uma máquina executava código, e o valor era denominado em quão habilmente o humano conseguia sequenciar essas instruções.
Você descreve o que quer, alimenta contexto e compra inteligência suficiente para obter um resultado. A máquina descobre os passos sozinha. O trabalho do humano subiu — de escrever lógica para especificar resultados e gerenciar orçamento de inteligência.
Isso não é um upgrade de ferramenta. É uma mudança no que a computação é.
Meta de gastar US$1.000/dia em tokens. Sem código escrito à mão.
Custos de AWS saltaram de US$6M para US$12M em um mês. Crescimento explosivo.
Gastou US$2,66 bilhões em AWS contra receita de US$2,55 bilhões. Mais de 100% da receita em infra.
Gastou 164% de toda sua receita de 2024 em AWS e infraestrutura.
Essas empresas não estão escolhendo uma forma mais cara. Estão operando em um paradigma fundamentalmente diferente. Inteligência agora é um insumo comprável.
Performance equivalente ao GPT-4 custava US$20/M tokens em 2022. Hoje custa US$0,40. Deflação de 10x a 200x por ano.
Quando um recurso fica mais barato, você não usa menos. Usa enormemente mais. Motores a vapor ficaram mais eficientes — o consumo explodiu. Computação em nuvem ficou mais barata — contas de AWS subiram.
Gasto médio organizacional em IA
Gasto médio/mês
Crescimento anual
Planejam gastar +US$100K/mês
Recurso escasso antigo
Tempo de desenvolvedor
Recurso escasso novo
Converter tokens em valor econômico
Estruturar contexto para máxima eficiência
Rotear tarefas para o modelo certo pelo custo certo
Construir loops de agentes que sustentam qualidade
Medir se a inteligência comprada produz resultados reais
Haiku para o barato. Opus para o difícil. Sonnet para o meio-termo. Não é custo a minimizar — é alavanca para maximizar ROI.
Enviava toda receita para a Anthropic em custos de API. Quando a Anthropic aumentou preços, os custos explodiram da noite pro dia — forçando a cortar o plano ilimitado de US$20 e criar um de US$200.
O papel do desenvolvedor está se diferenciando em três trilhas distintas com dinâmicas completamente diferentes.
Não escreve código — especifica resultados e gerencia a inteligência que os produz.
Compensação se correlaciona com orçamentos de tokens, não com linhas de código.
Constrói a infraestrutura que os orquestradores usam. Frameworks de agentes, pipelines de avaliação, roteamento inteligente.
Trilha menor em volume, muito mais especializada, teto de compensação altíssimo.
Combina fluência técnica com expertise profunda em um mercado específico. Sabe quais problemas vale a pena resolver.
Pode ser a maior das três trilhas. Valor sobe à medida que inteligência fica mais barata.
Quem está mais exposto: O meio da distribuição é o mais exposto: desenvolvedores que escrevem código competente mas não têm profundidade em sistemas nem expertise de domínio.
500 engenheiros escrevendo código à mão
50 engenheiros gerenciando agentes com melhores especificações, avaliação e context engineering
Os 50 podem produzir mais que os 500.
Rollout de IA desastroso no início. Teve que recontratar atendentes. Mas receita por funcionário escalou para 7 dígitos — muito acima da média SaaS.
O mundo não está pronto para o impacto que a IA terá no trabalho do conhecimento.
— Sebastian Siemiatkowski, CEO da Klarna
Empresas AI-native vs SaaS tradicionais
mais receita por funcionário
Startup de IA com US$10M ARR: 15 pessoas. SaaS tradicional: 60-70 pessoas.
Toda empresa tem um backlog de projetos que nunca foram economicamente viáveis. A ferramenta interna que economizaria 200h/ano mas custava 2.000h para construir — nunca ia ser feita.
Empresas que reconhecerem que seus backlogs agora são minas de ouro vão expandir dramaticamente o escopo do que constroem — não apenas a velocidade.
Competem em volume de tokens, plataformas horizontais, agentes 24h. Moat: capital e infraestrutura.
Vencem por especificidade — nicho, relacionamento, domínio. Moat: distribuição e confiança.
Goldman pode rodar mais inferência que uma startup focada em fintech para restaurantes. Mas Goldman nunca montou canal para vender gestão de estoque com IA para uma rede de 50 restaurantes.
O time mínimo viável para software se aproxima de um.
Ir por conta própria é cada vez menos troca de estilo de vida e cada vez mais escolha econômica racional para quem tem expertise de domínio e fluência em IA.
De 'two pizza teams' para times de meia pizza.
A Stickybit opera exatamente na interseção dos três caminhos:
Gerenciamos agentes e inteligência tokenizada para entregar sistemas que custam 10x menos que SaaS — com resultados mensuráveis.
Construímos a infraestrutura em Go que sustenta tudo: integrações, pipelines, APIs de alta performance desde 2004.
22 anos traduzindo tecnologia em resultado de negócio: saúde, e-commerce, logística, email, investimentos.
600K → 23M emails/dia, mesma equipe, 1/3 dos servidores
Substituiu SaaS de frete em 67 dias. Custo: R$150/mês
24 plataformas integradas, 1.000+ lojas servidas
Sua empresa precisa de um parceiro que entende token economics na prática — não na teoria.