Rodei o CSV do meu time no preview tool do GitHub: $457 viram $2.668 (e mesmo assim vale a pena)

Rodei o CSV do meu time no preview tool do GitHub: $457 viram $2.668 (e mesmo assim vale a pena)

14 de maio de 2026

Olá pessoALL, há duas semanas eu publiquei aqui o post A Conta Chegou: GitHub Anuncia AI Credits e Marca 1º de Junho como o Fim da Era PRU. Lá no meio do texto eu disse uma frase que ficou martelando: "o preview bill de maio vai ser a primeira vez que muita gente, eu incluído, vai olhar pro número honesto". Maio chegou, o GitHub publicou ontem uma atualização importante no plano individual (flex allotment + plano Max novo) e disponibilizou uma ferramenta web pra rodar o seu próprio CSV de "Premium Request Usage Report" e ver, em dólar, quanto você teria pago em abril sob o novo modelo.

Rodei o do time da AzureBrasil e o número saiu: 5,83x e mesmo assim, conforme a gente vai descer no detalhe, vou defender que valeu cada centavo. Tem novidade de produto, tem dado real, tem decisão prática de budget, e tem um pequeno mea-culpa do post anterior.

O anúncio de ontem (12/maio): flex allotments e plano Max

Ontem, Joe Binder, VP of Product do GitHub, publicou um update reconhecendo, com todas as letras, o que a comunidade vinha questionando desde o anúncio original: "ouvimos suas perguntas sobre se o uso incluído em cada plano vai ser suficiente quando a transição acontecer em 1º de junho. Sessões de agente mais longas, trabalho multi-step e modelos mais capazes vão pressionar os valores que detalhamos no anúncio original". Tradução de quem trabalha com release notes da Microsoft há tempo: "a conta não fechava, voltamos pra mesa de desenho".

A resposta veio em duas partes. Primeira: o uso incluído nos planos Pro e Pro+ agora tem duas camadas.

  • Base credits: casados 1:1 com o preço do plano. Pro = $10 = 1.000 AICs base. Pro+ = $39 = 3.900 AICs base. Esses nunca mudam.
  • Flex allotment: uma camada adicional, em cima da base, que pode variar com o tempo conforme a economia de IA evolui (preço de modelo, eficiência, etc.).

Segunda parte: nasce o Copilot Max, um plano novo de $100/mês pensado pra quem usa Copilot em volume sustentado e alto. Lineup individual atualizado, oficial na doc de usage-based billing for individuals:

Plano Preço Base credits Flex allotment Total incluído/mês
Copilot Pro $10 1.000 500 1.500 AICs
Copilot Pro+ $39 3.900 3.100 7.000 AICs
Copilot Max $100 10.000 10.000 20.000 AICs

Repara no Pro+: na minha tabela do post anterior, a cota incluída era 3.900 AICs. Agora, com o flex de 3.100, vai pra 7.000. Mesmo preço, quase o dobro de uso incluído. Quem está em Pro+ acabou de ganhar 3.100 AICs por mês de mesada sem fazer nada.

Bom, certo? Bom. Mas vale gravar uma frase da própria doc, palavra por palavra, antes de relaxar: "the flex allotment is a variable part of your included usage; it is designed to adapt as the economics of AI evolve". Em português direto: o flex pode encolher. Pode crescer também. Mas o piso garantido é só a parte base. Quem desenha FinOps de longo prazo precisa modelar com a base, não com a base+flex. Lição aprendida lá atrás com Azure free tiers vale aqui também.

E tem uma observação que precisa ficar clara: esse anúncio é só do lineup individual. Quem está em Copilot Business ($19/seat) ou Enterprise ($39/seat) segue exatamente os números do post anterior. 1.900 AICs/seat (Business) e 3.900 AICs/seat (Enterprise), com o promo Jun-Ago aumentando pra 3.000 e 7.000 respectivamente. Não tem flex pra org. Pelo menos por enquanto.

A ferramenta nova: Copilot Billing Preview

Junto com o anúncio, o GitHub liberou o Copilot Billing Preview, uma página web que aceita o CSV do Premium Request Usage Report (aquele que admin de Enterprise ou Billing Manager baixa em Billing & licensing → Preview your billing impact → Download CSV) e simula sua fatura sob o novo modelo. Detalhe que vale ouro: todo o processamento roda no browser. A própria página deixa explícito: "All processing happens in your browser. Your CSV is never uploaded to any server". Pra quem trabalha com cliente regulado (saúde, financeiro, governo), isso muda a conversa de governança. Não tem que abrir ticket de aprovação de upload de dado de billing pra time de segurança.

Baixei o CSV de abril/2026 da minha tenant da AzureBrasil e larguei na ferramenta. O que veio na tela me surpreendeu menos pelo número absoluto e mais pela distribuição.

O número agregado: $457,91 viram $2.668,78

Antes de mostrar o screenshot, uma nota de método. Estou usando um único mês de dados (abril/2026). Não é série histórica. É snapshot. Pra quem está prestes a passar pelo mesmo exercício, recomendo fazer pelo menos 3 meses pra ver tendência, não só fotografia.

Composição do time AzureBrasil em abril: 9 usuários ativos, sendo 8 em Copilot Enterprise e 1 em Copilot Business. License cost mensal: 8 × $39 + 1 × $19 = $331.

Modelo PRU atual:

  • 10.008 PRUs consumidos no mês
  • $348,65 de uso bruto
  • $221,74 absorvidos pela cota incluída
  • $126,91 de overage
  • Fatura total: $457,91

Modelo AIC simulado (com promo Jun-Ago aplicado):

  • 292.778 AICs consumidos
  • $2.927,78 de uso bruto
  • $590,00 de desconto promocional (8 × $70 Enterprise + 1 × $30 Business)
  • $2.337,78 de additional usage
  • Fatura total: $2.668,78

Copilot Billing Preview — overview AzureBrasil abril/2026

Diferença líquida: +$2.210,87 só em abril. Multiplicador efetivo de 5,83x. Sem o promo de transição, seria ~7,1x.

A primeira pergunta que vem na cabeça é a errada: "o GitHub aumentou o preço em 5,83x?". Não. O GitHub explicitou um custo que sempre existiu, mas que estava sendo absorvido por eles e mascarado por uma cota generosa de PRUs com fallback silencioso. A diferença entre $457 e $2.668 não é inflação, é transparência retroativa. E aqui mora o ponto que torna a conversa difícil de ter no Slack do time: o número antigo era confortável. O novo é honesto. Pessoa adulta escolhe honesto, mesmo doendo.

De onde vem a diferença: o drill-down por modelo

A primeira coisa que olhei depois do número agregado foi a quebra por modelo. Tem informação cirúrgica aí.

Modelo PRUs Custo PRU bruto Custo AIC % do AIC total
Claude Opus 4.6 5.152 $193,56 $1.840,25 63%
Claude Sonnet 4.6 1.809 $54,40 $551,67 19%
Claude Opus 4.7 1.719 $61,80 $209,44 7%
GPT-5.3-Codex 268 $6,64 $69,29 2%
Claude Haiku 4.5 110,4 $0,94 $56,38 2%
Coding Agent model 96 $3,84 $39,30 1%
Code Review model 70 $2,12 $18,69 <1%
Outros (12 modelos) ~785 ~$25 ~$143 ~5%

2026-05-12_21-52-21.png

Família Anthropic (Opus 4.6 + Opus 4.7 + Sonnet 4.6 + Sonnet 4.5 + Opus 4.5 + Haiku) soma mais de 90% do AIC cost. E Opus 4.6 sozinho responde por 63%. Isso é o tipo de número que você não enxerga no dashboard de PRU porque PRU normaliza tudo: 1 PRU de Opus = $0,04, 1 PRU de Sonnet = $0,03, e ponto. No AIC, Opus pesa 9x mais que Sonnet por unidade de uso real.

Lição aprendida: escolha de modelo agora é decisão de FinOps, não só de qualidade de output. Eu mesmo, quando configuro o agentic mode no VS Code, deixo Opus 4.6/4.7 como default porque "garante a melhor resposta". A análise mostra que em 2/3 das tarefas onde isso roda, Sonnet 4.6 ou Sonnet 4.5 entregariam exatamente o mesmo PR aceitável, com 1/9 do custo.

De onde vem a diferença: o drill-down por usuário

Aqui é onde fica desconfortável. E onde fica mais interessante.

Usuário PRUs Custo PRU líquido (pago) Custo AIC Diferença
talleswp 1.299 $0,70 $754,35 +$754
andrecustodio 1.011 $0,00 $575,28 +$575
rsantosdev (eu) 1.940 $27,94 $427,31 +$399
TallesValiatti 3.033 $90,80 $380,34 +$290
ErickVendramel 477 $3,77 $342,95 +$339
flpdefaria 1.105 $3,70 $201,07 +$197
carlosmachel 754 $0,00 $189,48 +$189
brunobritodev 101 $0,00 $31,80 +$32
naimeke 288 $0,00 $25,19 +$25

Copilot Billing Preview — Usage by Product

Lê com calma. O Talles WP consumiu 1.299 PRUs no mês e pagou líquidos $0,70, porque ficou dentro da cota incluída do plano dele. No modelo AIC, o mesmo consumo custa $754,35. O André Custódio pagou exatos $0,00 e custaria $575,28. O carlosmachel mesma história: $0 → $189.

Quem hoje está dentro da quota PRU é exatamente quem vai aparecer como o usuário mais caro no relatório de AIC. Não porque mudou de comportamento. Porque o subsídio acabou.

E tem outro detalhe que merece ser olhado. O TallesValiatti, maior pagador de overage do time em abril ($90,80 líquidos), na verdade não é o usuário mais caro no AIC. Cai pra 4º lugar. Em PRU ele aparecia como heavy user porque excedeu cota; em AIC ele rateia entre 23 modelos (a maior diversidade do time), o que indica perfil de exploração consciente, usa Haiku e Sonnet pra coisa pequena, Opus só pro essencial. Esse tipo de comportamento, no novo modelo, passa a ser premiado. No velho, era invisível.

Pivots de leitura: o que essa diferença não significa

Três ressalvas que ajudam a calibrar a leitura do número.

Mas o promo Jun-Ago amortiza ~22% por 3 meses. Os $590 de desconto promocional valem só Junho, Julho e Agosto. Em Setembro, o desconto cai pra ~$331 (a cota base sem promo: 8 × $39 + 1 × $19 em AICs). Use os 3 meses pra calibrar comportamento, não pra confortar a fatura. Setembro vai ser o primeiro mês "limpo" e a comparação vai ficar mais dura.

Mas escolha de modelo corta 50%+ sem esforço. Olhando minha própria distribuição, se eu trocar metade do uso de Opus 4.6 por Sonnet 4.6 (mantendo o Opus pra refactors realmente complexos), a economia projetada é em torno de $1.000 por mês numa equipe de 9 pessoas. Não é otimização heroica. É só configurar um default mais sensato no settings do VS Code.

Mas pooled credits muda a economia agregada. No modelo antigo, cada usuário tinha seu balde isolado. O naimeke consumiu 288 PRUs com cota de 1.000, sobrou cota equivalente a um André Custódio inteiro, sem aproveitar. No modelo novo, todo o time vira um pool único na entidade de billing. Heavy users como o talleswp, o andre, o erick e eu drenam, light users como naimeke e bruno repõem. Sem overhead de remanejamento de licença. É a primeira vez que "compra coletiva" funciona como compra coletiva de verdade.

Recomendações de budget (a parte prática)

A doc de Setting up budgets deixa claro que a entidade de billing pode criar budget em quatro escopos: enterprise inteiro, organization, repository, ou cost center. Cada budget pode (e deve) ter o flag "Stop usage when budget limit is reached". Abaixo, a estratégia que estou implementando na AzureBrasil, com valores ancorados nos números reais de abril.

1. Budget no nível account/enterprise: o teto duro. Pega seu pool incluído mais ~50% de buffer. Para nós: pool com promo = $590, então cap em ~$900 a partir de junho. Em setembro, sem promo, o pool cai pra $331 e eu ajusto o cap pra ~$500–$600. Tipo do budget: Bundled premium requests com Stop usage ativo. Isso é o fusível que evita um agentic em loop infinito custar $5.000 num fim de semana.

2. Cost centers por squad: segrega heavy de light. Crie um cost center "Plataforma & IA" pra quem usa Copilot Coding Agent intensamente, e outro "Produto" pra quem usa principalmente chat e completions. Isso te permite cap diferente por perfil. E mais importante, te dá visibilidade de qual squad está consumindo o quê. Sem isso, todo mês vai ser "alguém" que estourou. Com cost center, vira "o squad X, e dá pra investigar".

3. "Per-user budget" via cost center unitário. Aqui entra um mea-culpa: no post anterior eu descrevi os budgets como tendo 4 níveis incluindo user. Relendo a doc, a verdade é que não existe budget no nível usuário direto. Os escopos oficiais são enterprise, organization, repository e cost center. Mas você consegue o efeito de budget per-user criando um cost center com uma única pessoa dentro. Útil pra contratado externo, dev em PoC, ou aquele engenheiro que descobriu o agentic mode na semana passada e tá disparando 50 sessões em paralelo. Crio cost center, atribuo o user, ponho cap baixo. Funciona.

4. Product / SKU budgets: separe Copilot premium de Copilot cloud agent. Desde 1 de novembro de 2025, o GitHub separou as SKUs. Copilot premium requests, Copilot cloud agent premium requests e Spark premium requests viraram coisas distintas no relatório. Ponha cap maior no de cloud agent. É onde a tendência de gasto cresce mais rápido (sessão agentic varre repositório inteiro, contexto explode, tokens explodem) e você quer dar espaço pra isso, mas com teto.

5. Alertas 75/90/100 sempre ativos, mesmo sem Stop usage. Nos primeiros dois meses, recomendo deixar alertas ON e Stop usage OFF nos cost centers. Você quer ver primeiro, sem bloquear. A pior coisa que pode acontecer no piloto é alguém ficar travado no meio de uma sprint por causa de um cap mal calibrado. Depois que tiver baseline, vira o Stop usage pra ON.

6. Cuidado com budgets sobrepostos. A própria doc tem um exemplo didático: budget de $50 no produto Actions e $100 numa SKU de Linux 96-core. O da SKU vira inútil, porque quando o do produto esgota, todo mundo é bloqueado. Replicado pra Copilot: não crie budget no enterprise inteiro e no cost center pra mesma SKU sem pensar bem. O menor cap é quem manda. E quando bloqueia, ninguém entende o porquê.

A vista de empreendedor: 5,83x ainda fecha conta

Olhando a planilha de $2.668,78 com cara de quem assina o boleto no fim do mês, a primeira reação é apertar o cinto. Olhando a mesma planilha com cara de empreendedor que viu o que saiu do time em abril (features entregues, conteúdo publicado aqui no blog, vídeos no canal, PRs revisados, bugs caçados em horas que antes seriam dias) o cálculo muda completamente.

Em 9 cabeças, $2.668 dão $296 por pessoa por mês. Comparado com o custo de uma hora de engenheiro sênior no mercado brasileiro, é menos de 4 horas de trabalho por mês por dev. Se o Copilot economiza 4 horas de qualquer um no time num único mês, ele se paga. E na minha leitura honesta da nossa rotina, economiza muito mais do que isso. Por isso vale.

E aqui mora o argumento mais forte a favor da disciplina de modelo: tudo isso foi com zero otimização consciente. Ninguém no time foi orientado a usar Sonnet em vez de Opus, ninguém configurou modelo padrão, ninguém olhou pra fatura projetada antes de hoje. Se o ROI já fecha sem otimização, com a disciplina mínima que estou descrevendo neste post (default sensato, cost center por squad, alerta antes de bloqueio) o ROI explode. Esse é o argumento que eu levo pra reunião de orçamento. O pânico do 5,83x fica do lado de fora.

Lições aprendidas

  1. PRU mascarava o consumo real. AIC obriga você a olhar. O número velho era confortável. O novo é honesto. Pessoa adulta escolhe honesto.
  2. Quem está dentro da quota hoje vai ser o usuário mais caro amanhã. O subsídio invisível some em 1º de junho. Olhe pros nomes que pagam $0 hoje — eles vão liderar o ranking de custo em julho.
  3. Escolha de modelo virou decisão de FinOps. Opus paga 9x mais que Sonnet por unidade real de uso. Configure um default sensato e reserve Opus pra refactor que justifica.
  4. Promo é colchão temporário, não almofada permanente. 22% de desconto em Jun-Ago. Setembro é o primeiro mês de verdade. Use os 3 meses pra calibrar, não pra acomodar.
  5. Flex allotment é variável; base credits é o piso garantido. Modele FinOps de longo prazo com a base, trate o flex como bônus que pode encolher.

Sua vez de rodar a ferramenta

Se você administra Copilot em qualquer escala, de Pro individual a Enterprise com centenas de seats, a recomendação é simples e gratuita: abra o Copilot Billing Preview, baixe seu CSV de Premium Request Usage Report e rode. Leva menos de 5 minutos. O dado nunca sai do seu browser. E o número que vai aparecer na tela é a primeira oportunidade real de planejar antes de 1º de junho, em vez de reagir depois.

Quando rodar, me conta nos comentários: qual foi seu multiplicador? Foi mais doloroso que 5,83x ou menos? Qual modelo dominou seu AIC cost? E mais importante: depois de ver o número, o que você vai mudar no comportamento do time antes do dia 1º?

Referências

Anúncios oficiais

Ferramentas

Documentação

Posts relacionados aqui no blog

[]s e até a próxima.

Confira mais:

Fique por dentro das novidades

Assine nossa newsletter e receba as últimas atualizações e artigos diretamente em seu email.

Assinar gratuitamente