Rodei o CSV do meu time no preview tool do GitHub: $457 viram $2.668 (e mesmo assim vale a pena)
Olá pessoALL, há duas semanas eu publiquei aqui o post A Conta Chegou: GitHub Anuncia AI Credits e Marca 1º de Junho como o Fim da Era PRU. Lá no meio do texto eu disse uma frase que ficou martelando: "o preview bill de maio vai ser a primeira vez que muita gente, eu incluído, vai olhar pro número honesto". Maio chegou, o GitHub publicou ontem uma atualização importante no plano individual (flex allotment + plano Max novo) e disponibilizou uma ferramenta web pra rodar o seu próprio CSV de "Premium Request Usage Report" e ver, em dólar, quanto você teria pago em abril sob o novo modelo.
Rodei o do time da AzureBrasil e o número saiu: 5,83x e mesmo assim, conforme a gente vai descer no detalhe, vou defender que valeu cada centavo. Tem novidade de produto, tem dado real, tem decisão prática de budget, e tem um pequeno mea-culpa do post anterior.
O anúncio de ontem (12/maio): flex allotments e plano Max
Ontem, Joe Binder, VP of Product do GitHub, publicou um update reconhecendo, com todas as letras, o que a comunidade vinha questionando desde o anúncio original: "ouvimos suas perguntas sobre se o uso incluído em cada plano vai ser suficiente quando a transição acontecer em 1º de junho. Sessões de agente mais longas, trabalho multi-step e modelos mais capazes vão pressionar os valores que detalhamos no anúncio original". Tradução de quem trabalha com release notes da Microsoft há tempo: "a conta não fechava, voltamos pra mesa de desenho".
A resposta veio em duas partes. Primeira: o uso incluído nos planos Pro e Pro+ agora tem duas camadas.
- Base credits: casados 1:1 com o preço do plano. Pro = $10 = 1.000 AICs base. Pro+ = $39 = 3.900 AICs base. Esses nunca mudam.
- Flex allotment: uma camada adicional, em cima da base, que pode variar com o tempo conforme a economia de IA evolui (preço de modelo, eficiência, etc.).
Segunda parte: nasce o Copilot Max, um plano novo de $100/mês pensado pra quem usa Copilot em volume sustentado e alto. Lineup individual atualizado, oficial na doc de usage-based billing for individuals:
| Plano | Preço | Base credits | Flex allotment | Total incluído/mês |
|---|---|---|---|---|
| Copilot Pro | $10 | 1.000 | 500 | 1.500 AICs |
| Copilot Pro+ | $39 | 3.900 | 3.100 | 7.000 AICs |
| Copilot Max | $100 | 10.000 | 10.000 | 20.000 AICs |
Repara no Pro+: na minha tabela do post anterior, a cota incluída era 3.900 AICs. Agora, com o flex de 3.100, vai pra 7.000. Mesmo preço, quase o dobro de uso incluído. Quem está em Pro+ acabou de ganhar 3.100 AICs por mês de mesada sem fazer nada.
Bom, certo? Bom. Mas vale gravar uma frase da própria doc, palavra por palavra, antes de relaxar: "the flex allotment is a variable part of your included usage; it is designed to adapt as the economics of AI evolve". Em português direto: o flex pode encolher. Pode crescer também. Mas o piso garantido é só a parte base. Quem desenha FinOps de longo prazo precisa modelar com a base, não com a base+flex. Lição aprendida lá atrás com Azure free tiers vale aqui também.
E tem uma observação que precisa ficar clara: esse anúncio é só do lineup individual. Quem está em Copilot Business ($19/seat) ou Enterprise ($39/seat) segue exatamente os números do post anterior. 1.900 AICs/seat (Business) e 3.900 AICs/seat (Enterprise), com o promo Jun-Ago aumentando pra 3.000 e 7.000 respectivamente. Não tem flex pra org. Pelo menos por enquanto.
A ferramenta nova: Copilot Billing Preview
Junto com o anúncio, o GitHub liberou o Copilot Billing Preview, uma página web que aceita o CSV do Premium Request Usage Report (aquele que admin de Enterprise ou Billing Manager baixa em Billing & licensing → Preview your billing impact → Download CSV) e simula sua fatura sob o novo modelo. Detalhe que vale ouro: todo o processamento roda no browser. A própria página deixa explícito: "All processing happens in your browser. Your CSV is never uploaded to any server". Pra quem trabalha com cliente regulado (saúde, financeiro, governo), isso muda a conversa de governança. Não tem que abrir ticket de aprovação de upload de dado de billing pra time de segurança.
Baixei o CSV de abril/2026 da minha tenant da AzureBrasil e larguei na ferramenta. O que veio na tela me surpreendeu menos pelo número absoluto e mais pela distribuição.
O número agregado: $457,91 viram $2.668,78
Antes de mostrar o screenshot, uma nota de método. Estou usando um único mês de dados (abril/2026). Não é série histórica. É snapshot. Pra quem está prestes a passar pelo mesmo exercício, recomendo fazer pelo menos 3 meses pra ver tendência, não só fotografia.
Composição do time AzureBrasil em abril: 9 usuários ativos, sendo 8 em Copilot Enterprise e 1 em Copilot Business. License cost mensal: 8 × $39 + 1 × $19 = $331.
Modelo PRU atual:
- 10.008 PRUs consumidos no mês
- $348,65 de uso bruto
- $221,74 absorvidos pela cota incluída
- $126,91 de overage
- Fatura total: $457,91
Modelo AIC simulado (com promo Jun-Ago aplicado):
- 292.778 AICs consumidos
- $2.927,78 de uso bruto
- $590,00 de desconto promocional (8 × $70 Enterprise + 1 × $30 Business)
- $2.337,78 de additional usage
- Fatura total: $2.668,78

Diferença líquida: +$2.210,87 só em abril. Multiplicador efetivo de 5,83x. Sem o promo de transição, seria ~7,1x.
A primeira pergunta que vem na cabeça é a errada: "o GitHub aumentou o preço em 5,83x?". Não. O GitHub explicitou um custo que sempre existiu, mas que estava sendo absorvido por eles e mascarado por uma cota generosa de PRUs com fallback silencioso. A diferença entre $457 e $2.668 não é inflação, é transparência retroativa. E aqui mora o ponto que torna a conversa difícil de ter no Slack do time: o número antigo era confortável. O novo é honesto. Pessoa adulta escolhe honesto, mesmo doendo.
De onde vem a diferença: o drill-down por modelo
A primeira coisa que olhei depois do número agregado foi a quebra por modelo. Tem informação cirúrgica aí.
| Modelo | PRUs | Custo PRU bruto | Custo AIC | % do AIC total |
|---|---|---|---|---|
| Claude Opus 4.6 | 5.152 | $193,56 | $1.840,25 | 63% |
| Claude Sonnet 4.6 | 1.809 | $54,40 | $551,67 | 19% |
| Claude Opus 4.7 | 1.719 | $61,80 | $209,44 | 7% |
| GPT-5.3-Codex | 268 | $6,64 | $69,29 | 2% |
| Claude Haiku 4.5 | 110,4 | $0,94 | $56,38 | 2% |
| Coding Agent model | 96 | $3,84 | $39,30 | 1% |
| Code Review model | 70 | $2,12 | $18,69 | <1% |
| Outros (12 modelos) | ~785 | ~$25 | ~$143 | ~5% |

Família Anthropic (Opus 4.6 + Opus 4.7 + Sonnet 4.6 + Sonnet 4.5 + Opus 4.5 + Haiku) soma mais de 90% do AIC cost. E Opus 4.6 sozinho responde por 63%. Isso é o tipo de número que você não enxerga no dashboard de PRU porque PRU normaliza tudo: 1 PRU de Opus = $0,04, 1 PRU de Sonnet = $0,03, e ponto. No AIC, Opus pesa 9x mais que Sonnet por unidade de uso real.
Lição aprendida: escolha de modelo agora é decisão de FinOps, não só de qualidade de output. Eu mesmo, quando configuro o agentic mode no VS Code, deixo Opus 4.6/4.7 como default porque "garante a melhor resposta". A análise mostra que em 2/3 das tarefas onde isso roda, Sonnet 4.6 ou Sonnet 4.5 entregariam exatamente o mesmo PR aceitável, com 1/9 do custo.
De onde vem a diferença: o drill-down por usuário
Aqui é onde fica desconfortável. E onde fica mais interessante.
| Usuário | PRUs | Custo PRU líquido (pago) | Custo AIC | Diferença |
|---|---|---|---|---|
| talleswp | 1.299 | $0,70 | $754,35 | +$754 |
| andrecustodio | 1.011 | $0,00 | $575,28 | +$575 |
| rsantosdev (eu) | 1.940 | $27,94 | $427,31 | +$399 |
| TallesValiatti | 3.033 | $90,80 | $380,34 | +$290 |
| ErickVendramel | 477 | $3,77 | $342,95 | +$339 |
| flpdefaria | 1.105 | $3,70 | $201,07 | +$197 |
| carlosmachel | 754 | $0,00 | $189,48 | +$189 |
| brunobritodev | 101 | $0,00 | $31,80 | +$32 |
| naimeke | 288 | $0,00 | $25,19 | +$25 |

Lê com calma. O Talles WP consumiu 1.299 PRUs no mês e pagou líquidos $0,70, porque ficou dentro da cota incluída do plano dele. No modelo AIC, o mesmo consumo custa $754,35. O André Custódio pagou exatos $0,00 e custaria $575,28. O carlosmachel mesma história: $0 → $189.
Quem hoje está dentro da quota PRU é exatamente quem vai aparecer como o usuário mais caro no relatório de AIC. Não porque mudou de comportamento. Porque o subsídio acabou.
E tem outro detalhe que merece ser olhado. O TallesValiatti, maior pagador de overage do time em abril ($90,80 líquidos), na verdade não é o usuário mais caro no AIC. Cai pra 4º lugar. Em PRU ele aparecia como heavy user porque excedeu cota; em AIC ele rateia entre 23 modelos (a maior diversidade do time), o que indica perfil de exploração consciente, usa Haiku e Sonnet pra coisa pequena, Opus só pro essencial. Esse tipo de comportamento, no novo modelo, passa a ser premiado. No velho, era invisível.
Pivots de leitura: o que essa diferença não significa
Três ressalvas que ajudam a calibrar a leitura do número.
Mas o promo Jun-Ago amortiza ~22% por 3 meses. Os $590 de desconto promocional valem só Junho, Julho e Agosto. Em Setembro, o desconto cai pra ~$331 (a cota base sem promo: 8 × $39 + 1 × $19 em AICs). Use os 3 meses pra calibrar comportamento, não pra confortar a fatura. Setembro vai ser o primeiro mês "limpo" e a comparação vai ficar mais dura.
Mas escolha de modelo corta 50%+ sem esforço. Olhando minha própria distribuição, se eu trocar metade do uso de Opus 4.6 por Sonnet 4.6 (mantendo o Opus pra refactors realmente complexos), a economia projetada é em torno de $1.000 por mês numa equipe de 9 pessoas. Não é otimização heroica. É só configurar um default mais sensato no settings do VS Code.
Mas pooled credits muda a economia agregada. No modelo antigo, cada usuário tinha seu balde isolado. O naimeke consumiu 288 PRUs com cota de 1.000, sobrou cota equivalente a um André Custódio inteiro, sem aproveitar. No modelo novo, todo o time vira um pool único na entidade de billing. Heavy users como o talleswp, o andre, o erick e eu drenam, light users como naimeke e bruno repõem. Sem overhead de remanejamento de licença. É a primeira vez que "compra coletiva" funciona como compra coletiva de verdade.
Recomendações de budget (a parte prática)
A doc de Setting up budgets deixa claro que a entidade de billing pode criar budget em quatro escopos: enterprise inteiro, organization, repository, ou cost center. Cada budget pode (e deve) ter o flag "Stop usage when budget limit is reached". Abaixo, a estratégia que estou implementando na AzureBrasil, com valores ancorados nos números reais de abril.
1. Budget no nível account/enterprise: o teto duro. Pega seu pool incluído mais ~50% de buffer. Para nós: pool com promo = $590, então cap em ~$900 a partir de junho. Em setembro, sem promo, o pool cai pra $331 e eu ajusto o cap pra ~$500–$600. Tipo do budget: Bundled premium requests com Stop usage ativo. Isso é o fusível que evita um agentic em loop infinito custar $5.000 num fim de semana.
2. Cost centers por squad: segrega heavy de light. Crie um cost center "Plataforma & IA" pra quem usa Copilot Coding Agent intensamente, e outro "Produto" pra quem usa principalmente chat e completions. Isso te permite cap diferente por perfil. E mais importante, te dá visibilidade de qual squad está consumindo o quê. Sem isso, todo mês vai ser "alguém" que estourou. Com cost center, vira "o squad X, e dá pra investigar".
3. "Per-user budget" via cost center unitário. Aqui entra um mea-culpa: no post anterior eu descrevi os budgets como tendo 4 níveis incluindo user. Relendo a doc, a verdade é que não existe budget no nível usuário direto. Os escopos oficiais são enterprise, organization, repository e cost center. Mas você consegue o efeito de budget per-user criando um cost center com uma única pessoa dentro. Útil pra contratado externo, dev em PoC, ou aquele engenheiro que descobriu o agentic mode na semana passada e tá disparando 50 sessões em paralelo. Crio cost center, atribuo o user, ponho cap baixo. Funciona.
4. Product / SKU budgets: separe Copilot premium de Copilot cloud agent. Desde 1 de novembro de 2025, o GitHub separou as SKUs. Copilot premium requests, Copilot cloud agent premium requests e Spark premium requests viraram coisas distintas no relatório. Ponha cap maior no de cloud agent. É onde a tendência de gasto cresce mais rápido (sessão agentic varre repositório inteiro, contexto explode, tokens explodem) e você quer dar espaço pra isso, mas com teto.
5. Alertas 75/90/100 sempre ativos, mesmo sem Stop usage. Nos primeiros dois meses, recomendo deixar alertas ON e Stop usage OFF nos cost centers. Você quer ver primeiro, sem bloquear. A pior coisa que pode acontecer no piloto é alguém ficar travado no meio de uma sprint por causa de um cap mal calibrado. Depois que tiver baseline, vira o Stop usage pra ON.
6. Cuidado com budgets sobrepostos. A própria doc tem um exemplo didático: budget de $50 no produto Actions e $100 numa SKU de Linux 96-core. O da SKU vira inútil, porque quando o do produto esgota, todo mundo é bloqueado. Replicado pra Copilot: não crie budget no enterprise inteiro e no cost center pra mesma SKU sem pensar bem. O menor cap é quem manda. E quando bloqueia, ninguém entende o porquê.
A vista de empreendedor: 5,83x ainda fecha conta
Olhando a planilha de $2.668,78 com cara de quem assina o boleto no fim do mês, a primeira reação é apertar o cinto. Olhando a mesma planilha com cara de empreendedor que viu o que saiu do time em abril (features entregues, conteúdo publicado aqui no blog, vídeos no canal, PRs revisados, bugs caçados em horas que antes seriam dias) o cálculo muda completamente.
Em 9 cabeças, $2.668 dão $296 por pessoa por mês. Comparado com o custo de uma hora de engenheiro sênior no mercado brasileiro, é menos de 4 horas de trabalho por mês por dev. Se o Copilot economiza 4 horas de qualquer um no time num único mês, ele se paga. E na minha leitura honesta da nossa rotina, economiza muito mais do que isso. Por isso vale.
E aqui mora o argumento mais forte a favor da disciplina de modelo: tudo isso foi com zero otimização consciente. Ninguém no time foi orientado a usar Sonnet em vez de Opus, ninguém configurou modelo padrão, ninguém olhou pra fatura projetada antes de hoje. Se o ROI já fecha sem otimização, com a disciplina mínima que estou descrevendo neste post (default sensato, cost center por squad, alerta antes de bloqueio) o ROI explode. Esse é o argumento que eu levo pra reunião de orçamento. O pânico do 5,83x fica do lado de fora.
Lições aprendidas
- PRU mascarava o consumo real. AIC obriga você a olhar. O número velho era confortável. O novo é honesto. Pessoa adulta escolhe honesto.
- Quem está dentro da quota hoje vai ser o usuário mais caro amanhã. O subsídio invisível some em 1º de junho. Olhe pros nomes que pagam $0 hoje — eles vão liderar o ranking de custo em julho.
- Escolha de modelo virou decisão de FinOps. Opus paga 9x mais que Sonnet por unidade real de uso. Configure um default sensato e reserve Opus pra refactor que justifica.
- Promo é colchão temporário, não almofada permanente. 22% de desconto em Jun-Ago. Setembro é o primeiro mês de verdade. Use os 3 meses pra calibrar, não pra acomodar.
- Flex allotment é variável; base credits é o piso garantido. Modele FinOps de longo prazo com a base, trate o flex como bônus que pode encolher.
Sua vez de rodar a ferramenta
Se você administra Copilot em qualquer escala, de Pro individual a Enterprise com centenas de seats, a recomendação é simples e gratuita: abra o Copilot Billing Preview, baixe seu CSV de Premium Request Usage Report e rode. Leva menos de 5 minutos. O dado nunca sai do seu browser. E o número que vai aparecer na tela é a primeira oportunidade real de planejar antes de 1º de junho, em vez de reagir depois.
Quando rodar, me conta nos comentários: qual foi seu multiplicador? Foi mais doloroso que 5,83x ou menos? Qual modelo dominou seu AIC cost? E mais importante: depois de ver o número, o que você vai mudar no comportamento do time antes do dia 1º?
Referências
Anúncios oficiais
- GitHub Copilot individual plans: Introducing flex allotments in Pro and Pro+, and a new Max plan — Update de 12/maio/2026 que cobre flex allotments e o plano Max
- GitHub Copilot is moving to usage-based billing — Anúncio original de 27/abril/2026
Ferramentas
- Copilot Billing Preview — Web app que processa o CSV no browser e simula a fatura sob AIC
Documentação
- Usage-based billing for individuals — Doc oficial com a tabela atualizada de base + flex
- Setting up budgets to control spending on metered products — Como criar budgets nos escopos enterprise/org/repo/cost center
- Manage and monitor spending for GitHub Copilot — Hub de documentação de FinOps Copilot
- Models and pricing — Tabela de preço por modelo e por 1M tokens
Posts relacionados aqui no blog
- A Conta Chegou: GitHub Anuncia AI Credits e Marca 1º de Junho como o Fim da Era PRU — Post anterior que explica PRU → AIC, multiplicadores anuais Pro/Pro+, e a mecânica de pooled credits
- A IA Barata Está Acabando — A previsão original de 22/abril que virou cronograma
[]s e até a próxima.