Daniel Barra
- 27 de abr. de 2022
- 15 min para ler

Arbitragem com Baterias: Quanto o Custo Precisa Baixar para a Conta Fechar?

Com a presença cada vez mais frequente das fontes intermitentes como eólica e solar, as baterias já atingem protagonismo em mercados desenvolvidos. No Brasil seguimos carregados de impecilhos que impedem esse mercado de avançar, mas pouco a pouco chegamos lá. Nesse sentido, as falas do regulador trazem um ar de esperança por oportunidades que podem mudar tudo.

André Pepitone, diretor-geral da Aneel, declarou em evento promovido pela Huawei que 2022 será o ano em que o mercado das baterias vai “destravar”.

Ao mesmo tempo, com o Mercado Livre de Energia Elétrica atingindo maiores níveis de sofisticação, começa-se a pensar em fontes adicionais de receitas para operadores de baterias no Brasil além das mais conhecidas.

Vamos começar a contar essa história do começo, explicando um pouco quais as fontes mais comuns de receitas obtidas com baterias em geral e para o caso brasileiro em particular.

No geral, quais as fontes de receitas de baterias?

Baterias possuem flexibilidade de gerar receita de pelo menos três maneiras diferentes.

A primeira é no mercado de energia “puro”, provendo arbitragem temporal ao adquirir energia (carregar a bateria) em momentos em que o grid está menos sobrecarregado (e portanto o preço está mais baixo) e vendendo (descarregando a bateria) em momentos em que a geração demanda CVUs (e portanto preços) mais altos dado a demanda energética comparada à geração. Esse tipo de “serviço” para o grid é remunerado pela própria diferença de preços do MWh. Apesar de no Brasil não ser comum ainda, na Europa já há diversos participantes utilizando baterias para predominantemente esse fim. São os chamados merchant batteries.

A segunda forma que as baterias podem gerar receitas é provendo os chamados serviços ancilares. Dentre essa categoria os serviços mais comuns de serem prestados são: reserva, qualidade do fornecimento e garantia de confiabilidade. Esses serviços são parte predominante da receita de baterias no mercado europeu, e a compreensão é de que há oportunidades únicas de geração de valor para todo o setor elétrico pelas baterias, em especial em regiões onde as fontes intermitentes crescem substancialmente, aumentando a dificuldade de gerenciar alguns desses fatores.

A terceira forma que as baterias geram receitas é por meio da integração com infraestrutura já existente. Isso pode ser feito tanto nos geradores de fontes intermitentes, como solar e eólica, provendo maior estabilidade na energia colocada no grid no tempo, reduzindo custos e riscos do balanço energético, assim como gerenciando restrições que podem existir pela regulação ou pelos tipos de contratos negociados. Também pode ser realizada integrando na carga, realizando por exemplo o que chamamos de peak shaving (redução dos picos de consumo que aumentam o custo com capacidade e distribuição). Essas soluções integradas à carga hoje são o uso mais comum de baterias no mercado brasileiro. Por último, essas integrações também podem ocorrer no nível da rede energética, postergando a necessidade de ampliação de infraestrutura de distribuição ou de transmissão. Exemplo disso é o projeto da ISA CTEEP no litoral sul Paulista.

Mais comum do que a exploração de uma única fonte de receita é o empilhamento das múltiplas fontes. Nesse sentido, poucos mercados oferecem tantas oportunidades quanto o britânico, que recém lançou uma nova solução para o grid chamada Dynamic Containment (DC), que é um serviço ancilar de regulação de frequência na qual as baterias parecem ter um papel especificamente importante. Dynamic containment veio para suprir o serviço anterior de regulação de frequência por ser uma resposta mais rápida às mudanças na carga ou geração que afetam a frequência do sistema elétrico como um todo. A contratação de DC ocorre por meio de leilões referentes ao dia seguinte. Para saber mais sobre DC e como as baterias vão participar desse mercado, acesse essa notícia.

Como se ganha dinheiro com baterias no Brasil?

No Brasil há uma estrutura única de mercado para a realização de arbitragem. Diferente da maioria dos mercados europeus, no qual se define a operação do dia seguinte por meio de leilões nas quais os geradores e consumidores podem dar lances e acordar um valor pelo MWh, aqui os preços são definidos de forma determinística pelo modelo DESSEM e divulgados de forma definitiva até as 20h do dia ANTERIOR à operação. Isso significa, na prática, que sabemos em D+0 os preços de todas as horas do D+1. Isso é bem importante porque não nos expõe a risco de mercado, e nem à possibilidade de ter um lance aceito e outro recusado (nesse exemplo comprando mas depois não conseguindo vender).

Apesar disso, há relativamente pouca volatilidade intradiária de preços. O gráfico abaixo mostra o spread máximo intradiário de 20/01/2020 até 09/11/2021 no submercado Sudeste:

Podemos observar que a maior parte do tempo temos poucas oportunidades intradiárias relevantes. Com o alto custo de degradação e ineficiência, os objetivos de receita baseados apenas em arbitragem tornam-se difíceis de serem atingidos. Apesar disso, com a maior penetração das fontes renováveis intermitentes, esse cenário de spreads intradiários pode mudar radicalmente nos próximos dez anos.

Do ponto de vista de geração de receitas provendo serviços para o sistema, as (relativamente) boas notícias acabam na arbitragem. Isso se dá porque uma das maiores fontes de receita das baterias em mercados mais maduros é no mecanismo de balanço energético intradiário. No Reino Unido, por exemplo, os geradores e consumidores que geram/consomem mais ou menos do que estava na sua programação do dia anterior precisam dar lances em um leilão ao vivo que define o preço para geração ou consumo adicional (ou a menos). No Brasil temos o despacho central controlado pelo operador e com qualquer diferença em relação ao planejado sendo liquidado ao preço do PLD. Mesmo no caso de unidades menores que podem controlar seu próprio despacho a restrição ao valor do PLD impede que essas monetizem a sua flexibilidade.

Pior ainda do que isso é o fato de que nossa regulação hoje não é favorável à inserção de outras modalidades de serviços ancilares que não sejam hidrelétricas. O Gesel em 2020 produziu um material bastante relevante e atual comparando nosso sistema no Brasil ao do sistema elétrico Português. Nesse material se mostra, por exemplo, que lá o controle (regulação) de frequência é contratado por meio de mecanismos de mercado, diferente do que ocorre no Brasil.

Observou-se que no Portugal se usam as reservas tanto secundarias quanto de regulação para seguir as variações tanto da geração quanto do consumo. Estas reservas são contratadas através de mecanismos de mercado onde cada gerador realiza uma oferta para aumentar o reduzir sua produção com o respetivo preço, isso permite que tecnologias diferentes (hídrica e térmicas) forneçam estes serviços sendo remunerada em função de seus custos caso contratadas no mercado.

Já no caso do Brasil se constata uma situação diferente. Mostrou-se que quase a totalidade dos serviços ancilares são fornecidos por fontes hídricas devido à estrutura preponderantemente hídrica da matriz. Contudo, se constatou que a mudança na matriz elétrica pode trazer mudanças não apenas na forma de remunerar e contratar os serviços ancilares, mas na própria caracterização destes serviços.

Fonte: ANÁLISE DO MERCADO DE SERVIÇOS ANCILARES DO PORTUGAL: IMPLICAÇÕES PARA O CASO BRASILEIRO - GESEL

Apesar disso, o crescimento da matriz intermitente no Brasil, particularmente puxado pela solar e eólica, cria uma oportunidade bastante interessante para a utilização de baterias atrás do medidor como complemento de geradores.

Um dos casos de usos que consideramos mais interessantes é a utilização de baterias para “achatar” a curva de geração de uma dessas fontes intermitentes. O vento nem sempre está soprando e o sol nem sempre está brilhando, portanto ter a capacidade de nivelar a geração ao longo do dia, independentemente das condições daquele dia em específico, permite maior previsibilidade. Isso se torna ainda mais relevante no Brasil, dado o design de mercado que permite observar os preços com mais de 24h de antecedência. Além disso, aqui temos um mercado que negocia majoritariamente produtos em base mensal do tipo FLAT (ou seja, com o mesmo número de MWh para todas as horas daquele período de suprimento). Portanto, para que se tenha competitividade sem exposição ao mercado spot, nivelar a curva de geração pode ser de grande valor.

Também há oportunidades para os consumidores. Os custos desses agentes com energia elétrica são basicamente divididos em 3 tipos: energia, capacidade e custos do sistema (incluindo mas não limitado a distribuição e transmissão). Ao utilizar um parque de baterias dentro da sua estrutura atrás do medidor há a oportunidade de redução de custos nos dois primeiros.

Pode-se reduzir o custo final da energia elétrica pela capacidade de transferir o consumo de energia de um momento que estiver acima do seu limite determinada pelo contrato (normalmente definido pela quantidade de MWm adquiridos mais a faixa estipulada pela sazonalização, modulação e flexibilidade) com seu provedor para um momento em que estiver abaixo. Isso já reduz a chance de sair da faixa de tolerância do contrato e ficar exposto ao PLD.

Também é possível reduzir o custo para o consumidor evitando que ele atinja picos de consumo durante pequenos períodos de tempo mas que gerem cobranças pela capacidade dedicada a ele. Digamos que temos um consumidor que em média consome 10MWm, mas em um dia do mês esse consumo sobe para 13MWm. Dado que o sistema elétrico precisa ser robusto o suficiente para suportar os momentos de maior demanda, é compreensível que haja um custo para o agente por essa necessidade de expansão do seu consumo. Esse custo de capacidade pode ser reduzido ao se realizar o que chamamos de peak shaving, que nada mais é do que o uso de energia que armazenada na bateria em momentos de menor consumo, nesses momentos em que a capacidade demandada seria aumentada.

Barreiras

As maiores barreiras para implementação de sistemas de baterias no Brasil hoje são a regulação, que como já citamos é imprópria para a monetização desses equipamentos, e a carga tributária. Hoje se paga da ordem de 75% 🤯 de impostos para importação de sistemas de armazenamento de baterias.

Um algoritmo de arbitragem de baterias

A definição de arbitragem, para aqueles pouco familiares com o conceito, é a seguinte: obter lucros decorrentes da diferença de preços entre dois ou mais mercados, fazendo operações combinadas que permitam lucrar devido a esta diferença. Portanto, a arbitragem permite auferir um lucro livre de risco, após descontados os custos de transação.

Um exemplo simples é o das feiras de frutas: digamos que em duas cidades diferente a mesma variedade de maçã é vendida na feira. Se na cidade 1 a maçã for vendida por x reais e na cidade 2 por 2x reais, caso o custo de transporte da cidade 1 para a 2 seja menor do que a diferença e a demanda for previsível, basta comprar maçãs na 1 e vender na 2 para auferir lucro.

Em mercados mais tradicionais e eficientes, sempre está presumido o princípio da não-arbitragem, pois qualquer oportunidade de arbitragem deve se fechar rapidamente. Por exemplo, digamos que exista uma oportunidade de arbitragem na B3 entre os contratos futuros de mini índice e do índice cheio. Dado que ambos possuem o mesmo ativo adjacente, espera-se que rapidamente os agentes do mercado irão operar esta diferença até que os preços se equilibrem entre os dois mercados.

No entanto, implementar uma estratégia de arbitragem com baterias possui um maior grau de complexidade. Como elas são usadas para armazenar a energia durante a operação, é necessário já ter as baterias prontas para operar e levar em conta o seu custo. Como esse conceito pode ser aplicado aos parques de baterias no Brasil?

Podemos testar se existem oportunidades de arbitragem entre diferentes horas de um dia. Como os preços são divulgados no dia anterior, é possível verificar se, dado o custo para armazenar a energia, compensa realizar uma arbitragem entre dois momentos diferentes do mesmo produto, comprando energia num ponto de início da operação, armazenando na bateria e finalmente vendendo.

No fim das contas, esse algoritmo aproveitaria a volatilidade intraday do PLD de uma forma inédita no mercado brasileiro, pois quanto maiores e mais frequentes as variações de preço ao longo do dia, maior o potencial de ganhos da estratégia testada.

Mas existem custos que não podem ser negligenciados, a começar pelo custo de degradação das baterias. Como pode ser visto em Bordin et al. (2017), o custo de degradação de bateria por kWh (B) é igual a:

em que R é o custo de reposição da bateria, L o rendimento vitalício da bateria (lifetime throughtput) em KWh e E a eficiência de ida e volta (ou total) da bateria, que é a multiplicação das eficiências de entrada e de saída. Para calcular L para uma dada profundidade de descarga ou DoD (depth of discharge), fazemos a seguinte conta:

que é a multiplicação da profundidade (DoD), capacidade máxima da bateria (Q) e ciclos de vida da bateria para cada DoD.

Vamos tomar como exemplo uma pequena bateria, usando os dados do site da fabricante. O custo de reposição é de US$ 6.900,00 que multiplicado pela taxa de câmbio do dia 21/04/2022 (1 USD = 4,60 BRL) é igual a R$ 31.740,00. A fabricante oferece uma estimativa de 6000 ciclos até a total depreciação quando se opera com 80% de profundidade, a capacidade total é de 10,2 kWh e uma alta eficiência total de 98%. Portanto, L será igual a:

e com isso podemos calcular B:

e desta forma calcular o custo fixo por trade:

Além desse custo fixo, para cada operação também há o custo variável ou custo de eficiência, cuja fórmula é dada por:

em que Ei é a eficiência de entrada e E0 a eficiência de saída, cujos valores são assumidos por nós como 99% (de forma que a multiplicação de ambos resulte na eficiência total de 98%).

Por fim, vale ressaltar que estamos assumindo algumas hipóteses simplificadoras semelhantes a eliminar os custos de transação para estudos em mercados financeiros tradicionais. São elas: não consideramos custos de instalação e manutenção, nem os impostos sobre o preço de venda final da bateria.

Como testamos nossa hipótese?

Em abril de 2018 a CCEE começou a divulgar o preço sombra, que foi a fase de testes do PLD horário até a sua efetiva implementação. Ou seja, além do PLD semanal por patamar, também passou a ser publicado o PLD horário do dia seguinte para cada um dos 4 submercados (Norte, Nordeste, Sudeste e Sul).

Como em algumas outras análises que realizamos, o nosso material base para este estudo foi a série do PLD horário dos 4 submercados desde o dia 17/04/2018 (primeiro dia do preço sombra) até o dia 01/04/2022 — lembrando que a CCEE adotou o PLD horário oficialmente na virada de 2020 para 2021.

Esperamos resultados bastante similares no Sul e Sudeste, pois eles têm a maior correlação entre si, embora obviamente os quatro submercados sejam todos altamente correlacionados. Abaixo, a matriz de correlação:

De posse dos dados do dia seguinte, a estratégia testada busca encontrar pontos de mínimos e máximos locais para usar como preços de compra e de venda, respectivamente. O funcionamento é o seguinte:

O algoritmo parte da primeira hora do dia e procura até achar um horário que o preço aumenta;
Quando o algoritmo encontra esse horário, ele encontrou o ponto de compra, que é a hora antes do preço começar a subir (por exemplo, se o preço está no mínimo diário desde as 0h e nas 4h ele sobe, então o ponto de compra é 3h);
Depois ele procura nas horas seguintes ao ponto de compra até achar um horário em que o preço diminui, e ao encontrar, o algoritmo tem o ponto de venda, que é a hora antes do preço começar a descer (continuando o exemplo do item acima, começaria a procurar a partir das 4h até encontrar um ponto de venda);
O algoritmo repete o processo até o dia acabar, buscando novos candidatos para pontos de compra e de venda;
O algoritmo verifica quais trades vale a pena realizar com base no custo necessário para armazenar a energia nas baterias durante o horário de duração da operação.

Para ilustrar este raciocínio vamos mostrar uma tabela de exemplo, com valores meramente ilustrativos:

Neste caso, os possíveis trades seriam entrando 1h e saindo 4h ou entrando 6h e saindo 8h, caso sejam operações que compensem o gasto com a bateria. O retorno de cada operação será dado pela diferença entre o maior e o menor preço do dia, deduzidos também os custos com a bateria:

em que E é a eficiência de ida e volta da bateria e DoD (do inglês depth of discharge) é a profundidade de descarga.

Na prática, uma boa parte dos dias terá apenas um trade com o maior spread intraday (ou nenhum trade caso até esse spread não compense a operação), mas alguns dias terão múltiplos trades lucrativos. Também veremos a seguir que os trades costumam ter uma duração média e um intervalo entre eles mais longo do que o exemplo acima.

Quais os resultados atingidos?

Com a nossa estratégia de teste, rodamos o backtest para cada um dos quatro submercados de energia, presumindo a mesma bateria para todos e alterando apenas qual série de preços inserir como entrada do modelo. Considerando os dados da bateria já expostos acima, podemos calcular o volume de cada, considerando a profundidade de 80%:

e o custo fixo (degradação da bateria por trade):

Portanto o lucro líquido por trade, em média, deveria superar este valor somado ao custo variável médio (que é bem menor). Será que essa conta fecha? Vamos descobrir a seguir visualizando os resultados obtidos.

O primeiro gráfico mostra o lucro por trade ao longo do tempo, já descontando o custo variável, mas ainda ignorando o custo fixo (que iremos incluir no gráfico acumulado):

Uma das primeiras coisas que se percebe é que, apesar dos dados contemplarem o período até 01/04/2022, o gráfico acaba no fim de janeiro. Isso se deve ao fato de que o PLD está operando praticamente sempre no piso desde janeiro, então nenhuma janela de arbitragem se abriu nos dias de fevereiro em diante.

Como sabemos com um dia de antecedência o preço, não há nenhum drawdown diário na estratégia. No máximo, existem períodos onde os lucros são próximos de zero em virtude da baixa diferença entre os preços de venda e de compra.

De fato, há uma grande semelhança nas figuras do Sul e Sudeste. A região Norte, por sua vez, apresentou trades parecidos com estas duas, porém com abertura de menos oportunidades de arbitragem — perceba que nos meses anteriores a julho de 2020 o gráfico se mantém bastante próximo ao zero, diferente do Sudeste.

Mas exceto por esta ocasião na região Norte e por uma oportunidade recente no Sul e Sudeste (janeiro de 2022), percebemos que na maioria dos momentos houve oportunidades ao mesmo tempo em todos os submercados.

Julgando pelo tamanho da área sombreada no gráfico, presume-se que o Nordeste foi a região onde o algoritmo melhor performou, seguido por resultados parecidos no restante dos submercados. Vamos tirar a prova no gráfico abaixo, do retorno acumulado ao longo do tempo:

Agora paramos de ignorar o elefante na sala: ao considerar o custo fixo por trade, todos os mercados têm prejuízo e o menor prejuízo não é o Nordeste, mas o Norte com R$ (6.997,83). De fato, depois vem o Nordeste seguido do Sudeste e Sul, os três com mais de R$ (8.000). No começo todos os resultados acumulados andavam juntos, mas na primeira metade de 2019 os outros começaram a se descolar do Norte.

A explicação é simples: caso o custo fixo seja levado em conta, não existe nenhum trade vencedor. O custo fixo é o mesmo para todo trade, então o resultado incluindo o custo de degradação é uma função linear do número de trades realizados em cada submercado. O gráfico abaixo ilustra bem essa dinâmica, sendo uma versão espelhada quase perfeita do gráfico de prejuízos:

Até o começo de 2019 os quatro submercados possuem quantia quase idêntica de trades realizados, mas após a virada do ano começa o descolamento entre eles. O menor número de trades ocorre no submercado Norte, com 1360 operações.

Quanto aos outros, permaneceram com um número acumulado de transações mais parecido ao longo do tempo. No final o submercado Sul foi o que apresentou o maior número acumulado de operações entre os três, com 1732 contra 1697 do Sudeste e 1675 do Nordeste.

Por si só, este número mostra que caso a receita dos trades fosse maior, não seria em função de um maior número de trades, pois o Nordeste tem o melhor resultado excluindo a depreciação, mesmo tendo o menor número de trades.

A tabela a seguir apresenta algumas informações a destacar sobre os resultados por submercado, como um sumário do que foi apresentado até agora e mais alguns dados:

Exceto pelo submercado Nordeste, a operação de lucro máximo em todos os submercados foi na noite do dia 04/07/2021, com valor de R$ 3,95. O tempo médio por operação (diferença entre os horários de compra e venda) foi um pouco mais ou menos do que 5 horas para todos os submercados, e o tempo máximo sem operar foi bem maior no Norte e Nordeste.

No entanto, com a atual conjuntura do mercado, o tempo máximo sem operar em todos os submercados já estaria chegando em 90 dias novamente, pois as últimas operações em todos os submercados foram dia 28/01/2022. Desde então o PLD está constantemente próximo do piso sem uma volatilidade intraday que faça compensar um trade.

O que falta para que a arbitragem seja lucrativa por si só?

Considerando o alto custo fixo por trade, para que esta estratégia funcionasse por si só, o retorno médio por trade precisaria ser muitas vezes maior. Do ponto de vista de receita, isso depende da existência de altos spreads intraday do PLD, que está sempre sujeito aos caprichos da situação climática. Basta observar a situação atual, com o PLD praticamente o tempo todo no piso desde o final de janeiro.

Mas perceba que nem mesmo o trade mais lucrativo na região Nordeste, que também foi a região com maior lucro médio (ignorando depreciação), foi capaz de ultrapassar o valor do custo fixo. Portanto, precisaríamos de uma redução de grande magnitude no custo de degradação da bateria.

Vamos fazer uma conta rápida para mostrar o quanto esse custo precisaria diminuir para chegar ao ponto de equilíbrio operacional, considerando um modelo puramente merchant. Considerando o lucro médio por trade do Nordeste (R$ 0,36) e o volume dos trades como 8,12 kWh, o lucro por kWh é:

portanto para atingir um ponto de break-even, o custo de degradação das baterias precisaria ser aproximadamente o mesmo que o lucro por kWh (estamos desprezando os custos variáveis por serem pequenos). Vamos ver em quantas vezes o custo precisaria diminuir, tomando o atual custo de degradação por kWh:

Então para que o custo de degradação igualasse o lucro médio dos trades no submercado Nordeste, ele precisaria ser 15 vezes mais barato. E isso sem contar os submercados com menor lucro médio, onde o custo precisaria ser reduzido em mais de 20 vezes.

Mas olhando para o passado e vendo como as baterias se tornaram mais sofisticadas ao longo do tempo, quem sabe como elas estarão daqui a alguns anos? Por isso acreditamos que é importante se posicionar cedo e buscar entender o potencial dessas operações para obter uma vantagem competitiva num futuro onde a arbitragem temporal tem um espaço relevante na ampliação das fontes renováveis, que, por sua vez, são essenciais para um futuro mais sustentável para todo o planeta.

Gostou desse artigo? Receba todos os nossos conteúdos diretamente no seu e-mail! Fazendo parte da nossa comunidade