Skip to main content

A foto mostra um dispositivo eletrônico com a marca Lenovo em destaque, escrita em letras vermelhas sobre fundo branco, provavelmente na tela de um smartphone ou tablet. Ao fundo, desfocado, há uma placa-mãe com componentes visíveis, incluindo slots de expansão e texto técnico como “UEFI DualBIOS”. A imagem transmite um contexto tecnológico, associando a marca Lenovo a hardware e sistemas. Infraestrutura

Usar infraestrutura própriapara rodar cargas de inteligência artificial generativa pode ser mais vantajoso que depender exclusivamente da nuvem, e esse investimento pode se pagar em menos de quatro meses. Além disso, em cenários de uso contínuo e grande escala, manter servidores próprios pode gerar economias significativas em até 18 vezes.

Os dados acima fazem parte de um estudo recente da Lenovo, chamado On-Premise vs Cloud: Generative AI Total Cost of Ownership (2026 Edition), que analisa quanto custa operar aplicações de IA generativa na nuvem e em infraestrutura própria dentro das empresas. O levantamento considera o custo total de propriedade (TCO, na sigla em inglês) ao longo de cinco anos, incluindo hardware, energia, operação e manutenção.

Leia também: CMOs em destaque: as lideranças que transformam o marketing

Segundo os dados, o custo aproximado para gerar 1 milhão de tokens usando serviços de IA na nuvem é de US$ 2,00, enquanto na infraestrutura própria esse valor é de US$ 0,11. Em um dos cenários analisados, rodar um modelo de grande porte em servidores próprios pode custar cerca de US$ 4,74 por milhão de tokens, enquanto a execução equivalente em instância de nuvem pode chegar a US$ 29,09, economia de aproximadamente 84%.

“Com a popularização da IA generativa, muitas empresas começaram projetos diretamente na nuvem pela facilidade de implementação. O que o estudo mostra é que, quando essas aplicações passam a operar de forma contínua e em grande escala, o modelo de custos muda significativamente”, diz em comunicado Valério Mateus, gerente geral para a América Latina de serviços e soluções da Lenovo.

Segundo os autores do estudo, essa diferença ocorre principalmente porque aplicações de IA generativa costumam operar de forma contínua, gerando respostas e processando solicitações ao longo do dia. Outra razão apontada é que novas gerações de GPUs e servidores otimizados para IA têm aumentado o desempenho e a eficiência energética, permitindo que empresas “executem modelos mais complexos com melhor relação custo-benefício”.

O estudo completo da Lenovo pode ser baixado (em inglês) nesse link.

Siga oIT Forum no LinkedIn e fique por dentro de todas as notícias!

Close Menu

Wow look at this!

This is an optional, highly
customizable off canvas area.

About Salient

The Castle
Unit 345
2500 Castle Dr
Manhattan, NY

T: +216 (0)40 3629 4753
E: hello@themenectar.com