model serving

Categoria: modelos e inferência

Infraestrutura que hospeda e disponibiliza modelos para inferência em tempo real ou batch, gerenciando escalabilidade, balanceamento de carga e disponibilidade dos endpoints.