ailearn

模型部署与服务化 - MLOps实践

训练 -> 转换 -> 部署 -> 运维

访问-- -- --

一、部署概述

训练 -> 转换 -> 部署 -> 运维

二、模型导出

import torch
torch.onnx.export(model, dummy_input, "model.onnx")

三、API服务

from fastapi import FastAPI
app = FastAPI()
@app.post("/predict")
async def predict(data: Input):
    return model.predict(data)

四、容器化部署

Docker + Kubernetes

五、监控优化

Prometheus + Grafana

最后更新: 2026年4月19日

访问 --

讨论与反馈