模型部署与服务化 - MLOps实践
训练 -> 转换 -> 部署 -> 运维
一、部署概述
训练 -> 转换 -> 部署 -> 运维
二、模型导出
import torch
torch.onnx.export(model, dummy_input, "model.onnx")
三、API服务
from fastapi import FastAPI
app = FastAPI()
@app.post("/predict")
async def predict(data: Input):
return model.predict(data)
四、容器化部署
Docker + Kubernetes
五、监控优化
Prometheus + Grafana
最后更新: 2026年4月19日
讨论与反馈