Posts 模型部署技术概览
Post
Cancel

模型部署技术概览

前言

开坑模型离线部署技术相关内容更新 简单梳理技术栈如下(需要持续更新): img

深度学习框架

训练框架

Torch

PyTorch关键模块解读

Tensorflow

推理框架

ONNX

ONNX的模型优化与量化细节

TensorRT

AI硬件

AI模型部署硬件综述

深度学习编译器

算法

量化

低精度计算

网络压缩

上层应用

预处理加速

分布式推理

安全加密

模型优化方案

Transformer离线部署-GPU优化策略

This post is licensed under CC BY 4.0 by the author.