XJTU-深度学习工具与平台-2026春-思路梳理
第一章
四种模型:CV\GAN\NLP\RL
计算框架,第一代Caffe,配置文件提供layer级操控,不够灵活
第二代,用DAG描述,分TF和Pytorch
TF是静态图,可以全局优化,代码复杂,效率高,没有中间结果
PT是动态图,边执行边定义,代码简介,不能全局优化
自动求导:将复杂的函数拆分为算子组合。
四种模型:CV\GAN\NLP\RL
计算框架,第一代Caffe,配置文件提供layer级操控,不够灵活
第二代,用DAG描述,分TF和Pytorch
TF是静态图,可以全局优化,代码复杂,效率高,没有中间结果
PT是动态图,边执行边定义,代码简介,不能全局优化
自动求导:将复杂的函数拆分为算子组合。