A minimal tensor processing unit (TPU), inspired by Google's TPU
9 months ago
- #hardware-design
- #open-source
- #TPU
- 谷歌TPU V2/V1架构基础上重新设计的最小化张量处理单元(TPU)
- 功能特性:每个时钟周期执行乘加运算
- 数据流向:输入值水平流动,部分和垂直累加,权重固定存储
- 架构设计:采用旋转输入矩阵的处理器网格阵列(初始2x2规模)
- 模块组成:含偏置加法、Leaky ReLU激活、均方误差损失函数、Leaky ReLU导数计算及双端口存储器
- 指令系统:94位宽指令集架构,控制数据传输与TPU交互
- 开发环境:需配置cocotb、iverilog和gtkwave进行开发测试
- 模块扩展:新增模块需编写SV文件、测试用例并更新Makefile
- 后续规划:开发编译器工具链及扩展TPU阵列规模
- 开源目标:帮助硬件设计初学者快速入门的开源项目