Hasty Briefsbeta

双语

Llama2.c64: a port of llama2.c to the Commodore C64

a year ago

#Commodore64
#AI
#Llama2

Llama2.c64是llama2.c移植到Commodore C64的版本，至少需要2MB REU内存。
可运行260K参数的tinystories模型，模拟3岁儿童的讲故事能力。
配置步骤包括启用REU、设置2MB内存并加载weights.reu权重文件。
命令包含'make build'构建、'make test'测试及'make clean'清理。
Exomizer工具可选用于实机运行时的程序压缩。
优势包括低功耗、本地推理能力和数据安全性。
限制在于运行速度慢且无法处理超过8MB的模型。
模型预处理使用generate-model-files.py脚本，生成tokenizer.bin、config.bin和weights.reu文件。
模型以确定性模式运行（temperature=0.0），支持top-p采样。
输出每个标记约需8分钟，首个标记为起始标识符。
优化空间有限，大部分时间消耗在矩阵乘法函数。
该程序不适合对话场景，但能生成短篇故事。