guanaco - 搜索 News

实验表明，QLoRA技术使得研究者能够在单个48GB GPU上微调650亿个参数规模的模型，同时维持16bit精度任务的完整性能。例如，在训练Guanaco模型时，仅需在单个GPU上微调24h，即可达到与ChatGPT相当的99.3%性能水平。通过QLoRA微调技术，可以有效降低模型微调时的显存 ...

GitHub1 个月

awesome-LLMs-In-China

ChatLaw-33B基于Anima33B->Guanaco->LLaMA 27 中国科学院计算技术研究所百聆北京科研基于 LLaMA，权重Diff下载7B和13B,demo 28 好未来MathGPT北京教育学而思 29 晓多科技+国家超算成都中心晓模型XPT四川成都客服试用申请 30 昆仑万维天工Skywork北京通用开源且可 ...

GitHub27 天

微调大模型可以像这样轻松…

除上述链接以外的其他网站均为未经许可的第三方网站，请小心甄别。与 ChatGLM 官方的 P-Tuning微调相比，LLaMA Factory 的 LoRA 微调提供了 3.7 倍的加速比，同时在广告文案生成任务上取得了更高的 Rouge 分数。结合 4 比特量化技术，LLaMA Factory 的 QLoRA 微调进一步降低 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点