搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
电子工程专辑
29 天
超全!一文详解大型语言模型的11种微调方法
实验表明,QLoRA技术使得研究者能够在单个48GB GPU上微调650亿个参数规模的模型,同时维持16bit精度任务的完整性能。例如,在训练Guanaco模型时,仅需在单个GPU上微调24h,即可达到与ChatGPT相当的99.3%性能水平。通过QLoRA微调技术,可以有效降低模型微调时的显存 ...
GitHub
1 个月
awesome-LLMs-In-China
ChatLaw-33B基于Anima33B->Guanaco->LLaMA 27 中国科学院计算技术研究所百聆北京 科研 基于 LLaMA,权重Diff下载7B和13B,demo 28 好未来MathGPT北京 教育 学而思 29 晓多科技+国家超算成都中心晓模型XPT四川成都 客服 试用申请 30 昆仑万维天工Skywork北京 通用 开源且可 ...
GitHub
27 天
微调大模型可以像这样轻松…
除上述链接以外的其他网站均为未经许可的第三方网站,请小心甄别。 与 ChatGLM 官方的 P-Tuning微调相比,LLaMA Factory 的 LoRA 微调提供了 3.7 倍的加速比,同时在广告文案生成任务上取得了更高的 Rouge 分数。结合 4 比特量化技术,LLaMA Factory 的 QLoRA 微调进一步降低 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
今日热点
Florida sues FEMA officials
Named grand marshal
Vonn ending her retirement
The Onion buys Infowars
Declines WH invitation
FBI offering up to $25K
To replace Kotb on 'Today'
To close hundreds of stores
Former solicitor general dies
Ban on executives upheld
Judge blocks name change
Lawyers seek to quit case
FBI raids Coplan's home
Pulled from lunch program
Gaetz resigns from Congress
Briefly detained at airport
Teen guilty of swatting calls
Threatened by LSU student?
Wins GOP nod for speaker
Largest coral ever recorded
Remains ID'd after 82 years
China hacked telecom firms
Seeks pause in docs appeal
Notre Dame set to reopen
House GOP conference chair
Starts issuing layoff notices
Global increase in diabetes
Gabbard picked as DNI
Israel accused of war crimes
EU fines Meta
Weekly jobless claims fall
反馈