搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
8 小时
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer,Transformer ...
本论文第一作者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法。指导教授主要包括王立威,北京大学智能学院教授;Bernt Schiele,德国马普计算所教授;Federico Tombari 谷歌人工智能科学家等。
腾讯网
23 小时
量化遇瓶颈:Scaling Law无法无限扩展?科学家揭示低精度训练的极限
这些年大模型的发展史,某种程度上也是模型规模不断扩张的历史。更大规模的模型参数带来了性能的不断提升,但与此同时,计算成本也急剧增加。为了降低计算成本,低精度训练与推理成为了一种行之有效的策略,它能通过减少计算量和内存占用来提升训练效率和推理速度。例如 ...
腾讯网
10 小时
全球最强开源代码模型来了,Qwen2.5-Coder多项评测取得最佳成绩
这一消息无疑为开发者们带来了福音。 Qwen2.5-Coder系列模型基于Qwen2.5基础大模型进行初始化,通过5.5T tokens的数据持续训练,实现了代码生成、代码推理、代码修复等核心任务性能的显著提升。
8 天
on MSN
Claude 3.5 Haiku AI 模型每百万 tokens 输入1 美元/输出 5 美元
IT之家 11 月 5 日消息,Anthropic 昨日(11 月 4 日)发布博文,宣布开发者可以通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI,调用 Claude 3.5 Haiku ...
23 小时
为了让中小企业用好云,阿里云和合作伙伴今年“双11”干了这个
截至11月11日24时,阿里云分销合作伙伴“双11”销售额同比2023年“双11”实现两位数增长。11月前11天,AI大模型产品新用户数比10月增长了135%;无影云电脑的销售额,更是惊人地达到了2025财年前7个月(自然年2024年4月~10月)总 ...
8 天
GPT-4o加钱能变快,新功能7秒完成原先23秒的任务
从实验结果来看,“预测输出”加持下的GPT-4o响应时间比之前快了2-4倍,同时保持高精度。 值得注意的是,目前“预测输出”功能仅支持GPT-4o和GPT-4o mini两个模型,且是以API的形式。
2 天
深度揭秘CoT,普林斯顿耶鲁发布最新报告:大模型既有记忆推理、也 ...
大型语言模型(LLMs)以其通用性,在多项任务上都取得了出色的性能,虽然思维链(CoT)提示已经证明了大模型具备多步推理能力,但这种能力到底来自于「抽象泛化」(abstract generalization)还是「浅层启发式」(shallow ...
财富中文网
1 天
微策略公司花20亿美元买比特币,创2020年以来的最大交易记录
根据比特币周一超过8.65万美元的创纪录价格计算,此次购买使微策略公司持有的比特币总价值增至约240亿美元。美国当选总统唐纳德·特朗普(Donald ...
阿思達克財經網
10 小时
阿里云开源代码模型Qwen2.5-Coder全系列
阿里云宣布已旗下开源通义千问代码模型Qwen2.5-Coder系列0.5B、3B、14B和32B四款模型尺寸,是继9月云栖大会上发布两款代码模型以外再新增的模型尺寸,预期可更好地满足开发者的多样化需求,并能够探索更广泛的应用场景,包括代码助手和可视化 ...
雷锋网
2 天
超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
11月12日,阿里云通义大模型团队开源通义千问代码模型全系列,共6款Qwen2.5-Coder模型。相关评测显示,6款代码模型在同等尺寸下均取得了业界最佳效果,其中32B尺寸的旗舰代码模型在十余项基准评测中均取得开源最佳成绩,成为全球最强开源代码模型 ...
9 天
on MSN
Anthropic发布Claude 3.5 Haiku模型:定价每百万tokens输入1美元、输出5美元
【ITBEAR】近日,人工智能领域迎来新动态,Anthropic公司宣布其最新AI模型Claude 3.5 Haiku已开放给开发者使用。此次更新通过第一方API、Amazon Bedrock以及Google Cloud的Vertex AI等平台,为开发者提供了便捷的调用方式。 据悉,Claude 3.5 Haiku模型在性能上有了显著的提升,与OpenAI的GPT-4o Mini以及谷歌的Gem ...
红板报 on MSN
9 天
Claude 宣布开放Claude 3.5 Haiku 模型API,每百万 tokens 输入1美元
品玩11月5日讯,据 Anthropic 表示,Claude 3.5 Haiku 模型现已可通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI供开发者访问。 Claude 3.5 Haiku ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈