搜索优化
Rewards
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
1 天
万字推演OpenAI o1 self-play RL 技术路线
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!作者:曹宇,阿里巴巴集团 · 大模型练习生,AI 系统及算法方向原文:https:/ ...
10 天
o1 改变了 Scaling 范式?Self-Play 还值得 All In 吗?
事件 :OpenAI 新发布的 o1 模型在数学和理科推理能力上取得极大突破,其技术博客隐隐指出 Scaling Law 的范式正在转向推理,且这种 Scaling 形式与预训练有很大不同。这一说辞和「草莓」火热期间所引发的 Scaling 范式转向 ...
6 天
强化学习成为OpenAI o1灵魂,速来学习下Self-play增强大模型
在机器学习尤其是强化学习领域,自我博弈(Self-play)是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息,也能通过自己与自己的博弈来学习并获得提升,这常见于游戏场景。AlphaGo ...
人人都是产品经理 on MSN
11 天
AI大模型实战篇:Self Discover框架,万万想不到Agent还能这样推理
前面我们分享了Basic Reflection这种偏重反思的AI Agent设计模式,在面对复杂的问题时,就需要更强大的Self-discover设计模式来进行。这篇文章,作者的分享一定不能错过。 在上篇文章《AI大模型实战篇:Basic Reflection,AI Agent的左右互搏之术》中,风叔结合原理和具体源代码,详细介绍了第一种偏重反思的AI Agent设计模式,即Basic Refle ...
12 天
AI大模型实战:Self Discover框架带来的推理革命
Self ...
36氪
22 小时
人生就像玩俄罗斯方块
以下是你所需要的四种关键势能。 自我问责(self-accountability):对发展自己的能力负责,管理自己的不足,用理性控制自己的行为。 自我认识(self-knowledge):了解自己的长处和短处——知道什么事自己可以胜任,什么事自己无法胜任。 自我控制(self ...
2 小时
穆罕默德·马兰迪:全球南方交朋友,不用西方平台行不行?
Club点评:在北京对话主办的“金砖国家与多极世界2024对话会”上,伊朗德黑兰大学教授穆罕默德·马兰迪指出,美西方对伊朗实行数十年制裁,包括限制其发声渠道。他认为,俄罗斯已开始面临类似处境,中国则需要“未雨绸缪”。由于西方控制全球主要社交媒体,全球 ...
10 天
Chongqing’s first five-star self-drive camping site opens
This marks Chongqing’s first five-star auto self-drivecamping site and the third in the entire country. During the national ...
11 小时
中科院武汉病毒研究所研发新型疫苗,为埃博拉病毒防控带来新希望
中国科学院武汉病毒研究所张波研究员团队在国际学术期刊《Molecular Therapy》上发表了一项重要研究成果,题为“基于自复制RNA的埃博拉病毒糖蛋白作为疫苗的合理设计”。这项研究标志着科学家们在开发安全、高效的埃博拉病毒(Ebola ...
36氪
23 小时
草莓现世,大模型达到博士水平了吗?
O1 的水平大致相当于这个程度,它在数学竞赛中通过强化学习和符号空间中的self-play,本质上是一个搜索问题。与围棋类似,它只是找到解决问题的空间,而竞赛题目通常都有明确答案,所以在已有的逻辑推理能力下,解决奥赛题目并不意外。 徐思彦:O1 有没有 ...
新华网
17 小时
2024云栖大会“三问”:AI发展的速度、自动驾驶的精度、人形机器人 ...
阿里云智能集团首席技术官周靖人在大会期间宣布,通义千问升级旗舰模型Qwen-Max,大部分性能接近GPT-4o,数学能力、代码能力还实现了超越。此外,通义万相发布视频生成模型,用户输入文字或图片都能生成动态视频。由此,通义大模型也“攒齐”了文本生成、 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈