self-- - 搜索 News

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！作者：曹宇，阿里巴巴集团 · 大模型练习生，AI 系统及算法方向原文：https:/ ...

6 天

强化学习成为OpenAI o1灵魂，速来学习下Self-play增强大模型

在机器学习尤其是强化学习领域，自我博弈（Self-play）是一种非常重要的学习策略。即使 AI 或者智能体没有明确的对手或者没有外部环境提供额外信息，也能通过自己与自己的博弈来学习并获得提升，这常见于游戏场景。AlphaGo ...

11 天

o1 改变了 Scaling 范式？Self-Play 还值得 All In 吗？

事件：OpenAI 新发布的 o1 模型在数学和理科推理能力上取得极大突破，其技术博客隐隐指出 Scaling Law 的范式正在转向推理，且这种 Scaling 形式与预训练有很大不同。这一说辞和「草莓」火热期间所引发的 Scaling 范式转向 ...

人人都是产品经理 on MSN12 天

AI大模型实战篇：Self Discover框架，万万想不到Agent还能这样推理

前面我们分享了Basic Reflection这种偏重反思的AI Agent设计模式，在面对复杂的问题时，就需要更强大的Self-discover设计模式来进行。这篇文章，作者的分享一定不能错过。在上篇文章《AI大模型实战篇：Basic Reflection，AI Agent的左右互搏之术》中，风叔结合原理和具体源代码，详细介绍了第一种偏重反思的AI Agent设计模式，即Basic Refle ...

12 天

AI大模型实战：Self Discover框架带来的推理革命

Self ...

36氪1 天

人生就像玩俄罗斯方块

以下是你所需要的四种关键势能。自我问责（self-accountability）：对发展自己的能力负责，管理自己的不足，用理性控制自己的行为。自我认识（self-knowledge）：了解自己的长处和短处——知道什么事自己可以胜任，什么事自己无法胜任。自我控制（self ...

10 天

Chongqing’s first five-star self-drive camping site opens

This marks Chongqing’s first five-star auto self-drivecamping site and the third in the entire country. During the national ...

4 小时

穆罕默德·马兰迪：全球南方交朋友，不用西方平台行不行？

Club点评：在北京对话主办的“金砖国家与多极世界2024对话会”上，伊朗德黑兰大学教授穆罕默德·马兰迪指出，美西方对伊朗实行数十年制裁，包括限制其发声渠道。他认为，俄罗斯已开始面临类似处境，中国则需要“未雨绸缪”。由于西方控制全球主要社交媒体，全球 ...

13 小时

中科院武汉病毒研究所研发新型疫苗，为埃博拉病毒防控带来新希望

中国科学院武汉病毒研究所张波研究员团队在国际学术期刊《Molecular Therapy》上发表了一项重要研究成果，题为“基于自复制RNA的埃博拉病毒糖蛋白作为疫苗的合理设计”。这项研究标志着科学家们在开发安全、高效的埃博拉病毒（Ebola ...

1 小时

提振经济，A股“大奇迹日”只是一个开始

在社会学中有一个知名理论叫“预期的自我实现（Self-fulfilling Prophecy，即自证预言）”，其所指的是个体或群体对某种结果的预期，可能会通过影响行为和决策，最终促使预期结果成为现实。

36氪1 天

草莓现世，大模型达到博士水平了吗？

O1 的水平大致相当于这个程度，它在数学竞赛中通过强化学习和符号空间中的self-play，本质上是一个搜索问题。与围棋类似，它只是找到解决问题的空间，而竞赛题目通常都有明确答案，所以在已有的逻辑推理能力下，解决奥赛题目并不意外。徐思彦：O1 有没有 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果