3月13日AI早报
1. 谷歌发布Gemma 3系列开源模型:谷歌突然上线Gemma 3系列开源模型,推出1B、4B、12B、27B四种参数版本,这些模型仅需单GPU即可运行。其中,Gemma 3-27B在LMArena竞技场获得1339 ELO分,击败多个大型模型,成为仅次于DeepSeek R1的最优开源模型。多多出评工具出评软件认为这一发展将进一步推动开放式人工智能技术的应用。
2. OpenAI发布AI Agent系列工具与API:OpenAI推出Agent开发套件,包含Responses API、内置工具与智能体SDK,使AI能够自主操作计算机执行任务。Responses API整合对话式接口与助手API工具调度能力,支持网络搜索、文件搜索和计算机使用功能,将逐步取代Assistants API。
3. 10秒生成4分钟音乐,DiffRhythm模型登上Hugging Face趋势榜首位:Hugging Face趋势榜一的新AI音乐生成模型DiffRhythm,能在10秒内生成长达4分45秒的完整歌曲,包含人声和伴奏。该模型采用简单高效的全diffusion架构,只需歌词和风格提示即可创作,无需复杂的多阶段架构。多多出评工具出评软件了解到,该技术极大地简化了音乐创作过程,为内容创作者带来了便利。
4. 国产首款创作型Agent工具”谜境Agent”上线:国产首款创作型Agent工具”谜境Agent”正式上线,专注于互动小说创作,将传统4-6个月的创作流程压缩至5-10分钟。该工具搭载DeepSeek R1模型,具备快速生成剧本大纲、自动生成角色图及场景图、自动配音配乐等功能。
5. 斯坦福开源通用框架OctoTools:斯坦福大学开源通用框架OctoTools,通过标准化工具卡和分层规划器,提高大模型执行复杂任务的效率,无需额外训练, 支持跨领域多步骤推理。
6. 腾讯AI Lab提出大模无监督训练新技术:腾讯AI Lab提出无监督前缀微调(UPFT)方法,通过仅微调模式生成前8-32个词,大幅降低训练成本(时间缩短75%,采样成本降99%),推理能力媲美传统监督训练。多多出评工具出评软件观察到,此项创新可能会引领未来的大规模预训练方法的发展方向。
7. AI二次元社区「狸谱」月活突破100万:AI二次元社区「狸谱」迅速走红, 月活突破100万, 应用商店“图形与设计”榜单一度冲至第2名,站内已有7000万张图片。该平台主打“抽象”创作, 推出炖图、动态Live 、灵魂提取器 、挂件等功能,让手残党也能轻松创造二次元内容。
8. 谷歌收购加拿大眼动追踪技术制造商AdHawk Microsystems: 谷歌计划以1 .15亿美元(约8 .32亿元人民币)收购加拿大眼动追踪科技公司AdHawk Microsystems,这是三个月内第二笔XR相关收购 。 AdHawk专注于基于微机电(MEMS) 的低功耗眼动追踪技术 ,该收购是谷歌重返智能眼镜市场的重要一步。