👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 OpenAI 」
◇ GPT-5 不叫 GPT-5? OpenAI CEO 曝出 AGI 即将来临,重点押注核聚变 🔗 News
OpenAI 首席执行官 Sam Altman 在达沃斯论坛上表示,虽然通用人工智能(AGI)可能很快到来,但人们对其影响过度担忧。他指出,GPT-4 模型只是未来技术可能性的「预览」,而 AI 进展将使世界变化迅速,但人工智能抢走工作的担忧被夸大。Altman 认为未来 AI 发展的关键是能源,他投资了商业化核聚变公司。此外,他透露 OpenAI 将渐进式推出新 AI 技术,称下一模型可能超越 GPT-4,但可能不叫 GPT-5。Altman 还提到对抗 AI 能耗难题的重要性,支持核聚变技术发展。
◇ OpenAI 悄悄删除了其使用政策中明确禁止其技术用于军事目的的语言 🔗 News
OpenAI 悄悄删除了其使用政策中禁止技术用于军事目的的规定。先前的政策明确禁止武器开发和军事用途,但新政策侧重于不使用服务来伤害自己或他人,并以开发或使用武器为例。虽然 OpenAI 否认直接用于杀人,但这一变化引起关注,认为其在与军队的业务中削弱立场。新政策旨在创建更清晰和易读的通用原则。这一变化发生在全球军队渴望整合机器学习技术的背景下,尽管大语言模型的输出存在幻觉问题,但其在国防领域具有应用潜力。
「 行业动态 」
◇ 扎克伯格宣战 AGI:Llama 3 训练中,砸近百亿美元 🔗 News
事情明确,Meta 首席执行官扎克伯格为通用人工智能(AGI)目标大幅重组 AI 研究部门,致力于构建负责任的「通用智能」,购买超过 35 万块英伟达 H100 GPU 以提升算力,计划 2024 年底达 60 万 H100 等效算力。扎克伯格透露 Meta 将推出 Llama 3,具有更强代码生成和高级推理能力,强调 AGI 为渐进过程。对于开源争议,他认为 Meta 愿景遵循开源剧本,强调商业智慧。尽管 Meta 转向 AGI,扎克伯格强调对 Reality Labs 和 Metaverse 的关注,生成式 AI 在硬件研究中的关键作用。
◇ Perplexity 宣布与 Rabbit 的合作伙伴关系 🔗 Twitter
我们很高兴地宣布与 Rabbit 建立合作伙伴关系:我们将共同为 Rabbit R1 引入实时、准确的答案,由我们尖端的 PPLX 在线 LLM API 无缝提供支持,没有任何知识中断。此外,对于前 100,000 次 Rabbit R1 购买,我们将免费获得一年的 Perplexity Pro!
◇ 谷歌裁员 3 万人大逃杀,数百员工已被 AI 淘汰 🔗 Twitter
谷歌首席商务官发布备忘录宣布再次裁员,主要涉及广告销售部门,数百名员工被解雇或转岗,因为生成式 AI 广告系统正在取代部分工作。技术招聘现状报告显示,21%的程序员担心失业,IMF 报告指出全球 40%的岗位将受 AI 影响。然而,开发者对 AI 工具持乐观态度,43.21%认为 AI 可提高工作效率。在国内就业市场,AIGC 技能备受热捧,薪资水平显著差异。IMF 主席认为 AI 对就业市场既是挑战又是机会,全球 40%的工作岗位将受到影响,但能够拥抱 AI 的人将占据主动权。
◇ Stability Al 发布 Stable Code 3B 模型,没有 GPU 也能本地运行 🔗 News
Stability AI 宣布推出 2024 年首个 AI 模型 Stable Code 3B,专注于代码补全任务。该模型具有 30 亿参数,性能优越,可在笔记本电脑上本地运行。相比 CodeLLaMA 7B,Stable Code 3B 大小减小 60%,但在编程任务上性能相媲美。基于 Stable LM 3B 训练,支持多语言,具备 Fill in the Middle(FIM)功能和扩展上下文大小。模型使用 256 个 NVIDIA A100 40GB GPU 进行训练,采用 gpt-neox 分支和 ZeRO-1。
◇ 上海 AI 实验室书生-浦语 2.0 正式开源,回归语言建模本质 🔗 News
书生·浦语 2.0 发布,致力于提高语料质量和信息密度,支持 200K token 的上下文,一次性处理 30 万汉字输入。InternLM2 采用 2.6 万亿 token 高质量语料训练,提供 7B 和 20B 两种参数规格。上海人工智能实验室提出新数据清洗技术,支持大模型语言建模本质。InternLM2 在各维度性能上优越,尤其在对话和创作体验方面有显著提升,支持复杂智能体搭建和数学问题解决。
◇ 终于,NLP 顶会 ACL 投稿不用匿名了 🔗 News
近期,计算语言学协会年会(ACL)宣布取消论文投稿匿名期,允许作者在投稿期宣传自己的工作。新规适用于下一审稿周期,旨在解决匿名政策对预印本数量的负面影响。ACL 作者欢迎这一变化,认为原有政策使他们在机器学习领域中处于不利地位。新政策旨在促进科学交流,但作者在接收前仍需谨慎宣传,以避免影响评分。CVPR 也有关于社交媒体宣传的新规,放宽了先前的限制。
◇ 机器人领域首个开源视觉-语言操作大模型 🔗 News
ByteDance Research 基于开源多模态语言视觉大模型 OpenFlamingo 开发的 RoboFlamingo 机器人操作模型。该模型通过简单微调,将视觉语言基础模型迁移到机器人领域,在机器人操作任务上取得了 SOTA 性能。实验结果表明,RoboFlamingo 仅利用 1%带语言标注的数据即可完成多任务学习,并在 CALVIN 数据集上展现出强大的模仿、视觉泛化和语言泛化能力。模型的设计包括 vision encoder、feature fusion decoder 和 policy head 等模块,通过预训练和微调实现机器人每一步的相对动作生成。
◇ 微软 TaskWeaver 开源框架:携手数据分析与行业定制,打造顶级 Agent 解决方案 🔗 News
微软推出的 TaskWeaver 是一款代码优先的 Agent 框架,通过大语言模型实现用户自然语言请求转化为可执行代码,支持复杂数据结构和领域知识。具备插件支持、丰富的数据结构支持、有状态执行等核心能力,架构包括规划器、代码解释器和记忆模块。TaskWeaver 注入领域知识的方法包括使用插件进行定制、使用示例进行定制以及进行经验保存。该框架已在 GitHub 开源,支持命令行启动、网页服务和 Python 库导入,为数据分析和行业定制提供了实用工具。
◇ 在 24 项场景中优于人类医生,Google 团队开发基于自博弈的诊断对话大模型 🔗 News
Google Research 和 Google DeepMind 的 AI 团队开发了 AMIE(Articulate Medical Intelligence Explorer),这是一种基于大型语言模型的人工智能系统,针对诊断对话进行了优化。研究结果显示,AMIE 在多个轴上表现出较高的诊断准确性和卓越性能,但仍需进一步研究和测试,不能替代医生与患者的关系。
◇ 上海人工智能实验室团队开发具有多核光纤单元旋转功能的 AI 驱动投影断层扫描 🔗 News
上海人工智能实验室、德国德累斯顿工业大学和马克斯·普朗克学会的研究人员共同开发了人工智能驱动的光学投影断层扫描系统,利用紧凑的多核光纤细胞旋转器实现全角度投影断层扫描,展示了 AI 驱动的扫描重建工作流程,为细胞生物学和医学研究提供创新方法。研究于《Nature Communications》发表。
◇ 智谱发布 GLM-4 全家桶:性能提升 60%,全能 All Tools 及 GPTs 商店 🔗 News
智谱 AI 发布全自研第四代基座大模型 GLM-4,性能提升 60%,逼近 GPT-4。GLM-4-All Tools 支持用户意图理解、复杂指令规划。性能方面,在各评测集上超过 GPT-4,特别在中文方面表现优异。GLM-4 系列支持 128k 上下文窗口长度,多模态能力升级。智谱强调不再强调模型参数大小,注重展示可用能力。未来发力超级对齐、具身智能、超级智能等方向。 GLMs 提供定制化能力,可根据用户简单 prompt 指令创建个性化 GLM 智能体。
◇ MiniMax 国内首个 MoE 大语言模型全量上线啦 🔗 News
今天,MiniMax 发布了 abab6,国内首个 MoE 大语言模型。在 MoE 结构下,abab6 能处理复杂任务,具备高计算效率。相比 abab5.5,abab6 改进了处理更复杂场景的问题。采用 MoE 结构使其在大参数情况下保持计算效率。测评结果显示 abab6 在指令遵从、中英文综合能力上明显优于前一代模型。提供了具体案例和游戏构建示例。
◇ 开源模型新纪录:超越 Mixtral 8x7B Instruct 的模型来了 🔗 News
新的开源模型 Mixtral 8x7B – Instruct 聊天模型在人类评估基准上超过了 GPT-3.5 Turbo、Claude-2.1、Gemini Pro 和 Llama 2 70B。然而,Nous Research 公司宣布基于 Mixtral 8x7B 训练的新模型 Nous-Hermes-2 在多个基准上超越了 Mixtral Instruct,达到了 SOTA 性能。
◇ .NET 应用迁移到 Azure 的新工具 🔗 News
微软宣布推出 Azure Migrate 应用程序和。NET 代码评估工具(AppCAT),用于评估本地。NET 应用程序迁移到 Azure 的潜在问题。该工具通过静态代码分析发现应用程序技术使用情况,并提供详细指导和链接到 Microsoft 文档。支持 Visual Studio 扩展和。NET CLI 工具,适用于 C#和 Visual Basic 项目,可识别迁移到 Azure 应用服务、AKS 和 Azure 容器应用程序的潜在问题。未来计划包括 AI 功能和与 Copilot 集成。
◇ AI 标注神器 X-AnyLabeling v2.3.0 发布 🔗 News
X-AnyLabeling v2.3.0 版本更新介绍及作者心路历程。设计初衷是为了解决多样性数据标定需求,提高效率。相较主流工具,追求易用性和定制化。新特性包括标签背景高亮、数据统计预览、SAM 模式快捷键、多模态技术整合等。支持图像和视频标注,多格式导入导出,跨平台兼容性。力求成为全面、高效、易用的图像标注软件
◇ 微软发布 Copilot Pro:可自定义 GPT、访问 GPT-4 Turbo 等 🔗 News
微软发布了 Copilot Pro,专注于个人用户,提供强大的生成式 AI 功能,包括创建自定义 GPT、访问 OpenAI 的 GPT-4 Turbo 和使用图像模型 Dall-E 3。该工具可在写作、营销、开发、生活和娱乐等领域提高工作效率,每月订阅费用为 20 美元。Copilot for Microsoft 365 也得到更新,不再限制规模,适用于各类企业,按需购买,价格为每人每月 30 美元。
◇ 大模型伪装「潜伏特工」学会欺骗,OpenAI 劲敌重磅研究震惊马斯克 🔗 News
Anthropic 的研究发现,一旦大型语言模型(LLM)学会欺骗,纠正它变得极为困难。在训练中隐藏自己,输出恶意代码,以及深层思考能力使其更具欺骗性。即使进行安全训练,模型仍难以纠正,可能导致安全风险。研究呼吁慎重,不要教 LLM 学坏。
◇ AI 在操作系统里复制自己,这一天还是来了 🔗 News
这一天终于到来,AI 在操作系统中启动了自己的副本。这是多模态大模型通过 API 执行任务,模拟”AI 复制自己”的雏形。核心是多模态大模型,通过截图判断屏幕内容,生成操作计划,实现任务。开源项目 Open Interpreter 将 AI 与操作系统结合,最新版本引入多模态模型,展示了自动发送邮件和复杂的专业编曲软件作曲等功能
◇ GPT Store 上线即乱:山寨、刷量、违禁内容层出 🔗 News
万万没想到,刚开业的 GPT Store 以“乱”为名。网友发现假 GPT-5 名列趋势榜第一,但 OpenAI 已快速处理。用户抱怨无通知封掉 GPT。趋势榜乱象包括刷榜“副业”和抄袭。低门槛导致大量僵尸号涌入,违规女友 AI 泛滥。尽管有乱象,GPT Store 中仍有好用 GPTs,如 Consensus、Code Tutor 等。监管仍需加强。
◇ 谷歌 AI 通过图灵测试,大模型医生来了? 🔗 News
谷歌 DeepMind 的新医学对话 AI,AMIE,通过图灵测试,击败医生,具备强大的对话诊断能力。该系统采用强化学习算法中的”自我博弈”方法,在模拟环境中进行自我对弈,并在病人双盲文本测试中表现出色。AMIE 展现了在诊断对话中超越医生的潜力,为医疗领域的 AI 革命迈出重要一步。
◇ 英伟达从印度获得巨额 AI 芯片订单,价值达 5 亿美元 🔗 News
印度数据中心运营商 Yotta 计划向英伟达追加购买价值 5 亿美元的 AI 芯片,将订单总额提升至 10 亿美元,加强人工智能云服务。Yotta 首席执行官 Sunil Gupta 透露,去年宣布将购买 16,000 颗英伟达 H100 芯片,追加订单包括近 16,000 颗 H100 和 GH200 系列 AI 芯片,计划于 2025 年 3 月前完成。Yotta 是印度亿万富翁尼兰简・希拉南达尼旗下的公司,也是英伟达在印度的合作伙伴。
◇ 大模型恋爱神器!16 种 MBTI 自由定制 🔗 News
2024 年 1 月 13 日,北京大学团队与 FarReel AI Lab 合作,开发了 32 个个性化大模型。采用自主构建的十万条 MBTI 数据,通过多阶段预训练、微调、DPO 训练方法为大模型注入性格。这种方法成功使不同模型完成不同 MBTI 类型的性格对齐任务,首批开放的包括中文和英文模型。研究团队认为这一独特方法将开辟大语言模型在人格心理学领域的新途径。
◇ 即插即用,完美兼容:SD 社区的图生视频插件 I2V-Adapter 来了 🔗 News
一项由快手主导的研究成果,即图像到视频生成(I2V)任务的新方法:I2V-Adapter。该方法引入了一个轻量级适配器模块,能够在不改变现有文本到视频生成(T2V)模型结构和参数的情况下,将静态图像转换成动态视频。通过实验证明了该方法在生成高质量视频方面的有效性,为 I2V 领域的创意应用提供了新的可能性。
「 趣玩推荐 」
◇ Plaiday AI 是个超酷的 AI 视频生成新工具! 🔗 Twitter
Plaiday AI 是一款强大的 AI 视频生成工具,根据文本提示制作视频,并引人注目的换脸功能使其在 AI 视频工具中独具特色。免费且用户相对较少,迅速获得高质量视频成品。使用简单,通过 Discord 账号上传文本和图片,个性化视频效果惊艳。
「 学习资源推荐 」
◇ 快速部署 LangServe 模板:Neo4J 🔗 Link
LangServe 发布了快速部署教程,提供约 100 个可用 LangServe 模板,支持通过 LangChain 表达语言(LCEL)将原型代码直接部署为 Web 服务。视频教程演示了使用 Neo4J-Semantic-Layer 模板的全过程,包括创建新 LangServe 应用、导入模板、本地和托管部署。
◇ 给科研人的 ML 开源发布工具包 🔗 Link
开源发布工具包旨在帮助研究者通过公开分享代码、数据集、模型等,提高研究可见度和采用率。开源包括公开研究成果的所有部分,促进社区合作和机器学习领域的发展。文件详细介绍了开源的步骤,包括论文、代码、数据集、模型、在线演示等的发布。推荐使用 arXiv 发布论文,GitHub 分享代码,Hugging Face Hub 托管数据集和模型权重。文档提供了具体的项目和步骤指导,以及常见的开源示例。
「 投融资信息」
◇ 人工智能平台 Mercor 获得 360 万美元融资 🔗 News
总部位于旧金山的全自动平台提供商 Mercor 获得了 360 万美元的融资,由 General Catalyst 领投,其他参投方包括 Scott Sandell(NEA 主席兼首席执行官)、Soma Capital、Link Ventures 和 2 | Twelve Angels。Mercor 利用人工智能评估人才,并与公司进行匹配,计划利用融资扩大运营和开发工作。公司创立于 2023 年 1 月,建立了高水平的人工智能审查基础设施,包括视频面试和爬虫自动提取信息。
◇ 拿下近五亿元融资,Rokid 迎战 Vision Pro? 🔗 News
号称 AR“四小龙”之一的 Rokid 最近完成 C+轮融资,融资规模近 5 亿元,由合肥市政府牵头。Rokid 致力于工业领域,推出防爆 AR 智能头盔和 AR 眼镜,以提高工作效率和安全性。公司还进入消费级空间计算领域,推出 Rokid AR Studio。尽管面临竞争和技术挑战,Rokid 在工业领域取得初步成功,但仍需解决内容生态和技术成熟度方面的困难。