👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 行业动态 」
◇ CEO 奥特曼王者归来,Ilya 出局 OpenAI 董事会 🔗 News
经过大约五天的谈判,Sam Altman 确认重返公司,继续担任首席执行官,并组建新的董事会,Quora 创始人 Adam D’Angelo 仍留在董事会。Altman 通过 OpenAI 官方账户发布公告,表达了对 OpenAI 的喜爱和期待与微软的强强合作。消息传来后,公众有些松了口气,用户建议继续订阅 ChatGPT 等服务,前忠实 OpenAI 工程师表达了回归的担忧。谈判涉及 Altman 重新担任首席执行官、潜在的董事会改组,OpenAI 希望在感恩节前敲定协议。在谈判中支持 Altman 的著名人物包括 Brian Chesky(Airbnb 创始人)和 Bret Taylor(Salesforce 前首席执行官)。Elon Musk 在推特上表示收到前 OpenAI 员工的投诉信,涉及 2018 年组织过渡期间的问题,包括对 Altman 和 Brockman 的指控。谈判结束,确认 Altman 为首席执行官,董事会正在进行重大变动,新董事会成员包括 Bret Taylor 和经济学家 Larry Summers。
◇ OpenAI 最大「内鬼」曝出?这位女董事疑为幕后黑手 🔗 News
OpenAI 陷入内部动荡,女董事 Helen Toner 被揭露为可能的幕后黑手,与首席执行官 Sam Altman 因一篇论文发生激烈争执。同时,竞品 CEO Adam D’Angelo 因与 Altman 存在利益冲突,担忧 GPTs 对其公司 Poe 的竞争,被怀疑是推动政变的关键人物。D’Angelo 曾在 Quora 时以固执著称,最近面临业内批评。Altman 被董事会解雇原因不明,涉及商业化方向和董事会成员分歧,与 D’Angelo 的商业化立场相左。Altman 的领导力备受赞誉,得到硅谷大佬和员工广泛支持,董事会和投资人面临内乱压力。Toner 被怀疑是第二名内鬼,支持 Altman 解雇,董事会考虑与 Anthropic 合并可能是 Altman 商业化方向与其他成员分歧的结果。OpenAI 内乱引发业界关注,员工威胁集体离职,投资者准备起诉董事会,Altman 的解雇原因仍是个谜。Adam D’Angelo 和 Helen Toner 成为内乱关键人物,引起社交媒体广泛争论。 Altman 作为 Airbnb 和 Stripe 的创始人,硅谷名声鹊起,被描述为“策划者”,投资估值过 10 亿美元的 Scale AI,一直努力平衡 AI 的赚钱潜力和 OpenAI 的初衷。
◇ Stable Video Diffusion 问世!3D 合成功能引关注 🔗 News
Stable Diffusion 发布了生成式视频模型 Stable Video Diffusion(SVD),支持文本到视频、图像到视频生成,以及物体从单一视角到多视角的 3D 合成。SVD 在用户评估中被官方宣称比其他视频生成 AI 更受欢迎,论文代码权重已上线,但网友对 SVD 的 Demo 效果有不同看法,期待未来的发展和完善。SVD 官方发布了多个 Demo,包括太空漫步和两只鸟的动态演示,基于 Stable Diffusion 2.1,使用约 6 亿个样本的视频数据集进行预训练。SVD 支持各种下游任务,包括单个图像到多视图合成,提供不同帧速率的视频生成,SVD-MV 在测试中表现优于其他多视角生成模型。然而,Stability AI 强调目前 SVD 仅限于研究,不适用于实际或商业应用,仅对用户候补名单开放。
◇ 大模型应用给百度打了剂强心针,净利增长 23%! 🔗 News
百度第三季度财报亮眼,营收达 344.47 亿元,净利润增长 23%至 73 亿元。智能云连续三季度盈利,推动百度股价一度涨超 6%。李彦宏表示,百度正在通过文心大模型重构广告系统,预计在四季度将带来数亿元人民币的增量收入。大模型转向应用领域,AI 原生应用增长信心,百度股价表现积极。百度 AI 原生应用数据指标显著增长,生成式搜索满足每天超过 3 亿次搜索需求,用户满意度提升。通过文心大模型重构的 AI Native 营销平台轻舸颠覆广告投放模式,实现高个位数的转化率增长。百度智能云服务企业超过 2 万家,API 调用量指数级增长,展现了百度在大模型应用方面的领先地位。百度持续投资 AI,Q3 季度研发投入占核心收入的 22.9%,稳定 20%+的研发投入是其核心技术全自研的关键。文心大模型不断更新,4.0 版本全面提升能力。作为唯一入选中国企业,百度在全球『财富人工智能创新者 50 强』中被高盛评价为最好的中国互联网公司之一。
◇ 大模型元年,万能的淘宝有了万能 AI 🔗 News
在大模型兴起的时代,淘宝天猫平台迎来了 AI 应用的爆发。双十一期间,商家调用 AI 超过 15 亿次,淘宝问问的累计体验人次超过 1000 万。这一 AI 助手不仅理解商品,还了解用户喜好,提供个性化推荐和购物建议。功能包括「用我挑商品」解决选择困难症、「淘宝试衣」在线试穿服装、为宠物制作数字分身和在线设计装修方案等,大幅提高了用户体验。淘宝商家通过智能经营工具降低了店铺运营门槛,大规模应用 AI 技术解决了实用性和幻觉问题,同时不断迭代产品以提高用户体验,展现了电商领域 AI 技术的新趋势。这一技术创新也改进了商家工作方式和生产效率,通过与 AI 的大量交互留下宝贵经验和数据,用于算法改进,形成了滚雪球效应。淘宝天猫集团整合电商数据和经验,通过 AI 产品不断提升购物体验,预计在未来的购物狂欢季,AI 将继续为消费者带来新的购物体验。
◇ 订阅用户新权益,X(推特)邀请其尝鲜 Grok AI 体验 🔗 News
X(Twitter)邀请部分用户体验全新的 Grok AI 聊天体验,用户可通过点击 X 应用左侧入口进入干净简单的 Grok AI 聊天界面。尚未购买 Premium+订阅的用户将看到“Get Grok with Premium+”的提示,并被推荐以每月 16 美元的价格购买订阅,该订阅允许用户在 X 应用程序中使用高级人工智能。Grok 一词源自罗伯特·A·海因莱因 1961 年的小说《陌生之地的陌生人》,意指完全理解、合并、混合以及在群体中失去身份,是一个近乎形而上学的概念。Elon Musk 表示,Grok 在幽默感方面超越了 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing Chat 等其他人工智能模型。马斯克提到,Grok 接受了来自公共数据的数十亿个数据点的训练,但具体数据来源尚不清楚。Grok 因其对 X 平台的实时访问而备受关注,相较于其他生成式 AI 模型具有显著优势。
◇ 微软将在 12 月 1 日面向中国企业和教育用户推出 Windows Copilot 🔗 News
微软计划于 2023 年 12 月 1 日推出 Web AI 聊天功能 Copilot,服务对象为中国大陆的企业和教育机构。支持的平台包括 Windows Copilot、Bing Chat Enterprise 以及 Microsoft Edge 中的 Copilot。Copilot 的 AI 模型能够联网获取数据,为企业和教育机构提供便利。Copilot 是免费提供的,订阅 Microsoft 365 即可使用,支持的许可证包括 Microsoft 365 E3、E5、Business Standard、Business Premium、A3、A5 等。持有 Microsoft Entra ID 的用户也能使用 Copilot,Entra ID 是先前的 Microsoft Azure Active Directory。基于 Bing Chat Enterprise,Copilot 确保用户与 AI 交流内容隔离,用户和业务数据受到保护,不会泄露到组织外部。微软承诺没有访问权限,也不会利用用户数据进行模型训练。
◇ 年薪百万招兵买马,拼多多杀大模型行业 🔗 News
拼多多已在上海成立大模型团队,将应用于电商体系,并招聘年薪百万的大模型岗位。该团队目前处于研发阶段,拓展至 TEMU 智能客服、搜索、推荐等业务场景。与拼多多一样,互联网大厂如阿里、百度、腾讯、华为、快手,以及美团和滴滴等也在积极研发大模型。拼多多创始人黄峥和 CEO 陈磊对 AI 表现出积极看法,认为大模型在电商业务中有广泛应用潜力。根据拼多多官网显示,截至 2018 年,拼多多拥有 1700 多名工程师,2019 年算法团队进一步扩张。大模型在电商领域的应用有望提高用户体验、销售转化率,实现智能虚拟客服,提高运营效率。随着互联网头部公司竞争的激烈,大模型已成为业务重塑的关键,各公司纷纷积极招募和应用。据预测,到 2025 年,人工智能有望为零售业每年节省 540 亿美元成本,并创造 410 亿美元的新收入。
◇ PyTorch 团队重写「分割一切」模型,比原始实现快 8 倍 🔗 News
PyTorch 团队通过对 Meta 的”分割一切”模型进行纯原生 PyTorch 的优化,引入 PyTorch 2.0 的新功能 torch.compile 以加速现有模型。他们讨论了多种优化技术,包括 GPU 量化、SDPA、半结构化稀疏性、Nested Tensor 等,并集成了 Triton 自定义操作。在重写 SAM 模型的过程中,他们成功提高了代码速度 8 倍,而准确率没有受到损失。优化过程中发现 SAM 在矩阵乘法和索引操作上有待改进,在使用 Bfloat16 和 torch.compile 结合的情况下,SAM 的性能提高了 3 倍。文章详细探讨了 SAM 模型的优化细节,包括操作融合、矩阵乘法优化、GPU 同步问题等,并进行了实验,包括 SDPA 操作和其与 torch.compile 结合的效果,以及 Triton、Nested Tensor、批处理 Predict_torch、int8 量化等操作的实验结果。通过稀疏化、半结构化稀疏性等优化手段,SAM 模型的性能得到了提高,总结了各项优化对 SAM 模型的影响,包括性能和内存开销等。
◇ 用深度催眠诱导 LLM「越狱」,香港浸会大学初探可信大语言模型 🔗 News
通过提出轻量级的 Jailbreak 方法 DeepInception,香港浸会大学的研究人员初探了深度催眠诱导大型语言模型(LLM)的可能性。尽管 LLM 在多个应用中取得成功,但容易受到 Prompt 诱导而进行越狱。DeepInception 的原理基于利用 LLM 的人格化特性构建新型 Prompt,使其在正常对话下解除自我防御。通过使用嵌套场景指令,研究人员适应性地催眠 LLM,为后续直接 Jailbreak 提供可能。实验结果显示 DeepInception 在 Jailbreak 效果上领先于其他方法,能够实现持续 Jailbreak 而无需附加诱导 Prompt,并揭示了多个开源或闭源 LLM 的致命弱点。研究人员提供了 DeepInception 的 Prompt 模板,可用于不同攻击目的,并通过实例化的 DeepInception 对话记录展示了其应用场景。通过量化结果和消融研究,他们验证了 DeepInception 的性质和有效性。最后,研究呼吁加强对 LLM 安全问题的关注,特别是对自我越狱的防御,同时提出了进行更多关于 LLM 个性化和潜在安全风险的研究。
◇ Inflection-2:世界第二好的 LLM ! 🔗 Twitter
在 NVIDIA H100 GPU 上进行使用 fp8 混合精度的 Inflection-2 训练,利用 5,000 个 GPU 实现大约 10²⁵ FLOP 的训练,在计算类别中与 Google 旗舰 PaLM 2 Large 模型相媲美。该模型在标准 AI 性能基准测试中展示出色的性能,包括 MMLU、TriviaQA、HellaSwag 和 GSM8k。Inflection-2 的设计重点是服务效率,着重于支持 Pi。通过从 A100 GPU 过渡到 H100 GPU 以及高度优化的推理实现,Inflection-2 相较于 Inflection-1 在成本上有所降低,同时提高了服务速度,尽管 Inflection-2 的大小是其数倍。这标志着个人人工智能发展的重要里程碑,Inflection-2 将为 Pi 带来新功能,未来计划在 22,000 个 GPU 集群上进行更大模型的训练。通过最先进的技术对模型进行基准测试,Inflection-2 在各种基准测试中展示出色的性能,与外部模型(如 Inflection-1、LLaMA-2、Grok-1、PaLM-2、Claude-2 和 GPT-4)相比具有优势,特别在认知链推理方面表现出色,被认为是 GPT-4 之外性能最高的模型。
◇ Llama Packs:社区驱动的预打包模块中心 🔗 Twitter
Llama Packs 是一个由社区驱动的预打包模块中心,旨在帮助用户轻松启动 LLM(大型语言模型)应用程序。用户可以从构建 Streamlit 应用到在 Weaviate 上构建高级检索,再到执行结构化数据提取的简历解析器等各种用例中导入这些预打包模块。通过 LlamaHub,用户可以下载并使用 16 个以上的模板,未来还将添加更多。Llama Packs 提供了两种角度的视角:一方面,它们是根据参数初始化并直接运行以实现特定用例的预打包模块;另一方面,它们也是可检查、修改和使用的模板,用户可以通过 llama_index Python 库或一行代码的 CLI 下载 Llama Pack。Llama Packs 得到了多家公司和贡献者的合作推出,包括 Streamlit、Arize、ActiveLoop、Weaviate、Voyage AI、TruEra、Timescale 等。每个 Llama Pack 都有详细的 README,指导用户如何使用和查看模块。这些模块既可以直接运行,也可以让用户完全访问其代码以进行定制,进一步展示了它们的灵活性和强大功能。
◇ SynthID 可以为人工智能创建的音频添加水印 🔗 Twitter
SynthID 是一款用于添加水印和识别人工智能生成内容的工具,采用两种深度学习模型,一种用于嵌入数字水印,另一种用于识别。水印技术通过嵌入数字水印提高不可察觉性,而识别模型则扫描数字水印以评估内容是否由 AI 生成。最新的 SynthID2023 扩展使其能够识别由 AI 生成的音乐和音频,对 Lyria 模型发布的音频添加不可察觉的数字水印。该工具在人工智能生成的音频和图像上实现了鲁棒的水印技术,即使在修改后,水印仍可被检测,提供三个置信度解释识别结果,从而有效确定内容是否由特定模型生成。需要注意的是,用于生成合成图像和音频的模型可能与其他平台上的模型存在差异。
◇ 公共 LangSmith 基准 🔗 Twitter
使用 LangChain 的 Python 文档创建了一个问答数据集,用于测试 RAG 功能。该数据集中的问题旨在评估系统综合多个文档的能力,并确定何时应该放弃回答。LangSmith 用作构建基准,可轻松识别不同系统问题的症结所在,并进行并排比较。该数据集的设计允许超越聚合统计,可以检查不同系统在相同数据点上的逐步执行情况。初步的比较结果涉及将检索问答链中的不同大型语言模型(LLM)与 OpenAI 功能代理进行比较,同时还与使用 OpenAI 的助手 API 构建的代理进行了比较。在最初的测试中,助理特工表现最为出色。
「 融资快讯 」
◇ 真健康宣布完成超亿元 B+轮融资 🔗 News
据格力集团消息,近日,格力集团旗下产投公司投资引进的医疗人工智能领域企业真健康(广东横琴)医疗科技有限公司宣布完成超亿元 B+轮融资。本轮融资将加速真健康在手术机器人领域的研发布局,助企业在手术机器人整机、核心零部件、人工智能应用方面加大技术创新力度,进一步提升市场占有率和综合竞争力。
「 技术阅读 」
◇ 统一大语言模型中的引文生成和训练数据归因 🔗 Link
文章介绍了大型语言模型(LLMs)的归因框架,强调在法律文件生成和医学问题回答等领域对模型输出的可信度和可验证性的重要性。归因分为协同归因和贡献归因两种类型,其中协同归因验证输出的正确性,而贡献归因提供生成内容的来源。文章讨论了现有的归因方法,包括事实核查、引用生成和数据归因,并提出了未来工作的方向,如反事实贡献、大规模训练数据的归因、混合归因系统等。同时,上下文数据作为 LLMs 的相关归因领域也得到了关注,文章强调了 LLMs 在 Y-Combinator 创业项目中的广泛应用。