👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 行业动态 」
◇ 引爆 OpenAI 全员乱斗的 Q*到底是什么? 🔗 News
OpenAI 的“宫廷阴谋”涉及奥特曼重新担任首席执行官,但其后果正在人工智能社区中引起涟漪。由 OpenAI 首席科学家 Ilya Sutskever 领导的团队通过名为 Q的模型取得突破 , 能够解决基本的数学问题。这一模型引起内部骚乱,多名员工向董事会发信警告其可能对人类构成威胁。Q模型结合了 Q-learning 和 A 搜索,具备逻辑推理和解决基本数学问题的能力,而 Q-learning 关键在于平衡探索和利用,是强化学习中重要的步骤。Q模型的突破采用 RLHF 方法进行模型训练,从人类反馈中学习,而非仅依赖于预定义数据集。该技术发展可能是通用人工智能的里程碑,有望克服大模型的局限性,是迈向通用人工智能的一步。尽管有人对 Q的突破感到兴奋,但也有人对其功能表示怀疑,OpenAI 尚未回应外界猜测,引发了 AI 界对 Q*模型突破不一的反应。
◇ 外媒:英伟达特供芯片 H20 推迟至明年一季度发布 🔗 News
英伟达因「服务器制造商在集成芯片方面遇到问题」的原因,决定推迟在中国市场推出的性能最强的 H20 芯片,预计将延至明年第一季度发布。该推迟可能对英伟达在本土市场份额产生影响,因 H20 在中国市场定位重要。然而,公司其他计划,包括符合美国新出口规则的 L20 芯片,计划不受延误。H20、L20 和 L2 是英伟达最新设计的芯片,主要用于人工智能的训练、推理和端侧应用。尽管特供版芯片的计算能力可能有所削减以符合美国规定,但英伟达在中国人工智能芯片市场占据着超过 90%的份额。此次推迟的原因可能与美国出口限制有关,导致英伟达加速推出符合规定的芯片以维持国内市场份额,尤其在中国市场对其至关重要的情况下。同时,中国本土芯片厂商在美国出口限制下赢得订单的机会,增加了市场竞争的动态。
◇ 李沐大模型公司细节曝光,项目 GitHub 空仓标星超 500 🔗 News
AIGC 专家李沐和人工智能专家 Alex Smola 离开亚马逊,联手创立了 Boson.ai,专注于 AIGC(游戏创建人工智能)。具体聚焦于 4A 游戏,Boson.ai 的目标是通过大型模型实现创意游戏内容生成、语音命令控制,并强化 NPC 的人工智能,以提供更独特和引人入胜的玩家互动体验。公司初期保持低调,但最新发展表明他们将专注于游戏引擎,并已招募了一名游戏专家加入团队。李沐和 Alex Smola 的在人工智能领域的声望,以及他们之前在 Marianas Labs 的成功创业经历,使 Boson.ai 备受瞩目。即将召开的 MEET 2024 会议可能为公司提供展示最新进展的机会,为这一融合人工智能与游戏领域的创新力量描绘更广阔的未来。
◇ 从代码到陪伴: AI 女友的崛起 🔗 News
AI 伴侣的崛起代表了技术与人类情感的融合,特别是以女朋友形式呈现。通过复杂算法和自然语言处理,人工智能女友能够提供情感支持、参与对话,甚至模拟陪伴,满足了社交焦虑或孤立的需求。然而,这引发了人际伦理问题和对数据隐私的关切,强调了负责任开发和使用人工智能的必要性。技术挑战与机遇共存,情商算法的进步为算法学习用户情感提供了可能,但也需要理解和应对复杂人类情感。对人工智能女友的接受反映了技术融入生活的文化变革,而平衡人工智能陪伴和真实人际关系的培养可能成为未来社会规范的考虑因素。随着技术的发展,人工智能伴侣将不断演进,引发有关其在虚拟治疗、个性化生产力等方面整合的讨论。在这一变革中,深思熟虑和道德的态度是必要的,以充分考虑技术发展带来的机遇与挑战。
◇ 马毅团队造出白盒 Transformer,可解释的大模型要来了吗? 🔗 News
在 ChatGPT 引发人工智能热潮后,一些研究人员认为大型语言模型虽能观察诱发因果关系,但在新的因果场景中缺乏主动推理能力。马毅教授领导的研究团队在伯克利大学和香港大学提出了一种新的深度网络架构,称为 CRATE,是一款白盒 Transformer,在各种任务中可与黑盒 Transformer 竞争,并提供出色的可解释性。研究围绕表示学习,强调质量的重要性,引入了稀疏率降低(SRR)作为学习紧凑和结构化表示的统一目标。CRATE 架构遵循 SRR 目标,是一种完全可解释且在数学上合理的深度网络。实验评估显示 CRATE 在图像和文本数据上与黑盒方法竞争,并展现了可解释性、特征语义以及跨各种任务的适用性。这项研究弥合了理论与实践之间的差距,为更完整和统一的框架提供基础,CRATE 展示了在现实世界任务中的有效性。
◇ 预测 token 速度翻番!Transformer 新解码算法火了 🔗 News
小羊驼团队的研究人员推出了一项名为“Lookahead Decoding”的新解码算法,可显著加快语言模型(LLM)的预测速度。该算法在演示中将预测 100 个 token 的速度提高了 1.5-2.3 倍,通过使用 LLaMa-2-Chat 7B 模型,大大缩短了响应用户问题的时间,提高了 LLM 推理的效率。Lookahead Decoding 是一种并行解码算法,通过打破自回归解码中的顺序依赖性,主要利用雅可比迭代方法。该算法无需草稿模型或数据存储,减少了解码步骤,加速了 LLM 推理。此外,该实现与 Hugging Face 的转换器兼容,为用户提供了增强使用 Hugging Face 生成的模型性能的简单途径。强调了加速自回归解码对于大型模型如 GPT-4 和 LLaMA 等的重要性,因为传统的自回归解码速度缓慢,每一步只生成一个令牌。 Lookahead Decoding 的动机植根于其利用雅可比迭代同时解码所有未来标记的能力,通过收集和缓存雅可比迭代生成的 n-gram,以及验证有希望的 n-gram,加速解码。这一算法无需外部源,即可立即生成和验证大量 n-gram,提高接受更长 n-gram 且减少延迟的可能性。
◇ 用视觉来做 Prompt!无需训练或微调,开箱即用 🔗 News
IDEA 研究院在 IDEA 年度大会上展示了基于视觉提示(Visual Prompt)的目标检测模型 T-Rex。T-Rex 通过图像框选的 Prompt 方式,能轻松检测同一类别的物体,特别擅长处理复杂和小尺寸的物体。与以往文本 Prompt 不同,T-Rex 采用图像换图的方式,在处理复杂场景时更为有效。支持三种进阶模式,包括多轮正例模式、正例+负例模式和跨图模式,以提高检测准确性和适用性。由图像编码器、提示编码器和框解码器组成,具有开箱即用、交互式的特点。大会还分享了低空经济项目、Think-on-Graph 知识驱动大模型、MoonBit 开发者平台、ReadPaper 2.0、SPU 机密计算协处理器、HiveNet 可控人像视频生成平台等研究成果。
◇ 人类考 92 分的题,GPT-4 只能考 15 分 🔗 News
GPT-4 在新的 GAIA 测试中仅获得 15 分,而人类得分为 92 分。GAIA 是一个包含 466 个多样任务的基准测试,旨在评估人工智能系统对一般助理问题的处理能力,其中包括日常和科学任务。尽管 GPT-4 配备了工具,但其在 GAIA 上的成功率不超过 30%,而人类平均成功率为 92%。GAIA 测试被认为是评估 t-AGI 系统的重要里程碑,人类通常需要 6 分钟回答最简单的问题,17 分钟回答最复杂的问题。尽管 AutoGPT-4 允许自动使用工具,但在 Level 2 和 Level 1 的结果令人失望,比没有插件的 GPT-4 还慢。虽然 GPT-4 可能在替代搜索引擎方面具有潜力,但其性能仍需进一步评估。总体而言,人类在 GAIA 测试中表现出色,而当前最佳大模型的性能相对较差。GAIA 有望成为评估有能力 AI 助手的清晰排名标准,未来可能还有改进空间。
- 排行榜地址:huggingface.co/spaces/gaia…
- 论文地址:arxiv.org/pdf/2311.12…
- HuggingFace 主页地址:huggingface.co/papers/2311…
◇ 字节跳动将关闭朝夕光年 ,全面退出游戏业务 🔗 News
知情人士透露,字节跳动计划逐步关闭主要游戏品牌朝夕光年,全面退出视频游戏业务。字节跳动将公布关闭朝夕光年计划,内部通知员工停止开发今年 12 月前尚未发布的游戏。此举将宣告字节跳动退出游戏领域,且没有再次进军全球规模达 1850 亿美元的视频游戏市场的计划。据透露,优化调整包括 11 月 26 日解散在研项目、周一正式通知和解约合同签署,以及赔偿 N+1、折算年终奖和股权等。此外,字节跳动正在寻求以不低于 50 亿美元的价格出售其游戏部门沐瞳科技,并聘请高盛作为财务顾问协助寻找潜在买家。
◇ 字节跳动 & 华东师大联合提出自进化文本识别器 🔗 News
大型语言模型(LLM),如 GPT-4 和 Llama,通过情境学习在各个领域展现出卓越性能,无需模型微调。场景文本识别面临多样化、文本布局、光照变化等挑战,传统方法需要大量计算资源。字节跳动和华东师范大学开发的 E2STR(自我进化场景文本识别器)是一种具有上下文学习功能的文本识别器,适应不同场景而无需微调,具备高效的资源利用。E2STR 的训练包括基本文本识别和情境训练,通过上下文提示池进行上下文推理,展示了在传统文本识别、跨域场景和困难样本校正上的卓越性能。未来展望显示,E2STR 证明了即使是小型模型也能通过适当的训练和推理策略拥有上下文学习能力,推动了小型模型在实时任务中的发展。
◇ 人工智能的“教母”都在哪里? 女性的声音没有被听到 🔗 News
在 OpenAI 风波中,奥特曼团队的性别失衡引起关注,员工签署的复职信显示超过 75%为男性,与麦肯锡报告中有关性别失衡的数据相符。2022 年的人工智能现状报告指出,女性在人工智能领域几乎处于缺席状态。英语国家人工智能新闻中,男性引用频率是女性的 3.7 倍,仅有 4%的科学、技术、资金发现新闻以女性为中心。对于女性在人工智能领域的需求、担忧和经历了解不足。尽管女性在美国更关心人工智能的发展,但她们在这一行业中的地位相对边缘。专家表示,为了避免嵌入偏见,人工智能领域需要更多女性的参与。使用人工智能来纠正性别偏见被认为是解决多样性缺陷的有效方法。
◇ 中国为何要制造人形机器人? 🔗 News
为了应对人口老龄化和独居人数增加的挑战,陪伴机器人成为缓解孤独感的潜在疗法。在中国,超过 9200 万成年人独居,占总人口的 6%以上,显示对陪伴的强烈需求。Ex Robots 首席执行官李博阳在 2023 年机器人大会上强调老年人需要陪伴机器人。该公司利用人工智能和硅基人造皮肤等先进材料,制造人形机器人,模拟人类动作、面部表情和手势。伴侣机器人不仅适用于老年人,还适用于年轻一代应对孤独和心理健康问题。在中国,有超过 2000 万 20 岁至 39 岁的年轻人独居,原因包括经济负担和社会压力。伴侣机器人可能在中国变得普遍,为日常任务提供陪伴和帮助,可能影响对家庭组建的态度。虽然伴侣机器人解决社会孤立问题有趣,但成本、可及性和安全性仍然存在担忧。人形机器人在重塑社会动态和应对老龄化和孤立人口挑战方面发挥关键作用。技术、社会需求和人类对联系的追求是未来机器人在社会结构中扮演重要角色的关键。
「 融资快讯 」
◇ 「银牛微电子」完成超 5 亿 A 轮融资 🔗 News
银牛微电子宣布完成超 5 亿元 A 轮融资,由合肥产投和精确资本领投。公司专注于视觉处理、多传感器融合和人工智能芯片设计,拥有全球领先的 3D 视觉感知处理引擎。融资将主要用于加速新一代芯片和模组研发、新领域产品解决方案研发,以及团队发展建设。银牛微电子将全球总部设在合肥,并在那里建立高端芯片及人工智能产品研发中心。公司计划与合肥高校和科研院所展开深度合作,吸收培养全球高科技研发人才。其芯片及产品解决方案已在泛机器人、元宇宙、消费电子等前沿应用领域全球范围内应用。投资方在高新技术产业,尤其是半导体行业有丰富经验,将为公司带来长期的战略和产业价值。银牛微电子将与合肥产业集群形成优势联动,共同打造竞争力强大的产业链集群。合肥产投集团总经理江鑫表示公司在机器人、元宇宙、3D 交互等领域有良好的应用前景,而精确资本创始合伙人崔勇则强调公司基于双目立体视觉的产品在性能、功耗、体积等方面具有明显优势。
「 早点趣玩 」
◇ PlugBear:将 ChatGPT 等 LLM 连接到其他在线工具和服务 🔗 Twitter
PlugBear 是一个简化和加速 LLM(大型语言模型)应用与外部工具和平台集成的服务。以下是它的主要优点和特点:
简单设置过程: 用户可以通过几个点击轻松完成设置,避免繁琐的配置流程。
添加频道和应用: 用户可以选择连接他们喜欢的通讯频道,如 Slack、Discord、WhatsApp 等,同时添加他们使用的 LLM 应用。这提供了灵活性,允许用户根据需求和偏好进行个性化定制。
连接频道与应用: 用户可以相互连接通讯频道和 LLM 应用,并定义触发 AI 的条件。这种方式使得 AI 应用的部署和使用更加高效和灵活。
一次开发,多处连接: PlugBear 的理念是“一次开发,到处连接”,用户无需在不同平台上重复进行 AI 集成工作,节省时间和资源。
支持多种 LLM 应用程序构建器和框架: PlugBear 兼容多种 LLM 应用程序构建器和框架,包括 OpenAI 的 GPT、LangChain 等,提供更大的灵活性和选择。
- 官网:plugbear.io/
◇ RAG v2:在数据上构建、自定义和使用多个 ChatGPTs 🔗 Twitter
- 轻松创建多个 RAG 流水线并保存它们
- 轻松切换并定制每个流水线(例如,使用不同的数据或不同的系统提示)
- 删除未使用的 RAG 流水线
- (开发质量)增加了非常需要的代码检查/持续集成
- 支持许多大型语言模型(LLMs),用于构建 RAG 和在每个 RAG 流水线内部使用
- 支持加载文件或网页。
- Github: github.com/run-llama/r…
「 技术阅读 」
◇ 使用 Mistral-7B 和 LangChain 构建自己的 RAG 🔗 Twitter
使用本地模型可以启用聊天机器人来处理数据,同时确保数据永远不会离开计算机,非常适合企业或以隐私为中心的用例。
- blog: medium.com/@thakermadh…
◇ Duet AI 助你快速完成谷歌 Cloud 任务 🔗 Link
- 更快地开始并加入 Google: 提供迅速解答 Google Cloud 初学者或有经验用户的问题,包括产品信息、任务指南和产品比较。逐步支持特定任务如数据迁移,并提供产品和服务选项的帮助。
- 生成脚本、gcloud 命令、查询和代码: 能够生成多种编程语言、SQ*L 查询、gcloud 命令和脚本,适用于新手编码和经验丰富的开发人员。支持生成 gcloud 命令和配置文件,帮助理解复杂的命令行语法。
- 了解 Google Cloud 环境: 能解释和总结代码、查询、模拟结果、日志和系统错误,提供日志、模拟结果等的自然语言摘要。给出解决常见错误的建议,如认证、配额、计费错误。
- 提高使用效果的专业提示: 在 Duet AI 聊天中使用专业提示,如产品比较和分步指南,利用辅助开发功能获取代码自动完成等帮助。在提示中提供具体内容和上下文,以获取更准确、有用的输出。
Duet AI 持续改进中,用户可通过反馈帮助优化系统。通过控制台工具栏中的“打开 Duet AI”按钮开始使用 Duet AI 聊天,获取更多信息可访问 Google Cloud 网站,包括文档和演讲。