👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 OpenAI 」
◇ GPT Store 正式上线:超 300 万个应用可玩! 🔗 News
OpenAI 正式推出 GPT Store,汇聚超过 300 万个自定义版本的 ChatGPT。界面类似苹果应用商店,包括特色、社区热门、ChatGPT 团队创建的 GPTs 等类目。今年第一季度将推出 GPT 创建者收入计划,美国应用创建者可根据用户互动获得报酬。GPT Store 仅对 ChatGPT Plus、团队和企业用户开放,用户可轻松挑选并开始对话。同时,OpenAI 发布 ChatGPT Team,提供安全协作环境,支持团队使用高级模型和数据分析工具,收费标准为 25 美元/月。
◇ 微软高管 Dee Templeton,加入 OpenAI 董事会 🔗 News
微软高管 Dee Templeton 以无投票权观察员身份加入 OpenAI 董事会,监督董事会行为,避免再次发生“罢免闹剧”。Dee 在微软工作超过 25 年,曾担任多个高级职位,具备全面的技术、产品和咨询服务经验。此举是自 2019 年微软向 OpenAI 投资 10 亿美元以来的首次指派人员。
◇ OpenAI 开撕纽约时报:故意引导 ChatGPT 得出抄袭结论 🔗 News
OpenAI 公开反击纽约时报提出的史上最受关注侵权诉讼,指责其故意误导 ChatGPT,并主张合理使用版权数据训练 AI。OpenAI 强调与新闻机构合作,提供退出机制,并称“反流”为罕见错误。纽约时报被指故意操纵提示词,OpenAI 认为诉讼无根据,仍愿合作。舆论倾向支持纽约时报,关注合理使用与版权补偿。
「 行业动态 」
◇ 上海 AI 实验室等开源,音频、音乐统一开发工具包 Amphion 🔗 News
上海 AI 实验室、香港中文大学数据科学院、深圳大数据研究院联合开源了名为 Amphion 的音频、音乐和语音生成工具包,解决了生成模型难题,提供文本到语音、歌声转换、文本到音频生成等任务的框架、模型和开发说明。提供丰富的神经语音编解码器算法选项,包括 WaveNet 和 HiFi-GAN。性能评估模块帮助开发者评估生成语音质量。未来将持续更新,致力成为最好用的开源语音工具包之一。
◇ 全球首个汽车行业全栈自研全场景 AI 大模型 ! 🔗 News
吉利汽车发布全球首个汽车行业全栈自研 AI 大模型——吉利星睿 AI 大模型。基于星睿智算中心,将自研基础大模型与领先的 NPDS 研发体系深度融合,成为汽车行业最强大、应用场景最丰富的大模型。该模型拥有超千亿参数,丰富的知识库,实现多模态感知和生成,引领中国汽车全场景 AI 时代。
◇ Brockman:个性化服务仍在试验阶段,希望在未来几周内更广泛地推广 🔗 Twitter
格雷格·布罗克曼,以其与 OpenAI 的合作而闻名,已经透露了个性化 ChatGPT 体验的开发,暗示用户可以根据自己的需求定制 AI。这个概念有可能彻底改变我们与 AI 的互动方式,使其更具适应性和个性化。这一发展的重要性在于它有可能增强用户与 AI 的互动,使其成为日常任务和决策的更重要组成部分。
◇ Mistral Medium 在 elo 排行榜超越 Claude,仅次于 GPT-4 🔗 Twitter
Bindu Reddy 的推文宣布了开源 AI 模型 Mistral Medium 在 elo 排行榜上的排名,它现在位于 GPT-4 之下。这一进展非常重要,因为它展示了开源 AI 与 OpenAI 的 GPT-4 等专有巨头竞争的潜力。Reddy 强调在生产中同时使用 GPT-4 和 Mistral,并计划很快推出 Mistral Medium。推文还传达了一个强烈的信息,倡导开源 AI,并不鼓励使用闭源、性能不佳的替代方案,这可能会阻碍开源 AI 的发展。
◇ 荣耀发布自研 70 亿参数端侧平台级 AI 大模型 “魔法大模型” 🔗 News
荣耀发布了 MagicOS 8.0,首发搭载 70 亿参数平台级 AI 大模型“魔法大模型”于 Magic 6 手机。与百度智能云战略合作,开放给开发者并启动荣耀百模生态计划。MagicOS 8.0 引入“任意门”功能,通过理解用户真实意图实现多任务的快速切换,提供全新人机交互体验。
◇ 英特尔推出车载 AI 芯片,挑战英伟达和高通 🔗 News
英特尔宣布推出汽车版人工智能芯片,与高通和英伟达竞争。同时,他们将收购法国初创公司 Silicon Mobility,该公司专注于电动汽车电机和车载充电系统的片上系统技术和软件。中国汽车制造商极氪将是首个使用英特尔人工智能芯片系统的汽车制造商,旨在提升驾驶体验。英特尔强调他们将提供灵活的芯片选择,覆盖从低价车到高档车的全线产品。
◇ Rabbit 分享 R1 新设备:200 刀非订阅制,语音控制智能 Agent 🔗 Twitter
Rabbit Inc. 在 CES 2024 展会上推出了 r1,这款产品在人工智能硬件和软件领域引起了轰动。r1 将行动视为大型语言模型(LLMs)的主要概念,这一点尤为引人注目,表明了朝着更直观和自然的语言界面进行网页交互的转变。这一创新有可能简化用户与网页的交互,通过”API-化”网站并允许编排代理来管理任务。这一发展不仅在其核心功能上令人印象深刻,而且通过模型增强的持续改进也很有潜力。
◇ Meta 发布 Audiobox:新的基础音频生成研究模型 🔗 Twitter
Meta 发布了一款名为 Audiobox 的先进研究模型,用于音频生成。这一创新工具的独特之处在于它能够通过将语音输入与自然语言文本提示相结合来创建音频。Audiobox 在音频合成领域迈出了重要的一步,它将类似人类的语音生成与基于文本的灵活性相结合。通过访问提供的演示链接,用户可以亲身体验这个模型的能力。
◇ 2024 CES :全面押注 AI ,这些巨头都是玩真的 🔗 News
2024 年 CES 在美国拉斯维加斯举行,吸引超过 1200 家初创公司和 4000 家参展商,以 AI 为主题,英特尔发布 i9-14900KS 旗舰处理器,英伟达推出 RTX 4080 SUPER 显卡,AMD 发布锐龙 8040 系列笔记本处理器。汽车领域,奔驰推出人工智能虚拟助手,大众整合 ChatGPT 技术,宝马采用亚马逊 Alexa 生成式人工智能技术。AI 在 PC 和智能汽车领域蓬勃发展,CES 展示了各类创新产品,预示全球 AI 技术竞争白热化。
◇ 产业 AI 浪潮席卷 CES 2024,英伟达股价创历史新高! 🔗 News
NVIDIA 在 CES 上发布新款 GPU,强调生成式 AI 在游戏和内容创作中的作用。股价涨至历史新高,市值达 1.29 万亿美元。推出 GeForce RTX 40 SUPER 系列 GPU,支持 4K 光线追踪游戏。此外,NVIDIA 与中国理想汽车等公司合作提供自动驾驶硬件。报道称,NVIDIA 计划在 2024 年 Q2 生产专为中国市场设计的 AI 芯片 H20。国内科技公司对 H20 芯片持谨慎态度,转向国产替代产品。阿里巴巴和腾讯等公司开始将半导体订单转移到国内公司。
◇ 百川智能发布 大模型 Baichuan-NPC 只需简单文字描述就能构建游戏角色 🔗 News
百川智能发布角色大模型 Baichuan-NPC,并推出了“角色创建平台+搜索增强知识库”的定制化方案。通过这一方案,游戏厂商不用编写任何代码,只需通过简单的文字描述,便可以快速构建角色,实现角色定制。
◇ 对标 GPTs 但没有创建门槛,应用层的 AI Agent 玩家终于来了 🔗 News
钉钉 AI 助理在 7.5 版本中推出,以类似 GPTs 的智能产品形式,为用户提供个性化、专属助理,通过自然语言对话窗口执行 30 多项功能。企业可连接自身业务数据,解决特定场景需求,并通过 AI PaaS 进行高级自定义。AI 助理在环境感知、记忆增强、推理规划和行动执行方面增强,强调 AI + 原生设计,与用户以更人性化方式交互,打开通向各种应用的超级入口。计划推出 AI 助理市场,促进 AI Agent 领域的创新,更适合普通用户,提供多样化能力,加速 AI 在生活和工作场景中的普及。
◇ 奋战一年,LangChain 首个稳定版本终于发布 🔗 News
LangChain 发布了首个稳定版本 LangChain v0.1.0,为构建基于大模型的 AI 应用提供模块和工具。更新包含 700 多个集成、可观察性、可组合性、流式处理、输出解析、检索、LangGraph 等特点。LangChain 着力提高调试可观察性,引入 LangSmith,支持企业版本,优化流式处理,输出解析器简化 OpenAI 函数调用,提供高级检索系统。
◇ 三星打响“ AI 手机”第一枪,2024 会是 AI 终端元年吗? 🔗 News
三星将于 2024 年 1 月 18 日推出 Galaxy S24 系列,注重 AI 手机功能,包括视频处理、本地 AI 聊天机器人、影像处理、通话实时翻译等。此次发布或成为全球首款多模型 AI 手机,显示三星在终端 AI 竞争中的雄心。随着苹果、谷歌等科技巨头加强 AI 投入,2024 年被预测为 AI 终端元年,标志智能手机将经历重大升级。
◇ 超级 40 倍 RTX GPU 来了! 🔗 Twitter
NVIDIA 宣布推出 GeForce RTX 40 SUPER 系列 GPU,包括 GeForce RTX 4080 SUPER、GeForce RTX 4070 Ti SUPER 和 GeForce RTX 4070 SUPER。基于 NVIDIA Ada Lovelace 架构,这些 GPU 提供高达 52 个着色器 TFLOPS、121 个光线追踪 TFLOPS 和 836 个 AI TOPS 的性能,强化游戏和 AI 驱动的 PC。。新系列 GPU 在 AI 计算方面有突破性进展,支持 500 多款 RTX 游戏,满足游戏爱好者和创意专业人士需求。
◇ 一张图 500 元是目前 AIGC 最高“回报”? 🔗 News
最近的法院案例中,A 使用人工智能生成的图片被 B 盗用,法院认定 B 侵犯 A 的知识产权,判决支付 500 元赔偿。此案引发了对人工智能著作权和商业回报的讨论。小冰 CEO 李笛在智能大会中指出,目前人工智能在商业中未能带来高价值回报,提出未来商业模式需更聚焦于端到端工作,避免陷入 API 调用的大模型商业模式不适用的困境。他强调未来可能需要采用 Revenue Share 模式,让人工智能从创造的终端产品中直接获得回报。
◇ 首个多模态实体集扩展数据集 MESED 和多模态模型 MultiExpan 🔗 News
MESED(Multi-modal Entity Set Expansion Dataset)是一个大规模的多模态实体集扩展(MESE)数据集,包含来自维基百科的 14489 个实体和 434675 个图像-句子对。为解决传统单模态实体扩展(ESE)方法的局限性,论文提出了多模态基线模型 MultiExpan,并通过大量实验证明其有效性。 MESED 是首个用于 ESE 的多模态数据集,具有精细的人工标定和三层结构。
◇ 文生视频“黑马”Morph Studio 来袭:好用、1080P 、7 秒时长还免费 🔗 News
Morph Studio 近期更新了其 text-to-video 生成技术,提供 1080P 画质和 7 秒生成时长的免费服务,着重在文本理解和细节处理上取得行业领先。与其他产品相比,Morph Studio 在动物、建筑、人物和自然风景生成任务中表现更为稳定和准确,展示了高分辨率输出的视觉优势。模型采用扩散模型技术,其发展代表着文生视频技术的突破,被认为是 AI 行业竞赛的下一个阶段。
「 趣玩推荐 」
◇ 每 5 秒刷新一次的实时画廊! 一切只需 9 行代码 🔗 Twitter
用 Gradio 构建一个快速的 Web 应用程序,展示图像数据集作为实时画廊,每 5 秒刷新一次!只需 9 行代码即可完成。感谢在@huggingface 上开源数据集!PixelParti128 v0.1 现已在 huggingface.co/datasets/nerij 上发布,基于 Pixel Art XL 和 SDXL Turbo 的合成数据集,包含约 4,800 个完美的 128×128 像素样本。查看这个快速应用程序的代码,并在 Twitter 上关注获取有关轻松展示 AI 模型、数据集和框架的更多提示。
◇ 在本地计算机上运行文本转语音/语音克隆 🔗 Twitter
发布了 MyShell 的 OpenVoice Huggingface Gradio UI 的一键安装程序,让你可以在本地运行。它可以轻松生成更长的音频片段!支持的平台:Mac、Windows、Linux。体验演示:app.myshell.ai/bot/z6Bvua/170。克隆声音,精准控制情感、口音、韵律、停顿和语调,只需一键操作。感谢采纳建议,期待尽情尝试!
「 学习资源推荐 」
◇ 吴恩达推新课《使用 LangChain.js 构建 LLM 应用程序》 🔗 Twitter
- 了解使用 LangChain 的 JavaScript 库编排和链接不同模块的基础知识
- 了解加载和准备数据的基础知识,以提供有效定制 LLM 生成的上下文
- 学习以对话检索链的有用方式检索数据并向 LLM 呈现数据的技术
◇ 如何部署你的 LLM 应用程序 101 🔗 Twitter
学习如何使用 Terraform 和 GitHub Actions 将 LLM 应用部署为 AWS Fargate 上的完整服务。这篇详细指南覆盖了添加 Terraform 文件、使用 Actions 工作流程配置集群、通过 Docker 容器化 LLM 应用、在 GitHub 仓库中设置和传播机密、以及将部署集成到 CI/CD 管道。对于任何希望将其 LLM 或 RAG 应用投入生产的 AI 工程师来说,这是一篇必读文章,将在长期内为您节省大量时间。
「 智能硬件:智能硬件、机器人、智能穿戴设备…」
◇ Figure-01 学会制作咖啡:端到端人工智能 🔗 Twitter
Figure-01 学会了制作咖啡,通过观察人类制作咖啡的过程。这是端到端的人工智能,神经网络从视频中学到技能。他们招聘人才来共同培训他们的机器人团队。这一突破意味着通过获取人类数据,如制作咖啡、叠洗衣服、仓库工作等,可以在 Figure-01 上端到端地训练人工智能系统,为各种用例提供规模化的路径。
「 投融资信息」
◇ AI 搜索引擎再吸金 5.28 亿,英伟达贝佐斯入股,网友:干翻谷歌 🔗 News
Perplexity AI 是一家创新的 AI 搜索引擎初创公司,总部位于旧金山。该公司最近获得总额 7360 万美元的大笔融资,创下了搜索初创公司的融资纪录。其全球首个 AI 加持的对话式应答引擎在短短一年半内吸引了 1000 万月活用户,成功挤入全球最火爆 AI 工具 Top50。Perplexity AI 的独特之处在于其由大型语言模型驱动的搜索引擎,无传统 SEO 垃圾信息,可自动生成答案并提供完整来源和引用。此外,公司通过无传统营销,仅依靠口碑和社交媒体,取得了显著成就。
◇ AIGC 智能设计平台「Nolibox」获数千万元 A 轮融资 🔗 News
AIGC 智能设计平台「Nolibox 计算美学」完成数千万元 A 轮融资,由尖晶资本和 GRIP Capital 跟投。成立于 2020 年的 Nolibox 是一家智能设计引擎服务商,以 AIGC 一站式图像解决方案为企业提供服务。融资将用于技术研发、市场开拓,加深与电商、营销等领域的合作。 Nolibox 已推出多项基于 AI 的图片生成产品,包括无限画板、AI 海报设计生成等,针对电商和营销领域提供 AIGC 服务,已获得世界 500 强付费客户支持。未来计划着重推进商业化,加强与标杆企业的合作,提供更高价值的解决方案。