👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
🤖 YC 2023年夏季营入选160+创业团队,其中6成是AI方向
YC 2023年夏令营有160+创业团队入选,遵从了其一贯的价值主张:大量的AI、大量的B2B,以及大量的旧金山创业公司。Demo Day 将在9月初进行,目前可以分析出以下特点,感兴趣可以持续关注对这波创业团队更详细的解读。
有15家公司仍处于隐身模式
大约50%的创业公司在团队构成上仍保留了远程工作元素 (完全远程或混合办公)
加密货币消失了,在这一轮创业公司中,只有少数区块链/加密公司会在Demo Day亮相。
AI热潮是真实的,YC S23的公司中有60%是从事AI和机器学习的,而在过去一轮 (YC W23) 中这一比例只有大约32% ⋙ LinkedIn @Drake Dukes
🤖 在 Dify 轻松调用开源&国产大模型,还能薅400万token额度
Dify 是一个无代码的 LLM Ops 平台,让任何人都可以轻松创建和运营基于 GPT 等大型语言模型的AI应用。上周末 Dify 平台更新到了 V0.3.13 版本,模型供应商上新增了一大批国内外知名的开源模型:
凡托管在 Hugging Face 及 Replicate 上的模型,在 Dify 上只需要输入 Hugging Face 、 Replicate 的 API token 和模型名称就可以轻松接入调用 (如Llama2、ChatGLM、百川Baichuan、通义千问-7B 等)
与国内数家模型厂商达成了友好的上下游合作,讯飞星火、MiniMax、文心一言、通义千问都已在本批次接入
Dify 为用户争取到了讯飞星火和 MiniMax 体验额度,可以通过设置 –> 模型供应商 –> 讯飞星火或 MiniMax 图标处点击【免费获取】:
讯飞星火:免费领取 300 万 token,需要从 Dify 的入口进入,完成讯飞星火开放平台的注册,返回 Dify 静候 5 分钟即可在 Dify 页面体现可用额度(仅限未注册过讯飞星火的手机号)
MiniMax:免费领取 100 万 token,只需点击【免费领取】即可到账额度,无需手动注册流程 ⋙ 了解更多
🤖 中国大模型语料数据联盟,开源发布「书生·万卷」多模态语料
8月14日,上海人工智能实验室 (上海AI实验室) 宣布,联合语料数据联盟成员单位,共同开源发布「书生·万卷」1.0多模态预训练语料。
书生·万卷1.0为书生·万卷多模态语料库的首个开源版本,包含文本数据集、图文数据集、视频数据集三部分,数据总量超过2TB。 目前,书生·万卷1.0已被应用于书生·多模态、书生·浦语的训练。通过对高质量语料的“消化”,书生系列模型在语义理解、知识问答、视觉理解、视觉问答等各类生成式任务表现出的优异性能 ⋙ 了解详情
🤖 OpenAI发布重磅升级:使用GPT-4进行内容审核,更快、判断更一致
互联网内容平台海量的内容审核工作,虽然有机器的参与,但是仍然需要大量人工的参与。内容审核需要细致的努力、敏感度、对上下文的深刻理解,以及对新用例的快速适应,这使得它既耗时又具有挑战性,因此成为科技领域最困难的问题之一。
8月15日,OpenAI 在官方博客宣布开发了一种新技术,可以使用 GPT-4 理解并生成自然语言,并根据提供的政策指导方针做出适度的判断,在几个小时内完成大量人工审核员需要花费数月才能完成的工作。也因此,将有数以万计的人类审核员将可能因此被取代 ⋙ OpenAI Blog | 了解更多
🤖 极客公园:2023 H1「中国最具价值 AGI 创新机构 TOP 50」
极客公园首次发布了 2023 H1「中国大模型创新生态全景图」,并评选出了 2023 H1「中国最具价值 AGI 创新机构 TOP 50」,从基础设施、模型工具链、大模型、开发工具链、应用范式等多个维度,筛选出 2023 年上半年在技术、商业和行业影响方面表现颇具亮点的创新机构。对照下方名单看一看,你的关注清单更新了没~
阿里云
360集团
科大讯飞
华为云
智源研究院
百度
MiniMax
百川智能
腾讯云
Zilliz
智子引擎
智谱Al
西湖心辰
HiDreamai
即时设计
面壁智能
超参数科技
百图生科
出门问问
衔远科技
聆心智能
墨芯人工智能
澜舟科技
深言科技
光轮智能
IDEA研究院
光年之外
潞晨科技
深势科技
必优科技
太极图形
ZMO.AI
生数科技
TIAMAT
光线云
灵动音科技
心识宇宙
蔚领时代
分子之心
行者AI
上海人工智能实验室
Jina AI
第四范式
竹间智能
商汤科技
影眸科技
月之暗面
沐曦
云从科技
零一万物
🤖 妙鸭开源版,阿里达摩院推出「酷蛙FaceChain」并附原理揭秘
FaceChain 是一个深度学习工具链,使用3~10张头肩照片,就可以创建自己的数字写真,可以理解为开源版本的「妙鸭」。
FaceChain 由阿里达摩院开放视觉团队推出,并上线了魔搭ModelScope社区,具体操作流程可以 ⋙ 读这篇教程
此外,文章还对训练的核心技术要点进行了揭秘 (如上图所示)!
基本原理
影响个人写真生成效果的主要因素有两项:写真风格信息,以及用户人物信息,分别使用线下训练的风格LoRA模型、线上训练的人脸LoRA模型学习上述信息
个人写真模型的能力分为两个阶段:训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸LoRA模型;推断阶段基于人脸LoRA模型和风格LoRA模型生成个人写真图像
训练阶段
首先,分别使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法处理用户上传图像,得到包含正向人脸的图像
接下来,使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像
随后,使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签
最后,使用上述图像和标签数据微调Stable Diffusion模型得到人脸LoRA模型。
推断阶段
首先,将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中
接下来,使用Stable Diffusion模型的文生图功能,基于预设的输入提示词初步生成个人写真图像
随后,使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中挑选
最后,使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果 ⋙ 参与这个项目的社区建设
🤖 揭秘 Minimax、Zilliz、PingCAP 背后的投资逻辑 | 对谈云启合伙人陈昱
这是 @42章经 在小宇宙播客的第2期,邀请到了云启资本陈昱,与这位软科技赛道最好的投资人之一聊聊明星项目 Minimax、Zilliz、PingCAP等背后的故事:他是如何找到这些项目、又是如何判断的,以及他是怎么衡量一个创始人的好坏等。
以下是播客时间轴,前40分钟的正式内容挺有意思,最后的画外音也很有意思,评论区更有意思!!
- 00:55 AI 在过去十年里的三波浪潮
- 04:35 「软科技不只是云启的赛道,它简直是陈昱的被窝」
- 05:48 揭秘 PingCAP 投资历程
- 10:41 陈昱最看重创始人的哪些方面?
- 12:37 揭秘 Zilliz 投资历程
- 20:29 揭秘 Minimax 投资历程
- 26:07 陈昱最看好的 AI 项目方向是?
- 27:55 为什么陈昱能成为 ABC 领域最好的投资人?
- 30:54 怎么能在 21 年就注意到大模型的机会?
- 31:51 作为一个一直领先市场的投资人,陈昱当下在看的新方向是?
- 35:10 日本市场的巨大机会
- 41:26 投出 6 个独角兽的成功公式 ⋙ 小宇宙 @42章经
🤖 清华刘知远团队 · 大语言模型公开课,带你从入门到实战
ShowMeAI知识星球资源编码:R177
这是清华大学自然语言实验室在2022年推出的《大模型交叉研讨课》,由刘知远团队和两位助教共同授课,共9节,完整课程视频已经上传B站。
课程分为以下三个部分,手把手带领同学从深度学习开始,快速了解大模型的相关理论和实践,最后利用所学知识进行前沿问题的探索:
重点讲解动手操作相关的工具,学生应在课下充分利用课余时间进行实践。
介绍大模型的高效微调和训练压缩技术,帮助学生适应任务需求和解决算力问题。
通过三节课介绍大模型在生物医学、法律智能和脑科学领域的应用情况
课程的课件是英文,不过授课和视频字幕都是中文!可以放心食用~ 课程包含以下章节:
大模型基础知识
NLP 和大模型基础 (GPU server, Linux, Bash, Conda, …)
神经网络基础 (PyTorch)
Transformer 和 PLMs (Huggingface Transformers)
大模型的关键技术
提示调整和三角调整 (OpenPrompt, OpenDelta)
高效训练和模型压缩 (OpenBMB 套件)
基于大模型的文本理解和生成
大模型的跨学科应用
大模型 X 生物医学科学
大模型 X 法律智能
大模型 X 脑与认知科学 ⋙ B站学习链接
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!