这2个开源项目,为何让程序员疯狂?
01
Meta 重磅开源:抠出视频中的主体
Meta 公司推出的 Segment Anything Model 2 模型开源!
相比于之前 Meta 之前发布的 SAM,SAM2 可以看做是从图像到视频领域的推广。
SAM2 能够实时分割静态图像和动态视频内容中的任何对象,即使模型之前未曾见过这些对象。为未来的各种应用场景,如混合现实、自动驾驶车辆、视频编辑等提供了强大的技术支持。
SAM 2的架构采用了创新的流式内存设计,使得它非常适合实时应用,并且能够在图像分割准确率和视频分割性能上超越现有技术。可以看下面这些演示:
使用 SAM2 能够将视频中的物体抠出来,并且跟踪这个物体应用创意效果。
应用各种创意的场景,比如跟踪球球,分割显微镜视频中移动的细胞:
支持选择任何视频帧中的对象
及时视频中的小孩暂时被树遮挡,也能成功的扣除主体:
即使视频中有很多相似的马,SAM2 也能一直跟踪选中的那匹,并且抠出来:
及时自行车在高速移动,也能把细节抠的明明白白:
Meta还发布了一个大型带标注的数据集 SA-V,为 SAM 2 提供了丰富的训练数据。
总的来说,SAM 2 的发布是 Meta 在 AI 领域的一个重要里程碑,它将为计算机视觉任务带来革命性的变化,并推动相关技术的发展和应用。
02
文生图开源新霸主!
FLUX 一个由 Black Forest Labs 精心打造的开源项目,Black Forest Labs 由 Stable Difusion 原班人马和多位 Stability Al 前研究员成立,致力于研发多模态模型并开源。
FLUX.1 项目包含三个版本:Pro 版、开发者版本、极速版。
开源地址:https://github.com/black-forest-labs/flux
FLUX.1 一经推出,便获得了3200 万美元种子轮融资。正如其名,FLUX 代表着流动性和变革,它通过先进的文本到图像和图像到图像的转换技术,为艺术家和创作者提供了无限的想象空间。
这款新模型声称超越 Midjourney V、DALLE3 等闭源模型,还大幅领先于开源的 SD3 系列。而且提高了生成人手和手指的准确性。