发完最后一篇论文Stable Diffusion核心团队全要离职了_公司新闻

当前位置：首页 > 新闻中心 > 公司新闻

发完最后一篇论文Stable Diffusion核心团队全要离职了

作者：乐鱼网官方网发布时间：2024-04-02 06:14:14

内部核心员工出走频繁，外部投资者不断丧失信心，成立于 2019 年的 AI 初创公司 Stability AI 还能推出伟大的产品吗？

昨日，据 Sifted、福布斯等多家外国媒体报道，Stability AI 即将失去又一名主要技术负责人。

从与 Stability AI 保持密切关系的两处消息源得知，Robin Rombach 即将辞去自己的科研负责人职位。

2013 至 2020 年，Robin Rombach 在海德堡大学学习物理学。2020 后，他开始攻读海德堡大学计算机视觉小组的计算机科学博士学位，导师为 Björn Ommer，并在 2021 年随研究小组转到慕尼黑大学。他的研究中心在于生成式深度学习模型尤其是文本到图像系统。

在给到 Sifted 的回应中，Stability AI 发言人表示，「我们感谢 Robin 对公司做出的贡献，祝愿他未来工作一切顺利。同时公司仍将专注于自身世界领先技术的商业化推广。」

「这听起来很像互联网泡沫破裂前的两年 —— 疯狂的估值和没有盈利模式。与此同时，那些价值极高的公司购买了 Sun Microsystems 服务器，就像没有明天一样。当比赛结束时，许多估值疯狂的公司的价值都归零，留下了大量的 Sun 硬件。此后不久，Sun 就开始了长时间的暴跌。」

还有人猜测：「如此多的人离开以及主要投资者从董事会辞职绝对是值得玩味的。我想知道是否有一些未公开的丑闻会爆发，因为这非常疯狂。」

Stability AI 的成功在很大程度上可以直接追溯到 Stable Diffusion 研究，该研究最初是慕尼黑大学和海德堡大学的一个学术项目。

最初的研究论文发表 7 个月后，CEO Emad Mostaque 向学术界提供了公司的部分计算资源，用于进一步开发文本到图像模型，Stability AI 此公司因此参与其中。

从那时起，他们的研究使 Stability AI 一直走在图像生成技术发展的前沿。

不过，这种合作模式似乎为后来的争端埋下了雷，Björn Ommer 认为 Stability AI 在 2022 年 8 月推出 Stable Diffusion 时，在讲述自身对该模型的贡献上误导了公众（Stability AI 宣称他们与其他一些生成式 AI 组织「共同创建」了产品，但实际上，Stability AI 只是提供了计算支持）。

无论如何，对这家曾经炙手可热的 AI 初创公司来说，Robin Rombach 等人的离职是沉重的打击。一边是现金储备的减少，一边是筹集更多资金的徒劳，该公司的高管已经大批出走。

其实，在 Rombach 被曝出离职之前，Stability AI 的技术团队已经经历了 12 个月的动荡，更换了 CTO，并先后失去一名产品副总裁、一名工程副总裁、一名研发副总裁、一名研究主管和两名大语言模型主管。

此前就有报道称，Stability AI 创始人兼 CEO Emad Mostaque 惯于夸大事实，令投资的人对该公司业绩真实性存疑。

比如，投资机构 Coatue 曾要求过 Mostaque 辞去 CEO 一职，并推动公司出售。不过，一位 Stability AI 发言人告诉彭博社：「我们 CEO 的领导和管理对 Stability AI 的成功起到了至关重要的作用，公司并不打算出售。」

此外，福布斯此前报道称，Stability AI 一直在努力支付工资和工资税，Mostaque 及其妻子与公司财务之间的界限模糊不清。云计算提供商 AWS 曾一度威胁要因未支付账单而取消访问权，但 StabilityAI 否认了因逾期付款而限制访问这件事。

在财务上，Stability AI 还面临着一项重大支出，那就是为自己辩护，应对 Getty Images 以及美国和英国艺术家们提起的版权侵权诉讼。

在数据来源上，Stability AI 似乎也在碰壁。本月早一点的时候，竞争对手公司 Midjourney 封禁了 Stability AI 的所有员工账户，指责其恶意爬取数据，导致服务器瘫痪 24 小时。Midjourney 表示将禁止 Stability AI 的所有员工以及任何使用「激进自动化」来抓取提示信息的人使用该服务。Mostaque 在推特上的回复是，该起事件并非蓄意而为，而且是一名员工的个人项目。

我们都知道，扩散模型是图像和视频合成技术进步的主要推动力，但其推理速度较慢。一些蒸馏方法，如最近推出的对抗扩散蒸馏法（ADD），旨在将模型从多步推理转变为单步推理。

一般来说，与大型语言模型和扩散模型相比，目前的对抗模型并不严格遵守缩放法则，稳定的训练方法常常要大量的超参数调整。事实上，之前对 GAN 的缩放尝试导致生成器缩放时收益递减。更令人惊讶的是，较小的判别特征网络往往比较大的网络具有更加好的性能。这些非直观的特性是 GAN 的一个重大缺陷：遵循缩放法则的模型可提供可预测的性能改进，以此来实现更具战略性和成本效益的缩放，最终实现更好的模型开发。

Stability AI 这项工作提出了潜在对抗扩散蒸馏法（LADD），可以对预训练的扩散 Transformer 模型进行稳定、可扩展的对抗蒸馏，最高可达百万像素级别。团队没有利用 DINOv2 等自监督特征网络的判别特征，而是利用预训练扩散模型的生成特征。这种方法在直接实现多视角训练的同时，还提供了一种控制判别特征的自然方法：通过在训练过程中对噪声水平进行有明确的目的性的采样，可以将判别特征偏向于更全局（高噪声水平）或局部（低噪声水平）的行为。此外，在潜在空间中进行提炼可以充分的利用大型的学生和教师网络，避免昂贵的像素空间解码步骤，以此来实现高分辨率图像合成。因此，与 ADD 相比，LADD 的训练设置要简单得多，同时性能也优于之前所有的单步方法。

团队将 LADD 应用于当前最先进的文本到图像模型 Stable Diffusion 3，得到了 SD3-Turbo，这是一种多视角百万像素生成器，只需四个采样步骤就能达到其教师的图像质量。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

二胆岛被大陆无人机吓跑？“金防部”称因逆光未发现该无人机，岛内网友质疑

韩国3月出口连续六个月增长，芯片出口飙升35.7%创两年新高！对中国增长0.4%，对美国增长11.6%

中国生育率居全球倒数第二，抚养孩子到18岁的成本，相当于人均GDP的6.9倍

苹果将iPhone 6 Plus定义为过时产品 iPad Mini 4已成古董

上一篇: 转让二手闪蒸干燥机廉价处理

下一篇: 酒类常识—洋酒的国内开展

乐鱼娱乐全站官网

乐鱼电竞官网首页ESPORT