声音模型
Mirelo
Mirelo Video2SFX 1.0
Mirelo Video2SFX 1.0 是总部位于柏林的 Mirelo 的基础视频到音效模型,能够从视频输入生成同步音频,无需文本提示,专为 AI 生成内容而构建。擅长生成纯粹的音效而不会产生不需要的音乐或语音伪影,特别是在竞争对手表现不佳的合成素材上。支持 10 秒视频并实时生成 2–4 个多样化输出变体。通过轻量化的专用架构,所需计算量比典型大语言模型少 50 倍。
官方网站: https://www.mirelo.ai
Mirelo Video2SFX 1.5
Mirelo Video2SFX 1.5 是 Mirelo 于 2025 年发布的增强型视频到音效模型,提供更高的音频保真度、更广的场景覆盖以及更快的处理速度。保持零提示操作,仅通过对视频的分析生成具上下文感知的声景。通过对合成 AI 内容更出色的处理,在盲听测试中获得 70–80% 的偏好率。具备增强的帧级同步、多个变体生成和优化的推理性能。支持从自然环境到复杂动作序列的多种场景。该公司为获得 4400 万美元融资的初创企业,受到 Index Ventures 和 Andreessen Horowitz 的支持。
官方网站: https://www.mirelo.ai
最后更新于