共计 1363 个字符,预计需要花费 4 分钟才能阅读完成。

现代 AI 模型的一大突破在于其对人类语音的深入理解,这推动了更精准的听写工具的发展。Willow,一款 Mac 工具,现正推出 iOS 应用,让用户能够在所有应用中使用语音进行打字。
与 Wispr Flow 类似,Willow 的键盘能够将语音转录并根据上下文格式化消息。该应用支持超过 100 种语言,并允许用户自定义词汇术语或在不同应用类别(如工作、消息、电子邮件等)中创建不同的写作风格。
Willow 应用的一个显著优势是它提供了一个完整的键盘用于打字,而 Wispr Flow 仅提供数字键盘。这使得用户能够快速修改某些单词或句子,而无需重新打字。此外,当用户想要打字而非说话时,无需切换到另一个键盘。

Willow 由 Allan Guo 和 Lawrence Liu 创立,他们曾就读于斯坦福大学,后辍学创业。两人在 2024 年夏天与另一组联合创始人(现已离开公司)一起进入了 Y Combinator,最初的想法是开发医疗保健软件,特别是管理辅助生活设施的软件。然而,这个想法未能持续,公司在一年内尝试了不同的项目。
“在开发医疗保健解决方案时,我们注意到医生有语音 AI 助手,可以记录与患者的对话并创建后续文档。我与许多医生进行了交谈;他们说这些笔记工具对他们非常有用。这促使我们为知识工作者和其他用户开发一款语音 AI 工具,”Guo 在一次电话采访中告诉 TechCrunch。
Guo 补充说,他选择不开发另一款 AI 笔记工具,因为他觉得市场已经饱和。相反,听写领域更具吸引力,因为很多沟通发生在会议之外。他表示,公司使用了一系列模型,并专注于调整其基于 Meta 的 Llama 模型的文本到文本管道,以实现格式化和个性化。

这家初创公司随后将其 YC 批次移至 2025 年春季以推出产品。公司表示,自推出以来,用户数量每月增长 50%。它还有像 Uber、Heidi Health 和 Zego 这样的企业客户,他们使用该工具进行听写,并具有自定义团队词汇等功能。
Willow 已经从 Box Group、Y Combinator、Burst Capital 和天使投资者(如 HubSpot 的 Dharmesh Shah;Gusto 的 Tomer London;Reddit 联合创始人 Alexis Ohanian;前 Yelp COO Kipp Bodnar;Opendoor CEO Kaz Nejatian;餐厅软件公司 Owner 的联合创始人兼 CEO Adam Guild;以及 Instacart 联合创始人 Max Mullen)那里筹集了 450 万美元。
Mullen 表示,他相信未来最令人惊叹的用户界面将是语音主导的。
“当我通过 Willow 写作时,我需要进行的编辑比使用电脑内置的听写系统时要少。”
Mullen 指出,他最喜欢的工作流程之一是在桌面上,你也可以使用“Hey Willow”助手来指示应用以你自己的声音撰写电子邮件回复等内容。
这家初创公司与 Wispr Flow(迄今为止已筹集了超过 5600 万美元的资金)、Monologue(属于 Every 的订阅捆绑包 )以及 YC 支持的初创公司 Aqua、Talktastic、Superwhisper 和 Betterdictation 等竞争对手展开竞争。
Guo 表示,在接下来的几个月里,公司计划在 Windows 和 Android 平台上进行扩展,并进一步个性化,以减少用户在听写后需要进行的手动编辑次数。