共计 2250 个字符,预计需要花费 6 分钟才能阅读完成。
在众多被风险投资家追逐的年轻 AI 初创企业中,GPTZero 在其成立的第一年半内已实现盈利,创造了数百万美元的收入。由 24 岁的 Edward Tian 和 26 岁的 Alex Cui 共同创立,两人自高中时代便是好友。GPTZero 提供了一款检测工具,帮助识别内容是否由 AI 生成。
创始人已向 TechCrunch 独家透露,他们选择了由 Footwork 联合创始人 Nikhil Basu Trivedi 领导的 1000 万美元“先发制人”的 A 轮融资。对于 Basu Trivedi 来说,这是一次重大胜利。自 Tian 于 2022 年 12 月推出首个网络应用版本以来,GPTZero 几乎一直受到顶级风险投资公司的关注,3 万名用户立即涌入,导致其托管在 Streamlit 上的网站崩溃。公司于 2023 年 1 月正式成立。
自 2024 年初以来,随着客户基础的增长,两位年轻创始人每周接到四到五个来自风险投资家的电话。GPTZero 的年度经常性收入在过去六个月内增长了五倍,用户基数从 100 万增长到 400 万。这使其成为今年增长最快的消费者应用之一。
公司已连续数月实现盈利,他们表示,银行中的资金超过了公司成立以来的总融资额。具体来说,超过了 1300 万美元,其中包括 350 万美元的种子轮和新的 1000 万美元融资。
增长仍在继续。自 1 月以来,用户和收入“翻了一番以上,甚至可能翻了三倍”,Basu Trivedi 表示。尽管他们未透露估值,但根据典型的 20% 的 A 轮融资,这笔交易使公司的估值约为 5000 万美元。其他投资者包括专注于教育的 Reach Capital;Jack Altman 的 Alt Capital;Uncork Capital;以及 Neo。
Basu Trivedi,普林斯顿校友,通过长期策略赢得了这笔交易的主导权。他在 GPTZero 疯狂之前,于 2022 年在一个年度活动中与 Tian 相遇,该活动是一小群普林斯顿学生访问硅谷公司。Tian 在常春藤盟校学习计算机科学、自然语言处理和新闻学时开发了 GPTZero。在 BBC 实习期间,以及后来在《纽约时报》工作时,他编写了帮助记者识别 AI 生成内容的代码。
在最初的网络应用获得疯狂反响后,Tian 联系了他的朋友 Cui 寻求帮助。Cui 拥有多伦多大学机器学习硕士学位,并从博士项目中退出成为联合创始人。两人将应用重写为目前的独立平台,并在用户达到约 150 万后的前五个月内筹集了 350 万美元的种子资金。这主要来自天使投资人,如前路透社首席执行官 Tom Glocer;卡内基梅隆大学教授 Russ Salakhutdinov,曾任苹果 AI 研究总监;以及 CNN 首席执行官、前《纽约时报》首席执行官 Mark Thompson。
Basu Trivedi 看到了 GPTZero 如何获得媒体关注和令人印象深刻的天使投资人——并听到了 VC 圈中的传闻。作为 Canva、ClassDojo 和 Frame.io 等公司的种子投资者,他知道何时发现了一家热门公司。他在 2023 年 1 月给 Tian 发短信进行检查。他利用自己的网络和产品知识,以及其基金联合创始人 Mike Smith 的背景,吸引了创始人。
拥有产品和运营经验的投资人正是这两位 20 多岁的创始人所“渴望的,尤其是当我们学习如何建立一家大公司时,”Tian 说。为了证明这一点,在关闭这一轮融资后不久,Footwork 组织了一次与 AI 领导者的网络活动,包括 Jack Altman,他也是 Basu Trivedi 的大学同学,以及英伟达创始人 CEO Jensen Huang。
GPTZero 并非唯一致力于识别 AI 生成内容的公司。其他包括 AI Writing Check、Copyleaks、GPT Radar、CatchGPT 和 Originality.ai。但许多 AI 检测行业的准确性极低,研究人员发现。以至于 OpenAI 在 AI 行业的偏执压力下,于 2023 年初推出了自己的 AI 检测工具,但在七个月后因广泛批评其效果不佳而关闭了该工具。
有趣的是,当 TechCrunch 的 Kyle Wiggers 用自己的工具进行实验时,除了 GPTZero 之外的所有工具都失败了。自然,GPTZero 有自己的基准,特别是通过与宾夕法尼亚州立大学研究人员的合作,帮助其证明其技术在行业普遍声誉不佳的情况下仍然有效。
Cui 表示,GPTZero 更准确,因为它可以访问更多数据,并使用最先进的开源工具构建了自己的 LLM 模型,这些工具不会透露。“我们拥有大数据优势。我们有数百万个文本示例,区分人类与 AI,”Cui 说。“我们还结合了最佳模型和深度学习。我们实际上使用语言模型来检测语言模型。”
虽然该初创公司可能以帮助教师检测 AI 生成的学生作业而闻名,但其客户基础已经扩大。现在包括政府采购机构、赠款撰写组织、招聘经理,尤其是 AI 培训数据标签商。事实证明,使用 AI 生成的数据进行 AI 培训“导致模型崩溃”,Tian 说,因为使用虚构的例子来训练模型并不是让其适应现实世界的最佳方式。
自然,年轻创始人有一个更宏伟的长期愿景。他们希望创建一个新的、独立的互联网层,执行问责制,确保人类和 AI 内容得到适当归属。为此,团队目前正在研究 AI 幻觉检测。幻觉,即 AI 将 AI 生成的虚构内容呈现为事实,是 GenAI 行业的祸根。公司解决这一问题的第一步是新推出的免费 AI 文本版权检查,用于 LLM 训练数据集。这将帮助他们生成更广泛的幻觉检测训练数据。
“我们只是试图避免一个整个互联网都是 AI 生成内容的世界,”Tian 说。“一个每个人都使用 AI 的互联网不会保留让人们继续贡献创造性和原创内容的机会。”