共计 1512 个字符,预计需要花费 4 分钟才能阅读完成。
2025 年 6 月 27 日,旧金山——CTGT,一家致力于帮助企业部署 AI 于高风险场景的公司,今日宣布其平台升级,成功消除了 DeepSeek 及其他开源 AI 模型中的偏见、幻觉等不良特性。在测试中,CTGT 使 DeepSeek 回答敏感问题的准确率从 32% 提升至 96%,这一突破性成果使其荣获 2025 年 VentureBeat 创新展示大奖。
CTGT 在 2025 年 6 月 24 日至 25 日于旧金山举行的 VentureBeat Transform 2025 活动中首次展示了这一平台升级。作为七个决赛选手之一,CTGT 最终被评委评为顶级赢家。
近期,CTGT 为一家领先的保险公司构建了基础设施,确保其 AI 能够正确编码复杂的索赔,帮助该公司在一周内避免了超过 100 万美元的财务风险。此外,CTGT 还为一家主要银行设计了生成式 AI 电子邮件合规系统,通过自动更新合规模型,避免了系统下线带来的不便。
根据麦肯锡的数据,2024 年全球因 AI 幻觉导致的损失高达 674 亿美元。德勤的调查显示,47% 的企业 AI 用户承认至少做出了一项基于幻觉输出的重大商业决策。这一问题似乎正在恶化,一些新版本的模型比旧版本更容易产生幻觉。例如,近期推出的 ChatGPT 4.5 模型的幻觉率高达 30%,创下历史最差记录。而 DeepSeek R1 的幻觉率为 14.9%,其中大部分错误信息被指认为由中国政府故意编码到模型中。
在高风险环境中,这些模型的可信度受到严重质疑。
CTGT 于 2025 年 2 月成立,获得了来自 Gradient(谷歌的早期 AI 基金)、General Catalyst、Y Combinator、Liquid 2、Deepwater 以及包括 François Chollet(谷歌,Keras 的创造者)、Michael Seibel(Y Combinator,Twitch 联合创始人)和 Paul Graham(Y Combinator)在内的知名天使投资者的 700 万美元资金。最初,CTGT 专注于减少训练和部署 AI 模型所需的计算量,通过消除微调、提示工程和反向传播的需求,成功将计算量减少了一个数量级。
“DeepSeek 推出 R1 后,许多企业联系我们寻求帮助——他们对利用 DeepSeek 的低成本和速度感兴趣,但担心偏见问题,”CTGT 联合创始人兼首席执行官 Cyril Gorlla 表示。“在测试中,CTGT 能够识别并移除导致偏见的确切模型特征,使 DeepSeek R1 能够无偏见地运行。随后,我们对其他开源模型(包括 Llama)进行了相同测试,证明 CTGT 可以在几分钟内识别并移除偏见、幻觉等不良特性,而无需耗时且昂贵的微调或重新训练。现在,任何使用 CTGT 平台的企业都可以享受这一功能。”
“AI 模型的可信度是企业实现 AI 投资回报的主要障碍,”Gorra 补充道。“每周我都会接到财富 500 强高管的电话,寻求解决这一问题的建议。在过去的几个月里,我们在该领域进行了大量定制工作,现在我们将这一方法产品化,并在 CTGT 平台上向所有人开放。”
关于 CTGT
CTGT 通过突破性的数学方法,在模型级别自动实时消除幻觉、审查和偏见,无需训练或微调,使企业能够将 AI 应用于高风险场景。公司正在使用 CTGT 的平台来提高模型准确性,减少计算量,并使模型部署速度提高 500 倍。基于加州大学圣地亚哥分校开发的技术,CTGT 得到了 General Catalyst、Y Combinator 以及包括 Paul Graham 和 François Chollet 在内的知名天使投资者的支持。了解更多信息,请访问 CTGT.ai。
媒体联系人:
Michelle Faulkner
Big Swing
617-510-6998
michelle@big-swing.com