共计 2083 个字符,预计需要花费 6 分钟才能阅读完成。
在人工智能领域,印度企业正通过构建小型语言模型(SLM)来提供成本效益高的个性化解决方案。与使用数百亿甚至数万亿参数的大型语言模型(LLM)相比,SLM 的训练参数显著减少,范围从几百万到几十亿。
拥有大量专有数据的公司正在竞相构建 SLM,旨在提供 LLM 无法满足的定制化解决方案。四家印度公司——两家教育科技平台、一家健身科技初创公司和一家云科技公司——正在开发小规模的 AI 工具,为用户提供个性化服务。
Aakash Educational Services Ltd、Physics Wallah、Healthify 和 Zoho 都在大力投资这些工具,也被称为内部基础 AI 模型。Aakash 是一家为学生提供专业入学考试辅导的公司,其董事总经理兼首席执行官 Deepak Mehrotra 表示,该公司正在开发的 AI 模型预计将在 18-24 个月内取得成果。
其重点是评估分析,即分析测试结果、学习者表现和技能评估。该公司还计划使用 AI 创建定制学习包和职业路径。
“我们在这个方向上迈出了小步,但已经看到了效果,”Mehrotra 说。
该公司已经开始通过 Invictus 推出其 AI 产品的初始版本,Invictus 是其为印度工程和建筑课程联合入学考试准备的最新版本。
下一步是:利用专有数据并与外部专家(包括大型科技公司)合作开发 SLM。Mehrotra 没有透露有关合作伙伴关系的更多细节。
与使用数百亿甚至数万亿参数的 LLM(如 ChatGPT)不同,SLM 的训练参数显著减少,范围从几百万到几十亿。
“SLM 为生成式 AI(GenAI)的开发和部署提供了成本效益高的替代方案,因为许多组织不需要广泛的能力,”科技咨询公司 Gartner 的分析师 Anushree Verma 表示。
她补充说,SLM 更容易控制和微调,以适应特定的用例。
拥有大量专有数据的公司倾向于构建 SLM 以提供有针对性的服务,尤其是在现有 LLM 无法满足其需求的情况下。
一些公司正在现有模型的基础上构建 SLM,这也被称为 LLM 蒸馏。通过蒸馏,可以从较大的模型中提取重要功能和知识,并将其部署在较小的模型中。组织可以使用自己的数据对这些较小的模型进行调整,以适应特定的用例。
其他公司可能会从头开始。
云软件初创公司 Zoho Corp 计划在今年年底前公开两个基于 AI 的内部基础模型。Zoho 向《Mint》确认,中小型模型将从头开始构建。
向《Mint》确认其构建内部基础模型计划的四家公司中的两家——Physics Wallah 和 Aakash——来自教育科技领域,这表明这些工具在该领域的重要性日益上升。
《Mint》早些时候报道,Physics Wallah 计划在 2026 年底前推出其 SLM。该公司正在构建专注于物理、化学、数学和生物学的模型,这些领域目前的 LLM 效果有限。
然而,教育科技领域内不同细分市场对 SLM 的需求可能有所不同。upGrad 的首席产品和技术官 Ankur Dhawan 表示,SLM 在 K -12 教育等结构化和静态课程中最为有效,“在这些课程中,概念学习是关键”。
“在高等教育中,跨学科学习和更广泛的内容使得 LLM 更为合适,”他说。“现有模型的成本效益和延迟已经很强,并且在 AI 创新的推动下正在迅速提高。鉴于此,我们认为在我们的领域内暂时不需要 SLM。”
Dhawan 补充说,开发和维护利基模型也需要大量的持续投资,可能会减缓创新速度。
“鉴于 AI 的快速发展,我们认为利用现有最佳模型是服务我们的学习者并保持行业转型领先地位的最有效方式,”他说。
尽管内部基础模型的规模相对较小,但如果从头开始构建,也会产生高成本和长周期。
Aakash 去年承诺至少投入 10 亿卢比用于 AI 和数字技术。Mehrotra 预测,即使该公司正在尝试节俭地构建模型,这一投资也将在未来两到三年内增长。
在本周早些时候的一次采访中,Physics Wallah 创始人兼首席执行官 Alakh Pandey 表示,该公司正在不进行过度分析的情况下进行重大的 AI 投资,并指出时机对于抓住机会至关重要。
Physics Wallah 没有分享更多细节,因为它正处于首次公开募股前的准备阶段。
Zoho 和 Healthify 没有立即透露它们在开发替代 AI 工具方面的投资金额。
为了应对从头开始构建 AI 模型日益增加的成本,公司正在选择蒸馏。
健康和健身初创公司 Healthify 已经开发了在 OpenAI 和 Anthropic 的 LLM 之上运行的 SLM。
“我们用自己的本地数据——生活方式、饮食模式、位置、偏好和医疗状况——进行分层。这创造了一个更加个性化和智能的工具,”公司首席执行官 Tushar Vashisht 表示。
该公司认为 SLM 的价值主要体现在训练其 AI 助手 Ria 及其教练副助手上,以提供感觉人性化和富有同理心的实时对话建议。作为次要功能,公司的 SLM 提供上下文提示以及个性化健康洞察,以保留客户并推动参与度。
该公司认为没有必要从头开始构建。
“从头开始构建 SLM 既耗费资源又耗时。使用现有模型有助于我们快速集成先进的 AI 功能,而无需高昂的前期成本或长周期,”Healthify 的首席技术官 Abhijit Khasnis 表示。