共计 725 个字符,预计需要花费 2 分钟才能阅读完成。
长期以来,网络用户习惯于通过点击包含街道图像的 CAPTCHA 网格来识别日常物品,以此证明自己是人类而非机器人。然而,最新的研究表明,经过专门训练的图像识别模型可以在这种 CAPTCHA 中达到人类水平的表现,成功率高达 100%。
苏黎世联邦理工学院的博士生 Andreas Plesner 及其同事的研究,聚焦于 Google 的 ReCAPTCHA v2,该系统要求用户识别网格中的街道图像是否包含自行车、人行横道、山脉、楼梯或交通灯等物品。尽管 Google 多年前已开始逐步淘汰该系统,转而采用分析用户交互的“隐形”ReCAPTCHA v3,但旧版的 ReCAPTCHA v2 仍被数百万网站使用。
为了打造能够击败 ReCAPTCHA v2 的机器人,研究人员使用了开源 YOLO(You Only Look Once)对象识别模型的微调版本。在训练模型使用 14,000 张标记的交通图像后,研究人员开发了一个系统,能够识别任何提供的 CAPTCHA 网格图像属于 ReCAPTCHA v2 的 13 个候选类别之一的概率。
除了图像识别模型,研究人员还采取了其他措施来欺骗 ReCAPTCHA 的系统,如使用 VPN 和模拟人类活动的鼠标移动模型。根据所识别对象的类型,YOLO 模型能够准确识别单个 CAPTCHA 图像的成功率从 69%(摩托车)到 100%(消防栓)不等。这种性能足以每次都通过 CAPTCHA 的检测。
尽管之前有学术研究试图使用图像识别模型来解决 ReCAPTCHA,但它们的成功率仅在 68% 到 71% 之间。成功率达到 100% 表明我们正式进入了超越 CAPTCHA 的时代。然而,随着人工智能系统在模仿越来越多曾经被认为是人类专属任务方面变得越来越好,确保网络浏览器另一端的用户实际上是人类可能会变得越来越困难。