Google翻译与ChatGPT图片文字翻译对比:谁更胜一筹?

24次阅读
没有评论

共计 2187 个字符,预计需要花费 6 分钟才能阅读完成。

在复杂的图片文字翻译测试中,Google 翻译和 ChatGPT 的表现大相径庭,揭示了 AI 在文字识别和翻译中的挑战。

作为技术专栏作家和 YouTube 制片人,测试新设备是他们工作中的一大乐趣。他们一直在测试Anycubic Kobra 3 3D 打印机,这促使了这篇文章的诞生。

Google 翻译与 ChatGPT 图片文字翻译对比:谁更胜一筹?

3D 打印机使用称为切片器的软件,将 3D 模型转换为 3D 打印机用熔融塑料堆叠的层。一个不幸的新趋势是,大多数大型 3D 打印机公司都采用了一个名为 Orca Slicer 的开源切片器,并重新命名以供自己使用,添加了特定机器的代码以支持他们的打印机。

Anycubic 在他们的 Anycubic Slicer Next 中这样做了,这大大改进了他们之前自制的切片器。Anycubic 总部位于中国。虽然他们的切片器的大部分屏幕已经翻译成英文,但状态页面仍然保持中文。他们确信很快就会更新,但目前正在测试新版本。

虽然状态屏幕的大部分内容可以通过上下文自行解释,但有两个地方他们真的很想理解文字。在 (1) 处有两个按钮。在知道它们的含义之前,他们不想翻转这些按钮。在 (2) 处有一个大大的红色通知。这是一个需要注意的重要警告吗?

Google 翻译通常用于文本翻译,但在这种情况下,他们无法粘贴文本,因此点击了“图片”选项,得到了一个上传屏幕。然后,他们上传了截图,并将其提供给 Google。Google 翻译将大部分中文文本替换为英文文本。他们可以看出,这两个开关分别控制打印头灯和摄像头灯。不幸的是,红色警告文本完全无法阅读,即使在放大 700% 后也是如此。

他们决定尝试 ChatGPT Plus。结果好坏参半。ChatGPT Plus 中的小加号按钮,并上传了他们的截图。几乎立即,他们得到了一个描述每个中文字符串及其英文对应词的页面。他们注意到了两件事。首先,在 (1) 处,ChatGPT 告诉他们需要固件更新。Google 翻译忽略了原始图片上的蓝色文本,并没有在其重新渲染的截图中提供该文本块。其次,在 (2) 处,ChatGPT 确实翻译了红色警告信息。基本上,它说如果你手动移动机器上的打印头,你应该注意你的操作。这是一个有用的建议,但他们担心了几个月的那块红色文本并不是什么需要担心的事情。

然后,在底部,ChatGPT 提出将英文翻译覆盖在原始截图上。这让他们不得不看看。ChatGPT 已经完成了他们需要的任务,所以剩下的只是他们作为 AI 调查员的好奇心。他们回应了 ChatGPT 的邀请,提示它“是的,请将注释视觉上覆盖在截图上。”他们得到了这个。正如你所看到的,ChatGPT 非常周到地将覆盖层放置在原始截图上。只是它使用了蓝色的中文字符,而不是提供英文翻译。一些,如屏幕顶部中间(在 1 处),与已经存在的中文字符相似。一些,如屏幕右下角(在 2 处),即红色警告信息所在的地方,放置了比原始文本少得多的蓝色中文字符。

有趣的是,ChatGPT 还重新制作了图片。原本的英文文本(在 3 处)’Body1_PLA_0.2_52m49s.gcode’ 被修改为 ’Baby_PLA3_FullNoo.gcode’。四个线轴被替换为三个线轴(在 4 处),并重新着色(在 5 处)。

作为一个乐观主义者,他们决定再给 ChatGPT 一次机会。他们提示它“请再试一次,将英文翻译覆盖在中文字符上。”然后,他们得到了这个。这个显示了所有四个线轴,所以这还不错。它确实用英文单词替换了中文字符,但省略了他们好奇的红色提示以及固件更新通知。

但他们想让你注意的是摄像头视图。如果你仔细比较原始图片,你会发现 ChatGPT 重新制作了实际照片。事实证明,这张照片没有任何需要翻译的内容。左边的图片是原始图片。右边的图片是 ChatGPT 的重新解释。

左边是原始图片,右边是 ChatGPT 的版本。让我们来看看 ChatGPT 改变了什么:绿色箭头:Kobra 3 设备名称,原本是带有斜线形状的模板字体,被替换为仅仅是“Kobra”这个词。橙色箭头:完全不清楚 ChatGPT 决定对他们的插头阵列做什么。青色箭头:打印头,原本是一个立方体,在新图片中变成了一个扁平物体。黄色箭头:正在打印的物体形状发生了很大变化,从一个带有树支撑的物体变成了看起来像金色基座的东西。紫色箭头:“Sided PEI Sheet”变成了“Serial PEI Shoot”。红色箭头:标签被移动和更改。洋红色箭头:房间对面的东西和门都被改变了。

所以,是的。事情就是这样。AI 给予和 AI 失去理智。一方面,可以说 ChatGPT 确实给了他们想要的,即红色警告信息的翻译以及那些按钮的作用,而 Google 使得无法看到警告信息文本。在这种情况下,ChatGPT 赢了,Google 输了。但 ChatGPT 首先给他们一个纯文本翻译是偶然的吗?因为如果 ChatGPT 只给了他们其中一个截图,他们不得不说是 Google 赢了,不是因为 Google 给了他们想要的,而是因为 ChatGPT 失去了它那毛茸茸的小脑袋。

生成式 AI 有很多很酷的地方。但时不时地,他们也会遇到一些令人挠头的问题。他们确实得到了答案,但也窥探到了一个非常混乱的 AI 大脑。这是一份有趣的工作。你尝试过使用像 ChatGPT 或 Google 翻译这样的 AI 工具来解密图片中的文字吗?什么对你最有效?你遇到过像这里描述的奇怪或意外的结果吗?你通常使用什么工具来翻译或分析其他语言的界面元素?在下面的评论中告诉我们。

正文完
 0
admin-gah
版权声明:本文于2025-04-22转载自Zdnet,共计2187字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码