如何负责任且有效地使用AI进行研究

73次阅读
没有评论

共计 2940 个字符,预计需要花费 8 分钟才能阅读完成。

![图片 1:水泡](https://www.zdnet.com/a/img/resize/078902a9cba13ebb7e05ce07923bb96f5a856024/2024/11/15/ae4966be-d55d-4278-85cc-28493a869206/gettyimages-1488930209.jpg?auto=webp&width=1280)

如何负责任且有效地使用 AI 进行研究

有时,AI 聊天机器人被设计成青少年的样子。它们可以非常出色。但其他时候,它们会说谎。它们会编造东西。它们会虚构。它们自信地给出答案,基于它们认为自己无所不知的假设,但它们却大错特错。

虽然我们大多数人都知道不应该向青少年寻求重要信息和建议,但我们开始依赖同样会撒谎的 AI。公平地说,AI 并不坏;它们只是被这样编程的。

去年,我给了你八种减少 ChatGPT 幻觉的方法:

  1. 避免模糊和含糊不清
  2. 避免合并不相关的概念
  3. 避免描述不可能的场景
  4. 避免使用虚构或奇幻的实体
  5. 避免与已知事实相矛盾
  6. 避免滥用科学术语
  7. 避免混合不同的现实,以及
  8. 避免赋予不典型的属性

然而,这些提示都是要避免的事情。我没有给你主动工具来深入挖掘提示响应并引导 AI 提供更有成效的响应。如果你打算将 AI 用作搜索引擎的替代品或作为帮助你研究、撰写文章或论文的工具,这种技术尤为重要。

让我们深入探讨五个关键步骤,你可以采取这些步骤来引导 AI 提供准确的响应。

1. 要求提供参考和来源

我之前写过一篇关于如何让 ChatGPT 提供来源和引用的指南。幸运的是,ChatGPT 在引用来源方面做得越来越好,尤其是在 GPT-4o LLM 和每月 20 美元版本的网络搜索功能中。

但 ChatGPT 不会总是自愿提供这些来源。如果你在进行研究,总是—— 总是 ——要求提供来源。然后,测试这些来源并确保它们确实存在。在我的经验中,多次 ChatGPT 引用的来源似乎完全符合我正在寻找的内容。唯一的问题是,当我点击或搜索标题命名的来源后,我发现整个来源都是虚构的。

ChatGPT 甚至选择了真实的学术期刊,编造了作者名字,然后为文章分配了听起来令人信服的标题。你能想象如果我没有仔细检查就包括这些来源,情况会有多糟糕吗?我甚至不敢去想。

所以,要求提供来源,检查这些来源,并在 AI 给你一个编造的答案时指出它。

2. 告诉 AI‘展示你的工作’

在我早期探索 ChatGPT 时,我要求工具帮助我找到当地机械师。我让它去 Yelp 和 Google 评论进行情感分析。当时,它从这些网站中提取了有用的信息。

我最近再次尝试了这个测试,得到了另一组机械师排名。它实际上告诉我:“基于对独立汽车修理店的 Yelp 和 Google 评论的综合分析……”

但,ChatGPT 撒了谎。这个工具从未查看过 Yelp 或 Google 评论。这个结果可能是因为网站(包括 ZDNET)对允许 AI 抓取其内容变得更加严格。这没关系。我的观点是,AI 应该回来并说它无法检查 Yelp 或 Google 评论。相反,AI 只是声称它做了。

骗子,骗子,裤子着火。

当我要求它展示工作时,工具再次说它查看了 Yelp 和 Google 评论。然而,在“展示你的工作”的响应中,工具还显示了它分析的评论的来源。结果发现这是一个名为 Birdeye Reviews 的网站。

现在,我对 Birdeye Reviews 没有任何意见。我从未使用过它。但这不是重点。重点是 ChatGPT 说它基于 Yelp 和 Google 评论生成了信息。

“展示你的工作”是一个强大的提示。你可以揭示 AI 在给出结果时使用的推理过程的各种有趣信息。

3. 在相关问题中交叉验证 AI 的响应

这个过程让你和 AI 深入探讨一个主题,看看聊天机器人的答案是否在逻辑上一致且在上下文中相关。我们在传统研究和工程中经常使用这种方法,以确保我们在正确的轨道上。它也可以应用于 AI。

例如,假设你在写关于汽车轮胎的文章。你可以问:“汽车轮胎使用什么材料?”你可能期望的答案是“橡胶”。但橡胶不仅仅是一种物质。有来自树木的橡胶、合成橡胶,以及具有橡胶的柔韧性和强度但不含橡胶的材料。

例如,橡胶和 TPU(热塑性聚氨酯)都是柔韧的,感觉像橡胶。但合成橡胶是由石油基单体制成的,而 TPU 是由热塑性弹性体制成的。

你可以问 AI:“汽车轮胎使用哪种橡胶?”或“汽车轮胎仍然使用真正的橡胶吗?”这将导致解释汽车轮胎如何使用混合橡胶类型的答案。你可以通过问“橡胶在汽车中还用于哪里?”或“乐高汽车轮胎使用哪种橡胶?”来进一步深入探讨。

这种做法的重点不在于在你的论文中使用所有响应,而在于探索 AI 如何处理这类问题,以及它是否完全失去了线索。

4. 询问最近的事件或时间敏感的信息

许多聊天机器人有知识库截止日期。免费版本的 ChatGPT 的知识截止日期是 2023 年 10 月,这意味着在此日期之后发生的任何事情对 AI 来说都是未知的。

例如,当我要求免费版本的 ChatGPT 列出北约成员国时,它返回了 31 个国家的列表。然而,当我要求 ChatGPT Plus 列出北约成员国时,它返回了 32 个国家的列表。这是因为瑞典在 2024 年 3 月正式加入了北约。

聊天机器人通常会在被问及时告诉你它们的截止日期。但由于有额外的功能(如 Plus 中的网络搜索),最好尝试询问 AI 只有在拥有最新信息时才会知道的事件。

这里也有一个技巧。几分钟后,我要求免费版本的 ChatGPT:“你能使用网络查找当前的北约成员国是谁吗?”我明确告诉它“使用网络”。我得到了最新的答案。所以,如果你使用的是免费版本,考虑指导它在哪里查找信息以获得更好的答案。

5. 提出后续问题并迭代地完善你的查询

我在使用 ChatGPT 帮助我编程时使用这种方法。我从一个简单的查询开始,并不断完善和澄清,直到我得到一些基本代码。一旦这种方法有效,我会在我的代码中添加另一句话或细节。在一系列感觉更像对话而不是编码会话的互动之后,我通常会有一些有用的代码。

即使你不在编码,你也可以使用这种方法。假设你在做一个与云服务相关的项目。你可以问 AI:“你能解释不同类型的云服务吗?”

在这个例子中,你期望的答案会讨论电子邮件、网络托管、CRM 和其他软件即服务类别。然而,AI 回答了 SaaS(软件即服务)、PaaS(平台即服务)和 IaaS(基础设施即服务)的描述。

现在你会知道这个问题可能有几种解释方式,所以你可以跟进:“解释不同类型的云服务,专注于那些属于 SaaS 类别的服务。”

你可以跟进一个问题,比如:“基于这些 SaaS 类别,列出每个类别中最受欢迎的三种商业服务,以及每种服务的优缺点。”

这将给你一个更详细的描述,以及每种服务的特点。但让我们用一个额外的步骤来完善方法。在这个场景中,AI 提供了每种服务的描述,但你想要知道这些服务有何不同。

你可以通过添加“比较”这个词来完善查询,比如这个提示:“基于这些 SaaS 类别,列出每个类别中最受欢迎的三种商业服务,以及每种服务的比较优缺点。”

在我的测试中,最后的细化导致了比较每种服务特点的表格。我喜欢表格。事实上,如果 AI 没有以表格形式返回信息,我的额外提示是要求 AI 以表格形式呈现其结果。这个工具在按照这个指令操作时,通常会以有趣的方式重构其答案。

你最喜欢的 AI 策略是什么?

你最喜欢的确保与 AI 聊天时获得可靠结果的最佳实践是什么?请在下面的评论中告诉我们。

正文完
 0
admin-gah
版权声明:本文于2024-11-16转载自Zdnet,共计2940字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码