必应生成的 AI 图像
周末,我和我 12 岁的孩子谈论 ChatGPT 以及如何制作提示来让它做不同的事情。与其试图解释这些大型语言模型聊天机器人可以做什么,我想为什么不玩得开心,并尝试通过玩不同的提示并看看会发生什么来实际构建一个小的数学测验应用程序。
数学测验应用要求
为 12 岁的儿童开发一个数学测验应用程序,其中包含 2 位加法、减法、乘法和除法问题。以基于聊天的格式一次提出一个问题,并立即验证用户响应。显示“正确”或“错误”,以及针对每个问题的工作,并显示性能摘要,其中包含所花费的时间和鼓励的反馈。
什么是格式正确的提示?
格式良好的 ChatGPT 提示应该清晰、具体和简洁。它应该说明用户的查询或他们想要讨论的主题,提供上下文或相关详细信息,以确保 ChatGPT 有重点和准确的响应。通过精心设计定义明确的提示,用户可以从 AI 语言模型获得更多有用和相关答案。
提示工程是一个迭代过程,涉及优化和修改初始提示,以获得最适合特定任务或与 ChatGPT 交互的格式良好的提示。通过实验和调整,用户可以提高AI响应的质量和准确性,并与AI语言模型实现更有效的沟通。
阅读有关提示工程的详细文章:提示工程的艺术
为测验应用设置提示
***迭代 1:***最初的提示只是列出了一组问题和答案,而没有对测验应用程序的规则进行任何解释。因此,我将应用程序的规则编写为“规则 1:xxxxx,规则 2:xxxxx”。这有助于 ChatGPT 更好地了解测验的上下文并生成更准确的答案。
***迭代 2:***ChatGPT 根据提示“使用规则执行测验应用程序”生成代码。但是,我希望聊天界面输入响应。因此,我通过明确提及“使用您的聊天界面”来调整提示。这有助于 ChatGPT 更好地了解我对使用聊天界面的期望。
***迭代 3:***我希望应用程序开始根据命令“我准备好了”和“我完成了”提问。但是,这两个规则在同一句话中,这还不够清楚。因此,我将它们分解为两个单独的规则。
***迭代 4:***我清楚地提供了验证答案的规则,但 ChatGPT 在两种不同的情况下验证不正确。在第一种情况下,ChatGPT说答案是正确的,但实际上它是错误的。在第二种情况下,ChatGPT说答案是错误的,而实际上是正确的。这是由于一种称为经典幻觉的现象。
经过几次迭代对提示进行细微的调整和改进后,我决定直接利用 ChatGPT 本身来帮助完善措辞。我能够为我的数学测验应用程序最终确定最佳提示,如下所示:
为了验证最终提示的结构是否良好,我要求 ChatGPT 对其进行审查并确认它将实现所需的测验应用程序功能。
一切准备就绪,是时候测试应用程序了!
快乐路径测试
万岁!它有效。一些负面情况怎么样?
阴性检测
ChatGPT 可以理解意图,即使没有提供明确的规则,也会显示错误消息。这些提示使我们能够建立 chatGPT 在涉及负面场景的情况下应如何响应的指南。
好吧,它通常满足要求并且运行平稳。但是,我想提请大家注意一些挑战和问题。
挑战和问题
***挑战1:***第7条明确规定,每个问题所花费的时间应在最后摘要中列出。但是,在我的测试中并非如此。我尝试了几个不同的选项,但没有一个奏效。
***挑战2:***我最初在提示中包含了一些示例问题。但是,ChatGPT 只问了这些问题,所以我将它们从提示中删除了。
***挑战3:***数学测验应用程序在 5 或 6 个问题后没有重复。它将在收到命令“我已完成”之前显示摘要。这可能是由于 ChatGPT 免费层的限制。
*挑战4:经典幻觉问题*
以下示例清楚地捕获了 chatGPT 如何将输入的值与计算的答案进行比较中的错误。第二个问题(49-18=)有一个不正确的答案,但ChatGPT仍然说它是正确的,即使它正确地计算了答案。
快速工程使用户能够优化大型语言模型并实现强大的性能。但是,用户有责任在使用模型之前彻底检查模型的输出。负责任的提示工程需要了解模型的功能和局限性,仔细审查其响应,并就何时信任或忽略生成的文本做出明智的决策。通过适当的洞察力和谨慎,即时工程允许访问大型语言模型的强大功能,同时降低盲目依赖 AI 生成的文本的风险。
如果您有兴趣了解有关快速工程的更多信息,我鼓励您尝试自己的项目。您可能会对自己的成就感到惊讶。