Skip to content

⭐AI拆题项目:prompt工程

约 621 字大约 2 分钟

2025-10-21

AI拆题

这个系统的核心任务,是让AI将结构复杂、格式不规则的语文试卷,自动解析成高度标准化的JSON数据。

###流程:

1. 数据预处理(把非结构化的试卷文件转为markdown格式的结构化数据)

技术选型和验证

2. 对md数据进行AI智能解析:prompt规则设计

prompt怎么设计?

​​这个任务可以说是一个典型的‘复杂规则系统’的Prompt工程问题。​​ 首先,面对上百条复杂且可能冲突的业务规则——比如不同学科对标点符号的处理不同,‘选择题的题干和选项要分开存储’但‘阅读题的题干和材料又不能拆分’——我的核心解法是:​​用软件工程的思想来设计Prompt,而不是简单地罗列指令。

先简化问题:思路:背景、目的、行动、示例、限制条件

  1. 开篇先给AI一个全局背景和目的说明,抽象出问题本质:试卷有‘题组、题目、子题’三级结构,本质就是题组、题目、子题的各种组合情况。然后再深入到后面的具体规则。确保AI不会在细节中迷失方向。
  2. ​模块化组织​​:把复杂的规则按功能拆解成独立的模块,比如‘题型识别模块’、‘格式转换模块(md语法和特殊标记转换为HTML标签)’、‘JSON结构规范模块’等等,将原来复杂关联的规则解耦开,避免规则的冲突和矛盾。
  3. 撰写题目示例json结构
  4. 添加限制规则和检查清单

3. 测试迭代和prompt调优

测试和迭代的方式,由于prompt调优不是一个一次性的问题,可能涉及到反复的微调工作,本质上这是一个版本管理的任务,所以我用我在代码工作上的经验使用了git来管理我的prompt,保障每次更新都是有记录的,可回溯可管理的。(这应该也是我具备技术背景的一个优势点) (细节:发现误判问题如m选n和填空题的混淆、序号删减错误等,进行prompt调优)

锻炼的能力:逻辑思考和逻辑表达,能够对业务需求、技术能力做很好的抽象。