赛氪
个人中心

智能体与应用赛道示例及测试说明

2026.02.13 21:17:43

应各位同学老师的要求,为了让比赛更加清晰有效地进行,下面以受贿罪案由里判断是否处三年以下有期徒刑的任务为例说明撰写链图的思路和组委会可能进行的评测。

 

本说明将会用到云盘里的《20260213示例一受贿罪第一档刑罚》的压缩文件。可以通过本推文后面提供的网盘链接获取。

请下载并解压上述压缩文件后,打开 Excel 表格《受贿罪第一档刑罚智能体和应用赛道测试示例》。该文件包含两个工作表,分别对应 “智能体赛道” 与 “应用赛道”。两个表里,前三列都是赛队提交作品时要声明的关键信息。这里假设有赛队M做了受贿罪案由里的判断第一档刑罚的任务,并且声明是针对刑法修正案九至今的法律版本的。第四列是根据声明的任务和时间组委会准备的相关法条(本示例中就是跟判断受贿罪一档刑罚相关的法条),鼓励赛队提交但不要求,组委会在准备时会参考。

 


智能体赛道说明

  1. 第五列:是由组委会将第四列的法条输入至赛队提交的智能体系统输出得到的JSON文件。组委会希望提交的智能体能够输出两个标准化的JSON文件(压缩包内已提供示例)。

  2. 第六列:是组委会会用的提示词,用于将智能体输出的链图 JSON (去掉了“法律法规”与“案由”部分),输入大模型(如豆包),还原为自然语言表述的法条。

  3. 第七列:是组委会会用的另一提示词,用于引导大模型对“还原后的法条”与“原始法条(即第四列中的内容)”进行一致性评分。

  4. 第八至十列是验证智能体可拓展性的示例,分别是同一案由其它版本法条和其它案由法条的示例,这些示例会重复第五、六、七列的操作来评测。

  5. 第十一列到最后:包含四个预测准确率测试样本(含输入文本与标准答案)。对于刑法罪名的案由,一般是在北大法宝上找到该案由声明时间内审结的一审判决书和威科先行案例库的该案由声明时间内的检察文书里的不起诉决定书。测试集案例的构成是基本上正负样本各一半,负样本里包括不起诉、其它相关罪名的判决书、其它不相关罪名的判决书。测试的过程是将这些列中的示例输入、智能体输出的两个JSON填入测试工具,然后执行判断看结果与标答的一致性。测试时,需将示例输入与智能体输出的两个 JSON 填入指定测试工具,得到答案后,再与标答比对是否一致。

 


应用赛道说明

  1. 第五至十二列:提供了四个预测准确率测试样本的输入与标准答案。测试集的构成同上。测试的过程是将赛队提交的两个JSON 文件(压缩包内已附示例,同智能体赛道JSON示例)与测试样本一同填入工具进行准确率评估。
  2. 第十三列:提示词,用于将赛队提交的链图 JSON(去除“法律法规”与“案由”字段后)输入大模型,还原为自然语言法条。
  3. 第十四列:提示词,用于引导大模型对还原法条与原始法条(即第四列)进行一致性打分。
  4. 第十五至十六列:为可拓展性验证示例,是同一案由在不同法律生效期间的真实案例。赛队提交的 JSON 需与这些示例共同输入测试工具,验证跨版本适用能力。

链图 JSON 构建思路及规范

关于如何从法条得到链图 JSON,请详阅压缩包中的《思路受贿罪第一档刑罚链图》word文档,并对照阅读《受贿罪第一档刑罚链图》JSON文件。

关于链图JSON的核心规范进一步说明如下:

  • 固定结构:图中红线圈出部分为不可修改的固定模板。
  • “规则”字段要求:
    • 类型:仅限填写“逻辑运算”、“算术运算”或“条件判断”;
    • 若为“逻辑运算”,计算方式仅可选“与”、“或”、“非”;
    • 条件:可包含一个或多个字符串,代表法条中某结论成立的要件;
    • 结果:必须且仅能对应一个字符串。若需表达多个结果,应通过以下方式处理:
      • 合并为单一字符串;
      • 另建一条逻辑运算规则把多个字符串处理为一个节点;
      • 使用“集合”类型节点(需在“节点”部分明确定义)。
  • “节点”字段要求:
    • 所有在“规则”中出现的字符串(包括条件与结果),必须在“节点”部分预先定义,且其类型须为“逻辑”或“数值”或“集合”;
    • “逻辑”类型的字符串才能在“逻辑运算”中出现,而“数值”类型的字符串才能在“算术运算”中出现;
    • “结果”对应的节点无需填写提示词,因其值由规则运算得出。
  • “提示词”字段:
    • 为选填项,建议结合大模型能力,设计有助于提升推理准确率的问题;
    • 若未填写,系统将使用默认提示词。

注:“算术运算”与“条件判断”的具体示例,将于后续民法案由任务中发布,敬请关注。

关于《受贿罪第一档刑罚任务节点》JSON 的补充说明

在压缩包所附的《受贿罪第一档刑罚任务节点》JSON 文件中,请特别注意以下规范:

  • “任务节点”字段为固定结构,由图中红线圈出部分标识,不得修改或删除。该字段用于明确整个链图推理所要判定的最终法律结论。

  • “区间任务节点上限”与“区间任务节点下限”字段如有对应的内容,也是固定的;若当前任务不涉及区间判断,则这两个字段可留空或直接删除,不影响整体结构合规性。

  • “任务节点”对应的字符串列表可以有1或者多个字符串,是在链图JSON文件里“结果”里的某个或某多个字符串,用来表示链图JSON判断的最终结果,标识主规则,也即用来标识在众多结果中哪个是整个链图要判断的最终结果。不用把链图JSON里“结果”里的所有字符串写过来。

     

    注:示例链图的内容只是为了说明,所以做的比较粗糙,不想过多影响赛队自己的思路。

     

    文件提取请点击下方阅读原文从百度网盘获取,提取码: 5ufs

    亦可通过如下链接获取,密码:rpdmxm

    https://share.weiyun.com/c4UdsQuQ

证书查询
取消 确认

同学~下载赛氪APP就可以进群咯~
先不聊 去下载