多AI智能体在单课程中的应用:以PGcert 404课程为例的案例研究

1. 引言

 
1.1 生成式人工智能与教育领域中AI智能体的发展
 
        生成式人工智能(GenAI)的快速发展,已对包括教育在内的多个领域产生深远影响。AI驱动的工具,尤其是AI智能体,在提升学习体验、自动化管理任务以及为学生提供个性化支持方面展现出巨大潜力(Fui-Hoon Nah, 2023;Luckin, 2018)。AI智能体的定义是“能够执行通常需要人类智能才能完成的任务的自主或半自主系统”,目前正越来越多地被融入教育环境,用于解决规模化教学、资源可及性以及个性化学习支持等长期存在的教育难题 (Labadze et al., 2023; Roll & Wylie, 2016) 。

        教育领域的一个关键挑战是“两西格玛问题”,这一术语由教育心理学家本杰明·布鲁姆(Benjamin Bloom)于1984年提出,该问题重点凸显了规模化提供一对一辅导的重要性和困难性。布鲁姆发现,接受一对一辅导的学生平均表现比传统课堂教学的学生高出两个标准差(2σ)。这意味着,在传统班级中处于第50百分位的学生,通过个性化辅导可以跃升至第98百分位——这是学习成果的变革性提升。然而,传统教学方法受限于师资、时间等资源,很难复制这种个性化教学的效果(VanLehn, 2011)。与之相比,AI智能体提供了一个极具前景的解决方案,它能模拟一对一辅导的互动模式,为学生提供即时反馈,并协助教育工作者高效管理大规模学生群体(Fui-Hoon Nah, 2023)。
 
 
1.2 PGcert 404课程介绍与观察到的挑战

        PGcert 404("运用技术增强学与教")是西交利物浦大学(XJTLU)研究生证书(PGcert)项目中的选修课程。需要特别说明的是,PGcert 404的学习者本身就是高校教育工作者,他们需要在教学、科研和行政工作之余,挤出有限的时间来学习教育学和技术赋能教学的相关知识。该课程旨在:
        培养高校教师在高等教育环境中规划、设计、实施和评估技术增强学习(TEL)策略的能力
        增强对教育技术质量保证与提升的认识,包括生成式人工智能的影响
        鼓励对技术在教学中的应用进行批判性反思,并确保其与《专业标准框架(PSF)2023》保持契合

        该课程的评估包括两个部分:
        论坛发帖与反馈(权重50%):学习者需提交一篇1000-1500词的论坛帖子,讨论某一教育技术的教学应用,同时还要对至少两篇其他同学的帖子进行同行反馈。
        批判性反思总结性论文(权重50%):撰写一篇1500-2000词的反思性论文,评估TEL在实践中的应用,并涵盖“如何保证教学质量”的思考及与PSF的契合度。

        尽管课程团队通过视频讲解和案例示范提供了详细指导,学生仍常在以下几个关键领域面临显著挑战。第一,许多学生难以完全理解评估要求,尤其是在尝试将理论概念与实际应用结合这一点上。第二,撰写反思性论文对学生们来说尤其困难,因为他们发现难以将自己的教学经验与PSF有意义地联系起来。此外,学生们在尝试将课程的教育技术建议应用于其特定教学情境时,也会遇到障碍,这表明通用教学原则与实际课堂情境的适应之间还存在差距。为解决这些挑战,教学团队在课程中引入了三个AI智能体,每个智能体承担不同的教学支持和管理功能。
 


2. 课程中三个AI智能体的引入

 
        为解决上述挑战并提升学生在PGcert 404课程中的学习体验,课程团队利用学习平台Learning Mall和Coze(国内流行的零代码AI智能体应用开发平台)上的AI虚拟导师平台,部署了三个专用AI智能体。这些智能体的定位是“针对性解决学生的难点问题”,具体功能如下:
        虚拟教学助理(TA):一款通用聊天机器人,主要负责回答与课程相关的查询(例如,评估标准与准备、截止日期、阅读材料)。
        虚拟教学设计者(ID):一款专用智能体,协助学生将技术融入教学计划。学生可以上传课程说明或课程计划,AI智能体将提供定制化建议。
        虚拟反馈提供者:一款AI工具,提供对草稿提交的形成性反馈,帮助学生在最终提交前完善其评估内容。

        需要强调的是,这些智能体的设计初衷是“补充人工教学”,而不是“取代教师”,一方面要确保学生获得及时支持,另一方面要减少教师在重复性工作上的投入。接下来,本文将全面探讨PGcert 404课程中集成的三个AI智能体的开发与实施过程,概述所采用的技术架构、教学设计考量及实际部署策略,以确保这些工具有效应对已识别的学习挑战。
 
2.1 虚拟教学助理

        虚拟教学助理 AI 智能体的部署方式很简单:在西交利物浦大学(XIPU)现有的 AI 聊天机器人平台上,新增一个 “AI 导师模块” 即可(见图 1)。这个智能体的 “能力来源” 有三个:一是提前设定的 “提示词”(指导智能体如何回应的规则),二是 “真相源”(Source of Truth)部分存储的核心信息,三是专门搭建的知识库。
 
图1:虚拟教学助理AI智能体的截图
        “真相源” 部分的核心作用是 “存储课程关键信息”,并且采用了标准化的 “问答(Q&A)” 格式 —— 内容包括课程评估要求、课程手册、自定进度课程的链接,以及 “如何让反思性写作符合 PSF 框架” 的指导手册。这些信息被放置在“真相源”部分而非知识库中,原因有二:首先,知识库在检索事实数据时,可能会因为算法处理导致信息被意外修改;而“真相源”能确保信息保持不变。其次,只要在“真相源”中提供准确的文件名,就能自动生成平台上资源的直接链接。此外,选择 “问答格式” 还有一个重要考虑:能帮助系统更准确地理解学生的问题,进而给出精准、贴合上下文的回答。

        以下是 “真相源” 中具有代表性的几组问答示例:
        问:PGC404的评估内容是什么?
        答:PGC404有两项评估:论坛发帖与反馈(1000-1500词)[权重50%],批判性反思总结性论文(1500-2000词)[权重50%]。
想了解更多细节,请查看课程中的 “评估任务” 板块;另外,课程还提供了很多帮助大家完成评估的资源,具体可以看 “评估支持资源” 板块。
        问:如何将我的写作与PSF联系起来?
        答:请参考文件“在PGC404中嵌入PSF描述符的指南”。
        问:PGcert课程手册的链接是什么?
        答:请提供可点击链接。链接为:
https://core.xjtlu.edu.cn/pluginfile.php/120594/mod_resource/content/6/PGCert%202024-25%20S2%20Handbook%20AdvanceHE%200107.pdf
        问:主动学习与技术学生参与自定进度研讨会的链接是什么?
        答:请提供可点击链接。链接为:
https://core.xjtlu.edu.cn/course/view.php?id=1698
 
        除了“真相源”部分,课程组还为智能体设置了提示词,以确立其成为PGcert 404的“苏格拉底式虚拟导师”的核心教学功能,专门设计用于通过引导式提问而非直接信息传递来促进学生发展作业想法。苏格拉底提问法是一种常用方法,通过系统性地提出问题,比如 “你的假设是什么”“这个概念怎么理解”“这么做的理由是什么”“会有什么影响”,来激发学生的批判性思维 —— 最终让学生 “主动构建知识”,而不是 “被动接收信息”(Carey & Mullan, 2004)。这种方法源自古希腊哲学,常被称为“助产术”(maieutics)——核心逻辑是 “帮助学习者自己‘催生’见解”:通过提问指出他们推理中的矛盾,再引导他们反复探究,最终完善自己的想法(Paul & Elder, 2007)。

        团队设置的提示词给AI智能体明确了四个核心任务:(1)先通过“诊断性提问”,了解每位学生当前对作业的构思;(2)采用“策略性提问”技巧,逐步引导学生关于教育技术应用的批判性思维;(3)提供有针对性但非规定性的建议,在符合评估标准的同时帮助学生打开思路;(4)在适当的时候,整合《Adding Some TEC-VARIETY》一书中的策略(Bonk & Khoo, 2014)——该课程引入的资源,能够提供技术增强学习(TEL)框架和活动,丰富教学材料的设计与交付。这一提示架构确保智能体始终遵循其促进元认知发展的主要功能,而非提供基于解决方案的响应,从而保持课程对反思性实践和教学创新的重视。以下是所使用的提示:

        #角色
        你是PGcert 404的虚拟导师。您的任务是协助学生 brainstorming 创建和提升其作业的想法。您应采用苏格拉底式对话风格:不要直接给出答案,而是引导学生构建自己的答案,同时提供额外的想法和改进建议。

        ##技能
        ###技能1:头脑风暴作业思路
1.当学生请求帮助创建或改进作业时,首先了解主题、作业要求及学生当前的想法。若已掌握该信息,可跳过此步。
2.通过一系列问题,促使学生更深入地思考作业主题,探索更具创意的想法和视角。
3.基于学生的回应,提出一些补充想法和改进方向,以丰富学生的作业内容。
        ###技能2:引导式问答
1.当学生提出具体问题时,不要直接回答,而是通过进一步提问帮助学生自行找到解决方案。
2.在学生回答过程中,及时提供提示和指导,确保思维方向正确。

        ##限制:
        仅就与学生作业创建和改进相关的话题进行交流。拒绝回答无关问题。
        对话应遵循苏格拉底式风格,通过提问引导学生思考而非直接提供答案。
        提供的想法和建议应相关、建设性且符合作业要求。
       在帮助学生构思时,可参考《Adding Some TEC-Variety》一书中的一些想法。请注意,该书可在知识库中获取。

        ##约束
        请勿直接为学生撰写论坛帖子,您可以提供一些想法或结构建议。

        最后,团队向知识库中上传了关键材料,包括课程手册、任务单、常见问题解答(FAQ)及补充阅读材料。这些资源使智能体能够对学生查询提供准确且相关的响应。
 
2.2.1 虚拟教学设计师
 
        PGCert 404——运用技术提升学习与教学这门课的关键学习成果之一,是培养教职员工在高等教育情境下规划、设计、实施与评估技术增强学习(TEL)策略的能力。他们必须从教学规划的最初阶段起,到设计、资源准备、课堂教学、互动、评估与课后反思的整个过程,系统地整合技术。在此过程中,他们需要熟悉教学设计的基础理论,如 Merrill 和 Gagné 的理论( Branch 等,2014)以及学生参与策略,并将这些理论融入日常教学实践。
 
        为了优化时间管理并降低认知负担,我们基于教学设计(ID)理论与技术增强学习(TEL)框架,开发了一款虚拟教学设计师智能体。借助大语言模型(LLM)的自然语言处理能力和完善的知识库,该智能体(基于 Coze 平台构建)可协助教师们进行课程规划,并将传统教学活动转化为经过 TEL 增强的活动。学员可在课程设计之初与智能体互动,以解决一个关键挑战:在课程实施中弥合课程设计理论知识与课程设计实践应用之间的鸿沟。此外,虚拟教学设计师还能帮助教师们完善其评估要素,对所设计的 TEL 教学体验进行反思性分析。
 
        通过精心设计的提示词、插件和定制文档,该智能体被训练为高校教学设计专家。它被预设了课程规划、学习产出、教学方法选择、互动活动设计与评估方案筛选等专项能力。智能体能耐心精准地引导教师,只回复教学设计相关的问题,确保提供专注且专业的支持。它知识面虽广,但被限制为不回答与教学设计无关的问题。
图 2:虚拟教学设计师智能体的设置界面截图
 
        要让虚拟教学设计者智能体 “专业”,离不开高质量的知识库支撑 —— 团队为它准备的文档,都是教学设计领域 “基础、权威且有影响力” 的核心模型,例如 ADDIE 模型、4C/ID 模型、Merrill 原则、Gagné 方法(Branch 等,2014)。
 
        在为智能体管理与整理文档时,需要关注以下问题:
a. 文档格式要合规:支持 PDF、Word、PPT 这三种常用格式,也可以直接上传网页链接(方便引用在线资源);
b. 内容要 “去冗余”:删除文档中和教学设计无关的信息(比如无关的广告、过时的案例),只保留核心内容;
c. 文档拆分要合理:虽然可以按长度拆分文档(方便 Coze 平台读取),但更推荐 “按主题分层”—— 比如把 “ADDIE 模型” 单独作为一个文档,“Merrill 原则” 作为另一个文档,这样智能体理解起来更清晰;
d. 知识库结构要 “逻辑化”:搭建前可以先思考三个问题 ——“教学设计的基础理论和关键要素有哪些”“有哪些能直接复用的实践经验”“内容呈现是否足够清晰,教师能快速找到需要的信息吗”

        最后,测试与调试对于确保智能体的性能至关重要。一方面,设计“典型问题清单”,通过这些问题评估其行为与理解。另一方面,可邀请更多团队成员从不同视角测试智能体的功能,随后据此调整设置,使智能体更好地满足实际需求。
 
2.2.2 虚拟反馈

        虚拟反馈的 AI 智能体同样基于 Coze.cn 平台进行设计,并配置了 DeepSeek-V3-0324 大语言模型(图 3)。为了使该 AI 智能体更具体地针对 PGC404 课程的作业,其设置(包括角色定义、任务提示、知识库和插件)都与 PGC404 的评估要求和学习成果紧密对齐。
图 3:虚拟反馈界面截图
 
        提示词
        AI 智能体的提示词包括角色定义、任务步骤和约束条件。为了让 智能体的反馈更贴近教师的实际需求,其被设定为一位经验丰富的 PGC404 课程导师,主要任务是校对学习者的论文初稿。该智能体将根据 PGC404 的评分标准和学习成果,帮助收集和分析用户上传的文档。为了生成有意义且结构完善的反馈,任务被划分为两大核心步骤:
(1) 引导用户提交文档并让用户说明 AI作业的类型。(2) 进行校对并提供附有依据的详细反馈。根据第一步确定的作业类型,对照对应的标准,给出详细且有依据的反馈。

        提示词中详细说明了以下三种场景,并指导如何生成结构化反馈及提供示例:
1.仅提交论坛帖子——基于任务表 1(学习成果 A 和 B)进行评估和反馈。
2.提交包含论坛帖子的综合论文——基于任务表 1 和任务表 2(学习成果 A, B, C 和 D)进行评估和反馈。
3.提交不包含论坛帖子的综合论文——基于任务单表2(学习成果 C 和 D)进行评估和反馈。

        以下是步骤提示词的示例(加粗词语链接到知识库内容):
#步骤 2:进行校对并提供基于证据的详细反馈
根据用户在步骤 1 中选择的作业类型,针对不同论文类型的各项要求分析上传的论文。请遵循以下回复框架:

        -如果论文类型仅为论坛帖子:
        使用任务表 1 中的标准进行分析。检查并针对以下所有项目生成反馈,不得遗漏:
1.简要核查每项内容:字数限制符合要求、组织清晰度、引言有效性、焦点清晰度、结论有效性、正文段落结构、主题句清晰度、段落连贯性,以及段落统一性。若存在任何问题,请引用具体内容并提出改进建议。
2.深入分析论文中的"批判性反思":检查论文是否充分展现对教学实践的批判性反思。分析反思是否足够深入,是否兼顾多方视角。针对性提出深化批判性反思的建议,并引用原文句段佐证每项建议。
3.仔细检查"替代方法建议":确认作者是否为教学实践提供了替代方法。详细解释每种替代方法的潜在利弊,并基于作者在文件中的思路提出其他可行方案。
4.检查教学文献使用:检查教学文献的使用情况。分析文献是否相关、引用是否规范且融入论证逻辑。如有需要,提供优化文献整合的示例。
5.仔细分析并检查作者如何将其教学实践和反思与PSF专业标准框架对齐:这是分析的关键环节。如果论文中没有嵌入 PSF 2023,请指出并建议作者添加,同时提供整合 PSF 的示例。若作品中嵌入了 PSF,请参考PSF 2023和嵌入 PSF 的指南,并对反思/评估环节中PSF框架的引用展开细致分析。明确反思内容与PSF契合度高的领域及需改进之处,列举可嵌入特定PSF条目的具体相关领域。
6.检查论文是否包含"未来行动依据":需明确体现未来行动的合理性论证。若存在缺失,建议如何清晰阐述该实践成果将如何指导未来教学实践。
7.根据评分标准文件,详细评估该作业如何体现学习成果 A (LOA)和学习成果 B(LOB)。分别指出两项学习成果对应的内容,针对每项成果深入评述其优势与改进空间,重点标注可强化展示的领域并提供切实可行的改进建议。
8.参考文献要求:核对任务表1 中的参考文献要求,分析本文档中的参考文献格式是否符合要求。若不符合,请提供正确格式的示例。
9.总结:编写总结报告,突出论文的优势与改进方向,并给出明确的改进指导。

        我们在测试AI助手时发现了若干问题,例如,智能体有时会参考其他课程的评估标准,有时不遵循设定的指南和结构。为了增强智能体的性能,我们在提示区域的末尾添加了一个"约束条件"部分,以更有效地管控人机协作沟通机制:
        #限制条件
1.仅提供与 PGC404 评估相关的反馈和建议。请勿回答与本任务无关的问题。
2.使用英语进行沟通。
3.确保您的评论和建议基于所提供的指南和标准。请勿引入外部或未经证实的观点。请勿忽略知识库或标准中的任何选项。
4.对发现的问题提供详细反馈,并在必要时提出改进建议。
5.每个文档需单独执行新的评估流程。
6.仅在步骤 2 中使用插件或工具。

        大语言模型
Coze 提供了多种大语言模型供用户使用(图 4)。经过数十次测试,DeepSeek-V3-0324 显示出良好的分析能力和稳定的性能。
图 4:Coze 平台上的大语言模型列表截图
 
        知识库设置

        知识库区域存储了关于 PGC404 作业要求和评分标准的文档(见图 5)。此外,知识库中的每个文档都在提示区域进行了链接,以便 AI 能够清楚地了解针对不同论文类型应参考哪个文档:
图 5:知识库文档截图
 
 

3. 学生对AI智能体实施的反馈


        自AI智能体在课程中投入使用以来,系统已记录超过294次交互次数。学生的文字评价总体积极,多数人赞扬AI智能体能够有效澄清评估期望并提供即时、省时的反馈。许多学生认为虚拟导师功能强大,并表达了在自己课程设计中采用类似工具的兴趣。然而,也有部分学生对聊天机器人在实际使用中的有效性表示担忧。以下摘录部分学生对AI智能体的评价:
• ​​"PGC404虚拟导师很强大。"​​
• ​​"将AI导师集成至Learning Mall平台非常便捷。"​​
• ​​"AI导师的使用是值得关注的工具,或许可将其纳入我的作业设计体系。"​​
• ​​"AI聊天机器人颇具趣味性,能回答学生常见简单问题,但其实际效果仍需验证。"​​
• ​​"聊天机器人实用且高效,能帮助获取针对性反馈。"​
 


4. 结论


        在 PGcert 404 课程中 “同时使用多个 AI 智能体” 的实践,为高等教育提供了一个重要启示:人工智能在解决 “规模化教学” 与 “个性化支持” 这对核心矛盾上,具有显著潜力 —— 既能应对 “学生数量多、教师精力有限” 的问题,又能为每个学生提供针对性支持。
        尽管目前学生的反馈总体积极,但这并不意味着 AI 智能体已经 “完美”—— 还有一个关键问题需要进一步研究,即如何优化 “人机协作机制”,尤其是在 “复杂的反思性任务” 中—— 比如 “如何让 AI 先帮学生梳理思路,再由教师进行深度指导”“如何避免 AI 的反馈和教师的要求不一致”,这些都需要更多实践来探索。

作者
孙逸群,吴叶香,未来教育学院
崔玮,知识与信息中心西浦学习超市

日期
2025年08月14日

相关文章