11月29日下午三点半,我院邀请华东师范大学计算机科学与技术学院青年研究员陈琴博士在俊秀楼105室为2021 级“心理学+计算机”双学位班进行学术班会讲座。此次讲座的题目为《融合教育心理学的对话大模型:EduChat》。班会讲座由班主任胡杨老师主持,“心理学+计算机”双学位班、“耀翔班”同学及其他感兴趣的师生分别通过线上线下参与了本次活动。
陈老师首先为我们介绍了研究背景。她借用比尔·盖茨的观点,指出大语言模型(GPT)是这个时代最具革命性的技术之一,对人类社会的诸多方面起到了很大的作用。
接下来,陈老师介绍了一些已有的基于大模型的教育产品。在国外产品中,她介绍了Chegg,是一款AI作业辅导提供个性化的作业辅导服务,包含作业辅导、测验和考试辅导、数学辅导、专家校对以及抄袭检测;Duolingo Max,是一款英语学习辅导提供个性化英语辅导;还介绍了TutorAI,Khanmigo这两款个性化家教。目前应用较多的国内教育大模型包括讯飞-星火大模型、好未来-MathGPT、浙大-智海-三乐教育大模型,以及由陈老师所在的我校计算机科学大模型团队研究的华东师大-EduChat。
报告的第二部分,陈老师为我们介绍了EduChat的研发背景与现实意义。EduChat是在心理学和教育学理论指导下,结合人工智能技术,研发融合教育心理学的对话大模型,助力实现因材施教、公平公正、富有温度的智能教育。
就技术框架而言,EduChat主要采用了以下训练步骤。技术1是预训练,基于心理学学科教材书籍等教育语料进行预训练,储备教育领域基础知识。采用了与华东师大出版社合作的学科语料、共建数据开源联盟、心理学语料(600本书籍+部分访谈音视频)等。技术2是指令微调,采用清洗后的400万条基础指令+50万条定制的教育特色指令多步微调,保障基础能力无损同时提升教育能力。技术3是工具增强,学习使用外部工具如搜索引擎,并自主判断使用哪些有用的知识来回答,缓解幻觉问题实时更新知识。这一技术涉及检索增强的问答指令构建,从原始问答库、搜索引擎、判断检索、人工修正、构建Inner Thought、生成高质量回答到人工修正。
接下来,陈老师为我们介绍了EduChat的几种主要应用。应用1是开放问答:这一应用通过学习使用外部工具,结合搜索引擎辅助答案生成,有源可溯,缓解幻觉问题,实时更新信息。应用2是作文批改:这一应用结合一线教学专家经验,不仅会给出总体评分和方面级评分,还提供内容评价、表达评价、亮点句识别、分段评价以及整体评价等详细批注。应用3是启发式数学教学:传统的语言模型更倾向于直接喂答案,而EduChat结合苏格拉底式教学方法,通过反问、质疑和质询的多步向答方式,促进学生独立思考,激发其讨论、辩论、评估和分析等高级思维技巧,培养自主学习和创新能力。应用4是情感支持:这一应用融合情绪ABC理论,在心理学相关理论指导下,模拟心理咨询师,帮助深入了解来访者的情绪状态,挖掘情绪问题的根源,从而为用户提供更准确、专业和个性化的心理评估和心理疏导。
最后,陈老师还从数据质量、学习机制以及测评方法等几方面分析了目前EduGPT存在的问题与挑战。
讲座结束后,陈老师与现场听众就相关问题做了进一步交流,并勉励双学位同学在未来有机会更多参与交叉学科的科研工作。
【报告人简介】
陈琴,博士,华东师范大学计算机科学与技术学院青年研究员。研究兴趣主要包括自然语言处理、跨模态语义理解和机器学习,目前专注于信息抽取、知识表示和推理、问答系统和人机对话等相关研究。在相关领域国际顶级会议和期刊如TKDE、AAAI、IJCAI、SIGIR、EMNLP等发表论文20余篇,以项目/子课题负责人主持国家自然科学基金、省部级科研项目多项,常年担任相关学术会议期刊审稿人。
图、文:于海翔、胡杨