Please wait a minute...
图/表 详细信息
大语言模型赋能学生译文智能评估的实证研究
张静, 彭思锐
当代外语研究    2025, 25 (5): 85-96.   DOI:10.3969/j.issn.1674-8921.2025.05.009
摘要   (82 HTML1 PDF(pc) (1335KB)(36)  

本研究聚焦大语言模型在翻译教学中的应用,系统考察其在学生译文质量评估中的效能与局限。研究采用人工翻译质量评价标准,构建量化为主、质性为辅的双层分析框架,整合了人工评分、模型评分及评语数据。量化结果表明,大语言模型在英译汉任务的结构化维度表现稳健,但在汉译英的语义与文化维度一致性显著下降,暴露其在深层语义理解与文化适配方面的不足。质性分析进一步揭示模型生成的评语存在模板化、错误归因与创造性排斥等问题,与量化结果相互印证。基于此,研究提出人机协同的教学实践路径,强调大语言模型应作为结构化校验的辅助工具,由教师主导语义与文化评估。研究为智能化翻译评估的教育应用提供了实证支持,推动大语言模型从工具性辅助向认知协作的角色转型。


维度 ICC值 平均标准差 偏度/峰度
英→汉 汉→英 英→汉 汉→英 英→汉 汉→英
自然与清晰 0.67 0.58 0.46 0.45 1.333333 -0.97368
语法与词汇 0.65 0.67 0.85 0.68 0.907407 0.088889
意图与背景 0.61c 0.53c 0.56 0.52 0.04/-0.04 0.01/-0.47
内容与信息 0.45c 0.37c 0.83 0.66 0.333333 0.11/0.29
文化与术语 0.67c 0.60c 0.84 0.59 0.918919 -1
View table in article
表2 不同任务方向下ICC值与统计特征对比
本文的其它图/表