Please wait a minute...
图/表 详细信息
大语言模型赋能学生译文智能评估的实证研究
张静, 彭思锐
当代外语研究    2025, 25 (5): 85-96.   DOI:10.3969/j.issn.1674-8921.2025.05.009
摘要   (82 HTML1 PDF(pc) (1335KB)(36)  

本研究聚焦大语言模型在翻译教学中的应用,系统考察其在学生译文质量评估中的效能与局限。研究采用人工翻译质量评价标准,构建量化为主、质性为辅的双层分析框架,整合了人工评分、模型评分及评语数据。量化结果表明,大语言模型在英译汉任务的结构化维度表现稳健,但在汉译英的语义与文化维度一致性显著下降,暴露其在深层语义理解与文化适配方面的不足。质性分析进一步揭示模型生成的评语存在模板化、错误归因与创造性排斥等问题,与量化结果相互印证。基于此,研究提出人机协同的教学实践路径,强调大语言模型应作为结构化校验的辅助工具,由教师主导语义与文化评估。研究为智能化翻译评估的教育应用提供了实证支持,推动大语言模型从工具性辅助向认知协作的角色转型。


维度 方向 绝对一致性 趋势关联
ICC值 95% CI 显著性(p) 相关性(r) 显著性(p)
1.自然与清晰 英→汉 0.695c [0.44, 0.83] <0.01** 0.590** <0.001
汉→英 0.224c [-0.17, 0.52] <0.01** 0.341** 0.005
2.语法与词汇 英→汉 0.537c [0.25, 0.71] <0.01** 0.512** <0.001
汉→英 0.204c [-0.16, 0.47] 0.1 0.199 0.106
3.意图与背景 英→汉 0.255c [-0.18, 0.56] <0.01** 0.399** 0.001
汉→英 -0.019c [-0.12, 0.11] 0.63 -0.046 0.713
4.内容与信息 英→汉 0.632c [0.40, 0.77] <0.01** 0.498** <0.001
汉→英 0.323c [-0.16, 0.61] <0.01** 0.348** 0.004
5.文化与术语 英→汉 0.802c [0.67, 0.88] <0.01** 0.692** <0.001
汉→英 0.598c [0.35, 0.75] <0.01** 0.434** <0.001
总分 英→汉 0.811c [0.69, 0.88] <0.01** 0.733** <0.001
汉→英 0.257c [-0.16, 0.54] p=0.01* 0.339** 0.005
View table in article
表3 人机评分一致性对比
本文的其它图/表