Please wait a minute...
图/表 详细信息
大语言模型赋能学生译文智能评估的实证研究
张静, 彭思锐
当代外语研究    2025, 25 (5): 85-96.   DOI:10.3969/j.issn.1674-8921.2025.05.009
摘要   (82 HTML1 PDF(pc) (1335KB)(36)  

本研究聚焦大语言模型在翻译教学中的应用,系统考察其在学生译文质量评估中的效能与局限。研究采用人工翻译质量评价标准,构建量化为主、质性为辅的双层分析框架,整合了人工评分、模型评分及评语数据。量化结果表明,大语言模型在英译汉任务的结构化维度表现稳健,但在汉译英的语义与文化维度一致性显著下降,暴露其在深层语义理解与文化适配方面的不足。质性分析进一步揭示模型生成的评语存在模板化、错误归因与创造性排斥等问题,与量化结果相互印证。基于此,研究提出人机协同的教学实践路径,强调大语言模型应作为结构化校验的辅助工具,由教师主导语义与文化评估。研究为智能化翻译评估的教育应用提供了实证支持,推动大语言模型从工具性辅助向认知协作的角色转型。


模块 构成要素 具体内容示例
身份定义 角色定位 作为专业翻译质量评估系统,您需具备语言学与翻译学双重专业背景,严格依据既定标准执行多维度质量评测
任务说明 评估维度 自然度与清晰度、文化术语准确性、语法规范性、意图忠实性、内容完整性(上传各维度具体指标描述)
评分规则 各维度10分制(0—10分),每2分差代表显著水平差异,总分加权求和
操作流程 1.文化术语定位→词表比对→错误计数
2.语法检测→错误分类加权
3.意图分析→语义相似度计算
4.信息完整性→双向匹配验证
(上传词表和参考译文)
能力要求 核心技能 ·跨文化交际能力
·语法错误模式识别
·术语数据库检索
技术工具 ·预训练语言模型(流畅度分析)
·句法分析器(复杂度检测)
·词向量模型(词汇适切性)
·命名实体识别(事实准确性)
操作限制 约束条件 ·单次错误不重复扣分
·文化术语以提供词表为基准,但不限于词表
·必须输出扣分依据与改进建议
·禁止任何创造性解释
View table in article
表1 四元结构零样本提示模板
本文的其它图/表