6个AI写高考作文,DeepSeek和Gemini并列第一,GPT-5.5垫底

6个AI写上海高考作文,语文教师打分——DeepSeek和谷歌Gemini并列第一,66分;Kimi 63分;豆包61分;阿里Qwen 58分;得分最低的是OpenAI的GPT-5.5,只有53分。

这是个有趣的对照。去年同款测试里,AI的作文还能一眼看出机器痕迹——逻辑硬、例子假、像在拼接。今年几乎每个AI出手都是“精品”,几秒生成一篇结构完整、辞藻华丽的文章。进步确实快。

但分数拉开差距,核心落在“人味”上。教师评分标准里有一条专门写:是否少空话套话、更像真人写的。AI写作文本质是模仿——它见过海量范文,知道什么结构拿分,什么开头抓眼球。但“人味”这东西,涉及真实体验、情绪起伏、对具体细节的感知,不是统计规律能编出来的。

GPT-5.5垫底,可能跟它训练数据的风格有关——更偏欧美学术话语体系,碰到中国高考作文这种要求“立意升华”“引用典故”的任务,反而容易写出泛泛的“正确废话”。DeepSeek和Gemini拿高分,说明它们在中文语境下更贴近本地教学要求——熟悉《人民日报》金句、高考满分作文套路、常见名人案例。这其实是技术本地化能力的体现。

说到底,高考作文本身就是一种高度模板化的文体。AI写得好,不意味着它真的理解了文章在表达什么,只是它把“拿分模式”拟合得更精准。真正有原创思想、情感共鸣的文章,机器仍然写不出来——至少现在还写不出来。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注