高级中学名校试卷
PAGE
PAGE1
辽宁省本溪市满族自治县县级重点高中协作体2024-2025学年高三二模考试语文试题
一、现代文阅读(35分)
(一)现代文阅读Ⅰ(本题共5小题,19分)
阅读下面的文字,完成下面小题。
材料一:
最近美国的AI实验室越来越发现,美国AI模型之所以算力需求很大,一个重要的原因是他们的训练素材是英文的,而英文就是个“无底洞”。
比如说“心”,它的英文是heart,“病”的英文是disease,但“心脏病”却是cardiopathy,跟心和病没有一点的关系。又如,猪的英文是pig,肉的英文是meat,但猪肉却是pork。
但你要是换成中文,“心脏”加“病”,“猪”加“肉”。你只要懂得组词的两个字是什么意思,你就知道连起来它是什么意思。
现在英文按这个逻辑,每年要新增一万多个新词,而且基本上都和旧词没什么关系。但中文就简单多了,就像是乐高积木,“心脏”加“病”是“心脏病”,“脑”加“机”是“脑机接口”,“无人”加“机”就是“无人开的飞机”,谁都能理解,对吧?
所以为什么中国模型能节省训练成本,很可能这也是原因之一。这场AI的算力对决,在秦始皇书同文、车同轨的那一刻起,可能就预示了最终的结果。
当英语在专业术语的泥潭中艰难跋涉时,汉字正以8000年文明的磅礴势能为人类推开AI时代的大门。
(摘编自《AI时代,中国或将凭借中文优势领先全球!》)
材料二:
简单说说大语言模型的训练和输出结果是怎么得来的,大语言模型的训练就像让机器阅读海量文本学习文字的组合规律,通过调整内部参数逐步形成语法和语义的组合链路关系。输入问题后,模型会根据学到的知识像猜词游戏一样,逐步预测最可能的下一个词,最终生成连贯的回答。说得更直白一些那就是,大语言模型输出的结果就是对文字的排列组合,这种组合的链路就是类似神经网络的思考链路。
大语言模型想要得到更具有逻辑性、更符合人类思考过程的结果,就需要海量的学习资料的训练和人工的纠偏,这个学习资料就是大语言模型参数量,如DeepSeekR1671B满血版,671B代表该模型具有6710亿个可训练参数,这些参数就是各类文字的不同组合内容。西方科技人员理解DeepSeek的做法后,得出一个不敢说的结论,那就是中文的原理天然适配神经网络分布式表征,在中文的机制中,每个字如同单个神经元,思考时能快速联动、自由组合、弹性十足,中文仅仅凭借3500个汉字的不同组合就让模型参数效率得到指数级提升。反观英文,现代英语单词的词汇量已经超过百万,普通人一辈子也记不完。更别说是在逻辑推理自由组合过程中产生的数据量,那更是指数级的倍增,就比如要组成一个两个字的词,中文的组合量是3500×3500=1225万种可能,而英文则是1000000×1000000=1万亿种可能。OpenAI的工程师曾半自嘲半抱怨地说:“训练GPT-5最耗时的不是算法优化,而是教会AI理解各种新兴词语,为了让AI理解这些词语的意思,工程师不得不进行海量备注。”这个现象背后的真实原因是英语单词之间没有任何关联性,难以进行简化扩充,在这个信息爆炸的时代,各种新材料,新产品、新名词、新叫法层出不穷,英文为了维持这些信息量只能不断地暴力扩充词库,形成英语学习里最难理解和学习的专业英语。
(摘编自《DeepSeek的护城河,竟然是中文!!!》)
材料三:
现代计算机诞生后,文字输入成为难题。1979年,钱伟长访问美国时,IBM的工程师宣称英文是计算机的“天选之词”,认为中国人若不放弃中文,就无法迈入计算机时代。美国人还曾用漫画嘲讽中文打字机,认为其会是世界上最大的打字机,因为汉字输入计算机困难重重。
但其实,早在20世纪30年代,林语堂就花费三十年开发出中文打字机的雏形。进入计算机时代,王永民发明了五笔输入法,当时,它被联合国官员赞誉为“二十世纪最伟大的东方魔术”。王选提出开发中文激光照排技术时,日本学者断言掌握这项技术比登月还难,可中国人还是突破了重重封锁。到了21世纪,在数码时代,英文在底层逻辑上占据主导,很多人渴望能用汉字输入代码。就在大家认为美国在人工智能时代遥遥领先时,中国创造的人工智能算法却突然站在了世界前沿。在智能时代,汉字展现出了无与伦比的优势。
首先,汉字信息量大,检索信息时,中文花费的时间仅为英文的百分之三十。比如,ChatGPT用26个字母解释“量子纠缠”,而中文仅用“量子纠缠”四个字就能表达清楚。汉字超强的信息压缩能力,让中文大模型的训练速度比英文提高了百分之四十七。
其次,中文阅读者大脑激活区域比英文阅读者多百分之十五,信息处理速度却提升了百分之二十二,这得益于汉字的形象思维特征与神经网络分布天然契合。
再者,在处理意向性指令时,中文的准确率高达百分之九十一,远高于英文和其他文字的百分之四十几。中国古诗词中