基本信息
文件名称:自建小规模语料库 开展化学名词教学.docx
文件大小:43.72 KB
总页数:8 页
更新时间:2025-06-25
总字数:约6.24千字
文档摘要

自建小规模语料库开展化学名词教学

摘要:化学名词是学习化学的必要工具,是化学知识传播的基础,而语料库在当今社会的研究与运用也日趋成熟、普遍。教师可基于《化学名词(第二版)》等专业词典,运用AntConc等语料库软件,自建小规模高中化学教科书语料库,构建《高中化学名词词表》,从而引导学生明确教科书语境下化学名词的正名与异名及其定义与词频。具体教学中,教师可引导学生关注正名与异名的使用语境以提高科学交流的准确性,整合化学名词定义以增进对化学名词的理解,化抽象为具体以提高理解抽象化学名词的能力,从而增强构建知识的主动性,达成更有深度的学习。

关键词:自建小规模语料库;化学名词;高中化学教学

大规模电子文本数据库又称为语料库(corpus),其数字化、规模化、自动化特征深受学者青睐,在频率统计、词汇研究、语言教学方面有着广泛的应用[1]。从20世纪70年代开始,交叉学科的理论和实践得到越来越多的重视,语料库研究不再局限于语言学与计算机科学,学科壁垒不断被打破。运用语料库相关技术和方法,服务和解决其他学科领域内的特定问题,成为当前高中学科研究的重要方向。

化学名词是学习化学的必要工具,是化学知识传播的基础。化学教科书是学科领域专家们共同研究的成果,是集体智慧的结晶。围绕化学教科书开展化学名词教学,有利于精确表达思想、节省沟通成本、提高学习效率。那么,如何契合当前教学对化学专业语言即化学名词的需求呢?笔者认为,自建小规模高中化学教科书语料库,构建《高中化学名词词表》(以下简称“《词表》”),进而在真实的语境下,打破学科固化的藩篱,开展化学名词融合教学是一条值得尝试的路径,下面具体阐述。

一、自建小规模高中化学教科书语料库,构建《词表》

(一)语料库软件选择及语料准备

AntConc是一款可供免费使用的语料库软件,它支持多语言、多文本格式,界面友好,工具丰富,可处理中英文混合文本,支持Word和PDF文件,检索和统计功能强大,利于文本挖掘,适宜用来自建小规模语料库。

我们收集现行沪科、鲁科、人教、苏教4版普通高中化学教科书(以下简称“4版教科书”),将部分内容保存为图片的PDF文件,运用WPSOffice的“PDF转Word”工具,经人工修订,形成元语料。由于语料标注对专业水平的要求高且耗时多,加之数据驱动学习注重观察真实语境,我们的研究仅使用通配符对元语料中的空格、空行进行清洗,获得了20个化学教科书文本文件。我们启动AntConc,点击File→OpenFile(s)as‘quickCorpus’→选择文本文件,生成包含238937个类符的高中化学教科书语料库文件(示例如图1所示。另:为保持原貌,图中的语言、文字或格式问题未作调整,下同)。

(二)基于词典构建《词表》

2016年正式发布的《化学名词(第二版)》(经化学名词审定委员会审定)用词符合汉语文字、构词及语法特点,它将化学名词划分为无机化学、有机化学、分析化学、物理化学、高分子化学、放射化学6类。我们将其作为验证《词表》的依据,能保证权威性和科学性。

我们运行AntConc,调用语料库文件,运用KWIC工具的AdvSearch功能,批量检索《化学名词(第二版)》中的9142条化学名词,验证通过1280条规范用词,由此构建了《词表》,并将非推荐用词,如又称或俗名等,附于对应规范用词之后。分析这些名词在《化学名词(第二版)》中各子学科收录总数的占比,我们发现:(1)无机化学,以元素及无机化学、一般化学反应及无机化学反应、无机固体化学为主;(2)有机化学,以有机化合物及其类名、生物有机化学、有机合成和有机反应为主;(3)分析化学,集中于一般术语、化学分析;(4)物理化学,集中于化学热力学、电化学、催化、物质结构、理论和计算化学、晶体化学;(5)高分子化学,集中于高分子物质、高分子加工技术和应用;(6)放射化学,虽不是普通高中化学研究的重点,但是教科书也有涉及。这就可帮助高中生了解化学学科的全貌。

二、真实语境下的化学名词数据形式

(一)教科书语境下化学名词的正名与异名

化学名词仅有一个规范名,即正名,但可能存在异名。异名包括“全称”“简称”“曾称”“俗称(俗名)”“又称”。4版教科书中没有出现“全称”,其他异名出现情况如下:“简称”出现7例,有丙烯腈-丁二烯-苯乙烯树脂(ABS树脂)、锕系元素(锕系)、加成聚合(加聚)、加成聚合物(加聚物)、聚氨基甲酸酯(聚氨酯)、马尔科夫尼科夫规则(马氏规则)、配位化合物(配合物);“曾称”出现5例,有稀有气体(惰性气体)、换位反应(复分解反应)、旋光活性(光学活性)、摩尔浓度(物质的量浓度)、烯烃换位反应(烯烃复分解反应);“俗称(俗名)”不是学术用词,虽共有97例,但仅有4例与《化学名词(第二版)》一致,具体为1,4