海洋科技名词规范化与ChatGPT:应用前景、困境和建议
吴进冯劭华张展昝栋
摘要:海洋科技名词规范化工作对于海洋科学研究具有重要意义。文章通过将海洋科技名词规范化的工作方面与ChatGPT的技术要点进行结合分析,探讨ChatGPT在海洋科技名词规范化工作中的应用前景,探究应用困境,并给出应用建议。
中图分类号:H083;TP391.1?文献标识码:A
文章编号:1004-4914(2023)06-227-02
二、海洋科技名词规范化应用ChatGPT的前景
作为人工智能生成内容技术突破式发展的代表性成果,ChatGPT自身具备诸多技术优点,结合海洋科技名词规范化工作特点进行分析,ChatGPT可在如下两大方面赋能科技名词规范化工作。
(一)ChatGPT赋能海洋科技名词提取
ChatGPT作为一款聊天机器人程序,在自然语言处理技术上实现了突破式发展运用,实现了自然语言处理的技术飞跃[3],用户与ChatGPT进行交流时甚至觉察不到正在与机器对话[4]。同时,经过良好预训练的ChatGPT具备优秀的总结生成能力,且GPT-4模型的文字处理能力较GPT-3.5大幅提升,上述两大技术优势可以极大赋能文献阅读工作。工作人员只需将收集好的海洋科技类文献输入ChatGPT,ChatGPT即可对海洋科技领域的专业术语进行识别,并通过学习和分析大量的海洋科技文献,理解海洋科技主题词的使用方式和语境,从而生成并输出相关规范化的主题词信息。
2.ChatGPT赋能多语种文献信息处理。目前OpenAI尚未明确公布ChatGPT掌握的语种数量。但是,通过OpenAI官方网站公开的相关信息可以确认ChatGPT至少掌握了26种语言[5]。高质量的海洋科技文献以SCI收录文献为主,辅之部分中文、德语、法语等其他语种文献。多语种文献的人工处理严重依赖于工作人员的第二语言素养,语言不通的情形下,无法有效提取文献主题词信息。ChatGPT具备的多语种优势可以有效赋能多语种的海洋科技文献处理工作,使海洋科技名词规范化工作无需受制于工作人员的第二语言素养。
(二)ChatGPT赋能海洋科技名词推广宣传
海洋科技名词规范化的一个重要作用是统一学术词汇表达,避免各科研人员使用不同的学术表述,从而利于学术交流。如何做好海洋科技名词的推广宣传工作,确保科研人员了解、掌握并使用规范化的海洋科技名词具有重要的现实意义。ChatGPT可以从两大方面助力海洋科技名词推广宣传工作。一是可以借助ChatGPT生成推广宣传文案。海洋科技名词规范化工作完成后,工作成果不能束之高阁,面向广大科研工作者的推广宣传工作随即成为工作重点。基于高质量预训练的ChatGPT具备出色的文字生成能力,可以帮助相关管理部门生成行之有效、特色鲜明的推广文案,助力海洋科技名词规范化工作成果的宣传推广。二是助力海洋科技名词普及。将规范化的海洋科技名词输入ChatGPT进行针对性训练,可以让ChatGPT掌握最新的海洋科技名词。基于ChatGPT庞大的用户数量,ChatGPT在回答用户海洋科技领域的提问时使用标准有效的主题词进行信息组织输出的过程也是将主题词广泛推广普及的过程。同时,ChatGPT还可以对用户输入的信息进行非标准术语的识别和纠正,从而帮助科研人员避免使用不准确或非标准的术语,这也是将最新的海洋科技名词进行有效宣传推广的途径。
三、海洋科技名词规范化应用ChatGPT的困境
ChatGPT在凭借技术优势赋能海洋科技名词规范化的同时,还因自身存在的技术缺陷给海洋科技名词规范化工作应用ChatGPT带来一定的挑战。
(一)信息安全与保护问题
(二)信息准确性
有学者指出,“人的难题对于人工智能来说很容易,人的简单问题对人工智能来说很难。”莫拉维克悖论在ChatGPT上依然成立[7]。对于1000是否大于1062这样的简单数理逻辑问题,ChatGPT仍会给出错误回答[7]。这一技术缺陷存在投射到海洋科技名词规范化工作中的可能性,造成ChatGPT在生成海洋科技名词时出现错误或不准确的情况。
四、海洋科技名词规范化应用ChatGPT的建议
(一)打造定制化的海洋科技名词规范化ChatGPT
定制化的用于海洋科技名词规范化工作的ChatGPT可以从两方面着手,一是构建海洋科技名词专题语料库。《海洋科技名词》已发行2版,目前已积累了大量标准化的海洋科技主题词,将现有的海洋科技名词汇集成专题训练语料库在技术上是可行的。专业化的语料库可以对大语言模型进行针对性训练。二是进行定制化预训练。定制化预训练需要联手研发企业,各自发挥专长进行训练模型的设计和研发。基于专题语料库和专业预训练的ChatGPT会更加适合处理海洋科技领域的大规模数据和信息,用于生成海洋科技名词时具备更高的可靠性。
(二)结合专家审