基本信息
文件名称:机器翻译方法课件.ppt
文件大小:486 KB
总页数:55 页
更新时间:2025-07-17
总字数:约1万字
文档摘要
基於規則的一類方法在機器翻譯的發展中確實起了非常重要的作用,但是,隨著研究的深入,研究者們發現人工確定的有限規則難以正確翻譯大規模的現實語句。因此,人們不斷地尋找新的方法,從而產生了基於語料庫的一類方法。所謂語料庫,就是把各類在現實當中使用的真實文本收集在一起,並不對原來的語句進行修飾潤色,這樣構成的集合稱為語料庫。顯然,機器翻譯只有對語料庫中真實句子進行翻譯研究,才有可能建立起滿足現實要求的機器翻譯系統。早期的語料庫主要是為自然語言研究提供眾多的實例,如用於詞頻統計,以後逐漸發展為對其進行大規模的語法資訊標注,如詞性標注、句法符號標注等。這樣,對語料庫進行收集、整理、加工