
發布
注冊
/
登錄Helsinki-NLP
關注創建者:匿名 創建時間:2021-07-28

Helsinki-NLP的實例教程
本筆記測試了Transformers專門的機器翻譯數據集Helsinki-NLP。
2 Helsinki-NLP
測試虛擬環境為tfs4,具體參數見《生成摘要(Summarization)的新方法》。2020年5月,赫爾辛基大學(University of Helsinki)的語言技術研究小組(Helsinki-NLP)向Transformers庫發布了一套大的翻譯模型數據集。這些模型使用MarianNMT框架和開放平行語料庫(OPUS)數據集進行了訓練。該模型集包括超過1000個語言對,以及169個源語言或語系對英語的翻譯,當然其中包括中英文的互譯。每個模型的權重和標記器文件約為310MB)。
3 中文->英文
測試代碼: translation-zh-to-en.py. 測試目的是把中文翻譯成英文。測試使用的句子為: "智利北部的丘基卡馬塔礦是世界上最大的露天礦之一,長約4公里,寬3公里,深1公里。" 翻譯出來的結果為"The Chuquicamata mine in northern Chile is one of the largest open-air mines in the world, some 4 km long, 3 km wide and 1 km deep."
這個句子基本上表達出原中文的意思,但把“露天礦(open pits mine)”翻譯錯了,此外這個句子也存在著明顯的語法錯誤,some前面缺少動詞引導語,沒有翻譯出“約(about, approximately)這個詞的真實含義 ”。
展開 
Helsinki-NLP的相關專題、標簽、搜索
Helsinki-NLP的最新內容
本筆記測試了Transformers專門的機器翻譯數據集Helsinki-NLP。
2 Helsinki-NLP
測試虛擬環境為tfs4,具體參數見《生成摘要(Summarization)的新方法》。2020年5月,赫爾辛基大學(University of Helsinki)的語言技術研究小組(Helsinki-NLP)向Transformers庫發布了一套大的翻譯模型數據集。