三個庫更新到了最新版本---Transformers, BERTopic和Gensim

1 引言

對于任何代碼或軟件, 如果開發出來不繼續維護和更新,那么這樣的工具是沒有發展潛力的. 目前使用的幾個主要庫最近幾天都釋放了新的版本, 包括transformers, bertopic和gensimm,因此更新了相應的運行環境. 


Transformers

2021年8月31日, 發布了transformers 4.10.0, 主要使用它的GPT2文本生成功能和英漢互譯功能.

不得已而為之---CPU下使用gpt2-large模型進行微調訓練

GeotechSet數據集在GPT2上的訓練過程

三個庫更新到了最新版本---Transformers, BERTopic和Gensim的圖1

3 Bertopic

2021年9月1日, 發布了bertopic 0.9.1, 主要用它進行主題模擬. 

BERTopic(V0.9.0)主題模擬技術


4 Gensim

2021年8月30日, 發布了gensim 4.1.0, 主要使用它的Word2Vec功能;

語義相似模型(Doc2Vec)在雙語教學中的應用


5 Spacy

2021年8月20日, 發布了spacy 3.1.2, 主要使用基于這個庫的sense2Vec和pytextrank.

sense2vec---基于語境的詞向量(Contextually-keyed word vectors)

PyTextRank---文本關鍵字(keywords)的自動取出



登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP