
發布
注冊
/
登錄遷移學習的案例
機器學習 遷移學習
二、深度學習簡介與經典網絡結構介紹
1.神經網絡簡介
2.神經網絡組件簡介
3.神經網絡訓練方法
4.卷積神經網絡介紹
5.經典網絡結構介紹
目標:深入了解神經網絡的組成、訓練和實現,掌握深度空間特征分布等關鍵概念,為深度遷移學習奠定知識基礎。
三、遷移學習基礎
1.遷移學習緒論
2.基于樣本的遷移學習
3.基于特征的遷移學習
4.基于分類器適配的遷移學習
目標:掌握遷移學習的思想與基本形式,了解傳統遷移學習的基本方法,對比各種方法的優缺點,掌握遷移學習的適用范圍。
四、深度遷移學習介紹
1.深度遷移學習概述
2.基于距離函數的深度遷移學習
3.基于對抗網絡的深度遷移學習
4.深度異構遷移學習方法介紹
5.深度領域泛化學習介紹
目標:掌握深度遷移學習的思想與組成模塊,學習深度遷移學習的各種方法,對比各種方法的優缺點,掌握深度遷移學習的適用范圍。
五、遷移學習前沿方法介紹
1.深度遷移網絡結構設計
2.深度遷移學習目標函數設計
3.全新場景下的遷移學習
目標:掌握深度遷移學習的網絡結構設計、目標函數設計的前沿方法,了解遷移學習在PDA、Source-Free DA上的應用。
六、遷移學習前沿應用
1.遷移學習在語義分割中的應用
2.遷移學習在目標檢測中的應用
3.遷移學習在行人重識別中的應用
4.圖片與視頻風格遷移
目標:掌握深度遷移學習在語義分割、目標檢測、行人重識別等任務中的應用,學習圖像/視頻風格遷移方法,了解風格遷移在實際生活中的應用。
展開 “深度學習一點也不難!”
“深度學習一點也不難!”
通常情況下,機器學習尤其是深度學習的使用往往需要具備相當的有利條件,包括一個大型的數據集,設計有效的模型,而且還需要訓練的方法——但現在,利用遷移學習就可以消除掉這些瓶頸。
作者 | Caleb Kaiser
以下為譯文:
在不久之前,為了有效地使用深度學習,數據科學團隊需要:
· 一種新穎的模型架構,很可能需要自己設計;
· 大型數據集,很可能需要自己收集;
· 大規模訓練模型的硬件或資金。
這些條件和設施成為了限制深度學習的瓶頸,只有少數滿足這些條件項目才能應用深度學習。
然而,在過去的幾年中,情況發生了變化。
我們看到用戶開始試用基于深度學習的新一代產品,而且與以往不同的是,這些產品使用的是以前沒有出現過的任何一種模型架構。
這種增長背后的驅動力是遷移學習(transfer learning)。
什么是遷移學習?
從廣義上講,遷移學習的思想是專注于存儲已有問題的解決模型(例如識別照片中的花朵),并將其利用在其他不同但相關問題上(例如識別皮膚中的黑素瘤)。
遷移學習有多種方法,但其中一種方法——微調法(finetuning)得到了廣泛采用。
在這種方法中,團隊采用預先訓練好的模型,然后通過刪除或重新訓練模型的最后一層,將其用于新的相關任務。例如,AI Dungeon是一款開放世界的文字冒險游戲,因其AI生成的生動形象的故事而廣為傳播:
注意,AI Dungeon不是Google研究實驗室開發的項目,只是一名工程師構建的黑客馬拉松項目。
AI Dungeon的創建者Nick Walton并沒有從零開始設計模型,而是采用了最新的NLP模型(OpenAI GPT-2),然后對其進行微調來設置自己的冒險文字。
展開 基于深度學習的無人機航拍目標檢測研究綜述
表3 遷移學習的類型
Table 3 Types of transfer learning
對于深度學習而言,遷移學習的過程為利用相關領域的知識通過深度神經網絡進行目標域中模型的訓練。按照學習的方法不同可將深度遷移學習分為3類:基于實例的遷移學習、基于特征的遷移學習和基于模型的遷移學習。
基于實例的遷移學習通過調整權重來增加目標域有用樣本的權重,以此補充目標域訓練數據,這種方法目前使用較少;基于特征的遷移學習通過挖掘源域數據中可以覆蓋目標域數據的部分,實現不同特征空間之間的知識遷移,在目標檢測任務比較常見的是特征提取器的遷移;基于模型的遷移學習需要找到源域和目標域模型之間可以共享的參數或知識。
遷移學習在目標檢測領域取得了一些不錯的成果。Pan等[38]提出了一種基于遷移學習和幾何特征約束的級聯CNN網絡模型,在較少的遙感圖像樣本下實現了高精度的檢測;Yuan等[39]在大中小3種規模的數據集之間使用兩次遷移學習,實現了較高精度的夜間航拍車輛檢測;Wang等[40]使用深度遷移學習的方法成功地將在規模的仿真SAR圖像數據集上學習到的知識遷移到實測SAR圖像上,提高了數據稀缺下目標識別的準確率。但遷移學習的順利進行是有條件限制的,需要保證源域和目標域之間具有共同點,具有一定的相似性和關聯性[41-42]。
2.3 無人機目標檢測算法
計算機視覺領域中基于深度學習的目標檢測方法在自然場景領域取得了巨大的成功,這對于無人機目標檢測任務是值得借鑒和參考的,很多國內外研究提出了效果顯著的改進算法。本文從無人機影像的4個特點出發,分析比較了一些具有代表性的方法,表4給出了部分算法在DOTA數據集上的實驗結果,表5為不同算法的優缺點對比。
展開 用于圖像分類的頂級預訓練模型
主要特點:
使用強化學習自動設計架構。
高精度和高效的性能。
應用:通用圖像分類和遷移學習。
8. Xception (極限盜夢空間)
概述:Xception 由 Google 開發,是 Inception 架構的擴展,具有深度可分離卷積。
主要特點:
完全卷積架構。
用于提高性能的深度可分離卷積。
應用:通用圖像分類和遷移學習。
9. 亞歷克斯網
概述:AlexNet 由 Alex Krizhevsky 開發,是最早普及 CNN 在圖像分類中的使用的深度學習模型之一。
主要特點:
具有 8 層的簡單架構。
ReLU 激活函數和 dropout 正則化。
應用:通用圖像分類和歷史基準。
10. 視覺變形金剛 (ViT)
概述:Vision Transformers 由 Google 開發,將最初為 NLP 設計的 Transformer 架構應用于圖像分類。
主要特點:
Transformer 編碼器架構。
使用大型數據集和計算資源進行良好擴展。
應用:一般圖像分類和大規模視覺任務。
用于圖像分類的預訓練模型的優勢
減少訓練時間:預訓練模型顯著縮短了訓練時間。由于它們已經在大型數據集上進行了訓練,因此只需要針對特定任務進行微調。這種效率使開發人員能夠更快地部署模型。
提高準確性:這些模型已經在大量數據上進行了訓練,使它們能夠很好地泛化。因此,與從頭開始訓練的模型相比,它們通常在各種任務上實現更高的準確性。
展開 
基于大數據模型的數字孿生建模方法
圖3 深度學習算法的分類
③遷移學習:指一種學習或學習的經驗對另一種學習的影響,以深度卷積神經網絡為基礎,通過修改一個已經經過完整訓練的深度卷積神經網絡模型的最后幾層連接層,再使用針對特定問題而建立的小數據集進行訓練,以使其能夠適用于一個新問題。其放寬了傳統機器學習中的兩個基本假設,目的是遷移已有的知識來解決目標領域中僅有少量甚至沒有有標簽樣本數據的學習問題。圖4給出了傳統機器學習和遷移學習過程的差異。
圖4 遷移學習與機器學習的差異
2.大數據建模的未來發展趨勢
從技術發展的角度來講,大數據建模一方面將會呈現特征工程與特征學習算法相結合的趨勢,提升大數據建模的準確性;另一方面將會越來越多地探索無監督學習的算法性能提升和應用,解決數據標記的問題同時,賦予機器真正的類人學習行為。
從技術應用的角度來講,由于物理建模在進行復雜系統建模是存在的不準確的問題,將會越來越多地將新一代人工智能的算法與數控機床相結合,以開辟新的技術路線,提升預測的穩定性與準確性,使得機床具有更好知識學習、積累與應用的能力。
因此,大數據建模一方面本身的內涵和外延將會得到極大的擴展和深化,另一方面,其將會在數控機床領域得到全面、廣泛而深入的應用。
展開 無人車行駛環境圖像的幾何測距
首先,利用遷移學習的方法改進Tiny-YOLOv2網絡模型,對需識別的物體進行訓練與檢測,標記物體并定位物體在圖像中的位置。其次,提出了一種通過物體分類、邊緣檢測及邊緣擬合的方法,進一步提取物體的圖像信息。最后,建立了一種基于空間幾何理論的測距模型,結合物體先驗信息實現了物體的距離測量。該方法在4 m以內88%以上的測量值誤差不超過0.2 m,同時測量誤差并沒有隨著距離的增加而有較大變化。
關鍵詞:幾何測距;單目視覺;卷積神經網絡;遷移學習;圖像分割
前言
視覺傳感器具有提取信息量大、信息完整、價格便宜等優點,故成為獲取周圍環境信息的重要手段之一。由于圖像存在深度缺失以及背景環境干擾等問題,通過單目攝像頭對物體進行準確測距的方法一直是視覺研究的難點之一,目前主流的檢測方法有:使用運動圖像中的多個匹配點對物體深度進行估測[1-5];通過尋找穩定參照物的方法獲得距離信息[6-7];通過固定攝像頭位姿狀態下的物體距離檢測方法[8-10];通過卷積神經網絡檢測物體在圖片中的大概尺寸,結合先驗信息進行估測[11-13]。這些方法都有一定的可行性,但都存在精度低、適用性窄、容易受環境干擾以及步驟繁瑣等問題。利用卷積神經網絡預先提取所測物體位置,再經過圖像分割得到所測物體信息的方法,減少了由于外界環境的影響而帶來的誤差,具有更好的適用性、可靠性和抗干擾能力。
針對單目物體測距中深度缺失、背景干擾與前景分割困難等問題,提出了一種基于幾何測距模型的物體測距方法。首先,使用卷積神經網絡對物體進行標記并定位物體在圖片中的位置,為了提高訓練效率與準確率,在此利用遷移學習的方法,使用Tiny-YOLOv2網絡模型加載已訓練完成的權重,對需識別的物體進行訓練與檢測,之后根據訓練結果對網絡模型進行改進,并對其參數進行調整,獲得更為適合于當前環境下的物體檢測卷積模型。
展開 【技術】基于DTEmpower的旋轉機械故障診斷
采用AdaBN遷移學習算法分析不同工況下故障識別率,模型訓練中以一個工況作為訓練集,另一個工況作為測試集,對特征權重進行迭代修正,實現泛化的目的。實驗結果如表4所示,可以看出對于無標簽的變工況診斷,模型仍具有較高的分類識別率。
表4 江南大學數據集不同工況遷移學習預測準確率
總結
DTEmpower針對有標簽、無標簽及樣本不均衡等不同場景下的故障診斷均具有很好的診斷效果,為客戶提供了使用簡單、功能強大的實驗平臺,提供特征提取、特征選擇和模型訓練一站式的數據建模解決方案。
《使用R的線性回歸:數據建模導論,第二版》
你將學
到的內容
使用 PyTorch 庫
搭建深度學習環境 學習構建圖像分類深度學習模型
使用卷積神經網絡進行遷移學習
理解如何使用 PyTorch 進行自然語言處理
使用循環神經網絡分類
文本 理解如何在多處理器和分布環境中
優化 訓練、優化和部署神經網絡以實現最大準確性和性能
學習部署生產準備模型
這本書適合誰
熟悉機器學習但對深度學習還不熟悉的開發者和數據科學家,或希望用PyTorch訓練深度學習模型的現有深度學習從業者,都會覺得這本書很有用。具備Python編程知識將是額外的優勢,而此前則無需接觸PyTorch。
?
展開 基于Python深度學習的鯊魚識別分類系統
利用機器學習算法對這些數據進行挖掘和分析,可以為鯊魚研究提供寶貴的補充信息,同時也促進了科學研究與公眾參與的結合。
研究方法
數據庫構建:研究團隊創建了一個包含53,345張鯊魚圖片的數據庫,涵蓋了219種鯊魚。這些圖片主要來源于社交媒體、公民科學項目、用戶提交和其他電子檔案。
Shark Detector開發:開發了一個名為“Shark Detector”的軟件包,它集成了對象檢測和圖像分類模型。該軟件包使用遷移學習和卷積神經網絡(CNN)技術來自動識別和分類視頻中和圖像中的鯊魚。
模型組成:
Shark Locator (SL):對象檢測模型,用于在圖像和視頻中定位鯊魚并繪制邊界框。
Shark Identifier (SI):二元排序模型,用于從混合圖像集中篩選出鯊魚圖像。
Shark Classifiers (SCs):多類模型,用于將鯊魚圖像分類到屬和物種級別。
訓練與驗證:使用來自sharkPulse的數據和其他來源的圖像訓練模型。通過遷移學習,利用預訓練的網絡(如VGG16和DenseNet201)來提高訓練效率和準確性。
數據增強:采用圖像增強技術,如平移、剪切、縮放和旋轉,提高模型的泛化能力。
圖1 鯊魚探測器系統由對象檢測和分類軟件包組成,以循序漸進的方式達到最佳效果。此外,通過檢測鯊魚主體,鯊魚定位器可以合成鯊魚識別器和鯊魚分類器模型所需的剪切鯊魚圖像,作為新的訓練數據補充到sharkPulse檔案中。視頻按照定位、識別和分類的順序進行處理。異構數據挖掘數據集按照先識別后分類的順序進行處理。
圖2 SL物體探測模型根據鯊魚出現的置信度繪制方框。
展開 【篇三】生物醫藥領域發文難?(CADD、ROSETTA、多組學)一區SCI墊腳石已備好!
目標:從常見的多組學聯合分析策略出發,如轉錄組+代謝組,蛋白組+代謝組等,對常用的數理統計分析方法進行介紹,之后學習如何利用數據庫如KEGG等進行生物功能富集分析,結合機器學習方法進行生物標志物的挖掘,疾病預測以及生物分子作用機制等。
常用生物組學實驗與分析方法,如轉錄組學,代謝組學常用組學數據庫介紹,如TCGA,PathBank,HMDB,KEGG
Python批量處理組學數據-歸一化處理,差異分析,相關性分析
生物功能分析:GO 功能分析、代謝通路富集、分子互作等
基于轉錄組學的差異基因篩選,疾病預測
基于差異基因,聯合代謝組學分析疾病分子發生機制
? 組學數據可視化,如火山圖,t-SNE降維,代謝通路網絡分析
? 組學特征(基因,蛋白,代謝物)選擇(隨機森林分析)
? 單細胞轉錄組學數據分析及可視化分析
2 案例實踐三:(包含以下內容)
2 轉錄組+代謝組的多組學分析胃癌
2 從海量的數據中篩選出關鍵基因、代謝物及代謝通路
2 深度解析胃癌腫瘤標志物解釋腫瘤發生發展的復雜性和整體性案例
深度學習神經網絡進階(入門及實踐)
目標:學習前沿神經網絡如卷積神經網絡,循環神經網絡,注意力機制,自編碼器,圖神經網絡在生物組學及藥物篩選的應用,遷移學習應用等。
卷積神經網絡基礎及其應用(影像組學)
循環神經網絡基礎及其應用(蛋白組學)
注意力機制基礎及其應用
自編碼器基礎及其應用(轉錄組學)
圖神經網絡基礎及其應用(代謝組學)
遷移學習、深度學習框架——transformer的應用
2 案例實踐四:基于(變分)自編碼器進行藥物/代謝物分子生成
深度學習在組學數據藥物發現的應用 (入門及實踐)
目標:基于基因表達特征建立疾病與小分子藥物之間的關聯關系,運用轉錄組學,蛋白組學,機器學習算法進行藥物重定位。
展開 集成多組學數據的機器學習在生物醫學中的應用
常用生物組學實驗與分析方法,如轉錄組學,代謝組學常用組學數據庫介紹,如TCGA,PathBank,HMDB,KEGG
Python批量處理組學數據-歸一化處理,差異分析,相關性分析
生物功能分析:GO 功能分析、代謝通路富集、分子互作等
基于轉錄組學的差異基因篩選,疾病預測
基于差異基因,聯合代謝組學分析疾病分子發生機制
? 組學數據可視化,如火山圖,t-SNE降維,代謝通路網絡分析
? 組學特征(基因,蛋白,代謝物)選擇(隨機森林分析)
? 單細胞轉錄組學數據分析及可視化分析
2 案例實踐三:(包含以下內容)2 轉錄組+代謝組的多組學分析胃癌2 從海量的數據中篩選出關鍵基因、代謝物及代謝通路2 深度解析胃癌腫瘤標志物解釋腫瘤發生發展的復雜性和整體性案例
深度學習神經網絡進階(入門及實踐)
目標:學習前沿神經網絡如卷積神經網絡,循環神經網絡,注意力機制,自編碼器,圖神經網絡在生物組學及藥物篩選的應用,遷移學習應用等。
卷積神經網絡基礎及其應用(影像組學)
循環神經網絡基礎及其應用(蛋白組學)
注意力機制基礎及其應用
自編碼器基礎及其應用(轉錄組學)
圖神經網絡基礎及其應用(代謝組學)
遷移學習、深度學習框架——transformer的應用
2 案例實踐四:基于(變分)自編碼器進行藥物/代謝物分子生成
深度學習在組學數據藥物發現的應用 (入門及實踐)
目標:基于基因表達特征建立疾病與小分子藥物之間的關聯關系,運用轉錄組學,蛋白組學,機器學習算法進行藥物重定位。
展開 
【產品技術】中科行智 | GIVS視覺平臺發布AI訓練和部署工具包
// 模型遷移學習
模型遷移學習功能可對已訓練模型進行樣本追加訓練,減少重復操作時間,降低能源損耗,快速可持續提高模型精準度。
// 一鍵導出快速部署
GIVS AI訓練平臺一鍵導出網絡模型后,可在GIVS AI運行端快速調用,也可以與GIVS AI運行端其他傳統圖像處理工具融合使用,完成復雜的視覺檢測項目。
LS-DYNA人工智能多尺度計算技術及其在注塑成型復合材料領域的應用
為解決這一問題,LS-DYNA提出遷移學習方法,利用遷移學習方法,我們不再需要為不同纖維取向和體積分數訓練大量網絡,而是只需考慮三種有極端纖維取向狀態,且體積分數相同的RVE幾何模型,包括隨機三維、隨機二維和單向的纖維取向。從這三種有極端纖維取向狀態的RVE數據可以提取出不同纖維取向對復合材料的影響。此外我們將考慮單向纖維排布且體積分數更大的,第四種RVE幾何結構,目的是提取出纖維體積分數對復合材料的的影響。
對于每種微觀結構重構RVE模型,開展線彈性有限元仿真、采集材料剛度,包括纖維剛度、基體剛度和復合材料剛度,然后用這個訓練數據集來開展DMN離線訓練,以得到優化的DMN網絡參數,在完成離線訓練后,再對四個經過訓練的DMN網絡進行簡單的參數插值,就可以快速地生成與新的材料微觀結構相對應的新的DMN網絡。這里新的微觀結構可包含在離線訓練階段,沒有接觸過的纖維取向或體積分數。
上圖展示了使用訓練后的DMN網絡對兩個短纖維微觀結構開展在線預測,這兩個RVE模型與離線訓練階段采用的四個RVE模型擁有不同的微結構。圖中可以看到,非線性有限元計算與深度材料網絡計算得到的宏觀應力應變結果十分吻合,但是深度材料網絡的計算速度快得多,只需1秒鐘,而高保真有限元計算則需要花費30-40個小時。
基于DMN方法,LS-DYNA為短纖維增強復合材料開發出了一個DMN數據庫,數據庫內包含訓練好的深度材料網絡,且已被鏈接到LS-DYNA有限元求解器,可用于短纖維增強復合材料產品的多尺度結構分析。
展開 人工智能是如何處理數據的?
代表的算法大致包括: 深度學習,包括大部分常見的模型如cnn/rnn/dbn,也包括遷移學習等 某些無監督學習算法,如主成分分析(PCA)通過對數據轉化而使得輸入數據更有意義 某些樹模型可以自動的學習到數據中的特征并同時作出預測 特征工程:模型依賴人為處理的數據特征,而模型的主要任務是預測,比如簡單的線性回歸期待良好的輸入數據(如離散化后的數據) 需要注意的是,這種歸類方法是不嚴謹的,僅為了直觀目的而已。并沒有一種劃分說a算法是表示學習,而b算法不是,只是為了一種便于理解的劃分。
因此,大部分的模型都處于純粹的表示學習和純粹的依賴人工特征之間,程度不同而已,很少有絕對的自動學習模型。
那么好奇的讀者會問:
1. 是不是自動的特征抽取(表示學習)總是更好?
答案是不一定的:
在數據量不夠的時候,自動特征抽取的方法往往不如人為的特征工程。
當使用者對于數據和問題有深刻的理解時,人工的特征工程往往效果更好。
一個極端的例子是,在kaggle比賽中的特征工程總能帶來一些提升,因此人工的特征抽取和處理依然有用武之地。
同時也值得注意,表示學習的另一好處是高度抽象化的特征往往可以被應用于相關的領域上,這也是我們常說的遷移學習(transfer learning)的思路。比如有了大量貓的圖片以后,不僅可以用于預測一個物體是不是貓,也可以用于將抽取到的特征再運用于其他類似的領域從而節省數據開銷。
2. 特征學習(表示學習),特征工程,特征選擇,維度壓縮之間有什么關系?
從某個角度來看,表示學習有“嵌入式的特征選擇”(embedded feature selection)的特性,其表示學習嵌入到了模型中。
展開 LS-DYNA人工智能多尺度計算技術及其在注塑成型復合材料領域的應用
為解決這一問題,LS-DYNA提出遷移學習方法,利用遷移學習方法,我們不再需要為不同纖維取向和體積分數訓練大量網絡,而是只需考慮三種有極端纖維取向狀態,且體積分數相同的RVE幾何模型,包括隨機三維、隨機二維和單向的纖維取向。從這三種有極端纖維取向狀態的RVE數據可以提取出不同纖維取向對復合材料的影響。此外我們將考慮單向纖維排布且體積分數更大的,第四種RVE幾何結構,目的是提取出纖維體積分數對復合材料的的影響。
對于每種微觀結構重構RVE模型,開展線彈性有限元仿真、采集材料剛度,包括纖維剛度、基體剛度和復合材料剛度,然后用這個訓練數據集來開展DMN離線訓練,以得到優化的DMN網絡參數,在完成離線訓練后,再對四個經過訓練的DMN網絡進行簡單的參數插值,就可以快速地生成與新的材料微觀結構相對應的新的DMN網絡。這里新的微觀結構可包含在離線訓練階段,沒有接觸過的纖維取向或體積分數。
上圖展示了使用訓練后的DMN網絡對兩個短纖維微觀結構開展在線預測,這兩個RVE模型與離線訓練階段采用的四個RVE模型擁有不同的微結構。圖中可以看到,非線性有限元計算與深度材料網絡計算得到的宏觀應力應變結果十分吻合,但是深度材料網絡的計算速度快得多,只需1秒鐘,而高保真有限元計算則需要花費30-40個小時。
基于DMN方法,LS-DYNA為短纖維增強復合材料開發出了一個DMN數據庫,數據庫內包含訓練好的深度材料網絡,且已被鏈接到LS-DYNA有限元求解器,可用于短纖維增強復合材料產品的多尺度結構分析。
展開