
發布
注冊
/
登錄生成對抗網絡的案例
生成對抗網絡的用例
圖像合成:從給定的數據分布(如人臉、風景或動物)生成新的逼真圖像。
文本到圖像合成:從文本描述(如場景描述、對象描述或屬性)生成圖像。
圖像到圖像轉換:將圖像從一個域轉換到另一個域,例如將灰度圖像轉換為彩色、更改場景的季節或將草圖轉換為逼真的圖像。
異常檢測:識別數據中的異常或異常值,例如檢測金融交易中的欺詐、檢測網絡入侵或識別醫學成像中的醫療狀況。
數據增強:增加用于訓練深度學習模型的數據集的大小和多樣性,例如在計算機視覺、語音識別或自然語言處理中。
視頻合成:從給定的數據分布(例如人類動作序列、動物行為或動畫序列)生成新的逼真視頻序列。
音樂合成:從給定的數據分布(如音樂流派、風格或樂器)生成新的原創音樂。
3D 模型合成:從給定的數據分布(例如對象、場景或形狀)生成新的逼真 3D 模型。
生成對抗網絡 (GAN) 最流行的是從給定的圖像數據集生成圖像,但除此之外,GAN 現在還用于各種應用。這些是一類神經網絡,具有一個鑒別器塊和一個生成器塊,它們協同工作,除了對樣本類別進行分類或預測之外,還能夠生成新樣本。
一些新發現的 GAN 用例包括:
安全:事實證明,人工智能對許多行業來說都是一個福音,但它也受到網絡威脅問題的困擾。事實證明,GAN 對處理對抗性攻擊有很大幫助。對抗性攻擊使用各種技術來欺騙深度學習架構。通過創建虛假示例并訓練模型來識別它們,我們可以應對這些攻擊。
使用 GAN 生成數據:數據是任何深度學習算法中最重要的關鍵。一般來說,數據越多,任何深度學習算法的性能就越好。但是在許多情況下,例如健康診斷,數據量受到限制,在這種情況下,需要生成高質量的數據。正在使用 GAN 的用途。
隱私保護: 在許多情況下,我們的數據需要保密。這在國防和軍事應用中特別有用。
展開 使用 Keras 庫構建生成對抗網絡 ¥2
<div contenteditable="false" width="100%">
演示如何使用 Keras 庫構建生成對抗網絡。使用的數據集是預加載到 Keras 中的 CIFAR10 Image 數據集。您可以在此處閱讀有關數據集的信息。
</div><div contenteditable="false" width="100%">
<br>
</div><p><br></p>
展開 生成式對抗網絡 (GAN) |簡介
?
生成對抗網絡 (GAN) 由 Ian Goodfellow 于 2014 年首次提出。GAN 是一類功能強大的神經網絡,用于無監督學習。GAN 可以創造任何東西,無論你提供給他們什么,因為它是 Learn-Generate-Improve。要首先了解 GAN,您必須對
卷積神經網絡知之甚少。如果將圖像饋送到 CNN,CNN 經過訓練可以根據圖像的標簽對圖像進行分類,它會逐個像素分析圖像并通過 CNN 隱藏層中存在的節點,作為輸出,它會告訴圖像是關于什么的或它在圖像中看到什么。例如:如果 CNN 經過訓練對狗和貓進行分類,并且圖像被提供給該 CNN,它可以判斷該圖像中是狗還是貓。因此,它也可以稱為分類算法。GAN 有何不同?GAN 可以分為兩部分,即 Generator 和 Discriminator。鑒別器–GANs 的這一部分可以被認為類似于 CNN 的作用。判別器是一個卷積神經網絡,由許多隱藏層和一個輸出層組成,這里的主要區別是 GAN 的輸出層只能有兩個輸出,這與 CNN 不同,CNN 可以有相對于它訓練的標簽數量的輸出。判別器的輸出可以是 1 或 0,因為為此任務專門選擇了激活函數,如果輸出為 1,則提供的數據是真實的,如果輸出為 0,則將其稱為假數據。Discriminator 在真實數據上進行訓練,因此它學會識別實際數據的外觀以及數據應該將哪些特征歸類為真實數據。 發電機–從名稱本身,我們可以理解它是一種生成算法。Generator 是一個逆卷積神經網絡,它的作用與 CNN 完全相反,因為在 CNN 中,實際圖像作為輸入給出,分類標簽預期作為輸出,但在 Generator 中,隨機噪聲(具有一些確切值的向量)作為該逆 CNN 的輸入,實際圖像預期作為輸出。簡單來說,它利用自己的想象力從一段數據中生成數據。
展開 基于深度學習的老照片修復系統
可生成安裝程序(.msi),便于發布與部署。
5.4 系統特點
?免安裝:一鍵運行.exe文件即可使用;
?操作簡便:圖形界面設計直觀,適合非技術用戶;
總結
本項目結合深度學習、生成對抗網絡(GANs)、圖像處理算法和大規模數據集,實現自動修復老照片,最終生成更清晰、色彩自然、無劃痕的復原照片。
最后,有相關需求歡迎通過公眾號“320科技工作室”與我們聯絡。

AI 憑空捏造“真人面孔”,婚戀網站的“美女照騙”更不靠譜了?
2015年,Google把自家生成圖片的技術 Inceptionism 開源化,稱之為 Deep Dream ,一個原本用來將圖片分類的AI,在導入圖片之后,選擇某一層神經網路(Google 的神經網路有 10-30 層)進行重復處理的次數和變形的程度,就能獲得一張非常具有藝術感的圖片。
全球圖形技術和數字媒體處理器行業領導廠商英偉達(Nvidia)在上周五發布一則消息表示,生成對抗網絡(GAN)的一類算法可以整合不同的面孔,將兩個競爭性的神經網絡放在一起,其中的一個神經網絡被賦予生成功能(如圖像渲染),而另一個神經網絡則是放在一個對立的角色,挑戰之前的成績,這樣做可以使生成的神經網絡通過其反彈的思路來對抗對方,從而產生優質的圖片結果。
英偉達的團隊研究出了一個新的循序漸進的訓練方法,取材于著名的個人照片CelebA-HQ的數據庫,他們能夠產生出“前所未有的絕佳質量的圖像”,并且結果看起來相當不錯可以高達1024像素分辨率:所有這些人造面孔從來沒有真正的在你眼前出現過,雖然目前還只是靜態圖像(這意味著我們仍然距離動態人造面孔很遙遠),但英偉達的方法也可以很好地使物體和景觀相融合,未來或許會有更多的可能性。
Watching This Neural Network Render Truly Photorealistic Faces Is Creepy and Mesmerizing
內容來源:36kr
展開 機器學習 |使用門控循環單元網絡生成文本 ¥2
本文將演示如何通過構建 Gated Recurrent Unit Network 來構建文本生成器。訓練網絡的概念過程是首先向網絡提供網絡正在訓練的文本中存在的每個字符的映射到唯一數字。然后將每個字符熱編碼為一個向量,這是網絡所需的格式。
所述程序的數據是著名詩人的短詩和著名詩集,格式為 .txt。它可以從 kaggle 下載。
Fracman讀取FLAC3D生成的離散斷裂網絡(DFN)模型
1 引言
離散斷裂網絡DFN方法能夠顯式地表示巖體結構,采用鉆孔和測繪數據定義斷裂系統的幾何和空間屬性,構建出一個有效的三維離散斷裂網絡。FLAC3D,作為全球最流行的巖土工程數值模擬軟件,從版本5.0開始引進離散斷裂網絡(離散斷裂網絡(DFN)[P5]: FLAC3D中的DFN),并且在此基礎上成功地建立了合成巖體(離散斷裂網絡(DFN)[P4]: 創建一個合成巖體SRM)。FracMan,一個世界領先的離散斷裂網絡分析軟件,由Golder Associates(現在的WSP)的Dr. Dershowitz領銜開發(這是我見過的最多頁數的博士論文---Rock Joint Systems)。在某些情形下(例如采礦臺階的穩定性分析,巖橋斷裂分析),這兩個軟件需要進行交互操作。這個筆記簡要描述了Fracman讀取由FLAC3D生成的DFN模型。
2 FLAC3D產生DFN
在FLAC3D中產生一個隨機生成的DFN模型[離散斷裂網絡 (DFN) [P2]: fracture generate],首先使用'fracture template create'命令產生模板,然后使用'fracture generate dfn'命令即可生成一個三維DFN模型。
展開 FLAC3D導入Fracman生成的離散斷裂網絡(DFN)模型
1 引言
在《Fracman讀取FLAC3D生成的離散斷裂網絡(DFN)模型》中顯示了FLAC3D生成的DFN模型導入到Fracman的步驟。不過,對于大多數真實的研究項目,首先在Fracman中產生和細化DFN模型,然后把DFN模型導入到FLAC3D或3DEC,建立數值模型,這種轉換過程更有實際意義。不過建立DFN模型是一項非常麻煩的工作,需要反復調試,力求模擬的DFN與實測數值最大可能地接近,這已經超出了本文的范圍,這個筆記僅簡要討論了由Fracman到FLAC3D的轉換過程。
2 Fracman產生DFN
為了在Fracman中產生一個DFN模型,首先需要設置模型的范圍,這個設置類似于FLAC3D的語句model domain extent -500 500,然后用隨機幾何方法產生DFN模型。在《離散斷裂網絡DFN模型總結》中曾經總結了16種這樣的DFN模型,不過大多數模型沒有經過現場驗證。Fracman目前只包含了三種DFN產生方法:
(1) Enhanced Baecher Model
(2) Nearest Neig hbor Model
(3) Levy-Lee Fractal Model
其中,Baecher模型作過相對詳細的討論《離散斷裂網絡DFN模型---Baecher Model》。Baecher模型(Baecher, Lanney and Einstein, 1978) 是一個最早發展的離散斷裂模型。在這個模型中,斷裂中心均勻地位于空間中,使用泊松過程生成具有給定半徑和方向的圓盤形斷裂。 而增強的Baecher模型對Baecher模型進行了擴展,提供了對斷裂終點和更普遍的斷裂形狀的規定。增強的Baecher模型利用了最初生成的具有三至十六個邊的多邊形的斷裂形狀。
展開 人工神經網絡(ANN)(網絡架構)-4 ¥2
人工神經網絡(ANN)(網絡架構)-4
人工神經網絡(ANN):這是一種受人腦啟發的信息處理范式。ANN通過示例學習,就像人類一樣。通過學習過程,ANN可以被配置用于特定應用,如模式識別或數據分類。學習過程主要涉及調整神經元之間的突觸連接。
ANN的類型:
ANN有多種架構,每種架構都有其優勢和劣勢。常見的架構包括:
o 前饋神經網絡(Feedforward Neural Networks):這是最簡單的ANN架構,信息從輸入層單向流動到輸出層。各層是全連接的,即一層中的每個神經元都與下一層的所有神經元相連。
o 循環神經網絡(Recurrent Neural Networks,簡稱RNNs):這些網絡具有“記憶”組件,信息可以在網絡中循環流動。這使得網絡能夠處理數據序列,如時間序列或語音。
o 卷積神經網絡(Convolutional Neural Networks,簡稱CNNs):這些網絡旨在處理具有網格拓撲結構的數據,如圖像。層由卷積層組成,它們學習檢測數據中的特定特征,以及池化層,它們減少數據的空間維度。
o 自編碼器(Autoencoders):這些神經網絡用于無監督學習。它們由編碼器組成,將輸入數據映射到低維表示,以及解碼器,將表示映射回原始數據。
o 生成對抗網絡(Generative Adversarial Networks,簡稱GANs):這些神經網絡用于生成建模。它們由兩部分組成:一個生成器,學習生成新的數據樣本,以及一個鑒別器,學習區分真實和生成的數據。
ANN模型的三個實體:
o 互連(Interconnections):互連定義了ANN中處理元素(神經元)如何相互連接。這些處理元素的排列和互連的幾何形狀在ANN中非常重要。
展開 離散斷裂網絡DFN生成多個塊體的穩定性分析(block analyze-stability) (3)
首先使用離散斷裂網絡DFN技術產生斷裂,然后切割成塊體(block cut dfn)。只有與隧道開挖邊界相交塊體才會使用block analyze-stability方法計算安全系數。
2 DFN產生塊體
離散斷裂網絡DFN為自動生成塊體提供了一種非常有效的工具。為了生成一個DFN,首先需要使用fracture template create命令指定斷裂隨機分布的參數,斷裂模板包含了斷裂尺寸、位置和產狀分布的描述,然后使用fracture generate 命令產生DFN。fracture combine 命令用來合并小的斷裂。有三種方法阻止斷裂繼續生成。第一種使用mass-density關鍵字,第二種使用p10關鍵字,第三種使用fish-stop關鍵字。
展開 計算機視覺必讀:目標跟蹤、網絡壓縮、圖像分類、人臉識別等
例如,WaveNet可以生成類似人類說話的語音,但由于無法并行生成,得到1秒的語音需要2分鐘的計算,無法達到實時。
變分自編碼器(variational auto-encoder, VAE) 為避免顯式建模的弊端,變分自編碼器對數據分布進行隱式建模。其認為圖像的生成受一個隱變量控制,并假設該隱變量服從對角高斯分布。變分自編碼器通過一個解碼網絡從隱變量生成圖像。由于無法直接進行最大似然估計,在訓練時,類似于EM算法,變分自編碼器會構造似然函數的下界函數,并對這個下界函數進行優化。變分自編碼器的好處是,由于各維獨立,我們可以通過控制隱變量來控制輸出圖像的變化因素。
生成式對抗網絡(generative adversarial networks, GAN)由于學習數據分布十分困難,生成式對抗網絡繞開這一步驟,直接生成新的圖像。生成式對抗網絡使用一個生成網絡G從隨機噪聲中生成圖像,以及一個判別網絡D判斷其輸入圖像是真實/偽造圖像。在訓練時,判別網絡D的目標是能判斷真實/偽造圖像,而生成網絡G的目標是使得判別網絡D傾向于判斷其輸出是真實圖像。實際中,直接訓練生成式對抗網絡會遇到mode collapse問題,即生成式對抗網絡無法學到完整的數據分布。隨后,出現了LS-GAN和W-GAN的改進。和變分自編碼器相比,生成式對抗網絡的細節信息更好。以下鏈接整理了許多和生成式對抗網絡有關的論文:hindupuravinash/the-gan-zoo。
展開 
納米中心王磊/北科大曹暉/上海交大胡穎Biomaterials:類抗體的多肽網絡結構抑制新生血管生成
近日,國家納米科學中心的王磊研究員,北京科技大學的曹暉教授,上海交通大學附屬第六醫院的胡穎副主任醫師合作設計了一種類抗體的多肽網絡結構,并將其用于抑制新生血管生成。
脈絡膜新生血管是一種在老年人群中多發的疾病,其主要特征為新生血管內皮細胞的異常增殖和遷移。這種疾病會導致視力減退,失明等多種癥狀。針對這種新生血管的治療,通常使用的是針對血管內皮生長因子VEGF的單克l抗體,如貝伐單抗等。然而這些單抗類藥物的作用靶點單一,同時對部分患者無效。因此迫切需要新機制,新靶點以實現對新生血管的有效治療。
國家納米科學中心團隊設計了以神經菌毛素為靶點,纖維化結合受體為機制的類抗體的多肽網絡結構,使其有效的抑制新生血管生成。這種多肽網絡結構可以通過其在納米顆粒狀態下與神經菌毛素結合誘導下獲得。溶液層面的實驗結果表明,多肽網絡可以在加入神經菌毛素5天內形成,形成的多肽網絡具有β-折疊結構。在細胞層面,多肽網絡結構可以在與神經菌毛素過表達的血管內皮細胞共孵育4小時內形成,形成的纖維結構可以有效的覆蓋在細胞表面,并在不影響細胞存活率的情況下抑制細胞遷移。
圖1. 類抗體的多肽網絡材料的結構及其抗新生血管的機制。圖片來源:Biomaterials
在活體層面,這種多肽網絡結構可以在病灶部位滯留長達4天。同時,由于多肽網絡的覆蓋,導致神經菌毛素無法被其特異性抗體結合,即多肽材料結合神經菌毛素后可以抑制其他配體與其的結合。通過對比發現,這種多肽材料可以在更低的劑量下實現與商品化藥物貝伐單抗相當的抗新生血管治療效果(多肽材料0.26 μg/Kg VS 貝伐單抗23.5 μg/Kg)。這一結果表明,這種多肽網絡結構可以用于脈絡膜新生血管的治療。
展開 卷積神經網絡表征可視化研究綜述
GAN是一種生成式神經網絡, 由生成器和判別器兩部分構成, 二者之間通過對抗學習的方式互相提升性能[37]. 從結構上看, GAN的生成器一般使用反卷積結構, 判別器可視為一個CNN結構. 由于GAN主要用于學習數據的潛在分布, 然后用于生成式任務, 因此, GAN可視化的關注點主要在于生成器部分. 更具體地, 在于理解和解釋生成器隱變量的作用. 典型的如InfoGAN[38], 對輸入向量進行分解, 使其轉為可解釋的隱變量及不可壓縮的噪聲, 進而約束隱變量與輸出之間的關系, 從而學習可解釋的特征表達. 文獻[39]和文獻[40]通過操縱生成器的隱變量來觀察生成結果的變化情況, 進而理解GAN的過程. 文獻[41]專門研究了GAN隱空間的語義解糾纏問題, 提出了一種效果較好的人臉編輯方法, 可通過編輯GAN的隱空間來調整生成人臉的屬性, 如姿勢、性別和年齡等.
展開 人工智能 深度學習
視頻的時空特征
關鍵點:
1.C3D 網絡的構建 2.Attention 機制
實操解析與訓練
第四階段:
R-CNN 及 YOLO 實踐 實驗:目標檢測
1. 目標檢測發展現狀及代表性方法
2. 兩階段目標檢測方法:R-CNN 系列模型
3. 一階段目標檢測方法:YOLO 系列模型
高頻問題:
1. 提名與分類 2.BBOX 實現策略 3.YOLO Loss 函數
關鍵點:
1. 提名方法 2.ROI Pooling 3.SPP Net 4.RPN 5.YOLO
實操解析與訓練
第五階段:
RNN 實踐 實驗:股票預測
1. 股票數據分析 2. 同步預測 3. 異步預測
高頻問題:
1. 歷史數據的使用
關鍵點:
1. 構建 RNN 2. 采用 Keras 編程實現
實操解析與訓練八
第六階段:
Encoder-Decoder 實踐 實驗:去噪分析
1. 自編碼器 2. 去噪自編碼器
高頻問題:
1. 噪聲的引入與去除
關鍵點:
1. 設計去噪自編碼器
實驗:圖像標題生成
結合計算機視覺和機器翻譯的最新進展,利用深度神經網絡生成真實的圖像標題。
1. 掌握 Encoder-Decoder 結構 2. 學會 Seq2seq 結構
3. 圖像 CNN + 文本 RNN 4. 圖像標題生成模型
高頻問題:
1. 如何能夠根據圖像生成文本?
關鍵點:
1. 提取圖像特征 CNN,生成文本 RNN 2. 構建 Encoder-Decoder 結構
實操解析與訓練
第七階段:
GAN 實踐 實驗:藝術家作品生成
1. 生成對抗網絡原理 2.GAN 的生成模型、判別模型的設計
高頻問題:
1. 生成模型與判別模型的博弈過程
關鍵點:
1. 掌握 GAN 的思想與原理 2.
展開 機器學習 遷移學習
3.利用PyTorch加載數據、搭建模型、訓練網絡以及進行網絡微調操作。
4.給定遷移場景,利用daib庫和生成對抗技術獨立完成圖像分類中的領域適配。
5.遷移效果的可視化,利用機器學習庫scikit-learn中的t-SNE對遷移過后的高維數據進行可視化。
十、實驗實操之圖片與視頻風格遷移實踐
1.掌握基于生成對抗網絡的風格遷移技術。
2.圖像/視頻風格遷移網絡的搭建,重點掌握編碼器和解碼器的內在邏輯和不同損失函數的運用。
3.實踐紅外視頻轉換到可見光視頻的風格遷移。
十一、實驗實操之自動駕駛中的跨域語義分割實踐
1.掌握語義分割發展現狀及代表性工作,如FCN,DeepLab系列等。
2.了解常用的語義分割評價指標(PA、mPA、mIoU、FWIoU)和常見數據集(PASCAL VOC2012,ADE20K、BDD100K、Cityscapes、GTA5、Dark Zurich)。
3.語義分割工具箱MMSegmentaion的認識和使用。
4.設計一個分割模型能夠從仿真環境中得到的數據遷移到真實場景下產生的數據。
十二、實驗實操之目標檢測實踐
1.掌握目標檢測算法的基本框架以及目標檢測中的經典模型,如R-CNN系列的兩階段檢測模型和YOLO系列的單階段檢測模型。
2.掌握目標檢測模型的評測指標(IOU和mAP)、標準評測數據集(Pascal VOC,MS COCO和Cityscapes)以及檢測模型中的一些訓練技巧,如數據增強、多尺度訓練/測試、預測框微調/投票法、在線難例挖掘、軟化非極大抑制、RoI對齊和集成。
3.實踐基于Transformer的端到端目標檢測框架的搭建,并在新的數據集上與基于CNN的網絡進行遷移性能的對比。
我們的官網:www.chinaai.org.cn
關注微信公眾號人工智能技術與咨詢了解更多!
展開