什么是神經網絡?

?

 神經網絡是模擬人腦復雜功能的計算模型。神經網絡由互連的節點或神經元組成,它們處理數據并從中學習,從而支持機器學習中的模式識別和決策等任務。本文詳細探討了神經網絡、神經網絡的工作原理、架構等。

目錄

  • 神經網絡的演變
  • 什么是神經網絡?
  • 神經網絡的工作原理是什么?
  • 學習神經網絡
  • 神經網絡的類型
  • 神經網絡的簡單實現

神經網絡的演變

自 1940 年代以來,神經網絡領域取得了許多值得注意的進步:

  • 1940 年代至 1950 年代:早期概念
  • 神經網絡始于 McCulloch 和 Pitts 引入第一個人工神經元數學模型。但計算限制使進展變得困難。
  • 1960 年代至 1970 年代:感知器
  • 這個時代由 Rosenblatt 在感知器方面的工作定義。 感知器是單層網絡,其適用性僅限于可以單獨線性解決的問題。
  • 1980 年代:反向傳播和聯結主義
  • Rumelhart、Hinton 和 Williams 發明的反向傳播方法使多層網絡訓練成為可能。由于強調通過互連節點進行學習,聯結主義獲得了吸引力。
  • 1990 年代:繁榮與寒冬
  • 隨著神經網絡在圖像識別、金融和其他領域的應用而蓬勃發展。然而,由于高昂的計算成本和夸大的期望,神經網絡研究確實經歷了一個“冬天”。
  • 2000 年代:復興和深度學習
  • 更大的數據集、創新的結構和增強的處理能力刺激了它的卷土重來。 深度學習通過利用多個層,在許多學科中顯示出驚人的效果。
  • 2010 年代至今:深度學習占主導地位
  • 卷積神經網絡 (CNN) 和遞歸神經網絡 (RNN) 這兩種深度學習架構主導了機器學習。游戲、圖片識別和自然語言處理方面的創新證明了他們的強大功能。
  • 什么是神經網絡?

神經網絡從數據中提取識別特征,缺乏預編程的理解。網絡組件包括神經元、連接、權重、偏差、傳播函數和學習規則。神經元接收由閾值和激活函數控制的輸入。連接涉及調節信息傳輸的權重和偏差。學習、調整權重和偏差分為三個階段:輸入計算、輸出生成和迭代優化,以提高網絡對各種任務的熟練程度。

這些包括:

  1. 神經網絡由新環境模擬。
  2. 然后,作為此模擬的結果,神經網絡的自由參數會發生變化。
  3. 然后,由于神經網絡的自由參數發生了變化,因此以新的方式響應環境。

nn-Geeksforgeeks?

編輯

神經網絡的重要性

神經網絡識別模式、解決復雜難題和適應不斷變化的環境的能力至關重要。他們從數據中學習的能力具有深遠的影響,從徹底改變自然語言處理和自動駕駛汽車等技術,到自動化決策流程和提高眾多行業的效率。人工智能的發展在很大程度上依賴于神經網絡,神經網絡也驅動創新并影響技術的發展方向。

神經網絡的工作原理是什么?

讓我們通過一個神經網絡工作原理的示例來了解:

考慮使用用于電子郵件分類的神經網絡。輸入層采用電子郵件內容、發件人信息和主題等功能。這些輸入乘以調整后的權重,將穿過隱藏層。通過訓練,該網絡學會了識別指示電子郵件是否為垃圾郵件的模式。輸出層具有二進制激活函數,可預測電子郵件是否為垃圾郵件 (1) 或非垃圾郵件 (0)。隨著網絡通過反向傳播迭代優化其權重,它變得擅長區分垃圾郵件和合法電子郵件,展示了神經網絡在電子郵件篩選等實際應用中的實用性。

神經網絡的工作原理

神經網絡是模擬人腦功能某些特征的復雜系統。它由一個輸入層、一個或多個隱藏層和一個由耦合的人工神經元層組成的輸出層組成。基本過程的兩個階段稱為反向傳播前向傳播。

nn-ar-Geeksforgeeks?

編輯

前向傳播

  • Input Layer:輸入層中的每個要素都由網絡上的一個節點表示,該節點接收輸入數據。
  • 權重和連接:每個神經元連接的權重表示連接的強度。在整個訓練過程中,這些權重會發生變化。
  • 隱藏層:每個隱藏層神經元通過將輸入乘以權重,將它們相加,然后通過激活函數傳遞它們來處理輸入。通過這樣做,引入了非線性,使網絡能夠識別復雜的模式。
  • 輸出:通過重復該過程直到到達輸出層來產生最終結果。

反向傳播

  • 損失計算:根據實際目標值評估網絡的輸出,并使用損失函數計算差異。對于回歸問題,均方誤差(MSE) 通常用作成本函數。
  • 損失功能:
  • 什么是神經網絡?的圖5什么是神經網絡?的圖6?編輯
  • Gradient Descent:然后網絡使用 Gradient Descent 來減少損失。為了降低不準確性,權重將根據損失相對于每個權重的導數進行更改。
  • 調整權重:通過在整個網絡中向后應用此迭代過程或反向傳播,在每個連接處調整權重。
  • 訓練:在使用不同的數據樣本進行訓練時,前向傳播、損失計算和反向傳播的整個過程都是迭代完成的,使網絡能夠從數據中適應和學習模式。
  • 驅動函數:模型非線性由修正線性單元 (ReLU) 或 sigmoid 等激活函數引入。他們決定是否 “觸發” 神經元是基于整個加權輸入。

學習神經網絡

1. 通過監督學習學習

在監督式學習中,神經網絡由可以訪問兩個輸入-輸出對的教師指導。網絡根據輸入創建輸出,而不考慮周圍環境。通過將這些輸出與教師已知的所需輸出進行比較,生成誤差信號。為了減少錯誤,網絡的參數會迭代更改,并在性能達到可接受水平時停止。

2. 通過無監督學習進行學習

無監督式學習中不存在等效輸出變量。它的主要目標是理解傳入數據的 (X) 底層結構。沒有教練在場提供建議。相反,對數據模式和關系進行建模是預期的結果。回歸和分類等詞與監督學習有關,而無監督學習與聚類和關聯有關。

3. 通過強化學習進行學習

通過與環境互動和以獎勵或懲罰的形式提供反饋,網絡獲得了知識。找到一種隨著時間的推移優化累積獎勵的政策或策略是該網絡的目標。這種經常用于游戲和決策應用程序。

神經網絡的類型

可以使用種類型的神經網絡。

  • 前饋神經網絡:前饋神經網絡是一種簡單的人工神經網絡架構,其中數據沿單個方向從輸入移動到輸出。它有 input、hidden 和 output 層;沒有反饋循環。其簡單的架構使其適用于許多應用程序,例如回歸和模式識別。
  • 多層感知器 (MLP):MLP 是一種具有三層或更多層的前饋神經網絡,包括一個輸入層、一個或多個隱藏層和一個輸出層。它使用非線性激活函數。
  • 卷積神經網絡 (CNN):卷積神經網絡 (CNN) 是一種專為圖像處理而設計的專用人工神經網絡。它采用卷積層從輸入圖像中自動學習分層特征,從而實現有效的圖像識別和分類。CNN 徹底改變了計算機視覺,在對象檢測和圖像分析等任務中發揮著關鍵作用。
  • 遞歸神經網絡 (RNN):一種用于順序數據處理的人工神經網絡類型稱為遞歸神經網絡 (RNN)。它適用于上下文依賴關系至關重要的應用程序,例如時間序列預測和自然語言處理,因為它利用反饋循環,使信息能夠在網絡中生存。
  • 長短期記憶 (LSTM):LSTM 是一種 RNN,旨在克服訓練 RNN 中的梯度消失問題。它使用存儲單元和門選擇性地讀取、寫入和擦除信息。

神經網絡的簡單實現

代碼案例


?

以下內容為付費內容,請購買后觀看

App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP

1