
發(fā)布
注冊
/
登錄數(shù)據(jù)預(yù)處理的案例
數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過程中的一個重要步驟。它是指清理、轉(zhuǎn)換和集成數(shù)據(jù),以便為分析做好準(zhǔn)備。數(shù)據(jù)預(yù)處理的目標(biāo)是提高數(shù)據(jù)質(zhì)量,使其更適合特定的數(shù)據(jù)挖掘任務(wù)。
數(shù)據(jù)預(yù)處理步驟
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過程中的一個重要步驟,涉及清理和轉(zhuǎn)換原始數(shù)據(jù)以使其適合分析。數(shù)據(jù)預(yù)處理中的一些常見步驟包括:
數(shù)據(jù)清理:這涉及識別和糾正數(shù)據(jù)中的錯誤或不一致,例如缺失值、異常值和重復(fù)項。可以使用各種技術(shù)進行數(shù)據(jù)清理,例如插補、刪除和轉(zhuǎn)換。
數(shù)據(jù)集成:這涉及組合來自多個來源的數(shù)據(jù)以創(chuàng)建統(tǒng)一的數(shù)據(jù)集。數(shù)據(jù)集成可能具有挑戰(zhàn)性,因為它需要處理具有不同格式、結(jié)構(gòu)和語義的數(shù)據(jù)。可以使用記錄鏈接和數(shù)據(jù)融合等技術(shù)進行數(shù)據(jù)集成。
數(shù)據(jù)轉(zhuǎn)換:這涉及將數(shù)據(jù)轉(zhuǎn)換為合適的格式以供分析。數(shù)據(jù)轉(zhuǎn)換中使用的常見技術(shù)包括規(guī)范化、標(biāo)準(zhǔn)化和離散化。標(biāo)準(zhǔn)化用于將數(shù)據(jù)縮放到公共范圍,而標(biāo)準(zhǔn)化用于將數(shù)據(jù)轉(zhuǎn)換為零均值和單位方差。離散化用于將連續(xù)數(shù)據(jù)轉(zhuǎn)換為離散類別。
數(shù)據(jù)縮減:這涉及在保留重要信息的同時減小數(shù)據(jù)集的大小。可以通過特征選擇和特征提取等技術(shù)實現(xiàn)數(shù)據(jù)縮減。特征選擇涉及從數(shù)據(jù)集中選擇相關(guān)特征的子集,而特征提取涉及將數(shù)據(jù)轉(zhuǎn)換為較低維空間,同時保留重要信息。
數(shù)據(jù)離散化:這涉及將連續(xù)數(shù)據(jù)劃分為離散的類別或間隔。離散化通常用于需要分類數(shù)據(jù)的數(shù)據(jù)挖掘和機器學(xué)習(xí)算法。離散化可以通過等寬分箱、等頻分箱和聚類等技術(shù)來實現(xiàn)。
數(shù)據(jù)規(guī)范化:這涉及將數(shù)據(jù)縮放到一個通用范圍,例如介于 0 和 1 之間或 -1 和 1 之間。歸一化通常用于處理具有不同單位和尺度的數(shù)據(jù)。常見的規(guī)范化技術(shù)包括最小-最大規(guī)范化、z 分數(shù)規(guī)范化和十進制縮放。
數(shù)據(jù)預(yù)處理在保證數(shù)據(jù)質(zhì)量和分析結(jié)果的準(zhǔn)確性方面起著至關(guān)重要的作用。數(shù)據(jù)預(yù)處理中涉及的具體步驟可能因數(shù)據(jù)的性質(zhì)和分析目標(biāo)而異。
展開 介紹一款GNSS預(yù)處理軟件-Anubis
高精度位置信息的獲取必然依賴GNSS數(shù)據(jù)預(yù)處理,數(shù)據(jù)質(zhì)量檢查提供的信息不僅有利于數(shù)據(jù)后處理,還有益于高質(zhì)量觀測數(shù)據(jù)的收集、存儲。上述多種系統(tǒng)、信號、頻率的出現(xiàn)給GNSS數(shù)據(jù)預(yù)處理帶來了新的挑戰(zhàn)。RINEX3.X格式已經(jīng)包容了上述提到的所有系統(tǒng)、所有頻段的數(shù)據(jù)。
目前常用的GNSS數(shù)據(jù)預(yù)處理軟件有BNC(BKC ntrip client)及TEQC,但只有BNC是開源的,且支持RINEX3.X格式,但其操作相對復(fù)雜,且TEQC只能檢核GPS和GLONASS雙系統(tǒng)數(shù)據(jù)不支持BDS數(shù)據(jù)。本文介紹一種新興GNSS預(yù)處理軟件Anubis,由捷克國家大地測量、地形與地圖制圖研究所開發(fā),支持 GPS, GLONASS, BDS, Galileo, QZSS,SBAS各頻點數(shù)據(jù)的質(zhì)量檢核與分析,且支持Rinex3.X格式,具體功能包括數(shù)據(jù)缺失和小數(shù)據(jù)塊檢測、觀測值可用頻帶統(tǒng)計、周跳和鐘跳檢測、多路徑效應(yīng)影響估計、計算信噪比等,若同時提供導(dǎo)航數(shù)據(jù)還可以進行標(biāo)準(zhǔn)單點定位、方位角和高度角計算。
Anubis軟件免費開源,支持Windows、Linux和MacOS等常見操作系統(tǒng)。類似于TEQC,該軟件也在命令行窗口運行。通過預(yù)設(shè)好的配置文件,Anubis一次可對多個Rinex文件進行并行預(yù)處理操作,此舉可簡化處理流程,提高效率。Anubis的第一版于2013年發(fā)布,目前最新版本是Anubis2.2.3。下載網(wǎng)址為
http://www.pecny.cz/sw/anubis/
1 安裝配置
1.1 Windows 操作系統(tǒng)
首先從程序的下載頁面獲取文件名中帶有 “win” 字樣的適用于 Windows 操作系統(tǒng)的程序文件。例如,下載的文件為:anubis-2.2.3-win-static-64b,下載完成后將該文件重命名為“anubis.exe”。
展開 【篇三】生物醫(yī)藥領(lǐng)域發(fā)文難?(CADD、ROSETTA、多組學(xué))一區(qū)SCI墊腳石已備好!
集成多組學(xué)數(shù)據(jù)的機器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用(篇三)
機器學(xué)習(xí)及生物組學(xué)基礎(chǔ)
目標(biāo):對機器學(xué)習(xí)基本概念進行介紹,讓大家對機器學(xué)習(xí)基本概念有大致了解。明確機器學(xué)習(xí)方法的適用性,優(yōu)勢,以及局限性等
什么是機器學(xué)習(xí)
機器學(xué)習(xí)的應(yīng)用實例
生物組學(xué)簡介(基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白組學(xué),代謝組學(xué))
機器學(xué)習(xí)在在多組學(xué)數(shù)據(jù)分析的應(yīng)用
python基礎(chǔ)
目標(biāo):機器學(xué)習(xí)主流實現(xiàn)是python語言。學(xué)習(xí)機器學(xué)習(xí)之前,有針對性的對python進行系統(tǒng)的學(xué)習(xí),數(shù)據(jù)的基本處理,以方便將來開展機器學(xué)習(xí)的學(xué)習(xí)
python安裝與開發(fā)環(huán)境的搭建
基本數(shù)據(jù)類型、組合數(shù)據(jù)類型
函數(shù)、列表 、元組、字典、集合
控制結(jié)構(gòu)、循環(huán)結(jié)構(gòu)
Numpy模塊——矩陣的科學(xué)計算
Matplotlib模塊——數(shù)據(jù)處理與繪圖
Pandas模塊——csv數(shù)據(jù)處理與分析
Sklearn模塊——機器學(xué)習(xí)模型基礎(chǔ)軟件包調(diào)用
2 案例實踐一:利用Python pandas讀取組學(xué)CSV數(shù)據(jù)并進行數(shù)據(jù)讀取、轉(zhuǎn)換、保存等
生物組學(xué)大數(shù)據(jù)預(yù)處理與探索分析
目標(biāo):對高維組學(xué)數(shù)據(jù)進行統(tǒng)計分析及機器學(xué)習(xí)建模前,需要對數(shù)據(jù)進行預(yù)處理,如缺失值填補、降維可視化等,大數(shù)據(jù)預(yù)處理與探索分析是檢驗數(shù)據(jù)質(zhì)量與了解數(shù)據(jù)分布的必要過程。
展開 集成多組學(xué)數(shù)據(jù)的機器學(xué)習(xí)在生物醫(yī)學(xué)中的應(yīng)用
明確機器學(xué)習(xí)方法的適用性,優(yōu)勢,以及局限性等
什么是機器學(xué)習(xí)
機器學(xué)習(xí)的應(yīng)用實例
生物組學(xué)簡介(基因組學(xué),轉(zhuǎn)錄組學(xué),蛋白組學(xué),代謝組學(xué))
機器學(xué)習(xí)在在多組學(xué)數(shù)據(jù)分析的應(yīng)用
python基礎(chǔ)
目標(biāo):機器學(xué)習(xí)主流實現(xiàn)是python語言。學(xué)習(xí)機器學(xué)習(xí)之前,有針對性的對python進行系統(tǒng)的學(xué)習(xí),數(shù)據(jù)的基本處理,以方便將來開展機器學(xué)習(xí)的學(xué)習(xí)
python安裝與開發(fā)環(huán)境的搭建
基本數(shù)據(jù)類型、組合數(shù)據(jù)類型
函數(shù)、列表 、元組、字典、集合
控制結(jié)構(gòu)、循環(huán)結(jié)構(gòu)
Numpy模塊——矩陣的科學(xué)計算
Matplotlib模塊——數(shù)據(jù)處理與繪圖
Pandas模塊——csv數(shù)據(jù)處理與分析
Sklearn模塊——機器學(xué)習(xí)模型基礎(chǔ)軟件包調(diào)用
2 案例實踐一:利用Python pandas讀取組學(xué)CSV數(shù)據(jù)并進行數(shù)據(jù)讀取、轉(zhuǎn)換、保存等
生物組學(xué)大數(shù)據(jù)預(yù)處理與探索分析
目標(biāo):對高維組學(xué)數(shù)據(jù)進行統(tǒng)計分析及機器學(xué)習(xí)建模前,需要對數(shù)據(jù)進行預(yù)處理,如缺失值填補、降維可視化等,大數(shù)據(jù)預(yù)處理與探索分析是檢驗數(shù)據(jù)質(zhì)量與了解數(shù)據(jù)分布的必要過程。
展開 
有輕功:用3行代碼讓Python數(shù)據(jù)處理腳本獲得4倍提速
Python是一門非常適合處理數(shù)據(jù)和自動化完成重復(fù)性工作的編程語言,我們在用數(shù)據(jù)訓(xùn)練機器學(xué)習(xí)模型之前,通常都需要對數(shù)據(jù)進行預(yù)處理,而Python就非常適合完成這項工作,比如需要重新調(diào)整幾十萬張圖像的尺寸,用Python沒問題!你幾乎總是能找到一款可以輕松完成數(shù)據(jù)處理工作的Python庫。
然而,雖然Python易于學(xué)習(xí),使用方便,但它并非運行速度最快的語言。默認情況下,Python程序使用一個CPU以單個進程運行。不過如果你是在最近幾年配置的電腦,通常都是四核處理器,也就是有4個CPU。這就意味著在你苦苦等待Python腳本完成數(shù)據(jù)處理工作時,你的電腦其實有75%甚至更多的計算資源就在那閑著沒事干!
今天我(作者Adam Geitgey——譯者注)就教大家怎樣通過并行運行Python函數(shù),充分利用你的電腦的全部處理能力。得益于Python的 concurrent.futures 模塊,我們只需3行代碼,就能將一個普通數(shù)據(jù)處理腳本變?yōu)槟懿⑿?em>處理數(shù)據(jù)的腳本,提速4倍。
普通Python處理數(shù)據(jù)方法
比方說,我們有一個全是圖像數(shù)據(jù)的文件夾,想用Python為每張圖像創(chuàng)建縮略圖。
展開 機器學(xué)習(xí)加污水處理,給你勃勃生機萬物競發(fā)的世界
國家《城鎮(zhèn)污水處理廠污染物排放標(biāo)準(zhǔn)》就對城市污水處理廠出水的氮磷含量做了嚴格要求。
為保證排放達標(biāo),就需要及時知道處理廠出水中各物質(zhì)濃度信息。
目前常用的檢測方法是化學(xué)法,例如對于總氮含量,一般用“堿性過硫酸鉀-消解紫外分光光度法”。先采集樣品,再消解水中有機氮,然后過濾分離,最后測總氮含量。
結(jié)果雖然精準(zhǔn),但費時費力,時效性差。等實驗室檢測出結(jié)果,有可能超標(biāo)水已經(jīng)排放好一陣了。
但基于機器學(xué)習(xí)的智能檢測方法,就可大大彌補化學(xué)法的短板,做到實時監(jiān)測,實時預(yù)警。
下面基于數(shù)據(jù)建模軟件DTEmpower以及北京某污水處理廠的2萬多條數(shù)據(jù),展示如何零編碼實現(xiàn)智能檢測。
一、數(shù)據(jù)建模目的
我們想擺脫時效性差的化學(xué)檢測法,利用數(shù)據(jù)法快速預(yù)測“出水總氮”的值。首先就要分析哪些因素可能會影響出水總氮。注意,是“可能會”。
出水總氮的影響因素可分為兩大類,一類是進水數(shù)據(jù),另一類是污水處理過程數(shù)據(jù)。兩類加一起包含的可能影響因素有18個。
即對于下面這個函數(shù),自變量共有18個。
但18個變量如何影響出水總氮,哪個變量影響更大,不知道。
數(shù)據(jù)建模的最終目的,就是生成這個函數(shù)。你輸入自變量,快速給出因變量,即出水總氮。
數(shù)據(jù)建模通常包括三大步:數(shù)據(jù)預(yù)處理、變量分析、模型訓(xùn)練。
二、數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理的目的有兩個:處理缺失值和異常值。
生產(chǎn)一線采集的數(shù)據(jù)往往不能直接用,容易存在空值或者明顯不正常的值。
比如一組數(shù)據(jù)正常應(yīng)該有18個變量,但某個傳感器走神,最后只輸出了16個,就出現(xiàn)了缺失值。
再比如城市污水的PH值正常范圍應(yīng)在0~14之間,但某個傳感器抽風(fēng),最后輸出個24,就出現(xiàn)了異常值。
對缺失值,DTEmpower的空值處理工具可按需對空值進行刪除或補全。
展開 【Python數(shù)據(jù)分析基礎(chǔ)】: 數(shù)據(jù)缺失值處理
不處理
補齊處理只是將未知值補以我們的主觀估計值,不一定完全符合客觀事實,在對不完備信息進行補齊處理的同時,我們或多或少地改變了原始的信息系統(tǒng)。而且,對空值不正確的填充往往將新的噪聲引入數(shù)據(jù)中,使挖掘任務(wù)產(chǎn)生錯誤的結(jié)果。因此,在許多情況下,我們還是希望在保持原始信息不發(fā)生變化的前提下對信息系統(tǒng)進行處理。
在實際應(yīng)用中,一些模型無法應(yīng)對具有缺失值的數(shù)據(jù),因此要對缺失值進行處理。然而還有一些模型本身就可以應(yīng)對具有缺失值的數(shù)據(jù),此時無需對數(shù)據(jù)進行處理,比如Xgboost,rfr等高級模型。
4 總結(jié)
總而言之,大部分數(shù)據(jù)挖掘的預(yù)處理都會使用比較方便的方法來處理缺失值,比如均值法,但是效果上并一定好,因此還是需要根據(jù)不同的需要選擇合適的方法,并沒有一個解決所有問題的萬能方法。具體的方法采用還需要考慮多個方面的:
數(shù)據(jù)缺失的原因;
數(shù)據(jù)缺失值類型;
樣本的數(shù)據(jù)量;
數(shù)據(jù)缺失值隨機性等;
關(guān)于數(shù)據(jù)缺失值得思維導(dǎo)圖:
如果大家有任何好的其他方法,歡迎補充。
參考:
http://www.restore.ac.uk/PEAS/imputation.php
https://blog.csdn.net/lujiandong1/article/details/52654703
http://blog.sina.com.cn/s/blog_4b0f1da60101d8yb.html
https://www.cnblogs.com/Acceptyly/p/3985687.html
作者:Python數(shù)據(jù)科學(xué)
來源:掘金
展開 人工智能、藥物設(shè)計、藥物ADMET評價、抑制劑篩選
分子描述符/指紋計算軟件
2.1 分子表示方法和格式
2.1.1 SMILES,SMARTS,SDF, MOL, MOL2, PDB
2.1.2 JEM Editor, Chemdoodle, ChemAxon, ChemDraw, DrugBank
2.2 RDKit簡介及環(huán)境部署
2.3 RDKit中如何操作分子
2.4 RDKit中描述符的計算以及存儲
2.5 OpenBabel簡介及環(huán)境部署
2.6 OpenBabel操作分子和格式轉(zhuǎn)換
2.7 OpenBabel中的分子描述符和指紋
2.8 ChemDes計算分子描述符和指紋
2.9 ChemDes中的格式轉(zhuǎn)換和分子優(yōu)化
2.10 PyBioMed 簡介環(huán)境部署
2.11 PyBioMed 獲取分子
2.12 PyBioMed 計算分子描述符
2.13 PyBioMed 計算分子指紋
2.14 PyBioMed 計算蛋白質(zhì)描述符
2.45PyBioMed 計算核酸描述符
2.15 PyBioMed 計算相互作用描述符
結(jié)構(gòu)、數(shù)據(jù)預(yù)處理
3. 結(jié)構(gòu)預(yù)處理和數(shù)據(jù)預(yù)處理
3.1 PyBioMed結(jié)構(gòu)預(yù)處理
3.2 ChemSAR結(jié)構(gòu)預(yù)處理
3.3 KNIME 結(jié)構(gòu)預(yù)處理
3.4 Excel數(shù)據(jù)預(yù)處理及注意的問題
3.5 KNIME數(shù)據(jù)預(yù)處理
3.6 Pandas環(huán)境配置以及基本操作
3.6 sklearn數(shù)據(jù)預(yù)處理
3.7 歸一化與空值處理
常用人工智能藥物設(shè)計算法和軟件
4. 算法簡單介紹和分類
4.1 藥物設(shè)計中人工智能常用算法簡介
4.2 常用算法實現(xiàn)軟件或工具介紹
5.
展開 北航蔡國飆教授團隊:真空羽流智能化計算 | 航空學(xué)報
2
理論方法
下面分別對CNN-DSMC方法、使用的真空羽流數(shù)值模擬模型、使用的卷積神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)預(yù)處理方式進行介紹。
基于卷積神經(jīng)網(wǎng)絡(luò)的直接模擬蒙特卡洛(CNN-DSMC)方法
圖 1為CNN-DSMC方法求解流程示意圖。在CNN-DSMC方法中,計算分為數(shù)據(jù)預(yù)處理和模型訓(xùn)練兩個過程。在數(shù)據(jù)預(yù)處理中,真空羽流仿真模型中的幾何拓撲信息被抽象為符號距離函數(shù)(Signed Distance Function, SDF),邊界條件信息被抽象為標(biāo)識符矩陣(Identifier Matrix, IM);SDF和IM共同作為訓(xùn)練集的輸入;由DSMC數(shù)值模擬得到的真空羽流速度場(三個)和密度場作為訓(xùn)練集的輸出;測試集為未參與訓(xùn)練的DSMC數(shù)值模擬算例,用于驗證CNN-DSMC方法的準(zhǔn)確性。在完成訓(xùn)練之后,就得到了真空羽流智能計算模型
式中,
V
和
ρ
分別為真空羽流速度矢量和密度;
D
和
M
分別代表符號距離函數(shù)和標(biāo)識符矩陣。
圖1 CNN-DSMC方法計算流程
真空羽流數(shù)值模擬模型
本文研究的月面著陸過程羽流仿真所采用的計算域如圖 2(a)所示。除了月面,計算域的其余五個邊界均設(shè)置為開放邊界。月面和月球探測器表面設(shè)置為固體邊界,熱適應(yīng)系數(shù)設(shè)置為1.0。所有邊界的溫度設(shè)置為300 K,粒子與邊界相互作用模型使用Maxwell模型。DSMC數(shù)值模擬的時間步長設(shè)置為 10-7s。定義月球探測器足墊到月面的距離為h,且以h = 10 m為界限區(qū)分羽流智能計算的近場模型和遠場模型。
展開 有限元的預(yù)處理和后處理理論
有限元的預(yù)處理和后處理理論
有限元的預(yù)處理和后處理理論.part1.rar
有限元的預(yù)處理和后處理理論.part2.rar
有限元的預(yù)處理和后處理理論.part3.rar
【加工工藝】在光鮮的表面處理前,還需要表面預(yù)處理?
定義:表面處理前,使用手工工具、動力工具或噴砂、丸等方法進行的表面預(yù)處理。
1、機械預(yù)處理的目的
提供良好的表觀條件,提高表面精飾質(zhì)量;
提高產(chǎn)品品級;
減少焊接的影響;
產(chǎn)生裝飾效果;
獲得干凈表面。
2、機械預(yù)處理的常用方法
常用的機械預(yù)處理方法有拋光、噴砂、刷光、滾光等方法。具體采用那一種預(yù)處理要根據(jù)產(chǎn)品的類型、生產(chǎn)方法、表面初始狀態(tài)及最終精飾水平而定。
拋光
不銹鋼、鋁合金、鎂合金、鋅合金、液態(tài)金屬、電鍍銅層、銅均可進行拋光處理,不銹鋼可達到鏡面光的效果。
噴砂
不銹鋼、鋁合金、鎂合金、鋅合金、鈦合金、液態(tài)金屬均可進行噴砂處理,選擇不同的砂型可達到不同的噴砂效果。
展開 
有限元的預(yù)處理和后處理理論.pdf
希望大家喜歡
附件地址:
有限元的預(yù)處理和后處理理論.part1.rar
有限元的預(yù)處理和后處理理論.part2.rar
垃圾一樣的數(shù)據(jù),含淚也要處理完呀~Matlab讓你提高數(shù)據(jù)處理效率!
它通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。利用最小二乘法可以簡便地求得未知的數(shù)據(jù)并使得這些求得的數(shù)據(jù)與實際數(shù)據(jù)之間誤差的平方和為最小。
那么對于任意的x值,就會有一個實際值y和一個擬合值y’,那么對于所有的x值,最小二乘的就是求解下面公式的最小值:
比如用一次函數(shù)y=ax+b來擬合,系數(shù)a、b的值就要通過不斷計算,使得誤差的平方和最小來確定。
如果你已知數(shù)據(jù)趨勢,例如低碳鋼拉伸曲線,或者擬合工具箱里的基本函數(shù)已經(jīng)不能滿足需求,也可以自定義曲線函數(shù)來擬合數(shù)據(jù)噠,我給大家提供一個算例,關(guān)注公眾號,后臺回復(fù)“擬合”,即可領(lǐng)取啦!
上面是我處理后的兩張基坑排樁變形圖象呢,有人覺得這樣圖很丑,那就對了。畢導(dǎo)也說過:學(xué)術(shù)界是一個以丑為美的領(lǐng)域,沒有那么多的花里胡哨啦!學(xué)術(shù)圖表配色原則和理工男穿衣搭配原則是類似的!
當(dāng)然數(shù)據(jù)處理是為了總結(jié)規(guī)律,切不可為了強湊規(guī)律而偽造數(shù)據(jù),畢竟我們要尊重科學(xué)!
展開 【高速傳輸】數(shù)據(jù)量激增,處理吃緊?高速光纖通信板實現(xiàn)的大數(shù)據(jù)高速處理方案
作為參考,表4給出了每個產(chǎn)品對內(nèi)存的500MB數(shù)據(jù)的寫入和讀取時間。
表4 每個產(chǎn)品的數(shù)據(jù)寫入時間和讀取時間
應(yīng)用示例
圖8 一臺相機和一個采集卡的硬件配置圖。
圖9 使用1臺PC時的節(jié)拍時間。
在使用1臺PC連接一臺相機和一個采集卡的一般環(huán)境中,獲取影像的順序為第1個圖像采集→第1個圖像處理→第2個圖像采集→第2個圖像處理,由此連續(xù)獲取影像。
假如有如圖8所示的設(shè)置,將設(shè)備轉(zhuǎn)換為高分辨率、高速相機,則可能會因數(shù)據(jù)增加導(dǎo)致數(shù)據(jù)處理時間延遲,從而降低生產(chǎn)量。
圖10 分散式處理示例。
圖11 使用3臺PC時的節(jié)拍時間。
圖10顯示了一臺相機對三臺PC的分散式處理。
如圖11所示,相機正在獲取數(shù)據(jù),通過在PC1、PC2和PC3依次處理從相機輸入的圖像數(shù)據(jù),以此來縮短整體生產(chǎn)節(jié)拍時間。
圖12 節(jié)拍時間比較。
如圖12顯示,使用3臺PC時的處理速度,比使用1臺PC時快約2.5倍。
可見,分散式處理的在高速傳輸高分辨率數(shù)據(jù)的情況下,優(yōu)勢明顯。用戶可根據(jù)自身應(yīng)用目的,進行分散式處理或集中處理。
在分散式處理的情況下,如圖13所示,將一臺相機拍攝的圖像數(shù)據(jù)傳輸?shù)饺齻€節(jié)點。
圖13 分散式處理示例
在集中處理的情況下,如圖14所示,三臺相機的影像數(shù)據(jù)被傳輸?shù)揭粋€節(jié)點,作為一個集中過程進行處理。
圖14 集中處理示例
結(jié)論
GiGA系列是基于光通信進行數(shù)據(jù)處理的板卡,它可以傳輸大量數(shù)據(jù)以及圖像,因此應(yīng)用范圍廣泛。
展開 一文讀懂3D人臉識別十年發(fā)展及未來趨勢
在訓(xùn)練階段,需要 3D 人臉數(shù)據(jù)來生成特征庫,面部特征通過數(shù)據(jù)預(yù)處理和特征提取模型獲得,然后保存在特征庫中;在測試階段,獲取一個探針作為目標(biāo)人臉,并進行與訓(xùn)練階段相同的數(shù)據(jù)預(yù)處理和特征提取過程。
人臉識別是一個匹配的過程。將目標(biāo)人臉的特征向量與存儲在特征庫中的特征向量進行比較。掃描圖庫并返回匹配距離最近的人臉。如果距離小于預(yù)定義的閾值,則將目標(biāo)人臉標(biāo)記為已識別,否則失敗。因此,人臉識別過程包含三個核心步驟:數(shù)據(jù)預(yù)處理、特征提取和人臉匹配。所有這些都會影響識別的性能。
下表 2 列舉了基于局部特征的 3D 方法以及它們的重要細節(jié)。
基于深度學(xué)習(xí)的 3D 人臉識別
十年來,深度神經(jīng)網(wǎng)絡(luò)已成為最流行的人臉識別技術(shù)之一。與傳統(tǒng)方法相比,基于深度學(xué)習(xí)的方法比圖像處理有很大的優(yōu)勢。對于傳統(tǒng)方法,關(guān)鍵步驟是根據(jù) 3D 人臉數(shù)據(jù)的幾何信息找到穩(wěn)健的特征點和描述符。與端到端的深度學(xué)習(xí)模型相比,這些方法具有良好的識別性能,但涉及檢測關(guān)鍵特征的算法操作相對復(fù)雜。而對于基于深度學(xué)習(xí)的方法,可以通過在大型數(shù)據(jù)集上訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)穩(wěn)健的人臉表征。
下表 III 總結(jié)了社區(qū)在該領(lǐng)域做出的非凡努力。Spreeuwers 提出了一種用于 3D 人臉配準(zhǔn)的固有坐標(biāo)系。該系統(tǒng)基于通過鼻子、鼻尖和鼻子方向的垂直對稱平面。
混合 3D 人臉識別方法結(jié)合了不同類型的方法(基于局部和基于整體),并將局部和全局特征應(yīng)用于人臉匹配。通過結(jié)合不同的特征提取技術(shù),它們可以處理更多的面部差異,例如表情、姿勢和遮擋。最近的混合方法在下表 IV 中進行了比較。
展開