
發(fā)布
注冊
/
登錄數(shù)據(jù)隱私與合規(guī)的案例
康謀分享 | 數(shù)據(jù)隱私和匿名化:PIPL與GDPR下,如何確保數(shù)據(jù)合規(guī)?(二)
在上期數(shù)據(jù)隱私和匿名化系列文章中,我們主要分享了《中國個(gè)人信息保護(hù)法》(PIPL)和《歐盟通用數(shù)據(jù)保護(hù)條例》(GDPR)在涵蓋范圍、定義、敏感信息等方面的異同點(diǎn),今天,我們將重點(diǎn)分析PIPL與GDPR在數(shù)據(jù)處理行為及其基礎(chǔ)合法性方面的異同,旨在幫助車企更準(zhǔn)確地把握數(shù)據(jù)隱私保護(hù)法規(guī)的要求,有效應(yīng)對相關(guān)挑戰(zhàn),推動自動駕駛行業(yè)健康發(fā)展。
一、PIPL和GDPR的異同點(diǎn)
1、數(shù)據(jù)處理行為定義
兩部法規(guī)(PIPL和GDPR)均明確界定了不同的數(shù)據(jù)處理行為,這些行為將觸發(fā)各自法規(guī)的管理范疇。此處所提及的信息,已不再局限于敏感信息,而是涵蓋了兩部法規(guī)所規(guī)定的所有相關(guān)信息。
在英文版的PIPL中,數(shù)據(jù)處理行為被表述為“Handling”,而GDPR則使用“Processing”一詞,兩者在本質(zhì)上并無區(qū)別。然而,在數(shù)據(jù)處理行為的定義上,兩部法規(guī)卻存在些許差異。
PIPL中的“Handling”涵蓋了收集、存儲、使用、加工、傳輸、披露以及刪除個(gè)人信息等一系列行為。相較于PIPL,GDPR關(guān)于數(shù)據(jù)處理行為的定義則更為詳盡,除了包含上述相同的行為外,還涉及到了個(gè)人數(shù)據(jù)的檢索、咨詢等多個(gè)方面。
但實(shí)際上,當(dāng)我們深入探討PIPL中定義的數(shù)據(jù)處理行為時(shí),相關(guān)法律專家指出:“在中國境內(nèi)處理個(gè)人信息時(shí),GDPR所涵蓋的任何數(shù)據(jù)行為都需要被納入考慮范圍,即使PIPL并未完全列舉出所有要點(diǎn)。”
由此可見,在各自司法管轄區(qū)域內(nèi)處理相關(guān)數(shù)據(jù)時(shí),任何數(shù)據(jù)處理行為都將受到該區(qū)域法律條例的約束。
2、數(shù)據(jù)處理基礎(chǔ)合法性
為了進(jìn)一步對比數(shù)據(jù)處理行為的異同,我們在此列舉了中國的《個(gè)人信息保護(hù)法》(PIPL)與歐盟的《通用數(shù)據(jù)保護(hù)條例》(GDPR)在數(shù)據(jù)處理基礎(chǔ)合法性方面的相關(guān)規(guī)定。
展開 數(shù)據(jù)驅(qū)動變革時(shí)代,自動駕駛研發(fā)如何破解數(shù)據(jù)跨境合規(guī)難題?
當(dāng)下正是一個(gè)由數(shù)據(jù)驅(qū)動的偉大變革時(shí)代。從ADAS到AD,每一次技術(shù)的躍遷都離不開海量道路數(shù)據(jù)的采集、標(biāo)注與分析。以圖像數(shù)據(jù)為例,它們是訓(xùn)練和優(yōu)化感知算法、提升系統(tǒng)安全性的寶貴資源。
然而,當(dāng)計(jì)劃將這些數(shù)據(jù)送往異國研發(fā)團(tuán)隊(duì)時(shí),數(shù)據(jù)合規(guī)這個(gè)難題便擺在了面前。
一、全球化研發(fā)的數(shù)據(jù)合規(guī)挑戰(zhàn)
對于任何一個(gè)有全球拓展計(jì)劃的車企或技術(shù)供應(yīng)商而言,跨國研發(fā)與測試通常是不可避免的,例如驗(yàn)證算法在不同交通環(huán)境、氣候條件下的魯棒性。然而,當(dāng)使用到這些真實(shí)世界圖像的數(shù)據(jù)時(shí),不可避免地會捕捉到大量的個(gè)人身份信息(PII),例如行人的面部特征、清晰可辨的車牌號碼等。
這正是挑戰(zhàn)的核心所在。當(dāng)數(shù)據(jù)跨境傳輸成為研發(fā)的剛需時(shí),企業(yè)便會踏入全球隱私法規(guī)的“風(fēng)險(xiǎn)區(qū)域”。針對這些挑戰(zhàn),康謀有一些洞察和總結(jié),本文將與大家一起交流!
二、全球數(shù)據(jù)法規(guī)的差異與現(xiàn)實(shí)
自歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)設(shè)立全球數(shù)據(jù)保護(hù)的里程碑后,隱私立法變革隨之在世界范圍內(nèi)展開,中國的《個(gè)人信息保護(hù)法》(PIPL)就是其中的重要組成部分。這些法規(guī)雖都以保護(hù)個(gè)人信息為目標(biāo),卻在定義、原則和跨境規(guī)則上存在差異,給全球化車企帶來了嚴(yán)峻挑戰(zhàn)。
展開 窮人也有隱私權(quán)!廉價(jià)智能機(jī)擅自收集數(shù)據(jù)推廣告
(原標(biāo)題:App Traps: How Cheap Smartphones Help Themselves to User Data)
網(wǎng)易科技訊 7月8日消息,據(jù)華爾街日報(bào)報(bào)道,隱私保護(hù)和用戶數(shù)據(jù)共享之間的平衡問題在西方國家引發(fā)了一場爭論,而發(fā)展中國家則不大存在那樣的爭議。對于數(shù)百萬在隱私保護(hù)普遍不足的發(fā)展中國家購買廉價(jià)智能手機(jī)的人來說,隨時(shí)隨地上網(wǎng)的便利可能會帶來一項(xiàng)隱性成本:預(yù)裝的應(yīng)用程序會在用戶不知情的情況下收集他們的個(gè)人數(shù)據(jù)。
在緬甸和柬埔寨賣出的數(shù)千部中國生產(chǎn)的Singtech P10智能手機(jī)上,就有一款這樣的應(yīng)用,它會將機(jī)主的位置和獨(dú)特的設(shè)備細(xì)節(jié)發(fā)送給臺灣的移動廣告公司General Mobile(簡稱GMobi)。安全研究人員說,這款應(yīng)用也出現(xiàn)于在巴西銷售的智能手機(jī)以及中國和印度的制造商生產(chǎn)的智能手機(jī)。
總部位于臺北的GMobi在上海設(shè)有子公司,它表示,它利用這些數(shù)據(jù)在設(shè)備上推送定向廣告。它有時(shí)也會與設(shè)備制造商分享數(shù)據(jù),以幫助它們更好地了解它們的顧客。
該公司的首席執(zhí)行官Paul Wu稱,智能手機(jī)制造商還會獲得額外的好處:通過允許GMobi在它們的設(shè)備上安裝它的應(yīng)用,它們能夠向設(shè)備發(fā)送被稱為“固件”的軟件更新,而無需支付任何的費(fèi)用。這是設(shè)備制造商在新興市場推廣低成本手機(jī)的一個(gè)重要考量。
GMobi的一位發(fā)言人說:“如果終端用戶想要免費(fèi)的互聯(lián)網(wǎng)服務(wù),他或她需要為更好的定向廣告付出一點(diǎn)代價(jià)。”
在保護(hù)隱私和共享用戶數(shù)據(jù)之間的權(quán)衡問題,在西方引發(fā)了不小的爭論。用戶數(shù)據(jù)對于很多在線服務(wù)的盈利模式至關(guān)重要。社交網(wǎng)絡(luò)巨頭Facebook因在保護(hù)用戶數(shù)據(jù)方面做得不夠而受到抨擊。新的法律賦予加州人禁止出售其個(gè)人數(shù)據(jù)的權(quán)利,而歐盟的通用數(shù)據(jù)保護(hù)條例(GDPR)則帶來了非常嚴(yán)格的數(shù)據(jù)隱私保護(hù)。
展開 大成建設(shè)(Taisei)圖像數(shù)據(jù)隱私保護(hù)與AI開發(fā)協(xié)同案例解析
隱私優(yōu)先處理
- 完全符合GDPR等合規(guī)要求,處理后的數(shù)據(jù)無法被逆向還原
- 相比傳統(tǒng)模糊技術(shù),在保護(hù)隱私的同時(shí)保持數(shù)據(jù)可用性
3. 高效邊緣處理
- NVIDIA Orin AGX上可以實(shí)現(xiàn)穩(wěn)定24FPS的720p實(shí)時(shí)匿名化處理
- 自動化處理大幅減少人工審核需求
三、應(yīng)用成效
深度自然匿名化方案的采用,使Taisei在保護(hù)個(gè)人信息的同時(shí),成功推動了人工智能的開發(fā)。
此外,由于深度自然匿名化解決方案符合全球數(shù)據(jù)隱私基準(zhǔn)——《通用數(shù)據(jù)保護(hù)條例》(GDPR),Taisei 正考慮深化合作,借助方案技術(shù)能力進(jìn)一步適配全球個(gè)人信息保護(hù)規(guī)范,從而推動其在該領(lǐng)域的進(jìn)一步發(fā)展。
展開 
自動駕駛汽車開發(fā)注重數(shù)據(jù)合規(guī)性
二、隱私政策和用戶協(xié)議
車輛與駕駛員之間的互動通常是通過駕駛員的智能移動設(shè)備實(shí)現(xiàn)的,而APP已成為收集和處理用戶個(gè)人信息的主要途徑。
例如,駕駛員必須下載APP才能執(zhí)行某些車輛功能。
盡管中國沒有關(guān)于通過APP收集數(shù)據(jù)的具體法規(guī),但2019年在全國范圍內(nèi)開展了活動,打擊通過APP非法收集和使用個(gè)人信息的行為。因此,汽車服務(wù)提供商應(yīng)重視隱私政策,并以簡單易懂的方式向個(gè)人信息主體充分披露安全措施和退出機(jī)制。提供用戶協(xié)議時(shí),汽車服務(wù)提供商還應(yīng)遵守上述要求。
三、用戶畫像合規(guī)性
在推薦用戶畫像并提供個(gè)性化產(chǎn)品和服務(wù)時(shí),通常會涉及用戶隱私。在這方面,《規(guī)范》提出了許多限制,包括消除明確身份指向性、避免精確定位到特定個(gè)人。應(yīng)顯著區(qū)分個(gè)性化展示的內(nèi)容和非個(gè)性化展示的內(nèi)容,并應(yīng)建立自主控制機(jī)制,保障個(gè)人信息主體調(diào)控個(gè)性化展示相關(guān)性程度的能力。《規(guī)范》鼓勵(lì)汽車服務(wù)提供商在將來開發(fā)產(chǎn)品功能時(shí),充分考慮用戶的隱私和自主權(quán)。
四、數(shù)據(jù)出境和跨境傳輸
自動駕駛技術(shù)發(fā)展可能需要跨境合作。在開發(fā)此類技術(shù)時(shí),跨國汽車公司可能需要從本地子公司獲取信息并收集數(shù)據(jù)。中國對個(gè)人信息和重要數(shù)據(jù)傳輸有嚴(yán)格的規(guī)定。
展開 合規(guī)與風(fēng)險(xiǎn)管理:《GDPR生效后,UG許可中的用戶數(shù)據(jù)如何脫敏?》
**結(jié)構(gòu)化數(shù)據(jù)脫敏**:
- 針對UG許可日志中的IP地址、設(shè)備ID等結(jié)構(gòu)化數(shù)據(jù),采用保留格式加密(FFX)算法。
- 某家電企業(yè)通過FFX加密,在保持數(shù)據(jù)可用性的同時(shí),使逆向破解成本提升10^6倍。
3. **非結(jié)構(gòu)化數(shù)據(jù)治理**:
- 對設(shè)計(jì)文檔中的注釋、版本記錄等非結(jié)構(gòu)化數(shù)據(jù),應(yīng)用自然語言處理(NLP)識別敏感信息。
- 某航空企業(yè)通過NLP脫敏,使技術(shù)文檔共享合規(guī)率提升至99.2%。
三、數(shù)據(jù)跨境傳輸:搭建合規(guī)傳輸?shù)募用芡ǖ?某重工集團(tuán)的數(shù)據(jù)泄露事件展示傳輸風(fēng)險(xiǎn):其新加坡設(shè)計(jì)中心向歐洲總部傳輸U(kuò)G許可數(shù)據(jù)時(shí),因未采用標(biāo)準(zhǔn)合同條款(SCCs),導(dǎo)致數(shù)據(jù)在荷蘭被截獲。通過實(shí)施四層防護(hù)體系,該企業(yè)實(shí)現(xiàn)安全傳輸:
1. **傳輸前評估**:
- 開展數(shù)據(jù)保護(hù)影響評估(DPIA),識別傳輸數(shù)據(jù)中的個(gè)人數(shù)據(jù)元素。
- 某醫(yī)療器械企業(yè)通過DPIA,發(fā)現(xiàn)設(shè)計(jì)參數(shù)中隱藏的用戶健康信息,避免合規(guī)風(fēng)險(xiǎn)。
2. **加密通道構(gòu)建**:
- 采用TLS 1.3協(xié)議加密傳輸通道,結(jié)合AES-256算法加密數(shù)據(jù)包。
- 某汽車企業(yè)通過此組合,使數(shù)據(jù)傳輸中間人攻擊成功率降至0.0004%。
3. **標(biāo)準(zhǔn)合同條款(SCCs)**:
- 與歐盟接收方簽訂歐盟委員會批準(zhǔn)的SCCs,明確數(shù)據(jù)保護(hù)義務(wù)。
- 某航天企業(yè)通過SCCs機(jī)制,在48小時(shí)內(nèi)完成跨國設(shè)計(jì)數(shù)據(jù)的合規(guī)共享。
4. **接收方驗(yàn)證**:
- 對歐盟數(shù)據(jù)接收方進(jìn)行合規(guī)審計(jì),確認(rèn)其通過ISO 27701隱私信息管理體系認(rèn)證。
- 某家電企業(yè)通過此流程,淘汰3家不合規(guī)供應(yīng)商,避免連帶處罰風(fēng)險(xiǎn)。
四、實(shí)戰(zhàn)案例:從被動應(yīng)對到主動防御
1.
展開 康謀分享| 揭秘C-NCAP :合成數(shù)據(jù)如何助力攻克全球安全合規(guī)難關(guān)?
- 合成數(shù)據(jù):減少對真實(shí)道路測試的依賴,加快合規(guī)工作流程。
2、合規(guī)難點(diǎn)
當(dāng)前,汽車行業(yè)在邁向更高安全合規(guī)標(biāo)準(zhǔn)的過程中仍面臨多重挑戰(zhàn):
- 成本壓力:高性能ADAS(高級駕駛輔助系統(tǒng))硬件的研發(fā)與生產(chǎn)成本高昂,如何在保證性能的同時(shí)控制成本,成為車企面臨的一大挑戰(zhàn)。
- 惡劣環(huán)境可靠性:雨、雪、霧和低光等惡劣環(huán)境對DMS和RFR系統(tǒng)的可靠性提出了更高要求,如何確保在這些條件下系統(tǒng)的準(zhǔn)確性和穩(wěn)定性,是車企必須解決的問題。
- 復(fù)雜協(xié)議測試:AEB(自動緊急制動)、DMS和RFR等系統(tǒng)的廣泛測試要求,給車企的研發(fā)團(tuán)隊(duì)帶來了巨大壓力,如何在保證測試質(zhì)量的同時(shí)縮短產(chǎn)品上市時(shí)間,成為亟待解決的難題。
- 誤導(dǎo)性廣告風(fēng)險(xiǎn):部分車企在宣傳ADAS功能時(shí)存在誤導(dǎo)性陳述,導(dǎo)致消費(fèi)者對系統(tǒng)能力產(chǎn)生過高期望,增加了事故風(fēng)險(xiǎn)。
- 國際法規(guī)差異:隨著中國車企積極進(jìn)軍國際市場,如何滿足不同國家和地區(qū)的法規(guī)要求,成為車企必須面對的挑戰(zhàn)。
三、Anyverse助力車企應(yīng)對安全挑戰(zhàn)
我們不難發(fā)現(xiàn),傳統(tǒng)的開發(fā)測試模式已難以滿足新規(guī)下快速迭代與嚴(yán)格合規(guī)的雙重需求。Anyverse平臺優(yōu)勢顯得尤為重要,它以其獨(dú)特的虛擬仿真與合成數(shù)據(jù)技術(shù),正在徹底改變 OEM 測試和驗(yàn)證駕駛員監(jiān)控系統(tǒng)的方式:
- 模擬數(shù)千種車內(nèi)場景(人口特征、行為、光照)。
- 實(shí)現(xiàn)攝像頭、紅外和雷達(dá)模態(tài)的完美校準(zhǔn)。
- 針對 GB/T 和 C-NCAP 基準(zhǔn)進(jìn)行預(yù)驗(yàn)證,將物理原型需求減少高達(dá) 80%。
通過使用合成數(shù)據(jù),即使在面對中國監(jiān)管機(jī)構(gòu)的嚴(yán)格審查時(shí),制造商能夠大膽地?cái)U(kuò)展開發(fā)、加速驗(yàn)證并保持安全合規(guī)性。
Anyverse 已通過提供符合 Euro NCAP 的測試場景目錄,幫助 OEM 和一級供應(yīng)商實(shí)現(xiàn) Euro NCAP 合規(guī)。
展開 自動駕駛隱私保護(hù)出路在哪里
技術(shù)創(chuàng)新與隱私保護(hù)似乎陷入了 “非此即彼” 的兩難境地。
三、匿名化應(yīng)對方案
面對數(shù)據(jù)需求與隱私保護(hù)的矛盾,是否存在既能保障研發(fā)進(jìn)展,又能符合法規(guī)要求的解決方案?答案是肯定的 —— 數(shù)據(jù)匿名化技術(shù)為行業(yè)提供了解決思路。《通用數(shù)據(jù)保護(hù)條例》(GDPR)第 26 條注釋明確規(guī)定:“本條例不適用于對匿名信息的處理,包括用于統(tǒng)計(jì)或研究目的的匿名信息處理”,這一表述為合規(guī)的數(shù)據(jù)收集與使用提供了明確依據(jù),其他國家的多項(xiàng)數(shù)據(jù)保護(hù)法規(guī)也有類似條款。
比如深度自然匿名化(DNAT)技術(shù),是專為解決圖像與視頻數(shù)據(jù)中的隱私保護(hù)問題而設(shè)計(jì)的。與傳統(tǒng)模糊化處理技術(shù)不同,深度自然匿名化(DNAT)并非簡單遮蔽個(gè)人身份信息(PII),而是通過先進(jìn)算法自動檢測人臉、車牌等隱私數(shù)據(jù),并生成能夠精準(zhǔn)反映原始屬性的合成替代內(nèi)容。在匿名化過程中,年齡、視線方向、情緒狀態(tài)等對機(jī)器學(xué)習(xí)至關(guān)重要的核心信息得以完整保留,既實(shí)現(xiàn)了個(gè)人與車輛身份的隱私保護(hù),又不影響數(shù)據(jù)分析與模型訓(xùn)練的有效性。
此外,深度自然匿名化(DNAT)技術(shù)還能確保圖像語義分割的一致性(該一致性經(jīng)過專業(yè)檢測),避免了傳統(tǒng)模糊處理導(dǎo)致的信息丟失與上下文斷裂問題,完美平衡了隱私保護(hù)與數(shù)據(jù)可用性。這一解決方案徹底打破了 “創(chuàng)新必須以犧牲隱私為代價(jià)” 的固有認(rèn)知,讓自動駕駛行業(yè)能夠在合規(guī)前提下持續(xù)推進(jìn)技術(shù)迭代。
展開 康謀分享 | 從云端到單機(jī)的數(shù)據(jù)匿名化全攻略
在數(shù)據(jù)驅(qū)動決策時(shí)代,企業(yè)面臨隱私合規(guī)與數(shù)據(jù)利用的雙重挑戰(zhàn)(如PIPL、GDPR等隱私規(guī)定要求)。如何在聚焦效率與合規(guī)平衡,助力汽車、零售等行業(yè)在保護(hù)敏感信息的同時(shí),安全釋放視頻數(shù)據(jù)價(jià)值,破解數(shù)據(jù)處理的合規(guī)與業(yè)務(wù)增長難題?
本文為大家分享基于 AWS Kubernetes 的可擴(kuò)展集群方案和基于 Docker Compose 的單機(jī)方案,助力企業(yè)平衡數(shù)據(jù)安全與業(yè)務(wù)需求。
一、現(xiàn)實(shí)問題
人工智能技術(shù)的爆發(fā)式增長,推動汽車、制造、零售等行業(yè)進(jìn)入 “數(shù)據(jù)驅(qū)動決策” 的新時(shí)代。企業(yè)通過攝像頭采集海量數(shù)據(jù)用于自動駕駛模型訓(xùn)練、生產(chǎn)線缺陷檢測、門店客流分析等場景,但隨之而來的是日益嚴(yán)苛的隱私合規(guī)壓力 —— 歐盟GDPR、中國PIPL等規(guī)定明確要求,敏感數(shù)據(jù)處理需滿足匿名化脫敏存儲等硬性條件。
傳統(tǒng)云端方案雖然便捷,卻面臨侵犯隱私數(shù)據(jù)、跨境傳輸風(fēng)險(xiǎn)、網(wǎng)絡(luò)依賴及成本不可控等問題,越來越多企業(yè)開始尋求本地化匿名化解決方案,在保障合規(guī)性的同時(shí)釋放視頻數(shù)據(jù)價(jià)值。
二、從KBS到單機(jī)Docker的匿名化方案
1、基于 AWS Kubernetes 的彈性集群
關(guān)于“基于 AWS Kubernetes 的彈性集群”方案,下面將從技術(shù)架構(gòu)、模式、服務(wù)支持三方面具體闡述:
(1)隱私優(yōu)先的技術(shù)架構(gòu)
通過 Terraform 在 AWS 專用 VPC 私有子網(wǎng)內(nèi)構(gòu)建 Kubernetes 集群,實(shí)現(xiàn)數(shù)據(jù)全生命周期隔離;集成 Loki、Prometheus、Grafana 監(jiān)控堆棧,實(shí)時(shí)追蹤資源利用率、作業(yè)吞吐量及系統(tǒng)健康狀態(tài),確保處理流程透明可控。這種隱私優(yōu)先的架構(gòu)為大規(guī)模匿名化提供了可靠的安全態(tài)勢和顯著的吞吐量。
(2)雙模式靈活匹配
方案提供兩種模式,適合不同的吞吐量需求和預(yù)算。
展開 SimData:基于aiSim的高保真虛擬數(shù)據(jù)集生成方案
一、前言
在自動駕駛感知系統(tǒng)的研發(fā)過程中,模型的性能高度依賴于大規(guī)模、高質(zhì)量的感知數(shù)據(jù)集。目前業(yè)界常用的數(shù)據(jù)集包括 KITTI、nuScenes、Waymo Open Dataset 等,它們?yōu)樽詣玉{駛算法的發(fā)展奠定了重要基礎(chǔ)。
然而,構(gòu)建真實(shí)世界的感知數(shù)據(jù)集并非易事——不僅需要投入大量人力、物力與時(shí)間成本,還需要面對數(shù)據(jù)采集受限、隱私合規(guī)、標(biāo)注耗時(shí)以及極端場景(corner case)難以獲取等諸多挑戰(zhàn)。
在此背景下,高保真虛擬數(shù)據(jù)集正成為自動駕駛感知算法研究的新方向。通過仿真平臺生成的虛擬數(shù)據(jù),不僅能夠快速擴(kuò)充數(shù)據(jù)規(guī)模,還可靈活構(gòu)造復(fù)雜路況、惡劣天氣及罕見事件,為模型提供更全面的訓(xùn)練樣本。
基于此,本文介紹全新的高保真虛擬數(shù)據(jù)集——SimData。SimData依托aiSim的高精度物理建模與逼真視覺渲染能力,能夠生成多傳感器同步數(shù)據(jù)(包括相機(jī)、激光雷達(dá)、雷達(dá)、IMU 等),實(shí)現(xiàn)與真實(shí)世界數(shù)據(jù)一致的多模態(tài)特性。SimData數(shù)據(jù)結(jié)構(gòu)嚴(yán)格遵循nuScenes數(shù)據(jù)集格式規(guī)范,可直接使用官方nuscenes-devkit工具解析和可視化,大幅降低開發(fā)者上手成本。
本文將介紹SimData的核心特性與構(gòu)建流程,并展示其在典型感知任務(wù)中的表現(xiàn)。SimData 正式版及相關(guān)對比測試報(bào)告將于近期發(fā)布。
二、SimData構(gòu)建過程
1、傳感器布局
在 aiSim 仿真平臺中,我們嚴(yán)格復(fù)現(xiàn)了 nuScenes 數(shù)據(jù)集的傳感器布局,以確保數(shù)據(jù)結(jié)構(gòu)和多模態(tài)同步特性的一致性。 仿真車輛共配置了 6 路環(huán)視相機(jī)、5 個(gè)雷達(dá)(Radar)、1 個(gè)激光雷達(dá)(LiDAR)、1 個(gè)慣性測量單元(IMU)以及 1 個(gè)定位系統(tǒng)(GPS)。 其中,相機(jī)與雷達(dá)的采樣頻率均為 40 Hz,激光雷達(dá)的采樣頻率為 80 Hz,能夠滿足高時(shí)序精度的多傳感器同步采集需求。
展開 AI行業(yè)七大趨勢:合成數(shù)據(jù)、多模態(tài)AI崛起
為了保護(hù)隱私,醫(yī)療行業(yè)、電信以及金融業(yè)開始利用 synthetic data(合成數(shù)據(jù)),為數(shù)據(jù)共享提供更多的機(jī)會。
人工智能賦能產(chǎn)業(yè),正成為引領(lǐng)經(jīng)濟(jì)、科技發(fā)展的重要驅(qū)動力。
在較為低迷的投融資大環(huán)境下,全球投資者對于 AI 的關(guān)注度有增不減。2021 年,全球 AI 初創(chuàng)企業(yè)融資破紀(jì)錄達(dá)到 668 億美元,是 2020 年融資總額的兩倍之多。2022 年 Q1 相較于 2021 年 Q4 融資額下降了12%,但仍低于同期全球風(fēng)險(xiǎn)投資整體下降幅度。
新的一年,人工智能會朝著什么方向發(fā)展?CB Insights 提出了 2022 年值得關(guān)注的七大 AI 趨勢。
合成數(shù)據(jù),保護(hù)隱私
目前,由于 AI 技術(shù)呈指數(shù)級發(fā)展,變得更加先進(jìn),但其局限性仍然存在。例如,某些行業(yè)缺乏足夠的真實(shí)數(shù)據(jù)來訓(xùn)練 AI 模型,又或者合規(guī)隱私成為一些行業(yè)技術(shù)發(fā)展的痛點(diǎn)。
企業(yè)紛紛開始部署 Synthetic data (合成數(shù)據(jù)),即由計(jì)算機(jī)人工生成的數(shù)據(jù),可用于替代自現(xiàn)實(shí)世界中采集的真實(shí)數(shù)據(jù)集。
雖然有人質(zhì)疑合成數(shù)據(jù)模擬真實(shí)數(shù)據(jù)的準(zhǔn)確性,但仍有一些大公司將賭注押在了這項(xiàng)技術(shù)上。
illumina 正在使用由創(chuàng)業(yè)公司 Gretel 開發(fā)的合成基因數(shù)據(jù)進(jìn)行醫(yī)學(xué)研究。在一項(xiàng)聯(lián)合研究中,兩家公司均強(qiáng)調(diào)了,取得患者的知情同意權(quán)等舉措限制了部分醫(yī)學(xué)研究的速度和規(guī)模。Gretel 便使用真實(shí)的基因型和表型數(shù)據(jù)進(jìn)行 AI 算法訓(xùn)練,生成人工基因組合成數(shù)據(jù)。
在金融領(lǐng)域,J.P. Morgan 正在利用合成數(shù)據(jù)訓(xùn)練金融 AI 模型。而在電信行業(yè),由于無法獲得客戶同意,預(yù)計(jì)高達(dá) 85% 的真實(shí)數(shù)據(jù)無法獲取,這給行為分析和預(yù)測造成了極大障礙。西班牙電信公司 Telefónica 與 Most AI 合作,模擬真實(shí)數(shù)據(jù)的統(tǒng)計(jì)模式,創(chuàng)建 GDPR 合規(guī)的客戶合成數(shù)據(jù)檔案。
展開 
人工智能發(fā)展簡史
5.16 聯(lián)邦學(xué)習(xí)(Federated Learning)
聯(lián)邦學(xué)習(xí)(又稱協(xié)作學(xué)習(xí))是一種機(jī)器學(xué)習(xí)技術(shù), 2016 年由谷歌最先提出,它在多個(gè)持有本地數(shù)據(jù)樣本的分散式邊緣設(shè)備或服務(wù)器上訓(xùn)練算法,而不交換其數(shù)據(jù)樣本。這種方法與傳統(tǒng)的集中式機(jī)器學(xué)習(xí)技術(shù)形成鮮明對比,傳統(tǒng)的集中式機(jī)器學(xué)習(xí)技術(shù)將所有的數(shù)據(jù)樣本上傳到一個(gè)服務(wù)器上,而更經(jīng)典的去中心化方法則假設(shè)本地數(shù)據(jù)樣本是完全相同分布的。
聯(lián)邦學(xué)習(xí)能夠使多個(gè)參與者在不共享數(shù)據(jù)的情況下建立一個(gè)共同的、強(qiáng)大的機(jī)器學(xué)習(xí)模型,從而解決數(shù)據(jù)隱私、數(shù)據(jù)安全、數(shù)據(jù)訪問權(quán)限和異構(gòu)數(shù)據(jù)的訪問等關(guān)鍵問題。其應(yīng)用遍布國防、電信、物聯(lián)網(wǎng)或制藥等多個(gè)行業(yè)。
聯(lián)邦學(xué)習(xí)原本用于解決安卓手機(jī)終端用戶在本地更新模型的問題,其設(shè)計(jì)目標(biāo)是在保障大數(shù)據(jù)交換時(shí)的信息安全、保護(hù)終端數(shù)據(jù)和個(gè)人數(shù)據(jù)隱私、保證合法合規(guī)的前提下,在多參與方或多計(jì)算結(jié)點(diǎn)之間開展高效率的機(jī)器學(xué)習(xí)。其中,聯(lián)邦學(xué)習(xí)可使用的機(jī)器學(xué)習(xí)算法不局限于神經(jīng)網(wǎng)絡(luò),還包括隨機(jī)森林等重要算法。聯(lián)邦學(xué)習(xí)有望成為下一代人工智能協(xié)同算法和協(xié)作網(wǎng)絡(luò)的基礎(chǔ)。
5.17 BERT
BERT的全稱為Bidirectional Encoder Representation from Transformers,是一個(gè)預(yù)訓(xùn)練的語言表征模型。BERT論文 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding于2018年發(fā)表,它強(qiáng)調(diào)了不再像以往一樣采用傳統(tǒng)的單向語言模型或者把兩個(gè)單向語言模型進(jìn)行淺層拼接的方法進(jìn)行預(yù)訓(xùn)練,而是采用新的masked language model(MLM),以致能生成深度的雙向語言表征。
展開