
發布
注冊
/
登錄大數據服務的案例
案例 | 法院大數據管理和平臺建設
這其中,就有剛剛在首屆數字中國建設峰會中入選數字中國建設年度最佳實踐并被重點推介的人民法院大數據管理和服務平臺。
近年來,最高人民法院大力推進人民法院大數據管理和服務平臺建設,積極運用司法大數據提升審判質量和效率,服務法官辦案和人民群眾,并為國家治理提供決策和參考。
破除“孤島” 挖掘“富礦”
當今時代,被稱為是“大數據時代”,世界各國都在搶抓先機,紛紛制定并實施大數據行動計劃,運用大數據蘊藏的巨大潛力和能量,大數據革命正在引發新一輪全球各國治理能力的深刻變革。
司法大數據,被稱為是觀察社會的“第三只眼”。人民法院審理的案件信息覆蓋民事、商事、刑事、行政等各個方向,是經濟社會發展和人民群眾生產生活動的晴雨表、風向標,也被譽為是大數據時代的司法“富礦”。
在人民法院大數據管理和服務平臺建設之前,盡管全國3500多家法院每天都產生大量的司法信息數據,但是各地數據標準不兼容、系統不連通、資源不共享,一個個信息“孤島”,阻礙了司法大數據潛在價值的實現。
通過大數據管理和服務平臺建設,實現全國人民法院“一組數”,進而通過數據深度分析利用,服務法官辦案和人民法院決策,準確研判經濟運行風險、社會發展動態,國家立法需求等國家治理內容,有效引導社會治理模式變革,加快實現國家治理能力和治理體系的現代化,是最高人民法院響應國家大數據發展、創新驅動、數字中國等國家戰略的重要戰略部署。
2014年7月1日,人民法院大數據管理和服務平臺正式上線,經過近4年的建設,大數據平臺已累計匯聚1.4億件案件信息,除案件、文書和卷宗等審判執行信息外,還匯集了司法人事、司法政務、司法研究、信息化管理、外部數據等六大數據體系全面豐富的數據資源,已發展成為全球最大的審判信息資源庫。
展開 我國基本建成地球科學“一張圖”大數據體系 地質調查傳統模式徹底改變
5月26日,自然資源部中國地質調查局宣布,國家地球大數據共享服務平臺“地質云3.0”正式上線服務,我國基本建成了地球科學“一張圖”大數據體系。
此次發布的“地質云3.0” 大數據共享服務平臺實現了12顆國產遙感衛星、2萬余個地下水監測點以及地質災害、海岸帶地質環境、土壤質量地球化學、地面沉降等動態監測數據的實時云上服務,徹底改變了我國地質調查的傳統模式。
自然資源部中國地質調查局地質大數據與信息服務工程首席專家 高振記:你走到哪里,你周邊的地質資料地質信息就跟隨你推送到哪里,我們在野外拿著手機終端就可以調查采集數據,實時地傳回到我們的云上,我們的云端就可以進行處理和分析,這個是再造了我們整個地質調查的流程。
除此之外,“地質云3.0” 大數據共享服務平臺內容包括基礎地質、能源礦產、水資源、土地資源等11大類98個核心數據庫,新增了山水林田湖草等自然資源調查數據,增加了地球化學、地球物理、鉆孔等重要的原始數據,整合構建了地球科學“一張圖”大數據。
自然資源部中國地質調查局總工程師室信息處處長 屈紅剛:實現了我們國家層面歷史的成果地質資料數據、重要原始地質資料數據、山水林田湖草等自然資源調查數據、地質環境等這種實時監測數據的一體化集成和深度整合,為我們整個國家戰略和社會的廣泛需求提供了一個權威的信息服務。
展開 吳恩達:AI是時候從大數據轉向「小數據」了
注:基礎模型是Percy Liang和吳在斯坦福大學的一些朋友創造的一個術語,指的是在非常大的數據集上訓練的巨大模型,這種模型可以針對特定的應用進行調整,例如GPT-3。
過去十年里,面向消費者的企業由于擁有大量用戶群(有時甚至高達數十億),因此獲得了非常大的數據集得以開展深度學習。這給它們帶來了不少經濟價值,但我發現這種法則不適用于其他行業。
IEEE Spectrum:你前面提到,一些公司或機構只有少量數據可供使用。以數據為中心的人工智能如何幫助他們?
吳:
像很多視覺模型都是用數百萬張圖像構建的,我也曾經花3.5億張圖像搭建了一個人臉識別系統。但這種模型在只有50張圖像的數據集上卻沒法運行。不過事實證明,如果你有
50個非常好的數據
,你也可以做出有價值的東西,比如缺陷檢查系統。在許多根本不存在巨型數據集的行業,我認為重點必須
從大數據轉向優質數據
。有50個經過深思熟慮的實例就足以向神經網絡解釋你想要它學會什么。
IEEE Spectrum:
用50張圖像訓練一個模型的意思是在一個用大數據集訓練好的現有模型上對其進行微調嗎?還是說這是一個全新的模式,就從這個小數據集上學習?
吳:
我來講一下
Landing AI
是做什么的吧。在給制造商提供暇疵檢查服務時,我們一般就用帶有我們自己風格的RetinaNet。它是一個預訓練模型。話說過來,預訓練只是難題的一小部分,更大的難題是提供一個工具讓制造商能夠選擇正確的圖像集(用于微調),并用一致的方式對圖集進行標記。面對大數據集的應用時,我們的通常反應都是如果數據有噪音也沒關系,所有數據照單全收,算法會對其進行平均(average over)。
展開 大鍛件大數據系統架構的研究
數據采集途徑
開發應用工藝質量信息系統
⑴目的和意義。
研究者曾對國內主要大鍛件企業的工藝和質量信息化情況進行過調研。注意到,國內大鍛件企業工藝和質量信息化方面還存在空白。要想有大鍛件工藝和質量數據的積累,要想能科學分析工藝和質量問題,必須盡快開發、建立和應用先進的大鍛件工藝、質量信息系統。為此,研究者開發了一種系統雛形。
⑵原理和特點。
根據鍛壓工藝原理、大鍛件生產質量影響因素、質量檢驗和質量記錄過程、大鍛件鍛壓工藝和質量的參數化方法、管理信息系統開發原理和經驗,利用微軟免費關系型數據庫ACCESS、服務表單InfoPath及VBA編程語言等,研究開發出了鍛壓工藝及質量信息集成管理信息系統的雛形。圖3為該系統主菜單,包含鍛壓工藝數據、熱送鋼錠信息、鍛壓記錄、檢驗記錄和查看其他信息共五個信息輸入部分及1個預覽查詢各種自動報告的功能。
鍛壓工藝界面輸入數據后可自動生成安排生產的鍛件明細表;可通過網絡授權快速查詢所有輸入的工藝信息及圖形附件;進一步開發后,還可根據參數自動生成動態的鍛壓工藝卡。當某時期的生產數據輸入后,可自動關聯;檢驗記錄輸入后,則可生成智能的鍛壓工藝質量自動分析報告。
該系統借鑒了著名歐美跨國公司應用信息技術的成功經驗,結合大鍛件企業實際情況和需要,形成了鍛壓工藝和質量集成管理信息系統雛形。系統能將小樣本統計學、工藝參數化方法、設備工藝質量數據集成方案等再次集成,形成智能的記錄和自動分析系統,利于不斷改進,可成為穩定和提高大鍛件質量的基礎平臺。
圖3 鍛壓工藝質量記錄信息系統主菜單
設備數據提取
⑴生產設備數據提取。
隨著我國大鍛件生產設備的飛速發展,新的萬噸壓機和操作機都有了測量數據的計算機屏顯。國內部分企業還實現了數據自動存儲。
展開 
大數據應用,數據中心將采用機器人監控機柜中的熱點
很多企業的內部部署數據中心具有可以去除機架門或機柜門的優點,或者可以機柜不用上鎖以便更快速地訪問。
但是在多個客戶和供應商可以訪問的主機托管或托管數據中心設施中,柜門對于安全性非常重要。
有些客戶甚至在進行嚴格的審核才能打開柜門,但即使是機架中的設備組合也是經常對外保密,并且使用安全的柜門可以避免成本高昂的損失。
但封閉的機柜為監控數據中心的冷卻效率帶來新的挑戰。
"人們通過智能遙測技術,幾乎知道所有需要知道的信息,其中包括數據中心地板空間、IT服務器、機柜中氣流,以及正在產生的熱量,以及是如何產生的熱量等。
但是如果關閉柜門,就關閉了一個很好的觀測機械內部動態的窗口。"
OneNeck IT Solutions高級副總裁Hank Koch表示,該公司運行多個多租戶數據中心,其是包括托管數據中心和主機服務。
"如果工作人員打開柜門,那么就會改變其熱力學和空氣流體動力學。"
他說,"如果工作人員正在研究冷熱機柜的設備之間的相互作用,或者鄰近的比較敏感的設備之間的相互作用,而關閉柜門,那就沒有辦法找到任何熱輻射問題的根源。"
來自數據中心其他地方甚至CPU的溫度讀數無法幫助工作人員計算機柜內不同位置的空氣溫度。
許多客戶對數據中心運營商將傳感器放入其機柜內并不滿意,而他們會認為托管數據中心服務商這樣做會導致這些機柜發生任何的熱量問題。
為了解決這個問題,OneNeck公司在愛荷華州的數據中心團隊開發了一種機器人傳感器探頭,該探頭適用于標準機柜,無需鉆孔或需要安裝特殊硬件,通過藍牙外部控制,并上下移動皮帶驅動導軌,可以收集機架每個單元的溫度數據,并創建完整的熱圖。
展開 全球10大智慧城市大數據應用案例
隨著互聯網和信息化的發展,在云平臺、大數據和物聯網等技術的支持下,率先在美國“智慧星球”概念下誕生的“智慧城市”,逐漸成為當今世界各國城市建設的發展趨勢和選擇。
1.迪比克
迪比克市是美國第一個智慧城市,也是世界第一個智慧城市,它的特點是重視智能化建設。為了保持迪比克市宜居的優勢,并且在商業上有更大發展,市政府與IBM合作,計劃利用物聯網技術將城市的所有資源數字化并連接起來,含水、電、油、氣、交通、公共服務等,進而通過監測、分析和整合各種數據智能化地響應市民的需求,并降低城市的能耗和成本。
該市率先完成了水電資源的數據建設,給全市住戶和商鋪安裝數控水電計量器,不僅記錄資源使用量,還利用低流量傳感器技術預防資源泄漏。儀器記錄的數據會及時反映在綜合監測平臺上,以便進行分析、整合和公開展示。
2. 紐約
通過數據挖掘,有效預防了火災。據統計,紐約大約有100萬棟建筑物,平均每年約有3000棟會發生嚴重的火災。紐約消防部門將可能導致房屋起火的因素細分為60個,諸如是否是貧窮、低收入家庭的住房,房屋建筑年代是否久遠,建筑物是否有電梯等。
除去危害性較小的小型獨棟別墅或聯排別墅,分析人員通過特定算法,對城市中33萬棟需要檢驗的建筑物單獨進行打分,計算火災危險指數,劃分出重點監測和檢查對象。目前數據監測項目擴大到2400余項,諸如學校、圖書館等人口密集度高的場所也涵蓋了。盡管公眾對數據分析和防范措施的有效性之間的關系心存疑慮,但是火災數量確實下降了。
3. 芝加哥
通過“路燈桿裝上傳感器”,進行城市數據挖掘。在人們的生活里,無處不在的傳感器被應用在了芝加哥市的街邊燈柱上。通過“燈柱傳感器”,可以收集城市路面信息,檢測環境數據,如空氣質量、光照強度、噪音水平、溫度、風速。
展開 【高速傳輸】數據量激增,處理吃緊?高速光纖通信板實現的大數據高速處理方案
實際上,機器視覺中的圖像分散式處理,可以在大型顯示器制造、高速圖案印刷、物流系統、大數據中心等眾多領域廣泛應用。它將通過高效處理大數據為工業自動化應用提供解決方案。
郭臺銘:云端大數據分析將成為八大生活的基石
5月26日,2015貴陽國際大數據產業博覽會暨全球大數據時代貴陽峰會在貴陽開幕。富士康科技集團創辦人兼總裁郭臺銘在演講中說,將來在三網融合的基礎上,云端大數據分析將成為富士康“八大生活”的基石,也是寬帶中國的實際應用,透過云網端的串接,富士康的“八大生活”應用將貫穿我們每一天,云端大數據分析將為全人類打造一個智能生活網。
郭臺銘說,富士康集團已從一個制造業轉型為六流公司,所謂六流,其實是在大數據產業中一個關鍵的信息處理技術,大數據咨詢處理過程中蘊含著信息流、技術流與資金流、人員流、物料流、過程流這六個方面。六流哲理深藏在公司治理、產業創新、應用凈化過程中,因為六流的虛實結合,軟硬整合,才能貫穿整個大數據的應用,讓大數據的積累更有意義,更進而轉化為有用的作為決策的小數據,幫助我們創新與分析決策。透過這些有用的小數據,可以邁向萬物聯網的智能社會,這就需要這六流來幫公司進行轉型,進而實現互聯網+八大生活,這也是富士康在轉型過程中不忘的重要使命。我們可以采取更多的有用的大數據,再通過六流分析為我們創造智能生活。
“富士康打造全球最先進的服務器與數據中心,提供更綠色、更智能的云端儲存技術服務。”郭臺銘介紹。在移動終端方面,富士康已經是全球最大移動終端制造廠;在物聯網方面,富士康正在全力推動在工業自動化與機器人配合工業版4.0的演進,富士康將全力投入在萬物聯網方面的關鍵技術,尤其在中國制造2025中將全力參與,絕不缺席。
郭臺銘認為,在互聯網+時代,富士康的八大生活就是包括工作生活、教育生活、娛樂生活、家庭生活、安全生活、采購與交易生活、交通環保生活。
展開 干貨|如何從客戶服務中解鎖數據營銷
(5)你明白為什么數據如此重要了嗎?
所有這些信息都有實際用途,不僅僅是更好地了解你的客戶。
考慮一下你的營銷策略,你在搜索引擎優化(SEO)中使用的關鍵詞和你在銷售頁面上的副本已經在轉換了,對嗎?
如果你能提高利率呢?
你可以使用客戶自己的語言來增強你的文案,包裝強大的情感沖擊力,或者通過為他們定制的電子郵件活動來取悅他們。
任何營銷人員都不應該忽視信息的來源,因為這些信息可以以多種方式使用。
以下是你應該注意的地方:
一、回頭客,你品牌的潤色劑
當談到銷售時,很多注意力都放在了獲取新客戶上。
獲得新客戶是件好事,但你可能忘記了這個等式的一個重要部分——留住客戶,或者讓你的已有客戶繼續購買你的產品或服務。
顧客的旅程不會在他們從你這里購買之后結束。這只是其中一個階段的結束,所以不要把它們晾在一邊。
說服你現在的客戶反復購買對你的數據有直接的影響。
這只是其中的一部分,但不要忽略另一個你需要關注的原因。
與新客戶相比,老客戶更有可能購買和花費更多的錢。
關于客戶保留率,有很多數據點,包括:
(1)你的產品或服務的價格,從選擇加入或報價形式轉換的次數。
(2)你的網站設計有多好,例如,一個高的跳出率可能表明您的站點沒有很好地構建,因為人們離開得很快。
(3)站點的總體性能,例如,較長的加載時間對轉換率有負面影響。
(4)你提供的產品或服務,例如,客戶因遇到問題而與客服聯系的頻率,以及問題在第一次對話中得到解決的頻率。
但還有一個很大的因素是你的客戶服務和后續跟進是如何規劃的。他們點擊購買按鈕后會發生什么?
如果答案是“好吧,不多”,那么你就得到了一個黃金機會。
深入研究你的客戶服務數據,看看你做的哪些是對的,哪些是可以改進的。
展開 我國公安交通管理大數據應用現狀與成果
第三,互聯網交通安全服務平臺建設
我們設計開發了互聯網交通安全服務平臺以及手機12123 App,前者涵蓋了手機約考、手機選號、網上交罰款、快速理賠等功能;12123APP已經成為 “交通管理+互聯網服務”的一個品牌,目前實際注冊用戶1.8億,App下載量1.7億,日均訪問量15000萬次,服務群眾超過7億多次。
目前,駕駛員用手機App約考駕校科目一、科目二、科目三的大概有4.2億次。用手機在家里選號的有500多萬人次。在網上交罰款處理的也有9000多萬次,還有快速理賠流程。前幾天我在蘋果官網上看到一周內的APP下載熱度排行榜,12123 APP排在抖音后面,第二位,第三才是微信。目前12123已經成為交通管理+互聯網服務的品牌,前兩天剛好在寧波開了全國交管“放管服”工作的部署,很多措施都要依托12123系統去實現。
第四,大數據應用
有了上面三個系統的建設,我們匯聚了海量的信息,怎么用?目前交科所里建立了一個大數據平臺,數據分析研判的效益提升了將近100倍。交科所是全國交管數據中心,匯聚了海量大數據資源,包括170億條機動車、駕駛員基礎數據,包括車輛、駕駛員、交通事故、交通違法等信息;大約有2000億條路面動態數據,每天數據增量4億多;還有互聯網的路況數據,與百度、高德共享信息。這些數據都是通過十多年來的信息化建設,通過信息系統的龐大用戶規模積累起來的。
這些數據,我們主要應用于路面管控、業務監管、信息安全、公眾出行。以下是幾個大數據的應用案例。
01大數據+路面管控
我國現有5000多個省際、市際的公安檢查站和執法站,每天這么多的檢查站,實際上都是后臺海量數據在為路面執法檢查的時候提供跨省機動車、高風險駕駛員等對比信息服務。通過大數據平臺進行套牌車分析、流量預測、失駕駕駛員分析等。
展開 大數據與AI時代
作者 | 一驥絕塵
出品 |
焉知
什么是大數據?
“大數據”這個詞相信大家都十分熟悉。從字面理解,這不就是很多很多的數據嗎?
那什么是很多很多的數據呢?戰國時代,五輛馬車裝載的竹簡就是很多很多的數據。到宋代,壘起來跟人一樣高的書籍就是很多很多的數據。到我小時候,1.44MB的軟盤里就承載了很多很多的數據。時至今日,256GB基本是手機存儲容量的標配,1TB硬盤里的存儲空間也經常捉襟見肘。經常談論到PB和EB(1PB=1024GB,1EB=1024PB),才讓人感覺到數據量確實很多很多。
圖1:大數據概念圖
對于大數據,很多機構和學者都給出了不同的定義,例如研究機構Gartner給出了這樣的定義:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。麥肯錫全球研究所給出的定義是:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合。
那我們怎么來理解大數據呢?實際上我們可以從大數據的3V特征來剖析。
圖2:大數據與其3V特征
Volume
指的是數據總量大,一般來說其數據量起碼超過一臺計算機的內存和硬盤容量。例如2020年12月的微博月活躍用戶數為5.21億,微信月活用戶數則為12.25億。其產生的數據總量是巨大的。
Velocity
指的是數據產生和變化的速度快。例如世界上平均每分鐘就會有2億封郵件發送出去。
展開 
大數據智能決策.
基于大數據的科學決策,是公共管理、工業制造、醫療健康、金融服務等眾多行業領域未來發展的方向和目標.如何進行大數據的智能分析與科學決策,實現由數據優勢向決策優勢的轉化,仍然是當前大數據應用研究中的關鍵問題.然而,對大數據的分析和處理在不同行業和領域均存在著巨大的挑戰,大數據的大體量、高通量、多源異構性和不確定性等對傳統的數據處理硬件設備和軟件處理方法均構成前所未有的挑戰.目前,機器學習、數據挖掘及統計理論等傳統理論方法已經廣泛地應用于大數據分析,但多數方法是建立在“獨立同分布” 的假設之上,難以應對大數據的不確定性顯著、關聯復雜、動態增長、來源和分布廣泛等問題,多數只能挖掘到底層的數據特征,而對于挖掘高層次的符合人類認知的知識依然無法取得較好的效果,難以高效地將大數據轉化為決策價值.基于大數據的智能決策是一門集應用性和科研性于一體的學科領域,目前還存在眾多待研究的問題.大數據智能決策在內涵外延、模型理論、技術方法及實施策略等方面還需要人們繼續投入更多的研究與實踐.
展開 揭秘阿里服務互聯網金融的關系數據庫——OceanBase(轉)
時至今日,“Big data”(大數據)時代的來臨已經毋庸置疑,尤其是在電信、金融等行業,幾乎已經到了“數據就是業務本身”的地步。這種趨勢已經讓很多相信數據之力量的企業做出改變。為了應對大數據的沖擊,淘寶將以前的Oracle、小型機、高端存儲模式轉變到現今的MySQL、OceanBase、Hbase、MongoDB等數據庫,并使用普通PC服務器。本篇文章來自螞蟻金服高級研究員陽振坤,將會介紹OceanBase如何服務互聯網金融業務,以及實現過程中的一些技術細節。
OceanBase進入金融級應用
4月2日,螞蟻金服方面宣布,螞蟻金服及阿里巴巴自主研發的通用關系數據庫OceanBase已經開始支撐淘寶、天貓和聚劃算的所有日常交易。這個改變意味著OceanBase已經有能力滿足互聯網海量數據處理的需求,可以支撐復雜、高可靠的金融級業務。
隨著互聯網的發展,海量數據的處理越來越成為擺在大型互聯網公司面前的問題。而傳統的IT企業提供的服務,在系統可擴展性、性價比方面已經不再適用。
以數據庫系統舉例,一般來說,數據庫系統的穩定可靠,取決于數據庫軟件、數據庫服務器和數據庫存儲三方面。其中,數據庫軟件的維護升級總是讓互聯網企業比較頭疼:數據庫軟件的維護升級有很大的風險,為了保障數據庫系統的穩定可靠,企業需要匹配使用穩定性好的高端服務器和共享存儲,但是這些設備不僅價格昂貴,性能和擴展能力也有限。
在這種情況下,2010年起,阿里巴巴、螞蟻金服開始自主研發數據庫系統OceanBase,這一系統從立項到開花結果經歷了足足五年時間。
與傳統數據庫公司的產品相比,OceanBase的升級維護,不需要昂貴的共享存儲、高可靠的服務器、數據庫軟件的許可費,可以將商業數據庫成本降到一半以下。
展開 ArcGIS地理大數據實踐
目錄:
什么是大數據
——What is big data
空間大數據的傳統策略
——當互聯網遇上空間分析
現實的挑戰很嚴峻
——當量變成為質變的時候
大數據中,我們能做什么?
——We are action in Big data
大數據帶來的思考
——Think in Big data
1、什么是大數據?
——What is big data
現今大數據的幾種認識:
數據量大就是大數據
不用(傳統)數據庫就是大數據
用了Hadoop,就是大數據
我們是否可以憑借上面的條件判斷呢?當然不,那么用什么條件呢?
展開 北鯤云超算平臺如何為生命科學研究提供數據歸檔與存儲服務?
北鯤云超算平臺提供的服務允許將所有的東西都刻在光盤上并且把一大摞硬盤給用戶,用戶不用擔心‘嫁給’云一輩子。
然而對于通用的存儲來說,云可以提供意外事故和本地災害的保護,因為云服務一般會在多個地點復制數據。“可能其中一個數據中心被流星擊中,另一個中心又有火山爆發,但是你還是能夠得到另一個數據備份。這就是云平臺的優勢。