當前位置:
首頁 > 最新 > 工業大數據技術綜述

工業大數據技術綜述

工業大數據技術綜述

王建民

清華大學軟體學院,北京 100084

摘要:工業大數據是工業數據的總稱,包括信息化數據、物聯網數據以及跨界數據,是工業互聯網的核心要素。分析了工業大數據的發展背景和主體來源,剖析了工業大數據、企業信息化和工業互聯網之間的相互關係,闡述了工業大數據「多模態、高通量、強關聯」的數據特點以及「跨尺度、產業鏈、跨界」多源數據融合的應用特點,探討了工業大數據軟體系統架構,給出了製造環節的大數據應用實例。

關鍵詞:工業大數據;工業互聯網;大數據軟體;系統架構

doi:10.11959/j.issn.2096-0271.2017057

論文引用格式:王建民. 工業大數據技術綜述[J]. 大數據, 2017, 3(6): 3-14.

WANG J M. Survey on industrial big data[J]. Big Data Research, 2017, 3(6): 3-14.

1工業大數據的發展背景

當前,以大數據、雲計算、移動物聯網等為代表的新一輪科技革命席捲全球,正在構築信息互通、資源共享、能力協同、開放合作的製造業新體系,極大擴展了製造業創新與發展空間。新一代信息通信技術的發展驅動製造業邁向轉型升級的新階段——工業大數據驅動的新階段,這是在新技術條件下製造業生產全流程、全產業鏈、產品全生命周期數據可獲取、可分析、可執行的必然結果。

工業互聯網正處在高速發展時期,國際工業和軟體龍頭企業正在迅速布局工業互聯網技術與產品。2015年8月,美國通用電氣公司率先宣布推出首個面向工業數據和分析的雲平台Predix,如圖1所示。2016年2月,Predix正式對開發者開放;在2016年4月的漢諾威工業博覽會上,西門子公司宣布將推出雲平台MindSphere,到了2017年4月的漢諾威工業博覽會,MindSphere成為西門子公司展區最核心的展出內容,如圖2所示。

圖1 通用電氣Predix平台MRO 5.0

圖2 西門子MindSphere平台

在2017年漢諾威工業博覽會上,總部位於瑞士的ABB集團宣布推出產品ABB Ability,它集成了ABB集團從設備到邊緣計算再到雲服務的跨行業、一體化的數字化能力。總部位於法國的施耐德電氣有限公司也推出了EcoStruxure平台,它綜合了施耐德電氣有限公司的互聯互通產品、邊緣控制以及應用、分析和服務。

國內三一重工股份有限公司、海爾集團、中國航天科工集團公司等企業也開始打造自己的平台,分別推出了三一樹根物聯平台、COSMO平台、航天雲網平台等工業互聯網平台產品,如圖3所示。

圖3 工業互聯網技術與產品舉例

工業大數據是工業互聯網的核心要素。《中國製造2025》規劃中明確指出,工業大數據是我國製造業轉型升級的重要戰略資源,需要針對我國工業自己的特點有效利用工業大數據推動工業升級。一方面,我國是世界工廠,實體製造比重大,但技術含量低、勞動密集、高資源消耗製造的比重也大,實體工廠和實體製造升級迫在眉睫;另一方面我國互聯網產業發展具有領先優勢,過去十多年消費互聯網的高速發展使互聯網技術得到長足發展,互聯網思維深入人心,需要充分發揮這一優勢,並將其與製造業緊密結合,促進位造業升級和生產性服務業的發展。

因此,我國在推進工業大數據的應用過程中,要突出智能互聯產品創新[1],同時兼顧智能製造和製造服務,用數據驅動製造全生命周期從設計、製造到交付、服務、回收各個環節的智能化升級,推動製造全產業鏈智能協同,優化生產要素配置和資源利用,消除低效中間環節,整體提升中國製造業發展水平和世界競爭力。

2工業大數據的內涵

如圖4所示,工業大數據即工業數據的總和,其來源主要包括企業信息化數據、工業物聯網數據「跨界」數據[2,3]。

圖4 工業大數據的來源

企業信息系統存儲了高價值密度的核心業務數據,積累的產品研發數據、生產製造數據、供應鏈數據以及客戶服務數據存在於企業或產業鏈內部,是工業領域傳統數據資產。近年來,物聯網技術快速發展,工業物聯網成為工業大數據新的、增長最快的來源之一,它能實時自動採集設備和裝備運行狀態數據,並對它們實施遠程實時監控。互聯網也促進了工業與經濟社會各個領域的深度融合,人們開始關注氣候變化、生態約束、政治事件、自然災害、市場變化等因素對企業經營產生的影響,因此外部跨界數據已成為工業大數據不可忽視的來源。

人和機器是產生工業大數據的主體。人產生的數據是指由人輸入計算機中的數據,例如設計數據、業務數據等;機器數據是指由感測器、儀器儀錶和智能終端等採集的數據。近年來,由人產生的數據規模的比重正逐步降低,企業信息化和工業物聯網中機器產生的海量時序數據是工業數據規模變大的主要來源,機器數據所佔據的比重將越來越大

3工業大數據的特徵

工業大數據作為對工業相關要素的數字化描述和在賽博空間的映像,首先符合大數據的4V特徵[4],即大規模(volume)、速度快(velocity)、類型雜(variety)、低質量(veracity)。相對於其他類型大數據,工業大數據還具有反映工業邏輯的多模態、強關聯、高通量等新特徵。

多模態是指工業大數據必須反映工業系統的系統化特徵及其各方面要素,包括工業領域中「光、機、電、液、氣」等多學科、多專業信息化軟體產生的不同種類的非結構化數據。比如三維產品模型文件不僅包含幾何造型信息,還包含尺寸、工差、定位、物性等其他信息;同時,飛機、風機、機車等複雜產品的數據又涉及機械、電磁、流體、聲學、熱學等多學科、多專業。

強關聯反映的是工業的系統性及其複雜動態關係,不是數據欄位的關聯,本質是指物理對象之間和過程的語義關聯。包括產品部件之間的關聯關係,生產過程的數據關聯,產品生命周期設計、製造、服務等不同環節數據之間的關聯以及在產品生命周期的統一階段涉及的不同學科不同專業的數據關聯。

高通量即工業感測器要求瞬時寫入超大規模數據。嵌入了感測器的智能互聯產品已成為工業互聯網時代的重要標誌,用機器產生的數據代替人產生的數據,實現實時的感知。從工業大數據的組成體量上來看,物聯網數據已成為工業大數據的主體。以風機裝備為例,根據IEC61400-25標準,持續運轉風機的故障狀態,其數據採樣頻率為50 Hz,單颱風機每秒產生225 KB感測器數據,按2萬颱風機計算,如果全量採集,則寫入速率為4.5 GB/s。總體而言,機器設備產生的時序數據的特點包括海量的設備與測點、數據採集頻度高(產生速度快)、數據總吞吐量大、7×24 h持續不斷,呈現出「高通量」的特徵。

4工業大數據與企業信息化

企業信息化數據是工業領域傳統數據資產,也是工業大數據的第一個來源。在傳統製造業企業信息化系統中,廣義產品生命周期管理(product lifecycle management, PLM)系統主要支持產品開發,企業資源計劃(enterprise resource planning, ERP)系統負責「人財物、產供銷」,供應鏈管理(supply chain management, SCM)系統協調供應鏈,客戶關係管理(customer relationship management, CRM)系統服務於企業客戶和用戶,製造企業生產過程執行系統(manufacturing execution system, MES)負責製造執行,維護、維修和運營(maintenance, repair and operations, MRO)系統支持售後服務等。這些企業信息化系統積累的產品研發數據、生產製造數據、物流供應數據以及客戶服務數據多以結構化數據的形態存儲在企業資料庫系統中,計算機輔助設計(computer aided design, CAD)、模擬等研發軟體產生的非結構化工程數據則通過文件方式管理。

在企業信息化領域,信息系統是數據和流程的綜合體,二者聯繫緊密。圖5是波音公司20多年前「以數據為中心」的信息化架構。20世紀90年代,隨著空中客車公司的崛起,波音公司危機四伏,訂單下降,美譽度也隨之下降。危難之際,波音公司當時新上任的董事長武達德特別注重波音公司信息系統建設,成功解決了「信息孤島」問題,極大地改善了波音公司業績。具體方法就是以數據為中心,把產品數據、工藝數據、項目數據等有機融合在一起,構成邏輯上的單一產品數據源,然後在數據集上重構業務流程。從客服到客戶,提供端到端的服務模式,讓業務流程圍著數據轉。由此可見,流程是產生數據的來源,也是消費數據的歸宿,數據是支持流程無縫、高效運行的原材料,二者不可分離。

圖5 波音公司「以過程為中心」與「以數據為中心」信息化對比分析

從數據流動的視角來看,企業信息化解決了工業領域「有數據」的問題,網路化解決了「能流動」的問題,工業大數據要解決數據「智能化」的問題。「信息化」能夠把正確的數據在正確的時間以正確的方式傳遞給正確的人和機器,「智能化」則把海量的工業數據轉化為信息,信息轉化為知識,知識轉化為科學決策,以應對和解決製造過程的複雜性和不確定性等問題,其目標在於不斷提高製造資源的配置效率。

企業信息化主要解決的是數據單元傳遞問題,工業大數據則主要是基於數據集合分析問題。如圖6所示,這是一個製造業複雜裝備階段活動示意[5],業務活動沿實線部分從上游往下游傳遞,它主要反映了訂單、票據等數據是否正確,這是信息化過程中需要解決的核心問題。虛線主要是反饋部分,通過分析數據集發現業務規律和決策準則,然後反饋給前面的各個環節使用,從而形成數據全生命周期的閉環,這就是信息化和大數據智能化的區別,然而兩者又是不可分割的。

圖6 信息化與大數據:數據單元傳遞與數據集合分析

5工業大數據與工業互聯網

工業互聯網可以從網路、數據和安全3個方面理解。其中,網路是基礎,即通過工業全系統的互聯互通,促進工業數據的無縫集成;數據是核心,即通過工業數據全周期的應用,實現機器彈性生產、運營管理優化、生產協同組織與商業模式創新,推動工業智能化發展;安全是保障,即通過構建涵蓋工業全系統的安全防護體系,保障工業智能化的實現。工業互聯網的發展體現了多個產業生態系統的融合,是構建工業生態系統、實現工業智能化發展的必由之路。

工業大數據是智能製造與工業互聯網的核心,其本質是通過促進數據的自動流動解決控制和業務問題,減少決策過程帶來的不確定性,並盡量克服人工決策的缺點。隨著互聯網與工業的深度融合,機器數據的傳輸方式由區域網絡走向廣域網路,從管理企業內部的機器拓展到管理企業外部的機器,支撐人類和機器邊界的重構、企業和社會邊界的重構,釋放工業互聯網的價值。

6工業大數據典型應用場景

工業大數據的應用主要是實現製造業企業生命周期的智能化水平提升,以智能化生產為核心,涵蓋了從設計研發、生產製造、經營管理到售後服務的整個流程,實現提質增效。隨著工業互聯網的發展,企業的數據從內部數據實現了跨界,應用也隨之拓展到「互聯網+用戶」「互聯網+產業鏈」「互聯網+服務」等場景。工業互聯網產業聯盟發布的《工業互聯網體系架構》對此進行了總結,將其分成了4類典型場景:智能化生產、個性化定製、網路化協同、服務化延伸。

以採礦為例,圖7是未來智慧礦山的場景。傳統礦山經營過程中有很多裝備,一般是按照數月前擬定的計劃生產,不能很好地滿足市場的實際需求,經常會存在過度生產或者生產不足的問題[6]。未來可以通過工業大數據直接感知市場需求,通過市場分析可以知道哪一種鐵礦石配比在當前市場上適銷,據此確定各種鐵礦石的生產需求,並制定生產計劃,然後實時將操作命令下達到相應的智能化工程裝備,指揮這些工程裝備協同工作,這就是跨尺度的信息集成和優化。也就是說,把當天的市場需求通過大數據挖掘出來,直接傳達到設備上,變成設備的行動和操作。還可以通過設備網路化,實時獲取裝備工況數據。當工程裝備出現問題或異常時,及時地發現問題,找到問題的原因。另外,還可以通過大數據構建基於規則或案例的故障預測系統,對裝備狀態進行預測,更好地保障設備健康。

圖7 未來智慧礦山的場景

由此可見,工業大數據是提升工業生產效率,降低能耗,轉變高耗能、低效率、勞動密集的粗放型生產面貌的必要手段。結合數控機床、工業機器人等自動生產設備的使用,並建立從經營到生產系統貫通融合的數據流,做到數據全打通和數據流通不落地,可以提升企業整體生產效率,降低勞動力投入,有效管理並優化各種資源的流轉與消耗。大數據也是實現工業企業從製造向服務轉型的關鍵支撐技術。工業領域智能服務的本質就是智能產品加上感知控制能力和大數據分析,通過對產品使用過程中的自身工作狀況、周邊環境、用戶操作行為等數據進行採集和分析,可以提供在線健康檢測、故障診斷預警等服務以及支持在線租用、按使用付費等新的服務模型。

7工業大數據軟體架構

圖8是基於資料庫視角的大數據系統軟體技術架構,涉及物聯網、資料庫、數據處理、流處理、數據分析、批處理和機器學習等技術。關係資料庫存放的是結構化的關係數據,是企業信息化支撐技術,資料庫是先有模式後有數據,即先定義資料庫表,然後才能插入數據;與資料庫不同,互聯網、物聯網等產生的大多是非結構化數據,這些數據往往是設備產生的,先有數據,後有模式。

圖8 基於資料庫視角的大數據系統軟體技術架構

在工業的ERP、PLM、SCM、CRM等系統中,20%的「SQL小數據」具有80%的價值密度,而物聯網或互聯網中,80%的「非結構化大數據」密度只有20%的價值密度,甚至更低。因此,工業數據中20%的工業「小數據」需要「引爆」80%的工業「大數據」的價值。工業大數據應用本質就是要綜合利用結構化數據和非結構化數據,從中提煉出隱含的模式,形成知識,從而使工業製造和服務更加智能化

工業大數據更關注數據源的「完整性」,而不僅僅是數據的規模,因此對數據管理有較高要求。工業大數據應用需要實現數據在物理信息、產業鏈、跨界3個層次的融合。由於「信息孤島」的存在,這些數據源通常是離散和非同步的,這與其他領域大數據集成具有明顯差異,因此不僅需要從數據模型,更需要從製造過程、層次化物料表(bill of material,BOM)結構、運行環境等多類型工業語義層面對工業大數據進行一體化整合管理,其中BOM是產品全生命周期數據集成的關鍵手段。

工業大數據生命周期包括採集、管理、處理、分析和應用5個環節。工業大數據處理是一個數據集到另一個數據集的「物理」過程。工業大數據分析就是要利用機器學習、深度網路等人工智慧演算法,從訓練數據集里學習未知的模型,這個模型就是一個基於數據集(X,Y),求Y=F(X)計算式中F函數的過程。簡而言之,工業大數據分析是從訓練數據集到模型的「化學」過程。

工業大數據應用在工業互聯網中的應用可分為4個層次:監視、控制、優化、自主。監視就是要能遠程實時監測裝備的運行狀態;控制就是要實現操作者對機器的遠程遙控,讓機器能夠執行操作者遠程下達的操作指令;優化就是要基於海量工業大數據發現知識,提供在線運行調度、健康檢測、故障診斷預警等裝備在線運維服務;自主就是要實現裝備的自主決策和裝備集群的自主協同,通過「機器換人」實現生產運維的少人化和無人化。

8工業大數據典型應用舉例

圖9是一個伺服器主板生產流程。上料之後,第一個業務環節是錫膏印刷,然後是貼裝電子元組件,之後是迴流焊,看起來是一個比較簡短的流程,但生產過程中會出現器件偏移、立碑、覆蓋件漏印、爬錫短路等故障。電子器件因此將會出現質量問題,會給生產廠商造成嚴重的經濟和聲譽損失。

為了解決這個問題,在生產線流程中增加了兩個自動化質量檢測環節,如圖10所示。

相比於圖9,圖10增加了錫膏印刷檢測(solder paste inspection,SPI)和自動光學檢測(automatic optic inspection,AOI)環節。增加這兩個檢測環節後,需增加人工復判環節,而由於人工復判存在不穩定的問題,質量檢測成功率並未達到預期要求,企業為此付出了較大的人力成本,甚至經濟損失。

圖9 電子元器件表面貼裝生產流程

圖10 加入檢測環節後的電子器件表面貼裝生產流程

基於積累的主板焊點SPI質量檢測數據和主板AOI質量數據,採用基於機器學習的智能復判演算法,判定焊點質量合格率。由於這些不同類型故障的數據是相互交織在一起的,需要用機器學習的辦法進行複雜的數據集分類,然後採用隨機森林的辦法形成了一個基於人工智慧的電子器件表面貼裝「故障復判機器人」。該演算法只需要把5個參數輸入,就可以判斷伺服器主板每個焊點是否合格,極大提升了伺服器主板製造的品質穩定性與合格率。

9結束語

工業大數據創造價值的過程才剛剛開始,工業大數據的價值不僅在於對現有業務的優化,更在於支撐企業、行業乃至全社會的創新、轉型和發展。伴隨著工業互聯網的不斷普及,工業大數據應用價值將逐步釋放,智能製造也將得到長足發展。當前,工業大數據仍處在高速發展的歷史階段,其概念內涵、技術方法、價值創造模式還在不斷創新演化之中,需要努力和大膽地創新實踐。應該針對智能製造和工業互聯網的創新需求,把工業大數據的應用與工業自身提高質量、降低成本、提升管理水平的需求結合起來,特別要與中國工業的發展階段和結構特點結合起來,走出有中國特色的工業大數據技術與產業創新路線,助力中國工業彎道取直與加速騰飛。

致 謝

感謝清華大學軟體學院、大數據系統軟體國家工程實驗室、北京工業大數據創新中心和工業大數據系統與應用北京市重點實驗室的同事們。

點擊下方閱讀原文即可獲取全文

作 者簡 介

王建民(1968?),男,博士,清華大學軟體學院教授、博士生導師、院長,信息學院副院長,數據科學研究院副院長、管理委員會副主任,大數據系統軟體國家工程實驗室執行主任,工業大數據系統與應用北京市重點實驗室主任。主要研究方向為大數據系統軟體、工業大數據、產品全生命周期管理、業務過程管理等。

《大數據》期刊

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據期刊 的精彩文章:

海洋大數據關鍵技術及在災害天氣下船舶行為預測上的應用

TAG:大數據期刊 |