工業(yè)大數據的三大來(lái)源、三大關(guān)鍵問(wèn)題、三個(gè)實(shí)施案例
2011年麥肯錫全球研究院大數據報告表明,2009年美國以裝備制造為代表的離散工業(yè)領(lǐng)域擁有的數據規模為各領(lǐng)域之首,比美國政府擁有的數據還要多。近年來(lái),隨著(zhù)德國工業(yè)4.0和美國工業(yè)互聯(lián)網(wǎng)為代表的新工業(yè)革命深入發(fā)展,以及“中國制造2025”、“互聯(lián)網(wǎng)+”行動(dòng)計劃與“促進(jìn)大數據發(fā)展行動(dòng)綱要”的頒布實(shí)施,工業(yè)大數據得到了越來(lái)越多的關(guān)注。這里分享一下我們的思考與實(shí)踐。
1、工業(yè)大數據三大來(lái)源
企業(yè)信息系統、裝備物聯(lián)網(wǎng)和企業(yè)外部互聯(lián)網(wǎng)是工業(yè)大數據的三大來(lái)源:
企業(yè)信息系統存儲了高價(jià)值密度的核心業(yè)務(wù)數據。上世紀60年代以來(lái)信息技術(shù)加速應用于工業(yè)領(lǐng)域,形成了產(chǎn)品生命周期管理(PLM)、企業(yè)資源規劃(ERP)、供應鏈管理(SCM)和客戶(hù)關(guān)系管理(CRM)等企業(yè)信息系統。這些系統中積累的產(chǎn)品研發(fā)數據、生產(chǎn)制造數據、物流供應數據以及客戶(hù)服務(wù)數據,存在于企業(yè)或產(chǎn)業(yè)鏈內部,是工業(yè)領(lǐng)域傳統數據資產(chǎn)。
近年來(lái)物聯(lián)網(wǎng)技術(shù)快速發(fā)展,裝備物聯(lián)網(wǎng)成為工業(yè)大數據新的、增長(cháng)最快的來(lái)源,它實(shí)時(shí)自動(dòng)采集了生產(chǎn)設備和交付產(chǎn)品的狀態(tài)與工況數據。一方面,機床等生產(chǎn)設備物聯(lián)網(wǎng)數據為智能工廠(chǎng)生產(chǎn)調度、質(zhì)量控制和績(jì)效管理提供了實(shí)時(shí)數據基礎;另一方面,2012年美國通用電氣公司提出的工業(yè)大數據(狹義的),專(zhuān)指裝備使用過(guò)程中由傳感器采集的大規模時(shí)間序列數據,包括裝備狀態(tài)參數、工況負載和作業(yè)環(huán)境等信息,可以幫助用戶(hù)提高裝備運行效率,拓展制造服務(wù)。
當前互聯(lián)網(wǎng)與工業(yè)深度融合,企業(yè)外部互聯(lián)網(wǎng)已成為工業(yè)大數據不可忽視的來(lái)源。本世紀初,日本企業(yè)就開(kāi)始利用互聯(lián)網(wǎng)數據分析獲取用戶(hù)的產(chǎn)品評價(jià),時(shí)至今日,小米手機利用社交媒體數據成功實(shí)現產(chǎn)品創(chuàng )新研發(fā)。此外,外部互聯(lián)網(wǎng)還存在著(zhù)海量的“跨界”數據,比如影響裝備作業(yè)的氣象數據、影響產(chǎn)品市場(chǎng)預測的宏觀(guān)經(jīng)濟數據、影響企業(yè)生產(chǎn)成本的環(huán)境法規數據……
2、工業(yè)大數據實(shí)施的關(guān)鍵問(wèn)題
數據質(zhì)量、多源關(guān)聯(lián)和系統集成是工業(yè)大數據實(shí)施的關(guān)鍵問(wèn)題:
擁有大數據不是目的,發(fā)掘其價(jià)值才是關(guān)鍵。由企業(yè)信息化數據、裝備物聯(lián)網(wǎng)數據和外部互聯(lián)網(wǎng)數據匯聚而成的工業(yè)大數據,蘊藏著(zhù)巨大價(jià)值。例如,通過(guò)分析用戶(hù)使用數據改進(jìn)產(chǎn)品,通過(guò)分析現場(chǎng)測量數據提高工件加工水平,通過(guò)工況數據進(jìn)行產(chǎn)品健康管理等。
▋筆者認為實(shí)施工業(yè)大數據項目需要關(guān)注以下3個(gè)關(guān)鍵問(wèn)題:
1、數據質(zhì)量控制問(wèn)題
原始數據(生數據)質(zhì)量決定分析結果的質(zhì)量。企業(yè)信息系統數據質(zhì)量仍然存在問(wèn)題,例如2014年某大型機車(chē)企業(yè)ERP系統中近20%物料存在“一物多碼”問(wèn)題。裝備物聯(lián)網(wǎng)數據質(zhì)量堪憂(yōu),某大型制造企業(yè)1個(gè)月的狀態(tài)工況數據中,無(wú)效工況(如盾構機傳回了工程車(chē)工況)、重名工況(同一狀態(tài)工況使用不同名字)、時(shí)標混亂(當前時(shí)間錯誤或時(shí)標對不齊)等數據質(zhì)量問(wèn)題約30%。
2、多源數據關(guān)聯(lián)問(wèn)題
層次化的物料表(Bill Of Material, BOM)定義了企業(yè)信息系統數據的核心語(yǔ)義結構。針對跨生命周期的研制BOM和實(shí)例BOM間結構失配問(wèn)題,我們提出了中性BOM模型,并以此為核心,向前關(guān)聯(lián)設計制造BOM,向后關(guān)聯(lián)服務(wù)保障BOM,形成星型結構,極大地降低了數據關(guān)聯(lián)的復雜度。同時(shí),針對裝備物聯(lián)網(wǎng)數據和外部互聯(lián)網(wǎng)數據,可以根據其綁定的物理對象(零部件或產(chǎn)品)與相應的BOM節點(diǎn)相關(guān)聯(lián)。從而以BOM為橋梁,關(guān)聯(lián)3個(gè)不同來(lái)源的工業(yè)大數據。
3、大數據系統集成問(wèn)題
工業(yè)大數據其來(lái)源更加廣泛,并且裝備物聯(lián)網(wǎng)數據(半結構化數據)和外部互聯(lián)網(wǎng)數據(非結構化數據)都要與企業(yè)信息系統(結構化數據)進(jìn)行集成,因此要重構數據支撐平臺,甚至替換“舊”系統。
3、工業(yè)大數據實(shí)施工程案例
工業(yè)大數據分析提升工程裝備服務(wù)保障水平,這里分享兩個(gè)工程案例:
案例1 工業(yè)大數據提供故障分析新手段
液壓系統是工程機械的關(guān)鍵部件。2013年我們發(fā)現液壓系統的油缸密封套腐蝕故障數量異常。于是依據企業(yè)信息系統記錄的液壓系統維修歷史數據,通過(guò)比對相關(guān)狀態(tài)工況數據(裝備物聯(lián)網(wǎng)數據),搜索推薦與故障車(chē)輛關(guān)系密切的工況,發(fā)現車(chē)輛油缸換向頻率的波動(dòng)幅度與這些故障高度相關(guān)。
進(jìn)一步,引入互聯(lián)網(wǎng)上的行政區劃數據和歷年工程建設數據(外部互聯(lián)網(wǎng)數據)后,發(fā)現2012~2013年期間這些典型故障均發(fā)生在沿海省份,從而推斷出鹽霧環(huán)境是導致密封套腐蝕故障的主要誘因。
案例2 工業(yè)大數據提升備件需求預測精度
隨著(zhù)工程裝備增量市場(chǎng)增長(cháng)乏力,以維修保障為主的存量市場(chǎng)成為企業(yè)盈利新的增長(cháng)點(diǎn)。我們利用了企業(yè)信息系統中的備件銷(xiāo)售訂單、采購訂單和備件庫存狀態(tài)數據,以及工程物聯(lián)網(wǎng)采集到的工況數據和外部互聯(lián)網(wǎng)數據(如每個(gè)省的GDP,建筑、交通等規劃數據)。
針對30個(gè)省市區進(jìn)行了備件需要預測,平均預測精度為82%,每旬備件需求預測誤差在5件或真實(shí)值的20%以?xún)?。庫存水平控制在一個(gè)較低的穩定水平,僅為原來(lái)庫存水平的48%。同時(shí),因為考慮到了20天的配貨周期,基于預測的補貨策略可以保證現貨滿(mǎn)足率,消除緊急臨時(shí)訂單。如果按備件庫存占有資金1億元計算,可節約庫存資金占用5000萬(wàn)元。
工業(yè)大數據是實(shí)現智能制造的基礎原料,是提升工業(yè)生產(chǎn)力、競爭力、創(chuàng )新力的關(guān)鍵要素。然而必須看到,工業(yè)大數據是一個(gè)正在發(fā)展的學(xué)科領(lǐng)域,其內涵外延、模型理論、技術(shù)方法及其實(shí)施策略等還有待發(fā)展與創(chuàng )新。唯有結合中國國情認真實(shí)踐,才能走出中國工業(yè)大數據自主之路,實(shí)現制造強國的戰略目標。