誰卡住瞭工業AI的脖子?

工業AI場景中物理對象的存在使得數據采集、特征提取、模型訓練、部署等方面都存在著較大困難,也迥然不同於消費互聯網場景。另外,工業AI落地也不是純粹技術問題,綜合考慮企業認知、人才培養和法律商業環境等多個方面,才能厘清問題,系統發展工業AI應用。

轉載 | 說東道西

作者 | 宋華振

感慨於AI的聲勢浩大,千軍萬馬進工業,希望復制其巨大的商業積累,然而,工業AI與商業仍然大的不同,缺乏對工業的瞭解,會遇到很多坑。

工業AI往往是在有具體的物理對象的機器或系統上運行,這與很多純軟件形式的語音、圖像類的識別的商業AI還是有比較大的差別。物理對象是否能夠如你所願的執行或反饋,本來就依賴於其自身的機理模型,包括一些不確定的、幹擾因素會導致的潛在問題,都是工業AI無法像商業AI那樣對待的原因。

由於工業AI場景中物理對象的存在使得其本身在數據采集、特征提取、模型訓練、部署等方面存在著較大的困難,因此,必須冷靜的看待AI在工業的發展,才能厘清問題,讓我們避開那些坑並且知道該如何看待AI的工業發展。

不僅是技術,在企業認知、人才培養等多個方面都需要予以考慮,才能系統發展工業AI應用。

 一 

工業AI與商業AI的差異

工業數據與商業數據仍然是有較大的差別,這主要體現在以下幾個方面:

 

比較項

商業數據

工業數據

數據特點

追求數據量大

追求對問題的還原性

質量需求

用於較為模糊的計算,質量要求不高

數據要求極高,需清洗

用途

關聯性分析

尋求模型基礎上的關聯性

結果

準確性要求低

高容錯率

數據類型

非實時數據

實時數據

可解釋性

低可解釋性

高可解釋性

數據源

聲音、視頻、文本、圖像圖片

電流、電壓、振動、能源…

安全性

信息安全(Security)需求

信息安全+功能安全性(Safety)

可靠性

高可靠性

準確性

高精度需求:控制精度要求

魯棒性

高魯棒性需求:

綜上所述,工業AI與商業AI相比,還是有很多難度的,但是,驅動工業AI發展的因素也在於AI芯片、軟件方面的成本下降,工業AI本身是有需求的,隻是受制於工業領域的市場容量,在商業的芯片與軟件不能降低到合理成本時,工業AI就無法真正崛起,發揮其價值。

可解釋性。用戶對於「機器」進行決策背後的原因需要建立「信任」,而很多AI算法卻是一種「黑盒」機制,使得其不具有透明性,這使得很難被接受,因為「風險」仍然是存在的。

如果商業AI需要90%準確性,那麼,工業需要的99.99%的準確,而這個潛在的「不可解釋」使得模型的信任度降低。

安全性。如果用戶要求供應商一起承擔因為技術所需承擔的潛在安全風險—這無論對工業還是商業來說都是一個風險,因為,你可能是賺的面粉的錢,操著白粉的心,這你也不敢接受吧?

但是,客戶不管這麼多,你說你的系統很好,但是,如果出現瞭安全事故,那我是不是要找你呢?或者,你願意承擔這個風險,我才能接受這個產品。

 二 

模型驅動與數據驅動的優缺點

傳統工業生產通常是基於物理或化學的已有機理建模,並經過上百年大量生產的測試驗證,那麼具有一定的成熟性。但是,由於考慮更多是經濟性,因此做瞭非常多的線性化、安全值設定,使得其仍然有挖掘的潛力空間。

另一方面,由於模型驅動往往需要非常專業的人經過大量的時間進行積累,這個過程本身的成本也是非常高的,隻是在很多年中進行瞭分佈,似乎成本很低。

數據驅動的方式,在於發現新的模型—那些在傳統的機理方法中無法進行挖掘的模型,數據驅動的對於數據是饑渴的,而這不依賴於人的經驗和大量的積累,就像通過數據進行預測性維護,可以在短時間積累大量的數據,並挖掘出導致質量問題的相關性分析,而這在過去可能需要數年、數十年的積累。

比較項

模型驅動

數據驅動

復雜性

復雜-機電軟一體化融合

依靠數據學習

數據需求

小數據驗證接近於大數據分析

大數據

領域知識需求

成本

經驗

 

比較有效的方法當然是數據與模型驅動相互結合,在模型基礎上構建學習的過程,進而來優化模型,而相輔相成,才能各自發揮其優勢,機理模型的人不願意嘗試數據驅動的模型,而認為學習的人不懂工藝。

 三 

工業AI場景

首先,流程工業與離散工業的不同。工業按照生產的連續性、控制對象大致分為流程與離散制造業。

離散制造業主要以機器與產線的控制為主,例如食品飲料、塑料、電子、造船等工業,而流程工業從產業來說更傾向於連續型的過程生產,如石化、制藥、冶金等。

機器控制

流程控制

加工任務

物理

化學反應

參數

速度、扭矩、位置

溫度、壓力、液位、流量

循環周期

μS/mS

10mS/100mS

控制系統

嵌入式系統

DCS/SCADA

安全性

IEC61508

IEC61511/IEC61513

高可用性

冗餘需求較少

雙機熱備/網絡冗餘

生產連續性

離散制造

連續生產

 

就AI的應用來說,流程工業由於是連續生產,本身具有「自動」的需求,優化的效果很顯著,因為1%的能耗降低都是有效的。但是,流程工業本身的空間也是很難挖掘的。

請你相信我,流程工業在上百年的時間裡,已經用瞭各種方法在挖掘它的潛力,傳統機理模型方式已經幹瞭超出AI所能想象的工作。

離散制造業相對比較分散,現在卻向著「連線」生產的模式進發,傳統所謂的機器已經由機器人、輸送系統進行瞭「連接」,使得其具有瞭不停機生產的能力。

其次,工業AI場景。無論是流程工業還是離散制造,針對流程的各個部分,都有通過AI方式進行的優化與改善。我們不以具體技術或場景,而以宏觀場景來看待整個工業AI的空間,這也是傳統機理的空間:

1、數字化設計環節。通過數據的閉環迭代,來反映生產中的質量、成本的不斷約束下的降低,這也是AI算法可以幹的事情。

為個性化生產帶來數據的支撐能力,無論是早期驗證還是數字孿生對於工藝的智能挖掘,形成新的制程工藝決策支持,這些都是代替瞭「人的經驗」和隱性知識的功能,否則,人們仍然不能帶來質量的穩定性、良品率的上升。

第一次就做對,是精益生產裡的理想狀態,對於工藝來說,開機浪費不可避免,如何讓機器最快的進入穩定的質量工藝狀態,也是一個可以通過大量的學習來獲取的,經過累積,形成一個穩定的工藝模型,就是一種很好的應用。

生產數據對於設計端的反饋,無論對於流程還是離散制造業來說,現場數據對於設計端的反饋是一個非常重要的提升辦法—這些決策支持具有很大的商業價值。

2、數字化運營環節。數據驅動的優化,包括質量優化、參數尋優、作業調度,這些都是可以為AI所發揮力量的場景,在質量優化方面自然有極大的空間,無論是通過視覺的缺陷檢測來尋找質量改善的空間,還是通過視覺導引為機器人、AGV等提供快速的定位與指引,都是AI可以發揮空間的地方。降低能耗,提高原料使用效率,優化生產工藝中的參數匹配,自適應能力;

參數優化,包括瞭在靜態和動態系統建模以便應對環境的不確定性,實現更為有效的控制工藝,在線過程控制和優化。

因果關系和相關性(例如質量缺陷),在缺陷檢測中,可以實現對質量相關性分析來對影響質量的關鍵因素進行「發現」並對其進行有效的調節、控制,或者根據模型實施更為節省成本的控制策略。

工藝參數匹配,制造業無論是流程還是離散,其本質都是對材料進行各種化學與物理的反應,這個難點在於各種材料所具有的物理化學特性,這些在生產產品中與工藝流程、控制參數會形成無數種組合,傳統上建模本身也是一個難題,但是,即使有模型也需要大量的驗證,而這種驗證基於物理方法的顯然不如通過數據的方法積累,分析,提供工藝人員以決策支持。

決策支持,包括信息可用性的提高帶來瞭決策的支持能力,並且,在更多的AI場景中,我們可以看到工廠的資源如機器、設備、材料都有瞭節省的空間。

3、數字化維護。對於工廠的設備來說,通過數據驅動可以形成大量的應用積累,使得對於產線的未來狀態進行早期狀態預測,能夠維護較高的生產可用性(OEE指標提升)。

傳統的預測性維護往往基於機理模型,對於重值設備如飛機、大型空壓機組、鼓風機、風力發電機組等具有很高的必要性,因為這個投入是合算的,但是,對於生產線上的輕值設備,但是,個性化生產時代機器與產線的健康狀態又會對生產品質、交付能力造成較大的影響,這個時候就必須尋找更為經濟的運營維護方式,針對復雜多變的生產場景尋找更為經濟的數據驅動解決方案,代替傳統的基於專傢多年積累的方法。

 四 

工業AI目前需要突破的障礙

盡管我們描述瞭AI在工業的眾多場景和可能性,但是,要達到產業應用,我們還必須對它有更為清晰的認識,知道困難在哪裡,知道它的潛在風險和它自身發展的規律,才能更好的應用。以下幾個方面是未來工業AI需要突破的障礙。

1、數據本身的難題需要跨越。數據采集就是需要突破的Know-How:鑒於AI方法通常都是基於大規模數據並且這些數據必須具有高的可靠性,因此,數據的產生,數據魯棒性、數據質量和數據訪問,對於流程工業來說需要較大的改善。

另一方面,對於工業來說,從大數據到智能數據方法,這必須將大數據的方法與模型驅動方法結合。

就像振動信號的采集,就是在復雜的小信號中撿取有用的信號,而且需要經過一些快速傅裡葉變換,包絡曲線的分析才能檢出有用信號。

數據源帶來的信號幹擾,包括信號檢出方式本身就包含瞭很多工業Know-How在裡面,很多智能傳感器其實就是依賴於對信號的處理方式為核心競爭力,如果純粹原始的信號拿來,就相當於給瞭你一把面粉和白石灰混合在一起的數據。

你不要以為你有機會迭代。商業是大數據,而工業是小數據,有很多故障數據隻有在故障發生的時候才能有,而這個故障的發生—就意味著設備質量的問題—而這個不被接受。

商業AI說我們可以設定一個期望然後來迭代,但是,工業的用戶說「如果你達不到這個精度,請不要來測試」,這可能是兩個很大的差別。

商業客戶可以接受迭代的過程,比如識別圖片的能力、語音識別的能力不斷迭代提升,但是,工業的問題就是你如果出現瞭判斷錯誤,那麼,這個爐子裡的材料就廢瞭,在很多場景裡,可能你連測試的幾乎都不會有。

就像圖中所示,在商業AI裡你就識別一個狗和拖把的區別,在工業裡你可是要識別一個產品是否合格,這兩件事情是完全不同的。

在數據工程基礎工作方面。工業數據在網絡連接、數據模型、數據安全方面尚需更多的工作。

就目前而言,在工業數據的獲取方面,包括網絡連接的統一規范、信息模型、數據安全方面尚未有統一規范,OPC UA一直致力於這一工作,然而,目前OPC UA本身的市場完成度也並不高,在國內也僅有少數的企業開發瞭OPC UA,如果不開發基於OPC UA的規范,那麼,各個公司形成的規范仍然會成為障礙,因為大傢肯定沒法具有統一性,導致需要大量的接口與轉換工作。

數據源喂入到AI質量仍然不夠高,更多的數字化和數據集成仍需努力。

工業AI與商業AI還有就是在數據的需求「價值」方面,對於工業AI來說,如果獲得的數據到信息過程出現不可用、不完備的情況,也即,這些數據模型無法精確的描述一個物理或化學過程,那麼,這個數據就是無法真正使用或發揮價值的,不是單一的數據而是數據集,必須具有一定的完備性。

2、在工業AI應用實現過程中的難題。

(1) 缺乏數據處理的流程,從源頭獲取數據的質量問題、數據驗證、特征提取整個過程而言,目前AI尚未有比較好的自動化方法建立,仍然需要人工對數據進行特征提取、降維、標定等工作。即使現有的AI軟件已經非常容易使用,但是,對於工業場景而言,仍然有很多不適用的情況。

(2) 語義互操作問題。由於數據來源於不同的設備,需要統一的語義互操作規范支持。

不僅包括瞭M2M的數據,還包括瞭OT與IT系統的接口問題,這些都是目前尚未能夠很好解決的問題,對於傳統的模型驅動控制而言,都尚未有完整的解決方案,因此,AI的應用就更需時日。

在工業裡OPC UA即扮演這樣一個角色,提供結構性的數據,為數據在地址空間的存儲提供瞭統一的結構、類型、屬性等標準,並支持各種通信模式,以及提供瞭行業信息模型的集成。

(3)數據安全性問題:在整個數據的采集、傳遞、處理、運行、部署過程中,數據的安全性(Security),以及對生產運營的安全性(Safety)都是工業企業必須予以考量的要素。

3、企業本身對於AI的障礙。對於AI企業和用戶而言,尚有一些障礙。

(1)用戶過高的期望以及不可計量的AI期望值。對於用戶而言,AI是個好東西,但是,客戶需要先驗性的收益分析,就是「不見兔子不撒鷹」的投資方式。收益不明確、缺乏有說服力的案例、業務模式的匹配、對AI的局限性缺乏瞭解,較難以說服用戶。

(2)即或AI,也需要AI的運行機制和體系支撐。AI並非像買一個軸承,即使是軸承也需要維護人員專業的知識,而AI同樣如此,總不能就像買個東西裝上即可使用,而在應用中如何調整、迭代本身也需要用戶自身來完成,否則,花費一筆錢就得到供應商無限的服務支持,或者如果需要支持服務費用,這也是一筆不小的長期開銷,必須予以考慮。

因此,對於AI而言,必須要有清晰的認識,要有長期的規劃和人才培養計劃與之匹配,否則,可能就是一個項目,為瞭獲得一些所謂的資金支持,拿到一些補貼,但是,相對於企業所投入來說,往往也是得不償失。

(3)企業文化對於AI應用的支持。在一些企業中存在著對AI的抵觸,因為,他們會認為AI會代替他們的工作,就像在高速公路休息站地方的自動售貨機總是會無緣無故的故障一樣,因為自動售貨機裡2.5一瓶的礦泉水和商店裡5塊一瓶的水相比,他們更希望機器有故障。

AI的應用本身也是一種創新,需要跨學科融合的團隊合作,一是創新文化,二是團隊合作的文化,如果大傢藏著掖著,這個計劃就無法實現,因為,AI需要工藝人員將隱藏在其大腦中的知識拿出來分享,並形成不依賴於人的模型與算法,這本身就是有難度,而且在整個項目中的貢獻如果無法良好評價,就會產生對抗與抵觸情緒。

4、法律倫理與商業上的問題。在商業上,目前對於工業AI還缺乏「標準化」的應用,以解決可復用的問題,而這是商業AI與工業人必須共同解決的問題。AI在項目質量上、標準化方面還需要借助於軟件工程來實現更好的復用性,包括在上行和下行的互操作方面—因為采集和部署都是要跨平臺來實施的。

數據的歸屬權也是要考慮的問題,就像你來自End User的數據,那麼這個數據用來訓練瞭模型,那麼這個數據的所有權、模型的所有權就是問題,或者利益的劃分問題如何解決,是否有法律保障?

工業領域還有非常多的安全、審計追蹤等特殊的行業需求,這些都是工業AI應用時所需考慮的,而這些在商業AI中可能不會出現。

騎上摩托車,載大疆無人機播種去

2020-11-11

國務院放大招,新能源汽車產業發展定調,萬億級汽車迎最強助攻

2020-11-03

揭秘30億美元富士康「騙局」,特朗普夢碎再工業化

2020-10-26