成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    數智化 正文
    發私信給劉路遙
    發送

    0

    硝煙里的大模型,求變的機器視覺:「數據」決定天花板,「平臺架構」是底牌?

    本文作者: 劉路遙 2023-08-30 18:06
    導語:大模型時代,企業的自我革新是一項系統性的工程。

    如果問最近哪個行業最熱,無疑是大模型。

    ChatGPT的落地證明了,大模型已經能夠針對任務進行場景化應用,離用戶更近了。

    當一批類ChatGPT的通用大模型層出不窮時,另一批參與者著眼于“更容易落地”的行業垂直大模型,也走到了舞臺中央。

    機器視覺作為大模型重點應用的垂直領域,必將從這場技術革命中受益,但工業場景與生俱來的碎片化、樣本量少等特點,也對大模型的應用提出了挑戰。

    大模型這一顛覆性的技術,究竟應當如何應用于工業中,大家還處在相應的探索中。

    機器視覺的長期痛點:樣本少、時間短、爬坡要求高

    在人工智能和機器人領域,存在一個莫拉維克悖論,即對于計算機而言,只需很少的計算能力,就能掌握人類的邏輯推理等高級智慧,但對于人類無意識的感知、運動等低級智慧,卻需要極大的計算資源。

    這一悖論,在工業領域更加凸顯。

    在工業領域,用自動化的機器人替代人類,完成一個簡單的動作,存在極大的瓶頸。

    以摁壓、扣接這類精密組裝的動作為例,人類可以在手指不做出明顯向前位移的情況下,僅通過肌肉的彈力或指尖的觸感出色完成工作;但對于機器人來說,僅為了完成這一簡單的動作,就需要進行大量的計算。

    不僅如此,由于工業各細分領域千差萬別,每一項固定工序背后都需要進行大量的計算,這些訓練工作疊加起來的時間和成本,是企業難以負荷的。

    當下,小樣本學習技術、預訓練、預適應,是目前階段最適合工業場景的,這源于工業實際應用場景的嚴苛要求:樣本少、時間短、爬坡要求高。

    樣本量少是工業領域的典型難題。

    很多情況下,工廠里的邊緣AI應用,缺少豐富、多樣化的產品樣本,并不利于進行模型的訓練。

    “缺陷檢測場景中,工廠里會有很多正常的好樣本,但異常樣本的積累,通常要花幾個月甚至半年的時間。”凌云光知識理性研究院副院長全煜鳴告訴雷峰網(公眾號:雷峰網)

    假設一款新手機即將發布,前期模組生產已經耗費大量時間,最終組裝僅剩兩三個月,很難在這段時間中積累到足夠的異常樣本。

    要在獲取的樣本極少,而產能爬坡要求極高的情況下,讓整個產線適應新產品,就會對小樣本、預訓練、預適應提出極高的要求。

    對于小樣本來說,模型上面需要有極其嚴苛的適應性,數據上面要有很好的增廣能力,要具備在樣本少的情況下,增廣樣本給自己的模型做訓練的能力。

    尋找共性,是增廣樣本數量一個較為常用的辦法。有一些缺陷,在某幾個行業是相通的,比如中框、結構件的外觀檢測和手機整機的外觀檢測,再比如鋰電和光伏的外觀缺陷檢測等,都存在一定的相通性。

    “凌云光建立了擁有500萬樣本的專用工業數據集,可以對缺陷的機理進行研究,再加上深度學習和人工智能算法平臺F.Brain,能夠使得預訓練模型和積累的工業數據集,有比較好的樣本擴增的功能。”全煜鳴接著補充道:“生成缺陷只是第一步,還要兼顧與場景融合過程中的科學性,才能夠保證小樣本缺陷圖增廣的有效性。”

    預適應和小樣本一樣,其目的在于使相關模型具有更好的精度和更廣的適應范圍,以滿足不同工業場景,從而在一定程度上緩解產品在實驗室中表現穩定,一到真實產線上就“歇菜”的普遍問題。

    一邊,工業場景對小樣本學習技術提出了高要求;另一邊,工業場景對產品的要求也日益提高。

    首先,生產的精度要求越來越高。

    寧德時代的倪軍教授曾提出“極限制造”的概念,表示工業領域做到6σ(每百萬個產品里頭有一兩個不良品)遠遠不夠,而是需要做到9σ-12σ,即對不良品的要求上升到十億級,每十億個產品當中,只允許出現1-3個不良品,這對機器視覺廠商是個極大的挑戰。

    其次,3C制造領域、汽車、印刷品等行業的升級,對產品良率和產品形態提出了更高的要求。

    在此過程中,怎樣將物理世界的缺陷,通過攝像頭感知到光電領域、數字領域,并對不同類型和程度的瑕疵進行科學分級,最終定義良品與不良品,實際上是一個難題。

    這是因為,無瑕疵的產品幾乎不存在,所謂的良品來自于人們對其的定義。

    比如,蘋果和富士康通過三級質量分級完成了對于良品的定義,為其提供視覺感知系統的凌云光,則對標人眼感知,將缺陷細化分級為十級,以此針對不同客戶的質量要求,通過微調來滿足需求。

    這一切,都建立在一個前提基礎上,即有一套能夠精確感知缺陷的視覺系統。

    其中有兩大挑戰,一個來自于數據,一個來自于平臺架構。

    To B 叢林探險,向場景要什么樣的數據?

    人工智能由兩個部分驅動,一是數據,二是模型。

    數據的重要性,正如ML(Machine Learning)大牛吳恩達提出的著名“二八定律”:80%數據+20%模型=更好的AI。

    隨著預訓練大模型技術的發展,對于數據質量、數量和多樣性的要求越來越高。

    從樣本中積累行業知識、場景知識是一條重要的路徑。以顯示屏裂紋檢測為例,只有掌握了相關缺陷和產品物理位置的關系、物理形態上是否垂直于邊緣、不同位置產生缺陷的概率等數據,才能夠打造出好的預訓練模型。

    但要獲取到精準的數據,卻并不容易。

    一是數據的完整性問題;

    二是數據的維度單一性問題,檢測點獲取到的數據以及制程點的人機料法環測數據,能否從邏輯上實現閉環建模;

    三是做知識抽取和知識沉淀時,實際上獲取到的結論在驗證階段仍會出現偏差,需要更大數據量的驗證;

    全煜鳴坦言,即使是有著20多年行業積累,已經擁有數十億級相關樣本的凌云光,在數據獲取過程中也依然面對上述的挑戰。

    在全煜鳴看來,減少上述問題帶來的影響,需要做到精準感知和數據獲取的標準化。

    精準感知是對器件提出的要求。

    照明系統、感知元件、光學傳遞相應的鏡頭以及待測目標,都要能夠做到相關的標準度。只有在模塊級做到精準,才能夠在系統級的度量達到成像性能的一致性。

    對于照明系統來說,輻射通量、光譜信息、時間的穩定性、溫度的穩定性等度量指標,要能夠在模塊級進行測量和度量;對于感知元件來說,靈敏度、量子的效率、暗噪聲、動態范圍,也要能夠進行精準的度量、調節;對于被測目標,要能夠完整的對光電成像的過程進行物理建模和理論分析。

    數據的標準化是從維度上說的。

    比如對一個產品進行質檢,其維度包括整體產品數據、瑕疵數據、產品履歷、不同制程段的檢測結果等各個方面,既有圖像數據又有文本數據,有結構化數據和非結構化數據。

    但需要注意的是,并非所有數據都有價值,數據的標準化過程,需要舍棄那些永遠無人關心的沉默數據,留下有用的數據。

    “數據的標準化是一個系統性的問題,對數據的單位、背景條件、存儲都應該有相應的標準。比如,數據需要以什么樣的形式存儲下來,是不是要有產品的大圖,有缺陷的小圖用什么格式定義,在什么地方可以獲取到等。”全煜鳴對雷峰網介紹道。

    實現數據標準化只是第一步,在此基礎上,還需要進一步實現數據的精準化,以及數據知識化。

    數據的精準化,指的是能夠重復獲取的、穩定的、客觀的數據。實現精準的數據,是挖掘到帶有工藝知識和場景的知識化數據的基礎。

    以手機維修產線為例,維修不同產品過程中產生的數據,其實就包含了對手機或者手機主板怎樣進行下一步檢測的知識。最終將維修記錄整合成標準操作流程的過程,就是將一般數據變成帶有知識沉淀的數據的過程。

    將帶有知識沉淀的數據,用到知識圖譜和大模型上,可以幫助終端客戶縮短整體業務流程。

    比如,富士康主板維修嚴重依賴于有經驗的工人,但制造業人力供應鏈存在不穩定的弊端,對于富士康產線的工人來說,離職率會達到100%以上,尤其是一些有經驗的工人很難被留住。相應的,老師傅的知識和經驗也會跟著人一起走。

    “通過知識圖譜將大模型拓展至主板維修環節,過去 1500 步工序才能搞定一塊主板,現在 15 步就能完成,產線 UPPH 足足提升了37%,讓一線維修工真正可以‘入職三個月,五年老司機’。”

    從標準化數據,到精準化數據,再到帶有工藝知識的數據,三者之間層層遞進,而數據自始至終都是穿插在中間的一條重要主線。

    向平臺化架構要體驗

    機器視覺設計多個學科,其復雜性導致通用性差,且高度依賴數據驅動。

    在全煜鳴看來,機器視覺到今天,依舊像一門民間藝術,光、機、電、算、軟各自為戰,從成像的硬件,到成像的方案,再到算法軟件平臺,并沒有形成一個整體的解決方案。

    與此同時,隨著大模型時代的到來,要把數據處理好,對技術架構帶來全新挑戰。如果沒有全新的技術架構和全新的解決方案做支撐,就會出現技術投入越大,復雜度越高,但可持續性越弱的問題。

    基于此,行業在思考如何高效地利用數據迭代模型的同時,也越來越重視技術架構的創新。

    不過,企業在技術架構的搭建過程中,需要注意兩個問題。

    首先,要警惕脫離具體場景訴求談技術架構,要基于業務搭建技術架構、平臺,否則就是做無用功。

    做架構的第一件事,是把需求捋清楚,把業務目標捋清楚,然后才有可能找到合適的方案。

    據全煜鳴介紹,為更好做到從場景中來回到場景中去,凌云光將技術規劃和產品規劃分成了三個部分。

    第一部分是目前已經落地應用的解決方案,比如2D視覺、3D視覺的量測、檢測方案,思考怎樣提高效率、提高精度,降低整體對端側算力的要求。

    第二部分是在一些新興,短期有落地應用機會的創新方案上,領先行業半步,進行人才補齊等資源投入。

    不過,全煜鳴也提到,“因為不能脫離客戶的實際需求做研究,因此判斷怎么樣才是技術上提前半步,是比較難的。”

    第三部分是針對超前的研究,進行提前布局。比如,凌云光三年前開始進行大模型和知識圖譜的能力構建,提前將整體的技術框架進行落地。

    也就是說,對于不同時期或者不同成熟度的解決方案,應當能夠分梯次落地應用,并且做到一個閉環。

    其次,當前構建的架構要有足夠的靈活性,能應對未來的變化,保持旺盛的生命力。

    也就是說,要具備能夠誕生多個可模塊化快速復制的集成用例,并且在平臺化的技術架構基礎上設計橫向快速復制的方法。

    一個既支持現在,又能支持未來的架構,不僅可以避免重復建設,節約成本投入,還可以更好地得到綜合成本的下降。

    技術架構走向平臺化是重要趨勢之一,凌云光2018年左右開始向平臺化方向轉變,時隔5年,到今年又發布了全新的KingKong技術架構,包含視覺、數字基準、大腦、自動化和駕駛艙五個部分。

    在全煜鳴看來,KingKong技術架構的特征可以概括為三點:

    對于視覺領域,是一個科學的標定和圖像的科學評價,整體系統的一致性非常好;

    在數據層面,有精準的數據,并且是帶有知識的數據;

    AI 模型上,是數據加知識的雙輪驅動。

    對于凌云光而言,這些技術為平臺構建了豐富的、有差異化的平臺功能與服務,提高了基礎技術能力,為業務的安全、穩定、高效運行提供了保障。

    對于客戶來說,一個更具有一致性的技術架構,更能幫助提升缺陷產品的檢出精度,加快交付,從而帶來生產效率的提升,拉動產能。

    一般而言,新設備進入工廠要經過NPI新品導入,之后便是產量和質量爬坡階段。這個階段越短,客戶就越能省下更多物料和人員成本,更快進入大批量生產階段。

    “KingKong技術架構調整后,能夠讓手機的中框、頂框、底框的外觀檢測,到手機的整機外觀檢測,交付時間縮短。并且這樣的解決方案,能夠拓展到鋰電外觀、圓柱外觀檢測上。”全煜鳴介紹道。

    垂直大模型叩響工業大門,顛覆性技術隨時可能發生

    人工智能領域的發展突飛猛進,大模型將對全行業都將產生顛覆性地重構,已經是業界共識。

    在工業領域,從生產優化到供應鏈管理,從質量控制到創新設計,大模型正逐漸改變著工業領域的運作方式和業務模式。

    然而,工業領域的復雜性和專業性,決定了通用大模型無法直接應用,尤其在一些要求高精度和領域專業知識的領域。

    面對種種挑戰,能針對行業細分領域提供更精確、可解釋、安全和定制化的解決方案,比通用模型更具優勢和適用性的垂直模型,受到越來越廣泛的關注。

    通用大模型雖然在多個領域都表現出色,但并不具備深入的領域專業知識。

    以工業質檢領域為例,產品質檢涉及到大量數據和復雜的圖像、聲音、視頻等信息,要求模型能夠準確地識別和分析各種缺陷和問題,甚至是微小的變化。

    但是,通用模型很難在短時間內學會這些領域知識,也很難捕捉到產線上工藝流程和設備運行等細節。

    垂直模型具備專業知識,能夠更好的理解和處理行業數據和任務,并且能達到更高的精度和性能,提供更準確的結果。

    工業領域數據的稀缺性和特殊性,也使得通用模型難以應對。

    要達到高精度,模型通常需要大量高質量的訓練數據,然而在某些工業領域,特別是新興或者小規模領域,短期內難以積累足夠的異常樣本,經常出現模型缺乏足夠數據進行訓練的情況。

    此外,工業領域的數據還具有許多特殊性,對大量實時數據、多種類型數據、異常數據的處理和分析,是一項異常復雜的工作,難以被通用模型所理解。

    垂直模型則降低了對數據的需求,只需較少的場景訓練數據,就能實現高效開發,且定制成本更低。

    工業領域講求實際,對穩定性、可控性的要求極高,垂直模型更能獲得客戶的信任。

    對于工廠來說,需要模型能夠提供清晰的解釋和推理過程,以便能夠理解和信任模型的判斷,從而做出下一步決策。

    通用大模型通常是“黑盒模型”,內部運行機制較為復雜,難以提供透明的解釋,較高的風險使其難以獲得客戶的信任;垂直大模型則能將其決策過程和推理邏輯展現出來。

    安全和隱私問題,是敲開工業客戶的最后一道大門。

    工業領域的數據龐大且復雜,通用大模型尚難以提供足夠的數據安全保障,并且工業領域的生產流程、產品工藝、設備參數等都屬于工業企業的敏感數據,通用大模型的在訓練過程中必然會接觸廣泛的公共數據,存在將工廠敏感數據泄露出去的風險。因此,很多企業在權衡風險與收益后,并不愿意將自己的數據提供出來。

    垂直模型由于可以在特定領域內進行本地化處理,從而能夠減少數據共享和隱私泄露的風險。

    大模型的產生讓人們意識到,整個機器視覺的解決方案,很有可能被一些極具革命性和創造力的新模型所重構。

    全煜鳴坦言,“最近看到很多顛覆性技術,一些原先的技術路徑或者解決方案,很有可能會被新技術顛覆。目前,凌云光F.Brain深度學習平臺已實現工業場景數據、算法(模型訓練)、推理為一體的云邊端協同一體化平臺。首先,通過算法平臺進行特定場景的數據增廣,模型訓練精調,再由推理平臺完成對多端多平臺的部署優化。”

    不過,工業場景對精確度、可靠性的要求極高,現階段,這些新模型的直接導入應用還存在一定的瓶頸。

    在全煜鳴看來,這是時代拋給企業的兩個命題,一邊企業要沿著已有的路線不停迭代,保證滿足客戶4個9,12個σ的確定性需求和規格;一邊要保持技術的敏感性和興奮度,警惕會帶來顛覆性的新技術。

    然而,要打磨出對行業有顛覆性價值的模型,絕不是一項閉門造車的工程。

    企業需要在通用大模型基礎上,微調行業大模型,最后再精調成相關制造場景的模型。

    過程中,企業需要對不同產品和行業特點有深刻的認識;需要有行業高質量數據的積累;有在數據上進行研發、運算及推理的能力;有懂行業know-how的研究員和科學家等等。

    這意味著,那些深耕于產業,能觸達更多客戶的行業場景,更容易從生產線上獲取大量行業數據,且已經積累了較多科學精準樣本的企業,將更好地滿足工業領域的需求和挑戰,同時具備更快的技術迭代速度和競爭優勢。

    結語

    ChatGPT 帶來的熱度,就像是將一根針丟進了一片鐵屑中,其與各行各業之間的連接,是確定無疑的。

    但現階段,關于大模型應當怎樣在工業領域落地,怎樣在邊端、云端做相應的優化、輕量化,最終怎樣做到投資回報的閉環,給工業帶來效益,還處在相應的探索中。

    這一過程中,充滿著無數的變數,很難評判哪一家公司更有可能勝出。

    但可以確定的是,市場競爭的核心將始終圍繞一個詞:真實需求。

    接下來,在機器視覺領域,能在包括光學相機成像系統、軟件和算法等AI技術上,做出對客戶的提質增效、降本減存有數量級和革命性幫助的解決方案,將獲得更大的加速度。如果您有更多關于機器視覺的故事和看法,歡迎添加作者微信MOON_ERS進行交流。


    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說