心鑒智控羅曉忠接受澎湃科技專訪:所有創(chuàng)新要以提高企業(yè)效率為目的
內(nèi)容來(lái)源:澎湃新聞
·如何判斷某項(xiàng)技術(shù)是否需要投入?羅曉忠的標(biāo)準(zhǔn)是“接地氣”。他表示,“一定要結(jié)合公司的實(shí)際情況,不要‘為了創(chuàng)新而創(chuàng)新’。我們所有的創(chuàng)新都要圍繞一個(gè)目的,那就是提升企業(yè)的效率?!?/u>
·羅曉忠認(rèn)為,大模型之所以有這么高的能力,是因?yàn)樗鼡碛写罅扛哔|(zhì)量的數(shù)據(jù)和新型的訓(xùn)練方法,因此在大算力的支持下,涌現(xiàn)出了令人驚艷的能力。但在自己的行業(yè)領(lǐng)域,羅曉忠直接表示:“我們需要的是基于基礎(chǔ)大模型之上的行業(yè)大模型?!?/u>
心鑒智控創(chuàng)始人兼CEO羅曉忠向澎湃科技介紹,公司的第一個(gè)產(chǎn)品用了兩年時(shí)間才正式落地,在這兩年期間公司沒有任何營(yíng)收,只有不斷地研發(fā)投入。
“我最喜歡辛棄疾的‘醉里挑燈看劍’,很小的時(shí)候我也有當(dāng)大俠的夢(mèng)想,希望自己武功高強(qiáng)、除暴安良等。雖然這是小時(shí)候的夢(mèng)想,但它也指引了我人生的一些選擇?!?/span>
心鑒智控創(chuàng)始人兼CEO羅曉忠喜歡讀詩(shī)并感悟美好,用他自己的話來(lái)說(shuō),是一個(gè)“文縐縐”的人。五年前創(chuàng)業(yè)時(shí),他和聯(lián)合創(chuàng)始人為公司取名“心鑒智控”用的是《詩(shī)經(jīng)》中的“我心匪鑒”,寓意“用心做鑒別”。
羅曉忠于密歇根大學(xué)博士畢業(yè),創(chuàng)業(yè)前在美國(guó)微軟總部任首席軟件架構(gòu)師,擁有大數(shù)據(jù)、人工智能技術(shù)及企業(yè)級(jí)軟件的開發(fā)經(jīng)驗(yàn)及團(tuán)隊(duì)管理經(jīng)驗(yàn)。2018年,羅曉忠創(chuàng)立心鑒智控,專注工業(yè)場(chǎng)景下透明、反光、高速運(yùn)動(dòng)物品的AI視覺檢測(cè),主要應(yīng)用場(chǎng)景包括醫(yī)藥外包裝(鋁塑泡罩,輸液袋,軟膏及三期等)、導(dǎo)光板,瓶蓋瓶身等的瑕疵檢測(cè)。
在日前舉辦的華映資本2023年會(huì)間隙,羅曉忠接受了澎湃科技專訪,談及自己選擇創(chuàng)業(yè),他覺得仍然和年少時(shí)的夢(mèng)想相關(guān),只不過(guò)更加practical(重視實(shí)踐),“希望能做一些切實(shí)把人的雙眼從生產(chǎn)線中解放出來(lái)的事。因?yàn)槿说难劬σタ达L(fēng)景、看美好的東西,而不是去做瑕疵檢測(cè)?!?023年初,心鑒智控連續(xù)完成了A+和A++兩輪融資,融資總額近億元。
微軟工作18年后辭職下工廠2018年,在加入微軟18年后,羅曉忠選擇辭職回國(guó)創(chuàng)業(yè)?!拔沂冀K都有‘在這個(gè)世界上創(chuàng)造一些東西’的想法,而不是僅僅做一顆大廠螺絲釘。最小的孩子上大學(xué)后,沒有了對(duì)家庭的顧慮,我的太太也很支持我,所以正式投身創(chuàng)業(yè)。”
從工程師轉(zhuǎn)化成創(chuàng)業(yè)者,羅曉忠覺得最大的改變是“真是更加深入地理解了‘以客戶為中心’到底意味著什么?!闭劦阶约涸?jīng)因?yàn)槔碚摵蛯?shí)際脫節(jié)吃的虧,羅曉忠笑著回憶道,“我們公司有很多海歸員工,大多是軟件和AI(人工智能)的人員,對(duì)工業(yè)實(shí)操欠缺經(jīng)驗(yàn),做出過(guò)不少失敗的產(chǎn)品。后來(lái)我們就要求所有人必須到工廠去,看到實(shí)際的工況才不會(huì)閉門造車。”
心鑒智控剛成立不久,曾經(jīng)為一家知名品牌做過(guò)一個(gè)瓶蓋檢測(cè)的項(xiàng)目。酒瓶蓋的檢測(cè)看似簡(jiǎn)單,卻因團(tuán)隊(duì)不了解生產(chǎn)線上的實(shí)際情況而最終流產(chǎn)。
“我們沒有想到,客戶的同一條生產(chǎn)線上只要更換模具,就可以生產(chǎn)十幾款大小規(guī)格不同的酒瓶蓋,甚至包括印刷都完全不同,但當(dāng)時(shí)我們的模型迭代速度沒有那么快,滿足不了客戶的要求,”羅曉忠表示,“從那之后,我們?cè)诟蛻魷贤ê徒涣鞯倪^(guò)程之中,信息的收集會(huì)更加全面,讓項(xiàng)目最后成功的幾率更大?!?/span>
創(chuàng)業(yè)后,羅曉忠很多情況下需要為公司親自做戰(zhàn)略決策,這直接影響到公司的生和死,他也感到作為創(chuàng)業(yè)者肩上沉甸甸的責(zé)任。羅曉忠介紹,一個(gè)產(chǎn)品面臨失敗了要如何及時(shí)止損,以及一些技術(shù)路徑上面是否需要投入,這都是讓自己壓力很大的決策。
如何判斷某項(xiàng)技術(shù)是否需要投入?羅曉忠的標(biāo)準(zhǔn)是“接地氣”。他表示,“一定要結(jié)合公司的實(shí)際情況,不要‘為了創(chuàng)新而創(chuàng)新’。我們所有的創(chuàng)新都要圍繞一個(gè)目的,那就是提升企業(yè)的效率?!?/span>
“我們創(chuàng)業(yè)早期還保留著工程師的習(xí)慣,想把事情做得比較完美,但實(shí)際上短期之內(nèi)你不需要那么完美,卻一定要把它盡快落地用出去,讓產(chǎn)品在實(shí)踐的過(guò)程中不斷迭代才是最重要的?!绷_曉忠表示。
第一個(gè)產(chǎn)品歷經(jīng)兩年才落地機(jī)器學(xué)習(xí)需要海量的數(shù)據(jù)做支撐,高質(zhì)量的數(shù)據(jù)越多,最后的人工智能模型效果就會(huì)越好。對(duì)人工智能創(chuàng)業(yè)公司而言,一家初創(chuàng)公司,還沒有積累足夠多的行業(yè)數(shù)據(jù)時(shí),是發(fā)展最為艱難的時(shí)期。
羅曉忠向澎湃科技介紹,公司的第一個(gè)產(chǎn)品用了兩年時(shí)間才正式落地,在這兩年期間公司沒有任何營(yíng)收,只有不斷地研發(fā)投入。產(chǎn)品真正落地之前的測(cè)試之中,團(tuán)隊(duì)不管在硬件、軟件、還是模型上,都經(jīng)歷了一系列的問(wèn)題,在工程化層面,團(tuán)隊(duì)跟客戶也做了很多協(xié)同。
軟件層面的問(wèn)題主要體現(xiàn)在速度上。如果軟件處理的速度是20毫秒,但生產(chǎn)節(jié)拍是18毫秒,那軟件就會(huì)因?yàn)閬?lái)不及處理而導(dǎo)致系統(tǒng)崩潰。為了提高自己軟件的速度,羅曉忠推翻了自己原本用Python語(yǔ)言編寫的應(yīng)用,重新打造了公司基于C++語(yǔ)言的軟件框架?!癙ython是一種解釋性的語(yǔ)言,它運(yùn)行的速度很慢,一到高速產(chǎn)線就崩潰了。C++是一個(gè)多線程的語(yǔ)言,一個(gè)線程里可以有很多進(jìn)程并行,它的運(yùn)行速度比Python快很多?!?/span>
還有一個(gè)難點(diǎn)是公司的模型和客戶的產(chǎn)線系統(tǒng)需要匹配。羅曉忠介紹,藥片生產(chǎn)和包裝的速度很快,心鑒智控的系統(tǒng)在流水線上的A點(diǎn)識(shí)別出某一板藥品有瑕疵之后,它已經(jīng)位移到B點(diǎn)了生產(chǎn)線上的設(shè)備才能把瑕疵品剔出,因此模型和系統(tǒng)需要通過(guò)軟件和PLC(Programmablelogiccontroller,可編程邏輯控制器,專門用于工業(yè)環(huán)境的一種數(shù)字運(yùn)算操作電子系統(tǒng))控制實(shí)現(xiàn)精準(zhǔn)地協(xié)調(diào)和同步,這也花費(fèi)了團(tuán)隊(duì)很多時(shí)間和精力進(jìn)行調(diào)試。
除了軟件方面之外,在流水線上的硬件也出現(xiàn)過(guò)各種各樣的問(wèn)題,需要仔細(xì)排查并解決。團(tuán)隊(duì)曾經(jīng)發(fā)現(xiàn)有的工業(yè)相機(jī)里沒有緩存,也有的相機(jī)會(huì)反復(fù)提交同一張。工人操作時(shí)可能把線碰松了導(dǎo)致數(shù)據(jù)傳輸不穩(wěn)或是相機(jī)掉線。還有的便宜導(dǎo)線本身就數(shù)據(jù)傳輸不穩(wěn),需要更換。
在心鑒智控將產(chǎn)品工程化的過(guò)程中,也與藥廠就藥品瑕疵的定義達(dá)成了共識(shí)?,F(xiàn)在的行業(yè)標(biāo)準(zhǔn)中,鋁塑泡罩藥片有8種不同的瑕疵,膠囊有21種不同的瑕疵,就是心鑒智控在產(chǎn)業(yè)實(shí)踐中最早制訂出來(lái)的藥品瑕疵標(biāo)準(zhǔn)。隨著行業(yè)數(shù)據(jù)的積累和客戶的增加,現(xiàn)在,心鑒智控在醫(yī)藥產(chǎn)品、白玻、高速產(chǎn)線上物品的綜合檢測(cè)領(lǐng)域能力已經(jīng)位于行業(yè)第一梯隊(duì)。
打造自己的“行業(yè)大模型”羅曉忠介紹,心鑒智控在高透光、高反光的場(chǎng)景中,有自己獨(dú)到的光學(xué)成像技術(shù),可提供高質(zhì)量的初始圖像。另外,自己的人工智能模型也是另一個(gè)核心競(jìng)爭(zhēng)力。
公司的人工智能模型中,采集數(shù)據(jù)有兩個(gè)技術(shù)模塊:一個(gè)是數(shù)據(jù)的素材系統(tǒng),能夠?qū)ιa(chǎn)線上的數(shù)據(jù)進(jìn)行采集壓縮,并將數(shù)據(jù)在邊緣側(cè)上傳到云端,在云端解壓打開后,做半自動(dòng)機(jī)器標(biāo)注和人工的標(biāo)注;另一個(gè)是數(shù)據(jù)的重復(fù)利用系統(tǒng),模塊在云端有自己的自動(dòng)學(xué)習(xí)平臺(tái),能夠把標(biāo)注好的數(shù)據(jù)進(jìn)行模型的訓(xùn)練迭代和優(yōu)化,這就將數(shù)據(jù)和生產(chǎn)線部署的邊緣側(cè)模型進(jìn)行了高效率的再利用。
心鑒智控成立至今,已經(jīng)在視覺檢測(cè)的業(yè)務(wù)中積累了大量高質(zhì)量的數(shù)據(jù),并在2022年下半年訓(xùn)練出了自己在工業(yè)檢測(cè)領(lǐng)域的通用模型。同年11月,ChatGPT橫空出世。經(jīng)研究之后,羅曉忠認(rèn)為,大模型之所以有這么高的能力,是因?yàn)樗鼡碛写罅扛哔|(zhì)量的數(shù)據(jù)和新型的訓(xùn)練方法,因此在大算力的支持下,涌現(xiàn)出了令人驚艷的能力。但在自己的行業(yè)領(lǐng)域,羅曉忠直接表示:“我們需要的是基于基礎(chǔ)大模型之上的行業(yè)大模型?!?/span>
“瑕疵檢測(cè)的容錯(cuò)率非常低,有一點(diǎn)點(diǎn)差錯(cuò)都不行,語(yǔ)言類的模型達(dá)不到這個(gè)水平,所以ChatGPT有時(shí)候會(huì)一本正經(jīng)地滿口胡話;另外,瑕疵品的數(shù)據(jù)是ChatGPT背后的訓(xùn)練數(shù)據(jù)庫(kù)里沒有的,所以大模型不會(huì)根本性替代我們公司現(xiàn)有的技術(shù)底座,”羅曉忠說(shuō),“但借鑒大模型多模態(tài)的訓(xùn)練方式,結(jié)合公司已有的行業(yè)數(shù)據(jù),我們可以更好地打造自己的行業(yè)大模型?!?/span>