B03陳聿軒系友
我是B03畢業的陳聿軒,目前在美國卡內基梅隆大學(Carnegie Mellon University)就讀博士班。很榮幸有機會分享我近期完成的一篇論文,想和大家分享研究路上遇到的種種困難和心路歷程。
品牌辨識度創造了巨大的商業價值,這也是為何即使我們沒看到車子的logo,也可以輕易地從外觀辨識出賓士、BMW、Audi等車型。那麼,究竟是哪些曲線或幾何形狀讓它們如此容易辨識呢?從製造的角度出發,設計出兼顧創新又能保持品牌辨識度的新品,不僅需要設計師們多年的經驗,還得在反覆的市調與焦點小組中,透過抽象的語彙與片面的資訊進行迭代的修改,費時費力。既然人類辨識品牌特徵的方法是將不同品牌的設計進行比較,同中求異,那是否可以使用深度學習訓練一個模型來取代並自動化特徵辨識的過程,減輕設計者的一些負擔呢?
█ 研究的流程圖:從資料處理的角度,我提出了兩種使用人工智能提取品牌特徵的方案:從小的向量圖資料庫中觀察pattern並內插產生合成資料庫,以及從大的點陣圖資料庫進行向量化。在經過神經網路分類器後,我對這個分類器進行多方面的分析以獲得品牌導向的設計要素
在這個研究中,我面臨了許多困難。首先,資料從哪裡找?找到了以後,又該如何轉換成線條與形狀?進行此轉換之後,又要如何將向量形式的資料輸入給神經網路?
為了瞭解深度學習是否能被應用,我首先手動解決前兩個問題,以了解第三個問題能否得到解答。因此,我必須找一個外觀複雜度較低的產品,使得手動產生線條與形狀不會過於困難。手機,作為一個正正方方、線條簡約且隨處可見的日常用品,成為一個理想的個案分析。我量測了市面上各種手機的工程圖,找出共同點,用造型文法合成資料庫,接著我選擇了使用神經網路進行品牌分類。結果不但分類準確度高,而且可視化模型觀察的重點也符合人對手機品牌差異的觀察,因此我認為這是一個有潛力的方向。
█ 從收集來的手機工程圖中,我發現了品牌的pattern並製作了一個合成手機外觀的文法系統。只要調整每條規則中使用的參數,就可以產生有著高品牌辨識度的新手機
█ 由於合成資料庫中,蘋果的手機鏡頭始終在「瀏海」而三星則只會出現在正中間或是右上角,因此我將蘋果手機的鏡頭從左到右移動,將所訓練的模型判定該手機為蘋果的信心化成曲線圖。可以發現手機鏡頭在正中間時信心略為下降,且到「瀏海」右側時有很顯著的下降,顯示了模型的可解釋性
那麼,如何解決第二和第三個問題?由於點陣圖大數據在互聯網時代已經相當普及,只要建構一個點陣圖轉向量圖的流程即可解決前兩個問題,理論上也可以應用在幾何圖形複雜的資料上,而不需要手動製作。因此,我以車子作為第二個個案分析。
█ 邊緣偵測是我遇到的一大難題。我需要找到一個邊緣偵測演算法,可以提取最重要的產品外觀信息,忽略背景中的反射,但又不能忽略重要的曲線。經過多次嘗試,我終於發現使用transformer的EDTER效果最好
由於車子的向量圖有成千的曲線,我接著對手機個案分析使用的神經網路模型進行相應的深度和寬度的擴展,發現這個分類器同樣產出了可解釋且有高度參考價值的信息。從混淆矩陣和隱藏層降維可以看出,奢侈品牌的車辨識度特別高。我也對這個大模型進行可解釋分析,發現奢侈品牌一致集中在車燈和水箱罩形狀,不需要看logo甚至故意忽略。平價車則除了看logo形狀以外,沒有很明顯的趨勢。這應證了先前的研究:對奢侈品牌來說,外觀的設計對品牌辨識度非常重要,而平價品牌則更在意是否與同價位的車款相似,以達到可靠的印象。證明了人工智能的預測符合人性,有可解釋性,可以得出與人類相同的結論,也能輔助設計師辨識品牌。
█ 上圖為分類器的混淆矩陣結果,可以看出Benz, BMW, Audi等奢侈品牌的辨識度較高,反之豐田和現代則不容易區別。從右圖隱藏層的tSNE降維也可以得出一樣的結論
█ 圖中,紅色的曲線為分類器認為有助於品牌辨識的特徵,可以看出奢侈品牌的車多集中在車頭燈及水箱罩上,平價的車則沒有明顯的特徵。右上角為卷積神經網路在點陣圖上進行分類的可視化結果,可以發現在曲線及形狀的提取成效不佳,對設計的參考價值也就不高
在這個研究中,我學到了很多,特別想和學弟妹分享的有以下幾點:
首先,我很慶幸自己大學時優異成績使我獲得很好的留學機會,也為有趣的研究奠定基石。因此,我想鼓勵大家珍惜在校時光,體驗青春之虞一定要用心學習,努力取得好成績,將來便能收穫豐碩的果實。其次,不要怕寫程式!在這個資料科學飛速發展的時代,程式設計與演算法是每個專業都不可或缺的技能,在機械設計的領域,我更是相信機器學習能加速甚至解決很多長久被認為費時費力的問題。最後,我覺得做研究就像迷失在黑暗的隧道中。你可以看見前方微弱的光,希望那是出口,希望它不太遠,但你無法保證。既然你已經前行許久,回頭的路已經太長,只好硬著頭皮繼續往前。在這個迷茫的時刻,你會了解到你付出的努力:修過的課、看過的論文、寫過的程式、建立的人脈和溝通技巧(說與寫)成為了照亮你前方的手電筒--累積越多努力,你就能照得越遠,邁出的每一步也就會更加有自信。
希望這篇文章能夠激勵更多的人勇於追求自己的夢想,即使在研究的道路上遇到困難,也要堅持下去,因為每一份努力都會在未來成為照亮你前行的光。
校園與生活雜記
我在三所學校待過:臺灣大學、加州柏克萊大學和卡內基梅隆大學。三個大學都是頂尖的綜合型大學,因此都能接觸到來自各領域最聰明的人才,而城市給我的感受則有所不同。
柏克萊身處灣區,靠近大城市舊金山與奧克蘭,因此有很多的演唱會、市集與比賽等活動。我最喜歡的是爬柏克萊的後山,不但可以遠眺金門大橋,四季如春的天氣讓這裡一年四季都能在綠意盎然的環境中放鬆身心。
匹茲堡是一個比較小的城市,治安相對較好。秋天可以賞楓,冬天可以滑雪,夏天我最喜歡的活動是打匹克球(這是一種介於網球和桌球之間的運動),這些活動讓我在不同的季節都有不同的享受。
回想在台北的公館生活,這是三個城市中最方便的地方,不僅有四通八達又準時的公車和捷運,滿街都是便宜又好吃的餐廳。我則是由其喜歡在河濱公園騎腳踏車,這樣的便利性和豐富的美食選擇讓我的生活多姿多彩。
我認為,卡內基梅隆大學最大的優點是擁有世界一流的人工智慧教學與研究資源,由每個系所都有與機器學習相關的研究室可見一斑。因此,我特別推薦對這領域有興趣的同學來修機器學習和電腦圖學的課程,這些課的教授常能以淺顯易懂的方式解釋數學理論,作業也能很好地輔助學生理解。這些課程對我進行深度學習相關研究有很大的幫助。
作者簡介:
2018年畢業於台大機械系,曾在加州大學柏克萊分校交換留學一年,在高雄擔任工程師兩年。2020年秋季入學卡內基梅隆大學機械系博士班,現為博士候選人
論文連結
█ 圖1
█ 圖2
█ 圖3
█ 圖4
█ 圖5
卡內基梅隆大學的校慶Spring Carnival,有各種遊樂設施(圖1),Buggy比賽(圖2,3),和學生搭建的主題木屋booth(圖4,5)
點閱人數