這份投影片將對話機器人和進階的大型語言模型相關應用分成四個類別來介紹。首先,我從對話機器人最基本的技術「關鍵字觸發與檢索」開始,展示如何使用對話機器人來訓練海運貨櫃操作員。另一份研究著重於將供應鏈採購階段的研究結果彙整,以此訓練對話機器人來供人諮詢供應商的相關資訊,包括了採購指標與價格資訊等。
接著,我們從基礎的關鍵字技術繼續升級,進階到了「Transformer 應用」。 Transformer 架構捕捉語意的能力不僅僅只是用於對話,還能將它用於蛋白質結構生成,甚至是利用自然語言的輸入來生成建築材料的3D 模型草稿。
第三部分則是講述應用Transformer架構最令人印象深刻的成功結果,也就是大型語言模型在「設計與製造」的案例。這部分我介紹了研究是如何將大型語言模型整合到機器人的設計流程之中。從設計流程到細節實作,研究者確實可以跟大型語言模型共同建構出有效的機器人方案。接著我們更進一步地看到研究是如何訓練大型語言模型來解決電腦設計與製造(CDaM)領域的問題。在電腦設計與製造所必須經歷的設計呈現、設計空間呈現、為製造而設計(DfM)、效能預測與最佳化等階段中,大型語言模型確實能夠解決部分問題,但在精確的數值計算和空間推理上也出現了不可忽視的侷限。
最後一部分我將重點放在現在大型語言模型熱門的檢索增強生成(Retrieval-Augmented Generation, RAG)議題上,也就是「知識轉移」的相關應用。我介紹了化學研究如何應用大型語言模型作為代理者(agent)來完成自動化的化學實驗,整個 Coscientist 的實驗規劃、執行與評估都能夠由大型語言模型來完成,令人印象深刻。另一份研究提出了製造業的大型語言模型應用框架 FILLIS,說明如何整合工廠的各種資料,並透過 LLM 提供即時資訊與協助,而這也更符合許多產業對於大型語言模型和RAG的需求。