大語言模型 (LLms) 從一開始的「響應式」文字生成,受限於演算法、大數據訓練和算力速度,因此容易出現「一本正經地胡說八道」的幻覺。很快的、大語言模型發展為可支援生成文字、影像、聲音的多模態,但同樣受限於算力和 token 的大小,免費使用的大語言模型表現仍然受限,例如限制上下文本生成長度、上傳檔案大小受限、反應遲鈍等等。

為了降低幻覺的問題,各大語言模型不但訓練數據越來越大,演算法也不斷地更新進步,導入 RAG (Retriever, Generator, Ranker) 自然語言處理的模型架構,將檢索和生成兩個步驟結合起來,從外部知識庫中檢索與用戶查詢相關的信息。然後,RAG 模型使用生成模塊對檢索到的信息進行處理,生成最終的答案。OpenAI 最近發表的 o1 模型, 為 AI 的解決問題能力帶來了重大變革,它不再急於給予答案,而是採用了一種稱為「代理式逐步思維鏈」(agentic step by step chain of thought) 的慢思考模式,類似金庸筆下周伯通左右手互博,可以將複雜問題拆解成可管理的步驟,再給出回答。o1 模型強化了 AI 模型學習,達到能夠模仿人類思考模式的技術。

本自主學習計畫正好完整經歷過這些過程,我從傳統的 Google 瀏覽器查詢模式,然後 ChatGPT-3.5 問世,緊接著 ChatGPT-4、ChatGPT-4o、一直到最新的 ChatGPT-o1 陸續推出。從免費使用到付費訂閱,也從閉源平台到開源自架語言模型全部都經歷過一遍,其實動機都只是為了找出一種能夠「讓 AI 為自己學習目的而用」的最直觀和最簡易的操作模式。

所以、為了能幫助自己完善諸多的學習報告、協作專案、研究論文,我從學習提示詞工程並使用大模型模型平台解決問題,然後使用開源的大語言模型,自己動手架設本機LLM+知識庫模型,但是由於我的筆電太老舊也不支援 GPU,測試過程並不如人意,經常發生回答不完整、上下文丟失、反應卡頓、甚至不按指定知識庫來源自行生成幻覺回答等等…。

但是、很幸運的,隨著人工智慧不可思議的快速進展,我終於找到了最佳解決方案組合,而且全部都還是免費的。

匯集研究主題

STORM

連結:https://storm-project.stanford.edu/

STORM 是由史丹佛大學開發運營的知識管理系統,用於研究某個主題並產生帶有引文的完整報告。

STORM 可以根據網路搜尋從頭開始撰寫類似維基百科的文章。雖然該系統無法產生通常需要大量編輯的可發表文章,但經驗豐富的維基百科編輯發現它在預寫作階段很有幫助。

STORM 將產生帶有引用的長文章分為兩個步驟:

  1. 預寫階段:系統進行基於互聯網的研究,收集參考資料並產生大綱。
  2. 寫作階段:系統使用大綱和參考文獻產生帶有引文的全文文章。

STORM 認為研究過程自動化的核心是自動提出好的問題。直接提示語言模型提出問題效果並不好。為了提高問題的深度和廣度,STORM 採用了兩種策略:

  1. 觀點引導提問:給定輸入主題,STORM 透過調查類似主題的現有文章來發現不同的觀點,並使用它們來控制提問過程。
  2. 模擬對話:STORM 模擬維基百科作者和基於網路資源的主題專家之間的對話,使語言模型能夠更新其對主題的理解並提出後續問題。

<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/1c9a43a7-e4ff-4891-8d60-fbed70180ecf/service_17303622.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/1c9a43a7-e4ff-4891-8d60-fbed70180ecf/service_17303622.png" width="40px" />

其他類似科研工具

Connected Paper:找到所有特定領域相關論文(延伸論文網絡圖)

https://www.connectedpapers.com/

Scispace : AI段落總結、論文聊天機器人、APA格式生成..

https://typeset.io/

Explained Paper:針對論文特定名詞進行解釋(類似Chatgpt)

https://www.explainpaper.com/

使用教學影片

https://youtu.be/IG74SdDmNhs?si=CmDMTWsnlVetaNGl

</aside>

<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/14e8fd93-ac3b-469f-a2d2-c94b23cdb48f/service_17303622.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/14e8fd93-ac3b-469f-a2d2-c94b23cdb48f/service_17303622.png" width="40px" />

其他提供搜尋連結工具

Perplexity:https://www.perplexity.ai/

通義千問:https://tongyi.aliyun.com/

豆包:https://www.doubao.com/chat/

BeaGo:https://play.google.com/store/apps/details?id=com.beago.ai&hl=zh_TW

</aside>

NotebookLM 知識庫

Google 對應 AI 時代推出了 NotebookLM—AI 驅動的筆記平台,筆者認為這個平台或許是重新讓「做筆記」這件事情變得更有價值的好工具。