大語言模型 (LLms) 從一開始的「響應式」文字生成,受限於演算法、大數據訓練和算力速度,因此容易出現「一本正經地胡說八道」的幻覺。很快的、大語言模型發展為可支援生成文字、影像、聲音的多模態,但同樣受限於算力和 token 的大小,免費使用的大語言模型表現仍然受限,例如限制上下文本生成長度、上傳檔案大小受限、反應遲鈍等等。
為了降低幻覺的問題,各大語言模型不但訓練數據越來越大,演算法也不斷地更新進步,導入 RAG (Retriever, Generator, Ranker) 自然語言處理的模型架構,將檢索和生成兩個步驟結合起來,從外部知識庫中檢索與用戶查詢相關的信息。然後,RAG 模型使用生成模塊對檢索到的信息進行處理,生成最終的答案。OpenAI 最近發表的 o1 模型, 為 AI 的解決問題能力帶來了重大變革,它不再急於給予答案,而是採用了一種稱為「代理式逐步思維鏈」(agentic step by step chain of thought) 的慢思考模式,類似金庸筆下周伯通左右手互博,可以將複雜問題拆解成可管理的步驟,再給出回答。o1 模型強化了 AI 模型學習,達到能夠模仿人類思考模式的技術。
本自主學習計畫正好完整經歷過這些過程,我從傳統的 Google 瀏覽器查詢模式,然後 ChatGPT-3.5 問世,緊接著 ChatGPT-4、ChatGPT-4o、一直到最新的 ChatGPT-o1 陸續推出。從免費使用到付費訂閱,也從閉源平台到開源自架語言模型全部都經歷過一遍,其實動機都只是為了找出一種能夠「讓 AI 為自己學習目的而用」的最直觀和最簡易的操作模式。
所以、為了能幫助自己完善諸多的學習報告、協作專案、研究論文,我從學習提示詞工程並使用大模型模型平台解決問題,然後使用開源的大語言模型,自己動手架設本機LLM+知識庫模型,但是由於我的筆電太老舊也不支援 GPU,測試過程並不如人意,經常發生回答不完整、上下文丟失、反應卡頓、甚至不按指定知識庫來源自行生成幻覺回答等等…。
但是、很幸運的,隨著人工智慧不可思議的快速進展,我終於找到了最佳解決方案組合,而且全部都還是免費的。
連結:https://storm-project.stanford.edu/
STORM 是由史丹佛大學開發運營的知識管理系統,用於研究某個主題並產生帶有引文的完整報告。
STORM 可以根據網路搜尋從頭開始撰寫類似維基百科的文章。雖然該系統無法產生通常需要大量編輯的可發表文章,但經驗豐富的維基百科編輯發現它在預寫作階段很有幫助。
STORM 將產生帶有引用的長文章分為兩個步驟:
STORM 認為研究過程自動化的核心是自動提出好的問題。直接提示語言模型提出問題效果並不好。為了提高問題的深度和廣度,STORM 採用了兩種策略:
<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/1c9a43a7-e4ff-4891-8d60-fbed70180ecf/service_17303622.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/1c9a43a7-e4ff-4891-8d60-fbed70180ecf/service_17303622.png" width="40px" />
其他類似科研工具
Connected Paper:找到所有特定領域相關論文(延伸論文網絡圖)
https://www.connectedpapers.com/
Scispace : AI段落總結、論文聊天機器人、APA格式生成..
Explained Paper:針對論文特定名詞進行解釋(類似Chatgpt)
使用教學影片
https://youtu.be/IG74SdDmNhs?si=CmDMTWsnlVetaNGl
</aside>
<aside> <img src="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/14e8fd93-ac3b-469f-a2d2-c94b23cdb48f/service_17303622.png" alt="https://prod-files-secure.s3.us-west-2.amazonaws.com/74669eb4-5b30-42a0-b8b4-ad1bbc4925c0/14e8fd93-ac3b-469f-a2d2-c94b23cdb48f/service_17303622.png" width="40px" />
其他提供搜尋連結工具
Perplexity:https://www.perplexity.ai/
通義千問:https://tongyi.aliyun.com/
豆包:https://www.doubao.com/chat/
BeaGo:https://play.google.com/store/apps/details?id=com.beago.ai&hl=zh_TW
</aside>
Google 對應 AI 時代推出了 NotebookLM—AI 驅動的筆記平台,筆者認為這個平台或許是重新讓「做筆記」這件事情變得更有價值的好工具。