個人知識庫各家有各家強項,非要選一個嗎? AI知識庫 能不能讓我們不用選擇因為全都有?
不論是學烘焙、外文,或是 AI,你是否曾經從零自學一門知識?
我自學 Python 數據分析時,先去網上找大神提供的「攻略」,然後雄心勃勃照表操課,結果是:
- 攻略之間差很大:不只內容不同,而是人人重點不同,我自己做統計表,像請大神投票一樣列出我的攻略,實做發現也不對;
- 「重要基礎」可跳過:統計學、線性代數、微積分是 3 大必要基礎?狠 K 統計學課本兩週後,發現大神已寫成 Python 函式,會套函式即可!
- 「重要技術」可跳過:都強調 SQL 重要,買了 IBM 線上課程兩週拼命完成,後發現 Python 裡用的機會極稀少,而且並不鼓勵這樣用!
是大神的攻略出錯了嗎?
我是「實用學習」主義者,只想掌握技能。如果為了考證照、求職或入學的「學術學習」,學半年一年不怪。但學術學習很容易難倒自己,最後就算沒放棄,要應用時還是要「實用學習」一次,把大堆頭的知識「忘招」!
本文目錄
索引,網狀或樹狀?
老師會提供攻略(或叫講義、學習地圖),它就像書籍目錄,分部、章、節、段…,排放整齊的樹狀架構讓人心安。
攻略是「自上而下的分類法(Top-Down Classification)」,生物學家把生物分類成:界、門、綱、目、科、屬、種,把所有生物畫成一株大樹,每種生物都可以分到一個位置,這就是一種「索引」,索引是這門學問的分類結構,同時讓你能找到相關筆記。
寫樹狀索引要開「上帝視角」,生物學家知識淵博,看過各種生物,所以能分類。
但有時候非自學不可,從零開始,就失去上帝視角,有幾種情形:
- 冷門到找不到攻略:例如想在臺灣學秘魯料理、印地語,根本找不到人教,沒有攻略只能自己摸索;
- 發展太快還沒攻略:像區塊鏈、AI,剛開始沒人懂沒有攻略,漸漸有人開課,但很抱歉,這種以「日」為迭代單位的知識,結業那一瞬間攻略就過時了,最後還是得要自己整理;
- 沉迷自學破關多巴胺上頭:例如我自學慣了,搞懂一件事會狂喜,去上課就少這點多巴胺!
小學生硬要畫樹狀索引,八九成是猜的,越用功填滿每根樹枝,錯的時候就更慘!假設剛開始生物學家把蜘蛛分類到昆蟲,後來蜘蛛被分到節肢動物,於是要改 1 萬筆記錄,真是苦工。
學習者只能把資料、筆記、圖片都塞進一個檔案夾,等進入狀況,就可以靈活移動、修改、串接,這是用「自下而上的探索法(Bottom-Up Exploration)」,這就是「卡片筆記知識庫」(Zettelkasten)的功能,它讓文件互為對方的索引,就像用線串起資料,想起一部分能沿線頭找到。
這種方法,整理資訊碎片,對發展太快的領域特別好用,用久了你就是寫出攻略的大神。
不同的學習法有不同工具
樹狀或網狀,筆記要有索引。
如果你是大神,你需要一個 Top-down 工具,如 Notion,它的資料庫很容易變成像書的目錄,每個目錄打開再加一層,最後你有一套完整的樹狀索引。另外 Evernote,或 Apple 內建筆記 App,都是這種哲學的產物,當然心智圖(Mind Mapping)是代表作。
Top-down 工具也不是不能寫 Bottom-up 筆記,就很吃力,我曾用 Notion 自製 Zettelkasten,但看到專業工具就果斷放棄。
專業的 Bottom-up 筆記軟體,多可實現 Zettelkasten 觀念,如聲量最大的免費軟體 Obsidian、開源軟體 Logseq、學術圈常用的 Roam Research、新創瞄準學習者的 RemNote,或台灣之光 Heptabase 等,它們都可以建立 Bottom-up 的知識庫。
Zettelkasten 知識庫的搬家非常困難,一篇篇筆記可以存檔輸出,但標籤、連結、參照… 等功能,經我測試搬家後多數丟失,如果你有幾千篇筆記,而且你很依賴它們,那搬家後花半年整理並不誇張。
所以,有些考量要先想清楚。
很久以前我就寫了《個人知識庫 軟體怎麼選?》分享如何選擇筆記軟體的個人見解,經過這麼久有新體會,本文是補充版。
存資料庫還是檔案?
相較於專家才能寫出的樹狀索引(目錄)可以簡單印成幾頁紙,自學者的 Bottom-up 筆記叫做「網狀索引」,它不像樹狀索引放在固定位置,要很容易更動,不然就不能配合你的知識成長變化,技術比樹狀困難。
我主力工具是 RemNote,但曾在《這篇文章》試用 Logseq,那時覺得兩者很像,都用點列(Bullets)和內縮(Indents)的 Outliner 整理邏輯,於是有一陣子 RemNote 開發受阻時,我轉用 Logseq 一個月,才發現外表雖然很像,但技術差別導致性能天差地別。
最明顯的差異是 Obsidian 和 Logseq 用 Markdown 「檔案」儲存筆記,打開檔案夾會看到每篇筆記有一個檔案,用越久檔案數量越多。而 RemNote 用「資料庫」儲存,同步檔案夾隱藏起來,如果你打開會發現就算你有 5000 篇筆記,卻全部存在幾個檔案裡。
這讓兩者性能差異巨大。
無法層級搜尋
RemNote 有一個好用功能叫「hierarchical Search」(階層式搜尋),想起上一層筆記標題,就可以展開找到下一層,對記性差的人太方便了。
李阿祖經過 5 代,家族有 1000 個子孫,你要找你的同學李小明,就算忘了名字,可以往上、往下找到他爸爸、妹妹、叔叔的名字再找到他;就算有很多個同名同姓,看他在家族樹的位置就知道是不是你的同學李小明。
因為 RemNote 每段文字都記錄在資料庫,就像「戶政事務所」登記了每個孩子的「身份證字號」和「爸爸的名字」,找一個名字,就能列出家譜,這就是層級筆記。
階層搜尋很容易,它原本就是按照 ID 和 Parent 關係組成頁面的。
Logseq 就沒有這個功能,Obsidian 也沒有,用檔案儲存的軟體沒有「戶政事務所」,它有層級筆記,也有親屬關係,卻沒記錄 ID 和 Parent。
就算有強大搜尋引擎,就算用關鍵字搜出 5000 個姓李的人,沒親屬關係不知是不是李阿祖的後代,你記性要很好,因為不記得李小明的全名就找不到你同學。
嵌套引用受限
RemNote 的說明文件老強調「RemNote 裡的一切都是 Rem」,到底想說什麼?是 Rem 又如何?我就是要叫它「段」會怎麼樣?用 Logseq 才知道這個設計概念之妙。
Logseq 基本單位是檔案,例如筆記《資料庫 or 檔案》會存為一個「資料庫 or 檔案.md
」檔,如果這篇筆記參照了《資料庫》和《檔案》兩篇筆記,就是從「資料庫 or 檔案.md
」建立了到「資料庫.md
」和「檔案.md
」的超連結。
檔案下還有「段落」,因為通常會參照文章的一段而不是全文。
在資料庫中,要參照誰就無腦連過去,可以無數層;而檔案就要考慮要連到檔案還是段落(兩層)?你習慣也好,但這種架構會造成嵌套問題。
當習慣了分層點列整理邏輯神器後,層級會越用越多,如果 A 筆記引用了一段 B 筆記,而 B 筆記中有一部分從 C 筆記引用過來… 就像俄羅斯娃娃那樣層層嵌套,對 RemNote 完全沒影響,只要改變「parent」就好了,但 Obsidian, Logseq 就變成檔案中套檔案再套檔案再套檔案……,變得很複雜。
無法移動影響靈活編輯
- 我在 A 筆記寫了「段落甲」,有 10 篇筆記引用它。
- 我發現寫錯了,應該把「段落甲」移動到 B 筆記。
- 移動完畢,所有指向「A 筆記/段落甲」的 10 篇筆記都要勞師動衆地改成「B 筆記/段落甲」。
Logseq 如何處理這個改指向?有兩個選擇:
- 建立批次修改功能:它沒這麼做,這個功能要自動跨檔案剪下貼上,再自動把所有相關檔案修改指向新檔案,很容易出錯。
- 不讓你搬家:它選擇這麼做,Logseq 沒有「移動」功能,避免參照到不存在的段落。
剛開始用不能移動我還到處找到底功能隱藏在哪裡,原來沒有啊!
我認為移動很重要,因為 Bottom-up 筆記給學習者用,表示我筆記時還是外行,很容易分類錯誤,少了搬動功能,就像奇異筆寫了就擦不掉,只好塗塗抹抹,結果整本筆記塗得亂七八糟。
RemNote 可輕鬆移動「段落甲」(Rem 甲),因為引用它的筆記只是指向資料庫中的 Rem ID,根本沒有「檔案」觀念,ID 不變,引用者都不用改,Logseq 的難題,RemNote 輕易解決。
層級筆記適合整理邏輯,用資料庫可做到半自動維護,用檔案結構則是純手工維護,當知識庫越來越大,手動會複雜到難以維護,花越來越多時間在整理上。
筆記控都有同感,書寫可讓腦中模糊的概念清晰好記憶,如果筆記軟體很複雜就提高門檻,就不願寫筆記了。
Obsidian 和 Logseq 是純手動筆記系統,而 RemNote 是半自動筆記系統,還不夠?還想更省時省力?沒關係,AI 來了。
很高興知道 Logseq 也在開發資料庫版!團隊知道現行架構會限制發展,乾脆換成資料庫,但討論區很多用戶質疑幹嘛要改?我則「曾經滄海難為水」,用 RemNote 這麼久,檔案版已經用不來了。
用 AI知識庫 協助索引
要找到很久以前寫的筆記,要不靠索引,要不靠搜尋(背後也是索引)。
人類索引靠串聯,透過標籤、引用等方式讓彼此互為索引,比如我在筆記裡貼了 5 個標籤,段落裡引用被引用各 5 次,這樣就很難遺失了。
AI 讀書的「嵌入模型」(Embeddings model) 用近 1300 個維度把資料完善索引,難怪讀遍全世界知識的 ChatGPT 一瞬間就能回答問題。
LLM 能把我的筆記當訓練資料,貼上千個標籤精密讀,那它會更好的索引,甚至可以自動貼標籤,或建議貼什麼標籤,在筆記中建議連接到曾經寫過的其他筆記,雙重保障讓筆記更好索引,我夢想過這種筆記,不知是否存在?
居然真有這種筆記軟體,介紹 MEM!
MEM(https://get.mem.ai/),1.0 版要付費,開發中的 2.0 版免費使用,去試試 AI 輔助筆記的感覺吧!感想是,對我這重度依賴筆記軟體的人,筆記功能不足,但 AI 部分已具雛形。
它左半邊筆記,右邊 AI,AI 分做 Chat 和 Copilot。
- 在左半邊寫筆記時,AI 透過嵌入模型掃讀、分析,更新記憶;
- 但只有 Markdown,無法用 outliner 分層整理邏輯,類似 Obsidian;
- 更新完成,你可以在右邊 Chat 問問題,它會以你的筆記為基礎回覆(類似 NotebookLM);
- 反應較慢,可能是免費的關係,因為大語言模型很貴;
- 認得中文,但每個回覆要很長時間,server 運算就慢了,還要透過網路就更慢了吧!
- Copilot 應該在你寫作時給你建議,不過當前只會列出跟當前筆記相關的筆記。
無界 AI知識庫 筆記軟體的 USB
雖然 Mem 類似夢想筆記,但我心裡總覺得「天啊!又一個軟體!」,因為 ZK 知識庫搬家很難,我心裡的夢想筆記是不用搬家的,構想如下。
每個能生存的軟體都有強項,為了用某功能而裝某軟體,但它們彼此無法串連,只能靠我 Copy & Paste,因為每個軟體廠商都希望你用它的不要用別人的,刻意讓它不通,就像 USB 出現之前,每家公司都用自己奇形怪狀的接頭,例如 Apple 的 Lightening 和 Sony 特殊規格的記憶卡。
夢想筆記不是一套新軟體,而是讓「資料存入知識庫」和「知識從知識庫提取」這雙向過程能跨軟體,在 Google Docs 寫計劃書可以引用 RemNote 的筆記,就是「筆記軟體的 USB」。
好吧!只是個夢想,目前沒有這種軟體,如果你知道請分享給我,如果你打算要開發,我樂意協助!