選擇 AI 時代個人知識庫 PKM?從檔案、資料庫、AI,到無界 AI知識庫

個人知識庫各家有各家強項,非要選一個嗎? AI知識庫 能不能讓我們不用選擇因為全都有?

個人知識庫各家有各家強項,非要選一個嗎? AI知識庫 能不能讓我們不用選擇因為全都有?

個人知識庫各家有各家強項,非要選一個嗎? AI知識庫 能不能讓我們不用選擇因為全都有?

不論是學烘焙、外文,或是 AI,你是否曾經從零自學一門知識?

我自學 Python 數據分析時,先去網上找大神提供的「攻略」,然後雄心勃勃照表操課,結果是:

  1. 攻略之間差很大:不只內容不同,而是人人重點不同,我自己做統計表,像請大神投票一樣列出我的攻略,實做發現也不對;
  2. 「重要基礎」可跳過:統計學、線性代數、微積分是 3 大必要基礎?狠 K 統計學課本兩週後,發現大神已寫成 Python 函式,會套函式即可!
  3. 「重要技術」可跳過:都強調 SQL 重要,買了 IBM 線上課程兩週拼命完成,後發現 Python 裡用的機會極稀少,而且並不鼓勵這樣用!

是大神的攻略出錯了嗎?

我是「實用學習」主義者,只想掌握技能。如果為了考證照、求職或入學的「學術學習」,學半年一年不怪。但學術學習很容易難倒自己,最後就算沒放棄,要應用時還是要「實用學習」一次,把大堆頭的知識「忘招」!

索引,網狀或樹狀?

老師會提供攻略(或叫講義、學習地圖),它就像書籍目錄,分部、章、節、段…,排放整齊的樹狀架構讓人心安。

攻略是「自上而下的分類法(Top-Down Classification)」,生物學家把生物分類成:界、門、綱、目、科、屬、種,把所有生物畫成一株大樹,每種生物都可以分到一個位置,這就是一種「索引」,索引是這門學問的分類結構,同時讓你能找到相關筆記。

寫樹狀索引要開「上帝視角」,生物學家知識淵博,看過各種生物,所以能分類。

但有時候非自學不可,從零開始,就失去上帝視角,有幾種情形:

  1. 冷門到找不到攻略:例如想在臺灣學秘魯料理、印地語,根本找不到人教,沒有攻略只能自己摸索;
  2. 發展太快還沒攻略:像區塊鏈、AI,剛開始沒人懂沒有攻略,漸漸有人開課,但很抱歉,這種以「日」為迭代單位的知識,結業那一瞬間攻略就過時了,最後還是得要自己整理;
  3. 沉迷自學破關多巴胺上頭:例如我自學慣了,搞懂一件事會狂喜,去上課就少這點多巴胺!

小學生硬要畫樹狀索引,八九成是猜的,越用功填滿每根樹枝,錯的時候就更慘!假設剛開始生物學家把蜘蛛分類到昆蟲,後來蜘蛛被分到節肢動物,於是要改 1 萬筆記錄,真是苦工。

學習者只能把資料、筆記、圖片都塞進一個檔案夾,等進入狀況,就可以靈活移動、修改、串接,這是用「自下而上的探索法(Bottom-Up Exploration)」,這就是「卡片筆記知識庫」(Zettelkasten)的功能,它讓文件互為對方的索引,就像用線串起資料,想起一部分能沿線頭找到。

這種方法,整理資訊碎片,對發展太快的領域特別好用,用久了你就是寫出攻略的大神。

不同的學習法有不同工具

樹狀或網狀,筆記要有索引。

如果你是大神,你需要一個 Top-down 工具,如 Notion,它的資料庫很容易變成像書的目錄,每個目錄打開再加一層,最後你有一套完整的樹狀索引。另外 Evernote,或 Apple 內建筆記 App,都是這種哲學的產物,當然心智圖(Mind Mapping)是代表作。

Top-down 工具也不是不能寫 Bottom-up 筆記,就很吃力,我曾用 Notion 自製 Zettelkasten,但看到專業工具就果斷放棄。

專業的 Bottom-up 筆記軟體,多可實現 Zettelkasten 觀念,如聲量最大的免費軟體 Obsidian、開源軟體 Logseq、學術圈常用的 Roam Research、新創瞄準學習者的 RemNote,或台灣之光 Heptabase 等,它們都可以建立 Bottom-up 的知識庫。

Zettelkasten 知識庫的搬家非常困難,一篇篇筆記可以存檔輸出,但標籤、連結、參照… 等功能,經我測試搬家後多數丟失,如果你有幾千篇筆記,而且你很依賴它們,那搬家後花半年整理並不誇張。

所以,有些考量要先想清楚。

很久以前我就寫了《個人知識庫 軟體怎麼選?》分享如何選擇筆記軟體的個人見解,經過這麼久有新體會,本文是補充版。

存資料庫還是檔案?

相較於專家才能寫出的樹狀索引(目錄)可以簡單印成幾頁紙,自學者的 Bottom-up 筆記叫做「網狀索引」,它不像樹狀索引放在固定位置,要很容易更動,不然就不能配合你的知識成長變化,技術比樹狀困難。

我主力工具是 RemNote,但曾在《這篇文章》試用 Logseq,那時覺得兩者很像,都用點列(Bullets)和內縮(Indents)的 Outliner 整理邏輯,於是有一陣子 RemNote 開發受阻時,我轉用 Logseq 一個月,才發現外表雖然很像,但技術差別導致性能天差地別。

Logseq 每篇筆記都存一個檔案,電腦開檔案都有個「Loading…」嗎?對程式來說,開檔案就是去「外面」抓內容,快不起來,且越用檔案越多,那就會變得卡卡
RemNote 所有筆記都整在資料庫,只有少少幾個備份檔,資料庫原本就是用來處理大量資料的技術,只要優化得好,筆記多不會變慢,因為你其實是在同一個資料庫裡切換。

最明顯的差異是 Obsidian 和 Logseq 用 Markdown 「檔案」儲存筆記,打開檔案夾會看到每篇筆記有一個檔案,用越久檔案數量越多。而 RemNote 用「資料庫」儲存,同步檔案夾隱藏起來,如果你打開會發現就算你有 5000 篇筆記,卻全部存在幾個檔案裡。

這讓兩者性能差異巨大。

無法層級搜尋

RemNote 有一個好用功能叫「hierarchical Search」(階層式搜尋),想起上一層筆記標題,就可以展開找到下一層,對記性差的人太方便了。

李阿祖經過 5 代,家族有 1000 個子孫,你要找你的同學李小明,就算忘了名字,可以往上、往下找到他爸爸、妹妹、叔叔的名字再找到他;就算有很多個同名同姓,看他在家族樹的位置就知道是不是你的同學李小明。

因為 RemNote 每段文字都記錄在資料庫,就像「戶政事務所」登記了每個孩子的「身份證字號」和「爸爸的名字」,找一個名字,就能列出家譜,這就是層級筆記。

階層搜尋很容易,它原本就是按照 ID 和 Parent 關係組成頁面的。

Logseq 就沒有這個功能,Obsidian 也沒有,用檔案儲存的軟體沒有「戶政事務所」,它有層級筆記,也有親屬關係,卻沒記錄 ID 和 Parent。

就算有強大搜尋引擎,就算用關鍵字搜出 5000 個姓李的人,沒親屬關係不知是不是李阿祖的後代,你記性要很好,因為不記得李小明的全名就找不到你同學。

嵌套引用受限

RemNote 的說明文件老強調「RemNote 裡的一切都是 Rem」,到底想說什麼?是 Rem 又如何?我就是要叫它「段」會怎麼樣?用 Logseq 才知道這個設計概念之妙。

Logseq 基本單位是檔案,例如筆記《資料庫 or 檔案》會存為一個「資料庫 or 檔案.md」檔,如果這篇筆記參照了《資料庫》和《檔案》兩篇筆記,就是從「資料庫 or 檔案.md」建立了到「資料庫.md」和「檔案.md」的超連結。

檔案下還有「段落」,因為通常會參照文章的一段而不是全文。

在資料庫中,要參照誰就無腦連過去,可以無數層;而檔案就要考慮要連到檔案還是段落(兩層)?你習慣也好,但這種架構會造成嵌套問題。

當習慣了分層點列整理邏輯神器後,層級會越用越多,如果 A 筆記引用了一段 B 筆記,而 B 筆記中有一部分從 C 筆記引用過來… 就像俄羅斯娃娃那樣層層嵌套,對 RemNote 完全沒影響,只要改變「parent」就好了,但 Obsidian, Logseq 就變成檔案中套檔案再套檔案再套檔案……,變得很複雜。

無法移動影響靈活編輯

  • 我在 A 筆記寫了「段落甲」,有 10 篇筆記引用它。
  • 我發現寫錯了,應該把「段落甲」移動到 B 筆記。
  • 移動完畢,所有指向「A 筆記/段落甲」的 10 篇筆記都要勞師動衆地改成「B 筆記/段落甲」。

Logseq 如何處理這個改指向?有兩個選擇:

  1. 建立批次修改功能:它沒這麼做,這個功能要自動跨檔案剪下貼上,再自動把所有相關檔案修改指向新檔案,很容易出錯。
  2. 不讓你搬家:它選擇這麼做,Logseq 沒有「移動」功能,避免參照到不存在的段落。

剛開始用不能移動我還到處找到底功能隱藏在哪裡,原來沒有啊!

我認為移動很重要,因為 Bottom-up 筆記給學習者用,表示我筆記時還是外行,很容易分類錯誤,少了搬動功能,就像奇異筆寫了就擦不掉,只好塗塗抹抹,結果整本筆記塗得亂七八糟。

RemNote 可輕鬆移動「段落甲」(Rem 甲),因為引用它的筆記只是指向資料庫中的 Rem ID,根本沒有「檔案」觀念,ID 不變,引用者都不用改,Logseq 的難題,RemNote 輕易解決。

層級筆記適合整理邏輯,用資料庫可做到半自動維護,用檔案結構則是純手工維護,當知識庫越來越大,手動會複雜到難以維護,花越來越多時間在整理上。

筆記控都有同感,書寫可讓腦中模糊的概念清晰好記憶,如果筆記軟體很複雜就提高門檻,就不願寫筆記了。

Obsidian 和 Logseq 是純手動筆記系統,而 RemNote 是半自動筆記系統,還不夠?還想更省時省力?沒關係,AI 來了。

很高興知道 Logseq 也在開發資料庫版!團隊知道現行架構會限制發展,乾脆換成資料庫,但討論區很多用戶質疑幹嘛要改?我則「曾經滄海難為水」,用 RemNote 這麼久,檔案版已經用不來了。

用 AI知識庫 協助索引

要找到很久以前寫的筆記,要不靠索引,要不靠搜尋(背後也是索引)。

Embeddings Model 筆記,詳情請參考拙文

人類索引靠串聯,透過標籤、引用等方式讓彼此互為索引,比如我在筆記裡貼了 5 個標籤,段落裡引用被引用各 5 次,這樣就很難遺失了。

AI 讀書的「嵌入模型」(Embeddings model) 用近 1300 個維度把資料完善索引,難怪讀遍全世界知識的 ChatGPT 一瞬間就能回答問題。

LLM 能把我的筆記當訓練資料,貼上千個標籤精密讀,那它會更好的索引,甚至可以自動貼標籤,或建議貼什麼標籤,在筆記中建議連接到曾經寫過的其他筆記,雙重保障讓筆記更好索引,我夢想過這種筆記,不知是否存在?

居然真有這種筆記軟體,介紹 MEM!

MEM(https://get.mem.ai/),1.0 版要付費,開發中的 2.0 版免費使用,去試試 AI 輔助筆記的感覺吧!感想是,對我這重度依賴筆記軟體的人,筆記功能不足,但 AI 部分已具雛形。

本文規劃架構,在 RemNote 中寫複製貼上 Mem 這個 AI知識庫 ,不支援 RemNote/ Logseq 的 Outliner 分層級筆記功能,支援簡單的 Markdown 語法,右半是 AI Chat 和 Copilot,可能免費版,反應較慢
本文規劃架構,在 RemNote 中寫複製貼上 Mem 這個 AI知識庫 ,不支援 RemNote/ Logseq 的 Outliner 分層級筆記功能,支援簡單的 Markdown 語法,右半是 AI Chat 和 Copilot,可能免費版,反應較慢

它左半邊筆記,右邊 AI,AI 分做 Chat 和 Copilot。

  • 在左半邊寫筆記時,AI 透過嵌入模型掃讀、分析,更新記憶;
    • 但只有 Markdown,無法用 outliner 分層整理邏輯,類似 Obsidian;
  • 更新完成,你可以在右邊 Chat 問問題,它會以你的筆記為基礎回覆(類似 NotebookLM);
    • 反應較慢,可能是免費的關係,因為大語言模型很貴;
    • 認得中文,但每個回覆要很長時間,server 運算就慢了,還要透過網路就更慢了吧!
  • Copilot 應該在你寫作時給你建議,不過當前只會列出跟當前筆記相關的筆記。

無界 AI知識庫 筆記軟體的 USB

雖然 Mem 類似夢想筆記,但我心裡總覺得「天啊!又一個軟體!」,因為 ZK 知識庫搬家很難,我心裡的夢想筆記是不用搬家的,構想如下。

MEM 背後實現的架構應該是這張圖的上半截,但我不想再多用一個筆記軟體了,何不做個無界 AI知識庫 一個後台提供各種筆記軟體相同的 AI 服務,你原來習慣哪一套繼續用,還能幫不相通的軟體間造橋(圖片:六叔觀察站 https://uncle6.me)
MEM 背後實現的架構應該是這張圖的上半截,但我不想再多用一個筆記軟體了,何不做個無界 AI知識庫 一個後台提供各種筆記軟體相同的 AI 服務,你原來習慣哪一套繼續用,還能幫不相通的軟體間造橋(圖片:六叔觀察站 https://uncle6.me)

每個能生存的軟體都有強項,為了用某功能而裝某軟體,但它們彼此無法串連,只能靠我 Copy & Paste,因為每個軟體廠商都希望你用它的不要用別人的,刻意讓它不通,就像 USB 出現之前,每家公司都用自己奇形怪狀的接頭,例如 Apple 的 Lightening 和 Sony 特殊規格的記憶卡。

夢想筆記不是一套新軟體,而是讓「資料存入知識庫」和「知識從知識庫提取」這雙向過程能跨軟體,在 Google Docs 寫計劃書可以引用 RemNote 的筆記,就是「筆記軟體的 USB」。

好吧!只是個夢想,目前沒有這種軟體,如果你知道請分享給我,如果你打算要開發,我樂意協助!

讓我們保持聯繫

推送 Push:有個資疑慮的您,按下網址列左方「鎖頭」開啟「通知」會收到通知

電子報 Subscribe:在上方框或側邊欄框中訂閱電子報,我會看到信箱,但不會發垃圾郵件。

合作 Cooperation:行銷、課程合作 請到 About 中填寫表單,留言、臉書專頁聯繫也可以

臉書專頁:疑問或聊天,請留言,或到臉書專頁「Simpro 學習控」關注及留言

訂閱電子報

約雙週更新,絕無垃圾郵件|記得到信箱查看驗證信

最有人氣

探索更多來自 六叔觀察站 | Uncle6 Observer 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading