普通人如何簡單地理解 AI 的思考方式?
很多人第一次認真使用 ChatGPT,心裡大概都會經歷一個很奇怪的瞬間。
就是當你發現它的回答不像搜尋結果,不像百科條目,也不像傳統軟件吐出的指令回應。
而是像一個人坐在對面,讀完了你的問題,然後說:
我明白你的意思了,我覺得你可以怎樣怎樣做。
它真的好像明白了你提出的問題,甚至知道了你的意圖和你想達到什麽目標。
那一刻,人很自然會問:AI 到底是怎樣思考的?怎麽那麽像人?
一般人聽到這個問題,會聯想到主流媒體對 AI 的闡釋。
它是個黑箱子。
它是高深的算法。
它是一堆專業名詞如 Transformer、attention、parameter... 等等詞結合出來的產物。
絕大多數人對它的理解通常就止步於此,因為這好像已經不是理解問題,而是資格問題。
好像只有看得懂論文、看得懂算法,要 Dr. 級別的人,才有資格談 AI 怎樣思考。
但事實上,我們不需要這些資格,也不需要理解任何算法方程式。
你只需要看懂了一個關於人的思考理論,就能大致明白 AI 的思考黑箱子,到底是怎麽運作的。
而在你明白了 AI 如何思考之後,你使用 AI 的方式將會徹底進化、改變。
那麽具體來説,到底是什麽思考理論,可以讓人一下子就搞明白 AI 的黑箱呢?
答案是:
思維聯想論
如果你有上過我的《一課思考學》,或讀過《深度思考的技術》,你或許還記得我提出過這麽一個理論,叫「思維聯想論」。
那時 ChatGPT 還沒橫空出世,我也并不關注 AI 技術的前沿。
等到 ChatGPT 爆紅,我開始去閲讀其背後的技術原理后,我的第一印象就是覺得,這原理和我寫過的「思維聯想論」很像。
熟悉這個理論的朋友們,可以選擇跳過這一節,但如果你不知道什麽是「思維聯想論」,那不妨聽我簡略的介紹一下。
我先把書裡的定義搬過來。
思維聯想論是一個很簡單的理論,裡面只有三句話:凡是思考,皆是聯想。凡是聯想,必有素材。聯想日新,以此迭代。
這三句話看起來很樸素、很不怎麽樣,但在我看來,這三句話能解釋人的所有思考形態,任何思考模式。
我們先從第一句開始:
凡是思考,皆是聯想。
所謂想到一件事,説白了就是一個概念和另一個概念連接了起來。
看到烏雲,聯想到下雨;看到一個人說話吞吞吐吐,聯想到他可能在隱瞞;讀到一本經濟學書,聯想到自己的投資和所處的社會。
我在書裏有詳細論證過,就連推理、換位、邏輯思考,這類好像和聯想無關的事情,其實底層邏輯也是大腦在聯想。
比如,在邏輯三段論裡面,結論必定是透過結合大前提和小前提進而得出的,少了一個都不成。
大前提:凡是人都會死
小前提:蘇格拉底是人
而當我們把「蘇格拉底是人」和「凡是人都會死」聯想起來,當我們思考這兩者有什麼聯繫,我們就會得出
結論:蘇格拉底會死
礙於篇幅關係,在這裏,我希望你只記住這個理論的核心要點:
所有的思考,都是聯想思考。
「思維聯想論」接下來的第二句是:
凡是聯想,必有素材。
這句話更重要。人不可能聯想到自己從未接觸過的東西。
諸葛亮再聰明,也不可能憑空提出相對論,因為他手上沒有現代物理學的素材。
而愛因斯坦即使智商再高一倍,如果他出生在原始的叢林部落,他就無法透過思考而提出相對論,因為他手上沒有現代物理學的素材。
我們再舉一個更直觀的例子——不知道你有沒有想過,為什麼電影裡的外星人長得都像人呢?這些不就是把地球上有的東西,融合起來而已嘛?為什麼虛構的外星物種總是走不出這些樣子呢?
答案很簡單,因為人類想像不出自己沒看過的東西,人類只能把自己看過的東西拼湊出一個外星物種的樣子。
這也是為什麼古人可以想像出神的樣子,各種各樣充滿創意的神話,山海經裡面的各種怪獸,半獸人半人馬之類,但就是想像不出機械人。這不是因為他們的創意不行,而是因為素材不夠。
我們可以天馬行空的創意,但是翅膀和馬是人們早就已經知道的東西。裡面沒有絲毫憑空而來的元素。
而所謂的想像力,不過是對已知的東西進行聯想,然後在腦海裡用畫面呈現出來而已。
所以思維聯想論的第二句話,凡是聯想,必有素材——
這其實說的是人類思考的極限,限制於我們手上的素材。
無論是多麼聰明的天才,他都會限制於當下可得的所有知識。
我們甚至可以說,所有的創造,所有問題的答案,所有的思考結論,都來自手上的素材。
素材的總量 = 可能性的總量
這是思考的極限、硬性限制。
當然,這一限制也適用於 AI 的思考,這一點我們待會會講到。
但是問題來了,如果所有的思考都是對現有素材的思考,中間沒有任何憑空而來的新東西,那麼人類的進步從何而來呢?
這就要說到思維聯想論的第三句話:
聯想日新,以此迭代。
如果你研究科技的歷史,你會發現,雖然以前的人無法想像出機械人的模樣,但還是有一些人想到了簡單的機械裝置。
這些機械裝置慢慢改進迭代,簡單的部件和另一個簡單的部件組在一起,時而變得複雜,時而變得精簡,最後變成了今天的樣子。
一開始人們想要獲得飛行的能力,就在自己的身體裝上人造的翅膀模仿鳥兒,這是工具與翅膀的聯想,但這些發明都以失敗告終。
接著,有個人換了個角度思考,他自小學習大量關於機械和電力學的知識,因此做過幾次試驗並失敗後,他很快就意識到「鳥人」的思路可能從根本上就行不通,他叫做喬治·凱利(Sir George Cayley)爵士。
後來凱利爵士轉而思考鳥翼形狀在飛行起到的作用,他結合牛頓的空氣阻力理論和翅膀的觀察,提出了空氣動力學的原理,奠基了航空學的理論基礎。
經過多年的試驗和改進,凱利爵士終於在 76 歲那年製作出了一架成功的滑翔機,實現了第一次載人滑翔飛行。
有意思的是,凱利爵士曾經構思過要給滑翔機裝一個發動機,但是在他們那個時代裡只有蒸汽機,而蒸汽機的重量太大,所以他不曾實現這一個想法。
直到萊特兄弟的出現。萊特兄弟出生的時機剛好,因為他們的前人提供了航空學的理論基礎,而且又趕上了尼古拉斯·奧托(Nicolaus Otto)發明現代內燃機的時代。
萊特兄弟也足夠聰明,他們拋棄了用人體操控飛機平衡的思路,並從控制風箏的方法中聯想到控制機翼的操作桿。
而後來的事情我們都知道了,萊特兄弟結合了凱利爵士的理論,給滑翔機裝上現代內燃機,再融合自己控制機翼的操作桿,終於完成了現代飛機的發明。
你看,以聯想作爲分析視角,我們可以簡單地理解到人類是從無到有的發明飛機的。
聯想會帶來新的素材,而新的素材又會被納入到更新的聯想,然後帶來更新的素材。
接著,更新的素材又會被納入到更更新的聯想……以此類推。
人類文明不是靠一次神蹟跳到現代的,而是靠一層又一層的素材疊上去,過程沒有任何神秘之處。
好了,説完了「思維聯想論」的三句話,是時候用「思維聯想論」充當開門鑰匙,打開 AI 思考的黑箱了。
AI 大語言模型,是一台聯想機器
我們先做一個小實驗。
假設我問你:
「蘋果價格怎麽那麽高?」
你會卡住一下。因為這個句子有歧義,蘋果可以是水果,也可以是蘋果公司。你需要更多資訊才能知道我指的是哪個。
但如果我問:
「我說蘋果價格怎麽那麽高?我想喝果汁。」
你立刻明白我說的是水果。
因爲「果汁」這個詞和「水果蘋果」連得比較近,和「Apple 公司」連得比較遠。
在你過去的生活素材裡,「果汁」和「水果」一起出現的次數遠遠多於和「股價」一起出現。
所以聽到「果汁」之後,「蘋果」這個詞就被你的腦子推向了水果那一側。
整個過程不需要你意識到,它就是聯想思考在後台自動運行。
現在我們把同一個問題交給 AI。
2017 年,Vaswani 等人發表了改變 AI 歷史的論文 Attention Is All You Need。
就是這篇論文提出了著名的 Transformer 架構,它最關鍵的地方,是把注意力機制放到核心位置,讓模型能在序列中的不同位置之間建立關係。
這聽起來挺繞的,但如果我們把技術細節暫時放下,用大白話來說,就是:
模型讀到一段文字之後,它不會平均看待所有的詞。它會替每個詞分配不同的權重,某些詞更值得注意,某些詞不太重要。
這個權重,是模型從訓練數據裡推算出來的:
在過去看過的所有句子裡,哪些詞通常和哪些詞一起出現。
這很像人的聯想。
當然,這不是説 Transformer 像人的意識在理解這一切。它沒有坐在計算機裡感受語境,沒有一個內在自我在說「我懂了」。
但它在運作形態上,的確是在做一件和聯想很像的事:
從素材之間找關係。
從關係裡計算下一步。
再用下一步生成新的素材。
這就是爲什麽我説,我們可以用「思維聯想論」理解 AI 大語言模型的思考。
AI 大語言模型最常被誤解的地方,是很多人把它想像成一個藏在機器裡的萬能智者。
但如果套回思維聯想論,事情會變得清楚很多。
凡是聯想,必有素材。
對人來說,素材是經驗、知識、語言、記憶、情緒、社會互動。
我們在生活、體驗、學習、思考之中,發現各種素材的關聯,看見「什麼東西通常會引發什麼東西」,並明白到世界是如何運作的。
對 AI 來說,素材主要來自訓練資料、模型參數、當下的上下文,以及使用者輸入的提示。
它是在大量文本素材裡,學會「什麼東西通常會和什麼東西連在一起」,並生成出最有可能關聯的下一句。
這也解釋了為什麼 AI 有時候看起來很懂,有時候卻一本正經地胡說。
當它手上的素材足夠好,問題又落在它熟悉的語言模式裡,它就能把相關素材連得很漂亮。
但當它手上的素材不足,或者問題要求它分辨世界裡的具體事實,而它沒有可靠的即時資料,它就可能把一些看起來像答案的材料接起來,給出一個模糊又不太靠譜的答案。
比如,一個人問它:「某個人在 2024 年某場演講裡說了什麼?」
如果那場演講的逐字稿沒有被放進上下文,模型也沒有可靠的即時資料可以查,它仍然會根據這人的名字、常見的演講格式、類似主題的文章語氣,拼出一段很像演講摘要的文字。
那段文字可能很順,也可能很像那個人會說的話,但它未必真的來自那場演講。這就是幻覺。
它不是忽然變笨了。它只是沒有足夠素材可以核對現實,卻仍然要生成下一句,於是把相似材料補了上去。
這一點其實也和人很像。
以前的人沒有關於天氣的科學知識,所以當天氣經常不好,太久沒下雨,或者下太多的雨,以前的人就會說是因爲惹怒了神明,要趕快拜神求仙。
因爲在他們的知識網絡之中,只有神明有力量改變天氣,因此只能聯想出這樣的結論。
現在,我們知道了 AI 的思考和人類的聯想思考很像。
而單純是知道這一點,就能大大改善一般人提示詞,
讓人更擅長調用 AI 。
提示詞心法
想象一個場景。
小明最近想轉職,但身邊沒有他信得過的人給他建議。
他聽説 AI 在這方面做得不錯,於是他打開了 ChatGPT,注冊了一個新賬號,輸入:
「幫我分析一下,我適合做什麼工作?」
ChatGPT 回答了一大段:可以根據興趣、技能、價值觀、工作環境、長期目標來評估,也可以做人格測驗、列出過往經驗、尋求他人回饋。
這些答案都沒有錯。
但也沒有用。
為什麼?
因為小明沒有給素材。
AI 面對這個問題,只能調用最一般的職涯建議素材。
它不知道小明過去做過什麼,不知道他討厭什麼,不知道他在什麼時候最有能量,也不知道他承受風險的能力如何。
於是小明改問:
「我過去五年都在做產品經理,喜歡構思新功能和寫文件,不太喜歡排期和催進度。我在小團隊裡表現比較好,在大公司流程裡很容易疲乏。我想保留收入穩定,但希望未來三年增加寫作和顧問工作的比例。請幫我分析可能的職涯方向。」
這次答案就不一樣了,AI 給出了非常有針對性的回答,小明看了過後,獲得了一些之前自己沒能想到的洞見。
這不是因為 AI 忽然變聰明,而是因為小明給的素材變好了。
接著,小明再加一句:
「請分別從職涯風險、能力遷移、收入結構、心理能量四個角度分析。」
答案又變得更精細了,小明再一次收穫了洞見。
因爲提供的素材不同,聯想的角度不同,就能讓 AI 產出不一樣的洞見。
你知道,有些人怎麽使用 AI,單純是由網絡上流行的提示詞所決定的。
這些提示詞好像咒語,只要唸對了,機器就會聽命,並生成很接近、很類似,但又個性化的結果。
但現在你知道,提示詞不過是給 AI 投放素材、設定角度、限制聯想方向。
更具體地說,提示詞的品質,可以透過三個原則提升:
第一,不要只問結論,要先給素材。把所有 AI 不可能自己知道的東西,預先放進去。
第二,不只給素材,還要給角度。同一件事可以從金錢成本看,也可以從時間成本看。角度不同,聯想就不同。
第三,不要把第一版答案當答案,要把它當素材。它的回答是新素材,新素材該被納入下一輪聯想。可以追問,可以反駁,可以要求換一個框架,也可以把其中一段抽出來深挖。
這就是在 AI 時代裏該有的「聯想日新,以此迭代」。
人和 AI 的理想合作情景,不是一問一答,然後就結束。
而是應該使用者給素材,AI 產生新素材,新素材刺激使用者修正問題,修正後的問題再推動 AI 產生更好的回答。
要把 AI 推向極限,你就需要一輪一輪的聯想更新,捉住它給的反饋當作跳板,不斷在其之上推進、深入。
一般人用的是 AI 的下限。
而你的聯想極限,決定了你能否調用 AI 的能力極限。
最近我使用 AI 時最愛做的事情,是和 AI 進行辯論,試著反駁、挑戰它給出的判斷。
有時是針對文章的評分,有時是針對某個觀念、論點。
每次我成功讓它修正自己之前給出的答案時,比如,對文章某個維度的評分從 7 分提高到 8 分,我都會乘勝追擊,問它爲什麽不是 10 分,它給出解釋后,我再試著説服它讓它修正。
有時,我因此收穫一些有用的建議,補足了一些我也認同的文章薄弱之處。
有時候我收穫了成就感,心裏得意的想「世界最强 AI 不過如此?!」
有時我采納了原本不同意的意見。
但爲了宣示決策自主權,我不照單全收,而是在其之上做微調、更改。
「我連我媽的話都不全聼,又怎麽可能全聼你的話呢!」
本文是《每週讀懂一本書+》的免費前瞻文章。
如果你喜歡這種書籍深度解讀,可以先加入等候名單;正式推出時,我會把首次訂閱折扣寄給名單上的讀者。
注:若以上按鈕沒反應,請點擊這裏