“我最近,是不是廢了……”她癱在沙發上,手機扣在胸口,盯著天花板自言自語。
我坐在一旁,隨手翻著桌上的雜志,沒接話,等著她把情緒發泄完。
果然,幾秒后,她重重地嘆了口氣,甩開手機:“真搞不懂,為什么我越忙,越覺得自己一事無成。每天像陀螺一樣轉,最后輸出的全是廢話、廢稿、廢方案。”
我合上雜志,笑了笑:“你知道大語言模型是怎么訓練出來的嗎?”
她立刻警覺地看向我:“別又扯你的計算機哲學,我現在心情不好,沒空聽你上課。”
我挑眉:“恰恰相反,你現在最需要聽的,就是這個。”
她翻了個白眼,但終究還是沒打斷我。
我靠在沙發背上,慢悠悠地說:“你有沒有想過,你的問題,不在于‘輸出不夠好’,而在于——你輸入了什么?”
她皺了皺眉:“輸入?”
“對。”我指了指她甩開的手機,“計算機有個最基礎的機制,叫I/O,輸入/輸出。程序運行得好不好,取決于接收了什么信號。Garbage In, Garbage Out——垃圾進,垃圾出,懂了嗎?”
她嘟囔著:“第一次聽說……”
“想知道大語言模型為什么強大?”我繼續說道,“靠的不是臨時爆發,而是在預訓練階段,吃進了海量高質量的數據。模型的上限,早在輸入的時候就被定了。”
她低頭看著手機屏幕上堆滿的推送消息、短視頻推薦和無休止的社交提醒,神情有些恍惚。
我順勢補了一刀:“你每天刷的短視頻、八卦、無效社交、負能量吐槽大會……這些,都是你的‘訓練數據’。你輸入的都是這些,指望輸出什么精品?”
她苦笑著躺回沙發:“聽你這么一說,我是真被喂廢了。”
我笑著搖頭:“其實,更糟糕的是,你不僅輸入的是垃圾,還在超負荷輸入。你知道計算機的I/O有個概念叫帶寬限制嗎?”
她側頭看我:“又是什么高深詞?”
“簡單說,輸入通道有限,塞太多只會堵住。信息太雜、太碎,反而讓真正有價值的輸入被淹沒,系統變卡。”我指了指她堆滿推送的通知欄,“你這就是典型的信息過載。”
她若有所思:“那怎么辦?難道全關了?”
“不是關掉,而是學會異步I/O。”我笑道,“別被動接受碎片信息,安排固定的深度輸入時間。像計算機一樣,合理調度,批量處理,效率才高。”
她點點頭,順手清理了通知欄。
“還有,”我補充道,“計算機不會什么都接受,輸入前先看協議、格式標準。人生也一樣,學會設定輸入規則,別啥消息都往腦子里塞。”
她笑了:“給自己設個‘輸入白名單’?”
“聰明。”我點頭,“而且輸入后,記得做預處理。信息拿到手,先篩選、思考、歸納,別原樣吞下去,那是低效輸入。”
她坐起身,果斷卸載了幾個常用App,又關掉了后臺自動推送。
“從現在開始,只接收高質量輸入。”她揚了揚手機,神情認真。
我靠在沙發上,看著她的動作,忍不住笑道:“不錯,像極了我們最近那篇被NAACL接收的論文思路。”
她側頭看我:“又來了,非得秀一波是吧?”
我笑著聳聳肩:“講的就是數據選擇與優化輸入,你這操作,妥妥的實戰版。”
她翻了個白眼,調侃道:“行了行了,你多優秀我不知道嗎?我的大教授。”
說完,她干脆把通知欄也清了個干凈。
“別忘了,定期清理緩存,順便優化一下系統性能。”我補充了一句。
她抬頭看我,嘴角帶著點得意:“等著吧,等我輸出個女神版本的自己。”
我笑著點頭:“拭目以待。不過記得,輸入也別太單一,不然容易‘過擬合’,變成只會套路輸出的‘模板人’。”
她忽然頓住,若有所思地問:“那……如果大模型遇到輸入不足,會怎么樣?”
我想了想,回答:“會停滯,甚至崩潰。”
她點點頭,露出一抹狡黠的笑容:“那幸好,我還有你這個‘訓練師’。”
夜風吹進窗戶,屋里安靜下來。手機屏幕暗了下去,像是徹底切斷了那些無效的輸入源。我知道,從這一刻起,她的“系統”正在重啟。
真正高效的系統,不是接收最多的信息,而是懂得篩選、處理與積累,才能輸出最好的自己。——計算機哲學故事集 · 02