ChatGPT has entered the classroom: how LLMs could transform education
- 前言
- Introduction
- The risks are real
- Embracing LLMs
- Introducing the AI tutor
- Augmenting retrieval
- Will it catch on?
- 總結
前言
一篇來自Nature的文章,探討了教育行業的不同參與者,如何抓住LLM這個變革性的工具帶來的機會,重新改造這項自人類文明誕生以來就存在的行業。文中提出了當前LLM所帶來的機遇與挑戰,以及討論了未來教育領域該何去何從。
Paper | https://www.nature.com/articles/d41586-023-03507-3 |
---|---|
From | Nature |
Introduction
LLM對教育的沖擊已經不可阻擋,不論是學生,老師,還是教育機構,乃至教育工具提供商,都應該積極地把握LLM帶來的機會,徹底地改變學習和教學的方式,才能應對教育行業即將發生的改變。
教育心理學家Beghetto設計了一系列以創造力為主題的聊天機器人,并將其托管到亞利桑那州立大學的平臺上。這些機器人可以扮演各種角色,用于鼓勵學生的創造力。Beghetto將這些聊天機器人和一群研究生以及教學專家進行了對話,得到了積極的反饋,一位參與者說,他們以前曾嘗試使用ChatGPT來輔助學習,但發現它并不實用,這與Beghetto的聊天機器人不同。
LLM的興起同樣造成了需要教育工作者的擔憂,他們認為學生會更容易作弊。因此,Beghetto團隊正在探索如何發揮LLM的潛力,作為加強教育的工具,節省學生和老師的時間,讓他們更專注于討論和學習。為了讓一對一輔導模式能夠大規模應用,Wolfram Research公司目前正在開發一種基于LLM的輔導軟件,這種人工智能合作伙伴可以用來引導學生一步一步地解決問題,激發批判性思維,或者像Beghetto的實驗那樣,提高用戶的創造力,擴展思維的邊界。
The risks are real
自從ChatGPT推出以來,其在教育領域的應用大部分都是負面的。因為它的回答寫的很好,因此學生會常常依賴ChatGPT幫他們做作業,或者快速獲取答案,而不去明白其中的道理。此外,ChatGPT還會輸出錯誤的信息,從而誤導學生,這就是LLM的幻覺問題。
雖然GPT-4被認為是表現最好的LLM,但是研究發現,它并不擅長回答大學水平的教科書問題,即使是對問題進行分解進行解答也只能帶來適度的提升。
Embracing LLMs
盡管困難重重,一些研究人員和教育工作者還是看到了LLM的巨大潛力。有的公司使用ChatGPT的替代品,有的公司想方設法減少不準確性和幻覺,有的公司則通過指令微調等方法來讓LLM學習特定學科的知識。所謂“高風險,高回報”,許多教育專家都認為對于LLM強大的能力,社會需要幫助學生了解LLM的優勢和風險,而不是一味地禁止他們使用這項技術。2023年9月,聯合國教科文組織發布了一份題為《生成式人工智能教育和研究指南》的報告。其主要建議之一是教育機構在使用 ChatGPT 等工具支持學習之前先對其進行驗證。
一些公司銷售MagicSchool和Eduaide等商業助手,這些工具基于LLM,幫助學校教師規劃課程活動并評估學生的作業。此外,學術界也開發了其他工具,比如賓夕法尼亞州立大學計算機科學家Rebecca Passonneau團隊創建的PyrEval,用于閱讀論文并提取關鍵信息,并且還能為學生撰寫的物理論文進行評分,幫助學生對自己的作業內容進行反思。
Introducing the AI tutor
一些機構直接使用AI來輔導學生,除了ChatGPT,Khanmigo可能是使用最廣泛的基于LLM的教育工具。通過使用GPT-4提供的能力,Khanmigo可以在學生完成練習時為他們提供提示和輔導,從而節省教師的時間。它的呈現形式與ChatGPT不同,它以彈出式聊天機器人形式出現在學生的電腦屏幕上,當學生將自己的問題發送到GPT-4之前,Khanmigo會自動添加一個提示,讓GPT-4不要直接給出答案,而是提出很多問題,引導學生自己得到答案。
Khanmigo目前仍處于試驗階段,在有助于學習的問題和難到讓學生放棄的問題之間存在著微妙的界限,關鍵就是在于如何找到這條界線。雖然Khanmigo已經有超過2.8萬名教師和學生用戶,但是它在問答的過程中,有時候會出錯,有時候會直接給出答案。這表明,Khanmigo還有很多值得改進的地方。
Augmenting retrieval
另一種創建AI學習助手的方法是將LLM和嚴格認證的外部知識語料庫結合在一起。比如AI公司Merlyn Mind正在其開源Corpus-qa LLM中使用檢索生成方法(RAG),這個LLM面向教育領域。在回答問題時,它會參考特定的語料庫,從而減少幻覺和其他錯誤,此外,如果問題沒有高質量的回答,就會坦白說自己不會,并努力做出更好的回答。
華東師范大學的研究人員創建了一款名為EduChat的教育大模型,將論文評估、對話式輔導和情感支持結合在一個大語言模型中。該團隊以開放源代碼的形式分享了這一工具。盡管EduChat仍處于早期階段,但它是一個專用的教育LLM,而不是在現有通用模型基礎上的套殼工具,這一點值得注意。
Will it catch on?
AI真的能改變教育嗎,它是否會造成現有的教育資源不平等?并且如何確保LLM提供的信息不帶偏見,并確保模型考慮到代表性不足群體的知識和觀點?也許目前無法對這些問題給出準確的答案,但是LLM與人類的努力緊密相連,現階段必須重新思考在哦教育領域如何教學和評估學習。
總結
LLM對教育領域的沖擊已經勢不可擋,必然會改變教育領域的發展走勢,與其閉關鎖國,不如學會擁抱,勇于面對LLM對教育領域的挑戰,充分挖掘LLM的潛能和優勢,才是現如今教育領域面對LLM沖擊下的必要措施。