史丹佛研究:AI 對黑人學生讚美較多,對女性少建設性批評

史丹佛研究:AI 對黑人學生讚美較多,對女性少建設性批評

2026/04/29

史丹佛大學最新研究發現,主流 AI 模型在批改學生作業時,對黑人學生給予較多讚美,但對女性與少數族群的建設性批評較少,引發教學公平與評量偏誤的討論。

史丹佛大學一項針對 AI 模型在教育場景表現的最新研究指出,目前主流大型語言模型(LLM)在評閱學生作業時,存在明顯的族群與性別差異化反應。研究團隊發現,AI 對黑人學生傾向給予較多正向鼓勵與讚美,而對女性學生、少數族裔在面對需要改善的部分時,提供的建設性批評明顯偏少。這項結果重新點燃 AI 在教育場景中的公平性辯論。

研究方法上,學者讓多款 AI 模型針對相同品質的學生作業進行批改與回饋,僅修改作者的姓名、性別與族群提示。結果顯示,當模型認為作者屬於少數族群或女性時,整體語氣傾向「軟化」,較少指出文章結構、論點或論據上的具體缺失。研究人員認為,這類「過度禮貌」的回饋雖然出於善意,卻可能讓特定族群的學生失去學習成長所需的真實反饋,反而擴大教育不平等。

從技術面分析,這類偏差可能源自模型訓練過程中的兩個來源。其一,公開語料對於不同族群的描述本身就帶有歷史偏見,模型在接收 RLHF(基於人類回饋的強化學習)時,又會被人類標註者的「政治正確」傾向二度修正。其二,業者為避免引發爭議,往往設計安全護欄,讓模型在面對敏感族群時調整語氣,這在創作或客服場景或許合理,但在教學情境中卻可能造成評量品質下降。

對教育科技業者而言,這份研究帶來具體警訊。各國學校與教育平台近年積極導入 AI 助教、AI 改作業等工具,若直接套用通用 LLM 而未針對教育情境設計評估流程,學生收到的回饋品質可能因身分而異。研究建議業者應建立基於匿名作業內容的評估機制,並在介面上區分「鼓勵」與「具體改善建議」兩種回饋模式,確保所有學生獲得對等的學習資源。

放眼未來,這份研究預計將推動 AI 公平性審查框架在教育部門的落地。除了教育主管機關可能要求業者提交「偏誤審計報告」,第三方研究機構也可能發展出標準化測試集,檢視各家模型是否在學生族群間提供一致的學術回饋。AI 走進課堂已是不可逆的趨勢,但如何讓 AI 的「鼓勵」與「批評」真正一視同仁,將成為教育科技下一階段最關鍵的命題。