史丹佛研究：AI 對黑人學生讚美較多，對女性少建設性批評

2026/04/29

史丹佛大學最新研究發現，主流 AI 模型在批改學生作業時，對黑人學生給予較多讚美，但對女性與少數族群的建設性批評較少，引發教學公平與評量偏誤的討論。

史丹佛大學一項針對 AI 模型在教育場景表現的最新研究指出，目前主流大型語言模型（LLM）在評閱學生作業時，存在明顯的族群與性別差異化反應。研究團隊發現，AI 對黑人學生傾向給予較多正向鼓勵與讚美，而對女性學生、少數族裔在面對需要改善的部分時，提供的建設性批評明顯偏少。這項結果重新點燃 AI 在教育場景中的公平性辯論。

研究方法上，學者讓多款 AI 模型針對相同品質的學生作業進行批改與回饋，僅修改作者的姓名、性別與族群提示。結果顯示，當模型認為作者屬於少數族群或女性時，整體語氣傾向「軟化」，較少指出文章結構、論點或論據上的具體缺失。研究人員認為，這類「過度禮貌」的回饋雖然出於善意，卻可能讓特定族群的學生失去學習成長所需的真實反饋，反而擴大教育不平等。

從技術面分析，這類偏差可能源自模型訓練過程中的兩個來源。其一，公開語料對於不同族群的描述本身就帶有歷史偏見，模型在接收 RLHF（基於人類回饋的強化學習）時，又會被人類標註者的「政治正確」傾向二度修正。其二，業者為避免引發爭議，往往設計安全護欄，讓模型在面對敏感族群時調整語氣，這在創作或客服場景或許合理，但在教學情境中卻可能造成評量品質下降。

對教育科技業者而言，這份研究帶來具體警訊。各國學校與教育平台近年積極導入 AI 助教、AI 改作業等工具，若直接套用通用 LLM 而未針對教育情境設計評估流程，學生收到的回饋品質可能因身分而異。研究建議業者應建立基於匿名作業內容的評估機制，並在介面上區分「鼓勵」與「具體改善建議」兩種回饋模式，確保所有學生獲得對等的學習資源。

放眼未來，這份研究預計將推動 AI 公平性審查框架在教育部門的落地。除了教育主管機關可能要求業者提交「偏誤審計報告」，第三方研究機構也可能發展出標準化測試集，檢視各家模型是否在學生族群間提供一致的學術回饋。AI 走進課堂已是不可逆的趨勢，但如何讓 AI 的「鼓勵」與「批評」真正一視同仁，將成為教育科技下一階段最關鍵的命題。