Thinking Machines 發表互動模型預覽,前 OpenAI 技術長 Mira Murati 展示近即時 AI 互動
2026/05/19
由前 OpenAI 技術長 Mira Murati 創立的 AI 新創 Thinking Machines,正式發表互動模型研究預覽版,主打近即時語音與視訊互動能力,被視為下一代人機對話介面的重要探索方向。
Mira Murati——曾在 OpenAI 擔任技術長並主導 GPT-4、DALL-E 3 等重大產品推出——在離開 OpenAI 後創立了 Thinking Machines,外界對這家新創的一舉一動高度關注。如今,Thinking Machines 正式揭開旗下核心研究成果的面紗,發表了定位為下一代互動 AI 基礎的「互動模型」(Interaction Model)研究預覽。
互動模型的核心技術挑戰,是如何讓 AI 在語音與視訊等多模態輸入下,實現接近即時(near real-time)的感知、理解與回應能力,同時維持對話的自然流暢性。當前主流 AI 對話系統在語音互動上仍存在明顯延遲,且對視訊內容的理解多屬靜態幀分析,而非真正的動態即時理解,這是 Thinking Machines 試圖突破的關鍵瓶頸。
業界對 Thinking Machines 的期待,不僅源於 Murati 個人在 AI 產品開發上的深厚資歷,更在於其所招募的核心研究團隊成員多具備頂尖 AI 研究背景。若互動模型的研究預覽能夠如其所示達到近即時的多模態互動效果,將在 AI 代理、虛擬助理及教育科技等多個應用場景開啟全新的可能性。
然而,從研究預覽到商業化落地,仍有漫長的工程優化與規模化挑戰需要克服。業界分析人士指出,近即時語音視訊互動對算力資源的消耗極為龐大,如何在保持低延遲的同時有效控制推論成本,將是 Thinking Machines 在商業化路徑上面臨的核心考驗。