告別命令,迎接意圖
我們與軟件交互的方式絕非一成不變。有時,它是緩慢的演變,有時則是突飛猛進(jìn)。如今,越來越多的設(shè)計先鋒,包括維塔利·弗里德曼,艾米麗·坎貝爾和格雷格·努德爾曼正在剖析人工智能應(yīng)用中的新興模式,描繪出永不停歇的格局。乍一看,這似乎只是又一次炒作周期,就像圍繞著每一個新技術(shù)趨勢的那種令人窒息的熱情。但退一步來看,一個更深層次的轉(zhuǎn)變顯而易見:我們與數(shù)字系統(tǒng)的互動不僅在發(fā)生變化;它們的本質(zhì)也在發(fā)生轉(zhuǎn)變。
想象一下從膠片相機到數(shù)碼攝影的轉(zhuǎn)變——突然之間,用戶不再需要了解曝光時間或仔細(xì)定量膠卷。他們只需點擊一個按鈕,剩下的就交給設(shè)備處理了。
人工智能正在為UI設(shè)計帶來類似的轉(zhuǎn)變,讓我們擺脫僵硬、循序漸進(jìn)的流程,走向流暢、直觀的工作流程。交互的本質(zhì)正在發(fā)生轉(zhuǎn)變,正如Jakob Nielsen最近在其文章中強調(diào)的那樣,這種演變需要我們?nèi)褙炞ⅰKU述了一個至關(guān)重要的見解:
“有了新的人工智能系統(tǒng),用戶不再告訴計算機該做什么。而是用戶告訴計算機他們想要什么結(jié)果。”
這不僅僅是一場技術(shù)變革,更是一場哲學(xué)變革。它挑戰(zhàn)了長期以來關(guān)于控制、自主性和人機協(xié)作的假設(shè)。我們曾經(jīng)一絲不茍地掌控著每一步,而現(xiàn)在,我們能夠定義意圖,并讓人工智能決定最佳的前進(jìn)路徑。這種轉(zhuǎn)變的意義深遠(yuǎn),堪比從命令行界面到圖形用戶界面的轉(zhuǎn)變,對于 UI 設(shè)計師來說,它既是機遇,也是挑戰(zhàn)。
點擊、滑動、詢問:交互方式正在演變
但在深入探討人工智能如何重塑交互之前,我們有必要反思一下迄今為止最直觀的界面是如何定義的。1985 年,埃德溫·哈金斯、詹姆斯·霍蘭和唐納德·諾曼發(fā)表了一篇關(guān)于直接操作界面的開創(chuàng)性論文。諾曼后來在《設(shè)計心理學(xué)》中定義了一些最廣為接受的設(shè)計原則,而哈金斯則率先提出了分布式認(rèn)知的概念。但在 1985 年,他們與霍蘭一起抓住了設(shè)計史上的一個關(guān)鍵時刻,即直接操作逐漸成為一種主導(dǎo)策略。
直接操作是一種交互方式,用戶使用物理、增量和可逆的操作對顯示的感興趣對象進(jìn)行操作,其效果立即在屏幕上可見。NN /g
但這簡單來說意味著什么呢?比如,你需要將一個文件從一個文件夾移動到另一個文件夾——這是一個典型的直接操作的例子——你看到這個文件,抓住它,然后把它移動到你想要的位置。
首先,你需要明確目標(biāo) (1)。然后,在當(dāng)前文件夾中找到文件,并決定將其拖動到新位置 (2)。點擊并按住文件,將其移動到屏幕上,最后將其拖放到目標(biāo)文件夾中 (3)。
如果你不小心把它放在了錯誤的地方,你會立即看到結(jié)果,調(diào)整方法,然后再次拖動它,直到它落到你想要的位置。這種交互方式感覺很直觀,因為它最大限度地減少了認(rèn)知投入——系統(tǒng)會實時響應(yīng)你的操作,強化了直接參與和掌控的感覺。
這個過程越順暢,交互感覺就越自然、越令人滿意。

雖然縮短距離可以提高可用性,但真正定義直接操控的是參與度。作者寫道:
“最能體現(xiàn)直接操縱的系統(tǒng)都給人一種定性的感覺,即人們直接參與對對象的控制——不是通過程序,不是通過計算機,而是通過我們的目標(biāo)和意圖的語義對象。”
幾十年來,直接操控一直是設(shè)計的基本原則。然而,隨著我們向人工智能驅(qū)動的系統(tǒng)過渡,我們必須思考這些原則如何演變——以及它們何時會被目標(biāo)導(dǎo)向的交互所取代。
現(xiàn)在,想想Windows Photos 的 AI 驅(qū)動“擦除”功能。假設(shè)你給你的狗狗拍了一張照片,但照片里有一條不想要的牽引繩。你不用像十年前那樣手動選擇像素并精心編輯,而是只需選中牽引繩,剩下的交給 AI 處理即可。系統(tǒng)理解你的目標(biāo)——移除牽引繩——并執(zhí)行最佳解決方案。

這種交互仍然需要一定程度的操作,因為你必須指定要擦除的對象,但不同之處在于,你是在優(yōu)化請求,而不是直接修改像素。你不再需要一絲不茍地編輯每個細(xì)節(jié),而是與系統(tǒng)協(xié)作,以達(dá)到預(yù)期的效果。這種轉(zhuǎn)變標(biāo)志著 UI 設(shè)計的根本性變革。
Desolda 與其他研究人員基于諾曼的“執(zhí)行鴻溝”和“評估鴻溝”理論,構(gòu)建了一個模型,捕捉到了這種動態(tài)。與簡單的直接操作(例如在文件夾之間拖動文件,操作需要逐步展開)不同,AI 交互需要更流暢、更迭代的過程。用戶清晰地表達(dá)他們的目標(biāo),但并非手動執(zhí)行每一步,而是與系統(tǒng)協(xié)作,優(yōu)化輸入,并在 AI 進(jìn)行動態(tài)解釋、調(diào)整和響應(yīng)時對其進(jìn)行引導(dǎo)。

直接操縱的持續(xù)相關(guān)性
人工智能或許正在重塑我們與科技互動的方式,但直接操控卻不會消失。即使在基于意圖的界面時代,用戶仍然需要與人工智能系統(tǒng)互動,用正確的輸入引導(dǎo)它們,將人類的目標(biāo)轉(zhuǎn)化為機器可讀的指令。設(shè)計人工智能體驗并非要取代直接操控,而是要增強它,在既有模式的基礎(chǔ)上疊加新的交互模型,使交互更流暢、更直觀,并最終增強其功能。
為了設(shè)計無縫的人工智能體驗,我們需要識別并構(gòu)建熟悉的模式。
例如,在許多 AI 應(yīng)用中,開放式提示框可以充當(dāng)破冰船,幫助用戶開啟對話。這種方法建立在人們熟悉的輸入框模式之上,幾十年來,該模式一直是 UI 的標(biāo)準(zhǔn)組件,如今,它又扮演著新的角色。無論是在 ChatGPT 中輸入問題,還是指示設(shè)計工具生成布局,這種方法都能提供靈活性,同時以直觀易懂的方式引導(dǎo)用戶意圖。

這種方法不僅限于交互模式——它也擴展到用戶體驗框架。
例如,Evan Sunwall 提出了“Promptframes”的概念,通過將即時寫作和生成式 AI 融入設(shè)計流程,作為傳統(tǒng)線框圖的補充。其目標(biāo)是通過在工作流程的早期階段融入 AI 驅(qū)動的內(nèi)容生成,提高內(nèi)容保真度并加速用戶測試。然而,這一概念建立在線框圖的基礎(chǔ)上,這進(jìn)一步強調(diào)了理解傳統(tǒng)用戶體驗結(jié)構(gòu)對于有效設(shè)計 AI 驅(qū)動體驗的重要性。
最后的想法
不需要霓虹燈“人工智能驅(qū)動”標(biāo)簽;它應(yīng)該無縫地融入用戶旅程,感覺就像意圖的自然延伸。
以Netflix 的推薦系統(tǒng)為例。它不會打斷你的體驗,提醒你它正在使用高級算法。它也不會要求你配置一堆設(shè)置。相反,它會默默地學(xué)習(xí)、適應(yīng),并為你提供建議,讓你感覺毫不費力——以至于你很少會停下來思考它背后的系統(tǒng)。這才是人工智能驅(qū)動的交互應(yīng)該有的樣子:它不是一個需要你費力操作的功能,而是一個根據(jù)你的需求不斷改進(jìn)的隱形助手。
隨著我們邁向意圖驅(qū)動的系統(tǒng),這正是設(shè)計師應(yīng)該努力追求的目標(biāo)。人工智能應(yīng)該減少摩擦,而不是增加復(fù)雜性。它應(yīng)該賦予用戶權(quán)力,而不是用不必要的選擇讓他們不知所措。最好的人工智能不是那種需要注意力的人工智能——而是那種能夠融入你最初想要完成的任務(wù)流程中的人工智能。