亚洲欧美香蕉在线日韩精选_www在线观看美女视频_娇妻的呻吟大团结内裤奇缘_免费a漫禁漫h漫在线

AI時代新篇章：用戶體驗設計的智能革命與未來展望

2024-6-19 ui設計分享達人

隨著ChatGPT在23年初的火熱，AI熱潮已經開始席卷各行各業，人們對于AI的熱情就像是看著第一款iPhone發布或者蒸汽機的發明，期待著它帶來一場信息時代的工業革命。同時，AI替代60%崗位的口號也足以讓相關從業者感到前所未有的壓力與焦慮。在各大設計網站上，關于AI的內容肉眼可見的占據了越來越多的比重，包括AI在設計流程中的應用、各種AI最新工具等介紹、AI的使用技巧、AI生成的海報/插畫等作品……一瞬間，似乎全民都投入到了AI的浪潮之中。

反過頭來看，對于用戶體驗設計而言，由于產品的底層邏輯被AI改寫，產品的生態、單個產品的形態、使用方式等都將發生翻天覆地的變化。連帶著的，由于生產工具的變革，產品的設計、開發流程也將隨之發生變化，進一步提高效率，對于從業人員的能力要求也在實時更新。

對于這樣一種浪潮，埋頭當個鴕鳥或者嗤之以鼻是沒有意義的，我們需要看到、認識、擁抱它。所以有人笑稱：打不過就加入。同時，對于各種所謂干掉各個崗位的宣傳，也吸引著、推動著我們去了解將被什么干掉以及怎么被干掉。

從另一方面講，只有在技術變革的時候，彎道超車才有可能。如果只是沿用之前的經驗與技術，那么成熟的企業就會有先發優勢。但是當面對新的技術變革時，大家被拉回到同一起跑線上，這個時候，就看誰能夠找到正確的方向，率先突圍。

所以，不管是被動也好，還是主動也好，面對著新一輪的技術變革，也希望從AI能力本身、所帶來的變化、以后的發展等方面全面了解一下這個新的時代寵兒。

本文結構：

1 AI相關概念與術語

1.1 AI&AIGC

人工智能或者說AI，Artificial Intelligence。是用機器來模擬人的智能或者思維模式來完成各項任務目標。

從其工作的機制而言，目前主要分為兩種：決策式人工智能，生成式人工智能。

決策式人工智能。根據已有數據進行分析、判斷、預測，比如我們常見的抖音、頭條、淘寶等的推薦算法。
生成式人工智能。通過分析現有數據來生成模仿、拼合、創造新的內容。比如當下最熱的chatGPT、Midjourney、Sora等。

從能力角度而言，人工智能也可以分為強人工智能和弱人工智能。

強人工智能。通用型人工智能（AGI，Artificial General Intelligence）。能夠像人類一樣對不同領域進行記憶、推理和解決問題。領域間的知識與經驗可以遷徙、借鑒，是“通才”。既可以寫詩畫畫，又可以診斷疾病，還可以進行數學計算。
弱人工智能。在某一領域具備專業能力、解決特定問題，能力沒法泛化，是專才。比如下圍棋的AlphaGo，可以打敗人類圍棋世界冠軍，但是沒法回答你“白毛浮綠水”的下一句是什么。

AIGC（Artificial Intelligence Generative Content）

人工智能生成的內容，包括文本、語音、圖片、視頻等多種形式。

AI生成內容

1.2 AI Agent

1.2.1 人類與AI協作的三種模式：

嵌入（Embedding）模式：類似于L2級別的自動駕駛。人類占據主導，AI作為工具，執行某條具體的命令。
副駕駛（Co-pilot）模式：類似于L3級別的自動駕駛。人與AI共同參與，與人類之間互相協商、溝通，實現某一目標。
智能體（Agent）模式：類似于L4級別的自動駕駛。人類作為指揮者、監督者、評估者。AI作為獨立的行動者，自主分析目標、拆解任務、嘗試執行、對比結果與目標、優化執行步驟與方式并最終實施完成人類設立的目標。

AI與人類協作模式

1.2.2 AI Agent是什么

AI Agent是有能力主動思考和行動的智能體。讓任務自動化，主要包括感知、記憶、規劃與決策、行動/使用工具。

就像吳恩達在TED演講中提到的：“許多工作包含不同的任務，AI自動化的是任務而不是工作。”與直接使用大語言模型相比，AI Agent能夠依據目標分解復雜的工作流程，從而實現大語言模型的自我對話與運轉，而不是簡單地執行單一任務或者由人類來驅動任務的每一步。

AI Agent = 感知（Perceive）+LLM（記憶（Memory）+規劃（Planning ））+工具使用（Tool use）/行動（Action）

AI Agent

感知是AI Agent使用傳感器與周圍環境交互，感知真實的物理世界，這個部分涉及到多模態的信息解析與處理。
記憶讓AI Agent可以存儲關于某些方向的專業知識以及交互過程中產生的信息，從而利用這些經驗來支持、優化后續的決策與行動。
規劃和決策就像是通過大腦進行分析，包含事前規劃和事后反思。LLM在這里就類似于大腦。AI Agent讓AI不再是執行單一的任務，而是自動將復雜的任務拆解為一個個可執行的子任務步驟，然后按照順序執行，并結合感知與記憶信息在過程中不斷試錯、優化，最終得到滿足目標的結果。
工具的使用就像是能力集成/封裝，類似于APP將能力打包的邏輯（比如修圖類app可以提高亮度、裁剪畫面、改變色彩等等）。通過利用外部的資源或工具來執行任務，從而拓展AI Agent的能力邊界。
同時各個AI Agent之間還能夠彼此溝通、協作，通過不同能力之間的配合來發揮最大的效用。

AI Agent本質而言是一個更好發揮大模型能力的技術框架，是圍繞LLM搭建的一套程序。讓用戶不再只是與LLM進行對話，而是根據場景，借助LLM 的分析、推理能力，制定解決思路并調用不同的工具的能力，從而解決問題或者達成既定目標。簡單理解為一個會使用大語言模型能力以及各類工具來幫助人類解決問題的助理。

1.3 AI的算法

1.3.1 AI的三大流派

1.3.1.1 符號主義：

基于統計方法，通過建模預測讓機器通過計算來模擬人的智能，實現識別、預測等任務

主要代表算法有：樸素貝葉斯，邏輯回歸，決策樹，支持向量機。

1.3.1.2 連接主義：

認為生物智能是由神經網絡產生的，可以通過人工方式構造神經網絡，訓練神經網絡產生智能。也就是模擬人的腦部神經系統，通過構建神經元與他們之間的連接，來構建一個可以學習、推理的神經網絡。

主要代表就是神經網絡算法。

1.3.1.3 行為主義：

認為生物的智能來自對外界的復雜環境進行感知和適應，通過與環境和其他生物之間的相互作用，產生更強的智能。也就是通過嘗試與反饋來強化學習、改進系統自身的行為。

主要代表算法是強化學習。

1.3.2 目前主流的算法：

目前主流的算法都是基于神經網絡和機器學習，在此基礎上創新與結合。

1.3.2.1 神經網絡（Neural Network）

人工智能三大流派中的連接主義的代表算法，通過人工方式構造神經網絡，訓練神經網絡產生智能。最早起源于麥卡洛克-匹茲模型/M-P神經元模型（McCulloch-Pitts model）。

簡單來說就是模仿人腦的神經元結構，構建一個函數集合作為基本單元，然后再互相之間加權拼接形成神經網絡。一個神經元就是一個函數/規則，前一個神經元的輸出作為后一個神經元的輸入。

循環神經網絡（Recurrent Neural Networks, RNN）

神經網絡的一種。關鍵在于多一個隱藏層，可以將上一次的輸出產生的輸出作為這一次輸入的一部分。簡單來說就是能夠記住上下文信息。

在此基礎上演變出來的長短期記憶（Long short-term memory, LSTM），讓模型可以去選擇記住什么信息、忘掉什么信息，而不是越早的信息記憶得越少，或者無差別地全部記住前文的信息，避免短期記憶、梯度爆炸、梯度消失等問題。（梯度可簡單理解為變化率）

主要用于語音分析、文字分析、時間序列分析。

卷積神經網絡（ Convolutional Neural Network, CNN）

基本機構包含輸入層、卷積層、池化層、全聯接層、輸出層。

卷積層的主要目的是識別與提取不同的局部特征。

池化層也叫降采樣層，其本質是采樣共享。簡單來說就是通過用同一個采樣值（最大值或者平均值之類）來代替那些差別不大的采樣值，以便減少數據量。

主要用于圖像識別、人臉識別等。

1.3.2.2 生成式對抗網絡（Generative Adversarial Networks, GAN）

主要包含生成器(Generator)、判別器(Discriminator)。

生成器用于生成內容，判別器用于判斷生成網絡中產生的內容是真實數據還是生成的數據。

生成器要不斷優化自己的生成數據讓判別器判別不出來；判別器也要優化自己的判斷能力，使其更準確；通過互相之間的對抗、制約來實現訓練過程。

1.3.2.3 Transformer模型：

谷歌的論文《Attention Is All You Need》中提出一種神經網絡模型架構。主要特點在于加入自注意力（Self-attention）機制來處理序列數據。

自注意力機制通過給長文本中每個詞不一樣的權重來判斷每個詞之間的相關性，從而判斷整個文本中最重要的部分。

與RNN相比，Transformer會將一串序列中的每個詞的意義及其位置信息結合起來傳輸給神經網絡，從而讓模型可以同時處理序列里的所有位置的信息，而不需要像RNN那樣依次處理。這種并行計算帶來的好處是大大提高了模型的訓練速度，從而為大模型的發展奠定了基礎。

1.3.3 自然語言處理（Natural Language Processing, NLP）

“語言理解是人工智能領域皇冠上的明珠”——比爾蓋茨

自然語言處理（NLP）就是在機器語言和人類語言之間溝通的橋梁，終極目標就是讓人和機器能夠通過自然語言進行交互，也就是讓機器能夠理解人類的語言、文字等。

主要包含自然語言理解（NLU）和自然語言生成（NLG）。簡單來說就是聽懂人話和說人話。

1.3.4 機器學習（Machine Learning, ML）

所有的對象，不論人類、動物，甚至是無生命機械，如果接受外界信息的刺激之后，能形成經驗反應，并影響日后的行為，那其實這個過程就已經可以稱之為“學習”了。——《智慧的疆界：從圖靈機到人工智能》

機器學習是實現人工智能的核心方法。從有限的觀測數據中“學習”（or“猜測”）出一個具有一般性的規律，并利用這些規律對未知數據進行預測的方法。

簡單來說，機器學習就是通過數據訓練讓算法掌握規律。

機器學習

1.3.4.1 深度學習（ Deep Learning）

機器學習的一個分支。使用深層次神經網絡模型進行學習。深度是指模型有多個層次的神經元。通過逐層分解來解決復雜度較高的問題。

深度學習與傳統機器學習最大的區別在于使用神經網絡模型代替人工的特征提取過程，通過數據訓練來優化模型的表現。

可簡單理解為使用神經網絡算法的機器學習。

1.3.4.2 監督學習（Supervised Learning）

有標準答案的學習。其基本思想是利用帶有標簽的訓練數據來訓練模型，從而使其能夠從輸入數據中學習到輸入與輸出之間的映射關系，然后可以利用這個映射關系對新的未打標簽數據進行預測。

監督學習需要告訴模型：1. 事物的關鍵特征是什么（稱為特征）；2. 那東西到底是什么。就像學生刷題，通過練習獲得的經驗來解新的題目。

1.3.4.3 無監督學習（Unsupervised Learning）

沒有標準答案的學習。其目標是讓模型從未標記的數據中自行發現共性、結構、模式、關聯或者表示，而無需使用人工標簽或者先驗知識的指導。包括聚類、降維、異常檢測等。

1.3.4.4 強化學習（Reinforcement Learning）

與監督學習、無監督學習類似，也是一種機器學習的方式。

算法不斷的嘗試、試錯，反饋機制通過獎賞與懲罰告訴算法哪種是好的，哪種是不好的，從而規訓其行為方向。簡單來說就是獎勵積極行為和懲罰消極行為。

美劇《生活大爆炸》中Sheldon就使用巧克力作為獎勵，馴化Penny的行為。

美劇《生活大爆炸》劇照

1.3.5 大語言模型（Large Language Model, LLM）

是一種基于神經網絡、機器學習、自然語言處理技術的模型，目前大部分知名的大語言模型都是基于Transformer架構。

它通過將每個詞轉化為向量輸入到模型中，并使用大量的文本數據進行訓練，讓模型來學習服務人類語言理解和生成的能力。

大語言模型的【大】主要體現在訓練數據與模型參數的大，從而需要更高的算力支持。

與傳統的機器學習模型相比，大模型具有更強的表示能力和泛化能力，能夠處理海量數據、完成各種復雜的任務，如自然語言處理、計算機視覺、語音識別等。

2 AI能力分析

2.1 人類能力地形圖

機器人專家漢斯·莫拉維克（Hans Moravec）曾提出人類能力地形圖的概念，其中，海拔高度代表這項任務對計算機的難度，不斷上漲的海平面代表計算機現在能做的事情。

圖源：https://qph.cf2.quoracdn.net/main-qimg-dfa49b90572af22a8b8e9ec7c02b8688

AI的發展，會逐漸淹沒人類的特有的優勢領域。最終，當AI開始具備設計人工智能的能力（AI Design），AI能力的推動將有AI自己的改進來推動，其速度會比由人類推動快得多。這也是所謂的“奇點”，到達奇點，人工智能將出現爆發式的增長。

就目前而言，人類與AI各有優勢，所以人類與AI攜手合作，發揮各自的優勢，形成群體智慧，實現1+1> 2 才是最優解。

2.1.1 人類相比于AI，所擁有的優勢：

自主創造、構思以及戰略性規劃、精細化決策
具有同理心，能夠理解人類的情緒、情感
對于美的理解與感受
不同領域之間的經驗可以遷徙、復用
具備常識
具有價值觀、人生觀、世界觀，能夠理解人類的行為與文化
可以完成精確且復雜的體力工作
可以輕松界定思考問題的框架，也就是哪些問題與任務相關，哪些無關

2.1.2 AI相比于人類，所擁有的優勢：

沒有情感等主觀因素，比人類更理性，可以公正客觀對待每個方案
可以在極短時間內完成超復雜的運算，從而產出大量的方案與探索結果
可以長時間不厭其煩做同一件事，而且不會累或者因為疲勞而降低準確度
記憶力好，積累的經驗可以被隨時調用

2.2 發揮各自最大的優勢

對于AI將會取代人類，現在最常見的說法就是：

AI將改變或者消滅某些工作，同時創造出新的工作。
AI不會取代人，而會使用AI工具的人將取代不會使用AI工具的人。

讓AI解放人類的雙手，去做那些機械性、重復、無聊的計算工作。而人類則把時間精力投入到更有價值的工作比如規劃、決策、制定目標、人際關系維護等。

當然，二者之間的工作并不是完全剝離、獨立的，而是互相影響與溝通協作。比如，人類可以借用AI的數據分析能力、預測結果等增強自己的決策能力。

所以，一方面，人要學習怎么更好地使用AI，發揮AI最大的價值。另一方面，AI也要往增強人類能力、改善人類社會生活的方向發展。

3 AI能力加持后，產品/業務層面變化

3.1 產品邊界變得模糊

3.1.1 物理世界與數字世界深度融合

數字孿生將物理世界映射到數字世界，具身智能機器人、自動駕駛等讓數字世界操控物理世界。AI能力的強化則讓二者之間的融合更加深入。比如京東AI數字人“采銷東哥”，看面相幾乎和真人無異，可以在直播間為大家介紹各種產品。如果再進一步，可以實時回答觀眾的問題，那就與真人差別不大了。

3.1.2 產品成為能力中心

產品之間的壁壘打通，成為能力插件，主要在于提供某種能力。比如小D想通過視頻學習糖醋排骨的做法，那么AI所獲取的內容可能會來自于抖音、快手、淘寶直播、小紅書等等平臺，或者整合各平臺內容生成一個新的、針對于小D喜好的內容。平臺成為底層信息的提供方或者說資源池，用戶也無需在多個產品之間來回切換。

3.1.3 服務設計

由于AI對流程中每一個觸點信息的掌握以及對于各項能力的集成，使得根據場景調用不同能力以滿足需求成為可能。

產品的設計不止考慮單一的產品，而是要考慮與其他產品、能力、服務的配合。在使用環境/場景中，從用戶的歷程出發，滿足用戶在整個任務鏈路中每一個節點的需求。

3.1.4 流程自動化

產品與產品之間的互相銜接、流轉也將自動化，無需由用戶來推動。比如小D要出差，當他向AI提出這個需求時，AI一并將機票、酒店同步預定好，同時，在出差結束后，自動對接人事考勤、費用報銷等產品能力，實現流程自動化。也就是依據場景將服務打包，用戶觸發一次就完成整個流程動作，無需到每一個系統/產品中分別去執行一遍操作。

流程自動化帶來的也是效率和易用性的提升，用戶的操作負擔被大大減少。

3.1.5 B/C端差異減少

B端各流程節點之間的溝通、協作、傳遞也可以由【人-產品-人】的方式轉變為【Agent-Agent】的方式。提高流程運轉的效率，降低了B端產品的操作復雜度。

當用戶與AI Agent交互，由Agent代替用戶去直接面對、調用各個產品的各項能力，發起各種任務，B端產品和C端產品交互的邏輯會愈發類似。Agent對話式的交互、自動規劃等將會大大減少B端產品的學習成本，用戶在使用不同類型產品時將不會有太大的差異。

3.1.6 多產品形態互聯互通

AI可以在手機、平板、電腦、電視、車載終端等不同設備之間的無縫切換，設備跟著場景轉換，但是流程不中斷，多設備協調配合走完整個任務鏈路。比如在下班回家的路上，小D在車里聽小說，回家以后，家里的智能音箱繼續從下車時刻的部分開始繼續播放。

3.2 接受非結構化的信息

語音識別、NLP、圖片識別、手勢識別、紅外傳感、重力感應、腦機接口等等技術的演進與突破。讓輸入不再依賴于表單、按鈕等創建符合計算機理解模式的結構化信息。

非結構化輸入的特點：多模態、更自然、更高效、學習成本更低。不再是人去適應計算機能接受的數據模式，而是計算機來學習理解人類的信息表達形式，比如表情、手勢、語氣等。

AI對于非結構化數據、自然語言的理解，也降低了產品的復雜度，減少用戶的認知負擔，讓產品的學習成本大大減低。

3.2.1 普適計算（ubiquitous computing）

普適計算是指計算可以在任何設備上、在任何地理位置中以及用任何格式進行。其顯著目標之一則是使得計算機設備可以感知周圍的環境變化，從而根據環境的變化做出自動的基于用戶需要或者設定的行為。

與物聯網類似，簡單來說就是通過多樣化的設備（手機、手表、眼鏡、微波爐、冰箱等）來感知信息、獲取信息、處理信息，所有的物品都有可能變成一個計算機。這樣的目的是讓計算機可以隨時感知環境、行為的變化，從而及時、貼心地滿足用戶的需求。

3.3 數據的集中化處理

假設個人助手或者說AI Agent的成熟，那么人們與產品交互的通道將會從各個分散的產品集中到一個點。由統一的交互入口收集的用戶行為數據以及AI主動通過各類設備收集的用戶個人數據，讓每個人的信息更加完整、全面地被AI所記錄，更容易實現個人數據的集中化處理。

AI掌握的個人信息越多，才能更全面地了解一個人，也才能更有針對性地為用戶提供個性化的服務。聰明、貼心、智能的AI與集中化的數據將會互相促進、互相強化，也就是越集中的數據帶來越聰明的AI，越聰明的AI將會通過多渠道收集到更多的個人數據。

3.3.1 對于個人信息安全的注重

AI將會使用個人的數據進行訓練并改進行為，這需要符合監管要求，遵循個人數據處理的最小化原則，保證用戶的知情權，進行節點隔離以及加強對于數據處理權限、存儲、保密的管理。避免個人信息的泄露或者被不當使用。

當然，這也需要更加完善的數據保護法規進行支撐，比如GDPR、ADPPA、中華人民共和國數據安全法、個人信息保護法等，避免個人隱私泄露。

3.4 人機深度協同，構建信任變得更重要

越是使用頻繁的、形成依賴的產品，越需要得到用戶的信任。如果微信在使用過程中時不時的出現bug，發給A的消息錯發給了B，那么用戶就會變得不敢使用。尤其AI產品還需要收集用戶的各種數據才能更好地發揮作用，那么得到用戶的信任將顯得更加重要。

信任來源于了解、確定、可控，由于AI的黑盒性質以及產品越來越主動，如何解釋AI的決策過程、規范AI的行為、提高AI行為的可預測性、保持用戶的掌控感也越來越重要。

解釋決策過程和規范行為并不是說需要AI事事作說明、匯報，而是當用戶想要了解時提供詳細的解釋與說明、當用戶想要自己決策時可以修改AI提供的方案。從原則上而言，AI最終還是要服從于人、服務于人，而不是指揮人、控制人、取代人。

3.5 提前預判，主動推送，具備主動性

根據用戶的場景、行為，判斷用戶的意圖，通過多產品、數據的貫通，綜合分析，提供事前的提醒與服務。比如在用戶購買機票后對接航班、天氣、交通等數據，如果有航班管制、惡劣天氣、交通擁堵等不良狀況發生，可以及時通知用戶。

3.5.1 場景驅動

信息的集中化處理，使得結合各種傳感器、設備所提供的環境信息以及用戶的生理、行為等信息進行綜合分析成為可能。AI可以了解用戶所處的環境及其需求，通過場景所提供的上下文來減少信息輸入的要求。同時，調用各個產品的能力，解決問題，減少用戶操作，提高效率與用戶體驗。

比如，智能家庭助手通過手環檢測到小D躺在沙發上已經睡著，并且有點冷，那么它可能會自動調小正在播放的音樂、關閉窗簾、調暗燈光、打開空調，讓用戶更加舒適且不會著涼。

3.6 個性化/定制化

由于用戶與產品之間通過一個統一入口來交互，那么用戶的行為數據（包括個人的生物信息、健康狀態、行車路線、購買習慣、用戶偏好、場所出入數據等）將更加全面、完整、準確被獲取。

通過大量的數據與機器學習，讓人工智能可以依據個人喜好、場景，進行意圖判斷。結合各個產品能力，針對不同用戶可以推薦更加精準、個性化的內容、功能等，也就是說功能也能夠像feed流一樣被推薦，更好地滿足不同人群、場景的需求。

3.6.1 用戶自定義

AI降低了產品/工具操作的門檻，讓更多人可以使用它，也就是所謂技術的民主化。

這就讓用戶有可能根據自己的喜好、習慣、場景等需求差異來配置產品功能組成結構、優先級等。就像是洞洞鞋，本身提供一個基礎的樣式，但是每個人可以選擇自己不同的鞋花。未來，也許每個人都可以都可以自己設計一個APP應該具有什么功能、設計衣服樣式、設計房子的裝修風格等等。

同時，通過社區、論壇等的信息交流，A設計的產品也許B可以參考、改進后成為屬于自己的產品，每個人都有可能成為生活的創作者，而創作的對象可以包羅萬象。

3.7 改變垂直領域的細分產品

所有行業都值得基于人工智能技術重做一遍——阿里巴巴張勇

AI的生成、總結、提取、分類等能力的突破，將進一步促進各行業中各類信息的整合與利用，接手重復性的工作，給各行各業帶來流程的簡化、模式的轉變、效率的提升。

針對如殘障人士、老人、小孩等特殊群體，可以開發提供陪伴、照顧等功能的AI機器人。
針對律師、醫生等特定職業的人員，利用AI輔助進行資料收集、數據分析等，增強他們的能力，提升工作的效率。
針對生產線、倉庫等目標和任務相對固化的場景，也可以引入AI來替代很多重復性等工作。比如利用無人超市模式來管理倉庫出庫，領用人員刷臉后自動確認領料單，同時系統在領料人員拿走物品后自動進行出庫處理、更新庫存數據，在庫存不足時對接采購系統進行采購等。

4 AI能力加持后，產品的交互邏輯變化

4.1 信息架構的變化

GUI模式下基于點擊的輸入，需要將頁面內容、功能分門別類進行組織、布局，以方便用戶理解與查找然后觸發，所以信息需要按照邏輯歸類，可尋性也是信息架構關注的重點之一。

AI能力加持下的對話式交互，讓用戶只需要面對一個統一的入口，通過這個入口直達任意一個功能（類似于Deeplink）。信息的結構不再是以用戶快速找到為中心，而是以讓AI快速調取為導向。不再是由人去穿越層層結構尋找所需信息，而是所需的信息從紛繁復雜的數據中跳脫出來。

4.1.1 功能架構扁平化

通過AI直接調起產品中的某一個頁面，模塊的功能更加獨立、內聚，成為一個個能力單元，產品則成為能力單元的橫向集合。

如果是窄而深的信息架構，層層嵌套的模式，那么能力之間可能會有一定的耦合與依賴，被直接調起時容易缺失上下文，導致功能不可用。

4.1.1.1 導航的弱化

直接調起的模式，用戶直達功能。比如對AI說【我想聽李健的《給你》】，它會直接打開播放器，播放這首歌。而不再需要我們【打開音樂APP-找到并點擊搜索框-輸入并搜索-點擊播放】這樣一步一步操作。

減少了尋找信息的步驟，也就減少了導航的需求。導航頁的價值將會降低，以往功能之間需要合理組織以方便用戶記憶、尋找的特征將會減弱。

4.1.2 信息模塊化

功能變成類似于API或者組件的形式，可以根據需要與其他產品的信息隨意拼裝，成為整體信息流的一部分。就像我們在小紅書看一個個的筆記，或者在淘寶瀏覽一個一個的商品，功能也被拆解為一個一個的單元，在場景需要的時候與其他的功能拼裝形成一個解決方案。

同時，從整體而言，每個產品可能只提供整個信息集合的其中一個部分。也就是前面的說的產品邊界被打破。

4.1.3 拓展性更強

每個頁面都有可能成為首頁，都是信息架構的頂部，這需要產品的信息架構有很強的兼容性和擴展性。——《AI改變設計》

按照前述AI Agent的設想，AI所涉及的任務可能包含多個層級的復雜度，需要不同能力的配合才能完成，也就是需要依賴不同的產品、組件所提供的能力。

產品的每個功能將類似于樂高的一個積木零件，便于互相組合，目的是容納更多新的功能。同時AI直達功能的能力可以弱化過寬的信息架構所帶來的尋找信息不方便的問題。

4.1.4 用完即走

用戶以任務目標為導向，不在乎是哪個產品、哪個功能，關鍵在于高效。就像我們不會關注手機包裝盒里的充電器是哪個代工廠生產的。產品/能力會“透明化”“無形化”，這些能力的提供方將會成為AI Agent所對接的“供應商”。比如小D想聽李健的《給你》，內容有可能是QQ音樂提供的、也有可能是網易云音樂提供的、或者是B站一個李健的音樂會視頻，對用戶而言，聽歌的目的達到了就行。

4.2 交互范式的變化

技術的革新會引起范式的變遷。最終指向的都是越來越簡單、方便、自然，都是圍繞著更好地服務于人而來的。

4.2.1 人機交互的發展歷程：

批處理（Batch Processing）
命令行交互（Command-based Interaction）
圖形界面交互（Graphical User Interfaces,GUI）
對話式交互（Conversational User Interface,CUI）/語音用戶界面（Voice User Interface,VUI）/語言用戶界面（Language User Interface,LUI）
自然界面交互（Natural user interface,NUI ）/基于意圖的結果規范化（Intent-Based Outcome Specification ）

前三種都屬于用戶向計算機發出命令，計算機嚴格執行命令并產生結果，用戶評估結果逐步調整輸入，最終一步一步達成目標。

對話式交互，本質也和之前的幾種范式一樣，人發出命令，計算機執行命令，只是用戶的輸入方式更加多樣化，不止是依賴于當前界面所呈現的元素與選項。（圖形界面相對于命令行，也是在輸入輸出方式上變得更豐富，鼠標、觸控、手勢等輸入方式以及圖形、動畫等輸出方式減少了用戶的認知負擔、記憶負擔、操作負擔）

而在高級階段自然界面交互/基于意圖的的結果規范化中，用戶不再需要去適應計算機，而是計算機來適應人，去理解人的表情、手勢、語言、語氣、點擊、生理數據等等方式/渠道所傳遞的信息。用戶也不再告訴計算機要做什么，而是告訴計算機他們想要的結果，或者，計算機能夠通過感知周圍環境，主動識別用戶的意圖并自動達成其目標。

類似于前文提到過的AI Agent，能夠依據目標分解復雜的工作流程，從而實現大語言模型的自我對話與運轉，而不是簡單地執行單一任務或者由人類來驅動任務的每一步。

人機交互發展歷程

4.2.2 對話式交互

交互本質上是信息的交流，包含信息的輸入與輸出。人與現有產品的交互，輸入的形式包括鼠標、鍵盤、觸屏手勢、語音、拍照識別、掃碼等。而輸出的內容則包括視覺（文字、圖片、視頻、燈光等）、聽覺（語言、報警音等）、觸覺（震動）。

人與人之間最自然的交流方式通常是語言交流，通過言語表達思想、感情和意圖。除了語言，人們還通過非語言的方式進行交流，如面部表情、姿勢、手勢、眼神等。這些非語言元素可以傳達豐富的信息，有時比言語更直觀和強烈。這是我們整個成長過程中一種主要的學習形式。

對話式交互，就像是人與人之間聊天的交互方式，輸入的途徑可以是文字，也可以是語音、圖片、鏈接、手勢等。Sora甚至可以使用視頻作為輸入來生成視頻。

4.2.2.1 對話式交互的特點

用戶的輸入沒有邊界

擺脫了按鈕、輸入框等的限制，用戶的輸入可能五花八門，甚至與產品的主要功能無關。功能“無形”之后，就需要針對各種場景給出不同的反饋。

打破產品邊界、跨越信息層級

入口統一，交互路徑縮短，能夠穿透信息層級、跨越產品的業務界限。我們的交互過程基于語言的形式輸入，然后回答的形式根據內容而變。可以結合所個產品、領域的數據，綜合給出答案。也就是說，我們不用面對數量繁多的應用/產品，只需要像使用Siri一樣，和一個統一的AI Agent溝通，然后由它來調取各個產品的能力來為我們提供服務。

4.2.2.2 對話式交互的場景

任務式設計——高效

專業化的應用/工具。針對具體的業務領域、任務類型提出需求。輸入一般具有邊界、比較集中。產品的目的是盡快達成用戶的目標。

閑聊式設計——有趣

娛樂型的應用/伙伴。用戶沒有明確的目標，跟隨情緒變化。輸入一般沒有邊界，可能包含任何主題。產品的目的是在對話過程中逐步滿足用戶的情感需求。

4.2.2.3 對話式交互的原則

提供引導，鼓勵用戶輸入

如果開始對話之后遲遲沒有輸入，則提供猜測、默認選項、參考示例等，讓用戶直接點選、引導用戶輸入，避免用戶在空無一物的前提下不知道如何開展對話。

特別是在閑聊式場景下，通過打招呼來引導、提示等讓對話可持續。

理解語境

在我們日常的對話中，很多信息是大家的【共識】，是彼此之間交流的信息基礎，無需在對話中特意說明。

比如對話【Q：今天的天氣怎么樣？A：哪里的天氣？】。這其中位置信息一般都是基于當前對話所在的位置或者上下文出現的位置信息來決定的，也就無需用戶再次說明。

在AI的對話設計中，也就需要理解這些語境信息，減少信息輸入的數量要求，提高溝通的效率。

記住上下文

上下文包括用戶之前的操作、輸入、用戶的背景信息等，記住上下文并運用到之后的對話之中多輪對話的基礎。一方面可以保證話題的連貫性，一方面也避免用戶的重復輸入。

具有包容性，消除歧義

語言表達會有不同的語氣或者表達方式，語音識別也會有錯誤的情況，這時候要像谷歌搜索一樣，給出合理的猜測并回答，減少用戶二次輸入的成本。

當用戶的輸入有歧義時，實用多級置信度的方式給出最匹配的、最有可能的回答，并進一步詢問且允許用戶修改。

簡潔、清晰、保證表達質量

簡明扼要，陳述與話題相關的信息，避免模糊晦澀的表達。不管以何種形式來反饋，陳述的都是有效的事物，而不是無意義的答案。比如這樣的對話【Q：你知道有哪些人獲得了2023年諾貝爾獎嗎？A：知道。】就毫無意義。

合適的信息量，采用多種信息輸出模式

不多不少，恰到好處的信息含量。面對一個問題，網絡上相關的信息可能千千萬。需要結合實際產品、場景、用戶屬性等實際情況，給出合理、有效的回答。

我們大腦能處理的信息量是有限的，一旦超出，就會對短期記憶造成負擔。在某些場景下，語音可以提高效率。但是語音輸出的一個弊端是：聽清并理解語音中的信息，需要耗費我們大腦的資源，而且語音播放之后就消失了，也加重了用戶的記憶負擔。

所以不能只依賴于語音的輸出方式，也不僅僅依賴于當前的輸出渠道。采用視頻、圖片、聲音等多種形態的輸出方式甚至跨終端的輸出渠道（比如某些場景在手表輸入在手機、電視顯示反饋結果等），可以極大地豐富我們反饋的多樣性、提高信息傳達的效率，避免用戶需要在不同端之間來回處理信息。

照顧人類情緒，保持禮貌，具備服從指令的屬性

比如這樣的對話【Q：可以朗誦一首唐詩嗎？A：不可以】會讓人覺得別扭、受挫。

如果無法做到，也應該表達歉意并且說明愿意來安慰用戶。比如【A：不好意思，當前網絡狀態不可用，請檢查網絡設置后再次嘗試吧】

話輪轉換

對話是一種相互合作，必須有來有回，實用的對話讓對話雙方知道該誰說話。

設定用戶的期望，讓用戶知道什么時候可以輪換到自己、輸入是否生效等。方法包括隱性確認（在回答時帶上用戶提供的信息）、非語言確認（使用燈光、圖像、震動、提示音等進行反饋）等。

4.2.2.4 VUI/LUI

VUI，Voice User Interface，語音用戶交互界面。LUI，Language User Interface，語言用戶交互界面。是基于語音/語言作為輸入與輸出的交互方式。

嚴格來說，VUI/LUI是對話式交互形態之一。因為對話式交互的核心在于一來一回的對話，輸入輸出的可能并不只有語音、文字，可以容納更多的內容形式。

對話式交互

優點

自然流暢、學習成本足夠低。因為對話是從我們出生開始就伴隨我們的交流方式，對話式的交互和人與人之間的溝通相似，無需教學就會使用。
從輸入效率的角度而言，語音輸入比鍵盤打字的速度更快。
解放雙手，在雙手被占用的情況下，可以拓展交互的渠道。
語音中包含語氣、語調、語速等情緒性信息，如果能夠識別這些附屬的信息，也就拓寬了信息接收的渠道。
減少對于導航的依賴，減少用戶的記憶負擔、認知負擔

缺點

視覺通道和聽覺通道的信息融合要優于單獨的視覺通道和聽覺通道。對于多步驟、多字段的操作，如果完全依賴于對話式交互，所需的對話次數將會過多，影響整個動作的效率。這時候就需要用戶意圖預測、沿用典型模板、結合其他通道（屏幕點擊、手勢、實體按鈕、位置等）操作等方式來簡化所需的信息量或者多通道融合獲取信息。
容易受到周圍噪音的干擾。
隱私問題，在公共場合使用語音輸入容易泄露隱私或者影響到其他人。
公共場合之下對著手機說話，有可能會引發社會恥辱感。所以，新的類型的產品往往需要通過明星效應、營銷來形成一種風尚，引導人們使用。

4.2.3 NUI

NUI充分利用我們生活在這個世界中獲得的技能，最大限度地減少認知負擔，從而最大限度地減少對于注意力的分散。（NUIs exploit skills that we have acquired through a lifetime of living in the world, which minimizes the cognitive load and therefore minimizes the distraction.）——Bill Buxton, a principal researcher at Microsoft

自然用戶界面（Natural user interface，NUI）。維基百科對于NUI的描述是人們以最自然的交流方式與機器互動，使用NUI的計算機不需要鍵盤或鼠標。

相比于傳統的GUI或者當下比較火熱的CUI，NUI更強調【自然】，也就是以符合人類直覺的方式與計算機溝通。不局限于某一種交互方式，而是依據場景選擇最合適的交互方式。比如在自己家里，使用語音與智能音箱交互。在圖書館，使用觸控、手勢與智能手表交互。

NUI最大的核心是以人為中心，讓用戶可以使用生活中已經習得的技能、經驗以及已有的心理模型來與計算機交互，極大地減少學習成本。因為人與外界的自然交流本身是多通道的，包含視覺、聽覺、觸覺、嗅覺、味覺，也就決定了NUI注定是多模態的。

4.2.3.1 不完全依賴于語音

因為聲音稍縱即逝、難以回溯。完全依賴于語音輸入與輸出的交互方式需要占用用戶大量的注意力，而我們的注意力往往有限，長時間的注意力集中非常消耗人的精力，從而降低了交互的準確性、影響交互的效率。同時長時間占用用戶的主要注意力，也讓用戶無法同時做其他的事情。

對話式交互主要改變的是輸入方式與使用路徑，與現有豐富的、多模態的反饋形式結合，可以有效提升人機交互的效率。除聽覺反饋以外，輸出方式可以是視覺（指示燈、圖片、視頻等）、觸覺（震動、溫度變化等）。

隨著AI在語音識別、語義理解等方面能力的進步，自然對話的形式已成為AI產品的主流交互形式。就目前的情況而言，AI還難以捕捉并解讀我們的面部表情、姿勢、眼神等這些非語言、情緒化、視覺化的信息。

相信未來，隨著各種傳感器、算法模型的不斷演進，在我們與機器對話時，它不僅能聽懂我們的話語，也能結合我們的面部表情、姿勢、手勢、眼神等綜合分析。至少在輸入端，讓人與機器的交互逐漸靠近人與人的交互。有可能就像圖靈所預測的，我們難以分辨和我們對話的到底是一個人還是一臺機器。

4.2.3.2 VUI+GUI

未來的人工智能系統很可能會擁有混合用戶界面，結合了基于意圖和基于命令的界面元素，同時保留許多圖形用戶界面元素。——Jakob Nielsen

凡事皆具兩面性。不同交互形式的目的都是為了減少用戶的認知負擔、操作負擔、記憶負擔，不是為了用個用。結合用戶、場景、設備等特點，選用不同的交互形式結合，最大化地方便用戶才是最優解。

4.2.3.3 多模態交互

多通道融合交互/多模態交互，包括語音、面部表情、手勢、各類傳感器所檢測到的生理信息等都可以作為輸入通道，既可以是用戶主動發起的，也可以是產品主動獲取的。輸出則可以結合視覺、聽覺、觸覺、味覺和嗅覺多種模態。核心是圍繞情境選擇合適的交互模式，目標是自然、高效。

優勢：

多模態融合不僅是為了符合用戶自然的操作習慣，也可以增加信息的處理效率。就像在聽演講時，如果演講者結合PPT進行圖示化說明，就更容易、更快速地讓人理解。
多模態交互充分調動人的五感，結合AR、VR、MR等技術，將數字世界與物理世界有機結合，可以提供更好的真實感、臨場感、沉浸感。
減少對于個人能力的要求，讓老人、殘疾人等特殊群體也可以輕松、便捷地使用，踐行通用設計的原則，促進社會的和諧。

4.2.3.4 基于意圖的結果規范化（Intent-Based Outcome Specification ）

這是雅各布·尼爾森提出的一種新的交互范式，詳見：https://www.nngroup.com/articles/ai-paradigm/

以前是設計產品的能供性（Affordance）來引導用戶操作，比如按鈕代表可點擊。現在是計算機要來理解人的意符（Signifiers），比如抬起手臂，手機自動點亮屏幕，因為它猜測你可能需要開始使用手機。

NUI側重于交互方式的自然化，基于意圖的結果規范化側重于對于用戶意圖的反應。一個是方式，一個是目的，二者的核心都是讓計算機圍繞人來進行改變，減少人們對認知負擔、記憶負擔、操作負擔，提高人的效率，豐富人的生活。

4.3 交互特征的變化

4.3.1 交互層級的壓縮

功能架構更加扁平對應的就是交互層級的壓縮。通過對話直接調起某個特定的功能，不需要在一層一層的功能結構中去尋找。每一個動作都是直達目的，減少了很多尋找功能過程中的過渡操作。

4.3.2 界面的減少

一方面，NUI結合多種輸入輸出方式，不再單純依賴于界面的呈現，語音、提示音、燈光、震動等多種形式的反饋會替換部分界面的反饋。另一方面，對話式的交互減少了很多承載功能的頁面如導航頁、工作臺等。

4.3.2.1 按鈕的減少

按鈕是基于界面存在的，目的在于觸發一個動作。一方面，卡片等元素本身可以充當按鈕。另一方面，NUI帶來的多模態交互，點擊屏幕操作將會減少，對按鈕的需求也相應的減少了。

4.3.3 主動交互增加

產品不再只是被動的接受信息，而是可以通過多模態感知主動獲取信息，并依據用戶設定的目標、對于用戶的了解進行自主決策并觸發下一步的動作，不再需要每一個任務都由用戶來觸發。比如汽車在檢測到到用戶遠離車輛時自動鎖車。智能音箱會在天氣預報有雨時提醒用戶出門記得帶傘。

主動交互減少了用戶的操作負擔，提高了人機協同的效率，也讓產品顯得更加貼心。

4.3.3.1 分析用戶的意圖

用戶的行為數據、個人習慣與偏好等通過AI Agent這個統一的交互入口被全面、完整、準確地獲取，結合AI Agent所記憶的上下文信息以及各種傳感器所獲取到的場景信息，對用戶意圖對分析將更加準確。也就是可以通過預測用戶的下一步行為，主動提前幫助用戶完成。有點類似于想要喝水的時候，杯子里總是有溫度適宜的水。

4.4 AI的“人設”

4.4.1 人設是什么

人設是指用戶在與AI產品互動過程中，根據感知到的信息（虛擬形象、文本或者語音中的語氣、語調、音色、情緒等）將AI對象人格化后所建立的一種對于AI的角色形象認知。比如，掃地機器人在電量不足時，發出語音：“沒能量啦，我要回去吃飯了。”在用戶詢問“你在哪里”時，回應“我在這里”。都可以讓人感覺到它是一個有溫度、有感情的個體而不是一個冰冷的機器。這是一種心理上的簡化行為，避免“恐怖谷”效應。

人設使得產品的個性更加鮮明、突出，用戶與產品交互時能夠獲得“伙伴感”以及交流的愉悅感，有助于拉近產品與用戶之間的心理距離。

4.4.2 人設設定的原則

4.4.2.1 一致性

角色的設定要與產品/內容的屬性一致。比如法律、政治新聞等嚴肅性內容，就不適合使用呆萌、可愛的角色。

作為服務于人類的產品，在于用戶對話時，應該保持前后一致、穩定的形象。如果前后的回答反差太大會讓人覺得產品出錯了。

4.4.2.2 有禮貌

同時要注意禮貌。比如要及時回答用戶的問題，不能敷衍了事，不能指責用戶。即便用戶苛刻、生氣，角色也應該體現出禮貌、謙遜、關懷。

4.4.2.3 情感性

感知到人類的情緒，并給出恰當的、體貼的回應。用戶因此而與產品之間形成情感依戀，增強整體的使用體驗。

4.4.2.4 幽默性

使用象征、諷喻、雙關等手法，讓人感受到愉悅、有趣，給予用戶類似真實的社交體驗。使AI的形象更加靈活、生動、富有人情味，而不再是冰冷的機器。

4.4.2.5 個性化

針對不同的用戶特征（年齡、職業等），也可以針對性地提供不同的角色設定。

4.4.3 人設性格的體現方式

聲音的音色、語速、節奏、表述的方式/語氣、頭像都能體現出AI的性格特征。

4.4.4 人設性格的設定方法

與品牌/產品人設設定的方法類似，使用情緒板moodboard，結合商業目標、產品目標來發散人設的關鍵詞，比如客戶希望以什么形容詞來描述產品、用戶喜歡什么樣的人設。然后通過篩選、整合，選擇最具有代表性的形容詞，以可視化的方式呈現。然后與Persona類似，固化名字、職位、年齡、性別、行為習慣、愛好等特征。

人設設定好以后，所有的行為（語氣、語速、表達方式等）、外觀（表情、頭像、虛擬形象等等）都圍繞人設，從而強化這一形象在用戶心中的印象。并在用戶測試中優化迭代。

5 AI能力加持后，產品設計應該注意的原則

目前比較系統的提出AI產品設計原則都有MicroSoft、Google、SAP、IBM幾家公司（原文檔見文后參考鏈接）。總體而言，設計原則中不變的是以人為本的核心，變化的是如何以人為本、如何更好地以人為本。

5.1 明確傳遞系統可以做什么

做出說明、給出推薦等，幫助用戶明白 AI 系統能夠幫助自己解決何種問題。

提供框架與制約因素，引導用戶迅速展開行動，避免用戶在面對完全空白的頁面時，腦海中思緒過多且無法集中，不知從何著手。

5.1.1 說明系統能做到多好

幫助用戶了解AI系統犯錯的頻率，讓用戶對產品形成合適的預期。使用諸如【我們認為你可能會喜歡】來介紹推薦的音樂，會讓人更能包容錯誤。

5.2 基于具體場景和時間提供服務

根據用戶當前的任務和環境判斷何時該觸發行為或中斷行為。

比如檢測到用戶在行走過程中，手表自動記錄步數。假設用戶剛剛查詢過去往目的地的路線，則自動進入步行導航模式。比如當時間為半夜時，語音助手在回答問題時主動降低音量。

5.2.1 記住前后文

記住用戶最近的交互行為。保持短期記憶并允許用戶高效引用。比如用戶說：搜索【歌手李健】，在AI給出結果后，用戶說：播放他的歌曲。這時候產品就應該播放李健的歌曲而不是再次詢問用戶播放誰的歌曲。

5.2.1.1 顯示與上下文相關的信息

顯示與用戶當前任務和環境相關的信息。比如用戶詢問【天氣情況】時，在結果中表明是今天、當前位置的天氣情況。

5.2.2 記住關于用戶的信息

記住用戶的個人偏好、行為習慣等，主動推送/建議，減少用戶的重復操作。類似于登錄之后的個性化推薦。

5.2.2.1 從用戶的行為中學習

不斷學習用戶過往的操作來個性化用戶體驗，與用戶建立更加親密的聯系。類似于推薦算法，推薦的是用戶感興趣、可能會用到的功能、信息。比如用戶總是在每天的同一時刻打開同一個APP，iPhone會在用戶下次這個時間點解鎖手機時推薦這個APP。

5.2.2.2 鼓勵用戶反饋

讓用戶能夠在與人工智能系統的定期互動中提供反饋，表明自己的偏好。也就是產品不僅可以主動學習用戶的行為，還可以讓用戶主動告訴產品自己喜歡什么、習慣什么。

5.2.3 機器主動感知

通過各類傳感器實時感知周圍環境、人的行為，以此更好地為人類服務。不需要用戶主動發出指令，就可以結合以往的使用習慣進行意圖判斷，主動推送/發起流程。

5.2.3.1 平靜技術

交流不是為了體現技術設備的能力，而是為了滿足用戶需求。——《交互的未來》

因為人們的注意力是有限的，是一種寶貴的資源。應該讓人把注意力放在真正重要的事情上。如果各個產品一直大聲的吆喝，不停地爭奪用戶的注意力，那么重要的事情有可能會被淹沒。

在用戶需要時，能夠及時響應甚至提前預判，提高效率與流暢度。用戶不需要時，不要過多的干擾用戶，避免產品/技術本身引起太多的注意。類似于微信產品經理張小龍之前提出【用完即走】的理念，產品是服務于人的，不能成為負擔，而是要減輕人的負擔。

5.3 建立信任、不要讓用戶失去控制感

由于AI的不可解釋性、自主決策，用戶必然會對其有所顧慮。所以讓用戶建立起對于AI的信任感，是人類與AI深度協同的重要前提。

信任是有粘性的，如果用戶信任一項服務，可能會選擇一直信任。反之，如果用戶不信任，可能會一直選擇不信任。

信任對于用戶是否會采用至關重要。不信任會蔓延，一個功能的不信任會影響對于整體或者所有類似產品的不信任。比如Siri就降低了人們對于所有手機語音助手的信任度。

人類對機器的信任依賴于可靠性與安全性、可控性、清晰透明、一致性。

5.3.1 可靠性與安全性

要使 AI 系統受信任，它們需要可靠且安全。系統必須像設計好的那樣運行，并安全響應新的情況。其固有的復原能力應能抵御預期操作或意外操作。

5.3.1.1 準確、及時

信任由積極的體驗構成。頻繁的犯錯、延遲、不可用，讓用戶遭遇多次失敗、挫折，會降低用戶對產品的信心與信任。

與實際的人相比，人們對于機器犯錯的容忍度更低。

5.3.1.2 用戶數據權利

提供通知和同意的機制，允許用戶拒絕服務或數據。隱私設置和權限應該清晰、可查找且可調整。

充分披露個人信息的使用或共享方式。對數據的用途、使用范圍提供詳細的說明。

用戶應始終控制正在使用的數據以及選擇在什么情況下使用。他們可以拒絕AI訪問他們認為可能會受到損害或不適合人工智能了解或使用的個人數據。

保護用戶的隱私與數據安全。當個人詳細信息（例如地址）可能作為人工智能預測的一部分而暴露時，采取額外措施來保護隱私（例如，匿名化姓名，即使人們同意使用他們的名字）。保護個人隱私，遵守機器人三定律等。

5.3.2 可控性

5.3.2.1 由用戶控制

AI的底層原則是強化人的能力，而不是取代人。輔助用戶決策，簡化用戶的負擔。

從簡單、獨立的任務開始，讓用戶相信、適應AI的能力。同時，可以提供預測、建議，但是應該由用戶來做最終的決策。如果產品決策完以后再通知用戶，會讓用戶感覺失去主導權或者被產品所控制。

當用戶提出的訴求有歧義時，給用戶提供選項或者調整的機會來逐步明確目標。比如用戶說想聽【如愿】這首歌曲，搜索結果有好幾個版本，這時候讓用戶選擇一個，或者在播放開始時提示用戶可以主動更換。

提供全局控制，允許用戶全局自定義人工智能系統的監控內容和行為方式。

5.3.2.2 可以輕松的調用與關閉

在需要時能夠易于啟用。比如使用【Hi，Siri】來隨時激活iPhone的語音助手。

出錯時能輕松回退、編輯、改進或恢復。能夠隨時退出，類似于安全艙設計理念。

5.3.3 清晰透明

5.3.3.1 真誠

標記AI生成的內容，讓用戶心里有數，保持誠信。

5.3.3.2 可解釋性

清楚地說明系統為什么這樣做。提供解釋說明，讓用戶知曉AI做出決策的原因（一般是基于決策所帶來的好處，當用戶對底層技術感興趣時，通過漸進式披露的方式來提供更多詳細的信息）。或者如果發生錯誤，解釋哪里出了問題。

由于AI對于普通用戶來說就像一個黑盒，可解釋性可幫助數據科學家、審核員和業務決策者確保 AI 系統能夠證明其決策及其得出結論的方式，建立公眾對顛覆性技術的信心，促進更安全的實踐，并促進更廣泛的社會采用。

可解釋性還有助于確保符合公司政策、行業標準和政府法規。

5.3.3.3 通知用戶

謹慎的更新和修改，添加或更新其功能時要通知用戶。在更新和調整人工智能系統行為時，限制破壞性變化，讓用戶能夠適應變化。

傳達用戶行為的后果，及時更新或傳達用戶行為將如何影響人工智能系統的未來行為。

5.3.3.4 一致性

一致性讓AI的行為可預期，有助于用戶建立心智模型，減少因為AI能力黑盒帶來的不可知，增加用戶的掌控感。

5.4 符合社會規范、減少偏見

5.4.1 公平

錯誤的數據會帶來錯誤的認知。如果AI預訓練的數據中存在偏見，那么AI可能也會產生偏見。

建立倫理道德規范，減少社會偏見。由于現實世界的數據中難免包含帶有種族歧視等社會偏見的意向，需確保人工智能系統的語言和行為不會強化不良和不公平的成見和偏見，特別是那些與種族、民族、性別、國籍、收入、性取向、能力以及政治或宗教信仰等敏感特征相關的偏見。

5.4.2 國際化/在地化

根據用戶的社會和文化背景，確保以用戶期望的方式提供體驗。國際化的產品要尊重當地的文化、風俗習慣、宗教信仰等。

5.5 擬人化

社會語言學家的研究表明即使是極少的語音樣本，也會讓人產生對于演講者性格、形象方面的印象。我們早已進化成可以根據人的聲音來總結評判別人的專家。——《谷歌是怎么設計AI語音界面的？這里總結了對話設計六大原則》

人與AI的對話式交互，就像人與人之間的交流一樣。用戶能夠這種擬人化的對話中獲得“伙伴感”以及交流的愉悅感，拉近了人工智能與用戶的心理距離，大大降低了用戶使用人工智能的心理抗拒程度，從而形成品牌或產品和顧客間的情感紐帶，強化用戶與該品牌之間的關系。

6 AI產品發展過程分析

能力的發展會推動產品形態的變革，就像是通信網絡、智能手機催生出了無數的APP，讓微信視頻聊天、實時看直播成為可能一樣。AI能力的發展也會拓寬AI產品的邊界、豐富AI產品的形態。

6.1 從能力發展看

人工智能的主要發展方向：運算智能、感知智能、認知智能。

計算智能：計算智能是人工智能發展的最初階段，主要是指機器對信息進行存儲和計算的能力。在這個階段，機器主要進行簡單的數據處理和計算任務，缺乏更深層次的理解和學習能力。這部分主要是模型計算能力的提升。
感知智能：感知智能是人工智能發展的第二階段，指機器具備感知世界的能力，包括視覺、聽覺、觸覺等感知方式。這讓機器能夠更好地理解周圍環境和與之進行交互，但仍缺乏深層次的思考和推理能力。這部分主要是多模態感知能力的提升。
認知智能：認知智能是人工智能發展的最高階段，指機器具備類似人類的認知能力，包括學習、推理、記憶和理解等方面。在這個階段，機器可以自主地進行學習和思考，具有更高級的智能表現。這部分主要是模型能夠自主學習、調整、優化。

6.2 從產品角度看

6.2.1 一個趁手的工具

利用AI的運算智能、感知智能，在任務全流程的某一個任務中引入AI能力，解決各類業務場景中出現的問題。或者根據不同領域、職業等特定場景，打造垂直領域的AI而不是通用型的解決方案。比如使用人臉識別技術分析學生上直播課的表情，判斷學生的學習狀態，及時提醒老師關注，促進學生高效學習。

人智結合，任務還是由人來主導，AI作為像錘子一樣的工具，主要是執行指令，成為用戶的助手，提高操作效率，幫助用戶節省時間。比如內容創作平臺的編輯器，可以讓作者利用AI助手優化文章表達，但是沒法從頭到尾寫一篇符合用戶高要求的文章。

圖片來源：unsplash

6.2.2 成為現代“電力”

通過軟硬結合的形式，連接起各個產品，產品之間借助各自的AI Agent互相溝通，形成統一的生態。這樣的話，AI就在我們的生活環境中無處不在，滲透到每一個角落，集成各類行為數據進行分析，提供綜合、全面、貼心的服務。比如最常見的智能家居場景，門鎖通過人臉識別為主人開門，同時把客廳的燈打開。用戶坐到沙發上之后，用語音控制打開電視，客廳的燈光則自動調整到適合看電視的模式。

圖片來源：unsplash

6.2.3 一個管家/私人助理

認知智能讓AI學會自主預判、創造、決策，接管人類生活的瑣碎事情。打造個人專屬的AI，借助信息通信，從用戶相關的每一個產品中獲取信息，綜合分析，幫助用戶做出決策。這個AI助理熟悉用戶方方面面的習慣，通過用戶的行為分析主動去對接各個產品、能力，從而實現完全的個性化。

比如一個獨居老人，手環、心臟監測裝置等檢測到用戶可能會身體不適，提前通過智能音箱、手機等提示用戶去往醫院檢查。用戶乘坐自動駕駛等汽車到達醫院后，AI助理已經幫助用戶掛號，并將過往的數據發給醫院的AI醫生。醫護人員根據AI醫生的建議，直接安排檢查、治療方案。老人出院后，AI醫生將醫囑傳送給老人的AI助理，由它來提醒老人每天按時吃藥。

圖片來源：unsplash

7 AI與現有產品的融合模式分析

從與現有產品的結合程度而言，大致應該是AI部分介入作為輔助——AI主導功能——完全AI化。

7.1 從融合程度看

7.1.1 單點嵌入

在局部增加AI能力，比如嵌入到某一個按鈕中、在原界面增加一個小入口、在評論區/聊天窗口使用AT等方式呼出AI助理。這樣可以在保持原有用戶習慣的基礎上逐步培養用戶的習慣。

需要對場景進行細致地分析，也就是應該在什么場景下提示用戶產品所具有的AI能力。比如文檔類產品，可以自動生成文章大綱。或者在用戶選擇一段文字后，編輯菜單中會出現【AI改寫】的入口。

單點嵌入

7.1.2 模塊嵌入

劃分出專門的一塊功能區，比如頁面增加一個tab、或者做一個獨立的模塊、或者下拉后進入AI對話模式。這樣的好處是加入AI后，對原有的頁面影響不大，同時又會比較醒目，讓用戶快速感知。

比如FigJam AI，通過一個懸浮框來引導用戶使用。

Figma界面截圖

7.1.3 半獨立

這種是比較常見的一種方式，好處是不破壞原來的信息結構與頁面布局，可以更快地融入AI能力。比如懸浮操作球作為入口、瀏覽器插件等。

7.1.4 完全獨立

把AI能力打包，作為一個統一入口，可以輔助/調用所有產品，就像是嵌入AI Agent的PC或者手機一樣。

這樣AI就不是為了增強某一個產品的能力，而是本身成為一個能力平臺/私人助理，類似于Siri，可以調用iPhone內的各種應用。

7.2 從結合方式看

以下模式只是基于現有狀況對未來發展方向的一種合理推測與猜想。

7.2.1 軟硬結合

7.2.1.1 能力平臺

在電腦/手機中嵌入AI Agent ，就像手機的語音助手一樣，綜合多模態交互，直接調起設備中的各項能力進行響應。結合個人行為數據后，不但在對指令的回應方面愈發契合用戶的喜好與習慣，還可以主動交互，提高生產效率。

比如用戶想要看開心麻花的電影，那么Agent會整合各個應用資源供用戶選擇，或者依據用戶的習慣直接播放用戶可能感興趣的那一部。

比如在用戶看論文時，默默幫助用戶總結、整理、收集、分類，用戶看完幾十篇論文后，不僅可以幫助用戶橫向對比、提取核心觀點，還可以幫助用戶發現類似的論文。用戶在寫作中引用某一原文時，對應生成參考文獻注釋。

7.2.1.2 硬件協同

AI來協調指揮硬件，讓信息在各個產品/設備之間流動，按照具體場景實現設備之間關聯的貫通，促進各個設備之間的高效合作。

比如家庭助理，協調家中的各種電器，在下班到家之前調好空調溫度、到家后繼續通過智能音箱播放在車上收聽的節目、音樂等。假設用戶訂好了第二天早上的機票，那家庭助理會在用戶回到家后提醒用戶收拾行李并且定好第二天早上的鬧鐘。

對于獨居老人而言，可穿戴設備會實時監控老人的身體狀況并提醒老人按時服藥。在老人發生危險情況時及時撥打急救中心電話并為醫護人員開門。

7.2.2 物理世界與數字世界的融合

結合各類傳感器，AI可以更全面的收集關于物理世界的各類信息。同時，利用XR（VR, AR, MR）、具身智能（Embodied Artificial Intelligence）等技術等發展，數字世界也可以直接影響、操縱物理世界。

物理世界的信息、行為將可以通過數字世界進行傳輸，也許未來不僅可以視頻通話看到對方的樣子，還可以遠程握手、擁抱等，人與人之間通過網絡的聊天就像是面對面聊天一樣。

7.2.3 數字孿生

數字映射（Digital twin），或譯作數字孿生、數字分身、數位雙生，指在信息化平臺內模擬物理實體、流程或者系統，類似實體系統在信息化平臺中的雙胞胎。比如在醫療領域，通過把患者投射成具有生命功能的數字孿生體，就可以讓AI來模擬患者對于各種藥物的反應，從而為患者選擇最好的治療方案。

在科幻電視《黑鏡》中，技術人員通過抽取用戶的思維，在數字世界制造一個用戶的分身來作為用戶的私人助理。因為只有自己才最了解自己。

電視劇《黑鏡》劇照

8 我們該怎么做

8.1 AI只是手段，關鍵在于目的

AI可以執行【做】這個過程，它知道要做什么，但是它不知道為什么要這么做。產品的目的、所需要服務的人群、所產生的價值都是由人來定義的。這些是將所有資源整合起來的核心。不然，只是通過AI生成一堆沒有關聯的內容，并不能轉化為實際的產品或者服務。

AI可以解決重復性、規則性的工作，但是無法共情人類的情感、理解人類情緒、主動創造、做出決策。所以需要人類與AI攜手合作，充分發揮各自的優勢，

8.1.1 結合AI能力，幫助項目落地

在產品研發流程中，需要根據不同的業務需求和場景選擇適合的AI技術，靈活運用AI的能力，將AI技術融入工作流。

比如目前AI生成的內容，就像是一個一個單獨的元件，往往不能拿來直接使用，需要結合業務目的、場景等進行調整、結合等，達成業務目標。就像現在各種設計組件庫，也需要結合實際的業務場景、需要解決的問題等靈活選用。

8.2 提升綜合能力，成為雪花形人才

雪花型人才是指多元、復合型人才，圍繞一個核心，在多個領域快速積累知識和經驗。知識之間的交叉、經驗的遷移、不同行業之間的借鑒等，有助于快速地給出解決方案、做出決策。

由于AI可以解決很多基礎性、重復性的工作，拓展個人的能力邊界，提升個人產出的效率。那么人有限的精力可以用來做更多重要的事情，個人的能力將得到更全面的發展。也就是把以前用來練習與掌握各種軟件、工具的時間都用于去理解不同領域的知識，并結合這些知識指導、使用AI進行創作與輸出。

雪花型人才

8.2.1 未來已來，只是分布得不均勻

技術要找到合適的場景，解決問題，適配人性。就像《梁寧-產品思維30講》中所說的：未來已來，只是分布得不均勻。面對問題時，我們可以將多領域知識、經驗、技術、邏輯等遷移互鑒，拓寬自己的視野，通過類比、聯想獲得更優的解決方案。

這需要跨領域的學習能力，或者說快速熟悉某一個領域的能力，以及系統性思維。利用AI的快速總結能力，秉持終身學習的理念，將知識橫向連接，最終成為一個具有自己獨特見解的問題解決者。

8.2.2 提升軟實力

8.2.2.1 對于世界的好奇心

好奇心引領人類前行。AI是解決問題的工具，而人類則通過提出問題來拓展知識疆域的邊界。愛因斯坦曾說：“提出一個問題往往比解決一個問題更為重要。”提出一個好問題，往往意味著對事物有著濃厚的興趣、深入的思考、敏銳的洞察。在科學研究中，一個具有創新性和前瞻性的問題可能會引發一系列的研究和探索，從而推動整個領域的發展。

好奇心是自驅的動力。對未知充滿好奇，可以提升我們的自我批判能力，助力于我們探索新的未知的領域、拓寬我們的思維邊界，而不是僅僅滿足于當前已有的模式。

8.2.2.2 保持人性

AI主要是根據已有的數據、信息進行分析或預測，而人類的想象力、直覺、情感等可以幫助人類“無中生有”，創造那些不曾存在過的新事物。

信息不發生串聯、關聯、形成網絡，則只是數據，而不能稱之為知識。AI可以幫我們快速、準確地找到各類信息與資源，但是讓這些信息轉變為個人的知識與智慧，還需要人類自我的認知、分析、整合、思考的努力后形成自己的觀點與理解。

同時，我們能夠運用批判性思維來質疑和驗證所接收到的信息，保持自我的獨立性，從而避免盲目接受。

8.2.2.3 溝通能力

所有產品終究都是要為人所服務的，與人溝通、了解人的需求、確定我們要解決的問題，是確立產品目標的關鍵。而產品目標是決定我們要做什么、以及怎么做的指導原則，是整個產品的方向與旗幟。只有產品目標明確，產品才有可能獲得成功。

人與AI相比的一大優勢是具有同理心，能夠理解人類的情緒、情感，這在與人溝通中發揮著關鍵作用，可以設身處地為他人著想，理解他們的感受和觀點，從而分析與理解他們沒有直接表達出來的某些想法。

在溝通中建立信任、鞏固情感、平衡各方利益，與上下游合作推進方案落地，是除了產出設計方案以外更加重要的能力。

8.2.2.4 對于業務的理解

只有深入理解業務，才能真正知曉用戶在業務流程中的痛點和期望，從而設計出能切實解決問題、提升用戶體驗的產品。

很多B端產品，特別是金融類、法律合規類的產品，由于現實情況、規則制定多樣化的原因，往往有很多復雜業務場景限制，這些規則由人制定而且互相牽扯，AI 可能需要大量的訓練數據和時間來學習和適應。

同時，評估這些規則對于產品的影響，也需要多維度的梳理，并針對性的解決，確保產品的合規性和穩定性。

8.3 在目前的產品研發流程中，如何使用AI提效？

就目前的階段而言，人工智能更像是一個趁手、高效的工具。所以我們使用AI提效的總體原則是：在產品研發流程的不同階段，選取有價值的環節、AI比較擅長的部分，利用AI來強化能力、提高效率。

比如可以使用AI提高我們的搜索效率、助力我們快速獲取各類資源，或者輔助我們進行一些發散、總結、提煉等方面基礎性的思維創造工作，從中獲取一些設計靈感與方向。

或者使用AI為決策過程增加視角的多樣性。基于AI所擁有的不同領域的背景知識，當我們向AI尋求建議時，等于有各種類型的專業人士意見可供參考。

8.3.1 產品規劃

描述產品的目的、場景、用戶等，由AI給出一定的產品設計思路參考，包括對于產品業務流程的優化、模塊分類、頁面布局等。

8.3.2 信息架構

在組織信息時，可以讓 AI 扮演不同的角色，如用戶、管理員等，提供類似卡片分類測試的結果以供參考。

8.3.3 提供靈感

在設計的雙鉆模型中，當具體需要解決的問題明確以后，一般需要進行創意探索與方案發散。這時候可以利用AI所掌握的海量數據與遠超人類的計算能力，快速嘗試各種風格進行對比，探索各種類型的風格感覺。對于視覺要求度高的運營設計而言，能夠極大程度地縮減前期風格探索所需的時間。

8.3.4 尋找&生成各類資源

增強搜索能力，進行資源整合或者生成一些符合業務場景的資源。包括不限于競品、分析報告、情緒版、設計組件庫、產品相關知識（業務、心理學、設計等）、行業數據、展示模板樣機、插畫、宣傳海報等。

8.3.4.1 生成設計元素

使用Midjourney等AI圖像生成工具，生成如icon、logo、頭像、虛擬人物、背景、banner、運營活動宣傳插圖等視覺元素。比如QQ音樂的不同播放器風格，就是AI生成的。

8.3.4.2 AIGC豐富產品

產品中的一些內容資源，也可以加入AIGC內容。例如電商應用中的模特圖片、數字人虛擬主播、可以發表話題的虛擬用戶、可以在群聊/評論區隨時出現的AI助理等。這樣，可以使平臺內容更加豐富、多樣化，以吸引更多的用戶參與和交流。

8.3.5 優化文案

對文案表達進行潤色、優化表達方式、檢查錯別字等，包括不限于內容示例、說明引導文案、反饋提示文案、產品的簡介、銷售文案、各平臺的運營文案、Slogan等。

8.3.6 提煉重點、分析數據、撰寫材料

把資料整理、數據處理這一類重復性的工作交給AI。比如設計調研后，由AI來產出數據分析報告并總結、產品匯報階段用AI先擬定一個初步的PPT大綱、在用戶測試階段用AI幫助制定測試計劃、在宣傳策劃階段讓AI撰寫視頻腳本等。然后設計師再結合AI初步整理的材料進行細化與完善。

8.3.7 提供決策依據

設計方案完成后，需要對不同的方案進行比對、測試、驗證等。傳統的用戶測試常需要花費大量的人力、時間、金錢成本。使用AI進行初步的分析總結，選擇一種方案上線并在后續迭代中不斷優化，也許是另一種輕量化的解決思路。

9 最后

世界上唯一不變的是變化，我們唯一能做的就是擁抱它。

技術是產品實現的重要基礎，技術的變革會導致產品的形態發生改變。因而所有行業都有可能被AI改造一遍，包括不限于：生產制造、教育、法律、影視傳媒、游戲、醫療等等。這些改變將是業務層面的變革。

人性是產品需求的重要基礎，人性不變，需求則不變，改變的只是實現需求的方式。技術的發展應該服務于人類的利益，無論技術如何演進，歸根結底仍需以人本為核心，而不是僅僅追求技術本身的進步。也就是產品以技術作為實現手段，圍繞著提高人類生活質量、實現人類終極自由的目標而前進。

藍藍設計(m.axecq.cn )是一家專注而深入的界面設計公司，為期望卓越的國內外企業提供卓越的大數據可視化界面設計、B端界面設計、桌面端界面設計、APP界面設計、圖標定制、用戶體驗設計、交互設計、UI咨詢、高端網站設計、平面設計，以及相關的軟件開發服務，咨詢電話：01063334945。我們建立了一個微信群，每天分享國內外優秀的設計，有興趣請加入一起學習成長，咨詢及進群請加藍小助微信ben_lanlan。

關鍵詞：UI咨詢、UI設計服務公司、軟件界面設計公司、界面設計公司、UI設計公司、UI交互設計公司、數據可視化設計公司、用戶體驗公司、高端網站設計公司、銀行金融軟件 UI界面設計、能源及監控軟件 UI界面設計、氣象行業 UI界面設計、軌道交通界面設計、地理信息系統 GIS UI界面設計、航天軍工軟件 UI界面設計、醫療行業軟件 UI界面設計、教育行業軟件 UI界面設計、企業信息化UI界面設計、軟件qt開發、軟件wpf開發、軟件vue開發

« 超全面陰影設計指南圖標設計的進化歷程，讀這一篇就好了！ »