AI時(shí)代新篇章:用戶(hù)體驗(yàn)設(shè)計(jì)的智能革命與未來(lái)展望

2024-6-19    ui設(shè)計(jì)分享達(dá)人

隨著ChatGPT在23年初的火熱,AI熱潮已經(jīng)開(kāi)始席卷各行各業(yè),人們對(duì)于AI的熱情就像是看著第一款iPhone發(fā)布或者蒸汽機(jī)的發(fā)明,期待著它帶來(lái)一場(chǎng)信息時(shí)代的工業(yè)革命。同時(shí),AI替代60%崗位的口號(hào)也足以讓相關(guān)從業(yè)者感到前所未有的壓力與焦慮。在各大設(shè)計(jì)網(wǎng)站上,關(guān)于AI的內(nèi)容肉眼可見(jiàn)的占據(jù)了越來(lái)越多的比重,包括AI在設(shè)計(jì)流程中的應(yīng)用、各種AI最新工具等介紹、AI的使用技巧、AI生成的海報(bào)/插畫(huà)等作品……一瞬間,似乎全民都投入到了AI的浪潮之中。
反過(guò)頭來(lái)看,對(duì)于用戶(hù)體驗(yàn)設(shè)計(jì)而言,由于產(chǎn)品的底層邏輯被AI改寫(xiě),產(chǎn)品的生態(tài)、單個(gè)產(chǎn)品的形態(tài)、使用方式等都將發(fā)生翻天覆地的變化。連帶著的,由于生產(chǎn)工具的變革,產(chǎn)品的設(shè)計(jì)、開(kāi)發(fā)流程也將隨之發(fā)生變化,進(jìn)一步提高效率,對(duì)于從業(yè)人員的能力要求也在實(shí)時(shí)更新。
對(duì)于這樣一種浪潮,埋頭當(dāng)個(gè)鴕鳥(niǎo)或者嗤之以鼻是沒(méi)有意義的,我們需要看到、認(rèn)識(shí)、擁抱它。所以有人笑稱(chēng):打不過(guò)就加入。同時(shí),對(duì)于各種所謂干掉各個(gè)崗位的宣傳,也吸引著、推動(dòng)著我們?nèi)チ私鈱⒈皇裁锤傻粢约霸趺幢桓傻簟?/section>
從另一方面講,只有在技術(shù)變革的時(shí)候,彎道超車(chē)才有可能。如果只是沿用之前的經(jīng)驗(yàn)與技術(shù),那么成熟的企業(yè)就會(huì)有先發(fā)優(yōu)勢(shì)。但是當(dāng)面對(duì)新的技術(shù)變革時(shí),大家被拉回到同一起跑線上,這個(gè)時(shí)候,就看誰(shuí)能夠找到正確的方向,率先突圍。
所以,不管是被動(dòng)也好,還是主動(dòng)也好,面對(duì)著新一輪的技術(shù)變革,也希望從AI能力本身、所帶來(lái)的變化、以后的發(fā)展等方面全面了解一下這個(gè)新的時(shí)代寵兒。
本文結(jié)構(gòu):

 

1 AI相關(guān)概念與術(shù)語(yǔ)

1.1 AI&AIGC

人工智能或者說(shuō)AI,Artificial Intelligence。是用機(jī)器來(lái)模擬人的智能或者思維模式來(lái)完成各項(xiàng)任務(wù)目標(biāo)。

從其工作的機(jī)制而言,目前主要分為兩種:決策式人工智能,生成式人工智能。

  • 決策式人工智能。根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測(cè),比如我們常見(jiàn)的抖音、頭條、淘寶等的推薦算法。
  • 生成式人工智能。通過(guò)分析現(xiàn)有數(shù)據(jù)來(lái)生成模仿、拼合、創(chuàng)造新的內(nèi)容。比如當(dāng)下最熱的chatGPT、Midjourney、Sora等。

從能力角度而言,人工智能也可以分為強(qiáng)人工智能和弱人工智能。

  • 強(qiáng)人工智能。通用型人工智能(AGI,Artificial General Intelligence)。能夠像人類(lèi)一樣對(duì)不同領(lǐng)域進(jìn)行記憶、推理和解決問(wèn)題。領(lǐng)域間的知識(shí)與經(jīng)驗(yàn)可以遷徙、借鑒,是“通才”。既可以寫(xiě)詩(shī)畫(huà)畫(huà),又可以診斷疾病,還可以進(jìn)行數(shù)學(xué)計(jì)算。
  • 弱人工智能。在某一領(lǐng)域具備專(zhuān)業(yè)能力、解決特定問(wèn)題,能力沒(méi)法泛化,是專(zhuān)才。比如下圍棋的AlphaGo,可以打敗人類(lèi)圍棋世界冠軍,但是沒(méi)法回答你“白毛浮綠水”的下一句是什么。
AIGC(Artificial Intelligence Generative Content)
人工智能生成的內(nèi)容,包括文本、語(yǔ)音、圖片、視頻等多種形式。

 

AI生成內(nèi)容

1.2 AI Agent

1.2.1 人類(lèi)與AI協(xié)作的三種模式:

  • 嵌入(Embedding)模式:類(lèi)似于L2級(jí)別的自動(dòng)駕駛。人類(lèi)占據(jù)主導(dǎo),AI作為工具,執(zhí)行某條具體的命令。
  • 副駕駛(Co-pilot)模式:類(lèi)似于L3級(jí)別的自動(dòng)駕駛。人與AI共同參與,與人類(lèi)之間互相協(xié)商、溝通,實(shí)現(xiàn)某一目標(biāo)。
  • 智能體(Agent)模式:類(lèi)似于L4級(jí)別的自動(dòng)駕駛。人類(lèi)作為指揮者、監(jiān)督者、評(píng)估者。AI作為獨(dú)立的行動(dòng)者,自主分析目標(biāo)、拆解任務(wù)、嘗試執(zhí)行、對(duì)比結(jié)果與目標(biāo)、優(yōu)化執(zhí)行步驟與方式并最終實(shí)施完成人類(lèi)設(shè)立的目標(biāo)。

 

AI與人類(lèi)協(xié)作模式

1.2.2 AI  Agent是什么

AI Agent是有能力主動(dòng)思考和行動(dòng)的智能體。讓任務(wù)自動(dòng)化,主要包括感知、記憶、規(guī)劃與決策、行動(dòng)/使用工具。
就像吳恩達(dá)在TED演講中提到的:“許多工作包含不同的任務(wù),AI自動(dòng)化的是任務(wù)而不是工作。”與直接使用大語(yǔ)言模型相比,AI Agent能夠依據(jù)目標(biāo)分解復(fù)雜的工作流程,從而實(shí)現(xiàn)大語(yǔ)言模型的自我對(duì)話與運(yùn)轉(zhuǎn),而不是簡(jiǎn)單地執(zhí)行單一任務(wù)或者由人類(lèi)來(lái)驅(qū)動(dòng)任務(wù)的每一步。
AI Agent = 感知(Perceive)+LLM(記憶(Memory)+規(guī)劃(Planning ))+工具使用(Tool use)/行動(dòng)(Action)

 

AI Agent

  • 感知是AI Agent使用傳感器與周?chē)h(huán)境交互,感知真實(shí)的物理世界,這個(gè)部分涉及到多模態(tài)的信息解析與處理。

  • 記憶讓AI Agent可以存儲(chǔ)關(guān)于某些方向的專(zhuān)業(yè)知識(shí)以及交互過(guò)程中產(chǎn)生的信息,從而利用這些經(jīng)驗(yàn)來(lái)支持、優(yōu)化后續(xù)的決策與行動(dòng)。

  • 規(guī)劃和決策就像是通過(guò)大腦進(jìn)行分析,包含事前規(guī)劃和事后反思。LLM在這里就類(lèi)似于大腦。AI Agent讓AI不再是執(zhí)行單一的任務(wù),而是自動(dòng)將復(fù)雜的任務(wù)拆解為一個(gè)個(gè)可執(zhí)行的子任務(wù)步驟,然后按照順序執(zhí)行,并結(jié)合感知與記憶信息在過(guò)程中不斷試錯(cuò)、優(yōu)化,最終得到滿(mǎn)足目標(biāo)的結(jié)果。

  • 工具的使用就像是能力集成/封裝,類(lèi)似于APP將能力打包的邏輯(比如修圖類(lèi)app可以提高亮度、裁剪畫(huà)面、改變色彩等等)。通過(guò)利用外部的資源或工具來(lái)執(zhí)行任務(wù),從而拓展AI Agent的能力邊界。

  • 同時(shí)各個(gè)AI Agent之間還能夠彼此溝通、協(xié)作,通過(guò)不同能力之間的配合來(lái)發(fā)揮最大的效用。

AI Agent本質(zhì)而言是一個(gè)更好發(fā)揮大模型能力的技術(shù)框架,是圍繞LLM搭建的一套程序。讓用戶(hù)不再只是與LLM進(jìn)行對(duì)話,而是根據(jù)場(chǎng)景,借助LLM 的分析、推理能力,制定解決思路并調(diào)用不同的工具的能力,從而解決問(wèn)題或者達(dá)成既定目標(biāo)。簡(jiǎn)單理解為一個(gè)會(huì)使用大語(yǔ)言模型能力以及各類(lèi)工具來(lái)幫助人類(lèi)解決問(wèn)題的助理。

1.3 AI的算法

1.3.1 AI的三大流派

1.3.1.1 符號(hào)主義:

基于統(tǒng)計(jì)方法,通過(guò)建模預(yù)測(cè)讓機(jī)器通過(guò)計(jì)算來(lái)模擬人的智能,實(shí)現(xiàn)識(shí)別、預(yù)測(cè)等任務(wù)
主要代表算法有:樸素貝葉斯,邏輯回歸,決策樹(shù),支持向量機(jī)。

1.3.1.2 連接主義:

認(rèn)為生物智能是由神經(jīng)網(wǎng)絡(luò)產(chǎn)生的,可以通過(guò)人工方式構(gòu)造神經(jīng)網(wǎng)絡(luò),訓(xùn)練神經(jīng)網(wǎng)絡(luò)產(chǎn)生智能。也就是模擬人的腦部神經(jīng)系統(tǒng),通過(guò)構(gòu)建神經(jīng)元與他們之間的連接,來(lái)構(gòu)建一個(gè)可以學(xué)習(xí)、推理的神經(jīng)網(wǎng)絡(luò)。
主要代表就是神經(jīng)網(wǎng)絡(luò)算法。

1.3.1.3 行為主義:

認(rèn)為生物的智能來(lái)自對(duì)外界的復(fù)雜環(huán)境進(jìn)行感知和適應(yīng),通過(guò)與環(huán)境和其他生物之間的相互作用,產(chǎn)生更強(qiáng)的智能。也就是通過(guò)嘗試與反饋來(lái)強(qiáng)化學(xué)習(xí)、改進(jìn)系統(tǒng)自身的行為。
主要代表算法是強(qiáng)化學(xué)習(xí)。

1.3.2 目前主流的算法:

目前主流的算法都是基于神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí),在此基礎(chǔ)上創(chuàng)新與結(jié)合。

1.3.2.1 神經(jīng)網(wǎng)絡(luò)(Neural Network)

人工智能三大流派中的連接主義的代表算法,通過(guò)人工方式構(gòu)造神經(jīng)網(wǎng)絡(luò),訓(xùn)練神經(jīng)網(wǎng)絡(luò)產(chǎn)生智能。最早起源于麥卡洛克-匹茲模型/M-P神經(jīng)元模型(McCulloch-Pitts model)。
簡(jiǎn)單來(lái)說(shuō)就是模仿人腦的神經(jīng)元結(jié)構(gòu),構(gòu)建一個(gè)函數(shù)集合作為基本單元,然后再互相之間加權(quán)拼接形成神經(jīng)網(wǎng)絡(luò)。一個(gè)神經(jīng)元就是一個(gè)函數(shù)/規(guī)則,前一個(gè)神經(jīng)元的輸出作為后一個(gè)神經(jīng)元的輸入。
循環(huán)神經(jīng)網(wǎng)絡(luò)  (Recurrent Neural Networks, RNN)
神經(jīng)網(wǎng)絡(luò)的一種。關(guān)鍵在于多一個(gè)隱藏層,可以將上一次的輸出產(chǎn)生的輸出作為這一次輸入的一部分。簡(jiǎn)單來(lái)說(shuō)就是能夠記住上下文信息。
在此基礎(chǔ)上演變出來(lái)的長(zhǎng)短期記憶(Long short-term memory, LSTM),讓模型可以去選擇記住什么信息、忘掉什么信息,而不是越早的信息記憶得越少,或者無(wú)差別地全部記住前文的信息,避免短期記憶、梯度爆炸、梯度消失等問(wèn)題。(梯度可簡(jiǎn)單理解為變化率)
主要用于語(yǔ)音分析、文字分析、時(shí)間序列分析。
卷積神經(jīng)網(wǎng)絡(luò)( Convolutional Neural Network, CNN)
基本機(jī)構(gòu)包含輸入層、卷積層、池化層、全聯(lián)接層、輸出層。
卷積層的主要目的是識(shí)別與提取不同的局部特征。
池化層也叫降采樣層,其本質(zhì)是采樣共享。簡(jiǎn)單來(lái)說(shuō)就是通過(guò)用同一個(gè)采樣值(最大值或者平均值之類(lèi))來(lái)代替那些差別不大的采樣值,以便減少數(shù)據(jù)量。
主要用于圖像識(shí)別、人臉識(shí)別等。

1.3.2.2 生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks, GAN)

主要包含生成器(Generator)、判別器(Discriminator)。
生成器用于生成內(nèi)容,判別器用于判斷生成網(wǎng)絡(luò)中產(chǎn)生的內(nèi)容是真實(shí)數(shù)據(jù)還是生成的數(shù)據(jù)。
生成器要不斷優(yōu)化自己的生成數(shù)據(jù)讓判別器判別不出來(lái);判別器也要優(yōu)化自己的判斷能力,使其更準(zhǔn)確;通過(guò)互相之間的對(duì)抗、制約來(lái)實(shí)現(xiàn)訓(xùn)練過(guò)程。

1.3.2.3 Transformer模型:

谷歌的論文《Attention Is All You Need》中提出一種神經(jīng)網(wǎng)絡(luò)模型架構(gòu)。主要特點(diǎn)在于加入自注意力(Self-attention)機(jī)制來(lái)處理序列數(shù)據(jù)。
自注意力機(jī)制通過(guò)給長(zhǎng)文本中每個(gè)詞不一樣的權(quán)重來(lái)判斷每個(gè)詞之間的相關(guān)性,從而判斷整個(gè)文本中最重要的部分。
與RNN相比,Transformer會(huì)將一串序列中的每個(gè)詞的意義及其位置信息結(jié)合起來(lái)傳輸給神經(jīng)網(wǎng)絡(luò),從而讓模型可以同時(shí)處理序列里的所有位置的信息,而不需要像RNN那樣依次處理。這種并行計(jì)算帶來(lái)的好處是大大提高了模型的訓(xùn)練速度,從而為大模型的發(fā)展奠定了基礎(chǔ)。

1.3.3 自然語(yǔ)言處理(Natural Language Processing, NLP)

“語(yǔ)言理解是人工智能領(lǐng)域皇冠上的明珠”——比爾蓋茨
自然語(yǔ)言處理(NLP)就是在機(jī)器語(yǔ)言和人類(lèi)語(yǔ)言之間溝通的橋梁,終極目標(biāo)就是讓人和機(jī)器能夠通過(guò)自然語(yǔ)言進(jìn)行交互,也就是讓機(jī)器能夠理解人類(lèi)的語(yǔ)言、文字等。
主要包含自然語(yǔ)言理解(NLU)和自然語(yǔ)言生成(NLG)。簡(jiǎn)單來(lái)說(shuō)就是聽(tīng)懂人話和說(shuō)人話。

1.3.4 機(jī)器學(xué)習(xí)(Machine Learning, ML)

所有的對(duì)象,不論人類(lèi)、動(dòng)物,甚至是無(wú)生命機(jī)械,如果接受外界信息的刺激之后,能形成經(jīng)驗(yàn)反應(yīng),并影響日后的行為,那其實(shí)這個(gè)過(guò)程就已經(jīng)可以稱(chēng)之為“學(xué)習(xí)”了。——《智慧的疆界:從圖靈機(jī)到人工智能》
機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的核心方法。從有限的觀測(cè)數(shù)據(jù)中“學(xué)習(xí)”(or“猜測(cè)”)出一個(gè)具有一般性的規(guī)律,并利用這些規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的方法。
簡(jiǎn)單來(lái)說(shuō),機(jī)器學(xué)習(xí)就是通過(guò)數(shù)據(jù)訓(xùn)練讓算法掌握規(guī)律。

 

機(jī)器學(xué)習(xí)

1.3.4.1 深度學(xué)習(xí)( Deep Learning)

機(jī)器學(xué)習(xí)的一個(gè)分支。使用深層次神經(jīng)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)。深度是指模型有多個(gè)層次的神經(jīng)元。通過(guò)逐層分解來(lái)解決復(fù)雜度較高的問(wèn)題。
深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)最大的區(qū)別在于使用神經(jīng)網(wǎng)絡(luò)模型代替人工的特征提取過(guò)程,通過(guò)數(shù)據(jù)訓(xùn)練來(lái)優(yōu)化模型的表現(xiàn)。
可簡(jiǎn)單理解為使用神經(jīng)網(wǎng)絡(luò)算法的機(jī)器學(xué)習(xí)。

1.3.4.2 監(jiān)督學(xué)習(xí)(Supervised Learning)

有標(biāo)準(zhǔn)答案的學(xué)習(xí)。其基本思想是利用帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練模型,從而使其能夠從輸入數(shù)據(jù)中學(xué)習(xí)到輸入與輸出之間的映射關(guān)系,然后可以利用這個(gè)映射關(guān)系對(duì)新的未打標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)測(cè)。
監(jiān)督學(xué)習(xí)需要告訴模型:1. 事物的關(guān)鍵特征是什么(稱(chēng)為特征);2. 那東西到底是什么。就像學(xué)生刷題,通過(guò)練習(xí)獲得的經(jīng)驗(yàn)來(lái)解新的題目。

1.3.4.3 無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning)

沒(méi)有標(biāo)準(zhǔn)答案的學(xué)習(xí)。其目標(biāo)是讓模型從未標(biāo)記的數(shù)據(jù)中自行發(fā)現(xiàn)共性、結(jié)構(gòu)、模式、關(guān)聯(lián)或者表示,而無(wú)需使用人工標(biāo)簽或者先驗(yàn)知識(shí)的指導(dǎo)。包括聚類(lèi)、降維、異常檢測(cè)等。

1.3.4.4 強(qiáng)化學(xué)習(xí)(Reinforcement Learning)

與監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)類(lèi)似,也是一種機(jī)器學(xué)習(xí)的方式。
算法不斷的嘗試、試錯(cuò),反饋機(jī)制通過(guò)獎(jiǎng)賞與懲罰告訴算法哪種是好的,哪種是不好的,從而規(guī)訓(xùn)其行為方向。簡(jiǎn)單來(lái)說(shuō)就是獎(jiǎng)勵(lì)積極行為和懲罰消極行為。
美劇《生活大爆炸》中Sheldon就使用巧克力作為獎(jiǎng)勵(lì),馴化Penny的行為。

 

美劇《生活大爆炸》劇照

1.3.5 大語(yǔ)言模型(Large Language Model, LLM)

是一種基于神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理技術(shù)的模型,目前大部分知名的大語(yǔ)言模型都是基于Transformer架構(gòu)。
它通過(guò)將每個(gè)詞轉(zhuǎn)化為向量輸入到模型中,并使用大量的文本數(shù)據(jù)進(jìn)行訓(xùn)練,讓模型來(lái)學(xué)習(xí)服務(wù)人類(lèi)語(yǔ)言理解和生成的能力。
大語(yǔ)言模型的【大】主要體現(xiàn)在訓(xùn)練數(shù)據(jù)與模型參數(shù)的大,從而需要更高的算力支持。
與傳統(tǒng)的機(jī)器學(xué)習(xí)模型相比,大模型具有更強(qiáng)的表示能力和泛化能力,能夠處理海量數(shù)據(jù)、完成各種復(fù)雜的任務(wù),如自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等。

2 AI能力分析

2.1 人類(lèi)能力地形圖

機(jī)器人專(zhuān)家漢斯·莫拉維克(Hans Moravec)曾提出人類(lèi)能力地形圖的概念,其中,海拔高度代表這項(xiàng)任務(wù)對(duì)計(jì)算機(jī)的難度,不斷上漲的海平面代表計(jì)算機(jī)現(xiàn)在能做的事情。

 

圖源:https://qph.cf2.quoracdn.net/main-qimg-dfa49b90572af22a8b8e9ec7c02b8688
AI的發(fā)展,會(huì)逐漸淹沒(méi)人類(lèi)的特有的優(yōu)勢(shì)領(lǐng)域。最終,當(dāng)AI開(kāi)始具備設(shè)計(jì)人工智能的能力(AI Design),AI能力的推動(dòng)將有AI自己的改進(jìn)來(lái)推動(dòng),其速度會(huì)比由人類(lèi)推動(dòng)快得多。這也是所謂的“奇點(diǎn)”,到達(dá)奇點(diǎn),人工智能將出現(xiàn)爆發(fā)式的增長(zhǎng)。
就目前而言,人類(lèi)與AI各有優(yōu)勢(shì),所以人類(lèi)與AI攜手合作,發(fā)揮各自的優(yōu)勢(shì),形成群體智慧,實(shí)現(xiàn)1+1> 2 才是最優(yōu)解。

2.1.1 人類(lèi)相比于AI,所擁有的優(yōu)勢(shì):

  • 自主創(chuàng)造、構(gòu)思以及戰(zhàn)略性規(guī)劃、精細(xì)化決策

  • 具有同理心,能夠理解人類(lèi)的情緒、情感

  • 對(duì)于美的理解與感受

  • 不同領(lǐng)域之間的經(jīng)驗(yàn)可以遷徙、復(fù)用

  • 具備常識(shí)

  • 具有價(jià)值觀、人生觀、世界觀,能夠理解人類(lèi)的行為與文化

  • 可以完成精確且復(fù)雜的體力工作

  • 可以輕松界定思考問(wèn)題的框架,也就是哪些問(wèn)題與任務(wù)相關(guān),哪些無(wú)關(guān)

2.1.2 AI相比于人類(lèi),所擁有的優(yōu)勢(shì):

  • 沒(méi)有情感等主觀因素,比人類(lèi)更理性,可以公正客觀對(duì)待每個(gè)方案

  • 可以在極短時(shí)間內(nèi)完成超復(fù)雜的運(yùn)算,從而產(chǎn)出大量的方案與探索結(jié)果

  • 可以長(zhǎng)時(shí)間不厭其煩做同一件事,而且不會(huì)累或者因?yàn)槠诙档蜏?zhǔn)確度

  • 記憶力好,積累的經(jīng)驗(yàn)可以被隨時(shí)調(diào)用

2.2 發(fā)揮各自最大的優(yōu)勢(shì)

對(duì)于AI將會(huì)取代人類(lèi),現(xiàn)在最常見(jiàn)的說(shuō)法就是:
  • AI將改變或者消滅某些工作,同時(shí)創(chuàng)造出新的工作。

  • AI不會(huì)取代人,而會(huì)使用AI工具的人將取代不會(huì)使用AI工具的人。
讓AI解放人類(lèi)的雙手,去做那些機(jī)械性、重復(fù)、無(wú)聊的計(jì)算工作。而人類(lèi)則把時(shí)間精力投入到更有價(jià)值的工作比如規(guī)劃、決策、制定目標(biāo)、人際關(guān)系維護(hù)等。
當(dāng)然,二者之間的工作并不是完全剝離、獨(dú)立的,而是互相影響與溝通協(xié)作。比如,人類(lèi)可以借用AI的數(shù)據(jù)分析能力、預(yù)測(cè)結(jié)果等增強(qiáng)自己的決策能力。
所以,一方面,人要學(xué)習(xí)怎么更好地使用AI,發(fā)揮AI最大的價(jià)值。另一方面,AI也要往增強(qiáng)人類(lèi)能力、改善人類(lèi)社會(huì)生活的方向發(fā)展。

3 AI能力加持后,產(chǎn)品/業(yè)務(wù)層面變化

3.1 產(chǎn)品邊界變得模糊

3.1.1 物理世界與數(shù)字世界深度融合

數(shù)字孿生將物理世界映射到數(shù)字世界,具身智能機(jī)器人、自動(dòng)駕駛等讓數(shù)字世界操控物理世界。AI能力的強(qiáng)化則讓二者之間的融合更加深入。比如京東AI數(shù)字人“采銷(xiāo)東哥”,看面相幾乎和真人無(wú)異,可以在直播間為大家介紹各種產(chǎn)品。如果再進(jìn)一步,可以實(shí)時(shí)回答觀眾的問(wèn)題,那就與真人差別不大了。

3.1.2 產(chǎn)品成為能力中心

產(chǎn)品之間的壁壘打通,成為能力插件,主要在于提供某種能力。比如小D想通過(guò)視頻學(xué)習(xí)糖醋排骨的做法,那么AI所獲取的內(nèi)容可能會(huì)來(lái)自于抖音、快手、淘寶直播、小紅書(shū)等等平臺(tái),或者整合各平臺(tái)內(nèi)容生成一個(gè)新的、針對(duì)于小D喜好的內(nèi)容。平臺(tái)成為底層信息的提供方或者說(shuō)資源池,用戶(hù)也無(wú)需在多個(gè)產(chǎn)品之間來(lái)回切換。

3.1.3 服務(wù)設(shè)計(jì)

由于AI對(duì)流程中每一個(gè)觸點(diǎn)信息的掌握以及對(duì)于各項(xiàng)能力的集成,使得根據(jù)場(chǎng)景調(diào)用不同能力以滿(mǎn)足需求成為可能。
產(chǎn)品的設(shè)計(jì)不止考慮單一的產(chǎn)品,而是要考慮與其他產(chǎn)品、能力、服務(wù)的配合。在使用環(huán)境/場(chǎng)景中,從用戶(hù)的歷程出發(fā),滿(mǎn)足用戶(hù)在整個(gè)任務(wù)鏈路中每一個(gè)節(jié)點(diǎn)的需求。

3.1.4 流程自動(dòng)化

產(chǎn)品與產(chǎn)品之間的互相銜接、流轉(zhuǎn)也將自動(dòng)化,無(wú)需由用戶(hù)來(lái)推動(dòng)。比如小D要出差,當(dāng)他向AI提出這個(gè)需求時(shí),AI一并將機(jī)票、酒店同步預(yù)定好,同時(shí),在出差結(jié)束后,自動(dòng)對(duì)接人事考勤、費(fèi)用報(bào)銷(xiāo)等產(chǎn)品能力,實(shí)現(xiàn)流程自動(dòng)化。也就是依據(jù)場(chǎng)景將服務(wù)打包,用戶(hù)觸發(fā)一次就完成整個(gè)流程動(dòng)作,無(wú)需到每一個(gè)系統(tǒng)/產(chǎn)品中分別去執(zhí)行一遍操作。
流程自動(dòng)化帶來(lái)的也是效率和易用性的提升,用戶(hù)的操作負(fù)擔(dān)被大大減少。

3.1.5 B/C端差異減少

B端各流程節(jié)點(diǎn)之間的溝通、協(xié)作、傳遞也可以由【人-產(chǎn)品-人】的方式轉(zhuǎn)變?yōu)椤続gent-Agent】 的方式。提高流程運(yùn)轉(zhuǎn)的效率,降低了B端產(chǎn)品的操作復(fù)雜度。
當(dāng)用戶(hù)與AI Agent交互,由Agent代替用戶(hù)去直接面對(duì)、調(diào)用各個(gè)產(chǎn)品的各項(xiàng)能力,發(fā)起各種任務(wù),B端產(chǎn)品和C端產(chǎn)品交互的邏輯會(huì)愈發(fā)類(lèi)似。Agent對(duì)話式的交互、自動(dòng)規(guī)劃等將會(huì)大大減少B端產(chǎn)品的學(xué)習(xí)成本,用戶(hù)在使用不同類(lèi)型產(chǎn)品時(shí)將不會(huì)有太大的差異。

3.1.6 多產(chǎn)品形態(tài)互聯(lián)互通

AI可以在手機(jī)、平板、電腦、電視、車(chē)載終端等不同設(shè)備之間的無(wú)縫切換,設(shè)備跟著場(chǎng)景轉(zhuǎn)換,但是流程不中斷,多設(shè)備協(xié)調(diào)配合走完整個(gè)任務(wù)鏈路。比如在下班回家的路上,小D在車(chē)?yán)锫?tīng)小說(shuō),回家以后,家里的智能音箱繼續(xù)從下車(chē)時(shí)刻的部分開(kāi)始繼續(xù)播放。

3.2 接受非結(jié)構(gòu)化的信息

語(yǔ)音識(shí)別、NLP、圖片識(shí)別、手勢(shì)識(shí)別、紅外傳感、重力感應(yīng)、腦機(jī)接口等等技術(shù)的演進(jìn)與突破。讓輸入不再依賴(lài)于表單、按鈕等創(chuàng)建符合計(jì)算機(jī)理解模式的結(jié)構(gòu)化信息。
非結(jié)構(gòu)化輸入的特點(diǎn):多模態(tài)、更自然、更高效、學(xué)習(xí)成本更低。不再是人去適應(yīng)計(jì)算機(jī)能接受的數(shù)據(jù)模式,而是計(jì)算機(jī)來(lái)學(xué)習(xí)理解人類(lèi)的信息表達(dá)形式,比如表情、手勢(shì)、語(yǔ)氣等。
AI對(duì)于非結(jié)構(gòu)化數(shù)據(jù)、自然語(yǔ)言的理解,也降低了產(chǎn)品的復(fù)雜度,減少用戶(hù)的認(rèn)知負(fù)擔(dān),讓產(chǎn)品的學(xué)習(xí)成本大大減低。

3.2.1 普適計(jì)算(ubiquitous computing)

普適計(jì)算是指計(jì)算可以在任何設(shè)備上、在任何地理位置中以及用任何格式進(jìn)行。其顯著目標(biāo)之一則是使得計(jì)算機(jī)設(shè)備可以感知周?chē)沫h(huán)境變化,從而根據(jù)環(huán)境的變化做出自動(dòng)的基于用戶(hù)需要或者設(shè)定的行為。
與物聯(lián)網(wǎng)類(lèi)似,簡(jiǎn)單來(lái)說(shuō)就是通過(guò)多樣化的設(shè)備(手機(jī)、手表、眼鏡、微波爐、冰箱等)來(lái)感知信息、獲取信息、處理信息,所有的物品都有可能變成一個(gè)計(jì)算機(jī)。這樣的目的是讓計(jì)算機(jī)可以隨時(shí)感知環(huán)境、行為的變化,從而及時(shí)、貼心地滿(mǎn)足用戶(hù)的需求。

3.3 數(shù)據(jù)的集中化處理

假設(shè)個(gè)人助手或者說(shuō)AI Agent的成熟,那么人們與產(chǎn)品交互的通道將會(huì)從各個(gè)分散的產(chǎn)品集中到一個(gè)點(diǎn)。由統(tǒng)一的交互入口收集的用戶(hù)行為數(shù)據(jù)以及AI主動(dòng)通過(guò)各類(lèi)設(shè)備收集的用戶(hù)個(gè)人數(shù)據(jù),讓每個(gè)人的信息更加完整、全面地被AI所記錄,更容易實(shí)現(xiàn)個(gè)人數(shù)據(jù)的集中化處理。
AI掌握的個(gè)人信息越多,才能更全面地了解一個(gè)人,也才能更有針對(duì)性地為用戶(hù)提供個(gè)性化的服務(wù)。聰明、貼心、智能的AI與集中化的數(shù)據(jù)將會(huì)互相促進(jìn)、互相強(qiáng)化,也就是越集中的數(shù)據(jù)帶來(lái)越聰明的AI,越聰明的AI將會(huì)通過(guò)多渠道收集到更多的個(gè)人數(shù)據(jù)。

3.3.1 對(duì)于個(gè)人信息安全的注重

AI將會(huì)使用個(gè)人的數(shù)據(jù)進(jìn)行訓(xùn)練并改進(jìn)行為,這需要符合監(jiān)管要求,遵循個(gè)人數(shù)據(jù)處理的最小化原則,保證用戶(hù)的知情權(quán),進(jìn)行節(jié)點(diǎn)隔離以及加強(qiáng)對(duì)于數(shù)據(jù)處理權(quán)限、存儲(chǔ)、保密的管理。避免個(gè)人信息的泄露或者被不當(dāng)使用。
當(dāng)然,這也需要更加完善的數(shù)據(jù)保護(hù)法規(guī)進(jìn)行支撐,比如GDPR、ADPPA、中華人民共和國(guó)數(shù)據(jù)安全法、個(gè)人信息保護(hù)法等,避免個(gè)人隱私泄露。

3.4 人機(jī)深度協(xié)同,構(gòu)建信任變得更重要

越是使用頻繁的、形成依賴(lài)的產(chǎn)品,越需要得到用戶(hù)的信任。如果微信在使用過(guò)程中時(shí)不時(shí)的出現(xiàn)bug,發(fā)給A的消息錯(cuò)發(fā)給了B,那么用戶(hù)就會(huì)變得不敢使用。尤其AI產(chǎn)品還需要收集用戶(hù)的各種數(shù)據(jù)才能更好地發(fā)揮作用,那么得到用戶(hù)的信任將顯得更加重要。
信任來(lái)源于了解、確定、可控,由于AI的黑盒性質(zhì)以及產(chǎn)品越來(lái)越主動(dòng),如何解釋AI的決策過(guò)程、規(guī)范AI的行為、提高AI行為的可預(yù)測(cè)性、保持用戶(hù)的掌控感也越來(lái)越重要。
解釋決策過(guò)程和規(guī)范行為并不是說(shuō)需要AI事事作說(shuō)明、匯報(bào),而是當(dāng)用戶(hù)想要了解時(shí)提供詳細(xì)的解釋與說(shuō)明、當(dāng)用戶(hù)想要自己決策時(shí)可以修改AI提供的方案。從原則上而言,AI最終還是要服從于人、服務(wù)于人,而不是指揮人、控制人、取代人。

3.5 提前預(yù)判,主動(dòng)推送,具備主動(dòng)性

根據(jù)用戶(hù)的場(chǎng)景、行為,判斷用戶(hù)的意圖,通過(guò)多產(chǎn)品、數(shù)據(jù)的貫通,綜合分析,提供事前的提醒與服務(wù)。比如在用戶(hù)購(gòu)買(mǎi)機(jī)票后對(duì)接航班、天氣、交通等數(shù)據(jù),如果有航班管制、惡劣天氣、交通擁堵等不良狀況發(fā)生,可以及時(shí)通知用戶(hù)。

3.5.1 場(chǎng)景驅(qū)動(dòng)

信息的集中化處理,使得結(jié)合各種傳感器、設(shè)備所提供的環(huán)境信息以及用戶(hù)的生理、行為等信息進(jìn)行綜合分析成為可能。AI可以了解用戶(hù)所處的環(huán)境及其需求,通過(guò)場(chǎng)景所提供的上下文來(lái)減少信息輸入的要求。同時(shí),調(diào)用各個(gè)產(chǎn)品的能力,解決問(wèn)題,減少用戶(hù)操作,提高效率與用戶(hù)體驗(yàn)。
比如,智能家庭助手通過(guò)手環(huán)檢測(cè)到小D躺在沙發(fā)上已經(jīng)睡著,并且有點(diǎn)冷,那么它可能會(huì)自動(dòng)調(diào)小正在播放的音樂(lè)、關(guān)閉窗簾、調(diào)暗燈光、打開(kāi)空調(diào),讓用戶(hù)更加舒適且不會(huì)著涼。

3.6 個(gè)性化/定制化

由于用戶(hù)與產(chǎn)品之間通過(guò)一個(gè)統(tǒng)一入口來(lái)交互,那么用戶(hù)的行為數(shù)據(jù)(包括個(gè)人的生物信息、健康狀態(tài)、行車(chē)路線、購(gòu)買(mǎi)習(xí)慣、用戶(hù)偏好、場(chǎng)所出入數(shù)據(jù)等)將更加全面、完整、準(zhǔn)確被獲取。
通過(guò)大量的數(shù)據(jù)與機(jī)器學(xué)習(xí),讓人工智能可以依據(jù)個(gè)人喜好、場(chǎng)景,進(jìn)行意圖判斷。結(jié)合各個(gè)產(chǎn)品能力,針對(duì)不同用戶(hù)可以推薦更加精準(zhǔn)、個(gè)性化的內(nèi)容、功能等,也就是說(shuō)功能也能夠像feed流一樣被推薦,更好地滿(mǎn)足不同人群、場(chǎng)景的需求。

3.6.1 用戶(hù)自定義

AI降低了產(chǎn)品/工具操作的門(mén)檻,讓更多人可以使用它,也就是所謂技術(shù)的民主化。
這就讓用戶(hù)有可能根據(jù)自己的喜好、習(xí)慣、場(chǎng)景等需求差異來(lái)配置產(chǎn)品功能組成結(jié)構(gòu)、優(yōu)先級(jí)等。就像是洞洞鞋,本身提供一個(gè)基礎(chǔ)的樣式,但是每個(gè)人可以選擇自己不同的鞋花。未來(lái),也許每個(gè)人都可以都可以自己設(shè)計(jì)一個(gè)APP應(yīng)該具有什么功能、設(shè)計(jì)衣服樣式、設(shè)計(jì)房子的裝修風(fēng)格等等。
同時(shí),通過(guò)社區(qū)、論壇等的信息交流,A設(shè)計(jì)的產(chǎn)品也許B可以參考、改進(jìn)后成為屬于自己的產(chǎn)品,每個(gè)人都有可能成為生活的創(chuàng)作者,而創(chuàng)作的對(duì)象可以包羅萬(wàn)象。

3.7 改變垂直領(lǐng)域的細(xì)分產(chǎn)品

所有行業(yè)都值得基于人工智能技術(shù)重做一遍——阿里巴巴張勇
AI的生成、總結(jié)、提取、分類(lèi)等能力的突破,將進(jìn)一步促進(jìn)各行業(yè)中各類(lèi)信息的整合與利用,接手重復(fù)性的工作,給各行各業(yè)帶來(lái)流程的簡(jiǎn)化、模式的轉(zhuǎn)變、效率的提升。
  • 針對(duì)如殘障人士、老人、小孩等特殊群體,可以開(kāi)發(fā)提供陪伴、照顧等功能的AI機(jī)器人。

  • 針對(duì)律師、醫(yī)生等特定職業(yè)的人員,利用AI輔助進(jìn)行資料收集、數(shù)據(jù)分析等,增強(qiáng)他們的能力,提升工作的效率。

  • 針對(duì)生產(chǎn)線、倉(cāng)庫(kù)等目標(biāo)和任務(wù)相對(duì)固化的場(chǎng)景,也可以引入AI來(lái)替代很多重復(fù)性等工作。比如利用無(wú)人超市模式來(lái)管理倉(cāng)庫(kù)出庫(kù),領(lǐng)用人員刷臉后自動(dòng)確認(rèn)領(lǐng)料單,同時(shí)系統(tǒng)在領(lǐng)料人員拿走物品后自動(dòng)進(jìn)行出庫(kù)處理、更新庫(kù)存數(shù)據(jù),在庫(kù)存不足時(shí)對(duì)接采購(gòu)系統(tǒng)進(jìn)行采購(gòu)等。

4 AI能力加持后,產(chǎn)品的交互邏輯變化

4.1 信息架構(gòu)的變化

GUI模式下基于點(diǎn)擊的輸入,需要將頁(yè)面內(nèi)容、功能分門(mén)別類(lèi)進(jìn)行組織、布局,以方便用戶(hù)理解與查找然后觸發(fā),所以信息需要按照邏輯歸類(lèi),可尋性也是信息架構(gòu)關(guān)注的重點(diǎn)之一。
AI能力加持下的對(duì)話式交互,讓用戶(hù)只需要面對(duì)一個(gè)統(tǒng)一的入口,通過(guò)這個(gè)入口直達(dá)任意一個(gè)功能(類(lèi)似于Deeplink)。信息的結(jié)構(gòu)不再是以用戶(hù)快速找到為中心,而是以讓AI快速調(diào)取為導(dǎo)向。不再是由人去穿越層層結(jié)構(gòu)尋找所需信息,而是所需的信息從紛繁復(fù)雜的數(shù)據(jù)中跳脫出來(lái)。

4.1.1 功能架構(gòu)扁平化

通過(guò)AI直接調(diào)起產(chǎn)品中的某一個(gè)頁(yè)面,模塊的功能更加獨(dú)立、內(nèi)聚,成為一個(gè)個(gè)能力單元,產(chǎn)品則成為能力單元的橫向集合。
如果是窄而深的信息架構(gòu),層層嵌套的模式,那么能力之間可能會(huì)有一定的耦合與依賴(lài),被直接調(diào)起時(shí)容易缺失上下文,導(dǎo)致功能不可用。

4.1.1.1 導(dǎo)航的弱化

直接調(diào)起的模式,用戶(hù)直達(dá)功能。比如對(duì)AI說(shuō)【我想聽(tīng)李健的《給你》】,它會(huì)直接打開(kāi)播放器,播放這首歌。而不再需要我們【打開(kāi)音樂(lè)APP-找到并點(diǎn)擊搜索框-輸入并搜索-點(diǎn)擊播放】這樣一步一步操作。
減少了尋找信息的步驟,也就減少了導(dǎo)航的需求。導(dǎo)航頁(yè)的價(jià)值將會(huì)降低,以往功能之間需要合理組織以方便用戶(hù)記憶、尋找的特征將會(huì)減弱。

4.1.2 信息模塊化

功能變成類(lèi)似于API或者組件的形式,可以根據(jù)需要與其他產(chǎn)品的信息隨意拼裝,成為整體信息流的一部分。就像我們?cè)谛〖t書(shū)看一個(gè)個(gè)的筆記,或者在淘寶瀏覽一個(gè)一個(gè)的商品,功能也被拆解為一個(gè)一個(gè)的單元,在場(chǎng)景需要的時(shí)候與其他的功能拼裝形成一個(gè)解決方案。
同時(shí),從整體而言,每個(gè)產(chǎn)品可能只提供整個(gè)信息集合的其中一個(gè)部分。也就是前面的說(shuō)的產(chǎn)品邊界被打破。

4.1.3 拓展性更強(qiáng)

每個(gè)頁(yè)面都有可能成為首頁(yè),都是信息架構(gòu)的頂部,這需要產(chǎn)品的信息架構(gòu)有很強(qiáng)的兼容性和擴(kuò)展性。——《AI改變?cè)O(shè)計(jì)》
按照前述AI Agent的設(shè)想,AI所涉及的任務(wù)可能包含多個(gè)層級(jí)的復(fù)雜度,需要不同能力的配合才能完成,也就是需要依賴(lài)不同的產(chǎn)品、組件所提供的能力。
產(chǎn)品的每個(gè)功能將類(lèi)似于樂(lè)高的一個(gè)積木零件,便于互相組合,目的是容納更多新的功能。同時(shí)AI直達(dá)功能的能力可以弱化過(guò)寬的信息架構(gòu)所帶來(lái)的尋找信息不方便的問(wèn)題。

4.1.4 用完即走

用戶(hù)以任務(wù)目標(biāo)為導(dǎo)向,不在乎是哪個(gè)產(chǎn)品、哪個(gè)功能,關(guān)鍵在于高效。就像我們不會(huì)關(guān)注手機(jī)包裝盒里的充電器是哪個(gè)代工廠生產(chǎn)的。產(chǎn)品/能力會(huì)“透明化”“無(wú)形化”,這些能力的提供方將會(huì)成為AI Agent所對(duì)接的“供應(yīng)商”。比如小D想聽(tīng)李健的《給你》,內(nèi)容有可能是QQ音樂(lè)提供的、也有可能是網(wǎng)易云音樂(lè)提供的、或者是B站一個(gè)李健的音樂(lè)會(huì)視頻,對(duì)用戶(hù)而言,聽(tīng)歌的目的達(dá)到了就行。

4.2 交互范式的變化

技術(shù)的革新會(huì)引起范式的變遷。最終指向的都是越來(lái)越簡(jiǎn)單、方便、自然,都是圍繞著更好地服務(wù)于人而來(lái)的。

4.2.1 人機(jī)交互的發(fā)展歷程:

  1. 批處理(Batch Processing)

  2. 命令行交互(Command-based Interaction)

  3. 圖形界面交互(Graphical User Interfaces,GUI)

  4. 對(duì)話式交互(Conversational User Interface,CUI)/語(yǔ)音用戶(hù)界面(Voice User Interface,VUI)/語(yǔ)言用戶(hù)界面(Language User Interface,LUI)

  5. 自然界面交互(Natural user interface,NUI )/基于意圖的結(jié)果規(guī)范化(Intent-Based Outcome Specification )
前三種都屬于用戶(hù)向計(jì)算機(jī)發(fā)出命令,計(jì)算機(jī)嚴(yán)格執(zhí)行命令并產(chǎn)生結(jié)果,用戶(hù)評(píng)估結(jié)果逐步調(diào)整輸入,最終一步一步達(dá)成目標(biāo)。
對(duì)話式交互,本質(zhì)也和之前的幾種范式一樣,人發(fā)出命令,計(jì)算機(jī)執(zhí)行命令,只是用戶(hù)的輸入方式更加多樣化,不止是依賴(lài)于當(dāng)前界面所呈現(xiàn)的元素與選項(xiàng)。(圖形界面相對(duì)于命令行,也是在輸入輸出方式上變得更豐富,鼠標(biāo)、觸控、手勢(shì)等輸入方式以及圖形、動(dòng)畫(huà)等輸出方式減少了用戶(hù)的認(rèn)知負(fù)擔(dān)、記憶負(fù)擔(dān)、操作負(fù)擔(dān))
而在高級(jí)階段自然界面交互/基于意圖的的結(jié)果規(guī)范化中,用戶(hù)不再需要去適應(yīng)計(jì)算機(jī),而是計(jì)算機(jī)來(lái)適應(yīng)人,去理解人的表情、手勢(shì)、語(yǔ)言、語(yǔ)氣、點(diǎn)擊、生理數(shù)據(jù)等等方式/渠道所傳遞的信息。用戶(hù)也不再告訴計(jì)算機(jī)要做什么,而是告訴計(jì)算機(jī)他們想要的結(jié)果,或者,計(jì)算機(jī)能夠通過(guò)感知周?chē)h(huán)境,主動(dòng)識(shí)別用戶(hù)的意圖并自動(dòng)達(dá)成其目標(biāo)。
類(lèi)似于前文提到過(guò)的AI Agent,能夠依據(jù)目標(biāo)分解復(fù)雜的工作流程,從而實(shí)現(xiàn)大語(yǔ)言模型的自我對(duì)話與運(yùn)轉(zhuǎn),而不是簡(jiǎn)單地執(zhí)行單一任務(wù)或者由人類(lèi)來(lái)驅(qū)動(dòng)任務(wù)的每一步。

 

人機(jī)交互發(fā)展歷程

4.2.2 對(duì)話式交互

交互本質(zhì)上是信息的交流,包含信息的輸入與輸出。人與現(xiàn)有產(chǎn)品的交互,輸入的形式包括鼠標(biāo)、鍵盤(pán)、觸屏手勢(shì)、語(yǔ)音、拍照識(shí)別、掃碼等。而輸出的內(nèi)容則包括視覺(jué)(文字、圖片、視頻、燈光等)、聽(tīng)覺(jué)(語(yǔ)言、報(bào)警音等)、觸覺(jué)(震動(dòng))。
人與人之間最自然的交流方式通常是語(yǔ)言交流,通過(guò)言語(yǔ)表達(dá)思想、感情和意圖。除了語(yǔ)言,人們還通過(guò)非語(yǔ)言的方式進(jìn)行交流,如面部表情、姿勢(shì)、手勢(shì)、眼神等。這些非語(yǔ)言元素可以傳達(dá)豐富的信息,有時(shí)比言語(yǔ)更直觀和強(qiáng)烈。這是我們整個(gè)成長(zhǎng)過(guò)程中一種主要的學(xué)習(xí)形式。
對(duì)話式交互,就像是人與人之間聊天的交互方式,輸入的途徑可以是文字,也可以是語(yǔ)音、圖片、鏈接、手勢(shì)等。Sora甚至可以使用視頻作為輸入來(lái)生成視頻。

4.2.2.1 對(duì)話式交互的特點(diǎn)

用戶(hù)的輸入沒(méi)有邊界
擺脫了按鈕、輸入框等的限制,用戶(hù)的輸入可能五花八門(mén),甚至與產(chǎn)品的主要功能無(wú)關(guān)。功能“無(wú)形”之后,就需要針對(duì)各種場(chǎng)景給出不同的反饋。
打破產(chǎn)品邊界、跨越信息層級(jí)
入口統(tǒng)一,交互路徑縮短,能夠穿透信息層級(jí)、跨越產(chǎn)品的業(yè)務(wù)界限。我們的交互過(guò)程基于語(yǔ)言的形式輸入,然后回答的形式根據(jù)內(nèi)容而變??梢越Y(jié)合所個(gè)產(chǎn)品、領(lǐng)域的數(shù)據(jù),綜合給出答案。也就是說(shuō),我們不用面對(duì)數(shù)量繁多的應(yīng)用/產(chǎn)品,只需要像使用Siri一樣,和一個(gè)統(tǒng)一的AI Agent溝通,然后由它來(lái)調(diào)取各個(gè)產(chǎn)品的能力來(lái)為我們提供服務(wù)。

4.2.2.2 對(duì)話式交互的場(chǎng)景

任務(wù)式設(shè)計(jì)——高效
專(zhuān)業(yè)化的應(yīng)用/工具。針對(duì)具體的業(yè)務(wù)領(lǐng)域、任務(wù)類(lèi)型提出需求。輸入一般具有邊界、比較集中。產(chǎn)品的目的是盡快達(dá)成用戶(hù)的目標(biāo)。
閑聊式設(shè)計(jì)——有趣
娛樂(lè)型的應(yīng)用/伙伴。用戶(hù)沒(méi)有明確的目標(biāo),跟隨情緒變化。輸入一般沒(méi)有邊界,可能包含任何主題。產(chǎn)品的目的是在對(duì)話過(guò)程中逐步滿(mǎn)足用戶(hù)的情感需求。

4.2.2.3 對(duì)話式交互的原則

提供引導(dǎo),鼓勵(lì)用戶(hù)輸入
如果開(kāi)始對(duì)話之后遲遲沒(méi)有輸入,則提供猜測(cè)、默認(rèn)選項(xiàng)、參考示例等,讓用戶(hù)直接點(diǎn)選、引導(dǎo)用戶(hù)輸入,避免用戶(hù)在空無(wú)一物的前提下不知道如何開(kāi)展對(duì)話。
特別是在閑聊式場(chǎng)景下,通過(guò)打招呼來(lái)引導(dǎo)、提示等讓對(duì)話可持續(xù)。
理解語(yǔ)境
在我們?nèi)粘5膶?duì)話中,很多信息是大家的【共識(shí)】,是彼此之間交流的信息基礎(chǔ),無(wú)需在對(duì)話中特意說(shuō)明。
比如對(duì)話【Q:今天的天氣怎么樣?A:哪里的天氣?】。這其中位置信息一般都是基于當(dāng)前對(duì)話所在的位置或者上下文出現(xiàn)的位置信息來(lái)決定的,也就無(wú)需用戶(hù)再次說(shuō)明。
在AI的對(duì)話設(shè)計(jì)中,也就需要理解這些語(yǔ)境信息,減少信息輸入的數(shù)量要求,提高溝通的效率。
記住上下文
上下文包括用戶(hù)之前的操作、輸入、用戶(hù)的背景信息等,記住上下文并運(yùn)用到之后的對(duì)話之中多輪對(duì)話的基礎(chǔ)。一方面可以保證話題的連貫性,一方面也避免用戶(hù)的重復(fù)輸入。
具有包容性,消除歧義
語(yǔ)言表達(dá)會(huì)有不同的語(yǔ)氣或者表達(dá)方式,語(yǔ)音識(shí)別也會(huì)有錯(cuò)誤的情況,這時(shí)候要像谷歌搜索一樣,給出合理的猜測(cè)并回答,減少用戶(hù)二次輸入的成本。
當(dāng)用戶(hù)的輸入有歧義時(shí),實(shí)用多級(jí)置信度的方式給出最匹配的、最有可能的回答,并進(jìn)一步詢(xún)問(wèn)且允許用戶(hù)修改。
簡(jiǎn)潔、清晰、保證表達(dá)質(zhì)量
簡(jiǎn)明扼要,陳述與話題相關(guān)的信息,避免模糊晦澀的表達(dá)。不管以何種形式來(lái)反饋,陳述的都是有效的事物,而不是無(wú)意義的答案。比如這樣的對(duì)話【Q:你知道有哪些人獲得了2023年諾貝爾獎(jiǎng)嗎?A:知道?!烤秃翢o(wú)意義。
合適的信息量,采用多種信息輸出模式
不多不少,恰到好處的信息含量。面對(duì)一個(gè)問(wèn)題,網(wǎng)絡(luò)上相關(guān)的信息可能千千萬(wàn)。需要結(jié)合實(shí)際產(chǎn)品、場(chǎng)景、用戶(hù)屬性等實(shí)際情況,給出合理、有效的回答。
我們大腦能處理的信息量是有限的,一旦超出,就會(huì)對(duì)短期記憶造成負(fù)擔(dān)。在某些場(chǎng)景下,語(yǔ)音可以提高效率。但是語(yǔ)音輸出的一個(gè)弊端是:聽(tīng)清并理解語(yǔ)音中的信息,需要耗費(fèi)我們大腦的資源,而且語(yǔ)音播放之后就消失了,也加重了用戶(hù)的記憶負(fù)擔(dān)。
所以不能只依賴(lài)于語(yǔ)音的輸出方式,也不僅僅依賴(lài)于當(dāng)前的輸出渠道。采用視頻、圖片、聲音等多種形態(tài)的輸出方式甚至跨終端的輸出渠道(比如某些場(chǎng)景在手表輸入在手機(jī)、電視顯示反饋結(jié)果等),可以極大地豐富我們反饋的多樣性、提高信息傳達(dá)的效率,避免用戶(hù)需要在不同端之間來(lái)回處理信息。
照顧人類(lèi)情緒,保持禮貌,具備服從指令的屬性
比如這樣的對(duì)話【Q:可以朗誦一首唐詩(shī)嗎?A:不可以】會(huì)讓人覺(jué)得別扭、受挫。
如果無(wú)法做到,也應(yīng)該表達(dá)歉意并且說(shuō)明愿意來(lái)安慰用戶(hù)。比如【A:不好意思,當(dāng)前網(wǎng)絡(luò)狀態(tài)不可用,請(qǐng)檢查網(wǎng)絡(luò)設(shè)置后再次嘗試吧】
話輪轉(zhuǎn)換
對(duì)話是一種相互合作,必須有來(lái)有回,實(shí)用的對(duì)話讓對(duì)話雙方知道該誰(shuí)說(shuō)話。
設(shè)定用戶(hù)的期望,讓用戶(hù)知道什么時(shí)候可以輪換到自己、輸入是否生效等。方法包括隱性確認(rèn)(在回答時(shí)帶上用戶(hù)提供的信息)、非語(yǔ)言確認(rèn)(使用燈光、圖像、震動(dòng)、提示音等進(jìn)行反饋)等。

4.2.2.4 VUI/LUI

VUI,Voice User Interface,語(yǔ)音用戶(hù)交互界面。LUI,Language User Interface,語(yǔ)言用戶(hù)交互界面。是基于語(yǔ)音/語(yǔ)言作為輸入與輸出的交互方式。
嚴(yán)格來(lái)說(shuō),VUI/LUI是對(duì)話式交互形態(tài)之一。因?yàn)閷?duì)話式交互的核心在于一來(lái)一回的對(duì)話,輸入輸出的可能并不只有語(yǔ)音、文字,可以容納更多的內(nèi)容形式。

 

對(duì)話式交互

優(yōu)點(diǎn)
  • 自然流暢、學(xué)習(xí)成本足夠低。因?yàn)閷?duì)話是從我們出生開(kāi)始就伴隨我們的交流方式,對(duì)話式的交互和人與人之間的溝通相似,無(wú)需教學(xué)就會(huì)使用。

  • 從輸入效率的角度而言,語(yǔ)音輸入比鍵盤(pán)打字的速度更快。

  • 解放雙手,在雙手被占用的情況下,可以拓展交互的渠道。

  • 語(yǔ)音中包含語(yǔ)氣、語(yǔ)調(diào)、語(yǔ)速等情緒性信息,如果能夠識(shí)別這些附屬的信息,也就拓寬了信息接收的渠道。

  • 減少對(duì)于導(dǎo)航的依賴(lài),減少用戶(hù)的記憶負(fù)擔(dān)、認(rèn)知負(fù)擔(dān)
缺點(diǎn)
  • 視覺(jué)通道和聽(tīng)覺(jué)通道的信息融合要優(yōu)于單獨(dú)的視覺(jué)通道和聽(tīng)覺(jué)通道。對(duì)于多步驟、多字段的操作,如果完全依賴(lài)于對(duì)話式交互,所需的對(duì)話次數(shù)將會(huì)過(guò)多,影響整個(gè)動(dòng)作的效率。這時(shí)候就需要用戶(hù)意圖預(yù)測(cè)、沿用典型模板、結(jié)合其他通道(屏幕點(diǎn)擊、手勢(shì)、實(shí)體按鈕、位置等)操作等方式來(lái)簡(jiǎn)化所需的信息量或者多通道融合獲取信息。

  • 容易受到周?chē)胍舻母蓴_。

  • 隱私問(wèn)題,在公共場(chǎng)合使用語(yǔ)音輸入容易泄露隱私或者影響到其他人。

  • 公共場(chǎng)合之下對(duì)著手機(jī)說(shuō)話,有可能會(huì)引發(fā)社會(huì)恥辱感。所以,新的類(lèi)型的產(chǎn)品往往需要通過(guò)明星效應(yīng)、營(yíng)銷(xiāo)來(lái)形成一種風(fēng)尚,引導(dǎo)人們使用。

4.2.3 NUI

NUI充分利用我們生活在這個(gè)世界中獲得的技能,最大限度地減少認(rèn)知負(fù)擔(dān),從而最大限度地減少對(duì)于注意力的分散。(NUIs  exploit skills that we have acquired through a lifetime of living in the world, which minimizes the cognitive load and therefore minimizes the distraction.)——Bill Buxton, a principal researcher at Microsoft
自然用戶(hù)界面(Natural user interface,NUI)。維基百科對(duì)于NUI的描述是人們以最自然的交流方式與機(jī)器互動(dòng),使用NUI的計(jì)算機(jī)不需要鍵盤(pán)或鼠標(biāo)。
相比于傳統(tǒng)的GUI或者當(dāng)下比較火熱的CUI,NUI更強(qiáng)調(diào)【自然】,也就是以符合人類(lèi)直覺(jué)的方式與計(jì)算機(jī)溝通。不局限于某一種交互方式,而是依據(jù)場(chǎng)景選擇最合適的交互方式。比如在自己家里,使用語(yǔ)音與智能音箱交互。在圖書(shū)館,使用觸控、手勢(shì)與智能手表交互。
NUI最大的核心是以人為中心,讓用戶(hù)可以使用生活中已經(jīng)習(xí)得的技能、經(jīng)驗(yàn)以及已有的心理模型來(lái)與計(jì)算機(jī)交互,極大地減少學(xué)習(xí)成本。因?yàn)槿伺c外界的自然交流本身是多通道的,包含視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、嗅覺(jué)、味覺(jué),也就決定了NUI注定是多模態(tài)的。

4.2.3.1 不完全依賴(lài)于語(yǔ)音

因?yàn)槁曇羯钥v即逝、難以回溯。完全依賴(lài)于語(yǔ)音輸入與輸出的交互方式需要占用用戶(hù)大量的注意力,而我們的注意力往往有限,長(zhǎng)時(shí)間的注意力集中非常消耗人的精力,從而降低了交互的準(zhǔn)確性、影響交互的效率。同時(shí)長(zhǎng)時(shí)間占用用戶(hù)的主要注意力,也讓用戶(hù)無(wú)法同時(shí)做其他的事情。
對(duì)話式交互主要改變的是輸入方式與使用路徑,與現(xiàn)有豐富的、多模態(tài)的反饋形式結(jié)合,可以有效提升人機(jī)交互的效率。除聽(tīng)覺(jué)反饋以外,輸出方式可以是視覺(jué)(指示燈、圖片、視頻等)、觸覺(jué)(震動(dòng)、溫度變化等)。
隨著AI在語(yǔ)音識(shí)別、語(yǔ)義理解等方面能力的進(jìn)步,自然對(duì)話的形式已成為AI產(chǎn)品的主流交互形式。就目前的情況而言,AI還難以捕捉并解讀我們的面部表情、姿勢(shì)、眼神等這些非語(yǔ)言、情緒化、視覺(jué)化的信息。
相信未來(lái),隨著各種傳感器、算法模型的不斷演進(jìn),在我們與機(jī)器對(duì)話時(shí),它不僅能聽(tīng)懂我們的話語(yǔ),也能結(jié)合我們的面部表情、姿勢(shì)、手勢(shì)、眼神等綜合分析。至少在輸入端,讓人與機(jī)器的交互逐漸靠近人與人的交互。有可能就像圖靈所預(yù)測(cè)的,我們難以分辨和我們對(duì)話的到底是一個(gè)人還是一臺(tái)機(jī)器。

4.2.3.2 VUI+GUI

未來(lái)的人工智能系統(tǒng)很可能會(huì)擁有混合用戶(hù)界面,結(jié)合了基于意圖和基于命令的界面元素,同時(shí)保留許多圖形用戶(hù)界面元素。——Jakob Nielsen
凡事皆具兩面性。不同交互形式的目的都是為了減少用戶(hù)的認(rèn)知負(fù)擔(dān)、操作負(fù)擔(dān)、記憶負(fù)擔(dān),不是為了用個(gè)用。結(jié)合用戶(hù)、場(chǎng)景、設(shè)備等特點(diǎn),選用不同的交互形式結(jié)合,最大化地方便用戶(hù)才是最優(yōu)解。

4.2.3.3 多模態(tài)交互

多通道融合交互/多模態(tài)交互,包括語(yǔ)音、面部表情、手勢(shì)、各類(lèi)傳感器所檢測(cè)到的生理信息等都可以作為輸入通道,既可以是用戶(hù)主動(dòng)發(fā)起的,也可以是產(chǎn)品主動(dòng)獲取的。輸出則可以結(jié)合視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、味覺(jué)和嗅覺(jué)多種模態(tài)。核心是圍繞情境選擇合適的交互模式,目標(biāo)是自然、高效。
優(yōu)勢(shì):
  • 多模態(tài)融合不僅是為了符合用戶(hù)自然的操作習(xí)慣,也可以增加信息的處理效率。就像在聽(tīng)演講時(shí),如果演講者結(jié)合PPT進(jìn)行圖示化說(shuō)明,就更容易、更快速地讓人理解。

  • 多模態(tài)交互充分調(diào)動(dòng)人的五感,結(jié)合AR、VR、MR等技術(shù),將數(shù)字世界與物理世界有機(jī)結(jié)合,可以提供更好的真實(shí)感、臨場(chǎng)感、沉浸感。

  • 減少對(duì)于個(gè)人能力的要求,讓老人、殘疾人等特殊群體也可以輕松、便捷地使用,踐行通用設(shè)計(jì)的原則,促進(jìn)社會(huì)的和諧。

4.2.3.4 基于意圖的結(jié)果規(guī)范化(Intent-Based Outcome Specification )

這是雅各布·尼爾森提出的一種新的交互范式,詳見(jiàn):https://www.nngroup.com/articles/ai-paradigm/
以前是設(shè)計(jì)產(chǎn)品的能供性(Affordance)來(lái)引導(dǎo)用戶(hù)操作,比如按鈕代表可點(diǎn)擊。現(xiàn)在是計(jì)算機(jī)要來(lái)理解人的意符(Signifiers),比如抬起手臂,手機(jī)自動(dòng)點(diǎn)亮屏幕,因?yàn)樗聹y(cè)你可能需要開(kāi)始使用手機(jī)。
NUI側(cè)重于交互方式的自然化,基于意圖的結(jié)果規(guī)范化側(cè)重于對(duì)于用戶(hù)意圖的反應(yīng)。一個(gè)是方式,一個(gè)是目的,二者的核心都是讓計(jì)算機(jī)圍繞人來(lái)進(jìn)行改變,減少人們對(duì)認(rèn)知負(fù)擔(dān)、記憶負(fù)擔(dān)、操作負(fù)擔(dān),提高人的效率,豐富人的生活。

4.3 交互特征的變化

4.3.1 交互層級(jí)的壓縮

功能架構(gòu)更加扁平對(duì)應(yīng)的就是交互層級(jí)的壓縮。通過(guò)對(duì)話直接調(diào)起某個(gè)特定的功能,不需要在一層一層的功能結(jié)構(gòu)中去尋找。每一個(gè)動(dòng)作都是直達(dá)目的,減少了很多尋找功能過(guò)程中的過(guò)渡操作。

4.3.2 界面的減少

一方面,NUI結(jié)合多種輸入輸出方式,不再單純依賴(lài)于界面的呈現(xiàn),語(yǔ)音、提示音、燈光、震動(dòng)等多種形式的反饋會(huì)替換部分界面的反饋。另一方面,對(duì)話式的交互減少了很多承載功能的頁(yè)面如導(dǎo)航頁(yè)、工作臺(tái)等。

4.3.2.1 按鈕的減少

按鈕是基于界面存在的,目的在于觸發(fā)一個(gè)動(dòng)作。一方面,卡片等元素本身可以充當(dāng)按鈕。另一方面,NUI帶來(lái)的多模態(tài)交互,點(diǎn)擊屏幕操作將會(huì)減少,對(duì)按鈕的需求也相應(yīng)的減少了。

4.3.3 主動(dòng)交互增加

產(chǎn)品不再只是被動(dòng)的接受信息,而是可以通過(guò)多模態(tài)感知主動(dòng)獲取信息,并依據(jù)用戶(hù)設(shè)定的目標(biāo)、對(duì)于用戶(hù)的了解進(jìn)行自主決策并觸發(fā)下一步的動(dòng)作,不再需要每一個(gè)任務(wù)都由用戶(hù)來(lái)觸發(fā)。比如汽車(chē)在檢測(cè)到到用戶(hù)遠(yuǎn)離車(chē)輛時(shí)自動(dòng)鎖車(chē)。智能音箱會(huì)在天氣預(yù)報(bào)有雨時(shí)提醒用戶(hù)出門(mén)記得帶傘。
主動(dòng)交互減少了用戶(hù)的操作負(fù)擔(dān),提高了人機(jī)協(xié)同的效率,也讓產(chǎn)品顯得更加貼心。

4.3.3.1 分析用戶(hù)的意圖

用戶(hù)的行為數(shù)據(jù)、個(gè)人習(xí)慣與偏好等通過(guò)AI Agent這個(gè)統(tǒng)一的交互入口被全面、完整、準(zhǔn)確地獲取,結(jié)合AI Agent所記憶的上下文信息以及各種傳感器所獲取到的場(chǎng)景信息,對(duì)用戶(hù)意圖對(duì)分析將更加準(zhǔn)確。也就是可以通過(guò)預(yù)測(cè)用戶(hù)的下一步行為,主動(dòng)提前幫助用戶(hù)完成。有點(diǎn)類(lèi)似于想要喝水的時(shí)候,杯子里總是有溫度適宜的水。

4.4 AI的“人設(shè)”

4.4.1 人設(shè)是什么

人設(shè)是指用戶(hù)在與AI產(chǎn)品互動(dòng)過(guò)程中,根據(jù)感知到的信息(虛擬形象、文本或者語(yǔ)音中的語(yǔ)氣、語(yǔ)調(diào)、音色、情緒等)將AI對(duì)象人格化后所建立的一種對(duì)于AI的角色形象認(rèn)知。比如,掃地機(jī)器人在電量不足時(shí),發(fā)出語(yǔ)音:“沒(méi)能量啦,我要回去吃飯了。”在用戶(hù)詢(xún)問(wèn)“你在哪里”時(shí),回應(yīng)“我在這里”。都可以讓人感覺(jué)到它是一個(gè)有溫度、有感情的個(gè)體而不是一個(gè)冰冷的機(jī)器。這是一種心理上的簡(jiǎn)化行為,避免“恐怖谷”效應(yīng)。
人設(shè)使得產(chǎn)品的個(gè)性更加鮮明、突出,用戶(hù)與產(chǎn)品交互時(shí)能夠獲得“伙伴感”以及交流的愉悅感,有助于拉近產(chǎn)品與用戶(hù)之間的心理距離。

4.4.2 人設(shè)設(shè)定的原則

4.4.2.1 一致性

角色的設(shè)定要與產(chǎn)品/內(nèi)容的屬性一致。比如法律、政治新聞等嚴(yán)肅性?xún)?nèi)容,就不適合使用呆萌、可愛(ài)的角色。
作為服務(wù)于人類(lèi)的產(chǎn)品,在于用戶(hù)對(duì)話時(shí),應(yīng)該保持前后一致、穩(wěn)定的形象。如果前后的回答反差太大會(huì)讓人覺(jué)得產(chǎn)品出錯(cuò)了。

4.4.2.2 有禮貌

同時(shí)要注意禮貌。比如要及時(shí)回答用戶(hù)的問(wèn)題,不能敷衍了事,不能指責(zé)用戶(hù)。即便用戶(hù)苛刻、生氣,角色也應(yīng)該體現(xiàn)出禮貌、謙遜、關(guān)懷。

4.4.2.3 情感性

感知到人類(lèi)的情緒,并給出恰當(dāng)?shù)摹Ⅲw貼的回應(yīng)。用戶(hù)因此而與產(chǎn)品之間形成情感依戀,增強(qiáng)整體的使用體驗(yàn)。

4.4.2.4 幽默性

使用象征、諷喻、雙關(guān)等手法,讓人感受到愉悅、有趣,給予用戶(hù)類(lèi)似真實(shí)的社交體驗(yàn)。使AI的形象更加靈活、生動(dòng)、富有人情味,而不再是冰冷的機(jī)器。

4.4.2.5 個(gè)性化

針對(duì)不同的用戶(hù)特征(年齡、職業(yè)等),也可以針對(duì)性地提供不同的角色設(shè)定。

4.4.3 人設(shè)性格的體現(xiàn)方式

聲音的音色、語(yǔ)速、節(jié)奏、表述的方式/語(yǔ)氣、頭像都能體現(xiàn)出AI的性格特征。

4.4.4 人設(shè)性格的設(shè)定方法

與品牌/產(chǎn)品人設(shè)設(shè)定的方法類(lèi)似,使用情緒板moodboard,結(jié)合商業(yè)目標(biāo)、產(chǎn)品目標(biāo)來(lái)發(fā)散人設(shè)的關(guān)鍵詞,比如客戶(hù)希望以什么形容詞來(lái)描述產(chǎn)品、用戶(hù)喜歡什么樣的人設(shè)。然后通過(guò)篩選、整合,選擇最具有代表性的形容詞,以可視化的方式呈現(xiàn)。然后與Persona類(lèi)似,固化名字、職位、年齡、性別、行為習(xí)慣、愛(ài)好等特征。
人設(shè)設(shè)定好以后,所有的行為(語(yǔ)氣、語(yǔ)速、表達(dá)方式等)、外觀(表情、頭像、虛擬形象等等)都圍繞人設(shè),從而強(qiáng)化這一形象在用戶(hù)心中的印象。并在用戶(hù)測(cè)試中優(yōu)化迭代。

5 AI能力加持后,產(chǎn)品設(shè)計(jì)應(yīng)該注意的原則

目前比較系統(tǒng)的提出AI產(chǎn)品設(shè)計(jì)原則都有MicroSoft、Google、SAP、IBM幾家公司(原文檔見(jiàn)文后參考鏈接)。總體而言,設(shè)計(jì)原則中不變的是以人為本的核心,變化的是如何以人為本、如何更好地以人為本。

5.1 明確傳遞系統(tǒng)可以做什么

做出說(shuō)明、給出推薦等,幫助用戶(hù)明白 AI 系統(tǒng)能夠幫助自己解決何種問(wèn)題。
提供框架與制約因素,引導(dǎo)用戶(hù)迅速展開(kāi)行動(dòng),避免用戶(hù)在面對(duì)完全空白的頁(yè)面時(shí),腦海中思緒過(guò)多且無(wú)法集中,不知從何著手。

5.1.1 說(shuō)明系統(tǒng)能做到多好

幫助用戶(hù)了解AI系統(tǒng)犯錯(cuò)的頻率,讓用戶(hù)對(duì)產(chǎn)品形成合適的預(yù)期。使用諸如【我們認(rèn)為你可能會(huì)喜歡】來(lái)介紹推薦的音樂(lè),會(huì)讓人更能包容錯(cuò)誤。

5.2 基于具體場(chǎng)景和時(shí)間提供服務(wù)

根據(jù)用戶(hù)當(dāng)前的任務(wù)和環(huán)境判斷何時(shí)該觸發(fā)行為或中斷行為。
比如檢測(cè)到用戶(hù)在行走過(guò)程中,手表自動(dòng)記錄步數(shù)。假設(shè)用戶(hù)剛剛查詢(xún)過(guò)去往目的地的路線,則自動(dòng)進(jìn)入步行導(dǎo)航模式。比如當(dāng)時(shí)間為半夜時(shí),語(yǔ)音助手在回答問(wèn)題時(shí)主動(dòng)降低音量。

5.2.1 記住前后文

記住用戶(hù)最近的交互行為。保持短期記憶并允許用戶(hù)高效引用。比如用戶(hù)說(shuō):搜索【歌手李健】,在AI給出結(jié)果后,用戶(hù)說(shuō):播放他的歌曲。這時(shí)候產(chǎn)品就應(yīng)該播放李健的歌曲而不是再次詢(xún)問(wèn)用戶(hù)播放誰(shuí)的歌曲。

5.2.1.1 顯示與上下文相關(guān)的信息

顯示與用戶(hù)當(dāng)前任務(wù)和環(huán)境相關(guān)的信息。比如用戶(hù)詢(xún)問(wèn)【天氣情況】時(shí),在結(jié)果中表明是今天、當(dāng)前位置的天氣情況。

5.2.2 記住關(guān)于用戶(hù)的信息

記住用戶(hù)的個(gè)人偏好、行為習(xí)慣等,主動(dòng)推送/建議,減少用戶(hù)的重復(fù)操作。類(lèi)似于登錄之后的個(gè)性化推薦。

5.2.2.1 從用戶(hù)的行為中學(xué)習(xí)

不斷學(xué)習(xí)用戶(hù)過(guò)往的操作來(lái)個(gè)性化用戶(hù)體驗(yàn),與用戶(hù)建立更加親密的聯(lián)系。類(lèi)似于推薦算法,推薦的是用戶(hù)感興趣、可能會(huì)用到的功能、信息。比如用戶(hù)總是在每天的同一時(shí)刻打開(kāi)同一個(gè)APP,iPhone會(huì)在用戶(hù)下次這個(gè)時(shí)間點(diǎn)解鎖手機(jī)時(shí)推薦這個(gè)APP。

5.2.2.2 鼓勵(lì)用戶(hù)反饋

讓用戶(hù)能夠在與人工智能系統(tǒng)的定期互動(dòng)中提供反饋,表明自己的偏好。也就是產(chǎn)品不僅可以主動(dòng)學(xué)習(xí)用戶(hù)的行為,還可以讓用戶(hù)主動(dòng)告訴產(chǎn)品自己喜歡什么、習(xí)慣什么。

5.2.3 機(jī)器主動(dòng)感知

通過(guò)各類(lèi)傳感器實(shí)時(shí)感知周?chē)h(huán)境、人的行為,以此更好地為人類(lèi)服務(wù)。不需要用戶(hù)主動(dòng)發(fā)出指令,就可以結(jié)合以往的使用習(xí)慣進(jìn)行意圖判斷,主動(dòng)推送/發(fā)起流程。

5.2.3.1 平靜技術(shù)

交流不是為了體現(xiàn)技術(shù)設(shè)備的能力,而是為了滿(mǎn)足用戶(hù)需求。——《交互的未來(lái)》
因?yàn)槿藗兊淖⒁饬κ怯邢薜模且环N寶貴的資源。應(yīng)該讓人把注意力放在真正重要的事情上。如果各個(gè)產(chǎn)品一直大聲的吆喝,不停地爭(zhēng)奪用戶(hù)的注意力,那么重要的事情有可能會(huì)被淹沒(méi)。
在用戶(hù)需要時(shí),能夠及時(shí)響應(yīng)甚至提前預(yù)判,提高效率與流暢度。用戶(hù)不需要時(shí),不要過(guò)多的干擾用戶(hù),避免產(chǎn)品/技術(shù)本身引起太多的注意。類(lèi)似于微信產(chǎn)品經(jīng)理張小龍之前提出【用完即走】 的理念,產(chǎn)品是服務(wù)于人的,不能成為負(fù)擔(dān),而是要減輕人的負(fù)擔(dān)。

5.3 建立信任、不要讓用戶(hù)失去控制感

由于AI的不可解釋性、自主決策,用戶(hù)必然會(huì)對(duì)其有所顧慮。所以讓用戶(hù)建立起對(duì)于AI的信任感,是人類(lèi)與AI深度協(xié)同的重要前提。
信任是有粘性的,如果用戶(hù)信任一項(xiàng)服務(wù),可能會(huì)選擇一直信任。反之,如果用戶(hù)不信任,可能會(huì)一直選擇不信任。
信任對(duì)于用戶(hù)是否會(huì)采用至關(guān)重要。不信任會(huì)蔓延,一個(gè)功能的不信任會(huì)影響對(duì)于整體或者所有類(lèi)似產(chǎn)品的不信任。比如Siri就降低了人們對(duì)于所有手機(jī)語(yǔ)音助手的信任度。
人類(lèi)對(duì)機(jī)器的信任依賴(lài)于可靠性與安全性、可控性、清晰透明、一致性。

5.3.1 可靠性與安全性

要使 AI 系統(tǒng)受信任,它們需要可靠且安全。系統(tǒng)必須像設(shè)計(jì)好的那樣運(yùn)行,并安全響應(yīng)新的情況。其固有的復(fù)原能力應(yīng)能抵御預(yù)期操作或意外操作。

5.3.1.1 準(zhǔn)確、及時(shí)

信任由積極的體驗(yàn)構(gòu)成。頻繁的犯錯(cuò)、延遲、不可用,讓用戶(hù)遭遇多次失敗、挫折,會(huì)降低用戶(hù)對(duì)產(chǎn)品的信心與信任。
與實(shí)際的人相比,人們對(duì)于機(jī)器犯錯(cuò)的容忍度更低。

5.3.1.2 用戶(hù)數(shù)據(jù)權(quán)利

提供通知和同意的機(jī)制,允許用戶(hù)拒絕服務(wù)或數(shù)據(jù)。隱私設(shè)置和權(quán)限應(yīng)該清晰、可查找且可調(diào)整。
充分披露個(gè)人信息的使用或共享方式。對(duì)數(shù)據(jù)的用途、使用范圍提供詳細(xì)的說(shuō)明。
用戶(hù)應(yīng)始終控制正在使用的數(shù)據(jù)以及選擇在什么情況下使用。他們可以拒絕AI訪問(wèn)他們認(rèn)為可能會(huì)受到損害或不適合人工智能了解或使用的個(gè)人數(shù)據(jù)。
保護(hù)用戶(hù)的隱私與數(shù)據(jù)安全。當(dāng)個(gè)人詳細(xì)信息(例如地址)可能作為人工智能預(yù)測(cè)的一部分而暴露時(shí),采取額外措施來(lái)保護(hù)隱私(例如,匿名化姓名,即使人們同意使用他們的名字)。保護(hù)個(gè)人隱私,遵守機(jī)器人三定律等。

5.3.2 可控性

5.3.2.1 由用戶(hù)控制

AI的底層原則是強(qiáng)化人的能力,而不是取代人。輔助用戶(hù)決策,簡(jiǎn)化用戶(hù)的負(fù)擔(dān)。
從簡(jiǎn)單、獨(dú)立的任務(wù)開(kāi)始,讓用戶(hù)相信、適應(yīng)AI的能力。同時(shí),可以提供預(yù)測(cè)、建議,但是應(yīng)該由用戶(hù)來(lái)做最終的決策。如果產(chǎn)品決策完以后再通知用戶(hù),會(huì)讓用戶(hù)感覺(jué)失去主導(dǎo)權(quán)或者被產(chǎn)品所控制。
當(dāng)用戶(hù)提出的訴求有歧義時(shí),給用戶(hù)提供選項(xiàng)或者調(diào)整的機(jī)會(huì)來(lái)逐步明確目標(biāo)。比如用戶(hù)說(shuō)想聽(tīng)【如愿】這首歌曲,搜索結(jié)果有好幾個(gè)版本,這時(shí)候讓用戶(hù)選擇一個(gè),或者在播放開(kāi)始時(shí)提示用戶(hù)可以主動(dòng)更換。
提供全局控制,允許用戶(hù)全局自定義人工智能系統(tǒng)的監(jiān)控內(nèi)容和行為方式。

5.3.2.2 可以輕松的調(diào)用與關(guān)閉

在需要時(shí)能夠易于啟用。比如使用【Hi,Siri】來(lái)隨時(shí)激活iPhone的語(yǔ)音助手。
出錯(cuò)時(shí)能輕松回退、編輯、改進(jìn)或恢復(fù)。能夠隨時(shí)退出,類(lèi)似于安全艙設(shè)計(jì)理念。

5.3.3 清晰透明

5.3.3.1 真誠(chéng)

標(biāo)記AI生成的內(nèi)容,讓用戶(hù)心里有數(shù),保持誠(chéng)信。

5.3.3.2 可解釋性

清楚地說(shuō)明系統(tǒng)為什么這樣做。提供解釋說(shuō)明,讓用戶(hù)知曉AI做出決策的原因(一般是基于決策所帶來(lái)的好處,當(dāng)用戶(hù)對(duì)底層技術(shù)感興趣時(shí),通過(guò)漸進(jìn)式披露的方式來(lái)提供更多詳細(xì)的信息)?;蛘呷绻l(fā)生錯(cuò)誤,解釋哪里出了問(wèn)題。
由于AI對(duì)于普通用戶(hù)來(lái)說(shuō)就像一個(gè)黑盒,可解釋性可幫助數(shù)據(jù)科學(xué)家、審核員和業(yè)務(wù)決策者確保 AI 系統(tǒng)能夠證明其決策及其得出結(jié)論的方式,建立公眾對(duì)顛覆性技術(shù)的信心,促進(jìn)更安全的實(shí)踐,并促進(jìn)更廣泛的社會(huì)采用。
可解釋性還有助于確保符合公司政策、行業(yè)標(biāo)準(zhǔn)和政府法規(guī)。

5.3.3.3 通知用戶(hù)

謹(jǐn)慎的更新和修改,添加或更新其功能時(shí)要通知用戶(hù)。在更新和調(diào)整人工智能系統(tǒng)行為時(shí),限制破壞性變化,讓用戶(hù)能夠適應(yīng)變化。
傳達(dá)用戶(hù)行為的后果,及時(shí)更新或傳達(dá)用戶(hù)行為將如何影響人工智能系統(tǒng)的未來(lái)行為。

5.3.3.4 一致性

一致性讓AI的行為可預(yù)期,有助于用戶(hù)建立心智模型,減少因?yàn)锳I能力黑盒帶來(lái)的不可知,增加用戶(hù)的掌控感。

5.4 符合社會(huì)規(guī)范、減少偏見(jiàn)

5.4.1 公平

錯(cuò)誤的數(shù)據(jù)會(huì)帶來(lái)錯(cuò)誤的認(rèn)知。如果AI預(yù)訓(xùn)練的數(shù)據(jù)中存在偏見(jiàn),那么AI可能也會(huì)產(chǎn)生偏見(jiàn)。
建立倫理道德規(guī)范,減少社會(huì)偏見(jiàn)。由于現(xiàn)實(shí)世界的數(shù)據(jù)中難免包含帶有種族歧視等社會(huì)偏見(jiàn)的意向,需確保人工智能系統(tǒng)的語(yǔ)言和行為不會(huì)強(qiáng)化不良和不公平的成見(jiàn)和偏見(jiàn),特別是那些與種族、民族、性別、國(guó)籍、收入、性取向、能力以及政治或宗教信仰等敏感特征相關(guān)的偏見(jiàn)。

5.4.2 國(guó)際化/在地化

根據(jù)用戶(hù)的社會(huì)和文化背景,確保以用戶(hù)期望的方式提供體驗(yàn)。國(guó)際化的產(chǎn)品要尊重當(dāng)?shù)氐奈幕?、風(fēng)俗習(xí)慣、宗教信仰等。

5.5 擬人化

社會(huì)語(yǔ)言學(xué)家的研究表明即使是極少的語(yǔ)音樣本,也會(huì)讓人產(chǎn)生對(duì)于演講者性格、形象方面的印象。我們?cè)缫堰M(jìn)化成可以根據(jù)人的聲音來(lái)總結(jié)評(píng)判別人的專(zhuān)家。——《谷歌是怎么設(shè)計(jì)AI語(yǔ)音界面的?這里總結(jié)了對(duì)話設(shè)計(jì)六大原則》
人與AI的對(duì)話式交互,就像人與人之間的交流一樣。用戶(hù)能夠這種擬人化的對(duì)話中獲得“伙伴感”以及交流的愉悅感,拉近了人工智能與用戶(hù)的心理距離,大大降低了用戶(hù)使用人工智能的心理抗拒程度,從而形成品牌或產(chǎn)品和顧客間的情感紐帶,強(qiáng)化用戶(hù)與該品牌之間的關(guān)系。

6 AI產(chǎn)品發(fā)展過(guò)程分析

能力的發(fā)展會(huì)推動(dòng)產(chǎn)品形態(tài)的變革,就像是通信網(wǎng)絡(luò)、智能手機(jī)催生出了無(wú)數(shù)的APP,讓微信視頻聊天、實(shí)時(shí)看直播成為可能一樣。AI能力的發(fā)展也會(huì)拓寬AI產(chǎn)品的邊界、豐富AI產(chǎn)品的形態(tài)。

6.1 從能力發(fā)展看

人工智能的主要發(fā)展方向:運(yùn)算智能、感知智能、認(rèn)知智能。
  • 計(jì)算智能:計(jì)算智能是人工智能發(fā)展的最初階段,主要是指機(jī)器對(duì)信息進(jìn)行存儲(chǔ)和計(jì)算的能力。在這個(gè)階段,機(jī)器主要進(jìn)行簡(jiǎn)單的數(shù)據(jù)處理和計(jì)算任務(wù),缺乏更深層次的理解和學(xué)習(xí)能力。這部分主要是模型計(jì)算能力的提升。

  • 感知智能:感知智能是人工智能發(fā)展的第二階段,指機(jī)器具備感知世界的能力,包括視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感知方式。這讓機(jī)器能夠更好地理解周?chē)h(huán)境和與之進(jìn)行交互,但仍缺乏深層次的思考和推理能力。這部分主要是多模態(tài)感知能力的提升。

  • 認(rèn)知智能:認(rèn)知智能是人工智能發(fā)展的最高階段,指機(jī)器具備類(lèi)似人類(lèi)的認(rèn)知能力,包括學(xué)習(xí)、推理、記憶和理解等方面。在這個(gè)階段,機(jī)器可以自主地進(jìn)行學(xué)習(xí)和思考,具有更高級(jí)的智能表現(xiàn)。這部分主要是模型能夠自主學(xué)習(xí)、調(diào)整、優(yōu)化。

6.2 從產(chǎn)品角度看

6.2.1 一個(gè)趁手的工具

利用AI的運(yùn)算智能、感知智能,在任務(wù)全流程的某一個(gè)任務(wù)中引入AI能力,解決各類(lèi)業(yè)務(wù)場(chǎng)景中出現(xiàn)的問(wèn)題?;蛘吒鶕?jù)不同領(lǐng)域、職業(yè)等特定場(chǎng)景,打造垂直領(lǐng)域的AI而不是通用型的解決方案。比如使用人臉識(shí)別技術(shù)分析學(xué)生上直播課的表情,判斷學(xué)生的學(xué)習(xí)狀態(tài),及時(shí)提醒老師關(guān)注,促進(jìn)學(xué)生高效學(xué)習(xí)。
人智結(jié)合,任務(wù)還是由人來(lái)主導(dǎo),AI作為像錘子一樣的工具,主要是執(zhí)行指令,成為用戶(hù)的助手,提高操作效率,幫助用戶(hù)節(jié)省時(shí)間。比如內(nèi)容創(chuàng)作平臺(tái)的編輯器,可以讓作者利用AI助手優(yōu)化文章表達(dá),但是沒(méi)法從頭到尾寫(xiě)一篇符合用戶(hù)高要求的文章。

 

圖片來(lái)源:unsplash

6.2.2 成為現(xiàn)代“電力”

通過(guò)軟硬結(jié)合的形式,連接起各個(gè)產(chǎn)品,產(chǎn)品之間借助各自的AI Agent互相溝通,形成統(tǒng)一的生態(tài)。這樣的話,AI就在我們的生活環(huán)境中無(wú)處不在,滲透到每一個(gè)角落,集成各類(lèi)行為數(shù)據(jù)進(jìn)行分析,提供綜合、全面、貼心的服務(wù)。比如最常見(jiàn)的智能家居場(chǎng)景,門(mén)鎖通過(guò)人臉識(shí)別為主人開(kāi)門(mén),同時(shí)把客廳的燈打開(kāi)。用戶(hù)坐到沙發(fā)上之后,用語(yǔ)音控制打開(kāi)電視,客廳的燈光則自動(dòng)調(diào)整到適合看電視的模式。

 

圖片來(lái)源:unsplash

6.2.3 一個(gè)管家/私人助理

認(rèn)知智能讓AI學(xué)會(huì)自主預(yù)判、創(chuàng)造、決策,接管人類(lèi)生活的瑣碎事情。打造個(gè)人專(zhuān)屬的AI,借助信息通信,從用戶(hù)相關(guān)的每一個(gè)產(chǎn)品中獲取信息,綜合分析,幫助用戶(hù)做出決策。這個(gè)AI助理熟悉用戶(hù)方方面面的習(xí)慣,通過(guò)用戶(hù)的行為分析主動(dòng)去對(duì)接各個(gè)產(chǎn)品、能力,從而實(shí)現(xiàn)完全的個(gè)性化。
比如一個(gè)獨(dú)居老人,手環(huán)、心臟監(jiān)測(cè)裝置等檢測(cè)到用戶(hù)可能會(huì)身體不適,提前通過(guò)智能音箱、手機(jī)等提示用戶(hù)去往醫(yī)院檢查。用戶(hù)乘坐自動(dòng)駕駛等汽車(chē)到達(dá)醫(yī)院后,AI助理已經(jīng)幫助用戶(hù)掛號(hào),并將過(guò)往的數(shù)據(jù)發(fā)給醫(yī)院的AI醫(yī)生。醫(yī)護(hù)人員根據(jù)AI醫(yī)生的建議,直接安排檢查、治療方案。老人出院后,AI醫(yī)生將醫(yī)囑傳送給老人的AI助理,由它來(lái)提醒老人每天按時(shí)吃藥。

 

圖片來(lái)源:unsplash

7 AI與現(xiàn)有產(chǎn)品的融合模式分析

從與現(xiàn)有產(chǎn)品的結(jié)合程度而言,大致應(yīng)該是AI部分介入作為輔助——AI主導(dǎo)功能——完全AI化。

7.1 從融合程度看

7.1.1 單點(diǎn)嵌入

在局部增加AI能力,比如嵌入到某一個(gè)按鈕中、在原界面增加一個(gè)小入口、在評(píng)論區(qū)/聊天窗口使用AT等方式呼出AI助理。這樣可以在保持原有用戶(hù)習(xí)慣的基礎(chǔ)上逐步培養(yǎng)用戶(hù)的習(xí)慣。
需要對(duì)場(chǎng)景進(jìn)行細(xì)致地分析,也就是應(yīng)該在什么場(chǎng)景下提示用戶(hù)產(chǎn)品所具有的AI能力。比如文檔類(lèi)產(chǎn)品,可以自動(dòng)生成文章大綱?;蛘咴谟脩?hù)選擇一段文字后,編輯菜單中會(huì)出現(xiàn)【AI改寫(xiě)】的入口。

 

單點(diǎn)嵌入

7.1.2 模塊嵌入

劃分出專(zhuān)門(mén)的一塊功能區(qū),比如頁(yè)面增加一個(gè)tab、或者做一個(gè)獨(dú)立的模塊、或者下拉后進(jìn)入AI對(duì)話模式。這樣的好處是加入AI后,對(duì)原有的頁(yè)面影響不大,同時(shí)又會(huì)比較醒目,讓用戶(hù)快速感知。
比如FigJam AI,通過(guò)一個(gè)懸浮框來(lái)引導(dǎo)用戶(hù)使用。

 

Figma界面截圖

7.1.3 半獨(dú)立

這種是比較常見(jiàn)的一種方式,好處是不破壞原來(lái)的信息結(jié)構(gòu)與頁(yè)面布局,可以更快地融入AI能力。比如懸浮操作球作為入口、瀏覽器插件等。

 

7.1.4 完全獨(dú)立

把AI能力打包,作為一個(gè)統(tǒng)一入口,可以輔助/調(diào)用所有產(chǎn)品,就像是嵌入AI Agent的PC或者手機(jī)一樣。
這樣AI就不是為了增強(qiáng)某一個(gè)產(chǎn)品的能力,而是本身成為一個(gè)能力平臺(tái)/私人助理,類(lèi)似于Siri,可以調(diào)用iPhone內(nèi)的各種應(yīng)用。

7.2 從結(jié)合方式看

以下模式只是基于現(xiàn)有狀況對(duì)未來(lái)發(fā)展方向的一種合理推測(cè)與猜想。

7.2.1 軟硬結(jié)合

7.2.1.1 能力平臺(tái)

在電腦/手機(jī)中嵌入AI Agent ,就像手機(jī)的語(yǔ)音助手一樣,綜合多模態(tài)交互,直接調(diào)起設(shè)備中的各項(xiàng)能力進(jìn)行響應(yīng)。結(jié)合個(gè)人行為數(shù)據(jù)后,不但在對(duì)指令的回應(yīng)方面愈發(fā)契合用戶(hù)的喜好與習(xí)慣,還可以主動(dòng)交互,提高生產(chǎn)效率。
比如用戶(hù)想要看開(kāi)心麻花的電影,那么Agent會(huì)整合各個(gè)應(yīng)用資源供用戶(hù)選擇,或者依據(jù)用戶(hù)的習(xí)慣直接播放用戶(hù)可能感興趣的那一部。
比如在用戶(hù)看論文時(shí),默默幫助用戶(hù)總結(jié)、整理、收集、分類(lèi),用戶(hù)看完幾十篇論文后,不僅可以幫助用戶(hù)橫向?qū)Ρ取⑻崛『诵挠^點(diǎn),還可以幫助用戶(hù)發(fā)現(xiàn)類(lèi)似的論文。用戶(hù)在寫(xiě)作中引用某一原文時(shí),對(duì)應(yīng)生成參考文獻(xiàn)注釋。

7.2.1.2 硬件協(xié)同

AI來(lái)協(xié)調(diào)指揮硬件,讓信息在各個(gè)產(chǎn)品/設(shè)備之間流動(dòng),按照具體場(chǎng)景實(shí)現(xiàn)設(shè)備之間關(guān)聯(lián)的貫通,促進(jìn)各個(gè)設(shè)備之間的高效合作。
比如家庭助理,協(xié)調(diào)家中的各種電器,在下班到家之前調(diào)好空調(diào)溫度、到家后繼續(xù)通過(guò)智能音箱播放在車(chē)上收聽(tīng)的節(jié)目、音樂(lè)等。假設(shè)用戶(hù)訂好了第二天早上的機(jī)票,那家庭助理會(huì)在用戶(hù)回到家后提醒用戶(hù)收拾行李并且定好第二天早上的鬧鐘。
對(duì)于獨(dú)居老人而言,可穿戴設(shè)備會(huì)實(shí)時(shí)監(jiān)控老人的身體狀況并提醒老人按時(shí)服藥。在老人發(fā)生危險(xiǎn)情況時(shí)及時(shí)撥打急救中心電話并為醫(yī)護(hù)人員開(kāi)門(mén)。

7.2.2 物理世界與數(shù)字世界的融合

結(jié)合各類(lèi)傳感器,AI可以更全面的收集關(guān)于物理世界的各類(lèi)信息。同時(shí),利用XR(VR, AR, MR)、具身智能(Embodied Artificial Intelligence)等技術(shù)等發(fā)展,數(shù)字世界也可以直接影響、操縱物理世界。
物理世界的信息、行為將可以通過(guò)數(shù)字世界進(jìn)行傳輸,也許未來(lái)不僅可以視頻通話看到對(duì)方的樣子,還可以遠(yuǎn)程握手、擁抱等,人與人之間通過(guò)網(wǎng)絡(luò)的聊天就像是面對(duì)面聊天一樣。

7.2.3 數(shù)字孿生

數(shù)字映射(Digital twin),或譯作數(shù)字孿生、數(shù)字分身、數(shù)位雙生,指在信息化平臺(tái)內(nèi)模擬物理實(shí)體、流程或者系統(tǒng),類(lèi)似實(shí)體系統(tǒng)在信息化平臺(tái)中的雙胞胎。比如在醫(yī)療領(lǐng)域,通過(guò)把患者投射成具有生命功能的數(shù)字孿生體,就可以讓AI來(lái)模擬患者對(duì)于各種藥物的反應(yīng),從而為患者選擇最好的治療方案。
在科幻電視《黑鏡》中,技術(shù)人員通過(guò)抽取用戶(hù)的思維,在數(shù)字世界制造一個(gè)用戶(hù)的分身來(lái)作為用戶(hù)的私人助理。因?yàn)橹挥凶约翰抛盍私庾约骸?/section>

 

電視劇《黑鏡》劇照

8 我們?cè)撛趺醋?/strong>

8.1 AI只是手段,關(guān)鍵在于目的

AI可以執(zhí)行【做】這個(gè)過(guò)程,它知道要做什么,但是它不知道為什么要這么做。產(chǎn)品的目的、所需要服務(wù)的人群、所產(chǎn)生的價(jià)值都是由人來(lái)定義的。這些是將所有資源整合起來(lái)的核心。不然,只是通過(guò)AI生成一堆沒(méi)有關(guān)聯(lián)的內(nèi)容,并不能轉(zhuǎn)化為實(shí)際的產(chǎn)品或者服務(wù)。
AI可以解決重復(fù)性、規(guī)則性的工作,但是無(wú)法共情人類(lèi)的情感、理解人類(lèi)情緒、主動(dòng)創(chuàng)造、做出決策。所以需要人類(lèi)與AI攜手合作,充分發(fā)揮各自的優(yōu)勢(shì),

8.1.1 結(jié)合AI能力,幫助項(xiàng)目落地

在產(chǎn)品研發(fā)流程中,需要根據(jù)不同的業(yè)務(wù)需求和場(chǎng)景選擇適合的AI技術(shù),靈活運(yùn)用AI的能力,將AI技術(shù)融入工作流。
比如目前AI生成的內(nèi)容,就像是一個(gè)一個(gè)單獨(dú)的元件,往往不能拿來(lái)直接使用,需要結(jié)合業(yè)務(wù)目的、場(chǎng)景等進(jìn)行調(diào)整、結(jié)合等,達(dá)成業(yè)務(wù)目標(biāo)。就像現(xiàn)在各種設(shè)計(jì)組件庫(kù),也需要結(jié)合實(shí)際的業(yè)務(wù)場(chǎng)景、需要解決的問(wèn)題等靈活選用。

8.2 提升綜合能力,成為雪花形人才

雪花型人才是指多元、復(fù)合型人才,圍繞一個(gè)核心,在多個(gè)領(lǐng)域快速積累知識(shí)和經(jīng)驗(yàn)。知識(shí)之間的交叉、經(jīng)驗(yàn)的遷移、不同行業(yè)之間的借鑒等,有助于快速地給出解決方案、做出決策。
由于AI可以解決很多基礎(chǔ)性、重復(fù)性的工作,拓展個(gè)人的能力邊界,提升個(gè)人產(chǎn)出的效率。那么人有限的精力可以用來(lái)做更多重要的事情,個(gè)人的能力將得到更全面的發(fā)展。也就是把以前用來(lái)練習(xí)與掌握各種軟件、工具的時(shí)間都用于去理解不同領(lǐng)域的知識(shí),并結(jié)合這些知識(shí)指導(dǎo)、使用AI進(jìn)行創(chuàng)作與輸出。

 

雪花型人才

8.2.1 未來(lái)已來(lái),只是分布得不均勻
技術(shù)要找到合適的場(chǎng)景,解決問(wèn)題,適配人性。就像《梁寧-產(chǎn)品思維30講》中所說(shuō)的:未來(lái)已來(lái),只是分布得不均勻。面對(duì)問(wèn)題時(shí),我們可以將多領(lǐng)域知識(shí)、經(jīng)驗(yàn)、技術(shù)、邏輯等遷移互鑒,拓寬自己的視野,通過(guò)類(lèi)比、聯(lián)想獲得更優(yōu)的解決方案。
這需要跨領(lǐng)域的學(xué)習(xí)能力,或者說(shuō)快速熟悉某一個(gè)領(lǐng)域的能力,以及系統(tǒng)性思維。利用AI的快速總結(jié)能力,秉持終身學(xué)習(xí)的理念,將知識(shí)橫向連接,最終成為一個(gè)具有自己獨(dú)特見(jiàn)解的問(wèn)題解決者。

8.2.2 提升軟實(shí)力

8.2.2.1 對(duì)于世界的好奇心

好奇心引領(lǐng)人類(lèi)前行。AI是解決問(wèn)題的工具,而人類(lèi)則通過(guò)提出問(wèn)題來(lái)拓展知識(shí)疆域的邊界。愛(ài)因斯坦曾說(shuō):“提出一個(gè)問(wèn)題往往比解決一個(gè)問(wèn)題更為重要。”提出一個(gè)好問(wèn)題,往往意味著對(duì)事物有著濃厚的興趣、深入的思考、敏銳的洞察。在科學(xué)研究中,一個(gè)具有創(chuàng)新性和前瞻性的問(wèn)題可能會(huì)引發(fā)一系列的研究和探索,從而推動(dòng)整個(gè)領(lǐng)域的發(fā)展。
好奇心是自驅(qū)的動(dòng)力。對(duì)未知充滿(mǎn)好奇,可以提升我們的自我批判能力,助力于我們探索新的未知的領(lǐng)域、拓寬我們的思維邊界,而不是僅僅滿(mǎn)足于當(dāng)前已有的模式。

8.2.2.2 保持人性

AI主要是根據(jù)已有的數(shù)據(jù)、信息進(jìn)行分析或預(yù)測(cè),而人類(lèi)的想象力、直覺(jué)、情感等可以幫助人類(lèi)“無(wú)中生有”,創(chuàng)造那些不曾存在過(guò)的新事物。
信息不發(fā)生串聯(lián)、關(guān)聯(lián)、形成網(wǎng)絡(luò),則只是數(shù)據(jù),而不能稱(chēng)之為知識(shí)。AI可以幫我們快速、準(zhǔn)確地找到各類(lèi)信息與資源,但是讓這些信息轉(zhuǎn)變?yōu)閭€(gè)人的知識(shí)與智慧,還需要人類(lèi)自我的認(rèn)知、分析、整合、思考的努力后形成自己的觀點(diǎn)與理解。
同時(shí),我們能夠運(yùn)用批判性思維來(lái)質(zhì)疑和驗(yàn)證所接收到的信息,保持自我的獨(dú)立性,從而避免盲目接受。

8.2.2.3 溝通能力

所有產(chǎn)品終究都是要為人所服務(wù)的,與人溝通、了解人的需求、確定我們要解決的問(wèn)題,是確立產(chǎn)品目標(biāo)的關(guān)鍵。而產(chǎn)品目標(biāo)是決定我們要做什么、以及怎么做的指導(dǎo)原則,是整個(gè)產(chǎn)品的方向與旗幟。只有產(chǎn)品目標(biāo)明確,產(chǎn)品才有可能獲得成功。
人與AI相比的一大優(yōu)勢(shì)是具有同理心,能夠理解人類(lèi)的情緒、情感,這在與人溝通中發(fā)揮著關(guān)鍵作用,可以設(shè)身處地為他人著想,理解他們的感受和觀點(diǎn),從而分析與理解他們沒(méi)有直接表達(dá)出來(lái)的某些想法。
在溝通中建立信任、鞏固情感、平衡各方利益,與上下游合作推進(jìn)方案落地,是除了產(chǎn)出設(shè)計(jì)方案以外更加重要的能力。

8.2.2.4 對(duì)于業(yè)務(wù)的理解

只有深入理解業(yè)務(wù),才能真正知曉用戶(hù)在業(yè)務(wù)流程中的痛點(diǎn)和期望,從而設(shè)計(jì)出能切實(shí)解決問(wèn)題、提升用戶(hù)體驗(yàn)的產(chǎn)品。
很多B端產(chǎn)品,特別是金融類(lèi)、法律合規(guī)類(lèi)的產(chǎn)品,由于現(xiàn)實(shí)情況、規(guī)則制定多樣化的原因,往往有很多復(fù)雜業(yè)務(wù)場(chǎng)景限制,這些規(guī)則由人制定而且互相牽扯,AI 可能需要大量的訓(xùn)練數(shù)據(jù)和時(shí)間來(lái)學(xué)習(xí)和適應(yīng)。
同時(shí),評(píng)估這些規(guī)則對(duì)于產(chǎn)品的影響,也需要多維度的梳理,并針對(duì)性的解決,確保產(chǎn)品的合規(guī)性和穩(wěn)定性。

8.3 在目前的產(chǎn)品研發(fā)流程中,如何使用AI提效?

就目前的階段而言,人工智能更像是一個(gè)趁手、高效的工具。所以我們使用AI提效的總體原則是:在產(chǎn)品研發(fā)流程的不同階段,選取有價(jià)值的環(huán)節(jié)、AI比較擅長(zhǎng)的部分,利用AI來(lái)強(qiáng)化能力、提高效率。
比如可以使用AI提高我們的搜索效率、助力我們快速獲取各類(lèi)資源,或者輔助我們進(jìn)行一些發(fā)散、總結(jié)、提煉等方面基礎(chǔ)性的思維創(chuàng)造工作,從中獲取一些設(shè)計(jì)靈感與方向。
或者使用AI為決策過(guò)程增加視角的多樣性。基于AI所擁有的不同領(lǐng)域的背景知識(shí),當(dāng)我們向AI尋求建議時(shí),等于有各種類(lèi)型的專(zhuān)業(yè)人士意見(jiàn)可供參考。

8.3.1 產(chǎn)品規(guī)劃

描述產(chǎn)品的目的、場(chǎng)景、用戶(hù)等,由AI給出一定的產(chǎn)品設(shè)計(jì)思路參考,包括對(duì)于產(chǎn)品業(yè)務(wù)流程的優(yōu)化、模塊分類(lèi)、頁(yè)面布局等。

8.3.2 信息架構(gòu)

在組織信息時(shí),可以讓 AI 扮演不同的角色,如用戶(hù)、管理員等,提供類(lèi)似卡片分類(lèi)測(cè)試的結(jié)果以供參考。

8.3.3 提供靈感

在設(shè)計(jì)的雙鉆模型中,當(dāng)具體需要解決的問(wèn)題明確以后,一般需要進(jìn)行創(chuàng)意探索與方案發(fā)散。這時(shí)候可以利用AI所掌握的海量數(shù)據(jù)與遠(yuǎn)超人類(lèi)的計(jì)算能力,快速?lài)L試各種風(fēng)格進(jìn)行對(duì)比,探索各種類(lèi)型的風(fēng)格感覺(jué)。對(duì)于視覺(jué)要求度高的運(yùn)營(yíng)設(shè)計(jì)而言,能夠極大程度地縮減前期風(fēng)格探索所需的時(shí)間。

8.3.4 尋找&生成各類(lèi)資源

增強(qiáng)搜索能力,進(jìn)行資源整合或者生成一些符合業(yè)務(wù)場(chǎng)景的資源。包括不限于競(jìng)品、分析報(bào)告、情緒版、設(shè)計(jì)組件庫(kù)、產(chǎn)品相關(guān)知識(shí)(業(yè)務(wù)、心理學(xué)、設(shè)計(jì)等)、行業(yè)數(shù)據(jù)、展示模板樣機(jī)、插畫(huà)、宣傳海報(bào)等。

8.3.4.1 生成設(shè)計(jì)元素

使用Midjourney等AI圖像生成工具,生成如icon、logo、頭像、虛擬人物、背景、banner、運(yùn)營(yíng)活動(dòng)宣傳插圖等視覺(jué)元素。比如QQ音樂(lè)的不同播放器風(fēng)格,就是AI生成的。

8.3.4.2 AIGC豐富產(chǎn)品

產(chǎn)品中的一些內(nèi)容資源,也可以加入AIGC內(nèi)容。例如電商應(yīng)用中的模特圖片、數(shù)字人虛擬主播、可以發(fā)表話題的虛擬用戶(hù)、可以在群聊/評(píng)論區(qū)隨時(shí)出現(xiàn)的AI助理等。這樣,可以使平臺(tái)內(nèi)容更加豐富、多樣化,以吸引更多的用戶(hù)參與和交流。

8.3.5 優(yōu)化文案

對(duì)文案表達(dá)進(jìn)行潤(rùn)色、優(yōu)化表達(dá)方式、檢查錯(cuò)別字等,包括不限于內(nèi)容示例、說(shuō)明引導(dǎo)文案、反饋提示文案、產(chǎn)品的簡(jiǎn)介、銷(xiāo)售文案、各平臺(tái)的運(yùn)營(yíng)文案、Slogan等。

8.3.6 提煉重點(diǎn)、分析數(shù)據(jù)、撰寫(xiě)材料

把資料整理、數(shù)據(jù)處理這一類(lèi)重復(fù)性的工作交給AI。比如設(shè)計(jì)調(diào)研后,由AI來(lái)產(chǎn)出數(shù)據(jù)分析報(bào)告并總結(jié)、產(chǎn)品匯報(bào)階段用AI先擬定一個(gè)初步的PPT大綱、在用戶(hù)測(cè)試階段用AI幫助制定測(cè)試計(jì)劃、在宣傳策劃階段讓AI撰寫(xiě)視頻腳本等。然后設(shè)計(jì)師再結(jié)合AI初步整理的材料進(jìn)行細(xì)化與完善。

8.3.7 提供決策依據(jù)

設(shè)計(jì)方案完成后,需要對(duì)不同的方案進(jìn)行比對(duì)、測(cè)試、驗(yàn)證等。傳統(tǒng)的用戶(hù)測(cè)試常需要花費(fèi)大量的人力、時(shí)間、金錢(qián)成本。使用AI進(jìn)行初步的分析總結(jié),選擇一種方案上線并在后續(xù)迭代中不斷優(yōu)化,也許是另一種輕量化的解決思路。

9 最后

世界上唯一不變的是變化,我們唯一能做的就是擁抱它。
技術(shù)是產(chǎn)品實(shí)現(xiàn)的重要基礎(chǔ),技術(shù)的變革會(huì)導(dǎo)致產(chǎn)品的形態(tài)發(fā)生改變。因而所有行業(yè)都有可能被AI改造一遍,包括不限于:生產(chǎn)制造、教育、法律、影視傳媒、游戲、醫(yī)療等等。這些改變將是業(yè)務(wù)層面的變革。
人性是產(chǎn)品需求的重要基礎(chǔ),人性不變,需求則不變,改變的只是實(shí)現(xiàn)需求的方式。技術(shù)的發(fā)展應(yīng)該服務(wù)于人類(lèi)的利益,無(wú)論技術(shù)如何演進(jìn),歸根結(jié)底仍需以人本為核心,而不是僅僅追求技術(shù)本身的進(jìn)步。也就是產(chǎn)品以技術(shù)作為實(shí)現(xiàn)手段,圍繞著提高人類(lèi)生活質(zhì)量、實(shí)現(xiàn)人類(lèi)終極自由的目標(biāo)而前進(jìn)。
 
 

藍(lán)藍(lán)設(shè)計(jì)(m.bouu.cn )是一家專(zhuān)注而深入的界面設(shè)計(jì)公司,為期望卓越的國(guó)內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計(jì)B端界面設(shè)計(jì)、桌面端界面設(shè)計(jì)APP界面設(shè)計(jì)、圖標(biāo)定制、用戶(hù)體驗(yàn)設(shè)計(jì)交互設(shè)計(jì)UI咨詢(xún)、高端網(wǎng)站設(shè)計(jì)平面設(shè)計(jì),以及相關(guān)的軟件開(kāi)發(fā)服務(wù),咨詢(xún)電話:01063334945。我們建立了一個(gè)微信群,每天分享國(guó)內(nèi)外優(yōu)秀的設(shè)計(jì),有興趣請(qǐng)加入一起學(xué)習(xí)成長(zhǎng),咨詢(xún)及進(jìn)群請(qǐng)加藍(lán)小助微信ben_lanlan。

WechatIMG27.jpg

關(guān)鍵詞:UI咨詢(xún)、UI設(shè)計(jì)服務(wù)公司軟件界面設(shè)計(jì)公司、界面設(shè)計(jì)公司、UI設(shè)計(jì)公司UI交互設(shè)計(jì)公司、數(shù)據(jù)可視化設(shè)計(jì)公司用戶(hù)體驗(yàn)公司、高端網(wǎng)站設(shè)計(jì)公司、銀行金融軟件UI界面設(shè)計(jì)、能源及監(jiān)控軟件UI界面設(shè)計(jì)、氣象行業(yè)UI界面設(shè)計(jì)軌道交通界面設(shè)計(jì)、地理信息系統(tǒng)GIS UI界面設(shè)計(jì)、航天軍工軟件UI界面設(shè)計(jì)、醫(yī)療行業(yè)軟件UI界面設(shè)計(jì)教育行業(yè)軟件UI界面設(shè)計(jì)、企業(yè)信息化UI界面設(shè)計(jì)、軟件qt開(kāi)發(fā)、軟件wpf開(kāi)發(fā)軟件vue開(kāi)發(fā)

日歷

鏈接

個(gè)人資料

存檔