前言
- 最近幾個月,我有幸加入了公司的研究院工作群,由 CEO親自帶隊,集結了大模型研究組、數(shù)據(jù)組以及后端組、前端組的工程師們,一同攻克公司最新的AI產(chǎn)品的研發(fā)。
- 說實話,現(xiàn)在做AI產(chǎn)品就像在搭一輛行駛中的高鐵——技術迭代的速度快得驚人。在這個日新月異的領域里,今天的"最佳實踐"可能明天就變成了"歷史案例"。上周剛學會的一個技術名詞,這周開會時就已經(jīng)升級成了2.0版本;上午設計的交互流程,下午可能就要因為技術突破而重做;昨天還在糾結的技術限制,今天可能就被新框架解決了;產(chǎn)品經(jīng)理的需求文檔永遠趕不上技術發(fā)展的速度...
- 本文可以算是我對探索AI產(chǎn)品設計的歷程記錄。
1.0時代:自主訓練大模型的探索之路
- 回顧AI產(chǎn)品的演進歷程,1.0時代更像是一個充滿理想主義的開拓期。當時整個行業(yè)都沉浸在大模型的技術熱潮中,各大科技公司都在競相訓練自己的基礎大模型,我們也不例外。
自主訓練“通用大模型”的嘗試
- 2023-2024年間,我們投入大量資源自主研發(fā)了"網(wǎng)鏈大模型",這個決定反映了當時行業(yè)的普遍心態(tài):
- 技術自信:我們是“xx系”人工智能領域的公司,需要有自主可控的底層模型能力。
- 數(shù)據(jù)安全:我們有很多核心數(shù)據(jù),擔心使用第三方模型會導致商業(yè)數(shù)據(jù)泄露。
- 定制需求:期望可以通過自主訓練獲得更好的領域適配性。
- 但實際執(zhí)行一段時間后,自主訓練大模型的問題很快就暴露出來了。
- 資源錯配:80%的算力消耗在訓練通用能力上,而客戶真正需要的垂直領域理解只占20%
- 迭代遲滯:每個新需求的實現(xiàn)都需要全量微調,響應周期以月計算
- 專業(yè)度不足:在分析"多晶硅產(chǎn)能過剩對光伏中游影響"這類復合問題時,準確率不足60%
1.0階段的產(chǎn)品設計
- 1.0模型在我們的首個問答產(chǎn)品的實際使用過程中效果并不好。當時的產(chǎn)品就像一把鈍刀——雖然能砍能劈,但面對產(chǎn)業(yè)鏈分析這樣需要精細操作的場景時,總是力不從心。
- 所以最初,我們設計在進入產(chǎn)業(yè)頁面時有默認招呼語,首先為用戶提供問題分類,以及每個分類下常見的預設問題,一個是告訴用戶產(chǎn)品有哪些功能,一個是因為是預設好常用問題,可以提升回答的準確性和速度。
- 但如果用戶再追問語言邏輯更復雜,或者更具行業(yè)深度的內容,模型給出的回復就會出現(xiàn)理解不了專業(yè)術語、長文本邏輯連貫性不好、回答速度很慢的弱點。這些問題暴露出自主訓練模型在數(shù)據(jù)質量和算法積累上的不足。用戶等待一個回答要10s+,任憑UI再怎么增加loading動畫過渡,或者提供平復用戶焦慮的文案,也還是解決不了它最根本的問題。

- 投入超多資源訓練通用大模型,卻難以在專業(yè)場景落地。超多張高端GPU持續(xù)運轉數(shù)周、大量數(shù)據(jù)需要標注、算法團隊需要更多人力資源...這對大多數(shù)企業(yè)來說都是難以承受的。
- “通用大模型:就像AI領域的"全能型選手",通過海量數(shù)據(jù)和龐大參數(shù)訓練獲得廣泛的知識能力,能處理文本生成、基礎問答、簡單推理等多樣化任務。它具備強大的語言理解和內容創(chuàng)作能力,但缺乏專業(yè)領域的深度知識,就像通才學者雖博聞廣識,面對具體行業(yè)問題時仍需結合專業(yè)數(shù)據(jù)再學習。當前主流的GPT、Claude等都屬于這類基礎模型,為垂直領域應用提供底層能力支撐。”
- 這種情況大概持續(xù)了小一年,產(chǎn)品研發(fā)的進度也很緩慢。在這期間,我們深切地感受到市場客戶對于AI產(chǎn)品的需求越發(fā)旺盛,幾乎所有客戶都會想要有個功能叫:AI問答。
認知轉變帶動技術轉型
正如《2025年大模型2.0產(chǎn)業(yè)發(fā)展報告》所指出的,當時那個階段整個行業(yè)都在經(jīng)歷深刻的認知轉變。

- 我們也意識到,若再不快速做出點改變,不調整技術方向,創(chuàng)造不出為公司增收的商業(yè)化產(chǎn)品,不說這賽道前期的紅利拿不到,龐大體量的模型研發(fā)投入會拖垮公司,我們也會被客戶和市場無情拋棄。那段時間的評審會也是充滿了無力感,很多想實現(xiàn)的功能和交互方案,總被"模型不支持"打回。
- 直到CEO在年后的全員會議上帶來了關鍵轉向:"停止造輪子,專注做場景"。
這個決定意味著:我們不再追求"從頭訓練"模型的完美主義,開始接受使用現(xiàn)成的大模型API,把更多資源傾斜到更被需要的地方上去。

2.0時代:垂域大模型的深耕與突破
- 在1.0時代,我們走過了所有AI初創(chuàng)公司都會經(jīng)歷的陣痛期,進入2.0時代后,我們完成了三個關鍵轉變:
- 技術定位:從"全能型AI"轉向"產(chǎn)業(yè)專家系統(tǒng)"
- 研發(fā)重點:從模型規(guī)模競賽轉向場景深度理解
- 產(chǎn)品邏輯:從技術驅動轉向需求驅動
- 直至目前,我們終于能夠聚焦產(chǎn)業(yè)分析師真實的工作流,而不是困在技術可行性的泥潭中。產(chǎn)品設計的推進速度也在快速前進。我們采用小步快跑的形式,每周發(fā)布一個小版本上線,重大難點需求放寬至1.5周-2周。在不浪費開發(fā)資源的同時,也能快速根據(jù)市場變化調整迭代方向。
行業(yè)垂域大模型的技術選型優(yōu)化
技術升級
技術上,公司轉向垂域大模型開發(fā)后,省下之前全量微調參數(shù)的精力,重點提升專業(yè)領域專業(yè)性不高的問題。
- “垂直領域大模型(Vertical Domain Model)本質上是一種專業(yè)化的AI工具,它不像通用大模型那樣追求"萬事通",而是專注于成為某個特定領域的專家。就像醫(yī)院里既有全科醫(yī)生,也有心內科、神經(jīng)科等??漆t(yī)生一樣,垂直大模型就是AI世界里的"??漆t(yī)生"。采用的是“通用底座+行業(yè)微調”模式訓練。”
框架優(yōu)化
由開始的Transformer架構,改用了最新的“RAG框架+LLM微調”的混合架構。這種架構結合了兩種技術的優(yōu)勢,就像給專家配了一個智能資料庫。不僅在數(shù)據(jù)實時性上有保障,專業(yè)性的知識也能持續(xù)強化,不僅能支持數(shù)據(jù)來源查詢增加回答的可信度,在算力的消耗上也大大小于Transformer方案。
- “RAG(Retrieval-Augmented Generation,檢索增強生成)是當前企業(yè)級AI產(chǎn)品的核心技術框架,它完美解決了專業(yè)領域知識更新的難題。就像一位嚴謹?shù)膶W者,在回答問題前總會查閱最新文獻.”
- “LLM微調(Large Language Model Fine-tuning)就像培養(yǎng)一個通才成為專家,它基礎基于預訓練好的通用大模型(如GPT、DeepSeek)通過用垂直領域的數(shù)據(jù)進行二次訓練,在保留模型通用理解力的同時,再次強化模型的專業(yè)能力。”
在2.0時代,我們?yōu)楫a(chǎn)品裝上了"專業(yè)大腦"——智能體矩陣。這個改變讓系統(tǒng)終于能像真正的產(chǎn)業(yè)專家那樣思考了。

引入智能體矩陣
- 在2.0時代,我們?yōu)楫a(chǎn)品裝上了"專業(yè)大腦"——智能體矩陣。這個改變讓系統(tǒng)終于能像真正的產(chǎn)業(yè)專家那樣思考了。
- “智能體(Agent)是指能夠自主感知環(huán)境、制定決策并執(zhí)行任務的智能系統(tǒng)。不同于傳統(tǒng)單一功能的AI模型,智能體更像是一個具備專業(yè)思維和行動能力的數(shù)字專家,它不同于傳統(tǒng)問答系統(tǒng)的最關鍵特征是:自主決策能力。它能夠理解復雜問題、調用專業(yè)工具、組織分析邏輯,最終給出符合行業(yè)標準的解決方案。”

- 我們上線了“專家系統(tǒng)”,并給每個專家(智能體)設計了獨特的"性格":產(chǎn)業(yè)鏈分析專家像個嚴謹?shù)睦辖淌?,企業(yè)分析專家像精明的財務總監(jiān),研報專家則像專業(yè)的行業(yè)研究員。這些功能的上線讓產(chǎn)品真正具備了"產(chǎn)業(yè)級"的專業(yè)度。
- 有了這些底層技術的升級,原先產(chǎn)品功能和界面交互的設計局限性的問題也被大大的改善。很多模型和智能體預帶的功能也為產(chǎn)品的體驗設計帶來更積極的展現(xiàn)。許多之前不能做的功能現(xiàn)在能做了。例如,最開始我們需要花時間做處理的敏感詞問題,現(xiàn)在基座大模型都能直接支持此類問題的回答,從源頭顯示為“****”或提示用戶該問題涉及敏感內容不予回答。

再比如,智能體的加入能夠讓回答的分析過程透明化,用戶界面能夠展示出“理解-查詢-思考-回答”的步驟鏈條。

算力優(yōu)化
- 說到AI產(chǎn)品勢必要提到算力問題。目前市面上大部分在線產(chǎn)品都是靠用戶購買算力來實現(xiàn)商業(yè)化盈利的。我們的純網(wǎng)絡版產(chǎn)品,初步計劃也是根據(jù)算力或問答次數(shù)來收取用戶費用。
- 由于我們的客戶群體特殊,有的客戶需要更強的算力需求或數(shù)據(jù)安全需求,我們也可為其提供“華為昇騰一體機”,通過本地部署“軟件+硬件”的方式來收取用戶費用,實現(xiàn)產(chǎn)品盈利。

2.0階段的產(chǎn)品設計
智能問答產(chǎn)品進化
- 伴隨著底層技術的升級,產(chǎn)品頁面和體驗也同步進化。
- 1.界面設計
- 1.1風格
- 在延續(xù)主產(chǎn)品“量知云”輕漸變的品牌基因的同時,“輕量、主流、簡潔”這幾個關鍵詞主導著頁面風格的迭代方向。
- 輕量:配色克制、不出現(xiàn)大色塊分割
- 主流:配色以冷色系為主、元素采用輕擬物或3d風格。
- 簡潔:更大的元素間距與留白,讓頁面有呼吸感;元素有親密性,模塊之間有間距,符合塔式原則。提升頁面品質感。

- 1.2頁面框架
- 頁面框架主要圍繞“主流、前瞻性、高效”幾個關鍵詞來設計:
- 主流:區(qū)別于1.0時期的問答類產(chǎn)品,2.0采用目前主流流行的左右結構框架:左邊欄是常用工具操作欄,右邊為主要內容展示區(qū)域,內容區(qū)域里頂欄的位置通常放置一些和當前對話相關的操作,下方為主要內容展示區(qū)域。優(yōu)點:由原來固定寬度形式變得更靈活。內容展示區(qū)域更加開闊。

前瞻性:設計之初即考慮pc和移動頁面的兼容,同前端工程師提前確認響應式頁面的技術實現(xiàn)。

高效:有限制的自適應內容控制:主要內容展示的寬度不是越大越好,大段文字的展示寬度控制在一行50-60字左右,眼睛的閱讀效率最高。
- 1.3交互功能設計
- 1.3.1Prompt模板與模版庫
- 我們根據(jù)不同業(yè)務場景(企業(yè)分析/人才匹配/專利檢索等垂直場景),預先設置了至少幾十種Prompt 模板,相比自由發(fā)揮的AI回答,模板能夠保證回答合規(guī)性,錯誤率降低60%。
- “Prompt 模板:預先設計好的結構化指令框架,用于引導AI模型生成特定類型的回答。”
- “Prompt 模板庫:根據(jù)不同業(yè)務場景分類存儲的Prompt模板集合,通常包含數(shù)百個精細調整的模板。”
- 界面設計時,支持設計師定義Makedown支持的語法(emoij、表格、代碼塊...)作為問題回答的排版依據(jù)。例如,我們?yōu)?ldquo;專家模式”的招呼語設定了獨特的排版。

1.3.2用戶意圖識別引擎
通過自然語言處理(NLP)技術,將用戶輸入的語句自動歸類到預設的業(yè)務類別(如"企業(yè)競爭力評價"、"產(chǎn)業(yè)鏈斷供斷鏈分析"、"人才與技術匹配")。這和直接設定好明確空間,讓用戶直接在界面上選擇功能的操作不太一樣。我們將獲取用戶意圖的工作變?yōu)殡[藏式的,不易發(fā)覺的,在用戶詢問的過程中就完成了。對比一下,顯然后者更能讓用戶有流暢的、智能的AI產(chǎn)品體驗。
“NLP技術:Natural Language Processing,自然語言處理。讓計算機理解、解釋和生成人類語言的技術。”
1.3.3智能體矩陣
2.0產(chǎn)品引入了智能體矩陣,通過配備不同的專家系統(tǒng)智能體,為用戶提供多維度的更深層次的產(chǎn)業(yè)分析功能。用戶可以在有明確分析方向的時候,選擇某一個定向專家為其服務。同時,系統(tǒng)的多個智能體也能協(xié)同工作,自動感知用戶的復雜問題,分工協(xié)作,各自處理擅長的領域,共同完成對用戶問題的回答。整個過程如行云流水,同樣用戶只需自然提問,就能獲得專業(yè)級的分析回答。
- 1.3.4多模態(tài)交互
- 在產(chǎn)業(yè)分析領域,數(shù)據(jù)從來不是冰冷的數(shù)字,而是講述行業(yè)故事的語言。智能問答引入多模態(tài)交互,讓用戶能用最自然的方式與數(shù)據(jù)對話。
- “多模態(tài)交互模型:2024年 2 月,OpenAI 發(fā)布了其文本生成視頻的大模型 Sora。Sora 展示了人工智能在理解和模擬物理世界方面的能力,被認為是通用人工智能的關鍵一步。2024 年 5 月,OpenAI 推出其新旗艦模型 GPT-4o,能夠實時對音頻、視覺和文本進行推理,為多模態(tài)交互開啟無限可能。”
- 我們設想,在不久的將來 用戶可以通過自然語言,從數(shù)據(jù)庫中抽取相關數(shù)據(jù)自動生成可視化圖表,又或者可以支持本地文件(圖片形式)內容解析后的進一步提問。

智能報告產(chǎn)品的AI化升級
- 2.0時代,智能報告產(chǎn)品也從半定制化到全AI化升級中:
- 1.0階段:在初期階段,我們的智能報告產(chǎn)品更像是高級版的填空工具:整個報告生成流程需要人工占主導。首先需要產(chǎn)業(yè)研究員預先設計80%的報告框架,并手動標注每個數(shù)據(jù)插入位點;其次需要花費大量時間調整格式排版。
- 這個時期始終會存在一些問題,例如:每次業(yè)務變化都需要重新制作模板,耗時耗力。對于一些非結構化的數(shù)據(jù)無法處理。生成的圖表風格比較基礎,無法自定義。
- “非結構化數(shù)據(jù):像是未經(jīng)整理的原材料,內容呈現(xiàn)形式多樣且含義隱晦。包括文本報告、會議錄音、圖片圖表等,需要AI先進行"理解"和"提煉"才能使用。”
- “結構化數(shù)據(jù):就像整理好的工具箱,內容以整齊的表格形式存在(如Excel數(shù)據(jù)、數(shù)據(jù)庫記錄),每個字段都有嚴格定義的類型和格式,機器可以直接讀取分析。”
- 因為受限于技術限制,1.0階段的智能報告產(chǎn)品不是由產(chǎn)品和設計主導開發(fā)的,在功能設計和體驗上都有很大的提升空間。

到了2.0階段:智能報告已經(jīng)進化地更像一個真正的寫報告的專家了。模型能夠自主規(guī)劃內容結構(如輸入標題為“行業(yè)分析報告”,能夠自動生成符合邏輯的大綱內容如“劃分市場趨勢、競品對標、風險預測),并調用多智能體協(xié)作完成數(shù)據(jù)搜集與最終文案的生成。
根據(jù)用戶的實際使用場景,產(chǎn)品提供多路徑選擇。如果用戶對自己的報告內容胸有成竹,不強依賴AI生成功能,則可以快速進入編輯頁面,使用平臺的各類資料快速完成報告內容編寫。
相反的,用戶也可以從頭選擇預制模板,填寫報告標題后,就能從“報告關鍵詞”開始完全依賴AI生成,最終獲得一份圖文并貌的報告。
更多案例待補充…
寫在最后:奔跑者的宣言
- 至此,產(chǎn)品更新的進度就先記錄到這里,確實還有很多不足。
- 站在這個技術爆炸的產(chǎn)業(yè)變革節(jié)點,現(xiàn)在的進度也不過是萬里長征的第一步。當前版本還留有許多遺憾——智能體的協(xié)作效率有待提升,多模態(tài)交互的流暢度仍需打磨,那些躺在需求池里的創(chuàng)新功能還在等待排期...
- 差距也確實存在。但前方道路已然清晰,在多數(shù)同行還在重復造輪子時,慶幸我們已經(jīng)完成了從通用到垂直的關鍵轉身。繼續(xù)沿著"專業(yè)化+場景化"的賽道持續(xù)深耕,把每個槽點轉化為創(chuàng)新點,保持此刻"清醒奔跑"的姿態(tài)。
- 未來,我們選擇的方向充滿可能,路很長,產(chǎn)業(yè)理解的深度、產(chǎn)品體驗的溫度...要做的還有很多啊~
Powered by Froala Editor
大牛,別默默的看了,快登錄幫我點評一下吧!:)
登錄 立即注冊