提交需求
賽事與廣告咨詢合作,請(qǐng)?zhí)顚懶枨蟊韱?,我們?huì)在第一時(shí)間與您聯(lián)系!
AI設(shè)計(jì)觀察是MEUX發(fā)起的體驗(yàn)洞察系列內(nèi)容,定期匯總國內(nèi)外設(shè)計(jì)動(dòng)態(tài),為大家?guī)碜钚滦袠I(yè)資訊。
【1】Perplexity推出AI驅(qū)動(dòng)瀏覽器Comet
【2】谷歌發(fā)布32個(gè)T5Gemma模型
【3】馬斯克xAI發(fā)布Grok4
【4】新版 PNG 格式發(fā)布
【5】B站推“代號(hào)H”AI創(chuàng)作工具
【6】京東推出兩款A(yù)I社交產(chǎn)品
【7】字節(jié)上線“小荷AI醫(yī)生”
【8】vivo發(fā)布端側(cè)多模態(tài)模型
【9】騰訊元器接入微信支付MCP
【10】字節(jié)發(fā)布Xverse圖像生成模型
1.Perplexity推出AI驅(qū)動(dòng)瀏覽器Comet
Perplexity 推出首款 AI 驅(qū)動(dòng)網(wǎng)頁瀏覽器 Comet,旨在挑戰(zhàn)谷歌搜索作為用戶獲取信息主要途徑的地位。該瀏覽器初期向每月 200 美元的 Max 計(jì)劃訂閱者及少量等待名單邀請(qǐng)用戶開放,核心特色是預(yù)裝并默認(rèn)設(shè)置 Perplexity 的 AI 搜索引擎,突出展示其核心產(chǎn)品 ——AI 生成的搜索結(jié)果摘要。同時(shí),瀏覽器內(nèi)置全新 AI 助手 Comet Assistant,可自動(dòng)完成日常任務(wù),如總結(jié)郵件和日歷事件、管理標(biāo)簽頁、代用戶瀏覽網(wǎng)頁等,用戶可通過側(cè)邊欄調(diào)用該助手,使其查看網(wǎng)頁內(nèi)容并解答相關(guān)問題。
2.谷歌發(fā)布32個(gè)T5Gemma模型
谷歌發(fā)布編碼器 - 解碼器架構(gòu)的 T5Gemma 系列模型,同時(shí)還推出了用于健康 AI 開發(fā)的多模態(tài)模型 MedGemma。T5Gemma采用 “適應(yīng)” 技術(shù),將預(yù)訓(xùn)練的僅解碼器模型轉(zhuǎn)換為編碼器 - 解碼器架構(gòu),可靈活組合不同大小模型,平衡質(zhì)量與效率。實(shí)驗(yàn)顯示,T5Gemma 在多個(gè)基準(zhǔn)測試中表現(xiàn)優(yōu)異,尤其在推理密集型任務(wù)上,相比僅解碼器的 Gemma 2 有顯著提升,被認(rèn)為可能推動(dòng)編碼器 - 解碼器架構(gòu)復(fù)興。MedGemma 包含 4B 和 27B 大小的模型,能輔助醫(yī)療診斷,表現(xiàn)良好。
3.馬斯克xAI發(fā)布Grok4
馬斯克旗下 AI 公司 xAI 發(fā)布最新旗艦大模型Grok 4 及多智能體版本 Grok 4 Heavy,并推出每月 300 美元的高價(jià)訂閱計(jì)劃 Super Grok Heavy。在 “人類的最后考試” 中,Grok 4 無工具時(shí)準(zhǔn)確率 25.4%,超谷歌 Gemini 2.5 Pro 和 OpenAI o3;Grok 4 Heavy 帶工具得分 44.4%,表現(xiàn)亮眼。其在多學(xué)科測評(píng)中成績優(yōu)異,馬斯克稱其科研能力超人類博士,還能處理源代碼文件。此外,Grok 4 已在庫存管理、游戲創(chuàng)作等領(lǐng)域落地,未來還將推出編碼、多模態(tài)、視頻生成等模型,與 OpenAI 的 GPT-5 形成競爭態(tài)勢(shì)。
4.新版PNG格式發(fā)布
新版PNG格式規(guī)范發(fā)布,沉寂20余年的PNG格式重?zé)ɑ盍?。美國國?huì)圖書館等機(jī)構(gòu)均推薦該格式,此次更新由 Adobe、蘋果、谷歌等多巨頭參與推動(dòng)。新功能包括:一是完善 HDR 支持,僅用 4 字節(jié)即可實(shí)現(xiàn),且具備前瞻性;二是正式認(rèn)可 APNG 動(dòng)畫格式,此前該格式已獲廣泛支持;三是官方支持 Exif 數(shù)據(jù),可存儲(chǔ)版權(quán)、GPS 等附加信息,同時(shí)還進(jìn)行了錯(cuò)誤修正和說明澄清等整理工作。目前,Chrome、Photoshop 和Safari 等眾多程序已支持新版 PNG 規(guī)范,廣播領(lǐng)域的硬件和工具也在更新適配。后續(xù)計(jì)劃推出第四版更新以提升 HDR 與 SDR 的互操作性,第五版將研究壓縮優(yōu)化及并行編解碼功能。
5.B站推“代號(hào)H”AI創(chuàng)作工具
B站推出 “代號(hào) H” AI 創(chuàng)作工具,聚焦視頻播客領(lǐng)域,該工具可實(shí)現(xiàn)音頻內(nèi)容視頻化,支持文案、音頻輸入,適配播客和泛知識(shí)雜談圖文模板,能在 6 分鐘內(nèi)生成千字內(nèi)容視頻,未來預(yù)計(jì)縮至 3 分鐘,定向邀請(qǐng)用戶體驗(yàn)反饋超預(yù)期。
6.京東推出兩款A(yù)I社交產(chǎn)品
京東在其 App 內(nèi)推出兩款 AI 社交產(chǎn)品 “寵 TA” 和 “聊愈小宇宙”,虎牙則推出首個(gè) AI 助手產(chǎn)品 “小虎 AI 加工坊”。“寵 TA” 是以寵物為中心的 AI 社區(qū)產(chǎn)品,用戶可與寵物或?qū)櫸飻?shù)字人形象的智能體聊天,兼具換裝、寵物數(shù)字人等可玩性功能,還設(shè)有寵物醫(yī)生咨詢、食品購買專區(qū),將情感陪伴與消費(fèi)場景結(jié)合,形成 “邊玩邊買” 閉環(huán)。“聊愈小宇宙” 是 AI 類對(duì)話產(chǎn)品,能識(shí)別用戶情緒,提供情緒記錄、解壓游戲等服務(wù),用戶可與 AI 心理咨詢師聊天,還可在 “微光社區(qū)” 交流,同時(shí)提供專業(yè)心理咨詢師付費(fèi)服務(wù),增強(qiáng)用戶認(rèn)同感。
7.字節(jié)上線“小荷AI醫(yī)生”
字節(jié)首款 AI 醫(yī)療助手獨(dú)立 App “小荷 AI 醫(yī)生” 上線,定位健康管家,提供健康咨詢、報(bào)告解讀等服務(wù)。用戶注冊(cè)登錄后進(jìn)入對(duì)話界面,可咨詢疾病自查、用藥參考等健康問題,AI 會(huì)主動(dòng)收集關(guān)鍵信息(如癥狀持續(xù)時(shí)間),并通過讓用戶上傳診斷報(bào)告、拍攝病灶圖片等方式,結(jié)合信息給出建議。其還能解讀血常規(guī)等報(bào)告,快速分析指標(biāo)異常,評(píng)估狀況并給出建議;支持拍攝藥盒查詢藥效說明。2024 年中國 AI 醫(yī)療器械市場規(guī)模達(dá) 96.41 億元,預(yù)計(jì) 2025 年將達(dá) 242.3 億元,大廠競速或重新定義 AI 健康邊界。
8.vivo發(fā)布端側(cè)多模態(tài)模型
vivo AI Lab 發(fā)布端側(cè)多模態(tài)模型 BlueLM-2.5-3B,參數(shù)量僅 2.9B,專為端側(cè)設(shè)計(jì),緊湊高效。該模型融合文本與圖文理解推理能力,支持長短思考模式切換及思考預(yù)算控制,可直接理解 GUI 界面。在 20 余項(xiàng)評(píng)測中表現(xiàn)突出:文本任務(wù)上,緩解多模態(tài)模型文本能力遺忘問題,與同規(guī)模文本模型效果相近,優(yōu)于同規(guī)模及更大規(guī)模多模態(tài)模型;多模態(tài)任務(wù)領(lǐng)先同規(guī)模模型,部分接近大規(guī)模模型;GUI 理解能力在同規(guī)模模型中領(lǐng)先,尤其中文場景表現(xiàn)優(yōu)異。
9.騰訊元器接入微信支付MCP
騰訊元器宣布正式接入微信支付 MCP,成為首個(gè)接入該支付解決方案的智能體開發(fā)平臺(tái)。這一舉措支持開發(fā)者在智能體上直接添加下單、贊賞、查詢訂單等功能,打通了智能體商業(yè)化的最后環(huán)節(jié)。開發(fā)者僅需通過簡單的提示詞調(diào)用或工作流編排,就能快速接入微信支付 MCP,使智能體具備支付能力。目前,元器平臺(tái)已向開發(fā)者開放微信支付 MCP 的體驗(yàn)版本,正式版本將在資質(zhì)審核通過后開放。
10.字節(jié)發(fā)布Xverse圖像生成模型
字節(jié)發(fā)布多主體控制生成模型 Xverse,可對(duì)設(shè)定的每個(gè)主體進(jìn)行精確控制,且不破壞圖像生成質(zhì)量,能應(yīng)對(duì)多主體、多光源、多風(fēng)格等場景。其核心是通過學(xué)習(xí) DiT 中文本流調(diào)制機(jī)制中的偏移量,實(shí)現(xiàn)對(duì)多個(gè)主體身份和語義屬性的一致控制,包含 T-Mod 適配器、文本流調(diào)制機(jī)制、VAE 編碼圖像特征模塊及兩種正則化技術(shù)等關(guān)鍵組成部分。對(duì)比測試顯示,Xverse 在單主體、多主體任務(wù)及整體表現(xiàn)上均優(yōu)于 MS-Diffusion、OmniGen 等領(lǐng)先技術(shù)。
感謝閱讀,轉(zhuǎn)載請(qǐng)注明出處,違者必究,謝謝您的合作。申請(qǐng)轉(zhuǎn)載授權(quán)后臺(tái)回復(fù)【轉(zhuǎn)載】。MEUX招聘進(jìn)行中,交互/視覺/用研可投簡歷至meux-talent@baidu.com(請(qǐng)?jiān)卩]件中務(wù)必明確標(biāo)注信息來源,例如:來自MEUX UI中國)
關(guān)于我們:
MEUX,百度移動(dòng)生態(tài)用戶體驗(yàn)設(shè)計(jì)中心,負(fù)責(zé)百度移動(dòng)生態(tài)體系的用戶/商業(yè)產(chǎn)品的全鏈路體驗(yàn)設(shè)計(jì)。服務(wù)的產(chǎn)品包括百度APP、百度搜索、百度百科、百度貼吧、百度商業(yè)產(chǎn)品等。MEUX以「簡單極致」為設(shè)計(jì)理念,創(chuàng)造極致用戶體驗(yàn)的同時(shí)賦能商業(yè),推動(dòng)設(shè)計(jì)行業(yè)的價(jià)值和影響力,讓生活因設(shè)計(jì)而更美好。
Powered by Froala Editor
密碼登錄
大牛,別默默的看了,快登錄幫我點(diǎn)評(píng)一下吧!:)
登錄 立即注冊(cè)