Copyright 2018-2025 報紙迷 版權所有 京ICP備2018136890號
剛剛,文心5.0正式發布了!
全新一代主打原生全模態,最開始就把語言/圖像/視頻/音頻放在同一套自回歸統一架構里,做統一的理解與生成訓練。
所以,最終模型能夠做到支持全模態輸入(文字/圖片/音頻/視頻)+全模態輸出(文字/圖片/音頻/視頻),創意寫作、指令遵循、智能體規劃方面也更強了。

在官方展示中,上傳一個電影片段,它立馬就能分析出最緊張的情節,具體到第幾秒到第幾秒的那種。

同時上傳一段視頻和一段音頻,就能讓它指出視頻里是否有用到音頻里的音樂,還能說出節點:

做音視頻融合生成也行,簡單操作即可爆改甄嬛傳滴血認親(佟掌柜版):
