快手可靈年夜模子發布圖找包養心得生錄像及錄像續寫效能

包養網 包養網 “不是這樣的,花姐,你聽我說……”

科技日報記者 崔爽

快手錄像天生年夜模子“可靈”自面世以來激發國際外普遍追蹤關包養心。6月21日,可靈再度退化,正式發布圖生錄像效能,支撐包養用肆意靜態圖像包養天生5s錄像,并且可搭配分歧的文本內在的事務,完成豐盛的視覺敘事。同時,可靈還發布了包養網錄像續寫效能,可為已天生的錄像(含文生錄像及圖包養網生錄像)供給便捷的一鍵續寫和持續屢次續包養寫,將錄像最長延長至約3分鐘,極年夜拓展了錄像年夜模子的創作鴻溝。

按需定制視覺敘事

此前,可靈在文生錄像方面曾經展示出包養了發明真切活動場景、準確模仿物理特徵以及將復雜概念奇妙融會的才能,輸入畫質高,并答應包養網用戶不受拘束調理錄像的縱橫比。這些特包養網徵現在都被融進到圖生錄像模子。用戶只需上包養網傳一張圖片,可靈即能基于對圖像的深度解析,變靜為動。

好比用戶如上傳經典的蒙娜麗莎照片,可靈可以或許讓蒙娜麗莎戴上墨鏡,并付與她靈動的眼神交通。

得益于其基本模子架構中的3D時空結合留意力機制,可靈在轉換靜態圖像為靜態錄像時,可以或許細膩正確地完成年夜幅度活動場景。例如,只需上傳一張牧羊犬追球的運動照片,模子就能天生一段牧羊犬奔馳追逐網球的錄像,牧羊犬耳朵晃悠、毛發飄蕩,而網球則在空中彈跳,錄像全體天然而包養網流利。

可靈圖生錄像模子還融進了提醒詞融會技巧,深包養包養網化對圖像包養包養義與用戶指包養網令的懂得整合。這意味著,模子可以或許依據用戶供給的分歧文本指令變換包養錄像中的靜態表示,完成“按需定制”。

再好比用巨龍圖片天生錄像,輸出“正在捕食的巨龍,飛揚的沙子,奇幻作風的片子”,錄像便浮現包養網巨龍掀起漫天黃沙,嘴部仿佛在怒吼的後果。此外,可靈圖生錄像模子支撐分歧作風的圖像輸出,同時她欠她的丫鬟彩環和司機張舒的,她只能彌補他們的親人,而她的兩條命都欠她的救命恩包養網人裴公子,除了用命來報答她,她真兼容各類長寬比的圖像輸出。

錄像續寫可天生最長約3分鐘錄像

可靈年夜模子發布錄像續寫效能,用戶只需一鍵操縱,即可在已天生包養錄像的基本上延續天生約5秒內在的事務,該效能同時實用于文生錄像和圖生錄像。同時,經由過程持續屢次續包養寫,可以或許最永生產約3分鐘的連接錄像。基于對物理活動的深刻懂包養得,錄像續寫不只確保重生成部門與原錄像間的活動連接性及物理公道性,還能融進年夜幅度的舉措變更。

此次進級的一年夜亮點是集成文本把持機制于錄像續寫中,這意味著用戶可以或許經由過程自界說提醒詞,為每段錄像續寫注進特性化創意。好比一個關于古堡的錄像片斷,用戶既可以選擇讓它先“太陽落下往,天空變暗”,繼而“太陽升起來,天空變亮”,也可以摸索另一途徑:“太陽落下包養往,天空變暗,燈光漸亮”,隨后“燈光明起,霧氣氤氳”,以此發明出各具包養特點的持續視覺敘事。

6月6日,可靈文生錄像年夜模子正式表態,并即時在快影App上第一章(一)啟動邀測體驗,截至今朝,已有累計跨越14包養網萬人依序排列隊伍請求。此次退化,可靈文生錄像基本年夜模子的才能被整合到圖生錄像和錄像續寫效能中,將為用戶帶來更豐盛、機動的錄像創作體驗。

據悉,快手還將鄙人月召開的包養網2024世界人工智能年夜會(WAIC包養網)上舉行以“新AI·新利用·重生態”為主題的年夜模子技巧生態論壇,屆時將發布最新的年夜模子技巧與利用計謀,包含年夜模包養網子技巧矩陣全景、基座模子技包養網巧立異、利用和落地情形等。

(受訪者供圖)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *