![]()
要說(shuō)前陣子 AI 圈最神秘的模型,快樂(lè)小馬應(yīng)該算一個(gè)。
早在月初,這個(gè)模型就登頂了 Artificial Analysis 的榜首,直到現(xiàn)在還在榜單第一掛著。在 Arena AI 排行榜上,HappyHorse-1.0 也能排到第二的位置。
![]()
這么好的成績(jī),一下子激起了大伙兒的好奇心。
一夜之間,大量仿冒套殼擦邊版 “ 快樂(lè)馬 ” 激情上線,HappyHorse 突然成了流量密碼,整個(gè) AI 圈都在討論誰(shuí)才是小馬真正的爸爸。
![]()
直到最近,這場(chǎng)猜馬游戲終于有了答案。阿里 ATH 團(tuán)隊(duì)正式認(rèn)領(lǐng)這匹競(jìng)技場(chǎng)黑馬,并同時(shí)開(kāi)放了 HappyHorse-1.0 灰測(cè)。
世超也去前線觀察了一些大伙兒用 HappyHorse-1.0 做出來(lái)的案例,看起來(lái)整體效果還是有不少閃光點(diǎn)的。
即便是在高速運(yùn)動(dòng)的鏡頭里,人物基本沒(méi)有跑形,主體一致性保持得很穩(wěn)。音效也沒(méi)掉鏈子,節(jié)奏點(diǎn)踩得準(zhǔn),畫(huà)面動(dòng)作和聲音能完全對(duì)上。
來(lái)源:@嵐叔
而在氛圍感、真人特寫(xiě)和一些奇觀鏡頭上,成片的質(zhì)感看起來(lái)也比較在線。
咱也第一時(shí)間上手試了試。這回 HappyHorse-1.0 一共開(kāi)放了視頻生成和視頻編輯兩項(xiàng)功能,實(shí)測(cè)下來(lái),營(yíng)銷號(hào)嘴里的全面碾壓、拳打腳踢友商模型,咱聽(tīng)個(gè)樂(lè)就行了。
不過(guò),不能否認(rèn)的是,它確實(shí)是一款完成度較高的視頻模型。
下面世超就帶各位差友看看 HappyHorse 的實(shí)測(cè)案例。先從最核心的視頻生成說(shuō)起,HappyHorse-1.0 的生成等待時(shí)間大概在 3 到 5 分鐘,一次最長(zhǎng)可以生成 15 秒視頻,畫(huà)質(zhì)支持 720P 和 1080P,參考圖最多能放 9 張。
在無(wú)參考圖的情況下,只用一段不到 100 字的提示詞,就可以跑出一支質(zhì)感還不錯(cuò)的紀(jì)錄片風(fēng)格短片。
比較驚喜的是,它的音畫(huà)同步完成度很高。比如手掌揉過(guò)面團(tuán)時(shí)那種細(xì)碎的摩擦聲,還有面團(tuán)、面板撞擊案臺(tái)的聲音,都能跟手部動(dòng)作搭配。
而如果提供參考圖,只要搭配簡(jiǎn)單的一兩句話提示詞,也能做出不錯(cuò)的效果。
比如下面這個(gè)案例,“ 生成一段皮克斯電影質(zhì)感的電影前導(dǎo)片,主角坐到背后的賽車?yán)铮管囯x開(kāi)畫(huà)面。鏡頭位置始終不變,不要跟隨角色。”
或者讓米家三姐妹摸摸角色的頭:“ 閃光燈閃過(guò),左二右一的人物都放下剪刀手,摸右二人物的頭。”
又或者來(lái)個(gè)漢堡廣告片:
所以大伙兒也能看出來(lái),HappyHorse 對(duì)參考圖還是挺依賴的。加了參考圖之后,不管是抽卡成功率,還是最終畫(huà)面的質(zhì)感,都明顯穩(wěn)不少。
所以建議大家使用前先用 GPT-Image-2 做個(gè)圖,再搭配提示詞食用。
或者對(duì)畫(huà)面運(yùn)鏡要求更高的差友,還可以試試下面這種參考圖 + 千字提示詞的玩法。
只要在提示詞里說(shuō)清楚劇情,每秒的運(yùn)鏡分鏡,畫(huà)面氛圍,人物表演情緒,臺(tái)詞背景音等等細(xì)節(jié),你就可以得到一段 《 無(wú)間道 》 復(fù)刻版。
世超測(cè)了不少案例,感覺(jué) HappyHorse-1.0 在鏡頭指令遵循方面還是很強(qiáng)的。比如提示詞里說(shuō) 2-4s 給特寫(xiě)鏡頭,實(shí)際視頻里運(yùn)鏡是符合要求的。
不過(guò),如果說(shuō)運(yùn)鏡做得還不錯(cuò),語(yǔ)音聲線方面,HappyHorse 就有點(diǎn)一般了。上面這個(gè)算好例子,實(shí)際上 80% 的視頻,都會(huì)出現(xiàn)極其 AI 的配音,剩下 20% 的情況里,我也沒(méi)摸清怎么提示,才能讓它說(shuō)話穩(wěn)定地?fù)碛懈星椤!!?/p>
再給大伙兒看一個(gè)肖申克的救贖,只要不開(kāi)腔,環(huán)境音和動(dòng)作音還是比較到位的:
當(dāng)然,真正想跑出完美無(wú)缺的好視頻,還是得靠抽卡大法。而這,也是目前整個(gè)行業(yè)的現(xiàn)狀。比如抽出來(lái)一條視頻,80% 是沒(méi)有問(wèn)題的。但它總在那 20% 的細(xì)節(jié)上翻車,比如人飛著飛著少了一條腿,背景音突然出現(xiàn)莫名其妙的臺(tái)詞。
包括在多人物,在快速運(yùn)動(dòng)場(chǎng)景里表現(xiàn)比較一般。哪怕只是兩個(gè)人站在地面對(duì)劍這種相對(duì)簡(jiǎn)單的動(dòng)作,生成出來(lái)效果也經(jīng)常很綿軟,整體缺乏打擊感。 不過(guò)相信在未來(lái),隨著模型的更新,抽卡這件事兒,也會(huì)逐漸被技術(shù)淘汰。
而在視頻編輯功能上,HappyHorse-1.0 的表現(xiàn)也算比較穩(wěn)定。
在風(fēng)格、環(huán)境等大面積修改的時(shí)候,能保持和原視頻的一致性。比如真人改成動(dòng)漫風(fēng)格:
或者暴雨改晴天:
又或者局部給人物戴個(gè)口罩:
但視頻編輯對(duì)提示詞比較敏感,只會(huì)嚴(yán)格按照涉及的部分修改。比如,你只提到把畫(huà)面里的角色男性換成女性,背景音臺(tái)詞就會(huì)保持原來(lái)的男性聲線不變。
最后再給大伙兒說(shuō)說(shuō)價(jià)格。官網(wǎng)目前每天登錄免費(fèi)送 50 積分,而生成一條 5s 720P 的視頻原價(jià) 45 積分,會(huì)員 7 折后也要 32,白嫖基本不太現(xiàn)實(shí)。
但即使花錢,HappyHorse 其實(shí)算是比較有性價(jià)比的。根據(jù)官方的口徑,HappyHorse-1.0 官網(wǎng)疊加會(huì)員折扣之后合 0.44 元/秒,這在 AI 視頻模型里是一個(gè)相當(dāng)有競(jìng)爭(zhēng)力的價(jià)格。
![]()
目前比較優(yōu)秀的模型,每秒成本一般在 1 元左右。世超周圍也有不少編輯部小伙伴表示,現(xiàn)在好的視頻模型太貴,大伙兒非必要都不舍得用。
所以,如果 HappyHorse 能保持這個(gè)價(jià)格優(yōu)勢(shì),再把模型短板補(bǔ)上,對(duì)一些小工作室,或者個(gè)人使用來(lái)說(shuō),還是有很大吸引力的。
總的來(lái)說(shuō),不管是開(kāi)年的 Seedance,還是現(xiàn)在的 HappyHorse,咱們都能明顯感覺(jué)到,國(guó)產(chǎn)視頻模型已經(jīng)不再是 Veo、Sora 后面的小跟班,反過(guò)來(lái)要教這些海外模型學(xué)做 AI 了。
即使它們還不完美,依然翻車,但這些 AI 模型能力的持續(xù)進(jìn)化,成本的大幅優(yōu)化,正在一點(diǎn)點(diǎn)改變視頻內(nèi)容的生產(chǎn)方式。
過(guò)去做一條商業(yè)廣告片、短劇、電影,需要支撐一整個(gè)團(tuán)隊(duì)的預(yù)算。現(xiàn)在,一個(gè)普通創(chuàng)作者靠參考圖和提示詞,居然也能摸到專業(yè)影像的門(mén)檻。
希望視頻模型繼續(xù)照這個(gè)勢(shì)頭卷下去,以后普通人想看點(diǎn)好劇,可能真的只需要燒燒 token,在家里動(dòng)動(dòng)手指了。
撰文:咸咸
編輯:面線
美編:素描
圖片、資料來(lái)源:
X、HappyHorse 官網(wǎng)
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.