黑馬殺出!淘天視頻模型登頂第一!

最近AI視頻圈直接被一匹黑馬攪得天翻地覆。


今天,一個叫 HappyHorse-1.0 的模型突然出現在 Artificial Analysis Video Arena盲測榜單上。


結果當天就直接包攬了 Text-to-Video、Image-to-Video 兩個榜單的第一名,而且不管帶不帶音頻,它都是穩穩的第一(昨晚看還是第二來着)。

這裏我們先簡單說說這個評測平臺。


Artificial Analysis Video Arena 是目前公認的權威的AI視頻第三方盲測榜單,完全匿名投票,只看最終生成的視頻質量,不看參數、不看公司背景。

能在這裏全榜第一,足見其含金量。


HappyHorse-1.0 的出現,讓人忍不住感嘆AI視頻技術的進步速度又加快了。


確實,前段時間大家還驚豔於 Seedance 2.0 出色的畫面效果和鏡頭控制能力,感嘆其估計一段時間內沒對手。


結果阿里淘天,突然殺出這麼一匹黑馬,直接把所有榜單都拿下了。


目前,Artificial Analysis 也放出了一些 demo,並將其與 Seedance 2.0、可靈 3.0 Pro、Grok-video-imagine 以及 PixVerse V6 拉出來一起對比測試:

此部分移步我們寫的原文觀看

Prompt:A hula hoop spinning on a kids waist, gradually climbing to their chest, then dropping to knees, then clattering to the floor. They pick it up to try again.

Prompt:A golf ball in a cup rolling around the rim three times before finally dropping in. The golfer's body language matches each rotation. Audio: Ball rattle, exhale, plop.

Prompt:A cat staring at its own reflection in a toaster, paw tapping the chrome surface. The distorted cat reflection taps back. Audio: Paw taps, confused meow.

Prompt:A barista creating latte art by pouring steamed milk into espresso. The white milk submerges beneath the brown crema initially, then breaks through the surface as the cup fills. The barista's wrist makes precise oscillating movements, creating a rosetta pattern. The milk and espresso maintain their distinct colors while interacting at the boundary. Audio: The gentle pour of liquid, the hiss of the steam wand in the background.

從 demo 就可以看出,在畫面一致性、運動自然度、物理真實性、提示詞遵循度這些核心維度上,幾乎是全面領先的。


且更難得的是,不管是純文本生成視頻,還是帶圖像參考生成視頻,甚至需要同步輸出音頻,它的表現都保持在第一梯隊。


這在目前公開的視頻生成模型裏,屬於非常均衡且頂尖的水準。


當然,於我個人而言,除了上述的這些維度,其實還有一個很重要的點——美學,就目前來看,我認爲 HappyHorse 在美學上的水平跟其他幾家相比還是差了點意思,特別是高爾夫和呼啦圈這兩個 demo,雖然指令遵循得很好,但是在觀感上和 Seedance2.0 以及 PixVerse V6 比還是差了點意思,缺少故事感。

模型背後是淘天集團的未來生活實驗室,領銜人是張迪——他之前是快手Kling AI視頻模型的技術負責人,2025年底加入阿里淘天。

實驗室定位是專注多模態大模型和電商場景創新,這次算是把電商系的視頻生成能力第一次放到全球舞臺上亮了相。

定價方面,據我在X上看到的小道消息,生成成本大概只有Seedance 2.0的一半,如果是真的,那麼屆時性價比優勢將會非常明顯,等到正式開源或者開放API的時候,估計又會掀起一波討論。


AI視頻生成這兩年進步飛快。


從最早的模糊短片,到現在物理規律、細節一致性都開始接近真實,速度確實超出很多人預期,,這次 HappyHorse-1.0 全榜登頂,再次證明國內團隊在視頻生成賽道已經具備全球第一梯隊的實力。

當然,盲測只是用戶偏好的一種參考,就跟前文中我對於其美學問題的評價一樣,是有強烈個人審美偏好在裏面的。


至於最後真正用起來效果如何,還得等更多開發者上手測試,但從目前公開的對比視頻看,它的運動自然度和提示詞遵循度確實讓人眼前一亮。


而淘天集團在電商場景下做視頻生成,有天然的應用優勢:以後商品展示視頻、直播素材、短視頻內容生成,都可能因爲這個模型變得更高效、更便宜。

HappyHorse-1.0的出現,讓整個AI視頻賽道又熱鬧了起來。

它也提醒大家,國內團隊在多模態領域的追趕速度其實比外界想象得更快。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com