號(hào)稱地表最強(qiáng)人形機(jī)器人,來了。當(dāng)?shù)貢r(shí)間周二早晨,獲得微軟、英偉達(dá)、OpenAI投資的硅谷著名智能創(chuàng)業(yè)公司 Figure 正式發(fā)布了自己的新一代人形機(jī)器人Figure 02?;跈C(jī)載算力和各個(gè)組件的全方位升級(jí),AI人形機(jī)器人朝著進(jìn)廠打工又邁進(jìn)了一大步。據(jù)介紹,此次它的手有著驚人的16個(gè)自由度,能承受與人類相當(dāng)?shù)闹亓?。除了樣子夠科幻,這種機(jī)器人也有著足夠通用的智能,它可以與人類實(shí)時(shí)對(duì)話,自動(dòng)學(xué)習(xí)如何裝...
隨著大型模型技術(shù)的持續(xù)發(fā)展,視頻生成技術(shù)正逐步走向成熟。以Sora、Gen-3等閉源視頻生成模型為代表的技術(shù),正在重新定義行業(yè)的未來格局。而近幾個(gè)月,國產(chǎn)的AI視頻生成模型也是層出不窮,像是快手可靈、字節(jié)即夢、智譜清影、Vidu、PixVerse V2 等。就在近日,智譜AI秉承以先進(jìn)技術(shù),服務(wù)全球開發(fā)者的理念,宣布將與清影同源的視頻生成模型——CogVideoX開源,以期讓每一位開發(fā)者、每一家企...
AI視頻生成賽道風(fēng)起云涌,國內(nèi)外新穎的文生、圖生視頻產(chǎn)品層出不窮。在各大廠商的內(nèi)卷之下,當(dāng)下的視頻生成模型各方面已經(jīng)接近以假亂真的效果。例如,OpenAI 的 Sora 和國內(nèi)的 Vidu、可靈等模型,通過利用 Diffusion Transformer 的擴(kuò)展特性,不僅能夠滿足各種分辨率、尺寸和時(shí)長的預(yù)測要求,同時(shí)生成的視頻更符合物理世界的表現(xiàn)。但與此同時(shí),大部分視頻生成模型的準(zhǔn)確程度、遵循指令...
在人工智能領(lǐng)域,每一天都可能發(fā)生顛覆性的變革。就在Midjourney剛剛進(jìn)行大更新的第二天,開源圖像生成領(lǐng)域就迎來了一匹令人矚目的黑馬——FLUX.1。這個(gè)突如其來的新玩家不僅在性能上聲稱大幅超越了DALL·E3、Midjourney V6等閉源模型,還將開源的SD3系列全線秒殺,瞬間引爆了AI圈。出道即巔峰專找最硬的打,有點(diǎn)喬峰橫掃聚賢莊的意思。原來剛成立的FLUX.1的創(chuàng)始人是大名鼎鼎的Ro...
在最近的大模型戰(zhàn)爭中,OpenAI似乎很難維持霸主地位。雖然沒有具體的數(shù)據(jù)統(tǒng)計(jì),但Claude3.5出現(xiàn)后,只是看網(wǎng)友們的反響,就能感覺到OpenAI訂閱用戶的流失:既然Claude3.5比GPT-4o好用,為什么我們不去訂閱Claude呢?而這長達(dá)數(shù)月的批評(píng)聲中,OpenAI似乎盡顯頹勢,除了GPT-4o mini這個(gè)小模型以外,似乎再也沒有什么創(chuàng)新點(diǎn)。甚至就在前幾日,GPT-4o還被開源的大模...
UCloud小助手