歡迎來到 簽名詞典網(wǎng) , 一個(gè)專業(yè)的簽名鑒賞學(xué)習(xí)網(wǎng)站!

      [ Ctrl + D 鍵 ]收藏本站

      您所在的位置:首頁(yè) > 資訊 > 最新資訊

      最新資訊

      商業(yè)頭條No.13|Sora沖擊波

      分類: 最新資訊 簽名詞典 編輯 : 簽名大全 發(fā)布 : 02-26

      閱讀 :315

      界面新聞?dòng)浾?| 肖芳 李京亞界面新聞編輯 | 劉方遠(yuǎn)OpenAI發(fā)布Sora的當(dāng)天,綠洲資本董事總經(jīng)理胡哲人正在老家陪家人過春節(jié)假期。看到新聞之后,他第一時(shí)間到OpenAI官網(wǎng)查看了Sora的資料。“看得越多,感受到的沖擊和震撼就越大。”過去一年,胡哲人幾乎把AIGC領(lǐng)域文生圖、文生視頻的項(xiàng)目看了個(gè)遍,對(duì)Runway、Pika等海外公司的動(dòng)態(tài)盯得也比較緊。但看到Sora的視頻演示片段,他還是有一種完全意想不到的感覺。很多AI投資人的反應(yīng)和他類似。在ChatGPT出現(xiàn)之后,他們就一直在討論文生視頻的技術(shù)以及商用價(jià)值。但按他們的評(píng)估,距離技術(shù)成熟達(dá)到商用水平至少需要兩年,沒人預(yù)料到進(jìn)展這么快。“視頻demo片段會(huì)不會(huì)是假的?”包括胡哲人在內(nèi)的多位投資人看完Sora發(fā)布的新聞之后,都產(chǎn)生了類似的懷疑。理由是OpenAI公司前段時(shí)間遭遇了創(chuàng)始人被驅(qū)逐等諸多風(fēng)波,現(xiàn)在為了抬高估值繼續(xù)融資,它急需放出一個(gè)吸引眼球的東西。胡哲人的懷疑則來自于OpenAI并沒有把Sora開放,絕大部分人都無法使用,只能看他們放出的演示。作為每年在國(guó)內(nèi)看大量項(xiàng)目的投資人,直覺告訴他,這個(gè)東西沒有像ChatGPT一樣成為一個(gè)人人可用的產(chǎn)品,只能說明它還不成熟。他立刻和自己在上海交大的直系師弟進(jìn)行了溝通,對(duì)方是非常知名的人工智能科學(xué)家。經(jīng)過雙方交流,再結(jié)合OpenAI官網(wǎng)產(chǎn)品信息介紹和技術(shù)報(bào)告,胡哲人基本可以確認(rèn)OpenAI的Sora不是忽悠。他仍然想得到更確切的信息,最終輾轉(zhuǎn)找到了在美國(guó)的朋友得到了Sora的內(nèi)測(cè)機(jī)會(huì)。“我現(xiàn)在比較確認(rèn)Sora是有真材實(shí)料的,而不是一個(gè)只為了宣傳的純市場(chǎng)行為。”怎么會(huì)這么快?在Google發(fā)布Gemini 1.5的當(dāng)天,OpenAI放出了Sora,徹底打壓了前者的熱度。在正式發(fā)布之后,OpenAI相關(guān)團(tuán)隊(duì)成員便不斷在社交平臺(tái)X上放出Sora的演示。它能根據(jù)用戶的文字提示,生成一段從細(xì)節(jié)精度、多樣性到對(duì)物理規(guī)律的理解上都令人驚嘆的視頻。這些內(nèi)容被集合推送至OpenAI的TikTok賬號(hào)上,短短5天內(nèi)便獲得了51.3萬次贊,粉絲數(shù)也漲至10.6萬。除了演示視頻,OpenAI還放出了兩份文件,一份是上線聲明,一份是技術(shù)報(bào)告。不過,自去年多模態(tài)大模型GPT-4問世之后,OpenAI官方釋出的報(bào)告愈發(fā)精簡(jiǎn),不再把細(xì)節(jié)公之于眾。比如這次就只字未提與模型架構(gòu)、數(shù)據(jù)規(guī)模、訓(xùn)練成本等相關(guān)的重點(diǎn)議題。外界只能結(jié)合報(bào)告,并通過已有的視頻做各種技術(shù)推演。在深入這一領(lǐng)域的研究者看來,Sora在關(guān)鍵指標(biāo)上碾壓了目前市面上最好的文生視頻產(chǎn)品們。制圖:何苗研究員LiJun Yu目前在參與Google的VideoPoet項(xiàng)目,它是Google唯一有望和Sora形成競(jìng)爭(zhēng)的產(chǎn)品。他在播客節(jié)目OnBoard!上表示,VideoPoet在生成視頻時(shí)長(zhǎng)和分辨率這兩點(diǎn)都不及Sora, “我們的時(shí)長(zhǎng)在2秒到5秒之間,很難一下子做到60秒。”這是極大的差距。一個(gè)視頻從幾秒到一分鐘,不是單純時(shí)間長(zhǎng)度的升級(jí),而是數(shù)據(jù)量、數(shù)據(jù)復(fù)雜度以及構(gòu)建視頻空間連貫性、一致性這些信息的指數(shù)級(jí)增加。目前,業(yè)界普遍猜測(cè)Sora的成功延續(xù)了OpenAI的Scaling law法則,即通過海量的數(shù)據(jù),大量的算力,再加上大參數(shù)模型,最終“大力出奇跡”。出門問問創(chuàng)始人李志飛認(rèn)為,Sora很可能是訓(xùn)練時(shí)將OpenAI的大語(yǔ)言模型LLM作為起點(diǎn),然后再加入視頻的模態(tài)繼續(xù)訓(xùn)練。“Sora團(tuán)隊(duì)只有13人,肯定是大規(guī)模復(fù)用了大語(yǔ)言模型的東西。”云啟資本合伙人陳昱表示,其在2021年底天使輪投資了多模態(tài)基礎(chǔ)模型公司MiniMax。OpenAI似乎短期內(nèi)不會(huì)向大眾開放Sora。除了在社交平臺(tái)上與CEO Sam Altman互動(dòng),外界并不能直接參與到Sora內(nèi)測(cè)中去。OpenAI自己解釋稱,技術(shù)仍存在一些缺陷,包括一些空間問題。不過,這并不妨礙它成為現(xiàn)在世界上最強(qiáng)的文生視頻產(chǎn)品。OpenAI的技術(shù)報(bào)告也在標(biāo)題上赫然指出,Sora這種視頻生成模型是「世界的模擬器」。“是不是又要換方向了?”同樣經(jīng)歷了Sora帶來的震撼之后,一批應(yīng)用層AI創(chuàng)業(yè)者開始坐不住了。“是不是又要換方向了?”一位文生視頻公司的創(chuàng)始人向界面新聞表達(dá)了他的挫敗感。目前,國(guó)內(nèi)有100多家專門做AI文生圖和AI文生視頻的公司。去年下半年,Runway一些源代碼釋出,國(guó)內(nèi)還出現(xiàn)了一批專門使用Runway做文生視頻的公司。因?yàn)镃hatGPT的走紅帶火了整個(gè)AIGC賽道,投資機(jī)構(gòu)也非常傾向于投資文生圖和文生視頻類公司,因?yàn)檫@類公司的產(chǎn)品和服務(wù)能夠很快出來,做出來的產(chǎn)品也比較酷炫。制圖:何苗“就像炒股,文生視頻是非常火爆的題材,去年下半年新入場(chǎng)的初創(chuàng)算是追到了高點(diǎn),沒想到突然又出來Sora,可能有一批你聽都沒有聽過的公司直接就要消失了。”波形智能首席產(chǎn)品官萬磊表示。萬磊太熟悉這種感覺了,從去年年初創(chuàng)業(yè)以來,他看到了一批又一批AI創(chuàng)業(yè)公司因?yàn)镚PT版本的升級(jí)迭代而死掉。他自己也是典型案例:最開始,萬磊做了一個(gè)AI英語(yǔ)口語(yǔ)培訓(xùn)應(yīng)用,主打的是用戶可以選擇不同性格的英語(yǔ)老師來對(duì)話練習(xí),分析自己的語(yǔ)法問題。當(dāng)時(shí)這是一個(gè)非常新鮮的創(chuàng)意,幾乎沒有人能模仿。但當(dāng)GPT-3.5出來之后,大批競(jìng)爭(zhēng)對(duì)手涌現(xiàn),OpenAI的升級(jí)讓訓(xùn)練難度大幅降低。而GPT-4發(fā)布之后,這個(gè)產(chǎn)品徹底喪失了競(jìng)爭(zhēng)力,用戶可以直接和GPT語(yǔ)音對(duì)話,人物角色訓(xùn)練只需要短短幾句話就能完成。同樣,去年上半年還涌現(xiàn)一批AI輔助視頻創(chuàng)作的公司,但并不像Sora這么智能,還需要素材庫(kù)的輔助。在嘉程資本創(chuàng)始合伙人李黎看來,Sora把視頻素材庫(kù)類的公司全部都顛覆掉了,這個(gè)方向的公司,她所在的機(jī)構(gòu)也不會(huì)再投。但經(jīng)歷了去年一波又一波的技術(shù)迭代之后,很多AI創(chuàng)業(yè)者和投資人對(duì)新技術(shù)帶來的創(chuàng)業(yè)公司倒閉潮已見怪不怪。在他們看來,AI創(chuàng)業(yè)就是在這種技術(shù)爆炸過程中摩擦成長(zhǎng)的。“Sora的出現(xiàn)對(duì)國(guó)內(nèi)的AI創(chuàng)業(yè)者也不是壞事。如果你對(duì)自己的創(chuàng)業(yè)項(xiàng)目還有期待的話,看到Sora之后就可以立刻停掉換方向了。”一位投資人表示,“這其實(shí)是救了很多公司,尤其是一些排位比較靠后的AI視頻類公司。”“融不到10億美金,可以洗洗睡了”在Sora發(fā)布之后,國(guó)內(nèi)的基礎(chǔ)大模型公司開始了新一輪公關(guān)戰(zhàn)。月之暗面率先開戰(zhàn),于2月19日宣布完成了最新一輪10億美元融資。而另一家公司,在還沒有完成新一輪10億美元融資之際,已經(jīng)先向媒體放風(fēng)公布了即將完成融資的消息。如果說應(yīng)用層公司對(duì)Sora的反應(yīng)是悲喜交加,那國(guó)內(nèi)做基礎(chǔ)大模型的公司更像是遭遇了一次生死存亡的警告。Sora的出現(xiàn)再次驗(yàn)證了大數(shù)據(jù)大算力的“暴力美學(xué)”,這會(huì)逼迫追趕者繼續(xù)去堆算力,但堆算力就意味著要燒更多的錢。“基礎(chǔ)大模型的創(chuàng)業(yè)公司,如果融不到10億美金,可以暫時(shí)洗洗睡了。”陳昱表示。這是一場(chǎng)持久戰(zhàn),10億美金只是擠上牌桌的資格。要訓(xùn)練一個(gè)等效于GPT-4的模型需要5000-10000張H系列的GPU卡,而每張卡的價(jià)格高達(dá)3萬美元,再加其他配套設(shè)備成本,投入可達(dá)數(shù)億美元。而這還不包括推理需要的算力和人力成本,未來的模型升級(jí)所花費(fèi)的資金還要上一個(gè)數(shù)量級(jí)。業(yè)界普遍認(rèn)為,在國(guó)內(nèi)眾多基礎(chǔ)大模型創(chuàng)業(yè)公司中,留下的不會(huì)超過5家。當(dāng)下正是各家公司打融資心理戰(zhàn)的時(shí)候,多一家公司公布融資信息,就意味著又有幾家將被擠下牌桌,需要盡早放棄基礎(chǔ)大模型的研發(fā)。制圖:何苗除了創(chuàng)業(yè)公司,互聯(lián)網(wǎng)大廠的情況也并不樂觀。在Sora發(fā)布之后,大廠中只有字節(jié)跳動(dòng)公布正在研發(fā)一款名為Boximator的創(chuàng)新性視頻生成模型。但字節(jié)跳動(dòng)官方給出的回應(yīng)稱:Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無法作為完善的產(chǎn)品落地,距離國(guó)外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長(zhǎng)等方面還有很大差距。“這些互聯(lián)網(wǎng)大廠內(nèi)部肯定在做,也一定有還沒放出來的。但我相信,這些大廠沒放出來,只能是因?yàn)樾Ч€不盡如人意。”一位行業(yè)人士告訴界面新聞。而在另一位多模態(tài)大模型公司開發(fā)者看來,在用戶端爆火過的模特?fù)Q裝和科目三舞蹈,根本不是真正意義上的文生視頻。模特?fù)Q裝是通過改描述詞,修改視頻元素得成。而科目三舞蹈只是把模版視頻里的動(dòng)作骨骼提取出來,再加到用戶上傳的自己那張照片上,只能算是動(dòng)作提取。“基礎(chǔ)大模型核心還是要靠人才。”一位初創(chuàng)AI公司創(chuàng)始人對(duì)界面新聞表示。他在一家頭部互聯(lián)網(wǎng)大公司任職多年,熟知大廠內(nèi)部的情況。他表示,一些大廠內(nèi)的創(chuàng)業(yè)激情已經(jīng)很少了,組織關(guān)系非常固化,年輕人想提一個(gè)意見很難。“而大模型真正需要的是年輕人拼了命去干,才能干成的。”事實(shí)上,新一輪搶人戰(zhàn)也在打響。最新消息顯示,資深人工智能專家,Google VideoPoet項(xiàng)目研究負(fù)責(zé)人蔣路被挖去了TikTok,這體現(xiàn)出字節(jié)不想置身事外的態(tài)度。多位字節(jié)內(nèi)部人士告訴記者,去年6月字節(jié)內(nèi)部決定不投資任何大模型公司,把所有精力都專注在自建模型上,但此后其全盤AI工作進(jìn)展一直不順。人才會(huì)是算力之外的另一卡點(diǎn),也是新的變數(shù)。昆侖萬維董事長(zhǎng)兼CEO方漢日前稱,目前看,國(guó)內(nèi)大模型公司最稀缺的是核心算法人才,但樂觀的是,供需情況會(huì)迅速得到緩解。“還是先追上GPT-4吧”既然Sora生成視頻的能力被公認(rèn)是一項(xiàng)可用的強(qiáng)力資產(chǎn),那國(guó)內(nèi)有什么方法可以迎頭趕上?“我們現(xiàn)在根本還扯不到多模態(tài)的事情上去。”某互聯(lián)網(wǎng)大廠一位技術(shù)專家告訴記者,Sora問世幾天來,他們內(nèi)部也很焦慮。“都還不知道接下來要怎么辦。”目前互聯(lián)網(wǎng)大廠中,只有字節(jié)、騰訊、百度披露了視頻生成相關(guān)的工作, 但水花不大。在頭部大模型初創(chuàng)公司中,也只有智譜在文生視頻方面有所布局。事實(shí)上,有沒有視頻生成模型也許不那么重要。“ChatGPT之前大家也都有聊天機(jī)器人啊……關(guān)鍵是能不能到達(dá)那個(gè)水準(zhǔn)。”某大廠模型業(yè)務(wù)負(fù)責(zé)人有些無奈,據(jù)其透露,這家大廠暫不打算開展文生視頻方面的工作。初創(chuàng)方面則是另一番局面。去年下半年,國(guó)內(nèi)AIGC領(lǐng)域融資向文生圖與視頻方向靠攏,一批外界很少聽聞的公司悄然成立之后又迅速走向消亡。文生視頻領(lǐng)域剩下的幾家佼佼者,包括清華大學(xué)計(jì)算機(jī)系教授朱軍的生數(shù)科技,原字節(jié)跳動(dòng)視覺技術(shù)負(fù)責(zé)人王長(zhǎng)虎創(chuàng)辦的愛詩(shī)科技,以及前京東副總裁梅濤創(chuàng)辦的HiDream。但目前這幾家的產(chǎn)品和 Sora 對(duì)比,已被全面碾壓。前亞馬遜首席科學(xué)家,著名深度學(xué)習(xí)專家李沐建議業(yè)界過一陣再來談Sora,他認(rèn)同大量媒體的評(píng)價(jià),即Sora的工作有點(diǎn)像視頻生成界GPT-2到GPT-3的時(shí)刻,模型本身跟前作變化不大,但使用了幾百倍算力,“目前報(bào)告關(guān)鍵問題有所缺失,相信學(xué)界和開源界會(huì)很快跟進(jìn)。”現(xiàn)下,國(guó)內(nèi)基礎(chǔ)模型層公司的當(dāng)務(wù)之急并不是努力趕上Sora,而是努力趕上GPT-4。去年年中,有創(chuàng)業(yè)者專門詳細(xì)測(cè)試對(duì)比了所有國(guó)內(nèi)主流大模型產(chǎn)品與GPT-4,得到的結(jié)論是“有很大進(jìn)步空間”。科大訊飛董事長(zhǎng)劉慶峰則公開表示,國(guó)產(chǎn)大模型在復(fù)雜知識(shí)推理、小樣本快速學(xué)習(xí)、超長(zhǎng)文本處理、跨模態(tài)統(tǒng)一理解上跟GPT-4還有差距。“GPT-4放前面,Sora放后面,國(guó)內(nèi)還是先把GPT-4搞好吧。”近日,與陳昱接觸的國(guó)內(nèi)大模型創(chuàng)業(yè)者們目前也沒有特別焦慮,因?yàn)榇蠹叶汲两谂ψ鯣PT-4的進(jìn)程之中,“我知道幾家包括大廠內(nèi)部都在訓(xùn)練,都沒有訓(xùn)練完。”據(jù)他判斷,第二季度會(huì)是國(guó)內(nèi)版“GPT-4”真正出爐的節(jié)點(diǎn)。萬磊感受到,去年大家普遍都在“卷技術(shù)”。這位大廠出身的90后創(chuàng)業(yè)者說,如果不做真正技術(shù)上的突破,大家對(duì)于“國(guó)外AI教父是奧特曼,國(guó)內(nèi)是李一舟”的吐槽便會(huì)成為現(xiàn)實(shí),這是他最擔(dān)憂的事情。“焦慮是沒有用的,不解決問題。”嘉程資本創(chuàng)始合伙人李黎稱,創(chuàng)業(yè)者必須仔細(xì)看清楚當(dāng)前所處的位置,做好能做的事情。還有新機(jī)會(huì)嗎?當(dāng)然,面對(duì)Sora其他人不是完全沒有機(jī)會(huì)。在Sora模型發(fā)布的當(dāng)天,Meta推出了一款全新開源視頻預(yù)測(cè)模型V-JEPA。開源大語(yǔ)言模型在過去一年經(jīng)歷了如火如荼的發(fā)展,其中的佼佼者與GPT-4之間的差距已經(jīng)越來越小。硅谷風(fēng)投機(jī)構(gòu)Fusion Fund創(chuàng)始人張璐表示,開源領(lǐng)域有很大的競(jìng)爭(zhēng)空間。她看好開源平臺(tái)層面上有新的語(yǔ)言模型能對(duì)標(biāo)GPT-4,當(dāng)然也會(huì)有新的多模態(tài)模型能追上Sora。技術(shù)的顛覆是更具想象力的一條道路。現(xiàn)在業(yè)界基本達(dá)成共識(shí),Sora所做的是把擴(kuò)散模型Diffusion和Transformer骨架結(jié)合在一起,加上大量的數(shù)據(jù)和算力最終產(chǎn)生了我們看到的結(jié)果。但這種方式也許不是文生視頻的最優(yōu)解。圖靈獎(jiǎng)獲得者、Meta首席科學(xué)家楊立昆就曾多次批判OpenAI的技術(shù)路線。Sora出現(xiàn)贏得所有人的驚嘆之后,他也表示這些視頻并不代表模型理解了物理世界。Amino Capital合伙人徐霄羽表示,Pika未來的技術(shù)路線也很值得觀察。這家初創(chuàng)公司目前正在自建模型。在對(duì)Sora技術(shù)路線的質(zhì)疑聲中,老生常談“作為AI大模型主流架構(gòu)的Transformer也許并非唯一解”被重新提上日程。硅谷投資人們一直認(rèn)為,如果能出現(xiàn)其他超越Transformer的新模型,那OpenAI就不會(huì)獨(dú)占鰲頭。面對(duì)Sora的橫空出世,Runway CEO第一時(shí)間在X上發(fā)推稱,“game on(競(jìng)爭(zhēng)開始了)” ,表態(tài)要和OpenAI正面競(jìng)爭(zhēng)。國(guó)內(nèi)技術(shù)派創(chuàng)業(yè)者也沒有示弱。“我們看到Sora也很激動(dòng),正在加班加點(diǎn)迎頭追趕。”王長(zhǎng)虎創(chuàng)辦的愛詩(shī)科技仍保持樂觀,這家公司和Sora完全處在同一賽道之上。更多應(yīng)用層的創(chuàng)業(yè)者則在思考如何能利用上Sora的能力來幫助自己。“Sora出來之后,我們非常興奮,做一個(gè)真的有血有肉的電影完全沒問題了。”萬磊第一時(shí)間意識(shí)到了公司的新機(jī)會(huì),并立刻在合伙人群里分享自己看法。他參與創(chuàng)辦的新公司波形智能的主要業(yè)務(wù)是基于自研模型生成小說、劇本內(nèi)容。去年,波形智能討論過將業(yè)務(wù)從劇本創(chuàng)作拓展至成品的短劇生成一條龍服務(wù),但這個(gè)方向最終卡在了文生視頻的質(zhì)量上,當(dāng)時(shí)市面上的接口基本都無法達(dá)到滿意的效果。現(xiàn)在,也許新的機(jī)會(huì)就要來了。“現(xiàn)在我們的戰(zhàn)略可以重新調(diào)整了。”他說。
      主站蜘蛛池模板: 无码人妻精一区二区三区| 亚洲av乱码一区二区三区按摩| 国产福利一区二区三区在线视频 | 亚洲av成人一区二区三区在线播放 | 中文字幕在线看视频一区二区三区| 午夜视频在线观看一区二区| 一区二区三区国产精品 | 日韩精品一区二区亚洲AV观看| 国产精品一区二区av不卡| 午夜一区二区在线观看| 亚洲熟妇AV一区二区三区浪潮| 亚洲美女视频一区| 色偷偷av一区二区三区| 农村乱人伦一区二区| 人妻无码久久一区二区三区免费| 亚欧成人中文字幕一区| 亚洲毛片αv无线播放一区| 国模精品一区二区三区| 日韩制服国产精品一区| 日韩电影一区二区三区| 狠狠色婷婷久久一区二区 | 亚洲av成人一区二区三区观看在线| 91视频国产一区| 精品无码一区二区三区在线 | 免费一区二区视频| 国产精品无码一区二区三区不卡| 久久精品成人一区二区三区| 国产麻豆精品一区二区三区| 国产精品日韩一区二区三区| 日本精品一区二区三区在线视频| 精品中文字幕一区二区三区四区| 精品中文字幕一区二区三区四区| 国产福利一区二区在线视频| 国产一区二区三精品久久久无广告| 中文字幕在线观看一区二区三区| 国产一区二区三区91| 日产精品久久久一区二区| 亚洲AV无码一区二区乱子仑| 精品国产一区二区三区久久狼| 一区二区三区视频网站| 亚洲爆乳无码一区二区三区|