"多模態(tài)"相關(guān)的文章
業(yè)界動(dòng)態(tài)
Sora的最強(qiáng)競(jìng)爭(zhēng)對(duì)手,來(lái)自中國(guó)

Sora的最強(qiáng)競(jìng)爭(zhēng)對(duì)手,來(lái)自中國(guó)

在AI視頻生成領(lǐng)域,Sora模型的發(fā)布曾引起業(yè)界廣泛關(guān)注,但其算法閉源限制了進(jìn)一步的應(yīng)用與發(fā)展。近期,一家與清華大學(xué)合作的初創(chuàng)公司生數(shù)科技推出了Vidu,這是一款在性能上與Sora相媲美的中國(guó)首個(gè)長(zhǎng)時(shí)視頻大模型。Vidu采用U-ViT架構(gòu),結(jié)合Diffusion與Transformer技術(shù),能夠生成長(zhǎng)達(dá)16秒的高清視頻,展現(xiàn)了視頻大模型在多鏡頭生成、模擬真實(shí)世界等方面的先進(jìn)能力。本文將深入探討Vidu的技術(shù)特點(diǎn)、工程化能力,以及其在推動(dòng)國(guó)產(chǎn)多模態(tài)大模型創(chuàng)新中的潛在影響。
AI
2028年人類將迎來(lái)AGI:DeepMind聯(lián)合創(chuàng)始人長(zhǎng)文預(yù)測(cè)未來(lái)AI發(fā)展

2028年人類將迎來(lái)AGI:DeepMind聯(lián)合創(chuàng)始人長(zhǎng)文預(yù)測(cè)未來(lái)AI發(fā)展

AGI這個(gè)概念,相信不少人都聽(tīng)說(shuō)過(guò),那么,我們具體該如何為AGI做出定義?AGI又會(huì)何時(shí)到來(lái)?來(lái)自谷歌DeepMind的創(chuàng)始人兼首席AGI科學(xué)家Shane Legg在近期便做了描述和分享,一起來(lái)看看本文。
AI
再次炸天的OpenAI,大模型生態(tài)初現(xiàn)

再次炸天的OpenAI,大模型生態(tài)初現(xiàn)

許多業(yè)內(nèi)人士都在關(guān)注OpenAI的首屆開(kāi)發(fā)者大會(huì),而在這場(chǎng)發(fā)布會(huì)后,可以看到,OpenAI提供的生態(tài)能力或許將解決大模型發(fā)展的一些關(guān)鍵難點(diǎn),大模型的應(yīng)用層將迎來(lái)進(jìn)一步爆發(fā),大模型生態(tài),正在初步顯現(xiàn)。
AI
從Agent到多模態(tài),大模型想要什么?

從Agent到多模態(tài),大模型想要什么?

人類大腦皮層是相似的,但因?yàn)楦兄答佁幚韮?nèi)容不同而分成了不同的功能區(qū)來(lái)處理聽(tīng)覺(jué)、視覺(jué)和味道。OpenAI如果真的如預(yù)期在這條路上徹底跑通商業(yè)模式,那無(wú)疑是對(duì)整個(gè)行業(yè)的最大刺激,也會(huì)給自己打下超級(jí)巨頭的堅(jiān)實(shí)基礎(chǔ)。