AI視頻生成賽道風起云涌,國內(nèi)外新穎的文生、圖生視頻產(chǎn)品層出不窮。在各大廠商的內(nèi)卷之下,當下的視頻生成模型各方面已經(jīng)接近以假亂真的效果。例如,OpenAI 的 Sora 和國內(nèi)的 Vidu、可靈等模型,通過利用 Diffusion Transformer 的擴展特性,不僅能...
在人工智能領域,每一天都可能發(fā)生顛覆性的變革。就在Midjourney剛剛進行大更新的第二天,開源圖像生成領域就迎來了一匹令人矚目的黑馬——FLUX.1。這個突如其來的新玩家不僅在性能上聲稱大幅超越了DALL·E3、Midjourney V6等閉源模型,還將開源的SD3系列全線...
在最近的大模型戰(zhàn)爭中,OpenAI似乎很難維持霸主地位。雖然沒有具體的數(shù)據(jù)統(tǒng)計,但Claude3.5出現(xiàn)后,只是看網(wǎng)友們的反響,就能感覺到OpenAI訂閱用戶的流失:既然Claude3.5比GPT-4o好用,為什么我們不去訂閱Claude呢?而這長達數(shù)月的批評聲中,OpenAI似乎盡顯頹...
這可能會是AI技術形態(tài)的一個轉(zhuǎn)折點,大模型的下一個形態(tài),不再是人和模型一輪一輪的即時問答了。當?shù)貢r間 7 月 29 日,在美國丹佛舉行的第 51 屆 SIGGRAPH 計算機圖形學會議上,英偉達創(chuàng)始人、CEO 黃仁勛與 Meta 創(chuàng)始人、CEO 馬克?扎克伯格進行了一場全球矚目...
繼前幾日推出完開源大模型Llama 3.1后,就在剛剛,Meta在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 來了。在其前身的基礎上,SAM 2 的誕生代表了領域內(nèi)的一次重大進步 —— 為靜態(tài)圖像和動態(tài)視頻內(nèi)容提供實時、可提示的對象分割,將圖像和視頻...
在很長一段時間內(nèi),占據(jù)大模型評測榜單最前列的大多是一些閉源模型,直到Meta再次發(fā)布了最新的開源模型。就在近日,Meta和OpenAI打響了硅谷 AI 大模型保衛(wèi)戰(zhàn)。美國當?shù)貢r間7月23日,Meta正式發(fā)布Llama 3.1。其包含8B、70B 和405B三個規(guī)模,最大上下文提升到了...
在人工智能的浪潮中,個性化體驗已成為創(chuàng)新的關鍵。而隨著各種各樣的模型迭代更新,如何為AI應用提供持久、智能的記憶系統(tǒng)逐漸成為了一個關鍵挑戰(zhàn)。最近開源的Mem0項目為我們提供了一個強大的解決方案。它為大型語言模型(LLM)提供了一個智能、自我優(yōu)化的記憶...
小模型,成為本周的AI爆點。與動輒上千億參數(shù)的大模型相比,小模型的優(yōu)勢是顯而易見的:它們不僅計算成本更低,訓練和部署也更為便捷,可以滿足計算資源受限、數(shù)據(jù)安全級別較高的各類場景。因此,在大筆投入大模型訓練之余,像 OpenAI、谷歌等科技巨頭也在積極...
OpenAI昨日發(fā)布了全新的小型AI模型GPT-4o mini,這一模型在性能和成本效益方面都取得了重大突破,Sam Altman驚呼:通往智能的成本,已變得如此低廉。性能與成本的完美平衡GPT-4o mini在性能上顯著超越了其前身GPT-3.5 Turbo,同時將成本降低了60%以上。每百萬...
近年來,大型語言模型(LLM)的誕生刺激了對即插即用人工智能系統(tǒng)的需求不斷增長,而在各種人工智能技術中,Prompt工程,即通過不斷調(diào)整給予大模型的指令以優(yōu)化大模型生成結(jié)果顯得尤為重要。然而,由于陡峭的學習曲線和大量的時間投入,用戶在編寫提示時經(jīng)常...
近日,當下炙手可熱的快手宣布開源旗下明星產(chǎn)品可靈中一項重要技術項目LivePortrait。,該框架能夠準確、實時地將驅(qū)動視頻的表情、姿態(tài)遷移到靜態(tài)或動態(tài)人像視頻上,生成極具表現(xiàn)力的視頻結(jié)果。如下動圖所示:LivePortrait的主要功能包括從單一圖像生成生動動...
在人工智能領域,我們深感技術發(fā)展的迅速和成就的巨大。其中,法國初創(chuàng)公司MistralAI在這方面尤為令人矚目。MistralAI成立于2023年5月,由DeepMind和Meta的前科學家創(chuàng)立,被稱為歐洲版OpenAI。這是一家創(chuàng)新而富有前景的公司,他們的雄心壯志和成績讓人嘆...
近期,快手平臺又又又成為了焦點。就在OpenAI 當家花旦 Sora 的公測還遙遙無期時,快手就率先祭出了對標的當家產(chǎn)品可靈。得益于其逼真、高清和與Sora不相上下的視覺表現(xiàn),它迅速贏得了全球網(wǎng)民的喜愛。據(jù)快手,可靈申請用戶已經(jīng)近70 萬,已超30 萬用戶使用趁...
簡介一周前,由紅杉投資的硅谷初創(chuàng)公司UTA AI推出了其核心產(chǎn)品Wanderboat AI,這是一個基于GPT-4技術的智能旅行規(guī)劃工具。該平臺允許用戶通過對話交互來明確旅行的偏好和需求,并提供包括目的地、活動和實用建議在內(nèi)的定制化旅行建議。Wanderboat AI整合了視...
簡介近年來,人工智能(AI)技術的進步極大地改變了人類與機器的互動方式,特別是在語音處理領域。阿里巴巴通義實驗室最近開源了一個名為FunAudioLLM的語音大模型項目,旨在促進人類與大型語言模型(LLMs)之間的自然語音交互。FunAudioLLM包含兩個核心模型:...