本項目測試參考歌聲,歌詞“風吹來的砂冥冥在哭泣,難道早就預言了分離”:3gt夕小瑤科技說12秒提示詞“Iwanttolistentoasongwithamanvoice.”生成的歌聲:轉換男聲夕小瑤科技說12秒提示詞“I'minthemoodforasongperformedbyamadamartist.”生成的歌聲:轉換女聲夕小瑤科技說12秒引言:自然語言指令在歌聲合成中的新突破在數字音頻技術的發展歷程中,歌聲合成(SingingVoiceSynthesis,SVS)一直是一個充滿挑戰的領域。隨著深度...
2024-04-03 09:44:58 5819瀏覽 0點贊 0回復 0收藏
引言:探索記憶消除的界限在人工智能的發展過程中,一個引人入勝的議題是機器學習模型是否能夠被訓練以忘記其曾經學到的信息。近期,RonenEldan和MarkRussinovich在其研究“誰才是哈利·波特?”[1]中提出了一種創新技術,聲稱能夠從LLMs中“抹去”特定數據集的記憶,尤其是針對《哈利·波特》這樣的知名作品。他們的方法引發了業界的廣泛關注,并被認為是在LLMs“遺忘”技術領域的一大突破。但是,本文將對Eldan和Russinovich...
2024-04-03 09:33:28 3184瀏覽 0點贊 0回復 0收藏
引言:AI時代的信息真偽辨識在人工智能迅猛發展的今天,我們面臨著前所未有的信息真偽辨識挑戰。AI技術,尤其是深度學習模型,已經能夠生成極其逼真的圖片、音頻和視頻內容,這些內容被統稱為DeepFakes。DeepFakes的出現給信息的可信度和數字媒體的信任帶來了嚴重的挑戰。因此,識別DeepFakes成為了媒體取證領域中一個緊迫且關鍵的任務。這篇論文研究了多模態大語言模型(LLMs)在DeepFakes檢測上的作用。通過定性和定量實驗,...
2024-04-03 09:10:33 4819瀏覽 0點贊 0回復 0收藏
引言:大語言模型的高效微調及其在多樣化任務中的應用在人工智能領域,大語言模型(LLMs)已成為推動技術進步的關鍵力量。它們在理解和生成自然語言方面展現出了卓越的能力,從而在問答系統、機器翻譯、信息提取等多樣化任務中發揮著重要作用。然而,要將這些模型適配到特定的下游任務中,通常需要進行微調(finetuning),這是一個資源密集型的過程。高效的微調方法因此成為了研究的熱點,旨在減少訓練成本,同時保持或提升模...
2024-04-03 08:55:52 4714瀏覽 0點贊 0回復 0收藏
你有沒有想過,如果有一天ChatGPT有了身體,跑到你辦公桌上成了你的寵物,這是個多么有趣的場景,LOOI就是這樣一款把幻想帶進現實的產品不得不說,ChatGPT讓具身智能達到了新高度,LOOI便應運而生。LOOI是什么LOOI是一個集成了ChatGPT為大腦的智能桌面機器人,你可以叫它為?lu?i,類似于英美口音中的“Louie”(路易)。它可以理解復雜的指令,與人類順暢地溝通。它還能通過視覺模塊感知周圍的一切,他會想要了解你在做什么,...
2024-04-03 08:47:25 4447瀏覽 0點贊 0回復 0收藏
OpenAI又帶來了一項超酷的進展!周五推出了一項名為VoiceEngine的語音引擎,僅憑一段15秒的聲音樣本,便能夠精準模仿出那個人的聲音。VoiceEngine的獨特之處在于,它能通過簡單的文本輸入和短短音頻樣本,創造出非常接近原始說話者的自然聲音。這意味著無論你讓它讀什么語言的文字,都能以那個人獨有的聲音風格朗讀,效果既逼真又充滿感情。總而言之,OpenAI通過這項新技術展示了人工智能復制人聲的驚人可能性,接下來讓我們一...
2024-04-03 08:32:17 2820瀏覽 0點贊 0回復 0收藏
2024年3月21日,HeyGen5.0正式發布!這款革命性的AIGC產品將AI數字人的魔力融入視頻創作,以其簡潔易用的特性,讓視頻制作變得輕而易舉。只需幾次點擊,即可打造出令人驚嘆的高品質視頻作品!不僅如此,HeyGen支持超過40種語言和多種口音,每一個數字人都是語言大師!如此驚艷!HeyGen5.0生成的數字人不僅可以保持口型同步,克隆語音語調,保留背景聲,還能精準的識別和追蹤用戶的身體動作,如手部移動和手勢!讓我們看看下面的...
2024-04-03 08:16:36 4614瀏覽 0點贊 0回復 0收藏
引言:大語言模型數學能力評估的重要性數學能力的評估對于理解和發展大語言模型(LLMs)至關重要。數學問題不僅涉及對數字的理解和操作,還包括了抽象概念化、邏輯推理等核心能力的考察。因此,一個高質量的數學評估基準對于全面評估LLMs的能力具有重大意義。傳統的數學問題數據集,如AddSub和MultiArith(下圖),提供了基礎的數學詞匯問題庫,但這些通常只能評估模型在特定數學問題上的準確性。隨著中文LLMs的迅速發展,相應...
2024-04-03 08:11:32 4363瀏覽 0點贊 0回復 0收藏
StabilityAI又有新動作!程序員又有危機了?3月26日,StabilityAI推出了先進的代碼語言模型StableCodeInstruct3B,該模型是在StableCode3B的基礎上進行指令調優的CodeLM。StabilityAI表示,StableCodeInstruct3B在代碼完成準確性、對自然語言指令的理解以及處理多種編程語言方面都優于同類模型,在3B規模下提供最先進的性能,并且性能媲美Codellama7BInstruct以及DeepSeekCoderInstruct1.3B先讓我們來感受一下StableCodeInstruc...
2024-04-03 08:08:05 4670瀏覽 0點贊 0回復 0收藏
當今大模型如此火熱,作為一名數據同學,持續在關注LLM是如何應用在數據分析中的,也關注到很多公司推出了AI數智助手的產品,比如火山引擎數智平臺VeDI—AI助手、KyligenceCopilotAI數智助理、ThoughtSpot等,通過接入人工智能大模型,提升數據處理和查詢分析的效率。智能數據分析助手,采用對話式分析技術,每個普通人都可以與數據進行隨時隨地的實時交互,根據用戶的使用反饋,不斷學習,自我迭代找到答案,并在團隊內分享對...
2024-04-01 16:24:52 9196瀏覽 0點贊 0回復 0收藏
擴散模型是目前大部分AIGC生圖模型的基座,其本質是用神經網絡學習從高斯噪聲逐步恢復圖像的過程,本文用python代碼從零開始構建了一個簡單的擴散模型。一、理論部分DDPM(DenoisingDiffusionProbabilisticModels)是一種在生成對抗網絡等技術的基礎上發展起來的新型概率模型去噪擴散模型,與其他生成模型(如歸一化流、GANs或VAEs)相比并不是那么復雜,DDPM由兩部分組成:一個固定的前向傳播的過程,它會逐漸將高斯噪聲添加到圖...
2024-04-01 15:44:23 6369瀏覽 1點贊 0回復 1收藏
靈感藝術家項目,旨在通過AIGC繪圖能力,聯合商家打造低門檻+高趣味性的宣傳海報設計大賽,本文分享我們的方案和優化方向。建議對AIGC感興趣的工程、算法方向的同學閱讀。一、項目背景靈感藝術家項目,旨在通過AIGC繪圖能力,聯合商家打造低門檻+高趣味性的宣傳海報設計大賽,為新品進行宣傳和造勢。同時也是為了給消費者提供參與新品宣發的通道。二、目標拆解GPT部分采用通義千問大語言模型,詳見其技術文檔。本文重點介紹海報...
2024-03-28 15:30:57 4657瀏覽 0點贊 0回復 0收藏
隨著OpenAI推出ChatGPT,AIGC迎來了前所未有的發展機遇。大模型技術已經不僅僅是技術趨勢,而是深刻地塑造著我們交流、工作和思考的方式。本文介紹了筆者理解的大模型和AIGC的密切聯系,從歷史沿革到實際應用案例,再到面臨的技術挑戰和倫理監管問題,探討這一技術浪潮如何引領我們進入一個智能化的未來。一、前言引言:AI時代,未來已來2022.11月30號OpenAI推出ChatGPT后隨即爆火,五天注冊用戶數過百萬,2個月用戶破1億,成為...
2024-03-28 15:19:20 6516瀏覽 0點贊 0回復 0收藏
捏臉玩法是裝扮類應用的一個核心功能。本文主要介紹了捏臉的AI相關玩法之一即基于用戶上傳的照片在淘寶人生2(又名:第二人生)一鍵生成專屬3D數字人,闡述了淘天FC淘寶人生技術團隊在圖片捏臉上探索的心路歷程,核心原理以及技術框架。本文的視角也不局限于圖片捏臉本身,也介紹了其他AI類相關玩法在裝扮類應用落地的情況,希望能對大家有所啟發和幫助。一、背景淘寶人生是國內用戶規模較大的裝扮類應用之一,在淘寶中扮演了用...
2024-03-28 14:33:29 5530瀏覽 0點贊 0回復 0收藏
本文深入探討了基于參考物體的人工智能圖像生成(AIGC)技術的最新進展。首先概述了該類技術如何發展至今,然后著重分析了兩篇重要的相關學術論文。隨后,文章針對家居導購領域的特殊應用場景,討論了運用此項技術時遭遇的挑戰和取得的最新效果。?一、引言隨著AIGC技術的快速發展,其中以StableDiffusion模型為代表的的文生圖技術已經在內容生成領域產生了應用價值,用戶只需要提供一段文本輸入,就能通過AI模型快速生成大量美...
2024-03-28 14:15:58 2765瀏覽 0點贊 0回復 0收藏
本文總結了近10年來的生圖模型論文中用到的評價指標,并嘗試解答兩個問題不同時期的評價標準都有哪些特點?圖片質量的評價如何輔助模型的迭代??一、前言隨著各種文生圖模型逐漸從toyproject進入到生產鏈路,在線上實際落地并產生業務價值,同時自研來源模型也進入了快速迭代的階段。一套直指問題、綜合拓展性和復用性的評價指標變得尤為寶貴,從效果上來講,如果說數據質量決定了模型效果的上限,那么指標的好壞直接決定了模...
2024-03-28 14:10:44 7177瀏覽 0點贊 0回復 0收藏
淘寶人生2(又名:第二人生)是淘寶的一個虛擬人裝扮類應用,承擔了用戶在淘寶的第二個人生的作用。我們旨在通過AI為淘寶人生2的用戶提供豐富有趣的可玩性內容,隨著最近火熱的AIGC技術的發展,我們也進行了相關嘗試和落地,目前已經上線了AI拍照風格化、AI寫真館、AI服飾涂鴉等項目。本文主要以AI服飾涂鴉為例介紹我們在AIGC圖像領域的探索和應用,希望能夠對大家有所啟發和幫助,也歡迎大家建議和合作。一、項目背景為了能夠...
2024-03-28 13:29:40 6514瀏覽 0點贊 0回復 0收藏
基于Diffusion模型的AIGC生成算法日益火熱,其中文生圖,圖生圖等圖像生成技術普遍成熟,很多算法從業者開始從事視頻生成算法的研究和開發,原因是視頻生成領域相對空白。一、AIGC視頻算法發展現狀從2023年開始,AIGC+視頻的新算法層出不窮,其中最直接的是把圖像方面的成果引入視頻領域,并結合時序信息去生成具有連續性的視頻。隨著Sora的出現,視頻生成的效果又再次上升了一個臺階,因此有必要將去年一年到現在的視頻領域進...
2024-03-28 13:20:37 7382瀏覽 0點贊 0回復 0收藏
引言:參與式城市規劃的新篇章隨著城市化的不斷推進,傳統的城市規劃方法面臨著越來越多的挑戰。這些方法往往需要大量的時間和人力,且嚴重依賴于經驗豐富的城市規劃師。為了應對這些挑戰,參與式城市規劃應運而生,它強調不同利益相關者,包括官員、專業人士、開發商、當地居民和公眾的積極參與。這種包容性的方法旨在通過精心設計的程序、討論、小組會議或研討會,將多樣化的視角納入規劃和決策過程中。然而,參與式規劃的傳...
2024-03-28 12:56:24 3815瀏覽 0點贊 0回復 0收藏
引言:探索大型語言模型中低秩適應的新方法在自然語言處理領域,大語言模型(LLMs)的迅猛發展帶來了前所未有的性能提升。然而,隨之而來的是模型參數數量的激增,這不僅導致了調優成本的線性增長,也給在常規硬件上進行微調帶來了挑戰。為了解決這一問題,研究者們提出了一系列參數高效的調優方法,如LoRA,它們通過只調整模型中一小部分參數來實現與全參數微調相當的性能。盡管這些方法能夠降低約30%的GPU內存需求,但仍需要...
2024-03-28 12:51:45 3338瀏覽 0點贊 0回復 0收藏