字節年終獎發放大賞;復現類Sora代碼,全細節開源;網友透析馬斯克開源Grok;“Apple ID”將成歷史;英偉達B100來了
原創一、商業圈
1.盒馬、大潤發辟謠被阿里出售給中糧:假的
近日有消息傳出稱阿里巴巴將把大潤發和盒馬出售給中糧集團。對此,盒馬和大潤發的負責人在個人社交平臺上進行辟謠,稱這一消息為假。
此前,網絡上曾出現許多關于盒馬關閉門店、無人送貨等消息,并引發熱議。對此,盒馬官方回應表示,這些報道只是因為物業合同到期和個別商場經營不善等原因導致的關閉現象,并計劃今年上半年關閉6-7家門店,同時尋找更好的物業以滿足消費者需求。
此外,盒馬還強調了其開店計劃,表示今年計劃新開70家門店,并且已經有超過360家門店正常運營。
2.英偉達GTC大會看點:B100,多款AI+機器人系列應用
據悉,英偉達GTC大會將于3月18日至21日期間,在圣何塞會議中心和線上同時舉行。這是英偉達每年最重要的技術發布平臺之一,被業界公認為“AI風向標”。
對此,浙商證券分析師劉雯蜀、李佩京在最新發布的報告中表示,英偉達有望在大會上發布Blackwell架構及B100芯片,硬件系列將全面升級。英偉達的機器人系列應用也有望迎來迭代。此外,英偉達還將發布一系列生成式AI應用,而這或成為其新增長點。
3.喬任梁父親喊話:撕下AI復活明星偽善面具
AI“復活”死者成為新的流量密碼。利用AI生成技術,通過深度學習以及圖像、語音合成技術,已故明星的數字化復制品可以輕易地上傳至網絡并博得大量關注。然而,這種行為對逝者親人已是一種冒犯和傷害。
近日,高以翔家人和喬任梁父親相繼喊話,要求下架相關的AI生成視頻。正如喬任梁父親所說,未經允許的AI“復活”,無異于“揭傷疤”,會讓親人再一次陷入悲傷的旋渦。
技術是把雙刃劍,必須要在合乎道德和倫理的規范下使用。更不能打著緬懷的幌子,靠吃逝者的人血饅頭來娛樂和引流。同時,有律師提醒,這類行為可能涉及侵權,并提醒公眾注意相關的法律風險。
4.OpenAI CTO:不確定是否使用了社交媒體數據訓練Sora
OpenAI首席技術官Mira近日在接受采訪時,被問及OpenAI使用了什么數據來訓練其視頻生成模型Sora,以及是否使用了來自多個社交媒體平臺的數據。
Mra表示,她并不確定OpenAI是否使用了社交媒體平臺的數據。她強調OpenAI使用的是“公開可用的數據或得到許可的數據”,但她拒絕介紹更多細節。
二、產業圈
1.字節跳動年終開獎:m、e績效持平
據公眾號“大廠日爆”消息,TikTok、生服等部門從上周開始,陸續開始績效+年終系數溝通,根據目前情況看:
績效m:主流3個月,多的3.5個月,少數個例4個月
績效m+:主流4個月,多的4.5個月,少數個例5個月
績效e:6個月起,普遍7個月,多的8-10個月,少數個例10月以上
績效m-:1-2個月;績效i:0-1個月
如果是產品,m:6個月,m+:7-9個月,e可能10個月以上
總體而言:今年年終獎整體滿足預期,m、e可能持平,部分m+相比去年可能打八折(以上不考慮0.839的時間系數,實際到手再打八折)
2.BOSS直聘向41名員工授予215萬股獎勵
據公告,BOSS直聘于2024年3月15日,根據首次公開發售后股份計劃,向41名員工授予了總計215.55萬份受限制股份單位,每份代表一股A類普通股。這些股份獎勵將在授予日期的第一、第二、第三及第四周年分期等額歸屬,前提是承授人需保持與公司的持續服務關系。
此次股份獎勵的授予并不受任何績效目標的限制。存在一種回撥機制,即在特定情況下,如承授人終止服務關系、涉及誠信或誠實的刑事罪行被定罪,或嚴重行為不當等,公司有權收回已授予的股份。
BOSS直聘表示,此次授出股份獎勵的目的在于獎勵那些為公司發展做出不懈努力的員工,并以此提升公司及其股份的價值。通過這種方式,公司希望能夠激勵員工繼續為公司的發展貢獻力量。
3.“Apple ID”將成歷史,傳蘋果將在 iOS 18 中更改新名稱
科技網站MacRumors曾爆料蘋果計劃將“Apple ID”更名為“Apple Account”,此消息得到彭博社記者Mark Gurman確認。Gurman表示,新名稱將于今年晚些時候在網絡端和重大軟件更新中啟用,如iOS 18和watchOS 11。蘋果已使用“蘋果賬戶余額”稱謂,內部存在“Apple Account”團隊。預計“Apple ID”這一20年術語將逐漸被淘汰。更名原因尚不明,但“Apple Account”更易于理解。
4.馬斯克將Grok開源,網友第一時間解析:314B,幾乎最大的開源模型
3月18日,馬斯克的AI創企xAI正式發布了此前備受期待大模型Grok-1,其參數量達到了3140億,遠超OpenAI GPT-3.5的1750億,遵照Apache 2.0協議開放模型權重和架構。
截止發稿前已獲得6.8k星。網友們:唯一的問題是Grok的性能不如其他AI模型。但可用的開源模型越多越好。
圖片
具體配置參數信息如下:
基礎信息:314B 的模型,由 8 專家組成(2 活躍狀態)86B 活躍參數,使用Rotary Embeddings
詞匯量:131,072 個,與 GPT-4 持平,實際上是 2 的 17 次方
詞嵌入維度:6,144(由 48 乘以 128 計算得來)
Transformer 層:64
Key value size : 128
上下文長度: 8192 個令牌,計算精度采用 bf16 格式。這里使用了 8 bit 量化。
旋轉位置嵌入的維度為 6144,這與模型輸入嵌入的維度一致。
遵循 Apache 2.0,即——
可商用:用戶可以自由地將軟件用于商業目的,不必支付許可費。
可修改和分發:用戶可以修改源代碼,并且可以在修改后的軟件上施加同樣的許可證進行再分發。
專利授權:該許可證自動授予軟件用戶任何專利權利,這意味著貢獻者不能對軟件用戶提起專利訴訟。
保留版權和許可聲明:在分發軟件或其修改版本時,必須保留原有的版權聲明和許可證聲明。
不承擔責任:提供一定的保障,但軟件作者或貢獻者不必為軟件可能引起的任何損失承擔責任。
5.一加Ace3V確定3月21日發布,首發多項 AI 功能
據一加官方消息,一加將會在3月21日19點舉辦新品發布會,發布一加 Ace3V 手機。
據悉,一加 Ace3V 手機將全球首發第三代驍龍 7+ 芯片,并全球首發多項全新 AI 功能。此外一加 Ace3V 手機將配有雙電芯5500mAh 電池。一加中國區總裁李杰表示,一加 Ace 3V 也將成為年輕人的第一臺 AI 手機。
三、技術圈
1.Open-Sora1.0發布:復現類Sora視頻,所有訓練細節均已開源
潞晨科技Colossal-AI 團隊全面開源全球首個類 Sora 架構視頻生成模型 「Open-Sora 1.0」,涵蓋了整個訓練流程,包括數據處理、所有訓練細節和模型權重。
- Open-Sora-v1 已發布。這里提供了模型權重。只需 400K 視頻片段和在單卡 H800 上訓200天(類比Stable Video Diffusion 的 152M 樣本),我們就能生成 2 秒的 512×512 視頻。
- 從圖像擴散模型到視頻擴散模型的三階段訓練。每個階段的權重已開放。
- 支持訓練加速,包括Transformer加速、更快的 T5 和 VAE 以及序列并行。在對 64x512x512 視頻進行訓練時,Open-Sora 可將訓練速度提高55%。
同時,Github上還提供了該模型生成的逼真視頻,感興趣的朋友可移步:https://github.com/hpcaitech/Open-Sora/
圖片
2.ChatGPT 參數規模很可能只有 7B(70 億)
南加州大學最新研究,ChatGPT 參數規模很可能只有 7B(70 億)。南加大團隊三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量維度(embedding size)為 4096 或 4608。而幾乎所有已知的開源大模型如 Llama 和 Mistral,嵌入向量維度 4096 的時候都是約 7B 參數規模。其它比例的話,就會造成網絡過寬或過窄,已被證明對模型性能不利。
因此南加大團隊指出,可以推測 gpt-3.5-turbo 的參數規模也在 7B 左右,除非是 MoE 架構可能不同。數月前,曾有微軟 CODEFUSION 論文意外泄露當時 GPT-3.5 模型參數為 20B,在后續論文版本中又刪除了這一信息。(開源中國)
3.零一萬物開放笛卡爾向量數據庫搜索內核 Binary下載,免費商用
零一萬物宣布決定全面開放笛卡爾向量數據庫搜索內核,并免費商用。零一萬物的笛卡爾向量數據庫定位專注于大模型場景,能夠執行超高精度、超快速度的檢索,輔助大模型在 RAG、Agent 等方面達到更佳的性能從而提升整體效果。
零一萬物向量檢索技術全自研,從0開始研發,擁有完整且獨立的知識產權。值得一提的是,負責該項技術的 Infra 團隊成員從2013年開始進入向量引擎的研究,主導過多個頭部大廠的向量檢索技術,做出的向量檢索技術服務過數千萬級別DAU的產品應用。
鏈接:https://github.com/01-ai/Descartes
4.蘋果“狂追”AI,首次發布多模態語言模型
近日,蘋果在arxiv.org上發布MM1模型的論文(超半數作者是華人),“MM1:多模態LLM預訓練的方法、分析與洞見”。它強調了結合多樣化的訓練數據和模型架構的重要性,以在多個AI基準測試中實現頂級性能。MM1模型在包括視覺和語言信息的多樣化數據集上接受了訓練,在圖像字幕、視覺問答和自然語言推理等任務上表現出色。
MM1的關鍵發現之一是圖像編碼器和輸入圖像的分辨率對模型性能有重大影響,這表明提升視覺組件是未來改進的關鍵。最大的MM1模型擁有300億個參數,展示了強大的上下文學習能力,這表明大型多模態模型能夠解決需要語言理解和生成能力的復雜問題。
這一發展正值蘋果加大AI投資之際,目的是要與谷歌、微軟和亞馬遜等競爭對手保持同步。據報道,蘋果正在開發一個名為“Ajax”的語言模型框架和一個內部稱為“Apple GPT”的聊天機器人,計劃將這些技術整合到Siri、信息、蘋果音樂和其他服務中。預計蘋果將在6月的全球開發者大會上將揭示新的AI功能。
5.Fermyon:一個Kubernetes節點上運行超過5000個WebAssembly應用程序
Fermyon推出SpinKube,用于Kubernetes上開發和部署WebAssembly應用,同時推出適用于Kubernetes的Fermyon平臺,該平臺支持高密度部署。Spin框架支持多種語言編寫WebAssembly應用,現已適配Kubernetes。
SpinKube是開源項目,包含Kubernetes操作符、Containerd Shim和運行時類管理器。Fermyon平臺是無服務器平臺,可大幅提升Kubernetes的pod運行數量。此外,還有針對Spin的Kubernetes插件。該項目得到Fermyon、Microsoft Deis Labs和SUSE等支持。
6.新版macOS 會導致Java意外終止,甲骨文建議暫緩更新
甲骨文公司稱,macOS Sonoma 14.4版本存在漏洞,導致Java程序意外終止,建議Mac用戶暫緩更新。此漏洞影響Java版本8以上及JDK 22搶先體驗版,暫無臨時解決辦法。高級管理總監指出測試版未發現此問題,但創建新鏡像或受影響。已通知相關方,Apple Silicon Mac用戶需等待蘋果修復。因Java被蘋果標記為過時技術,此問題對普通用戶影響有限。