AI視野:王小川發(fā)布新大模型;必應免費向用戶供給DALL-E3 |
發(fā)布時間:2023-10-12 文章來源:本站 瀏覽次數(shù):2072 |
王小川團隊發(fā)布新的53B大模型,這是繼Baichuan-7B和Baichuan-13B之后他們的第三個大模型產(chǎn)品,但與前兩款不同,這次挑選閉源。 AiBase概要 53B模型規(guī)模到達530億參數(shù),是王小川團隊到目前為止參數(shù)量最大53B模型結合了查找技能,增強了對抗生成和時效性等方面的才能 王小川表明商業(yè)化的時機已到,53B閉源有利于直接面向企業(yè)客戶商業(yè)化運營 敞開模型權重被指將導致AI失控,Meta遭舉牌反對 AI范疇開源與閉源挑選存在分歧,但大模型年代開源力氣崛起,Meta因開源陷入費事,反對者質(zhì)疑敞開模型權重安全性,LeCun則表態(tài)開源AI不行阻撓。 AiBase概要 開源模型揭露權重或許被濫用,Meta遭反對 開源與閉源各有利弊,關鍵看運用 開源促進AI健康發(fā)展不行阻撓 港中大MathCoder模型應戰(zhàn)GPT-4,數(shù)學題解得分逾越后者 港中大開發(fā)的 MathCoder 大模型在數(shù)學推理方面超越了 GPT-4,能夠無縫集成代碼處理數(shù)學問題。 AiBase概要: 1️⃣ 港中大開發(fā)的 MathCoder 大模型數(shù)學才能超越 GPT-4。 2️⃣ MathCoder 在 MATH 和 GSM8K 數(shù)據(jù)集上取得了優(yōu)異成績。 3️⃣ MathCoder 經(jīng)過無縫集成代碼處理數(shù)學問題。 AI運用 微軟Bing Chat免費向用戶供給DALL-E3 微軟宣告將 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中,并免費供給給用戶運用。 AiBase概要: 1️⃣ DALL-E3是一款類 Midjourney 產(chǎn)品,經(jīng)過文本就能生成二次元、3D、朋克、涂鴉等多種類型圖片。 2️⃣ 微軟表明,為了保證用戶經(jīng)過 Bing Image Creator 創(chuàng)立的內(nèi)容的安全性,已經(jīng)在生成的圖片中內(nèi)置了符合 C2PA 標準的數(shù)字水印。 3️⃣ 用戶在創(chuàng)立圖片的過程中,供給的文本細節(jié)越多、描述越豐厚,最終生成的圖片也就越精準。 文心一言將再次晉級 百度宣告將于10月17日舉辦“百度國際大會2023”,李彥宏透露將帶來文心一言、查找、地圖、網(wǎng)盤等運用產(chǎn)品的全新露臉。 AiBase概要: 李彥宏將在主題講演中分享AI原生運用的心得,要點介紹生成式AI的幻想和立異空間 文心一言將進行再次晉級,發(fā)揮在生活生產(chǎn)中的更重要作用 百度查找、地圖、網(wǎng)盤等運用將帶來全新露臉,供給更好的用戶體會 微軟 OneDrive 將迎來全新晉級:Copilot 將為用戶供給更多 AI 功用 微軟推出晉級版OneDrive,整合Copilot人工智能功用,協(xié)助用戶更快捷地辦理文件。 AiBase概要: OneDrive將整合Copilot人工智能幫手,可自動生成文件內(nèi)容摘要,進步文件查找效率。 OneDrive Copilot可預測用戶需求,主張將相關文件歸類到同一文件夾。 OneDrive 將推出人工智能查找功用,可在2024年初公測。 谷歌為Google Assistant注入AI新功用 谷歌在Made by Google活動上為Google Assistant注入了新的AI功用,如與Bard的融合、了解更天然的語音命令、電話體會優(yōu)化等,以進步其在語音幫手商場的位置。 AiBase概要: Assistant with Bard將成為更加智能的語音幫手 能夠了解更天然的語音交互方法 電話挑選和垃圾電話過濾功用加強 AI新鮮事 原百度AI高管景鯤和朱凱華離任將聯(lián)手創(chuàng)業(yè) 原百度人工智能高管景鯤和朱凱華最近宣告離任,方案聯(lián)手創(chuàng)業(yè)。兩人在語音交互范疇積累了豐厚經(jīng)歷。據(jù)悉,他們的創(chuàng)業(yè)項目會結合大模型技能,方針是打造語音交互一體化處理方案。業(yè)內(nèi)人士以為,兩人在軟硬件結合方面的經(jīng)歷,將會是創(chuàng)業(yè)過程中的優(yōu)勢。 AiBase概要: 景鯤和朱凱華分別曾任小度科技CEO和CTO,景鯤被稱為“小冰之父” 二人均有軟硬件結合經(jīng)歷,拿手語音交互范疇 擬創(chuàng)業(yè)項目預計結合大模型技能,方針打造語音交互一體化處理方案 Windows12將于2024年推出:AI 功用影響更新需求 英特爾高管在揭露場合透露,微軟或許會在2024年推出Windows12操作體系,以影響用戶對新體系的更新需求。 AiBase概要: 英特爾CFO提到2024年Windows會有嚴重更新,意味著Windows12行將推出 微軟近期在Windows11中加入AI功用,Windows12或許會進一步整合AI Windows12開發(fā)已在加快,正式發(fā)布時間表與2024年秋季吻合 淘寶:國慶期間AI修圖服務查找量周環(huán)比暴增數(shù)十倍 淘寶數(shù)據(jù)顯示,國慶期間淘寶上AI修圖服務查找量周環(huán)比暴增數(shù)十倍,景點代打卡等“懶人旅行”服務也大受歡迎。 AiBase概要 淘寶上境內(nèi)外旅行門票預定大幅增長 代打卡、代P圖等“懶人旅行”服務火爆 AI修圖服務查找量周環(huán)比暴增數(shù)十倍 百萬網(wǎng)友圍觀DALL-E3新玩法!鋼鐵俠特斯拉皆“中招” 最近DALL-E3在網(wǎng)友手中玩出了多種新玩法,比方規(guī)整擺放物品,生成各類難以拍照的產(chǎn)品相片,合作提示詞可生成不同風格圖畫。這種風格叫做knolling,要點在于擺放規(guī)整,也是不少產(chǎn)品攝影的表達方法。 AiBase概要: DALL-E3可將物品規(guī)整擺放,生成風趣的組合相片,比方電影人物的身體部件平鋪照。 DALL-E3可輕松生成正常拍照困難的產(chǎn)品組合照,如特斯拉全系列車型。 增加提示詞可讓DALL-E3生成不同風格的圖畫,非常適合產(chǎn)品攝影創(chuàng)造。 研討人員稱,即使是最糟糕Claude AI版本也比GPT3.5更好 根據(jù)Chatbot Arena排行榜,Anthropic的Claude模型在功能上逾越了OpenAI的GPT-3.5,即使是最差的Claude版本也優(yōu)于ChatGPT免費版的GPT-3.5。 AiBase概要 Claude模型在排名上整體搶先GPT-3.5 排名考量了上下文處理才能、長文本生成等多個維度 排名成果將影響用戶挑選ChatGPT或Claude 賓夕法尼亞州立大學研宣布“電子舌頭”,有望賦能AI品嘗美食 賓夕法尼亞州立大學研討團隊最近研宣布一種根據(jù)石墨烯的電子“舌頭”,能夠檢測不同滋味,為人工情感智能的發(fā)展帶來嚴重突破。 AiBase概要: 研討團隊研宣布根據(jù)石墨烯的電子“舌頭”,能檢測不同滋味,完成AI“品嘗”功用。 研討關注將情感智能引進AI,經(jīng)過仿效人類味覺過程使AI更人性化。 立異可運用于智能飲食推薦等范疇,未來可拓展到視覺、聽覺等其他感官的AI。 AMD蓄勢待發(fā)準備應戰(zhàn)英偉達的人工智能霸主位置 AMD正在加緊應戰(zhàn)英偉達在AI商場近乎壟斷的位置,憑仗與PyTorch的合作和微軟的支撐,有望顛覆現(xiàn)狀。 AiBase概要 ⚡AMD一直在默默取得發(fā)展,開發(fā)了CUDA轉化東西,行將推出的Instinct MI300A處理器具有競賽力。 AMD與PyTorch合作,為后者供給AMD GPU支撐,也獲得了微軟的戰(zhàn)略支撐。 AMD有或許借助戰(zhàn)略合作伙伴關系,在AI商場顛覆英偉達的壟斷位置。 聚焦開發(fā)者 浙大校友聯(lián)手微軟開源LLaVA-1.5,硬剛GPT-4V 最近威斯康星大學麥迪遜分校、微軟研討院和哥倫比亞大學的研討人員聯(lián)手開源了新式多模態(tài)模型LLaVA-1.5,在多個基準測試中完成SOTA,展現(xiàn)出強大的多模態(tài)了解才能,被以為可與GPT-4V構成正面競賽。 AiBase概要: LLaVA-1.5在11項基準測試完成了SOTA,運用8塊A100GPU,LLaVA-1.5的練習僅需1天時間即可完成。 LLaVA-1.5在多模態(tài)了解上逾越GPT-4V,可對其構成有力競賽。 LLaVA-1.5采用最簡略的架構和揭露數(shù)據(jù)集,功能明顯進步。 OnnxStream:可在樹莓派Zero2上運轉Stable Diffusion1.5 OnnxStream是一款內(nèi)存占用極低的機器學習推理引擎,可在內(nèi)存僅512MB的樹莓派Zero2設備上運轉Stable Diffusion1.5等大型深度學習模型。 AiBase概要 OnnxStream經(jīng)過超卓的內(nèi)存辦理,可極大下降模型運轉時的RAM占用。 OnnxStream支撐多種功用以習慣資源受限環(huán)境,如權重加載器、注意力切片等。 OnnxStream完成了跨平臺支撐,可靈活運轉在Linux、Windows、Mac和Termux等體系。 StreamingLLM:讓AI模型無限期平穩(wěn)運轉的一種方法 Meta、麻省理工和卡內(nèi)基梅隆的研討人員提出StreamingLLM技能,經(jīng)過在對話不同階段重新引進初始符號,處理了LLM在長期對話中功能下降的問題,使其能夠在無限長度文本上堅持高功能。 AiBase概要: Meta、MIT和CMU的研討人員提出了StreamingLLM技能,旨在處理LLM在長期對話中的功能下降問題。 StreamingLLM使用attention sinks的概念,在對話不同階段重新引進初始符號,使LLM能夠在無限長度文本上堅持高功能。 研討人員提出了運用單個特別符號作為attention sink來穩(wěn)定LLM的關注機制,堅持其在長期對話中的高功能。 全新圖文生成方法MiniGPT-5生成文本的一起創(chuàng)造匹配的圖片 MiniGPT-5是一款根據(jù)大型言語模型的視覺與言語協(xié)同生成東西,經(jīng)過生成vokens完成圖畫文本協(xié)同生成。 AiBase概要 MiniGPT-5完成圖畫文本協(xié)同生成,用戶可輸入文本生成圖畫或輸入圖畫生成文本 MiniGPT-5經(jīng)過兩階段練習進步模型魯棒性,無需詳細描述進行練習 ⭐️ MiniGPT-5在多個數(shù)據(jù)集上表現(xiàn)超卓,是多模態(tài)生成有力東西 輕量級代碼庫剖析東西ctoc開源 ctoc是一個輕量級的代碼庫剖析東西,根據(jù)gocloc,能夠快速計算代碼庫中的令牌數(shù)量,支撐多種言語和輸出格局,對了解代碼庫復雜性和與不同LLM模型互操作很有協(xié)助。 AiBase概要 ctoc能夠快速計算代碼庫中的令牌數(shù)量,剖析復雜性 支撐多種編程言語,能夠輕松計算不同言語的令牌數(shù) ⚙️ 供給多種輸出格局,支撐與不同LLM模型互操作 |
|