AI視野：王小川發(fā)布新大模型；必應免費向用戶供給DALL-E3

發(fā)布時間：2023-10-12 文章來源：本站瀏覽次數(shù)：2072

王小川團隊發(fā)布新的53B大模型，這是繼Baichuan-7B和Baichuan-13B之后他們的第三個大模型產(chǎn)品，但與前兩款不同，這次挑選閉源。

AiBase概要

53B模型規(guī)模到達530億參數(shù)，是王小川團隊到目前為止參數(shù)量最大53B模型結合了查找技能，增強了對抗生成和時效性等方面的才能

王小川表明商業(yè)化的時機已到，53B閉源有利于直接面向企業(yè)客戶商業(yè)化運營

敞開模型權重被指將導致AI失控，Meta遭舉牌反對

AI范疇開源與閉源挑選存在分歧，但大模型年代開源力氣崛起，Meta因開源陷入費事，反對者質(zhì)疑敞開模型權重安全性，LeCun則表態(tài)開源AI不行阻撓。

AiBase概要

開源模型揭露權重或許被濫用，Meta遭反對

開源與閉源各有利弊，關鍵看運用

開源促進AI健康發(fā)展不行阻撓

港中大MathCoder模型應戰(zhàn)GPT-4，數(shù)學題解得分逾越后者

港中大開發(fā)的 MathCoder 大模型在數(shù)學推理方面超越了 GPT-4，能夠無縫集成代碼處理數(shù)學問題。

AiBase概要:

1️⃣ 港中大開發(fā)的 MathCoder 大模型數(shù)學才能超越 GPT-4。

2️⃣ MathCoder 在 MATH 和 GSM8K 數(shù)據(jù)集上取得了優(yōu)異成績。

3️⃣ MathCoder 經(jīng)過無縫集成代碼處理數(shù)學問題。

AI運用

微軟Bing Chat免費向用戶供給DALL-E3

微軟宣告將 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中，并免費供給給用戶運用。

AiBase概要:

1️⃣ DALL-E3是一款類 Midjourney 產(chǎn)品，經(jīng)過文本就能生成二次元、3D、朋克、涂鴉等多種類型圖片。

2️⃣ 微軟表明，為了保證用戶經(jīng)過 Bing Image Creator 創(chuàng)立的內(nèi)容的安全性，已經(jīng)在生成的圖片中內(nèi)置了符合 C2PA 標準的數(shù)字水印。

3️⃣ 用戶在創(chuàng)立圖片的過程中，供給的文本細節(jié)越多、描述越豐厚，最終生成的圖片也就越精準。

文心一言將再次晉級

百度宣告將于10月17日舉辦“百度國際大會2023”，李彥宏透露將帶來文心一言、查找、地圖、網(wǎng)盤等運用產(chǎn)品的全新露臉。

AiBase概要:

李彥宏將在主題講演中分享AI原生運用的心得，要點介紹生成式AI的幻想和立異空間

文心一言將進行再次晉級，發(fā)揮在生活生產(chǎn)中的更重要作用

百度查找、地圖、網(wǎng)盤等運用將帶來全新露臉，供給更好的用戶體會

微軟 OneDrive 將迎來全新晉級:Copilot 將為用戶供給更多 AI 功用

微軟推出晉級版OneDrive，整合Copilot人工智能功用，協(xié)助用戶更快捷地辦理文件。

AiBase概要:

OneDrive將整合Copilot人工智能幫手，可自動生成文件內(nèi)容摘要，進步文件查找效率。

OneDrive Copilot可預測用戶需求，主張將相關文件歸類到同一文件夾。

OneDrive 將推出人工智能查找功用，可在2024年初公測。

谷歌為Google Assistant注入AI新功用

谷歌在Made by Google活動上為Google Assistant注入了新的AI功用，如與Bard的融合、了解更天然的語音命令、電話體會優(yōu)化等，以進步其在語音幫手商場的位置。

AiBase概要:

Assistant with Bard將成為更加智能的語音幫手

能夠了解更天然的語音交互方法

電話挑選和垃圾電話過濾功用加強

AI新鮮事

原百度AI高管景鯤和朱凱華離任將聯(lián)手創(chuàng)業(yè)

原百度人工智能高管景鯤和朱凱華最近宣告離任，方案聯(lián)手創(chuàng)業(yè)。兩人在語音交互范疇積累了豐厚經(jīng)歷。據(jù)悉，他們的創(chuàng)業(yè)項目會結合大模型技能，方針是打造語音交互一體化處理方案。業(yè)內(nèi)人士以為，兩人在軟硬件結合方面的經(jīng)歷，將會是創(chuàng)業(yè)過程中的優(yōu)勢。

AiBase概要：

景鯤和朱凱華分別曾任小度科技CEO和CTO，景鯤被稱為“小冰之父”

二人均有軟硬件結合經(jīng)歷，拿手語音交互范疇

擬創(chuàng)業(yè)項目預計結合大模型技能，方針打造語音交互一體化處理方案

Windows12將于2024年推出:AI 功用影響更新需求

英特爾高管在揭露場合透露，微軟或許會在2024年推出Windows12操作體系，以影響用戶對新體系的更新需求。

AiBase概要:

英特爾CFO提到2024年Windows會有嚴重更新，意味著Windows12行將推出

微軟近期在Windows11中加入AI功用，Windows12或許會進一步整合AI

Windows12開發(fā)已在加快，正式發(fā)布時間表與2024年秋季吻合

淘寶:國慶期間AI修圖服務查找量周環(huán)比暴增數(shù)十倍

淘寶數(shù)據(jù)顯示，國慶期間淘寶上AI修圖服務查找量周環(huán)比暴增數(shù)十倍，景點代打卡等“懶人旅行”服務也大受歡迎。

AiBase概要

淘寶上境內(nèi)外旅行門票預定大幅增長

代打卡、代P圖等“懶人旅行”服務火爆

AI修圖服務查找量周環(huán)比暴增數(shù)十倍

百萬網(wǎng)友圍觀DALL-E3新玩法!鋼鐵俠特斯拉皆“中招”

最近DALL-E3在網(wǎng)友手中玩出了多種新玩法，比方規(guī)整擺放物品，生成各類難以拍照的產(chǎn)品相片，合作提示詞可生成不同風格圖畫。這種風格叫做knolling，要點在于擺放規(guī)整，也是不少產(chǎn)品攝影的表達方法。

AiBase概要:

DALL-E3可將物品規(guī)整擺放，生成風趣的組合相片，比方電影人物的身體部件平鋪照。

DALL-E3可輕松生成正常拍照困難的產(chǎn)品組合照，如特斯拉全系列車型。

增加提示詞可讓DALL-E3生成不同風格的圖畫，非常適合產(chǎn)品攝影創(chuàng)造。

研討人員稱，即使是最糟糕Claude AI版本也比GPT3.5更好

根據(jù)Chatbot Arena排行榜，Anthropic的Claude模型在功能上逾越了OpenAI的GPT-3.5，即使是最差的Claude版本也優(yōu)于ChatGPT免費版的GPT-3.5。

AiBase概要

Claude模型在排名上整體搶先GPT-3.5

排名考量了上下文處理才能、長文本生成等多個維度

排名成果將影響用戶挑選ChatGPT或Claude

賓夕法尼亞州立大學研宣布“電子舌頭”，有望賦能AI品嘗美食

賓夕法尼亞州立大學研討團隊最近研宣布一種根據(jù)石墨烯的電子“舌頭”，能夠檢測不同滋味，為人工情感智能的發(fā)展帶來嚴重突破。

AiBase概要:

研討團隊研宣布根據(jù)石墨烯的電子“舌頭”，能檢測不同滋味，完成AI“品嘗”功用。

研討關注將情感智能引進AI，經(jīng)過仿效人類味覺過程使AI更人性化。

立異可運用于智能飲食推薦等范疇，未來可拓展到視覺、聽覺等其他感官的AI。

AMD蓄勢待發(fā)準備應戰(zhàn)英偉達的人工智能霸主位置

AMD正在加緊應戰(zhàn)英偉達在AI商場近乎壟斷的位置，憑仗與PyTorch的合作和微軟的支撐，有望顛覆現(xiàn)狀。

AiBase概要

⚡AMD一直在默默取得發(fā)展，開發(fā)了CUDA轉化東西，行將推出的Instinct MI300A處理器具有競賽力。

AMD與PyTorch合作，為后者供給AMD GPU支撐，也獲得了微軟的戰(zhàn)略支撐。

AMD有或許借助戰(zhàn)略合作伙伴關系，在AI商場顛覆英偉達的壟斷位置。

聚焦開發(fā)者

浙大校友聯(lián)手微軟開源LLaVA-1.5，硬剛GPT-4V

最近威斯康星大學麥迪遜分校、微軟研討院和哥倫比亞大學的研討人員聯(lián)手開源了新式多模態(tài)模型LLaVA-1.5，在多個基準測試中完成SOTA，展現(xiàn)出強大的多模態(tài)了解才能，被以為可與GPT-4V構成正面競賽。

AiBase概要:

LLaVA-1.5在11項基準測試完成了SOTA，運用8塊A100GPU，LLaVA-1.5的練習僅需1天時間即可完成。

LLaVA-1.5在多模態(tài)了解上逾越GPT-4V，可對其構成有力競賽。

LLaVA-1.5采用最簡略的架構和揭露數(shù)據(jù)集，功能明顯進步。

OnnxStream:可在樹莓派Zero2上運轉Stable Diffusion1.5

OnnxStream是一款內(nèi)存占用極低的機器學習推理引擎，可在內(nèi)存僅512MB的樹莓派Zero2設備上運轉Stable Diffusion1.5等大型深度學習模型。

AiBase概要

OnnxStream經(jīng)過超卓的內(nèi)存辦理，可極大下降模型運轉時的RAM占用。

OnnxStream支撐多種功用以習慣資源受限環(huán)境，如權重加載器、注意力切片等。

OnnxStream完成了跨平臺支撐，可靈活運轉在Linux、Windows、Mac和Termux等體系。

StreamingLLM:讓AI模型無限期平穩(wěn)運轉的一種方法

Meta、麻省理工和卡內(nèi)基梅隆的研討人員提出StreamingLLM技能，經(jīng)過在對話不同階段重新引進初始符號，處理了LLM在長期對話中功能下降的問題，使其能夠在無限長度文本上堅持高功能。

AiBase概要:

Meta、MIT和CMU的研討人員提出了StreamingLLM技能，旨在處理LLM在長期對話中的功能下降問題。

StreamingLLM使用attention sinks的概念，在對話不同階段重新引進初始符號，使LLM能夠在無限長度文本上堅持高功能。

研討人員提出了運用單個特別符號作為attention sink來穩(wěn)定LLM的關注機制，堅持其在長期對話中的高功能。

全新圖文生成方法MiniGPT-5生成文本的一起創(chuàng)造匹配的圖片

MiniGPT-5是一款根據(jù)大型言語模型的視覺與言語協(xié)同生成東西，經(jīng)過生成vokens完成圖畫文本協(xié)同生成。

AiBase概要

MiniGPT-5完成圖畫文本協(xié)同生成，用戶可輸入文本生成圖畫或輸入圖畫生成文本

MiniGPT-5經(jīng)過兩階段練習進步模型魯棒性，無需詳細描述進行練習

⭐️ MiniGPT-5在多個數(shù)據(jù)集上表現(xiàn)超卓，是多模態(tài)生成有力東西

輕量級代碼庫剖析東西ctoc開源

ctoc是一個輕量級的代碼庫剖析東西，根據(jù)gocloc，能夠快速計算代碼庫中的令牌數(shù)量，支撐多種言語和輸出格局，對了解代碼庫復雜性和與不同LLM模型互操作很有協(xié)助。

AiBase概要

ctoc能夠快速計算代碼庫中的令牌數(shù)量，剖析復雜性

支撐多種編程言語，能夠輕松計算不同言語的令牌數(shù)

⚙️ 供給多種輸出格局，支撐與不同LLM模型互操作

上一條：OpenAI被曝“在憋大...

下一條：OpenAI做芯片，只因...