推特等公司要價(jià)太高,OpenAI 和 Cohere 等 AI 公司轉(zhuǎn)向組成數(shù)據(jù) |
發(fā)布時(shí)間:2023-07-22 文章來(lái)源:本站 瀏覽次數(shù):2106 |
7 月 20 日消息,人工智能公司 Cohere 首席執(zhí)行官 Aiden Gomez 近來(lái)透露,因?yàn)?Reddit、Twitter 等公司的數(shù)據(jù)收集要價(jià)太高,包括微軟、OpenAI 和 Cohere 在內(nèi)的 AI 公司,已運(yùn)用組成數(shù)據(jù)來(lái)練習(xí) AI 模型。 Gomez 表示組成數(shù)據(jù)能夠適用于許多練習(xí)場(chǎng)景,僅僅目前尚未全面推廣。 IT之家在此附上 Gomez 舉的一個(gè)例子:假如某個(gè)企業(yè)想在高等數(shù)學(xué)中練習(xí)一個(gè)模型,能夠創(chuàng)立兩個(gè)人工智能模型,分別扮演教師和學(xué)生的人物,并讓它們?cè)u(píng)論三角學(xué)之類的話題。人工首要擔(dān)任調(diào)查,假如看到有什么過(guò)錯(cuò),能夠進(jìn)行糾正。 IT之家注: 組成數(shù)據(jù)(synthetic data)是經(jīng)過(guò)計(jì)算機(jī)技術(shù)人工生成的數(shù)據(jù),而不是由實(shí)在事件產(chǎn)生的數(shù)據(jù)。 但組成數(shù)據(jù)具備“可用性”,能夠在數(shù)學(xué)上或統(tǒng)計(jì)學(xué)上反映原始數(shù)據(jù)的屬性,因此能夠作為原始數(shù)據(jù)的替代品來(lái)練習(xí)、測(cè)試并驗(yàn)證大模型。 |
|