推特等公司要價太高，OpenAI 和 Cohere 等 AI 公司轉(zhuǎn)向組成數(shù)據(jù)

發(fā)布時間：2023-07-22 文章來源：本站瀏覽次數(shù)：2508

7 月 20 日消息，人工智能公司 Cohere 首席執(zhí)行官 Aiden Gomez 近來透露，因為 Reddit、Twitter 等公司的數(shù)據(jù)收集要價太高，包括微軟、OpenAI 和 Cohere 在內(nèi)的 AI 公司，已運用組成數(shù)據(jù)來練習(xí) AI 模型。

Gomez 表示組成數(shù)據(jù)能夠適用于許多練習(xí)場景，僅僅目前尚未全面推廣。

IT之家在此附上 Gomez 舉的一個例子：假如某個企業(yè)想在高等數(shù)學(xué)中練習(xí)一個模型，能夠創(chuàng)立兩個人工智能模型，分別扮演教師和學(xué)生的人物，并讓它們評論三角學(xué)之類的話題。人工首要擔(dān)任調(diào)查，假如看到有什么過錯，能夠進(jìn)行糾正。

IT之家注：

組成數(shù)據(jù)（synthetic data）是經(jīng)過計算機(jī)技術(shù)人工生成的數(shù)據(jù)，而不是由實在事件產(chǎn)生的數(shù)據(jù)。

但組成數(shù)據(jù)具備“可用性”，能夠在數(shù)學(xué)上或統(tǒng)計學(xué)上反映原始數(shù)據(jù)的屬性，因此能夠作為原始數(shù)據(jù)的替代品來練習(xí)、測試并驗證大模型。

上一條：繼微信之后，付出寶宣布境...

下一條：《2023胡潤我國元世界...