比 ChatGPT 更強大，微軟推出全能型人工智能模型 Kosmos-1

發(fā)布時間：2023-03-05 文章來源：本站瀏覽次數(shù)：2286

3 月 4 日音訊，基于 ChatGPT 的必應(yīng)聊天曾經(jīng)讓不少用戶感遭到了 AI 的強大，而微軟于近日推出了更為強悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM，而它是更強大的多形式大型言語模型（MLLM）。

Kosmos-1 能夠剖析圖像的內(nèi)容、處理視覺難題、執(zhí)行視覺文本辨認、經(jīng)過視覺智商測試以及了解自然言語指令等等。

IT之家從報道中得悉，Kosmos-1 能夠處置文本、音頻、圖像和視頻等內(nèi)容，構(gòu)建一個全能型的人工智能，能夠像人類思想一樣來處置任務(wù)。

研討人員在他們的學(xué)術(shù)論文中寫道：“作為智能的根本組成局部，多模態(tài)感知是完成人工智能的必要條件”。Kosmos-1 論文中的視覺示例顯現(xiàn)模型剖析圖像并答復(fù)有關(guān)圖像的問題，從圖像中讀取文本，為圖像編寫標(biāo)題，并以 22-26% 的精確度停止視覺智商測試。

微軟表示，它方案向開發(fā)人員提供 Kosmos-1，雖然該論文援用的 GitHub 頁面在本文發(fā)表時沒有明顯的 Kosmos 特定代碼。

上一條：ChatGPT背后的35...

下一條：人工智能制造的網(wǎng)紅粉絲過...