比 ChatGPT 更強大,微軟推出全能型人工智能模型 Kosmos-1 |
發(fā)布時間:2023-03-05 文章來源:本站 瀏覽次數(shù):2286 |
3 月 4 日音訊,基于 ChatGPT 的必應(yīng)聊天曾經(jīng)讓不少用戶感遭到了 AI 的強大,而微軟于近日推出了更為強悍的全能型 AI--Kosmos-1。ChatGPT 是純文本 LLM,而它是更強大的多形式大型言語模型(MLLM)。
Kosmos-1 能夠剖析圖像的內(nèi)容、處理視覺難題、執(zhí)行視覺文本辨認、經(jīng)過視覺智商測試以及了解自然言語指令等等。 IT之家從報道中得悉,Kosmos-1 能夠處置文本、音頻、圖像和視頻等內(nèi)容,構(gòu)建一個全能型的人工智能,能夠像人類思想一樣來處置任務(wù)。 研討人員在他們的學(xué)術(shù)論文中寫道:“作為智能的根本組成局部,多模態(tài)感知是完成人工智能的必要條件”。Kosmos-1 論文中的視覺示例顯現(xiàn)模型剖析圖像并答復(fù)有關(guān)圖像的問題,從圖像中讀取文本,為圖像編寫標(biāo)題,并以 22-26% 的精確度停止視覺智商測試。 微軟表示,它方案向開發(fā)人員提供 Kosmos-1,雖然該論文援用的 GitHub 頁面在本文發(fā)表時沒有明顯的 Kosmos 特定代碼。 |
|