蘋果公布多模態AI模型Ferret

// 蘋果發表多模態大型語言模型Ferret,能接受文字、聲音、影像或數據的輸入,蘋果的研究論文顯示Ferret效能優於Kosmos-2、GPT4-ROI、LLaVA、Shikra等多模態大語言模型。此外,蘋果宣稱其物件幻覺也較Shikra、InstructBLIP、MiniGPT4、LLaVA、MM-GPT及 mPLUG-Owl等知名MLLM少很多。 https://www.ithome.com.tw/news/160517 //

Comments are closed.

Proudly powered by WordPress | Theme: Baskerville 2 by Anders Noren.

Up ↑