// 蘋果發表多模態大型語言模型Ferret,能接受文字、聲音、影像或數據的輸入,蘋果的研究論文顯示Ferret效能優於Kosmos-2、GPT4-ROI、LLaVA、Shikra等多模態大語言模型。此外,蘋果宣稱其物件幻覺也較Shikra、InstructBLIP、MiniGPT4、LLaVA、MM-GPT及 mPLUG-Owl等知名MLLM少很多。 https://www.ithome.com.tw/news/160517 //