10 月 21 日消息,日本 NTT 當(dāng)?shù)貢r(shí)間 20 日宣布推出新款日語(yǔ)環(huán)境優(yōu)化輕量級(jí) AI 模型 tsuzumi2。這款 30B 參數(shù)模型在推理運(yùn)行時(shí)僅需約 30GB 內(nèi)存,一張 A100 40GB 即可滿足要求,能方便地在本地或私有云環(huán)境部署,保障機(jī)密信息安全性。
NTT 在 2023 年發(fā)布了同樣定位的初代 tsuzumi 模型,此次 tsuzumi2 的誕生源于政企組織在實(shí)際使用初代 tsuzumi 后對(duì)復(fù)雜文檔理解能力與專業(yè)知識(shí)應(yīng)對(duì)能力等方面提出的要求。

NTT 宣稱,tsuzumi2 在日語(yǔ)環(huán)境中擁有同等參數(shù)規(guī)模模型中一流的性能;而通過(guò) RAG(IT之家注:檢索增強(qiáng)生成)和微調(diào),tsuzumi2 在金融、醫(yī)療、公共領(lǐng)域能發(fā)揮出更優(yōu)秀的表現(xiàn),對(duì) NTT 自身業(yè)務(wù)而言甚至優(yōu)于 GPT-5。
