OpenAl采用智譜標(biāo)準(zhǔn)評(píng)測(cè)GPT-4.1系列大模型快訊
ComplexFuncBench是由智譜團(tuán)隊(duì)提出的專用于評(píng)估大模型復(fù)雜函數(shù)調(diào)用能力的測(cè)試基準(zhǔn),ComplexFuncBench要求大模型對(duì)真實(shí)場(chǎng)景下的用戶需求進(jìn)行細(xì)粒度理解,ComplexFuncBench主要評(píng)測(cè)大模型在128K的長(zhǎng)上下文下進(jìn)行多步帶約束的函數(shù)調(diào)用的能力。
【TechWeb】4月15日消息,OpenAI發(fā)布的了最新GPT-4.1系列大模型,其中在評(píng)測(cè)函數(shù)調(diào)用能力時(shí)采用了ComplexFuncBench。

ComplexFuncBench是由智譜團(tuán)隊(duì)提出的專用于評(píng)估大模型復(fù)雜函數(shù)調(diào)用能力的測(cè)試基準(zhǔn)。
據(jù)悉,ComplexFuncBench主要評(píng)測(cè)大模型在128K的長(zhǎng)上下文下進(jìn)行多步帶約束的函數(shù)調(diào)用的能力。相比于現(xiàn)有函數(shù)調(diào)用測(cè)試基準(zhǔn),ComplexFuncBench要求大模型對(duì)真實(shí)場(chǎng)景下的用戶需求進(jìn)行細(xì)粒度理解,并在此基礎(chǔ)上進(jìn)行多步帶推理的函數(shù)調(diào)用,這對(duì)模型的函數(shù)調(diào)用能力提出了更高的挑戰(zhàn)。(果青)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。