聲網(wǎng)發(fā)布對(duì)話式AI引擎 只需兩行代碼讓AI開(kāi)口說(shuō)話快訊
隨時(shí)打斷與AI的對(duì)話,對(duì)話式AI引擎提供了極簡(jiǎn)的開(kāi)發(fā)部署,AI語(yǔ)音對(duì)話需0.098元/分鐘。
【TechWeb】3月6日消息,今日,實(shí)時(shí)互動(dòng)云服務(wù)商聲網(wǎng)正式發(fā)布對(duì)話式AI引擎,支持任意文本大模型升級(jí)為對(duì)話式多模態(tài)大模型。
據(jù)介紹,聲網(wǎng)對(duì)話式AI引擎支持包含DeepSeek、ChatGPT等在內(nèi)的全球幾乎所有大模型廠商。同時(shí)也支持全球主流語(yǔ)音合成供應(yīng)商任意切換,支持開(kāi)發(fā)者通過(guò)語(yǔ)音合成供應(yīng)商定制的自定義音色接入。
聲網(wǎng)方面表示,通過(guò)全鏈路深度優(yōu)化,并在中、美、歐、東南亞主要城市實(shí)測(cè),語(yǔ)音對(duì)話延遲中位數(shù)低至650ms。同時(shí),自研“智能打斷”技術(shù),模擬真人對(duì)話節(jié)奏,隨時(shí)打斷與AI的對(duì)話,響應(yīng)低至340ms。
從現(xiàn)場(chǎng)演示的demo來(lái)看,聲網(wǎng)對(duì)話式AI引擎基本可以做到實(shí)時(shí)應(yīng)答,“選擇性注意力鎖定”功能可屏蔽95%環(huán)境人聲、噪聲干擾,精準(zhǔn)識(shí)別對(duì)話人聲。
此外,對(duì)話式AI引擎具備優(yōu)秀的抗弱網(wǎng)、抗丟包能力,80%丟包率下仍能穩(wěn)定流暢對(duì)話,斷網(wǎng)3-5s依舊流暢對(duì)話。
據(jù)聲網(wǎng)相關(guān)負(fù)責(zé)人介紹,對(duì)話式AI引擎提供了極簡(jiǎn)的開(kāi)發(fā)部署,只需2行代碼,15分鐘就能讓AI開(kāi)口說(shuō)話,大幅降低了開(kāi)發(fā)門檻。只需填入與復(fù)制LLM與TTS相關(guān)的URL與Key,就能實(shí)現(xiàn)快速部署,具體流程可查看聲網(wǎng)官網(wǎng)的文檔中心。

目前,該產(chǎn)品的應(yīng)用場(chǎng)景包括智能助手、虛擬陪伴、口語(yǔ)陪練、智能客服、智能硬件等。
成本方面,AI語(yǔ)音對(duì)話需0.098元/分鐘,單次贈(zèng)送1000分鐘。自研的“智能打斷”功能作為增值服務(wù)需0.042元/分鐘。
聲網(wǎng)AI RTE產(chǎn)品線負(fù)責(zé)人姚光華表示,"經(jīng)過(guò)一段時(shí)間與客戶的打磨及實(shí)際使用場(chǎng)景調(diào)研,我們統(tǒng)計(jì)出,用戶與AI 每產(chǎn)生1次對(duì)話中,平均會(huì)有約3輪問(wèn)答,計(jì)算下來(lái)平均對(duì)話時(shí)長(zhǎng)約為21.1s,單次成本僅需3分錢。如果每月對(duì)話次數(shù)15次,那么月成本不到5毛錢,年成本也只需5元。"(周小白)
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。