當(dāng)?shù)貢r(shí)間 27 日,據(jù)美聯(lián)社報(bào)道,超過(guò)十位軟件工程師、開(kāi)發(fā)人員和學(xué)術(shù)研究人員稱(chēng),OpenAI 的語(yǔ)音轉(zhuǎn)寫(xiě)工具 Whisper 存在一個(gè)重大缺陷:有時(shí)會(huì)憑空生成大段甚至整句虛假內(nèi)容。
這些專(zhuān)家指出,這些生成的文本(IT之家注:業(yè)內(nèi)通常稱(chēng)為“AI 幻覺(jué)”)可能涉及種族言論、暴力措辭,甚至杜撰的醫(yī)療建議。
專(zhuān)家們認(rèn)為,這一問(wèn)題尤其令人擔(dān)憂(yōu),因?yàn)?Whisper 已被廣泛應(yīng)用于全球多個(gè)行業(yè),包括用于翻譯和轉(zhuǎn)錄訪談內(nèi)容、生成常見(jiàn)消費(fèi)科技文本及制作視頻字幕。
更具風(fēng)險(xiǎn)的是,盡管 OpenAI已提醒不應(yīng)在“高風(fēng)險(xiǎn)領(lǐng)域”使用該工具,但一些醫(yī)療機(jī)構(gòu)仍在匆忙采用基于 Whisper 的工具來(lái)記錄醫(yī)生與患者的咨詢(xún)記錄。
報(bào)道稱(chēng),研究人員和工程師在工作中經(jīng)常遇到 Whisper 的“幻覺(jué)”現(xiàn)象,問(wèn)題的整體規(guī)模尚不清楚。例如,密歇根大學(xué)一位研究員在研究公共會(huì)議時(shí)發(fā)現(xiàn),在嘗試改進(jìn)模型前,他所檢查的十份音頻轉(zhuǎn)錄中,八份含有虛構(gòu)內(nèi)容。
一位機(jī)器學(xué)習(xí)工程師透露,在最初分析的超過(guò) 100 小時(shí) Whisper 轉(zhuǎn)錄中,他發(fā)現(xiàn)大約一半的內(nèi)容存在“幻覺(jué)”現(xiàn)象。一位開(kāi)發(fā)人員進(jìn)一步指出,在他用 Whisper 生成的 26000 份轉(zhuǎn)錄中,幾乎每一份都帶有虛構(gòu)內(nèi)容。
即便是音質(zhì)良好的簡(jiǎn)短音頻樣本,也未能幸免于這些問(wèn)題。計(jì)算機(jī)科學(xué)家們的最新研究表明,他們審查的 13000 多段清晰音頻片段中,有 187 段出現(xiàn)了“幻覺(jué)”現(xiàn)象。
研究人員認(rèn)為,這一趨勢(shì)意味著,在數(shù)百萬(wàn)條錄音中將可能出現(xiàn)數(shù)以萬(wàn)計(jì)的錯(cuò)誤轉(zhuǎn)錄。
OpenAI 的發(fā)言人表示,該公司持續(xù)研究如何減少幻覺(jué),并且感謝研究者的發(fā)現(xiàn),將會(huì)在模型更新中采納反饋。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類(lèi)型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類(lèi)強(qiáng)勁的市場(chǎng)需求。